Riegelnegg, M. (2024). Automated extraction of complexity measures from engineering drawings [Diploma Thesis, Technische Universität Wien]. reposiTUm. https://doi.org/10.34726/hss.2024.115164
E193 - Institut für Visual Computing and Human-Centered Technology
-
Datum (veröffentlicht):
2024
-
Umfang:
117
-
Keywords:
Technische Zeichnung; KI Anwendung
de
engineering drawing; information extraction; computer vision; pattern recognition; deep learning; additive manufacturing; vision transformer
en
Abstract:
Eine technische Zeichnung ist eine detaillierte Darstellung eines Objekts, die dazu dient, komplexe Informationen für Konstruktions-, Fertigungs- und Instandhaltungszwecke zu vermitteln.Diese Zeichnungen bestehen in der Regel aus mehreren orthografischen 2D-Ansichten eines 3D-Objekts, die mit Bemaßungsinformationen und Metadaten zu bestimmten Eigenschaften des Objekts versehen sind.In den letzten Jahrzehnten haben sich technische Zeichnungen von handgezeichneten Skizzen zu hoch standardisierten Dokumenten entwickelt, die mit Hilfe von CAD-Software erstellt werden.Die sich dadurch ergebende stilistische Vielfalt erschwert die automatische Extraktion abstrakter Informationen.Additive Fertigung (AM) gibt Unternehmen die Möglichkeit, Ersatzteile für Wartungszwecke nach Bedarf herzustellen.Die Bewertung des AM-Potenzials von Ersatzteilen ist sowohl aus wirtschaftlicher als auch aus technischer Sicht wichtig.Diese Machbarkeitsanalyse erfordert die Interpretation von Komplexitätsmaßen, die aus technischen Zeichnungen abgeleitet werden können.Die Hauptabmessungen eines Objekts sind wichtige Komplexitätsmaße, um eine AM-Potenzialanalyse durchzuführen.In dieser Diplomarbeit entwickeln wir eine Verarbeitungspipeline, welche die Extraktion von Komplexitätsmaßen aus technischen Zeichnungen automatisiert.Unsere Methodik basiert auf einer detaillierten Analyse der Eigenschaften technischer Zeichnungen aus unterschiedlichen Epochen.Außerdem versuchen wir, die einzelnen Schritte unserer Pipeline interpretierbar zu machen.Wir segmentieren wichtige Komponenten der Eingabezeichnung, um mögliche Bemaßungslinien zu identifizieren, die dann durch eine Abfolge von Bearbeitungsschritten verfeinert werden.Das Ansichtsraster wird so bestimmt, dass wir jeder Ansicht Achsenbeschriftungen zuweisen können.Wir verwenden OCR, um die erkannten Bemaßungszahlen auszuwerten.Anhand der OCR-Ergebnisse ermitteln wir das Verhältnis zwischen den OCR-Werten und der Länge der Bemaßungslinien in Pixeln.Zur Demonstration der Leistungsfähigkeit unserer Pipeline implementieren wir einen Forschungsprototypen.Die Ergebnisse einer quantitativen und qualitativen Evaluierung bestätigen die Effektivität unseres Ansatzes zur automatischen Extraktion abstrakter Informationen aus technischen Zeichnungen.
de
An engineering drawing is a detailed representation of an object used to communicate complex information for the purposes of design, manufacturing, and maintenance.These line drawings typically consist of multiple 2D orthographic views of a 3D object, along with dimensioning information and metadata about specific properties.Over the past decades, engineering drawings have evolved from hand-drawn sketches to highly standardized documents created with the help of CAD software.The large variety of engineering drawings makes it difficult to automatically extract abstract information in a robust way.The emergence of additive manufacturing (AM) promises companies that they can produce spare parts on demand for maintenance, potentially increasing the operational time of their infrastructure.Evaluating the AM potential of spare parts is essential from both an economic and technical perspective.This analysis of economic and technical viability requires the interpretation of complexity measures that can be derived from the engineering drawing of a spare part.The external dimensions of an object are key complexity measures to facilitate an AM potential analysis.In this thesis, we propose a processing pipeline that automates the extraction of complexity measures from engineering drawings, focusing on the external dimensions of the depicted objects.An in-depth examination of engineering drawings from different eras forms the basis of our methodology.Our pipeline is designed to be adaptable and consists of interpretable stages for specific tasks.We segment important entities in the input drawing to detect candidate dimension lines that are subsequently filtered by a sequence of processing steps.The grid structure of the orthographic views is determined, which allows us to assign axis labels to each view.We run optical character recognition (OCR) on detected dimension numbers and use the results to optimize the ratio between the OCR values and the length of dimension lines in pixels, providing us with a solution that is resilient to errors in the OCR predictions.A prototypical implementation of our pipeline demonstrates its capabilities in handling a large variety of drawings.We conduct a basic quantitative and qualitative evaluation of our methodology.The results confirm the effectiveness of our approach in automatically extracting abstract information from real-world engineering drawings.