DE202023105341U1 - Deep-Learning-basiertes System zur Erkennung von Korrosion in metallischen Objekten - Google Patents

Deep-Learning-basiertes System zur Erkennung von Korrosion in metallischen Objekten Download PDF

Info

Publication number
DE202023105341U1
DE202023105341U1 DE202023105341.6U DE202023105341U DE202023105341U1 DE 202023105341 U1 DE202023105341 U1 DE 202023105341U1 DE 202023105341 U DE202023105341 U DE 202023105341U DE 202023105341 U1 DE202023105341 U1 DE 202023105341U1
Authority
DE
Germany
Prior art keywords
images
unit
corroded
processing unit
corrosion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE202023105341.6U
Other languages
English (en)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nitte Meenakshi Institute Of Tech
Nitte Meenakshi Institute of Technology
Original Assignee
Nitte Meenakshi Institute Of Tech
Nitte Meenakshi Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nitte Meenakshi Institute Of Tech, Nitte Meenakshi Institute of Technology filed Critical Nitte Meenakshi Institute Of Tech
Priority to DE202023105341.6U priority Critical patent/DE202023105341U1/de
Publication of DE202023105341U1 publication Critical patent/DE202023105341U1/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

Ein auf Deep Learning basierendes System (100) zur Erkennung von Korrosion in metallischen Objekten, wobei das System (100) Folgendes umfasst:
eine Kamera (102) zum Aufnehmen mehrerer Bilder von mindestens einem metallischen Objekt bei unterschiedlichen Lichtverhältnissen, wobei die aufgenommenen Bilder einen Datensatz bilden und in einem Speicher (104) gespeichert werden; Und
eine mit dem Speicher (104) verbundene Verarbeitungseinheit (106) zum Verarbeiten der aufgenommenen Bilder, um Korrosion in metallischen Objekten zu erkennen, wobei die Verarbeitungseinheit (106) Folgendes umfasst:
eine Vorverarbeitungseinheit (106a) zum Normalisieren der aufgenommenen Bilder durch Formen und Skalieren, um die Konvergenzgeschwindigkeit und die Genauigkeit der Erkennung zu verbessern;
eine Bildsegmentierungseinheit (106b), die mit der Vorverarbeitungseinheit (106a) verbunden ist, um Pixel jedes der normalisierten Bilder in mehrere Segmente zu unterteilen;
eine Merkmalsextraktionseinheit (106c), die mit der Bildsegmentierungseinheit (106b) verbunden ist, um mehrere Merkmale aus den mehreren Bildern basierend auf dichten Blöcken zu extrahieren, um Merkmalskarten zum Erkennen von Korrosion in metallischen Objekten zu erhalten; Und
eine Klassifizierungseinheit (106d), die mit der Merkmalsextraktionseinheit (106c) verbunden ist, um die erhaltenen Merkmalskarten basierend auf Adam Optimizer in mehrere Klassen zu klassifizieren, um korrodierte und nicht korrodierte Metallobjekte zu identifizieren.

Description

  • GEBIET DER ERFINDUNG
  • Die vorliegende Erfindung bezieht sich auf das Gebiet der Deep-Learning-Systeme. Insbesondere betrifft die vorliegende Erfindung ein auf Deep Learning basierendes System zur Erkennung von Korrosion in metallischen Objekten.
  • HINTERGRUND DER ERFINDUNG
  • Korrosion von Stahl und anderen technischen Legierungen stellt für die Gesellschaft ein anhaltendes Problem dar, da die daraus resultierende Verschlechterung erhebliche Folgen, Umweltschäden und erhebliche finanzielle Verluste nach sich zieht. Die automatisierte Erkennung von Korrosion anhand von Bildern, entweder Fotos oder Videos, die von einfachen oder hochentwickelten Geräten (z. B. Smartphones, Drohnen usw.) erfasst werden, bietet erhebliche Vorteile im Hinblick auf die Korrosionsüberwachung.
  • Eine in der Literatur beschriebene innovative Technik nutzt eine automatisierte Bildanalyse zur Überwachung der Strukturkorrosion. Die erste Phase einer risikobasierten Wartungsphilosophie, die auf der Einschätzung des Risikos eines Gebäudeeinbruchs im Vergleich zu den Reparaturkosten durch einen Ingenieur basiert, ist die Überwachung der strukturellen Korrosion. Dieser Ansatz unterliegt jedoch menschlichen Fehlern und ist daher bei der Erkennung von Korrosion ungenau.
  • Korrosion ist ein weit verbreitetes Problem bei Pipeline-Transportsystemen und kann, wenn sie nicht kontrolliert wird, zu katastrophalen Ausfällen und Produktverlusten führen. Eine tiefe Korrosion der Rohroberfläche kann zur Bildung von Rissen und anderen Diskontinuitäten führen, was zu Produktverlusten führt. In Wärmeversorgungssystemen können bereits kleine Unterbrechungen im Jahresverlauf zu erheblichen Verlusten an Wärmeenergie und Wärmeträgermedium führen.
  • Korrosion in Unterwasserpipelines stellt eine große Herausforderung für die Offshore-Öl- und Gasindustrie dar, da sie die Integrität der Pipeline beeinträchtigen und zu Lecks und Brüchen führen kann. Traditionell wurde die visuelle Inspektion und Überwachung von Unterwasserpipelines von menschlichen Tauchern durchgeführt. Da die Meeresinfrastruktur jedoch immer tiefer in den Ozean vordringt, werden bildbasierte Roboterlösungen benötigt, um die raue Unterwasserumgebung zu meistern. Allerdings steht die Unterwasserfotografie vor Herausforderungen wie Lichtabsorption und -streuung, die zu Unschärfe, Farbverschlechterung und verringertem Kontrast führen. Traditionelle Strategien umfassten Kategorisierungstechniken basierend auf dem Prozentsatz der Pixel, die eine bestimmte rote Farbkomponente (Rost) enthielten. Zur Berechnung und Kategorisierung von Bildern wurde diese Technik in Python erstellt und nutzt das OpenCV-Paket. Caffe, ein leistungsstarkes Framework, das am Berkeley Vision and Learning Center (BVLC) entwickelt wurde, wurde zur Unterstützung unserer Deep-Learning-Methodik verwendet.
  • Darüber hinaus bleibt die Inspektion der Infrastruktur auf Korrosion eine Aufgabe, die typischerweise manuell von qualifizierten Ingenieuren oder Inspektoren durchgeführt wird, was mühsam und langsam ist und oft einen komplexen Zugang erfordert. Die Forschung zur Segmentierung von Bildern für die automatisierte Korrosionserkennung war begrenzt, da die für das Modelltraining erforderlichen, pro Pixel gekennzeichneten Datensätze nicht verfügbar sind.
  • Um die oben genannten Einschränkungen zu überwinden, besteht daher die Notwendigkeit, eine neuartige Technik zur Erkennung von Korrosionsfehlern in Rohrleitungen zu entwickeln, die künstliche Intelligenz nutzt, um das akustische Signal zu analysieren und den sinnvollen Frequenzbereich zu bestimmen und die korrodierten Teile im Voraus zu ersetzen, um weitere Schäden zu vermeiden.
  • Die durch die vorliegende Erfindung offenbarten technischen Fortschritte überwinden die Einschränkungen und Nachteile bestehender und herkömmlicher Systeme und Methoden.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die vorliegende Erfindung bezieht sich im Allgemeinen auf ein auf Deep Learning basierendes System zur Erkennung von Korrosion in metallischen Objekten.
  • Ein Ziel der vorliegenden Erfindung besteht darin, Korrosion in metallischen Gegenständen zu erkennen.
  • Ein weiteres Ziel der vorliegenden Erfindung besteht darin, die Korrosion in Unterwasserpipelines anhand der Farbinformationen korrodierter Rohre zu beurteilen, um die Qualität beschädigter Unterwasserfotos zu verbessern.
  • Ein weiteres Ziel der vorliegenden Erfindung besteht darin, ein automatisches Werkzeug zur Klassifizierung korrodierter und nicht korrodierter Metalloberflächen zu entwickeln.
  • Ein weiteres Ziel der vorliegenden Erfindung besteht darin, ein leichtes Deep-Learning-Modell zur Korrosionserkennung zu entwickeln.
  • In einer Ausführungsform ein auf Deep Learning basierendes System zur Erkennung von Korrosion in metallischen Objekten, wobei das System Folgendes umfasst:
    • eine Kamera zum Aufnehmen mehrerer Bilder von mindestens einem metallischen Objekt bei unterschiedlichen Lichtverhältnissen, wobei die aufgenommenen Bilder einen Datensatz bilden und in einem Speicher gespeichert werden; Und
    • eine mit dem Speicher verbundene Verarbeitungseinheit zum Verarbeiten der aufgenommenen Bilder, um Korrosion in metallischen Objekten zu erkennen, wobei die Verarbeitungseinheit Folgendes umfasst:
      • eine mit der Kamera verbundene Vorverarbeitungseinheit zur Normalisierung der aufgenommenen Bilder durch Formung und Skalierung, um die Konvergenzgeschwindigkeit und die Erkennungsgenauigkeit zu verbessern;
      • eine Bildsegmentierungseinheit, die mit der Vorverarbeitungseinheit verbunden ist, um Pixel jedes der normalisierten Bilder in mehrere Segmente zu unterteilen;
      • eine Merkmalsextraktionseinheit, die mit der Bildsegmentierungseinheit verbunden ist, um mehrere Merkmale aus den mehreren Bildern basierend auf dichten Blöcken zu extrahieren, um Merkmalskarten zum Erkennen von Korrosion in metallischen Objekten zu erhalten; Und
      • eine Klassifizierungseinheit, die mit der Merkmalsextraktionseinheit verbunden ist, um die erhaltenen Merkmalskarten basierend auf Adam Optimizer in mehrere Klassen zu klassifizieren, um korrodierte und nicht korrodierte Metallobjekte zu identifizieren.
  • In einer Ausführungsform umfasst der Datensatz Bilder von korrodierten Metallobjekten und nicht korrodierten Metallobjekten.
  • Um die Vorteile und Merkmale der vorliegenden Erfindung weiter zu verdeutlichen, erfolgt eine detailliertere Beschreibung der Erfindung unter Bezugnahme auf spezifische Ausführungsformen davon, die in der beigefügten Zeichnung dargestellt sind. Es versteht sich, dass diese Zeichnung nur typische Ausführungsformen der Erfindung darstellt und daher nicht als deren Umfang einschränkend anzusehen ist. Die Erfindung wird anhand der beigefügten Zeichnung genauer und detaillierter beschrieben und erläutert.
  • KURZBESCHREIBUNG DER FIGUR
  • Diese und andere Merkmale, Aspekte und Vorteile der vorliegenden Erfindung werden besser verständlich, wenn die folgende detaillierte Beschreibung unter Bezugnahme auf die beigefügte Zeichnung gelesen wird, in der gleiche Bezugszeichen gleiche Teile darstellen, wobei:
    • 1 zeigt ein Blockdiagramm eines Deep-Learning-basierten Systems zur Erkennung von Korrosion in metallischen Objekten.
  • Darüber hinaus werden erfahrene Handwerker erkennen, dass Elemente in der Zeichnung der Einfachheit halber dargestellt sind und möglicherweise nicht unbedingt maßstabsgetreu gezeichnet wurden. Beispielsweise veranschaulichen die Flussdiagramme die Methode anhand der wichtigsten Schritte, die dazu beitragen, das Verständnis von Aspekten der vorliegenden Offenbarung zu verbessern. Darüber hinaus können im Hinblick auf die Konstruktion des Geräts eine oder mehrere Komponenten des Geräts in der Zeichnung durch herkömmliche Symbole dargestellt worden sein, und die Zeichnung zeigt möglicherweise nur die spezifischen Details, die für das Verständnis der Ausführungsformen der vorliegenden Offenbarung relevant sind um die Zeichnung nicht durch Details zu verdecken, die für den Durchschnittsfachmann auf dem Gebiet, der Nutzen aus der Beschreibung hierin zieht, leicht ersichtlich sind.
  • DETAILLIERTE BESCHREIBUNG:
  • Um das Verständnis der Prinzipien der Erfindung zu fördern, wird nun auf die in der Zeichnung dargestellte Ausführungsform Bezug genommen und für deren Beschreibung eine spezifische Sprache verwendet. Es versteht sich jedoch, dass dadurch keine Einschränkung des Umfangs der Erfindung beabsichtigt ist, da Änderungen und weitere Modifikationen des dargestellten Systems und weitere Anwendungen der darin dargestellten Prinzipien der Erfindung in Betracht gezogen werden, wie sie einem Fachmann normalerweise in den Sinn kommen würden in der Technik, auf die sich die Erfindung bezieht.
  • Der Fachmann wird verstehen, dass die vorstehende allgemeine Beschreibung und die folgende detaillierte Beschreibung beispielhaft und erläuternd für die Erfindung sind und diese nicht einschränken sollen.
  • Verweise in dieser Spezifikation auf „einen Aspekt“, „einen anderen Aspekt“ oder eine ähnliche Sprache bedeuten, dass ein bestimmtes Merkmal, eine bestimmte Struktur oder ein bestimmtes Merkmal, das in Verbindung mit der Ausführungsform beschrieben wird, in mindestens einer Ausführungsform der vorliegenden Erfindung enthalten ist. Daher beziehen sich die Formulierungen „in einer Ausführungsform“, „in einer anderen Ausführungsform“ und ähnliche Formulierungen in dieser Spezifikation möglicherweise, aber nicht unbedingt, auf dieselbe Ausführungsform.
  • Die Begriffe „umfasst“, „umfassend“ oder andere Variationen davon sollen eine nicht ausschließliche Einbeziehung abdecken, sodass ein Prozess oder eine Methode, die eine Liste von Schritten umfasst, nicht nur diese Schritte umfasst, sondern möglicherweise andere Schritte nicht umfasst ausdrücklich aufgeführt oder diesem Prozess oder dieser Methode innewohnend sind. Ebenso schließen ein oder mehrere Geräte oder Subsysteme oder Elemente oder Strukturen oder Komponenten, denen „umfasst...a“ vorangestellt ist, nicht ohne weitere Einschränkungen die Existenz anderer Geräte oder anderer Subsysteme oder anderer Elemente oder anderer Strukturen aus andere Komponenten oder zusätzliche Geräte oder zusätzliche Subsysteme oder zusätzliche Elemente oder zusätzliche Strukturen oder zusätzliche Komponenten.
  • Sofern nicht anders definiert, haben alle hier verwendeten technischen und wissenschaftlichen Begriffe die gleiche Bedeutung, wie sie von einem Durchschnittsfachmann auf dem Gebiet, zu dem diese Erfindung gehört, allgemein verstanden werden. Das hier bereitgestellte System, die Methoden und Beispiele dienen nur der Veranschaulichung und sollen nicht einschränkend sein.
  • Nachfolgend werden Ausführungsformen der vorliegenden Erfindung unter Bezugnahme auf die beigefügte Zeichnung ausführlich beschrieben.
  • 1 zeigt ein Blockdiagramm eines auf Deep Learning basierenden Systems (100) zur Erkennung von Korrosion in metallischen Objekten, wobei das System (100) Folgendes umfasst:
    • eine Kamera (102) zum Aufnehmen mehrerer Bilder von mindestens einem metallischen Objekt bei unterschiedlichen Lichtverhältnissen, wobei die aufgenommenen Bilder einen Datensatz bilden und in einem Speicher (104) gespeichert werden; Und
    • eine mit dem Speicher (104) verbundene Verarbeitungseinheit (106) zum Verarbeiten der aufgenommenen Bilder, um Korrosion in metallischen Objekten zu erkennen, wobei die Verarbeitungseinheit (106) Folgendes umfasst:
      • eine Vorverarbeitungseinheit (106a) zum Normalisieren der aufgenommenen Bilder durch Formen und Skalieren, um die Konvergenzgeschwindigkeit und die Genauigkeit der Erkennung zu verbessern;
    • eine Bildsegmentierungseinheit (106b), die mit der Vorverarbeitungseinheit (106a) verbunden ist, um Pixel jedes der normalisierten Bilder in mehrere Segmente zu unterteilen;
    • eine Merkmalsextraktionseinheit (106c), die mit der Bildsegmentierungseinheit (106b) verbunden ist, um mehrere Merkmale aus den mehreren Bildern basierend auf dichten Blöcken zu extrahieren, um Merkmalskarten zum Erkennen von Korrosion in metallischen Objekten zu erhalten; Und
    • eine Klassifizierungseinheit (106d), die mit der Merkmalsextraktionseinheit (106c) verbunden ist, um die erhaltenen Merkmalskarten basierend auf Adam Optimizer in mehrere Klassen zu klassifizieren, um korrodierte und nicht korrodierte Metallobjekte zu identifizieren.
  • In einer Ausführungsform umfasst der Datensatz Bilder von korrodierten Metallobjekten und nicht korrodierten Metallobjekten.
  • In einer Ausführungsform werden die Bilder der Eingabepipeline auf die Dimensionen 250 x 250 umgeformt und Pixel auf [0,1 ] skaliert , indem jedes Pixel durch 1/255 geteilt wird.
  • In einer Ausführungsform ist die Klassifizierungseinheit (106d) ein auf einer visuellen Geometriegruppe (VGG16) basierendes Faltungs-Neuronales Netzwerk mit 7 Epochen des Adam-Optimierers für eine schnellere Erkennung der korrodierten Objekte bei reduziertem Speicherbedarf.
  • In einer Ausführungsform besteht die VGG16-Klassifizierungseinheit (106d) aus 13 Faltungsschichten und 3 vollständig verbundenen Schichten, um 1000 Bilder aus 1000 verschiedenen Kategorien genau zu klassifizieren.
  • In einer Ausführungsform ist die Merkmalsextraktionseinheit (106c) eine Das Convolutional Neural Network (CNN) von DenseNet nutzt dichte Verbindungen zwischen mehreren Schichten über dichte Blöcke, wobei die Eingabe für jede der mehreren Schichten aus den Feature-Maps aller vorhergehenden Schichten zusammen mit ihren eigenen Feature-Maps erhalten wird.
  • In einer Ausführungsform extrahiert die Merkmalsextraktionseinheit (106c) die Vielzahl von Merkmalen wie Farbe und Textur, um die Merkmalskarten zu bilden, wobei die Textur auf Grundlage einer aus einer Graustufen-Koexistenzmatrix berechneten Einheitlichkeitsmetrik analysiert wird und die Farbe auf Grundlage dieser analysiert wird auf einem HSV-Farbraumhistogramm (Hue Saturation Value) von Farben, um Korrosion widerzuspiegeln, das aus einem Datensatz entnommen wurde.
  • In einer Ausführungsform umfasst die CNN-basierte Verarbeitungseinheit (106) einen Filter für das Eingabebild, um eine Aktivierung zur Identifizierung einzigartiger Merkmale auf Eingabebildern zu erzeugen.
  • In einer Ausführungsform umfasst die CNN-basierte Verarbeitungseinheit (106) eine Schicht einer gleichgerichteten linearen Einheit (ReLu), um die nichtlinearen Eigenschaften und das Netzwerk der Verarbeitungseinheit (106) zu verbessern, wobei CNN eine Pooling-Schicht hinzugefügt wird, um die Anzahl der Parameter zu reduzieren und Berechnung im Netzwerk.
  • In einer Ausführungsform ist eine Anzeige (108) über eine Kommunikationseinheit (110) mit der Verarbeitungseinheit (106) verbunden, um die klassifizierten Bilder separat entweder als korrodierte Bilder oder als nicht korrodierte Bilder anzuzeigen.
  • In einer Ausführungsform ist die Kamera auf Drohnen montiert, um tatsächliche Fotos von komplexen Strukturen, wie beispielsweise Telekommunikationstürmen in einer typischen Situation, aufzunehmen.
  • In einer Ausführungsform handelt es sich bei der Anzeige vorzugsweise um eine 16x8-Flüssigkristallanzeige (LCD) zur getrennten Anzeige der Bilder korrodierter Bilder und nicht korrodierter Bilder.
  • In einer Ausführungsform ist die Kommunikationseinheit (110) entweder ein drahtgebundenes oder ein drahtloses Medium zum Herstellen der Kommunikation zwischen der Anzeige (108) und der Verarbeitungseinheit (106). Als Kommunikationseinheit (110) wird entweder Arduino Uno, Arduino Nano oder Raspberry Pie ausgewählt.
  • In einer Ausführungsform ist der Speicher (104) eine Speichereinheit wie etwa ein Cloud-Server, eine Festplatte, ein RAM, ein ROM oder ein USB-Stick.
  • In einer Ausführungsform wird der Datensatz durch Herunterladen von Bildern von Ressourcen aus dem Internet wie Kaggle erstellt. Der Datensatz besteht aus Bildern von korrodierten und nicht korrodierten Objekten. Die Daten sind in zwei Kategorien unterteilt: Trainings- und Testdaten. Trainingsdaten bestehen aus 1273 Bildern und Testdaten bestehen aus jeweils 254 Bildern. Die Trainingsdaten bestehen aus 692 Bildern von korrodierten und 581 nicht korrodierten Bildern. Die Testdaten bestehen aus 99 Bildern von korrodierten und 155 Bildern von nicht korrodierten Metallobjekten.
  • In einer Ausführungsform wird das System unter Verwendung eines Trainingsdatensatzes trainiert. Das System wird mithilfe des Korrosionsdatensatzes trainiert. Der Datensatz ist in Trainings-, Validierungs- und Testdatensätze unterteilt, die jeweils Bilder enthalten. Die Eingabepipeline formte die Bilder auf die Dimensionen 250 × 250 um und skalierte die Pixel auf [0,1] , indem jedes Pixel durch 1/255 geteilt wurde. Neuronale Netze verwenden kleine Werte für die Datenverarbeitung, sodass die Normalisierung (Skalierung) der Eingaben die Konvergenzgeschwindigkeit und -genauigkeit verbessert. Um das CNN-Modell schneller zu trainieren und den Speicherbedarf zu reduzieren, wird eine Stapelgröße von 32 für den Trainingsdatensatz und 32 für den Validierungsdatensatz ausgewählt. Das Modell wird mit dem Adam-Optimierer für 15 Epochen trainiert. Das VGG16-Modell wurde mit dem Adam-Optimierer für 7 Epochen trainiert. Um das VGG16-Modell schneller zu trainieren und den Speicherbedarf zu reduzieren, wird eine Stapelgröße von 12 für den Trainingsdatensatz und 12 für den Validierungsdatensatz ausgewählt. Um das DenseNet- Modell schneller zu trainieren und den Speicherbedarf zu reduzieren, wird eine Stapelgröße von 10 für den Trainingsdatensatz und 10 für den Validierungsdatensatz ausgewählt.
  • In einer Ausführungsform wird die VGG16-Architektur bei der Bildklassifizierung verwendet. Es besteht aus 16 Schichten trainierbarer Parameter, darunter 13 Faltungsschichten und 3 vollständig verbundene Schichten. VGG16 ist eine Objekterkennungs- und Klassifizierungseinheit, die 1000 Bilder aus 1000 verschiedenen Kategorien mit hoher Genauigkeit klassifizieren kann. VGG16 wird für das Training auf einem Datensatz von Bildern implementiert, wobei eine geeignete Verlustfunktion und Optimierungstechnik verwendet wird. Sobald das Gerät trainiert wurde, können Sie damit vorhersagen, ob ein Bild korrodiert ist oder nicht.
  • In einer Ausführungsform ist ein DenseNet eine Art Faltungs-Neuronales Netzwerk, das dichte Verbindungen zwischen Schichten über dichte Blöcke nutzt, wobei wir alle Schichten (mit übereinstimmenden Feature-Map-Größen) direkt miteinander verbinden. Für jede Ebene werden die Feature-Maps aller vorherigen Ebenen als Eingaben verwendet, und ihre eigenen Feature-Maps werden als Eingaben für alle nachfolgenden Ebenen verwendet.
  • In einer Ausführungsform handelt es sich bei Convolutional Neural Networks (CNNs) um Deep-Learning-Techniken, die für Bild- und Videoverarbeitungsaufgaben verwendet werden. CNN ist eine der Hauptkomponenten neuronaler Netze. Es besteht aus Neuronen mit Lerngewichten und Vorurteilen. Sie lernen räumliche Hierarchien von Merkmalen von Eingabebildern über Faltungsschichten, Pooling-Schichten und vollständig verbundene Schichten. Die Faltungsschicht sind die Hauptbausteine von CNN und diese Schicht wendet einen Filter auf eine Eingabe an, um eine Aktivierung zu erzeugen. Infolgedessen erscheinen auf Eingabebildern äußerst einzigartige Merkmale, die überall identifiziert werden können. Die ReLu- Schicht erhöht die nichtlinearen Eigenschaften des Modells und des gesamten Netzwerks, ohne die Empfangsfelder der Faltungsschicht zu beeinträchtigen. Das Ziel der Pooling-Schicht besteht darin, die räumliche Größe der Darstellung schrittweise zu verkleinern, um die Anzahl der Parameter und Berechnungen im Netzwerk zu reduzieren. Jede Funktionszuordnung wird von der Pooling-Schicht einzeln behandelt. Es gibt zwei Formen von Pooling-Ebenen: durchschnittliches maximales Pooling und maximales Pooling, wobei maximales Pooling am häufigsten vorkommt. Die Pooling-Schicht verringert die Parameter, für die die Überanpassung des Modells verringert wird. Sigmoidschicht im Deep Learning als nichtlineare Aktivierungsfunktion innerhalb von Neuronen in künstlichen neuronalen Netzen, damit das Netzwerk die nichtlinearen Beziehungen zwischen den Daten lernen kann. Die Sigmoidfunktion eignet sich gut zur Darstellung einer Wahrscheinlichkeit. Sein Definitionsbereich sind alle reellen Zahlen, aber sein Bereich liegt zwischen 0 und 1. Das von uns verwendete Modell ist ein sequentielles Modell.
  • Die Zeichnung und die vorstehende Beschreibung geben Beispiele für Ausführungsformen. Fachleute werden erkennen, dass eines oder mehrere der beschriebenen Elemente durchaus zu einem einzigen Funktionselement kombiniert werden können. Alternativ können bestimmte Elemente in mehrere Funktionselemente aufgeteilt werden. Elemente einer Ausführungsform können zu einer anderen Ausführungsform hinzugefügt werden. Beispielsweise können die Reihenfolgen der hier beschriebenen Prozesse geändert werden und sind nicht auf die hier beschriebene Weise beschränkt. Darüber hinaus müssen die Aktionen eines Flussdiagramms nicht in der gezeigten Reihenfolge implementiert werden; Es müssen auch nicht unbedingt alle Handlungen ausgeführt werden. Auch solche Handlungen, die nicht von anderen Handlungen abhängig sind, können parallel zu den anderen Handlungen durchgeführt werden. Der Umfang der Ausführungsformen wird durch diese spezifischen Beispiele keineswegs eingeschränkt. Zahlreiche Variationen, ob explizit in der Spezifikation angegeben oder nicht, wie z. B. Unterschiede in Struktur, Abmessung und Materialverwendung, sind möglich. Der Umfang der Ausführungsformen ist mindestens so breit wie durch die folgenden Ansprüche angegeben.
  • Vorteile, andere Vorzüge und Problemlösungen wurden oben im Hinblick auf spezifische Ausführungsformen beschrieben. Die Vorteile, Vorzüge, Problemlösungen und alle Komponenten, die dazu führen können, dass ein Nutzen, ein Vorteil oder eine Lösung eintritt oder ausgeprägter wird, dürfen jedoch nicht als kritische, erforderliche oder wesentliche Funktion oder Komponente von ausgelegt werden einzelne oder alle Ansprüche.
  • REFERENZEN
  • 100
    Ein Auf Tiefem Lernen Basierendes System Zur Erkennung Von Korrosion In Metallischen Objekten.
    102
    Kamera
    104
    Erinnerung
    106
    Verarbeitungseinheit
    106a
    Vorverarbeitungseinheit
    106b
    Bildsegmentierungseinheit
    106c
    Merkmalsextraktionseinheit
    106d
    Klassifizierungseinheit
    108
    Anzeige
    110
    Kommunikationseinheit

Claims (10)

  1. Ein auf Deep Learning basierendes System (100) zur Erkennung von Korrosion in metallischen Objekten, wobei das System (100) Folgendes umfasst: eine Kamera (102) zum Aufnehmen mehrerer Bilder von mindestens einem metallischen Objekt bei unterschiedlichen Lichtverhältnissen, wobei die aufgenommenen Bilder einen Datensatz bilden und in einem Speicher (104) gespeichert werden; Und eine mit dem Speicher (104) verbundene Verarbeitungseinheit (106) zum Verarbeiten der aufgenommenen Bilder, um Korrosion in metallischen Objekten zu erkennen, wobei die Verarbeitungseinheit (106) Folgendes umfasst: eine Vorverarbeitungseinheit (106a) zum Normalisieren der aufgenommenen Bilder durch Formen und Skalieren, um die Konvergenzgeschwindigkeit und die Genauigkeit der Erkennung zu verbessern; eine Bildsegmentierungseinheit (106b), die mit der Vorverarbeitungseinheit (106a) verbunden ist, um Pixel jedes der normalisierten Bilder in mehrere Segmente zu unterteilen; eine Merkmalsextraktionseinheit (106c), die mit der Bildsegmentierungseinheit (106b) verbunden ist, um mehrere Merkmale aus den mehreren Bildern basierend auf dichten Blöcken zu extrahieren, um Merkmalskarten zum Erkennen von Korrosion in metallischen Objekten zu erhalten; Und eine Klassifizierungseinheit (106d), die mit der Merkmalsextraktionseinheit (106c) verbunden ist, um die erhaltenen Merkmalskarten basierend auf Adam Optimizer in mehrere Klassen zu klassifizieren, um korrodierte und nicht korrodierte Metallobjekte zu identifizieren.
  2. System nach Anspruch 1, wobei der Datensatz Bilder von korrodierten Metallobjekten und nicht korrodierten Metallobjekten umfasst.
  3. System nach Anspruch 1, wobei die Bilder der Eingabepipeline auf 250 × 250-Dimensionen umgeformt und die Pixel auf [0,1] skaliert werden, indem jedes Pixel durch 1/255 geteilt wird.
  4. Das System nach Anspruch 1, wobei die Klassifizierungseinheit (106d) ein auf einer visuellen Geometriegruppe (VGG16) basierendes Faltungs-Neuronales Netzwerk mit 7 Epochen des Adam-Optimierers für eine schnellere Erkennung der korrodierten Objekte bei reduziertem Speicherbedarf ist.
  5. System nach Anspruch 4, wobei die VGG16-Klassifizierungseinheit (106d) aus 13 Faltungsschichten und 3 vollständig verbundenen Schichten besteht, um 1000 Bilder aus 1000 verschiedenen Kategorien genau zu klassifizieren.
  6. System nach Anspruch 1, wobei die Merkmalsextraktionseinheit (106c) ein DenseNet- Faltungs-Neuronales Netzwerk (CNN) ist, das dichte Verbindungen zwischen mehreren Schichten durch dichte Blöcke nutzt, wobei die Eingabe für jede der mehreren Schichten von diesem erhalten wird Feature-Maps aller vorherigen Layer, zusammen mit seinen eigenen Feature-Maps.
  7. System nach Anspruch 1, wobei die Merkmalsextraktionseinheit (106c) die mehreren Merkmale wie Farbe und Textur extrahiert, um die Merkmalskarten zu bilden, wobei die Textur auf der Grundlage einer aus einer Graustufen-Koexistenzmatrix berechneten Einheitlichkeitsmetrik analysiert wird Die Farbe wird basierend auf einem Farbraumhistogramm des Farbtons Sättigungswert (HSV) analysiert, um die Korrosion widerzuspiegeln, die aus einem Datensatz entnommen wurde.
  8. System nach Anspruch 1, wobei die CNN-basierte Verarbeitungseinheit (106) einen Filter für das Eingabebild umfasst, um eine Aktivierung zur Identifizierung einzigartiger Merkmale auf Eingabebildern zu erzeugen.
  9. System nach Anspruch 1, wobei die CNN-basierte Verarbeitungseinheit (106) eine Schicht einer gleichgerichteten linearen Einheit (ReLu) umfasst, um die nichtlinearen Eigenschaften und das Netzwerk der Verarbeitungseinheit (106) zu verbessern, wobei dem CNN eine Pooling-Schicht hinzugefügt wird Reduzieren Sie die Anzahl der Parameter und Berechnungen im Netzwerk.
  10. System nach Anspruch 1, wobei eine Anzeige (108) über eine Kommunikationseinheit (110) mit der Verarbeitungseinheit (106) verbunden ist, um die klassifizierten Bilder separat entweder als korrodierte Bilder oder als nicht korrodierte Bilder anzuzeigen.
DE202023105341.6U 2023-09-14 2023-09-14 Deep-Learning-basiertes System zur Erkennung von Korrosion in metallischen Objekten Active DE202023105341U1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE202023105341.6U DE202023105341U1 (de) 2023-09-14 2023-09-14 Deep-Learning-basiertes System zur Erkennung von Korrosion in metallischen Objekten

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE202023105341.6U DE202023105341U1 (de) 2023-09-14 2023-09-14 Deep-Learning-basiertes System zur Erkennung von Korrosion in metallischen Objekten

Publications (1)

Publication Number Publication Date
DE202023105341U1 true DE202023105341U1 (de) 2023-09-28

Family

ID=88414553

Family Applications (1)

Application Number Title Priority Date Filing Date
DE202023105341.6U Active DE202023105341U1 (de) 2023-09-14 2023-09-14 Deep-Learning-basiertes System zur Erkennung von Korrosion in metallischen Objekten

Country Status (1)

Country Link
DE (1) DE202023105341U1 (de)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117237930A (zh) * 2023-11-13 2023-12-15 成都大学 基于ResNet与迁移学习的腐蚀金具SEM图像识别方法
CN117760952A (zh) * 2024-02-21 2024-03-26 中冶建筑研究总院(深圳)有限公司 钢结构耐久性评定方法、系统及装置
CN117760952B (zh) * 2024-02-21 2024-06-04 中冶建筑研究总院(深圳)有限公司 钢结构耐久性评定方法、系统及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117237930A (zh) * 2023-11-13 2023-12-15 成都大学 基于ResNet与迁移学习的腐蚀金具SEM图像识别方法
CN117760952A (zh) * 2024-02-21 2024-03-26 中冶建筑研究总院(深圳)有限公司 钢结构耐久性评定方法、系统及装置
CN117760952B (zh) * 2024-02-21 2024-06-04 中冶建筑研究总院(深圳)有限公司 钢结构耐久性评定方法、系统及装置

Similar Documents

Publication Publication Date Title
Hacıefendioğlu et al. Concrete road crack detection using deep learning-based faster R-CNN method
Mery Aluminum casting inspection using deep learning: a method based on convolutional neural networks
Li et al. Automatic crack recognition for concrete bridges using a fully convolutional neural network and naive Bayes data fusion based on a visual detection system
CN105678332B (zh) 火焰图像cnn识别建模的转炉炼钢终点判断方法及系统
Yao et al. Deep‐Learning‐Based Bughole Detection for Concrete Surface Image
Wan et al. Ceramic tile surface defect detection based on deep learning
CN104992449A (zh) 基于机器视觉的信息识别及表面缺陷在线检测方法
DE202023105341U1 (de) Deep-Learning-basiertes System zur Erkennung von Korrosion in metallischen Objekten
CN115482491B (zh) 一种基于transformer的桥梁缺陷识别方法与系统
CN112308826A (zh) 一种基于卷积神经网络的桥梁结构表面缺陷检测方法
CN112381788A (zh) 一种基于双分支匹配网络的零部件表面缺陷增量检测方法
CN111860106B (zh) 一种无监督的桥梁裂缝识别方法
DE202009013865U1 (de) Konzept zum Auswählen eines optimierten Bewertungsmerkmalsteilsatzes für eine Inspektion von Freiformoberflächen und Konzept zum Inspizieren einer Freiformoberfläche
CN110751644B (zh) 道路表面裂纹检测方法
Miao et al. Online inspection of narrow overlap weld quality using two-stage convolution neural network image recognition
US20230222643A1 (en) Semantic deep learning and rule optimization for surface corrosion detection and evaluation
CN114749342A (zh) 一种锂电池极片涂布缺陷识别方法、装置及介质
CN115995056A (zh) 一种基于深度学习的桥梁病害自动识别方法
Jiang et al. Automatic pixel-level detection and measurement of corrosion-related damages in dim steel box girders using Fusion-Attention-U-net
Liu et al. Deep learning for coating condition assessment with active perception
Liu et al. Automatic detection and quantification of hot-rolled steel surface defects using deep learning
Li et al. A high‐frequency feature enhancement network for the surface defect detection of welded rebar
CN116563230A (zh) 焊缝缺陷识别方法及系统
CN115984215A (zh) 一种基于双生网络的纤维束缺陷检测方法
Gong et al. Research on surface defects detection method and system in manufacturing processes based on the fusion of multi-scale features and semantic segmentation for intelligent manufacturing

Legal Events

Date Code Title Description
R207 Utility model specification
R082 Change of representative

Representative=s name: LIPPERT STACHOW PATENTANWAELTE RECHTSANWAELTE , DE