DE202023105341U1

DE202023105341U1 - Deep-Learning-basiertes System zur Erkennung von Korrosion in metallischen Objekten

Info

Publication number: DE202023105341U1
Application number: DE202023105341.6U
Authority: DE
Original assignee: Nitte Meenakshi Institute Of Tech; Nitte Meenakshi Institute of Technology
Current assignee: Nitte Meenakshi Institute Of Tech; Nitte Meenakshi Institute of Technology
Priority date: 2023-09-14
Filing date: 2023-09-14
Publication date: 2023-09-28
Anticipated expiration: 2033-09-15

Abstract

Ein auf Deep Learning basierendes System (100) zur Erkennung von Korrosion in metallischen Objekten, wobei das System (100) Folgendes umfasst:
eine Kamera (102) zum Aufnehmen mehrerer Bilder von mindestens einem metallischen Objekt bei unterschiedlichen Lichtverhältnissen, wobei die aufgenommenen Bilder einen Datensatz bilden und in einem Speicher (104) gespeichert werden; Und
eine mit dem Speicher (104) verbundene Verarbeitungseinheit (106) zum Verarbeiten der aufgenommenen Bilder, um Korrosion in metallischen Objekten zu erkennen, wobei die Verarbeitungseinheit (106) Folgendes umfasst:
eine Vorverarbeitungseinheit (106a) zum Normalisieren der aufgenommenen Bilder durch Formen und Skalieren, um die Konvergenzgeschwindigkeit und die Genauigkeit der Erkennung zu verbessern;
eine Bildsegmentierungseinheit (106b), die mit der Vorverarbeitungseinheit (106a) verbunden ist, um Pixel jedes der normalisierten Bilder in mehrere Segmente zu unterteilen;
eine Merkmalsextraktionseinheit (106c), die mit der Bildsegmentierungseinheit (106b) verbunden ist, um mehrere Merkmale aus den mehreren Bildern basierend auf dichten Blöcken zu extrahieren, um Merkmalskarten zum Erkennen von Korrosion in metallischen Objekten zu erhalten; Und
eine Klassifizierungseinheit (106d), die mit der Merkmalsextraktionseinheit (106c) verbunden ist, um die erhaltenen Merkmalskarten basierend auf Adam Optimizer in mehrere Klassen zu klassifizieren, um korrodierte und nicht korrodierte Metallobjekte zu identifizieren.

Description

GEBIET DER ERFINDUNG
Die vorliegende Erfindung bezieht sich auf das Gebiet der Deep-Learning-Systeme. Insbesondere betrifft die vorliegende Erfindung ein auf Deep Learning basierendes System zur Erkennung von Korrosion in metallischen Objekten.
HINTERGRUND DER ERFINDUNG
Korrosion von Stahl und anderen technischen Legierungen stellt für die Gesellschaft ein anhaltendes Problem dar, da die daraus resultierende Verschlechterung erhebliche Folgen, Umweltschäden und erhebliche finanzielle Verluste nach sich zieht. Die automatisierte Erkennung von Korrosion anhand von Bildern, entweder Fotos oder Videos, die von einfachen oder hochentwickelten Geräten (z. B. Smartphones, Drohnen usw.) erfasst werden, bietet erhebliche Vorteile im Hinblick auf die Korrosionsüberwachung.
Eine in der Literatur beschriebene innovative Technik nutzt eine automatisierte Bildanalyse zur Überwachung der Strukturkorrosion. Die erste Phase einer risikobasierten Wartungsphilosophie, die auf der Einschätzung des Risikos eines Gebäudeeinbruchs im Vergleich zu den Reparaturkosten durch einen Ingenieur basiert, ist die Überwachung der strukturellen Korrosion. Dieser Ansatz unterliegt jedoch menschlichen Fehlern und ist daher bei der Erkennung von Korrosion ungenau.
Korrosion ist ein weit verbreitetes Problem bei Pipeline-Transportsystemen und kann, wenn sie nicht kontrolliert wird, zu katastrophalen Ausfällen und Produktverlusten führen. Eine tiefe Korrosion der Rohroberfläche kann zur Bildung von Rissen und anderen Diskontinuitäten führen, was zu Produktverlusten führt. In Wärmeversorgungssystemen können bereits kleine Unterbrechungen im Jahresverlauf zu erheblichen Verlusten an Wärmeenergie und Wärmeträgermedium führen.
Korrosion in Unterwasserpipelines stellt eine große Herausforderung für die Offshore-Öl- und Gasindustrie dar, da sie die Integrität der Pipeline beeinträchtigen und zu Lecks und Brüchen führen kann. Traditionell wurde die visuelle Inspektion und Überwachung von Unterwasserpipelines von menschlichen Tauchern durchgeführt. Da die Meeresinfrastruktur jedoch immer tiefer in den Ozean vordringt, werden bildbasierte Roboterlösungen benötigt, um die raue Unterwasserumgebung zu meistern. Allerdings steht die Unterwasserfotografie vor Herausforderungen wie Lichtabsorption und -streuung, die zu Unschärfe, Farbverschlechterung und verringertem Kontrast führen. Traditionelle Strategien umfassten Kategorisierungstechniken basierend auf dem Prozentsatz der Pixel, die eine bestimmte rote Farbkomponente (Rost) enthielten. Zur Berechnung und Kategorisierung von Bildern wurde diese Technik in Python erstellt und nutzt das OpenCV-Paket. Caffe, ein leistungsstarkes Framework, das am Berkeley Vision and Learning Center (BVLC) entwickelt wurde, wurde zur Unterstützung unserer Deep-Learning-Methodik verwendet.
Darüber hinaus bleibt die Inspektion der Infrastruktur auf Korrosion eine Aufgabe, die typischerweise manuell von qualifizierten Ingenieuren oder Inspektoren durchgeführt wird, was mühsam und langsam ist und oft einen komplexen Zugang erfordert. Die Forschung zur Segmentierung von Bildern für die automatisierte Korrosionserkennung war begrenzt, da die für das Modelltraining erforderlichen, pro Pixel gekennzeichneten Datensätze nicht verfügbar sind.
Um die oben genannten Einschränkungen zu überwinden, besteht daher die Notwendigkeit, eine neuartige Technik zur Erkennung von Korrosionsfehlern in Rohrleitungen zu entwickeln, die künstliche Intelligenz nutzt, um das akustische Signal zu analysieren und den sinnvollen Frequenzbereich zu bestimmen und die korrodierten Teile im Voraus zu ersetzen, um weitere Schäden zu vermeiden.
Die durch die vorliegende Erfindung offenbarten technischen Fortschritte überwinden die Einschränkungen und Nachteile bestehender und herkömmlicher Systeme und Methoden.
ZUSAMMENFASSUNG DER ERFINDUNG
Die vorliegende Erfindung bezieht sich im Allgemeinen auf ein auf Deep Learning basierendes System zur Erkennung von Korrosion in metallischen Objekten.
Ein Ziel der vorliegenden Erfindung besteht darin, Korrosion in metallischen Gegenständen zu erkennen.
Ein weiteres Ziel der vorliegenden Erfindung besteht darin, die Korrosion in Unterwasserpipelines anhand der Farbinformationen korrodierter Rohre zu beurteilen, um die Qualität beschädigter Unterwasserfotos zu verbessern.
Ein weiteres Ziel der vorliegenden Erfindung besteht darin, ein automatisches Werkzeug zur Klassifizierung korrodierter und nicht korrodierter Metalloberflächen zu entwickeln.
Ein weiteres Ziel der vorliegenden Erfindung besteht darin, ein leichtes Deep-Learning-Modell zur Korrosionserkennung zu entwickeln.
In einer Ausführungsform ein auf Deep Learning basierendes System zur Erkennung von Korrosion in metallischen Objekten, wobei das System Folgendes umfasst:

eine Kamera zum Aufnehmen mehrerer Bilder von mindestens einem metallischen Objekt bei unterschiedlichen Lichtverhältnissen, wobei die aufgenommenen Bilder einen Datensatz bilden und in einem Speicher gespeichert werden; Und
eine mit dem Speicher verbundene Verarbeitungseinheit zum Verarbeiten der aufgenommenen Bilder, um Korrosion in metallischen Objekten zu erkennen, wobei die Verarbeitungseinheit Folgendes umfasst:
- eine mit der Kamera verbundene Vorverarbeitungseinheit zur Normalisierung der aufgenommenen Bilder durch Formung und Skalierung, um die Konvergenzgeschwindigkeit und die Erkennungsgenauigkeit zu verbessern;
- eine Bildsegmentierungseinheit, die mit der Vorverarbeitungseinheit verbunden ist, um Pixel jedes der normalisierten Bilder in mehrere Segmente zu unterteilen;
- eine Merkmalsextraktionseinheit, die mit der Bildsegmentierungseinheit verbunden ist, um mehrere Merkmale aus den mehreren Bildern basierend auf dichten Blöcken zu extrahieren, um Merkmalskarten zum Erkennen von Korrosion in metallischen Objekten zu erhalten; Und
- eine Klassifizierungseinheit, die mit der Merkmalsextraktionseinheit verbunden ist, um die erhaltenen Merkmalskarten basierend auf Adam Optimizer in mehrere Klassen zu klassifizieren, um korrodierte und nicht korrodierte Metallobjekte zu identifizieren.

In einer Ausführungsform umfasst der Datensatz Bilder von korrodierten Metallobjekten und nicht korrodierten Metallobjekten.
Um die Vorteile und Merkmale der vorliegenden Erfindung weiter zu verdeutlichen, erfolgt eine detailliertere Beschreibung der Erfindung unter Bezugnahme auf spezifische Ausführungsformen davon, die in der beigefügten Zeichnung dargestellt sind. Es versteht sich, dass diese Zeichnung nur typische Ausführungsformen der Erfindung darstellt und daher nicht als deren Umfang einschränkend anzusehen ist. Die Erfindung wird anhand der beigefügten Zeichnung genauer und detaillierter beschrieben und erläutert.
KURZBESCHREIBUNG DER FIGUR
Diese und andere Merkmale, Aspekte und Vorteile der vorliegenden Erfindung werden besser verständlich, wenn die folgende detaillierte Beschreibung unter Bezugnahme auf die beigefügte Zeichnung gelesen wird, in der gleiche Bezugszeichen gleiche Teile darstellen, wobei:

1 zeigt ein Blockdiagramm eines Deep-Learning-basierten Systems zur Erkennung von Korrosion in metallischen Objekten.

Darüber hinaus werden erfahrene Handwerker erkennen, dass Elemente in der Zeichnung der Einfachheit halber dargestellt sind und möglicherweise nicht unbedingt maßstabsgetreu gezeichnet wurden. Beispielsweise veranschaulichen die Flussdiagramme die Methode anhand der wichtigsten Schritte, die dazu beitragen, das Verständnis von Aspekten der vorliegenden Offenbarung zu verbessern. Darüber hinaus können im Hinblick auf die Konstruktion des Geräts eine oder mehrere Komponenten des Geräts in der Zeichnung durch herkömmliche Symbole dargestellt worden sein, und die Zeichnung zeigt möglicherweise nur die spezifischen Details, die für das Verständnis der Ausführungsformen der vorliegenden Offenbarung relevant sind um die Zeichnung nicht durch Details zu verdecken, die für den Durchschnittsfachmann auf dem Gebiet, der Nutzen aus der Beschreibung hierin zieht, leicht ersichtlich sind.
DETAILLIERTE BESCHREIBUNG:
Um das Verständnis der Prinzipien der Erfindung zu fördern, wird nun auf die in der Zeichnung dargestellte Ausführungsform Bezug genommen und für deren Beschreibung eine spezifische Sprache verwendet. Es versteht sich jedoch, dass dadurch keine Einschränkung des Umfangs der Erfindung beabsichtigt ist, da Änderungen und weitere Modifikationen des dargestellten Systems und weitere Anwendungen der darin dargestellten Prinzipien der Erfindung in Betracht gezogen werden, wie sie einem Fachmann normalerweise in den Sinn kommen würden in der Technik, auf die sich die Erfindung bezieht.
Der Fachmann wird verstehen, dass die vorstehende allgemeine Beschreibung und die folgende detaillierte Beschreibung beispielhaft und erläuternd für die Erfindung sind und diese nicht einschränken sollen.
Verweise in dieser Spezifikation auf „einen Aspekt“, „einen anderen Aspekt“ oder eine ähnliche Sprache bedeuten, dass ein bestimmtes Merkmal, eine bestimmte Struktur oder ein bestimmtes Merkmal, das in Verbindung mit der Ausführungsform beschrieben wird, in mindestens einer Ausführungsform der vorliegenden Erfindung enthalten ist. Daher beziehen sich die Formulierungen „in einer Ausführungsform“, „in einer anderen Ausführungsform“ und ähnliche Formulierungen in dieser Spezifikation möglicherweise, aber nicht unbedingt, auf dieselbe Ausführungsform.
Die Begriffe „umfasst“, „umfassend“ oder andere Variationen davon sollen eine nicht ausschließliche Einbeziehung abdecken, sodass ein Prozess oder eine Methode, die eine Liste von Schritten umfasst, nicht nur diese Schritte umfasst, sondern möglicherweise andere Schritte nicht umfasst ausdrücklich aufgeführt oder diesem Prozess oder dieser Methode innewohnend sind. Ebenso schließen ein oder mehrere Geräte oder Subsysteme oder Elemente oder Strukturen oder Komponenten, denen „umfasst...a“ vorangestellt ist, nicht ohne weitere Einschränkungen die Existenz anderer Geräte oder anderer Subsysteme oder anderer Elemente oder anderer Strukturen aus andere Komponenten oder zusätzliche Geräte oder zusätzliche Subsysteme oder zusätzliche Elemente oder zusätzliche Strukturen oder zusätzliche Komponenten.
Sofern nicht anders definiert, haben alle hier verwendeten technischen und wissenschaftlichen Begriffe die gleiche Bedeutung, wie sie von einem Durchschnittsfachmann auf dem Gebiet, zu dem diese Erfindung gehört, allgemein verstanden werden. Das hier bereitgestellte System, die Methoden und Beispiele dienen nur der Veranschaulichung und sollen nicht einschränkend sein.
Nachfolgend werden Ausführungsformen der vorliegenden Erfindung unter Bezugnahme auf die beigefügte Zeichnung ausführlich beschrieben.
1 zeigt ein Blockdiagramm eines auf Deep Learning basierenden Systems (100) zur Erkennung von Korrosion in metallischen Objekten, wobei das System (100) Folgendes umfasst:

eine Kamera (102) zum Aufnehmen mehrerer Bilder von mindestens einem metallischen Objekt bei unterschiedlichen Lichtverhältnissen, wobei die aufgenommenen Bilder einen Datensatz bilden und in einem Speicher (104) gespeichert werden; Und
eine mit dem Speicher (104) verbundene Verarbeitungseinheit (106) zum Verarbeiten der aufgenommenen Bilder, um Korrosion in metallischen Objekten zu erkennen, wobei die Verarbeitungseinheit (106) Folgendes umfasst:
- eine Vorverarbeitungseinheit (106a) zum Normalisieren der aufgenommenen Bilder durch Formen und Skalieren, um die Konvergenzgeschwindigkeit und die Genauigkeit der Erkennung zu verbessern;
eine Bildsegmentierungseinheit (106b), die mit der Vorverarbeitungseinheit (106a) verbunden ist, um Pixel jedes der normalisierten Bilder in mehrere Segmente zu unterteilen;
eine Merkmalsextraktionseinheit (106c), die mit der Bildsegmentierungseinheit (106b) verbunden ist, um mehrere Merkmale aus den mehreren Bildern basierend auf dichten Blöcken zu extrahieren, um Merkmalskarten zum Erkennen von Korrosion in metallischen Objekten zu erhalten; Und
eine Klassifizierungseinheit (106d), die mit der Merkmalsextraktionseinheit (106c) verbunden ist, um die erhaltenen Merkmalskarten basierend auf Adam Optimizer in mehrere Klassen zu klassifizieren, um korrodierte und nicht korrodierte Metallobjekte zu identifizieren.

In einer Ausführungsform umfasst der Datensatz Bilder von korrodierten Metallobjekten und nicht korrodierten Metallobjekten.
In einer Ausführungsform werden die Bilder der Eingabepipeline auf die Dimensionen 250 x 250 umgeformt und Pixel auf [0,1 ] skaliert , indem jedes Pixel durch 1/255 geteilt wird.
In einer Ausführungsform ist die Klassifizierungseinheit (106d) ein auf einer visuellen Geometriegruppe (VGG16) basierendes Faltungs-Neuronales Netzwerk mit 7 Epochen des Adam-Optimierers für eine schnellere Erkennung der korrodierten Objekte bei reduziertem Speicherbedarf.
In einer Ausführungsform besteht die VGG16-Klassifizierungseinheit (106d) aus 13 Faltungsschichten und 3 vollständig verbundenen Schichten, um 1000 Bilder aus 1000 verschiedenen Kategorien genau zu klassifizieren.
In einer Ausführungsform ist die Merkmalsextraktionseinheit (106c) eine Das Convolutional Neural Network (CNN) von DenseNet nutzt dichte Verbindungen zwischen mehreren Schichten über dichte Blöcke, wobei die Eingabe für jede der mehreren Schichten aus den Feature-Maps aller vorhergehenden Schichten zusammen mit ihren eigenen Feature-Maps erhalten wird.
In einer Ausführungsform extrahiert die Merkmalsextraktionseinheit (106c) die Vielzahl von Merkmalen wie Farbe und Textur, um die Merkmalskarten zu bilden, wobei die Textur auf Grundlage einer aus einer Graustufen-Koexistenzmatrix berechneten Einheitlichkeitsmetrik analysiert wird und die Farbe auf Grundlage dieser analysiert wird auf einem HSV-Farbraumhistogramm (Hue Saturation Value) von Farben, um Korrosion widerzuspiegeln, das aus einem Datensatz entnommen wurde.
In einer Ausführungsform umfasst die CNN-basierte Verarbeitungseinheit (106) einen Filter für das Eingabebild, um eine Aktivierung zur Identifizierung einzigartiger Merkmale auf Eingabebildern zu erzeugen.
In einer Ausführungsform umfasst die CNN-basierte Verarbeitungseinheit (106) eine Schicht einer gleichgerichteten linearen Einheit (ReLu), um die nichtlinearen Eigenschaften und das Netzwerk der Verarbeitungseinheit (106) zu verbessern, wobei CNN eine Pooling-Schicht hinzugefügt wird, um die Anzahl der Parameter zu reduzieren und Berechnung im Netzwerk.
In einer Ausführungsform ist eine Anzeige (108) über eine Kommunikationseinheit (110) mit der Verarbeitungseinheit (106) verbunden, um die klassifizierten Bilder separat entweder als korrodierte Bilder oder als nicht korrodierte Bilder anzuzeigen.
In einer Ausführungsform ist die Kamera auf Drohnen montiert, um tatsächliche Fotos von komplexen Strukturen, wie beispielsweise Telekommunikationstürmen in einer typischen Situation, aufzunehmen.
In einer Ausführungsform handelt es sich bei der Anzeige vorzugsweise um eine 16x8-Flüssigkristallanzeige (LCD) zur getrennten Anzeige der Bilder korrodierter Bilder und nicht korrodierter Bilder.
In einer Ausführungsform ist die Kommunikationseinheit (110) entweder ein drahtgebundenes oder ein drahtloses Medium zum Herstellen der Kommunikation zwischen der Anzeige (108) und der Verarbeitungseinheit (106). Als Kommunikationseinheit (110) wird entweder Arduino Uno, Arduino Nano oder Raspberry Pie ausgewählt.
In einer Ausführungsform ist der Speicher (104) eine Speichereinheit wie etwa ein Cloud-Server, eine Festplatte, ein RAM, ein ROM oder ein USB-Stick.
In einer Ausführungsform wird der Datensatz durch Herunterladen von Bildern von Ressourcen aus dem Internet wie Kaggle erstellt. Der Datensatz besteht aus Bildern von korrodierten und nicht korrodierten Objekten. Die Daten sind in zwei Kategorien unterteilt: Trainings- und Testdaten. Trainingsdaten bestehen aus 1273 Bildern und Testdaten bestehen aus jeweils 254 Bildern. Die Trainingsdaten bestehen aus 692 Bildern von korrodierten und 581 nicht korrodierten Bildern. Die Testdaten bestehen aus 99 Bildern von korrodierten und 155 Bildern von nicht korrodierten Metallobjekten.
In einer Ausführungsform wird das System unter Verwendung eines Trainingsdatensatzes trainiert. Das System wird mithilfe des Korrosionsdatensatzes trainiert. Der Datensatz ist in Trainings-, Validierungs- und Testdatensätze unterteilt, die jeweils Bilder enthalten. Die Eingabepipeline formte die Bilder auf die Dimensionen 250 × 250 um und skalierte die Pixel auf [0,1] , indem jedes Pixel durch 1/255 geteilt wurde. Neuronale Netze verwenden kleine Werte für die Datenverarbeitung, sodass die Normalisierung (Skalierung) der Eingaben die Konvergenzgeschwindigkeit und -genauigkeit verbessert. Um das CNN-Modell schneller zu trainieren und den Speicherbedarf zu reduzieren, wird eine Stapelgröße von 32 für den Trainingsdatensatz und 32 für den Validierungsdatensatz ausgewählt. Das Modell wird mit dem Adam-Optimierer für 15 Epochen trainiert. Das VGG16-Modell wurde mit dem Adam-Optimierer für 7 Epochen trainiert. Um das VGG16-Modell schneller zu trainieren und den Speicherbedarf zu reduzieren, wird eine Stapelgröße von 12 für den Trainingsdatensatz und 12 für den Validierungsdatensatz ausgewählt. Um das DenseNet- Modell schneller zu trainieren und den Speicherbedarf zu reduzieren, wird eine Stapelgröße von 10 für den Trainingsdatensatz und 10 für den Validierungsdatensatz ausgewählt.
In einer Ausführungsform wird die VGG16-Architektur bei der Bildklassifizierung verwendet. Es besteht aus 16 Schichten trainierbarer Parameter, darunter 13 Faltungsschichten und 3 vollständig verbundene Schichten. VGG16 ist eine Objekterkennungs- und Klassifizierungseinheit, die 1000 Bilder aus 1000 verschiedenen Kategorien mit hoher Genauigkeit klassifizieren kann. VGG16 wird für das Training auf einem Datensatz von Bildern implementiert, wobei eine geeignete Verlustfunktion und Optimierungstechnik verwendet wird. Sobald das Gerät trainiert wurde, können Sie damit vorhersagen, ob ein Bild korrodiert ist oder nicht.
In einer Ausführungsform ist ein DenseNet eine Art Faltungs-Neuronales Netzwerk, das dichte Verbindungen zwischen Schichten über dichte Blöcke nutzt, wobei wir alle Schichten (mit übereinstimmenden Feature-Map-Größen) direkt miteinander verbinden. Für jede Ebene werden die Feature-Maps aller vorherigen Ebenen als Eingaben verwendet, und ihre eigenen Feature-Maps werden als Eingaben für alle nachfolgenden Ebenen verwendet.
In einer Ausführungsform handelt es sich bei Convolutional Neural Networks (CNNs) um Deep-Learning-Techniken, die für Bild- und Videoverarbeitungsaufgaben verwendet werden. CNN ist eine der Hauptkomponenten neuronaler Netze. Es besteht aus Neuronen mit Lerngewichten und Vorurteilen. Sie lernen räumliche Hierarchien von Merkmalen von Eingabebildern über Faltungsschichten, Pooling-Schichten und vollständig verbundene Schichten. Die Faltungsschicht sind die Hauptbausteine von CNN und diese Schicht wendet einen Filter auf eine Eingabe an, um eine Aktivierung zu erzeugen. Infolgedessen erscheinen auf Eingabebildern äußerst einzigartige Merkmale, die überall identifiziert werden können. Die ReLu- Schicht erhöht die nichtlinearen Eigenschaften des Modells und des gesamten Netzwerks, ohne die Empfangsfelder der Faltungsschicht zu beeinträchtigen. Das Ziel der Pooling-Schicht besteht darin, die räumliche Größe der Darstellung schrittweise zu verkleinern, um die Anzahl der Parameter und Berechnungen im Netzwerk zu reduzieren. Jede Funktionszuordnung wird von der Pooling-Schicht einzeln behandelt. Es gibt zwei Formen von Pooling-Ebenen: durchschnittliches maximales Pooling und maximales Pooling, wobei maximales Pooling am häufigsten vorkommt. Die Pooling-Schicht verringert die Parameter, für die die Überanpassung des Modells verringert wird. Sigmoidschicht im Deep Learning als nichtlineare Aktivierungsfunktion innerhalb von Neuronen in künstlichen neuronalen Netzen, damit das Netzwerk die nichtlinearen Beziehungen zwischen den Daten lernen kann. Die Sigmoidfunktion eignet sich gut zur Darstellung einer Wahrscheinlichkeit. Sein Definitionsbereich sind alle reellen Zahlen, aber sein Bereich liegt zwischen 0 und 1. Das von uns verwendete Modell ist ein sequentielles Modell.
Die Zeichnung und die vorstehende Beschreibung geben Beispiele für Ausführungsformen. Fachleute werden erkennen, dass eines oder mehrere der beschriebenen Elemente durchaus zu einem einzigen Funktionselement kombiniert werden können. Alternativ können bestimmte Elemente in mehrere Funktionselemente aufgeteilt werden. Elemente einer Ausführungsform können zu einer anderen Ausführungsform hinzugefügt werden. Beispielsweise können die Reihenfolgen der hier beschriebenen Prozesse geändert werden und sind nicht auf die hier beschriebene Weise beschränkt. Darüber hinaus müssen die Aktionen eines Flussdiagramms nicht in der gezeigten Reihenfolge implementiert werden; Es müssen auch nicht unbedingt alle Handlungen ausgeführt werden. Auch solche Handlungen, die nicht von anderen Handlungen abhängig sind, können parallel zu den anderen Handlungen durchgeführt werden. Der Umfang der Ausführungsformen wird durch diese spezifischen Beispiele keineswegs eingeschränkt. Zahlreiche Variationen, ob explizit in der Spezifikation angegeben oder nicht, wie z. B. Unterschiede in Struktur, Abmessung und Materialverwendung, sind möglich. Der Umfang der Ausführungsformen ist mindestens so breit wie durch die folgenden Ansprüche angegeben.
Vorteile, andere Vorzüge und Problemlösungen wurden oben im Hinblick auf spezifische Ausführungsformen beschrieben. Die Vorteile, Vorzüge, Problemlösungen und alle Komponenten, die dazu führen können, dass ein Nutzen, ein Vorteil oder eine Lösung eintritt oder ausgeprägter wird, dürfen jedoch nicht als kritische, erforderliche oder wesentliche Funktion oder Komponente von ausgelegt werden einzelne oder alle Ansprüche.
REFERENZEN

100: Ein Auf Tiefem Lernen Basierendes System Zur Erkennung Von Korrosion In Metallischen Objekten.
102: Kamera
104: Erinnerung
106: Verarbeitungseinheit
106a: Vorverarbeitungseinheit
106b: Bildsegmentierungseinheit
106c: Merkmalsextraktionseinheit
106d: Klassifizierungseinheit
108: Anzeige
110: Kommunikationseinheit

Claims

Ein auf Deep Learning basierendes System (100) zur Erkennung von Korrosion in metallischen Objekten, wobei das System (100) Folgendes umfasst: eine Kamera (102) zum Aufnehmen mehrerer Bilder von mindestens einem metallischen Objekt bei unterschiedlichen Lichtverhältnissen, wobei die aufgenommenen Bilder einen Datensatz bilden und in einem Speicher (104) gespeichert werden; Und eine mit dem Speicher (104) verbundene Verarbeitungseinheit (106) zum Verarbeiten der aufgenommenen Bilder, um Korrosion in metallischen Objekten zu erkennen, wobei die Verarbeitungseinheit (106) Folgendes umfasst: eine Vorverarbeitungseinheit (106a) zum Normalisieren der aufgenommenen Bilder durch Formen und Skalieren, um die Konvergenzgeschwindigkeit und die Genauigkeit der Erkennung zu verbessern; eine Bildsegmentierungseinheit (106b), die mit der Vorverarbeitungseinheit (106a) verbunden ist, um Pixel jedes der normalisierten Bilder in mehrere Segmente zu unterteilen; eine Merkmalsextraktionseinheit (106c), die mit der Bildsegmentierungseinheit (106b) verbunden ist, um mehrere Merkmale aus den mehreren Bildern basierend auf dichten Blöcken zu extrahieren, um Merkmalskarten zum Erkennen von Korrosion in metallischen Objekten zu erhalten; Und eine Klassifizierungseinheit (106d), die mit der Merkmalsextraktionseinheit (106c) verbunden ist, um die erhaltenen Merkmalskarten basierend auf Adam Optimizer in mehrere Klassen zu klassifizieren, um korrodierte und nicht korrodierte Metallobjekte zu identifizieren.
System nach Anspruch 1, wobei der Datensatz Bilder von korrodierten Metallobjekten und nicht korrodierten Metallobjekten umfasst.
System nach Anspruch 1, wobei die Bilder der Eingabepipeline auf 250 × 250-Dimensionen umgeformt und die Pixel auf [0,1] skaliert werden, indem jedes Pixel durch 1/255 geteilt wird.
Das System nach Anspruch 1, wobei die Klassifizierungseinheit (106d) ein auf einer visuellen Geometriegruppe (VGG16) basierendes Faltungs-Neuronales Netzwerk mit 7 Epochen des Adam-Optimierers für eine schnellere Erkennung der korrodierten Objekte bei reduziertem Speicherbedarf ist.
System nach Anspruch 4, wobei die VGG16-Klassifizierungseinheit (106d) aus 13 Faltungsschichten und 3 vollständig verbundenen Schichten besteht, um 1000 Bilder aus 1000 verschiedenen Kategorien genau zu klassifizieren.
System nach Anspruch 1, wobei die Merkmalsextraktionseinheit (106c) ein DenseNet- Faltungs-Neuronales Netzwerk (CNN) ist, das dichte Verbindungen zwischen mehreren Schichten durch dichte Blöcke nutzt, wobei die Eingabe für jede der mehreren Schichten von diesem erhalten wird Feature-Maps aller vorherigen Layer, zusammen mit seinen eigenen Feature-Maps.
System nach Anspruch 1, wobei die Merkmalsextraktionseinheit (106c) die mehreren Merkmale wie Farbe und Textur extrahiert, um die Merkmalskarten zu bilden, wobei die Textur auf der Grundlage einer aus einer Graustufen-Koexistenzmatrix berechneten Einheitlichkeitsmetrik analysiert wird Die Farbe wird basierend auf einem Farbraumhistogramm des Farbtons Sättigungswert (HSV) analysiert, um die Korrosion widerzuspiegeln, die aus einem Datensatz entnommen wurde.
System nach Anspruch 1, wobei die CNN-basierte Verarbeitungseinheit (106) einen Filter für das Eingabebild umfasst, um eine Aktivierung zur Identifizierung einzigartiger Merkmale auf Eingabebildern zu erzeugen.
System nach Anspruch 1, wobei die CNN-basierte Verarbeitungseinheit (106) eine Schicht einer gleichgerichteten linearen Einheit (ReLu) umfasst, um die nichtlinearen Eigenschaften und das Netzwerk der Verarbeitungseinheit (106) zu verbessern, wobei dem CNN eine Pooling-Schicht hinzugefügt wird Reduzieren Sie die Anzahl der Parameter und Berechnungen im Netzwerk.
System nach Anspruch 1, wobei eine Anzeige (108) über eine Kommunikationseinheit (110) mit der Verarbeitungseinheit (106) verbunden ist, um die klassifizierten Bilder separat entweder als korrodierte Bilder oder als nicht korrodierte Bilder anzuzeigen.