-
Technisches Gebiet
-
Die vorliegende Erfindung bezieht sich auf eine Einrichtung und ein Verfahren zum Analysieren eines Analyseobjekts auf Basis eines Lichtspektrums, das im Analyseobjekt erzeugt wird.
-
Stand der Technik
-
Ein Spektrum von Licht, das in einem Analyseobjekt erzeugt wird, weist eine Form entsprechend Typen oder Verhältnissen von Komponenten, die im Analyseobjekt enthalten sind, auf. Daher kann das Analyseobjekt auf Basis des Spektrums von in dem Analyseobjekt erzeugtem Lichts analysiert werden. Das Spektrum von in dem Analyseobjekt erzeugten Licht beinhaltet ein Spektrum von Licht (beispielsweise reflektiertes Licht, transmittiertes Licht, gestreutes Licht, Fluoreszenzlicht, durch ein nicht-lineares optisches Phänomen (beispielsweise Raman-Streuung oder dergleichen) erzeugtes Licht), das in Reaktion auf Lichtbestrahlung auf das Analyseobjekt in dem Analyseobjekt erzeugt wird, und beinhaltet weiter ein Spektrum von chemilumineszenten Licht, welches durch eine chemische Reaktion im Analyseobjekt erzeugt wird. Zusätzlich beinhaltet das Lichtspektrum ein Spektrum von refraktivem Index oder Absorptions-Koeffizienten, die aus transmittiertem Licht oder reflektiertem Licht ermittelt werden. Hier ist das Licht nicht auf ultraviolettes Licht, sichtbares Licht und Infrarotlicht beschränkt und beinhaltet beispielsweise Terahertz-Wellen.
-
Konventioneller Weise ist eine multivariante Analyse zum Durchführen der Spektrum-Analyse verwendet worden. Als multivariante Analyse werden Hauptkomponentenanalyse, Klassifizierer, Regressionsanalyse und dergleichen verwendet, oder in einem bekannten Analyseverfahren kombiniert und verwendet. Weiterhin schlägt Patentdokument 1 auch das Durchführen der Spektralanalyse unter Verwendung eines tiefen neuronalen Netzwerks vor. Mit dem tiefen neuronalen Netzwerk ist es möglich, hocheffiziente und hochgenaue Bilderkennung oder dergleichen zu erzielen (siehe Nicht-Patentdokument 1), so dass, falls die Spektralanalyse unter Verwendung des tiefen neuronalen Netzwerks durchgeführt wird, es erwartet wird, hocheffiziente und hochgenaue Analyse im Vergleich zu dem Fall, bei dem multivariante Analyse verwendet wird, zu erzielen.
-
Zitateliste
-
Patentliteratur
-
Patentdokument 1: Japanische Patentanmeldung, Veröffentlichungsnummer
JP2017-90130A
-
Nicht-Patentliteratur
-
Nicht-Patentliteratur 1:
- Nichtpatentdokument 1: O. Russakovsky et al., „ImageNet Large Scale Visual Recognition Challenge", Int. J. Comput. Vis. 115, 2015, S.211-252
- Nichtpatentdokument 2: R. R. Selvaraju et al., „Grad-CAM: Visual Explanations from Deep Networks via Gradientbased Localization“, arXiv:1610.02391, 2017
- Nichtpatentdokument 3: D. Smilkov et al., „SmoothGrad: removing noise by adding noise“, arXiv:1706.03825, 2017
-
Zusammenfassung der Erfindung
-
Technisches Problem
-
Jedoch beschreibt Patentdokument 1 keine spezifische Prozedur zum Durchführen der Spektralanalyse unter Verwendung des tiefen neuronalen Netzwerks. Weiter schlägt Nicht-Patentdokument 1 nicht das Durchführen der Spektralanalyse unter Verwendung des tiefen neuronalen Netzwerks vor.
-
Die vorliegende Erfindung ist gemacht worden, um das obige Problem zu lösen und eine Aufgabe derselben ist es, eine Einrichtung und ein Verfahren bereitzustellen, die zum Durchführen hocheffizienter und hochgenauer Spektralanalyse in der Lage sind.
-
Problemlösung
-
Eine Spektralanalyseeinrichtung gemäß der vorliegenden Erfindung ist eine Einrichtung zum Analysieren eines Analyseobjektes auf Basis eines Spektrums von in dem Analyseobjekt erzeugten Licht, das ein oder zwei oder mehr einer Vielzahl von Referenzobjekten enthält, und beinhaltet (1) eine Feldumwandlungseinheit zum Umwandeln von zwei-dimensionalen Felddaten auf Basis eines Spektrums von Licht; (2) eine Verarbeitungseinheit, die ein tiefes neuronales Netzwerk beinhaltet; und (3) eine Analyseeinheit zum Eingeben der zwei-dimensionalen Felddaten, welche durch die Feldumwandlungseinheit erzeugt sind, auf Basis des Spektrums von in dem Analyseobjekt erzeugtem Licht in das tiefe neuronale Netzwerk und Analysieren des Analyseobjekts auf Basis von aus dem tiefen neuronalen Netzwerk ausgegebenen Daten.
-
Ein Spektralanalyseverfahren gemäß der vorliegenden Erfindung ist ein Verfahren zum Analysieren eines Analyseobjekts auf Basis eines Spektrums von in dem Analyseobjekt erzeugten Licht, das ein oder zwei oder mehr einer Vielzahl von Referenzobjekten enthält, und beinhaltet (1) einen Feldumwandlungsschritt des Erzeugens von zwei-dimensionalen Felddaten auf Basis eines Spektrums von Licht; und (2) einen Analyseschritt, der eine Verarbeitungseinheit, die ein tiefes neuronales Netzwerk beinhaltet, verwendet, des Eingebens der zwei-dimensionalen Felddaten, die in einem Feldumwandlungsschritt erzeugt werden, auf Basis des Spektrums von in dem Analyseobjekt erzeugten Licht, in das tiefe neuronale Netzwerk, und Analysieren des Analyseobjektes auf Basis von aus dem tiefen neuronalen Netzwerk ausgegebenen Daten.
-
Vorteilhafte Effekte der Erfindung
-
Gemäß der vorliegenden Erfindung kann eine hocheffiziente und hochgenaue Spektralanalyse durchgeführt werden.
-
Figurenliste
-
- 1 ist ein Diagramm, das eine Konfiguration einer Spektralanalyseeinrichtung 1 illustriert.
- 2 ist ein Diagramm, das ein Beispiel von zwei-dimensionalen Felddaten illustriert, die auf Basis eines Raman-Spektrums erzeugt werden.
- 3 ist ein Diagramm, das ein Beispiel von Raman-Spektren jeweiliger Polymermaterialien als Referenzobjekt illustriert.
- 4 ist eine Tabelle, die Werte von Trainingskennzeichnungen von jeweiligen Polymermaterialien zum Erlernen eines Raman-Spektrums von PC als einem Referenzobjekt illustriert.
- 5 ist ein Diagramm, das ein Beispiel des Raman-Spektrums von PC als einem Analyseobjekt illustriert.
- 6 ist ein Diagramm, das ein Beispiel von Ausgabekennzeichnungen illustriert, wenn zwei-dimensionale Felddaten, basierend auf dem Raman-Spektrum von PC als dem Analyseobjekt in ein tiefes neuronales Netzwerk eingegeben werden.
- 7 beinhaltet Tabellen, die Klassifikationsergebnisse in einem ersten Beispiel und einem ersten Vergleichsbeispiel zusammenfasst und illustriert (a) ein Klassifikationsergebnis des ersten Beispiels, und (b) ein Klassifikationsergebnis des ersten Vergleichsbeispiels.
- 8 ist ein Diagramm, das ein Beispiel von Raman-Spektren von Mischungen von SR und PS illustriert.
- 9 ist eine Tabelle, die Werte von Trainingskennzeichnungen von jeweiligen Polymermaterialien zum Erlernen eines Raman-Spektrums einer Mischung von PC und PMMA (Mischverhältnis 0,8:0,2) illustrieren.
- 10 ist ein Diagramm, das ein Beispiel von Ausgabekennzeichnungen illustriert, wenn zwei-dimensionale Felddaten basierend auf dem Raman-Spektrum einer Mischung von PC und PMMA Mischverhältnis 0,8:0,2) als das Analyseobjekt im tiefen neuronalen Netzwerk eingegeben werden.
- 11 beinhaltet Diagramme, die Quantifizierungsergebnisse von PC in einem zweiten Beispiel und einem zweiten Vergleichsbeispiel illustrieren, und illustriert (a) ein Quantifizierungsergebnis des zweiten Beispiels, und (b) ein Quantifizierungsergebnis des zweiten Vergleichsbeispiels.
- 12 beinhaltet Diagramme, die Quantifizierungsergebnisse von PET im zweiten Beispiel und dem zweiten Vergleichsbeispiel illustrieren, und illustriert (a) ein Quantifizierungsergebnis des zweiten Beispiels, und (b) ein Quantifizierungsergebnis des zweiten Vergleichsbeispiels.
- 13 beinhaltet Diagramme, die Quantifizierungsergebnisse von PMMA im zweiten Beispiel und dem zweiten Vergleichsbeispiel illustrieren, und illustriert (a) ein Quantifizierungsergebnis des zweiten Beispiels, und (b) ein Quantifizierungsergebnis des zweiten Vergleichsbeispiels.
- 14 beinhaltet Diagramme, die Quantifizierungsergebnisse von PS im zweiten Beispiel und dem zweiten Vergleichsbeispiel illustrieren, und illustriert (a) ein Quantifizierungsergebnis des zweiten Beispiels, und (b) ein Quantifizierungsergebnis des zweiten Vergleichsbeispiels.
- 15 beinhaltet Diagramme, die Quantifizierungsergebnisse von PVC(b) im zweiten Beispiel und dem zweiten Vergleichsbeispiel illustrieren, und illustriert (a) ein Quantifizierungsergebnis des zweiten Beispiels, und (b) ein Quantifizierungsergebnis des zweiten Vergleichsbeispiels.
- 16 beinhaltet Diagramme, die Quantifizierungsergebnisse von PVDC im zweiten Beispiel und dem zweiten Vergleichsbeispiel illustrieren, und illustriert (a) ein Quantifizierungsergebnis des zweiten Beispiels, und (b) ein Quantifizierungsergebnis des zweiten Vergleichsbeispiels.
- 17 beinhaltet Diagramme, die Quantifizierungsergebnisse von SR im zweiten Beispiel und dem zweiten Vergleichsbeispiel illustrieren, und illustriert (a) ein Quantifizierungsergebnis des zweiten Beispiels, und (b) ein Quantifizierungsergebnis des zweiten Vergleichsbeispiels.
- 18 beinhaltet Diagramme, die ein Beispiel eines Spektrums zum Trainieren vor Kompression und zwei-dimensionale Felddaten illustrieren, und (a) zwei-dimensionale Felddaten und (b) ein Spektrum illustrieren.
- 19 beinhaltet Diagramme, die ein Beispiel eines Spektrums zum Trainieren nach Kompression und zwei-dimensionale Felddaten illustrieren und, und illustriert (a) zwei-dimensionale Felddaten und (b) ein Spektrum.
- 20 beinhaltet Diagramme, die ein Beispiel eines Spektrums eines Analyseobjekts und zwei-dimensionalen Felddaten illustrieren, und illustriert (a) zwei-dimensionale Felddaten und (b) ein Spektrum.
- 21 beinhaltet Tabellen, die Klassifikationsergebnisse in einem dritten Beispiel und einem dritten Vergleichsbeispiel zusammenfassen und illustriert (a) ein Klassifikationsergebnis des dritten Beispiels und (b) ein Klassifikationsergebnis des dritten Vergleichsbeispiels.
- 22 ist ein Diagramm, das ein Beispiel einer Wärmeabbildung des als PC im ersten Beispiel klassifizierten Spektrums illustriert.
-
Beschreibung von Ausführungsformen
-
Nachfolgend werden Ausführungsformen zum Ausführen der vorliegenden Erfindung im Detail unter Bezugnahme auf die beigefügten Zeichnungen beschrieben. In der Beschreibung der Zeichnungen werden dieselben Elemente durch dieselben Bezugszeichen ohne redundante Beschreibung bezeichnet. Die vorliegende Erfindung ist nicht auf diese Beispiele beschränkt.
-
1 ist ein Diagramm, das eine Konfiguration einer Spektralanalyseeinrichtung 1 illustriert. Die Spektralanalyseeinrichtung 1 ist eine Einrichtung zum Analysieren eines Analyseobjektes auf Basis eines Spektrums von in dem Analyseobjekt erzeugtem Licht, das ein, oder zwei oder mehr einer Vielzahl von Referenzobjekten enthält, und beinhaltet eine Feldumwandlungseinheit 10, eine Verarbeitungseinheit 20, eine Lerneinheit 30 und eine Analyseeinheit 40.
-
Die Feldumwandlungseinheit 10 erzeugt zwei-dimensionale Felddaten auf Basis des Spektrums von in dem Referenzobjekt oder dem Analyseobjekt erzeugtem Licht. Die Feldumwandlungseinheit 10 erzeugt vorzugsweise zwei-dimensionale Felddaten durch Normalisieren des Spektrums, so dass die Spitzenintensität des Spektrums einen vorbestimmten Wert aufweist. Weiter wird es ebenfalls bevorzugt, dass die Feldumwandlungseinheit 10 die zwei-dimensionalen Felddaten durch Anordnung von M × N Datenstücken, die alle oder einen Teil von Daten des Spektrums enthält, in M Reihen und N Spalten erzeugt. M und N sind Ganzzahlen von 2 oder mehr. M und N können sich voneinander unterscheiden oder können gleich sein.
-
Die Verarbeitungseinheit 20 beinhaltet ein tiefes neuronales Netzwerk. Das tiefe neuronale Netzwerk ist vorzugsweise ein konvolutionales neuronales Netzwerk. Das konvolutionale neuronale Netzwerk beinhaltet eine konvolutionale Schicht zum Extrahieren eines Merkmals und eine Sammelschicht zum Komprimieren des Merkmals, die abwechselnd vorgesehen sind. Die Verarbeitungseinheit 20 kann die Verarbeitung in einem tiefen neuronalen Netzwerk durch eine Zentralverarbeitungseinheit (CPU) durchführen und kann weiter vorzugsweise durch einen Digital-Signal-Prozessor (DSP) oder eine Graphikverarbeitungseinheit (GPU), die zum Erzielen einer Verarbeitung mit höherer Geschwindigkeit in der Lage sind, durchführen.
-
Die Lerneinheit 30 veranlasst die Feldumwandlungseinheit 10, die zwei-dimensionalen Felddaten auf Basis des Spektrums von in jedem der Vielzahl von Referenzobjekten erzeugtem Licht zu erzeugen, gibt die zwei-dimensionalen Felddaten an dem tiefen neuronalen Netzwerk als Trainingsdaten ein und trainiert das tiefe neuronale Netzwerk. Weiter veranlasst die Lerneinheit 30 die Feldumwandlungseinheit 10, die zwei-dimensionalen Felddaten auf Basis des Spektrums von in einer Mischung, die ein oder zwei oder mehr der Referenzobjekte enthält, und ein bekanntes Mischverhältnis aufweist, erzeugtem Licht, zu erzeugen, gibt die zwei-dimensionalen Felddaten an das tiefe neuronale Netzwerk als Trainingsdaten ein und trainiert das tiefe neuronale Netzwerk unter Verwendung des Mischverhältnisses. Ein solches Lernen des tiefen neuronalen Netzwerks wird als tiefes Lernen (deep learning) bezeichnet.
-
Die Analyseeinheit 40 veranlasst die Feldumwandlungseinheit 10, die zwei-dimensionalen Felddaten auf Basis des Spektrums von in dem Analyseobjekt erzeugtem Licht zu erzeugen, gibt die zwei-dimensionalen Felddaten an das tiefe neuronale Netzwerk als Analyseobjektdaten ein und analysiert das Analyseobjekt auf Basis der aus dem tiefen neuronalen Netzwerk ausgegebenen Daten. Die Analyseeinheit 40 klassifiziert das Analyseobjekt als eines der Vielzahl von Referenzobjekten, auf Basis der aus dem tiefen neuronalen Netzwerk ausgegebenen Daten. Weiter bestimmt die Analyseeinheit 40 das Mischverhältnis des Referenzobjekts, das in dem Analyseobjekt enthalten ist, auf Basis der aus dem tiefen neuronalen Netzwerk ausgegebenen Daten.
-
Die Feldumwandlungseinheit 10 stellt die Trainingsdaten und die Analyseobjektdaten jeweils als zwei-dimensionale Felddaten von identischen M Reihen und N Spalten bereit. Daher, wenn die Spektrumsdatengröße nicht M × N ist, oder wenn die Datengröße sich zwischen dem Trainingsspektrum und dem Analyseobjektspektrum unterscheidet, wird es bevorzugt, dass die Feldumwandlungseinheit 10 Dezimierung, Trimmen, Ergänzen eines beliebigen Werts und dergleichen an den Spektrumsdaten durchführt. Weiter stellt die Feldumwandlungseinheit 10 vorzugsweise die Trainingsdaten und die Analyseobjektdaten jeweils als die zwei-dimensionalen Felddaten identisch in M Reihen und N Spalten bereit, durch eine Interpolationsmethode (Spline-Interpolation, Lagrange-Interpolation, Akima-Interpolation oder dergleichen), die im Feld der Numerikanalyse verwendet wird, oder ein Kompressionsverfahren (Wavelet-Transformation, direkte Kosinus-Transformation oder dergleichen), die auf dem Gebiet der Bildverarbeitung verwendet wird.
-
Die Spektralanalyseeinrichtung 1 kann eine Eingabeeinheit beinhaltet, die eine Auswahl eines Spektrums des Analyseobjekts, Anweisung des Analysestarts, Auswahl von Analysebedingungen und dergleichen empfängt. Die Eingabeeinheit ist beispielsweise eine Tastatur, eine Maus oder dergleichen. Weiter kann die Spektralanalyseeinrichtung 1 eine Anzeigeeinheit beinhalten, die ein Analyseergebnis und dergleichen anzeigt. Die Anzeigeeinheit ist beispielsweise eine Flüssigkristallanzeige oder dergleichen. Die Spektralanalyseeinrichtung 1 kann eine Speichereinheit beinhalten, die ein Analyseobjektspektrum, ein Analyseergebnis und dergleichen speichert. Die Spektralanalyseeinrichtung 1 kann einen Computer beinhalten.
-
Ein Spektrum-Analyseverfahren, welches die obige Spektralanalyseeinrichtung 1 verwendet, beinhaltet einen Feldumwandlungsschritt durch die Feldumwandlungseinheit 10, einen Lernschritt durch die Lerneinheit 30 und einen Analyseschritt durch die Analyseeinheit 40.
-
Das heißt, dass im Feldumwandlungsschritt zwei-dimensionale Felddaten in der Feldumwandlungseinheit 10 auf Basis des Spektrums von in dem Referenzobjekt oder dem Analyseobjekt erzeugtem Licht erzeugt werden. Im Lernschritt, unter Verwendung der Verarbeitungseinheit 20 einschließlich des tiefen neuronalen Netzwerks, werden die im Feldumwandlungsschritt auf Basis des Spektrums von in jeder der Vielzahl von Referenzobjekten erzeugtem Licht erzeugten zwei-dimensionalen Felddaten an dem tiefen neuronalem Netzwerk als die Trainingsdaten zum Trainieren des tiefen neuronalem Netzwerks eingegeben. Im Analyseschritt, unter Verwendung der das tiefe neuronale Netzwerk enthaltenden Verarbeitungseinheit 20, werden die in dem Feldumwandlungsschritt auf Basis des Spektrums von in dem Analyseobjekt erzeugtem Licht erzeugten zwei-dimensionalen Felddaten an dem tiefen neuronalem Netzwerk als die Analyseobjektdaten zum Analysieren des Analyseobjektes auf Basis der aus dem tiefen neuronalen Netzwerk ausgegebenen Daten eingegeben.
-
Wenn das tiefe neuronale Netzwerk im Lernschritt einmal gelernt hat, kann der Analyseschritt danach wiederholt werden, so dass es nicht notwendig ist, einen Lernschritt jedes Mal, wenn der Analyseschritt durchgeführt wird, durchzuführen. Aus demselben Grund, wenn das tiefe neuronale Netzwerk bereits gelernt hat, ist die Lerneinheit 30 unnötig.
-
In der vorliegenden Ausführungsform werden die zwei-dimensionalen Felddaten, die basierend auf dem Spektrum erzeugt werden, am tiefen neuronalen Netzwerk zum Durchführen der Spektralanalyse eingegeben und somit kann die Spektralanalyse stabil mit hoher Effizienz und hoher Genauigkeit selbst in dem Fall durchgeführt werden, bei dem eine komplizierte Klassifikation durchgeführt wird oder eine große Anzahl von Spektren klassifiziert wird. Weiter kann in der vorliegenden Ausführungsform eine quantitative Analyse unter Verwendung des tiefen neuronalen Netzwerks durchgeführt werden.
-
Als Nächstes werden erste bis dritte Beispiele beschrieben. In jedem Beispiel werden sieben Typen von unten aufgelisteten Polymermaterialien als Referenzobjekte verwendet. Als ein Analyseobjekt wurde ein Objekt verwendet, dass ein oder zwei Typen von diesen sieben Typen von Polymermaterialien enthält.
- Polycarbonat (PC)
- Polyethylenterephthalat (PET)
- Polymethylmethacrylat (PMMA)
- Polystyrol (PS)
- Hartes Polyvinylchlorid (PVC(h))
- Polyvinylidenchlorid (PVDC)
- Silikon-Gummi (SR)
-
Das Referenzobjekt und das Analyseobjekt wurden mit Laserlicht mit einer zentralen Wellenlänge von 785 nm bestrahlt und die Intensität von erzeugtem Raman-Streulicht wurde bei jedem Wert eines Raman-Verschiebungsbetrags (Wellennummer) gemessen, um das Raman-Spektrum zu erhalten.
-
In den ersten und zweiten Beispielen betrug die Datengröße jedes Spektrums 1024. Im Feldumwandlungsschritt wurde die Normalisierung so durchgeführt, dass die Spitzenintensität einen vorbestimmten Wert für jedes Raman-Spektrum aufwieß, und es wurden 1024 Datenstücke jedes Raman-Spektrums in 32 Reihen und 32 Spalten angeordnet, um zwei-dimensionale Felddaten zu erzeugen. Beim Erzeugen der zwei-dimensionalen Felddaten wurden die ersten 32 Datenstücke in den in der Reihenfolge der Wellennummer des Raman-Spektrums angeordneten 1024 Datenstücke in der Reihenfolge ab der ersten Spalte bis zur 32. Spalte in der ersten Reihe angeordnet, wurden die nächsten 32 Datenstücke in der Reihenfolge ab der ersten Spalte bis zur 32. Spalte in der zweiten Reihe angeordnet und wurden die Prozesse wiederholt durchgeführt, und wurden die letzten 32 Datenstücke in der Reihenfolge ab der ersten Spalte bis zur 32. Spalte in der 32. Reihe angeordnet. Im dritten Beispiel betrug die Datengröße des Analyseobjektspektrums 256.
-
2 ist ein Diagramm, das ein Beispiel der auf Basis des Raman-Spektrums erzeugten zwei-dimensionalen Felddaten illustriert. Diese Figur illustriert zwei-dimensionale Felddaten als ein zwei-dimensionales Bild. Die Anzahl von Pixeln in dieser Figur beträgt 32 × 32. Jedes Pixel wird in helleren Tönen bei größeren Datenwerten illustriert, während in dunkleren Tönen bei kleineren Datenwerten illustriert wird. Die Anzahl von Gradationen beträgt 256. Diese Figur jedoch illustriert ein zwei-dimensionales Bild mit 256 Gradationen für die Bequemlichkeit, aber eine reale Anzahl von etwa 0 - 70 wurde als ein Wert für jedes Pixel bei der tatsächlichen Verarbeitung verwendet.
-
Im ersten Beispiel wurde das Analyseobjekt als eines von sieben Typen von Referenzobjekten klassifiziert, wie unten beschrieben.
-
Im Lernschritt wurden 100 Raman-Spektren als Trainingsdaten für jedes Polymermaterial als das Referenzobjekt verwendet. Insgesamt 700 (= 100 × 7 Typen) von Datenstücken wurden als die Trainingsdaten verwendet. Im Falle von PC wurden beispielsweise zwei-dimensionale Felddaten im Feldumwandlungsschritt auf Basis des Raman-Spektrums eines Polymermaterials, das nur aus PC besteht, erzeugt. Dann wurden die zwei-dimensionalen Felddaten in das tiefe neuronale Netzwerk eingegeben, wobei die Trennungskennzeichnung für PC auf den Wert 1 eingestellt wurde und die Trainingskennzeichnungen für die anderen Polymermaterialien auf den Wert 0 eingestellt werden, um das tiefe neuronale Netzwerk zu trainieren. 3 ist ein Diagramm, das ein Beispiel von Raman-Spektren von jeweiligen Polymermaterialien als die Referenzobjekte illustriert. 4 ist eine Tabelle, die Werte der Trainingskennzeichnungen für entsprechende Polymermaterialien zum Lernen des Raman-Spektrums von PC als dem Referenzobjekt illustriert.
-
Im Analyseschritt wurden 40 Raman-Spektren als Analyseobjektdaten für jedes Polymermaterial als das Analyseobjekt verwendet. Insgesamt 280 (= 40 × 7 Typen) Datenstücke wurden als die Analyseobjektdaten verwendet. Beispielsweise wurden im Falle von PC vier Typen von Raman-Spektren des nur aus PC bestehenden Polymermaterials mit unterschiedlichen Signalrauschverhältnissen vorbereitet und wurden zwei-dimensionale Felddaten im Feldumwandlungsschritt auf Basis jedes Raman-Spektrums erzeugt. Dann wurden die zwei-dimensionalen Felddaten an das tiefe neuronale Netzwerk eingegeben, um Ausgabekennzeichnungen aus dem tiefen neuronalen Netzwerk zu erhalten.
-
5 ist ein Diagramm, das ein Beispiel des Raman-Spektrums von PC als dem Analyseobjekt illustriert. Diese Figur illustriert vier Raman-Spektren mit unterschiedlichen SN-Verhältnissen. 6 ist ein Diagramm, das ein Beispiel der Ausgabekennzeichnungen illustriert, wenn die zwei-dimensionalen Felddaten, die auf dem Raman-Spektrum von PC basieren, als dem Analyseobjekt, in das tiefe neuronale Netzwerk eingegeben werden. Im Beispiel dieser Figur ist der Wert der Ausgabekennzeichnung von PC die größte von den Ausgabekennzeichnungen der jeweiligen Polymermaterialien, die aus dem tiefen neuronalen Netzwerk ausgegeben werden, so dass das Analyseobjekt als PC klassifiziert wird.
-
In einem ersten Vergleichsbeispiel im Vergleich mit dem ersten Beispiel wurde das Analyseobjekt als einer von sieben Typen von Referenzobjekten durch multivariate Analyse klassifiziert, wie unten beschrieben. Das heißt, auf Basis des Ergebnisses der Durchführung von Hauptkomponentenanalyse (PCA, princial componenten analysis) an den Trainingsdaten wurde ein Sieben-Klassen-Musteridentifizierer durch eine Unterstützungsvektormaschine (SVM, support vector machine) gebildet. Die Anzahl von Hauptkomponenten von PCA betrug 8 und die Beitragsrate von PCA war 0,968. Die Analyseobjektdaten wurden an den Musteridentifizierer durch SVM eingegeben.
-
7 beinhaltet Tabellen, die Klassifikationsergebnisse im ersten Beispiel und im ersten Vergleichsbeispiel zusammenfassen, (a) In 7 illustriert ein Klassifikationsergebnis des ersten Beispiels und (b) in 7 illustriert ein Klassifikationsergebnis des ersten Vergleichsbeispiels. Im ersten Vergleichsbeispiel waren von 280 Analyseobjektdatenstücken die Klassifikationsergebnisse von 10 Analyseobjektdatenstücken von PS mit dem niedrigsten SN-Verhältnis inkorrekt. Andererseits konnten im ersten Beispiel alle 280 Analyseobjektdatenstücke korrekt klassifiziert werden. Somit, verglichen mit dem ersten Vergleichsbeispiel, das die multivariate Analyse verwendet, war das erste Beispiel, dass das tiefe neuronale Netzwerk verwendet, in der Lage, mit höherer Genauigkeit klassifiziert zu werden.
-
Im zweiten Beispiel wurde ein Mischverhältnis des in dem Analyseobjekt enthaltenen Referenzobjekt bestimmt, wie unten beschrieben.
-
Im Lernschritt wurde das Raman-Spektrum einer Mischung, die ein oder zwei Typen von den sieben Typen von Polymermaterialien als Referenzobjekte enthielt, und ein bekanntes Mischverhältnis aufwieß, als Trainingsdaten verwendet. Beispielsweise im Fall einer Mischung von PC und PET wurde das Mischverhältnis von PC und PET auf × : (1-x) eingestellt, wobei × um 0,1 im Bereich von 0 bis 1 inkrementiert wurde, und wurden die Raman-Spektren von Mischungen mit 11 unterschiedlichen Mischverhältnissen vorbereitet. Zusätzlich, obwohl PC 100% ist, wenn × = 1 und PET 100% ist, wenn × = 0, werden diese hier aus Gründen der Bequemlichkeit auch als Mischungen bezeichnet.
-
Die Gesamtanzahl von Trainingsdatenstücken betrug 3 für jedes Polymermaterial (x = 0) (Untersumme 21 (= 3 × 7)) und 3 für eine Mischung, die jegliche zwei Typen von Polymermaterialien (ein Mischverhältnis von neun Typen von x = 0,1 bis 0,9) enthielt (Untersumme 567 (= 3 × 7C2 × 9), so dass die Gesamtzahl 588 bereitgestellt wurde. 7C2 gibt 7 × 6/2 an, was die Anzahl von Kombinationen beim Auswählen von zwei Typen aus sieben Typen repräsentiert. Das Raman-Spektrum der Mischung wurde durch gewichtete Mittelung der Raman-Spektren zweier jeweiliger Polymermaterialien durch die Mischverhältnisse vorbereitet.
-
Es wurden zwei-dimensionale Felddaten im Feldumwandlungsschritt auf Basis Raman-Spektrums der Mischung erzeugt. Dann wurden zwei-dimensionale Felddaten an das tiefe neuronale Netzwerke eingegeben, wobei die Trainingskennzeichnungen von Werten den Mischverhältnissen entsprachen, um das tiefe neuronale Netzwerk zu trainieren. 8 ist ein Diagramm, das ein Beispiel der Raman-Spektren der Mischungen von SR und PS illustriert. 9 ist eine Tabelle, die Werte der Trainingskennzeichnungen für entsprechende Polymermaterialien zum Erlernen des Raman-Spektrums der Mischung von PC und PMMA (Mischverhältnis 0,8 : 0,2) illustriert.
-
Im Analyseschritt wurde ein Raman-Spektrum einer Mischung, die ein oder zwei Typen von sieben Typen von Polymermaterialien als die Referenzobjekte enthielt und ein bekanntes Mischverhältnis aufwiesen, als die Analyseobjektdaten verwendet. Die Analyseobjektdaten wurden in derselben Weise wie die Trainingsdaten erzeugt. Die Anzahl von Analyseobjektdatenstücken betrug 1 für jedes Polymermaterial (x = 0) und 1 für jede Mischung, die jegliche zwei Polymermaterialien enthielt (ein Mischverhältnis von neun Typen von x = 0,1 bis 0,9), womit eine Gesamtanzahl 196 bereitgestellt wurde.
-
10 ist ein Diagramm, das ein Beispiel von Ausgabekennzeichnungen illustriert, wenn zwei-dimensionale Felddaten, basierend auf dem Raman-Spektrum der Mischung von PC und PMMA (Mischverhältnis 0,8 : 0,2) als das Analyseobjekt in das tiefe neuronale Netzwerk eingegeben werden. Im Beispiel dieser Figur ist von den Ausgabekennzeichnungen für entsprechende Polymermaterialien, die aus dem tiefen neuronalen Netzwerk ausgegeben werden, der Wert der Ausgabekennzeichnung von PC 0,75, der Wert der Ausgabekennzeichnung von PMMA ist 0,15 und der Wert der Ausgabekennzeichnung von PVDC ist 0,10, so dass festgestellt wird, dass das Analyseobjekt eine Mischung von drei Typen von Polymermaterialien von PC, PMMA und PVDC ist, und das Mischverhältnis 0,75 : 0,15 : 0,10 beträgt.
-
In einem zweiten Vergleichsbeispiel wurde im Vergleich zu dem zweiten Beispiel ein Mischverhältnis des in dem Analyseobjekt enthaltenen Referenzobjekts durch multivariate Analyse bestimmt, wie unten beschrieben. Das heißt, dass eine Kalibrationskurve durch multivariate lineare Regression (MLR) erzeugt wurde, auf Basis des Ergebnisses des Anwendens von PCA auf die Trainingsdaten, und eine Quantifizierung unter Verwendung dieser Kalibrierungskurve durchgeführt wurde. Die Anzahl von Hauptkomponenten von PCA betrug 10 und die Beitragsrate von PCA war 0,994.
-
11 bis 17 sind Diagramme, die Quantifizierungsergebnisse im zweiten Beispiel und im zweiten Vergleichsbeispiel illustrieren. 11 illustriert die Quantifizierungsergebnisse von PC. 12 illustriert die Quantifizierungsergebnisse von PET. 13 illustriert die Quantifizierungsergebnisse von PMMA. 14 illustriert die Quantifizierungsergebnisse von PS. 15 illustriert die Quantifizierungsergebnisse von PVC(h). 16 illustriert die Quantifizierungsergebnisse von PVDC. 17 illustriert die Quantifizierungsergebnisse von SR. In jeder Figur illustriert (a) das Quantifizierungsergebnis im zweiten Beispiel. In jeder Figur illustriert (b) das Quantifizierungsergebnis im zweiten Vergleichsbeispiel. Weiter illustriert jede Figur die Beziehung zwischen dem wahren Mischverhältnis (horizontale Achse) und dem Mischverhältnis (vertikale Achse) des Quantifizierungsergebnisses für alle Trainingsdaten und die Analyseobjektdaten. Die Differenz zwischen dem wahren Mischverhältnis und dem Mischverhältnis des Quantifizierungsergebnisses wurde durch den mittleren quadratischen Gesamtfehler evaluiert, um 0,0473 im zweiten Beispiel und 0,0762 im zweiten Vergleichsbeispiel zu erhalten. Somit kann verglichen mit dem zweiten Vergleichsbeispiel, welches die multivariate Analyse verwendet, das zweite Beispiel, welches das tiefe neuronale Netzwerk verwendet, die quantitative Analyse mit hoher Genauigkeit durchführen.
-
Im dritten Beispiel wurde das Analyseobjekt als eins von sieben Typen von Referenzobjekten klassifiziert, in der im Wesentlichen selben Weise wie im ersten Beispiel. Insgesamt 700 (= 100 × 7 Typen) von Datenstücken wurden als die Trainingsdaten verwendet. Insgesamt 280 (= 40 × 7 Typen) Datenstücke wurden als die Analyseobjektdaten verwendet. Das dritte Beispiel war dasselbe wie das erste Beispiel dahingehend, dass die Datengröße des Trainingsspektrums 1024 war, unterschied sich aber darin, dass die Datengröße des Analyseobjektspektrums 256 war.
-
Um sowohl die Trainingsdaten als auch die Analyseobjektdaten auf die zwei-dimensionalen Felddaten von 16 Reihen und 16 Spalten einzustellen, wurde die Datengröße des Trainingsspektrums durch Wavelet-Transformation auf 256 komprimiert, und wurden die zwei-dimensionalen Felddaten in den Feldumwandlungsschritt auf Basis des komprimierten Spektrums erzeugt. 18 beinhaltet Diagramme, die ein Beispiel des Trainingsspektrums vor Kompression und die zwei-dimensionalen Felddaten illustrieren. 19 beinhaltet Diagramme, die ein Beispiel des Trainingsspektrums nach Kompression und die zwei-dimensionalen Felddaten illustrieren. 20 beinhaltet Diagramme, die ein Beispiel des Analyseobjektspektrums und der zwei-dimensionalen Felddaten illustrieren. In jeder Figur illustriert (a) die zwei-dimensionale Felddaten. In jeder Figur illustriert (b) das Spektrum.
-
In einem dritten Vergleichsbeispiel wurde im Vergleich mit dem dritten Beispiel das Analyseobjekt als einer von sieben Typen von Referenzobjekten durch multivariate Analyse (PCA und SVM) wie im ersten Vergleichsbeispiel klassifiziert. Die Anzahl von Hauptkomponenten von PCA betrugt 8, und das Beitragsverhältnis von PCA betrag 0,974.
-
21 beinhaltet Tabellen, die Klassifikationsergebnisse im dritten Beispiel und im dritten Vergleichsbeispiel zusammenfassen, (a) in 21 illustriert das Klassifikationsergebnis des dritten Beispiels und (b) in 21 illustriert das Klassifikationsergebnis des dritten Vergleichsbeispiels. Eine korrekte Antwortrate betrug 97,4% im dritten Vergleichsbeispiel und eine korrekte Antwortrate betrug 99,3% im dritten Beispiel. Wie oben beschrieben, selbst wenn die Spektrums-Datengröße komprimiert wird, erzielte das das tiefe neuronale Netzwerk verwendende Beispiel eine Klassifikation mit höherer Genauigkeit als das, die Multivariat-Analyse verwendende dritte Vergleichsbeispiel.
-
Zusätzlich, in der Analyse des Analyseobjekts, welche durch die Analyseeinheit 40 durchgeführt wird, kann ein zur Bilderkennung verwendetes Merkmalsvisualisierungsverfahren auf ein Spektrum angewendet werden und kann das Merkmalsvisualisierungsverfahren beispielsweise für das Extrahieren von Merkmalsbereichen im Spektrum verwendet werden.
-
Hier wird ein Beispiel, das eine Technik verwendet, die Grad-CAM (Gradienten gerichtete Klassenaktivierungsabbildung) genannt wird (siehe Nicht-Patentdokument 2), auf dem Gebiet des tiefen Lernens als das Merkmalsvisualisierungsverfahren beschrieben. Dies ist eine von Techniken zum Visualisieren von Bewertungskriterien der ermittelten Klassifikationsergebnisse im konvolutionalen neuronalen Netzwerk. Durch Anwendung einer solchen Technik auf das Spektrum steht zu erwarten, dass es für die Verifikation der Gültigkeit des Modells (beispielsweise Bestimmen, ob eine Spitze, die Menschen zur Identifikation verwenden, fokussiert ist oder nicht) verwendet wird, und es kann auch erwartet werden, dass sie für die Extraktion von Merkmalen verwendet wird, auf die durch Menschen nicht fokussiert worden ist.
-
Der in der Grad-CAM, die oben beschrieben ist, verwendete Algorithmus wird kurz beschrieben. Zuerst wird eine Kennzeichnung, für welche es gewünscht ist, Bewertungskriterien zu ermitteln, spezifiziert. Danach wird berechnet, wieviel die Änderung bei entsprechenden trainierten Merkmalskarten (eine konvolutionale Schicht oder eine Sammelschicht, die passiert wird, bevor die vorhergesagte Kennzeichnung erhalten wird) das Vorhersageergebnis beeinträchtigt. Diese Berechnung hat eine Bedeutung, einen Bereich zu spezifizieren, der einen großen Einfluss auf das Vorhersageergebnis hat, durch Ändern des Wertes jedes Pixels in jedem Kennfeld, etwas und sequentiell, um den Betrag der Änderung zu sehen, der die nachfolgende Stufe beeinträchtigt. Im Allgemeinen wird diese Verarbeitung als Erfassung eines Gradienten ausgedrückt. Wenn die Änderungsbetragskennfelder, die für die entsprechenden Kennfelder ermittelt werden, addiert werden, ist es möglich, einen Bereich zu extrahieren, der einen großen Einfluss auf die nachfolgende Stufe hat, das heißt einen Merkmalsbereich, basierend auf dem die Bewertung vorgenommen wird.
-
22 ist ein Diagramm, das ein Beispiel eines Wärmekennfelds des Spektrums illustriert, das im ersten Beispiel als Polycarbonat (PC) klassifiziert ist. In dieser Figur wird die Summe der durch das obige Verfahren erhaltenen Änderungsbetrags-Kennfelder mit einer Aktivierungsfunktion multipliziert und als ein Wärmekennfeld angezeigt, das dem Originalspektrum überlagert ist, und Bereiche, wo das tiefe Lernmodell bestimmt, wichtig zu sein, werden hervorgehoben.
-
Zusätzlich, wie oben beschrieben, ist Grad-CAN eines der Merkmals-Visualisierungsverfahren zum Durchführen beispielsweise der Extraktion von Merkmalsbereichen im Spektrum. Obwohl das Verfahren des Berechnens des Betrags an Änderung, der durch jedes Pixel gegeben ist, gemeinsam verwendet wird, als das Merkmalsbereichs-Extraktionsverfahren, können neben Grad-CAN verschiedene Verfahren wie etwa SmoothGrad (siehe Nicht-Patentdokument 3) verwendet werden.
-
Die Spektrums-Analyseeinrichtung und das Spektrums-Analyseverfahren gemäß der vorliegenden Erfindung sind nicht auf die obigen Ausführungsformen und Konfigurationsbeispiele beschränkt und verschiedene Modifikationen sind möglich.
-
Die Spektralanalyseeinrichtung der obigen Ausführungsform ist eine Einrichtung zum Analysieren eines Analyseobjektes auf Basis eines Spektrums von Licht, das in dem Analyseobjekt erzeugt wird, das in ein oder zwei oder mehr einer Vielzahl von Referenzobjekten enthalten ist, und ist konfiguriert, (1) eine Feldumwandlungseinheit zum Erzeugen von zwei-dimensionalen Felddaten auf Basis eines Spektrums von Licht; (2) eine Verarbeitungseinheit, die ein tiefes neuronales Netzwerk enthält, und (3) eine Analyseeinheit zum Eingeben der durch die Feldumwandlungseinheit erzeugten zwei-dimensionalen Felddaten auf Basis des Spektrums von in dem Analyseobjekt erzeugtem Licht in das tiefe neuronale Netzwerk und Analysieren des Analyseobjektes auf Basis der aus dem tiefen neuronalen Netzwerk ausgegebenen Daten zu enthalten.
-
In der Analyseeinrichtung der obigen Konfiguration kann die Feldumwandlungseinheit die zwei-dimensionalen Felddaten durch Normalisieren des Spektrums in einer Weise erzeugen, dass eine Spitzenintensität des Spektrums einen vorbestimmten Wert aufweist. Weiter kann in der Analyseeinrichtung der obigen Konfiguration die Feldumwandlungseinheit die zwei-dimensionalen Felddaten durch Anordnen von M × N Datenstücken einschließlich aller oder des Teils von Daten des Spektrums in M Reihen und N Spalten erzeugen.
-
Die Analyseeinrichtung der obigen Konfiguration kann weiter eine Lerneinheit zum Trainieren des tiefen neuronalen Netzwerks durch Eingeben der durch die Feldumwandlungseinheit erzeugten zwei-dimensionalen Felddaten auf Basis des Spektrums von in jedem der Vielzahl von Referenzobjekten erzeugtem Licht in das tiefe neuronale Netzwerk beinhalten. In diesem Fall kann die Lerneinheit die zwei-dimensionalen Felddaten eingeben, welche durch die Feldumwandlungseinheit erzeugt werden, auf Basis des Spektrums von in einer Mischung erzeugten Licht, die ein oder zwei oder mehr der Vielzahl von Referenzobjekten enthält, und ein bekanntes Mischverhältnis aufweist, in das tiefe neuronale Netzwerk eingeben und das tiefe neuronale Netzwerk unter Verwendung des Mischverhältnisses trainieren.
-
In der Analyseeinrichtung der obigen Konfiguration kann die Analyseeinheit das Analyseobjekt als eines der Vielzahl von Referenzobjekten auf Basis der aus dem tiefen neuronalen Netzwerk ausgegebenen Daten klassifizieren. Weiter kann in der Analyseeinrichtung der obigen Konfiguration die Analyseeinheit ein Mischverhältnis des in dem Analyseobjekt enthaltenen Referenzobjekts auf Basis der aus dem tiefen neuronalen Netzwerk ausgegebenen Daten bestimmen. Weiter kann in der Analyseeinrichtung der obigen Konfiguration die Analyseeinheit einen Merkmalsbereich des Spektrums unter Verwendung eines Merkmalsvisualisierungsverfahren extrahieren.
-
Das Spektralanalyseverfahren der obigen Ausführungsform ist ein Verfahren zum Analysieren eines Analyseobjekts auf Basis eines Spektrums von in dem Analyseobjekt erzeugten Licht, das ein oder zwei oder mehr einer Vielzahl von Referenzobjekten enthält, und ist konfiguriert, (1) einen Feldumwandlungsschritt des Erzeugens von zwei-dimensionalen Felddaten auf Basis eines Spektrums von Licht; und (2) ein Analyseschritt, unter Verwendung einer Verarbeitungseinheit, die ein tiefes neuronales Netzwerk beinhaltet, des Eingebens der in dem Feldumwandlungsschritt erzeugten zwei-dimensionalen Felddaten, auf Basis des Spektrums von in dem Analyseobjekt erzeugtem Licht, in das tiefe neuronale Netzwerk und Analysieren des Analyseobjekts auf Basis der aus dem tiefen neuronalen Netzwerk ausgegebenen Daten beinhalten.
-
Im Analyseverfahren der obigen Konfiguration kann der Feldumwandlungsschritt die zwei-dimensionalen Felddaten durch Normalisieren des Spektrums in einer Weise erzeugen, dass eine Spitzenintensität des Spektrums einen vorbestimmten Wert aufweist. Weiter können im Analyseverfahren der obigen Konfiguration der Feldumwandlungsschritt die zwei-dimensionalen Felddaten durch Anordnen von M × N Datenstücken erzeugen, die alle oder Teil von Daten des Spektrums in M Reihen und N Spalten enthalten.
-
Das Analyseverfahren der obigen Konfiguration kann weiter einen Lernschritt des Trainierens des tiefen neuronalen Netzwerks durch Eingeben der in dem Feldumwandlungsschritt erzeugten zwei-dimensionalen Felddaten, auf Basis des Spektrums von in jedem der Vielzahl von Referenzobjekten erzeugtem Licht, in das tiefe neuronale Netzwerk beinhalten. In diesem Fall kann der Lernschritt die in dem Feldumwandlungsschritt erzeugten zwei-dimensionalen Felddaten auf Basis des Spektrums von in einer Mischung, die ein oder zwei der mehr der Vielzahl von Referenzobjekten enthält, und ein bekanntes Mischverhältnis aufweist, erzeugten Lichts in das tiefe neuronale Netzwerk eingeben und das tiefe neuronale Netzwerk unter Verwendung des Mischverhältnisses trainieren.
-
Im Analyseverfahren der obigen Konfiguration kann der Analyseschritt das Analyseobjekt als eines der Vielzahl von Referenzobjekten auf Basis der aus dem tiefen neuronalen Netzwerk ausgegebenen Daten klassifizieren. Weiter kann im Analyseverfahren der obigen Konfiguration der Analyseschritt ein Mischverhältnis des in dem Analyseobjekt enthaltenen Referenzobjekts auf Basis der aus dem tiefen neuronalen Netzwerk ausgegebenen Daten bestimmen. Weiter kann im Analyseverfahren der obigen Konfiguration der Analyseschritt einen Merkmalsbereich im Spektrum unter Verwendung eines Merkmalsvisualisierungsverfahrens extrahieren.
-
Industrielle Anwendbarkeit
-
Die vorliegende Erfindung kann als eine Einrichtung und ein Verfahren verwendet werden, die hocheffiziente und hochgenaue Spektralanalyse durchführen können.
-
Bezugszeichenliste
-
- 1 Spektralanalyseeinrichtung, 10 Feldumwandlungseinheit, 20 Verarbeitungseinheit, 30 Lerneinheit, 40 Analyseeinheit
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
-
Zitierte Nicht-Patentliteratur
-
- O. Russakovsky et al., „ImageNet Large Scale Visual Recognition Challenge“, Int. J. Comput. Vis. 115, 2015, S.211-252 [0005]