DE112020006501T5 - Informationsverarbeitungsvorrichtung, programm, und informationsverarbeitungsverfahren - Google Patents

Informationsverarbeitungsvorrichtung, programm, und informationsverarbeitungsverfahren Download PDF

Info

Publication number
DE112020006501T5
DE112020006501T5 DE112020006501.4T DE112020006501T DE112020006501T5 DE 112020006501 T5 DE112020006501 T5 DE 112020006501T5 DE 112020006501 T DE112020006501 T DE 112020006501T DE 112020006501 T5 DE112020006501 T5 DE 112020006501T5
Authority
DE
Germany
Prior art keywords
variation
samples
classes
degree
labels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE112020006501.4T
Other languages
English (en)
Inventor
Takeru Shiraga
Nobuaki Tanaka
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of DE112020006501T5 publication Critical patent/DE112020006501T5/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/206Drawing of charts or graphs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Operations Research (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Image Analysis (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • User Interface Of Digital Computer (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Eine Informationsverarbeitungsvorrichtung weist eine Distanzmatrix-Berechnungseinheit (104), eine Reihenfolgeanpassungseinheit (105), eine Visualisierungseinheit (106) und eine Anzeigeeinheit (107) auf. Die Distanzmatrix-Berechnungseinheit (104) erzeugt aus einem Datensatz, der Proben aufweist, eine Ähnlichkeitsmatrix, die eine Vielzahl von Spalten und Zeilen aufweist, die entsprechend einer Reihenfolge der angeordneten Proben angeordnet sind und eine Ähnlichkeit zwischen einer Probe, die einer der Spalten entspricht, und einer Probe, die einer der Zeilen entspricht, in einem Feld speichert, das durch die eine der Spalten und die eine der Zeilen spezifiziert ist. Die Reihenfolgeanpassungseinheit (105) erzeugt eine angepasste Ähnlichkeitsmatrix, indem sie auf Kennzeichnungsinformationen Bezug nimmt, die ein Ergebnis einer Kennzeichnung jeder der Proben mit Kennzeichnungen angeben, die jeweils Klassen aufweisen, und die Reihenfolge in der Ähnlichkeitsmatrix so anpassen, dass die Proben nach jeder der Klassen in einer in den Kennzeichnungen markierten Zielkennzeichnung angeordnet sind. Die Visualisierungseinheit (106) erzeugt ein Evaluierungsbildschirmbild, das jedes Feld der angepassten Ähnlichkeitsmatrix in einer der Ähnlichkeit entsprechenden Helligkeit angibt. Die Anzeigeeinheit (107) zeigt das Evaluierungsbildschirmbild an.

Description

  • TECHNISCHES GEBIET
  • Die Offenbarung betrifft eine Informationsverarbeitungsvorrichtung, ein Programm und ein Informationsverarbeitungsverfahren.
  • STAND DER TECHNIK
  • In den letzten Jahren hat eine Entwicklung in der Messtechnik es ermöglicht, verschiedene Arten von Daten zu messen und zu verwerten. Um beispielsweise die Anomalie einer Einrichtung zu diagnostizieren, wird ein Vibrationssensor oder ein Mikrofon in der Einrichtung installiert und die von der Einrichtung erhaltene Vibration oder der Ton werden gemessen. Die auf diese Weise erhaltenen Daten werden verwendet, um die Anomalie der Einrichtung zu erkennen.
  • Wenn solche Messdaten verwendet werden, kann die Qualität der Daten aufgrund von Variationen in der Messumgebung oder Abtastung beeinträchtigt sein. In einem Fall kann der Sensor beispielsweise von verschiedenen Messenden durch unterschiedliche Verfahren angebracht werden, was zu einer Änderung der Art der Daten führen kann. Falls die Daten aufgrund von Faktoren, die nichts mit dem ursprünglichen Messzweck zu tun haben, stark schwanken, kann dies ein Hindernis für die Identifizierung der ursprünglichen Zielkennzeichnung werden, z. B. für die Identifizierung von normal oder anormal.
  • In der Patentliteratur 1 wird eine Korrelationsanalysevorrichtung offenbart, die Zeitreihendaten in Datenstücke vorbestimmter Zeiteinheiten unterteilt, die Ähnlichkeit in jeder Zeiteinheit berechnet und an einer vorbestimmten Position auf einer zweidimensionalen Ebene die Korrelation in jeder vorbestimmten Zeit auf der Grundlage der berechneten Ähnlichkeiten anzeigt.
  • REFERENZ ZUM STAND DER TECHNIK
  • PATENTLITERATUR
  • Patentliteratur 1: Japanische Patentanmeldung, Veröffentlichungsnummer 2015-225637
  • KURZFASSUNG DER ERFINDUNG
  • DURCH DIE ERFINDUNG ZU LÖSENDES PROBLEM
  • Die in Patentliteratur 1 beschriebene Korrelationsanalysevorrichtung kann eine Korrelation auf Grundlage der Ähnlichkeit in jeder Zeiteinheit anzeigen. Auf diese Weise wird die Variation der Daten im Laufe der Zeit deutlich. Andere Faktoren als die Zeit, wie z. B. der „Messende“ oder die „individuelle Vorrichtung“, werden jedoch nicht berücksichtigt.
  • Dementsprechend können ein oder mehrere Aspekte der Offenbarung Datenschwankungen überprüfen, die durch Faktoren verursacht werden, die nichts mit dem ursprünglichen Messzweck zu tun haben.
  • MITTEL ZUR LÖSUNG DES PROBLEMS
  • Eine Informationsverarbeitungsvorrichtung gemäß einem ersten Aspekt der Offenbarung umfasst: eine Ähnlichkeitsmatrix-Erzeugungseinheit, die eingerichtet ist, eine Ähnlichkeitsmatrix aus einem Datensatz zu erzeugen, der eine Vielzahl von Proben aufweist, wobei die Ähnlichkeitsmatrix eine Vielzahl von Spalten, die horizontal entsprechend einer Reihenfolge angeordnet sind, in der die Vielzahl von Proben angeordnet sind, und eine Vielzahl von Zeilen, die vertikal entsprechend der Reihenfolge angeordnet sind, aufweist, wobei die Ähnlichkeitsmatrix eine Ähnlichkeit zwischen einer Probe, die einer der Spalten entspricht, und einer Probe, die einer der Zeilen entspricht, in einem Feld speichert, das durch die eine der Spalten und die eine der Zeilen spezifiziert wird; eine Reihenfolgeanpassungseinheit, die eingerichtet ist, eine angepasste Ähnlichkeitsmatrix zu erzeugen, indem sie auf Kennzeichnungsinformationen Bezug nimmt, die ein Ergebnis einer Kennzeichnung jeder der Proben mit einer Vielzahl von Kennzeichnungen angeben, die jeweils eine Vielzahl von Klassen aufweisen, und die Reihenfolge in der Ähnlichkeitsmatrix so anpassen, dass die Proben nach jeder der Klassen einer in der Vielzahl von Kennzeichnungen markierten Zielkennzeichnung angeordnet sind; eine Visualisierungseinheit, die eingerichtet ist, ein Evaluierungsbildschirmbild zu erzeugen, das jedes Feld der angepassten Ähnlichkeitsmatrix mit einer der Ähnlichkeit entsprechenden Helligkeit angibt; und eine Anzeigeeinheit, die eingerichtet ist, das Evaluierungsbildschirmbild anzuzeigen.
  • Eine Informationsverarbeitungsvorrichtung gemäß einem zweiten Aspekt der Offenbarung umfasst: eine Variationsberechnungseinheit, die eingerichtet ist, sich auf Kennzeichnungsinformationen zu beziehen, die ein Ergebnis einer Kennzeichnung jeder einer Vielzahl von Proben, die in einem Datensatz enthalten sind, mit einer Vielzahl von Kennzeichnungen, die jeweils eine Vielzahl von Klassen aufweisen, angeben, einen Variationsgrad der Proben zu berechnen, die durch jede der Kennzeichnungen verursacht werden, und ein Variationsergebnis-Bildschirmbild zu erzeugen, das mindestens eine Kennzeichnung, die in der Vielzahl von Kennzeichnungen enthalten ist, und den Variationsgrad, der der mindestens einen Kennzeichnung entspricht, anzeigt; und eine Anzeigeeinheit, die eingerichtet ist, das Variationsergebnis-Bildschirmbild anzuzeigen.
  • Eine Informationsverarbeitungsvorrichtung gemäß einem dritten Aspekt der Offenbarung umfasst: eine Variationsberechnungseinheit, die eingerichtet ist, sich auf Kennzeichnungsinformationen zu beziehen, die ein Ergebnis einer Kennzeichnung jeder einer Vielzahl von Proben, die in einem Datensatz enthalten sind, mit einer Vielzahl von Kennzeichnungen, die jeweils eine Vielzahl von Klassen aufweisen, angeben, einen Variationsgrad der Proben zu berechnen, der durch jede der Klassen verursacht wird, und ein Variationsergebnis-Bildschirmbild zu erzeugen, das die Klassen und den Variationsgrad, der jeder der Klassen entspricht, anzeigt; und eine Anzeigeeinheit, die eingerichtet ist, das Variationsergebnis-Bildschirmbild anzuzeigen.
  • Ein Programm gemäß einem ersten Aspekt der Offenbarung veranlasst einen Computer zu arbeiten als: eine Ähnlichkeitsmatrix-Erzeugungseinheit, die eingerichtet ist, eine Ähnlichkeitsmatrix aus einem Datensatz zu erzeugen, der eine Vielzahl von Proben aufweist, wobei die Ähnlichkeitsmatrix eine Vielzahl von Spalten, die horizontal entsprechend einer Reihenfolge angeordnet sind, in der die Vielzahl von Proben angeordnet sind, und eine Vielzahl von Zeilen, die vertikal entsprechend der Reihenfolge angeordnet sind, aufweist, wobei die Ähnlichkeitsmatrix eine Ähnlichkeit zwischen einer Probe, die einer der Spalten entspricht, und einer Probe, die einer der Zeilen entspricht, in einem Feld speichert, das durch die eine der Spalten und die eine der Zeilen spezifiziert wird; eine Reihenfolgeanpassungseinheit, die eingerichtet ist, eine angepasste Ähnlichkeitsmatrix zu erzeugen, indem sie auf Kennzeichnungsinformationen Bezug nimmt, die ein Ergebnis einer Kennzeichnung jeder der Proben mit einer Vielzahl von Kennzeichnungen angeben, die jeweils eine Vielzahl von Klassen aufweisen, und die Reihenfolge in der Ähnlichkeitsmatrix so anpassen, dass die Proben nach jeder der Klassen einer in der Vielzahl von Kennzeichnungen markierten Zielkennzeichnung angeordnet sind; eine Visualisierungseinheit, die eingerichtet ist, ein Evaluierungsbildschirmbild zu erzeugen, das jedes Feld der angepassten Ähnlichkeitsmatrix in einer der Ähnlichkeit entsprechenden Helligkeit angibt; und eine Anzeigeeinheit, die eingerichtet ist, das Evaluierungsbildschirmbild anzuzeigen.
  • Ein Programm gemäß einem zweiten Aspekt der Offenbarung veranlasst einen Computer zu arbeiten als: eine Variationsberechnungseinheit, die eingerichtet ist, sich auf Kennzeichnungsinformationen zu beziehen, die ein Ergebnis einer Kennzeichnung jeder einer Vielzahl von Proben, die in einem Datensatz enthalten sind, mit einer Vielzahl von Kennzeichnungen, die jeweils eine Vielzahl von Klassen aufweisen, angeben, Variationsgrade der Proben zu berechnen, die durch jede der Kennzeichnungen veranlasst werden, ein Variationsergebnis-Bildschirmbild zu erzeugen, das mindestens eine Kennzeichnung, die in der Vielzahl von Kennzeichnungen enthalten ist, und den Variationsgrad, der der mindestens einen Kennzeichnung entspricht, anzeigt; und eine Anzeigeeinheit, die eingerichtet ist, das Variationsergebnis-Bildschirmbild anzuzeigen.
  • Ein Programm gemäß einem dritten Aspekt der Offenbarung veranlasst einen Computer zu arbeiten als: eine Variationsberechnungseinheit, die eingerichtet ist, sich auf Kennzeichnungsinformationen zu beziehen, die ein Ergebnis einer Kennzeichnung jeder einer Vielzahl von Proben, die in einem Datensatz enthalten sind, mit einer Vielzahl von Kennzeichnungen, die jeweils eine Vielzahl von Klassen aufweisen, angeben, einen Variationsgrad jeder der Proben zu berechnen, der durch jede der Klassen verursacht wird, und ein Variationsergebnis-Bildschirmbild zu erzeugen, das jede der Klassen und den Variationsgrad, der jeder der Klassen entspricht, anzeigt; und eine Anzeigeeinheit, die eingerichtet ist, das Variationsergebnis-Bildschirmbild anzuzeigen.
  • Informationsverarbeitungsverfahren gemäß einem ersten Aspekt der Offenbarung umfasst: Erzeugen einer Ähnlichkeitsmatrix aus einem Datensatz, der eine Vielzahl von Proben aufweist, wobei die Ähnlichkeitsmatrix eine Vielzahl von Spalten, die horizontal entsprechend einer Reihenfolge angeordnet sind, in der die Vielzahl von Proben angeordnet sind, und eine Vielzahl von Zeilen, die vertikal entsprechend der Reihenfolge angeordnet sind, aufweist, wobei die Ähnlichkeitsmatrix eine Ähnlichkeit zwischen einer Probe, die einer der Spalten entspricht, und einer Probe, die einer der Zeilen entspricht, in einem Feld speichert, das durch die eine der Spalten und die eine der Zeilen spezifiziert ist; Erzeugen einer angepassten Ähnlichkeitsmatrix durch Bezugnahme auf Kennzeichnungsinformationen, die ein Ergebnis einer Kennzeichnung jeder der Proben mit einer Vielzahl von Kennzeichnungen angeben, die jeweils eine Vielzahl von Klassen aufweisen, und die Reihenfolge in der Ähnlichkeitsmatrix so anpassen, dass die Proben nach jeder der Klassen einer in der Vielzahl von Kennzeichnungen markierten Zielkennzeichnung angeordnet sind; Erzeugen eines Evaluierungsbildschirmbilds, das jedes Feld der angepassten Ähnlichkeitsmatrix in einer der Ähnlichkeit entsprechenden Helligkeit angibt; und Anzeigen des Evaluierungsbildschirmbilds.
  • Ein Informationsverarbeitungsverfahren gemäß einem zweiten Aspekt der Offenbarung umfasst: Bezug nehmen auf Kennzeichnungsinformationen, die ein Ergebnis einer Kennzeichnung jeder einer Vielzahl von Proben, die in einem Datensatz enthalten sind, mit einer Vielzahl von Kennzeichnungen, die jeweils eine Vielzahl von Klassen aufweisen, angeben und Berechnen eines Variationsgrads jeder der Proben, der durch jede der Kennzeichnungen verursacht wird; Erzeugen eines Variationsergebnis-Bildschirmbilds, das mindestens eine Kennzeichnung, die in der Vielzahl von Kennzeichnungen enthalten ist und den Variationsgrad, der der mindestens einen Kennzeichnung entspricht, anzeigt; und Anzeigen des Variationsergebnis-Bildschirmbilds.
  • Ein Informationsverarbeitungsverfahren gemäß einem dritten Aspekt der Offenbarung umfasst: Bezug nehmen auf Kennzeichnungsinformationen, die ein Ergebnis einer Kennzeichnung jeder einer Vielzahl von Proben, die in einem Datensatz enthalten sind, mit einer Vielzahl von Kennzeichnungen, die jeweils eine Vielzahl von Klassen aufweisen, angeben und Berechnen eines Variationsgrads jeder der Proben, der durch jede der Klassen verursacht wird; Erzeugen eines Variationsergebnis-Bildschirmbilds, das die Klassen und den Variationsgrad entsprechend jeder der Klassen anzeigt; und Anzeigen des Variationsergebnis-Bildschirmbilds.
  • WIRKUNGEN DER ERFINDUNG
  • Gemäß einem oder mehrerer Aspekte der Offenbarung können Datenschwankungen, die durch Faktoren verursacht werden, die nichts mit dem ursprünglichen Messzweck zu tun haben, überprüft werden.
  • Figurenliste
    • 1 ist ein Blockdiagramm, das schematisch die Konfiguration einer Datenvisualisierungsvorrichtung gemäß einer ersten Ausführungsform darstellt.
    • 2A und 2B sind Graphen, die die Distanz zwischen zwei Probenverteilungen darstellen.
    • 3 ist ein schematisches Diagramm, das ein Beispiel einer Distanzmatrix darstellt.
    • 4 ist ein schematisches Diagramm, das ein erstes Beispiel einer angepassten Distanzmatrix darstellt.
    • 5A und 5B sind schematische Diagramme, die jeweils zweite und dritte Beispiele einer angepassten Distanzmatrix darstellen.
    • 6A und 6B sind schematische Diagramme, die jeweils vierte und fünfte Beispiele einer angepassten Distanzmatrix darstellen.
    • 7 ist ein schematisches Diagramm, das ein sechstes Beispiel einer angepassten Distanzmatrix darstellt.
    • 8 ist ein schematisches Diagramm, das ein erstes Beispiel eines Evaluierungsbildschirmbilds darstellt, das eine angepasste Distanzmatrix visualisiert.
    • 9 ist ein schematisches Diagramm, das ein zweites Beispiel eines Evaluierungsbildschirmbilds darstellt, das eine angepasste Distanzmatrix visualisiert.
    • 10 ist ein schematisches Diagramm, das ein drittes Beispiel eines Evaluierungsbildschirmbilds darstellt, das eine angepasste Distanzmatrix visualisiert.
    • 11 ist ein schematisches Diagramm, das ein viertes Beispiel eines Evaluierungsbildschirmbilds darstellt, das eine angepasste Distanzmatrix visualisiert.
    • 12 ist ein schematisches Diagramm, das ein fünftes Beispiel eines Evaluierungsbildschirmbilds darstellt, das eine angepasste Distanzmatrix visualisiert.
    • 13 ist ein Blockdiagramm, das ein Beispiel für eine Hardware-Konfiguration einer Datenvisualisierungsvorrichtung darstellt.
    • 14 ist ein Flussdiagramm, das eine Verarbeitung durch eine Datenvisualisierungsvorrichtung gemäß der ersten Ausführungsform darstellt.
    • 15 ist ein Blockdiagramm, das schematisch die Konfiguration einer Datenvisualisierungsvorrichtung gemäß einer zweiten Ausführungsform darstellt.
    • 16 ist ein schematisches Diagramm, das ein Beispiel von Submatrizen darstellt.
    • 17 ist ein schematisches Diagramm zur Erläuterung eines Berechnungsverfahrens.
    • 18 ist ein Flussdiagramm, das eine erste Verarbeitung durch die Datenvisualisierungsvorrichtung gemäß der zweiten Ausführungsform darstellt.
    • 19 ist ein Flussdiagramm, das eine zweite Verarbeitung durch die Datenvisualisierungsvorrichtung gemäß der zweiten Ausführungsform darstellt.
    • 20 ist ein Blockdiagramm, das schematisch die Konfiguration einer Datenvisualisierungsvorrichtung gemäß einer dritten Ausführungsform darstellt.
    • 21 ist ein Flussdiagramm, das eine Verarbeitung durch die Datenvisualisierungsvorrichtung gemäß der dritten Ausführungsform darstellt.
  • MODUS ZUR AUSFÜHRUNG DER ERFINDUNG
  • Erste Ausführungsform
  • 1 ist ein Blockdiagramm, das die Konfiguration einer Informationsverarbeitungsvorrichtung oder einer Datenvisualisierungsvorrichtung 100 gemäß der ersten Ausführungsform schematisch darstellt.
  • Die Datenvisualisierungsvorrichtung 100 weist eine Eingabeeinheit 101, eine Speichereinheit 102, eine Datenbeschaffungseinheit 103, eine Distanzmatrix-Berechnungseinheit 104, eine Reihenfolgeanpassungseinheit 105, eine Visualisierungseinheit 106 und eine Anzeigeeinheit 107 auf.
  • Die Eingabeeinheit 101 empfängt eine Eingabe von Anweisungen von einem Benutzer. Die Eingabeeinheit 101 empfängt zum Beispiel eine Eingabe, die eine Kennzeichnung als eine Zielkennzeichnung aus mehreren Kennzeichnungen markiert.
  • Die Speichereinheit 102 speichert Programme und Daten, die für eine Verarbeitung durch die Datenvisualisierungsvorrichtung 100 notwendig sind. Die Speichereinheit 102 speichert zum Beispiel zu visualisierende Datensätze und Kennzeichnungsinformationen der Datensätze.
  • Ein Datensatz ist z. B. ein Satz von Zeitreihendaten, die durch Messung erhalten werden. Ein Datensatz besteht aus einem Satz von mehreren Proben.
  • Die Proben in einem Datensatz bilden eine Einheit zur Berechnung einer Distanzmatrix durch die Distanzmatrix-Berechnungseinheit 104. Bei jeder Probe handelt es sich um Zeitreihendaten, die z. B. von einem Vibrationssensor oder einem Mikrofon erhalten werden.
  • Bei der Probe handelt es sich um eindimensionale Daten, die einen zu jedem Zeitpunkt gemessenen Wert angeben, aber nicht auf solche eindimensionalen Daten beschränkt sind. Bei der Probe kann es sich um mehrdimensionale Daten handeln, die zu jedem Zeitpunkt mehrere Werte angeben.
  • Die Kennzeichnungsinformationen geben ein Attribut an, das mit jeder Probe im Datensatz verbunden ist. Die Kennzeichnungsinformationen sind Informationen, die ein Kennzeichnungsergebnis jeder der Proben unter Verwendung mehrerer Kennzeichnungen angeben. Jede der Kennzeichnungen weist mehrere Klassen auf.
  • Im Folgenden werden als Beispiel Kennzeichnungsinformationen beschrieben, die mit Proben verbunden sind, bei denen es sich um Messdaten handelt, die zum Zweck des Erkennens von Anomalien einer Einrichtung erfasst werden. Der Zweck der Messung der Daten dient dazu, auf der Grundlage der gemessenen Daten zwischen Anomalie und Normalität zu unterscheiden.
  • In diesem Fall ist jede Probe mit Kennzeichnungsinformationen vorgesehen, die eine Kennzeichnung aufweisen, die ein Untersuchungsergebnis angibt. Die Kennzeichnung, die ein Untersuchungsergebnis oder eine Untersuchungsergebniskennzeichnung angibt, kann zwei Klassen aufweisen, eine „normale Klasse“ und eine „anormale Klasse“, oder drei oder mehr Klassen, wie eine „normale Klasse“, eine „erste anormale Klasse“ und eine „zweite anormale Klasse“, um den Arten von Anomalie zu entsprechen. Hier bezeichnen Klassen bestimmte Zustände, die in ein und derselben Kennzeichnung enthalten sind. Zum Beispiel geben verschiedene Klassen verschiedene Zustände in ein und derselben Kennzeichnung an.
  • In einigen Fällen können die gemessenen Daten Kennzeichnungen enthalten, die voraussichtlich nicht mit der Kennzeichnung übereinstimmen, die dem Zweck der gemessenen Daten entspricht (in diesem Fall das Erkennen von normal oder anormal). Beispiele für solche nicht übereinstimmende Kennzeichnungen umfassen „Messende“, „Messstelle“ und „Datum und Uhrzeit der Messung“.
  • Die Datenbeschaffungseinheit 103 beschafft einen Datensatz DS und seine Kennzeichnungsinformationen LI von der Speichereinheit 102. Der beschaffte Datensatz DS und seine Kennzeichnungsinformationen LI werden der Distanzmatrix-Berechnungseinheit 104 zugeführt.
  • Die Distanzmatrix-Berechnungseinheit 104 ist eine Ähnlichkeitsmatrix-Erzeugungseinheit, die eine Distanzmatrix oder Ähnlichkeitsmatrix aus einem Datensatz DS erzeugt. Die Ähnlichkeitsmatrix hat mehrere Spalten, die horizontal in der Reihenfolge angeordnet sind, in der mehrere Proben angeordnet sind, und mehrere Zeilen, die vertikal in der gleichen Reihenfolge angeordnet sind. Die Ähnlichkeitsmatrix speichert eine Ähnlichkeit zwischen einer Probe, die jeder Spalte entspricht, und einer Probe, die jeder Zeile entspricht, in einem Feld, das durch die Spalte und die Zeile spezifiziert ist. Es ist zu beachten, dass jede in der Distanzmatrix enthaltene Ähnlichkeit auch als ein Element der Distanzmatrix bezeichnet wird.
  • Beispielsweise berechnet die Distanzmatrix-Berechnungseinheit 104 eine Distanz zwischen den Proben für jede Kombination von Proben im Datensatz DS und erzeugt auf der Grundlage der berechneten Distanzen zwischen den Proben eine Distanzmatrix, bei der es sich um eine Matrix handelt, bei der die Anzahl von Zeilen und die Anzahl von Spalten jeweils gleich der Anzahl von Proben ist.
  • Die Distanz zwischen den Proben ist ein Maß für die Ähnlichkeit zwischen zwei Proben. Die Distanz zwischen den Proben ist klein, wenn zwei Proben ähnlich sind, und ist gleich Null, wenn die Proben genau gleich sind. Folglich wird die Distanzmatrix auch als Ähnlichkeitsmatrix bezeichnet.
  • Im Folgenden wird ein Beispiel beschrieben, bei dem Schwingungsdaten zum Zweck einer Anomalieerkennung gesammelt werden.
  • Daten, die zu einem bestimmten Zeitpunkt und unter einer bestimmten Bedingung gemessen werden, werden als eine Probe behandelt. Im vorliegenden Beispiel ist eine Probe ein Teil von Zeitreihendaten, die einen eindimensionalen Wert eines Zeitpunkts angeben. Es wird davon ausgegangen, dass jede Probe mit einer Kennzeichnung vorgesehen ist, die eine „Untersuchungsergebniskennzeichnung“, die das Untersuchungsergebnis der Einrichtung angibt, d. h. normal oder anormal, und eine „Messdatenkennzeichnung“ ist, die angibt, wann die Messung vorgenommen wurde.
  • In diesem Fall wird davon ausgegangen, dass am 12. Juni zwei normale und zwei anormale Proben gemessen werden, was durch die Messdatenkennzeichnung angegeben ist, und zwei normale und zwei anormale Proben am 13. Juni gemessen werden, was auf der Messdatenkennzeichnung angegeben ist.
  • Es wird nun ein Verarbeitungsbeispiel für den oben beschriebenen Fall beschrieben, in dem die Distanzmatrix-Berechnungseinheit 104 tatsächlich die Distanzen zwischen den Proben berechnet und eine Distanzmatrix erstellt. In diesem Beispiel wird die Ähnlichkeit zwischen den Wahrscheinlichkeitsverteilungen der zwei Proben als die Ähnlichkeit zwischen den beiden Proben definiert.
  • Im Einzelnen berechnet die Distanzmatrix-Berechnungseinheit 104 die von jeder Probe gebildete Verteilung. Zu diesem Zeitpunkt wird eine Verteilung pro Probe berechnet. Die hier angenommene Verteilung kann eine Normalverteilung oder dergleichen sein.
  • Die Distanzmatrix-Berechnungseinheit 104 berechnet dann die Distanz zwischen Verteilungen der zwei Proben als ein Maß für die Ähnlichkeit zwischen den Proben. Beispiele für Verfahren zur Berechnung der Distanz zwischen Verteilungen sind die Bhattacharyya-Distanz, die Kullback-Leibler (KL)-Divergenz und die Jensen-Shannon (JS)-Divergenz.
  • 2A und 2B sind Graphen, die jeweils die Distanz zwischen Verteilungen zwischen zwei Proben darstellen.
  • 2A stellt einen Fall dar, in dem die Distanz zwischen Verteilungen der zwei Proben groß ist, und 2B stellt einen Fall dar, in dem die Distanz zwischen Verteilungen der zwei Proben klein ist.
  • Die Distanzmatrix-Berechnungseinheit 104 erzeugt dann eine Distanzmatrix auf Grundlage der für alle Probenkombinationen berechneten Distanzen zwischen Verteilungen. Es wird davon ausgegangen, dass in der Distanzmatrix die Spalten entlang der horizontalen Richtung angeordnet sind und die Zeilen entlang der vertikalen Richtung angeordnet sind, in Übereinstimmung mit der Reihenfolge von acht Proben.
  • 3 ist ein schematisches Diagramm, das eine Beispiel-Distanzmatrix darstellt.
  • Wie oben beschrieben, werden über zwei Tage acht Proben gesammelt. Hier erhält jede Probe eine Probennummer oder Probenidentifikationsinformationen zur Spezifizierung jeder Probe. Die Distanz zwischen einer N-ten Probe und einer M-ten Probe wird durch ein Element in der N-ten Zeile und M-ten Spalte der Distanzmatrix dargestellt. Die Zeichen N und M bezeichnen jeweils eine ganze Zahl im Bereich von 1 bis 8.
  • Die Diagonalwerte der in 3 dargestellten Distanzmatrix sind alle Null, da es sich um die Distanzen zwischen gleichen Proben handelt.
  • Wenn ein symmetrisches Verfahren, wie die Bhattacharyya-Distanz, zur Berechnung der Distanzen zwischen Proben verwendet wird, ist die Distanzmatrix eine symmetrische Matrix, da sich die Distanzwerte nicht ändern, selbst wenn die Proben vertauscht werden.
  • Die Reihenfolgeanpassungseinheit 105 erzeugt eine angepasste Ähnlichkeitsmatrix, indem sie auf die Kennzeichnungsinformationen LI Bezug nimmt und die Reihenfolge, in der die Proben angeordnet sind, in der Ähnlichkeitsmatrix so anpasst, dass die Proben nach jeder der Klassen in einer in den Kennzeichnungen markierten Zielkennzeichnung angeordnet werden können.
  • Insbesondere passt die Reihenfolgeanpassungseinheit 105 die Reihenfolge der Proben, die in der von der Distanzmatrix-Berechnungseinheit 104 erzeugten Distanzmatrix enthalten sind, entsprechend der markierten Kennzeichnung an. Wenn, wie oben beschrieben, eine „Untersuchungsergebniskennzeichnung“ und eine „Messdatenkennzeichnung“ als Kennzeichnungsinformationen enthalten sind, passt die Reihenfolgeanpassungseinheit 105 die Reihenfolge der Proben in der Distanzmatrix durch die „Untersuchungsergebniskennzeichnung“ oder die „Messdatenkennzeichnung“ an.
  • Wenn die Distanzmatrix beispielsweise nach der Untersuchungsergebniskennzeichnung sortiert werden soll, die zwei Klassen, eine „normale Klasse“ und eine „anormale Klasse“, umfasst, passt die Reihenfolgeanpassungseinheit 105 die Reihenfolge der Proben so an, dass die Proben nach Klasse angeordnet sind, d. h. die Proben, die zur anormalen Klasse gehören (anormale Proben), werden hinter den Proben angeordnet, die zur normalen Klasse gehören (normale Proben). Wenn beispielsweise, wie in 3 dargestellt, unter den acht Proben die Proben mit ungeraden Probennummern in der normalen Klasse und die Proben mit geraden Probennummern in der anormalen Klasse sind, passt die Reihenfolgeanpassungseinheit 105 die Reihenfolge der Proben in der in 3 dargestellten Distanzmatrix so an, dass sie der in 4 dargestellten angepassten Distanzmatrix entspricht. Es ist zu beachten, dass die angepasste Distanzmatrix auch als angepasste Ähnlichkeitsmatrix bezeichnet werden kann.
  • Wenn die Distanzmatrix alternativ nach der Messdatenkennzeichnung sortiert werden soll, die zwei Klassen, eine „12. Juni-Klasse“ und eine „13. Juni-Klasse“, umfasst, passt die Reihenfolgeanpassungseinheit 105 die Reihenfolge der Proben so an, dass die Proben, die zur 13. Juni-Klasse gehören, hinter den Proben angeordnet sind, die zur 12. Juni-Klasse gehören. Wenn beispielsweise, wie in 3 dargestellt, unter den acht Proben die Proben mit den Probennummern 1 bis 4 zu der 12. Juni-Klasse gehören und die Proben mit den Probennummern 5 bis 8 zu der 13. Juni-Klasse gehören, stellt die Reihenfolgeanpassungseinheit 105 die in 3 dargestellte Distanzmatrix als die angepasste Distanzmatrix bereit.
  • Die Visualisierungseinheit 106 erzeugt ein Evaluierungsbildschirmbild, das die angepasste Distanzmatrix visualisiert, und veranlasst, dass das Evaluierungsbildschirmbild auf der Anzeigeeinheit 107 zur Präsentation für einen Benutzer erscheint.
  • Beispielsweise erzeugt die Visualisierungseinheit 106 das Evaluierungsbildschirmbild, indem sie die Helligkeit der Farbe der Felder, die den Elementen entsprechen, in Übereinstimmung mit den Werten der Elemente in der angepassten Distanzmatrix bestimmt, in der die Reihenfolge durch die Reihenfolgeanpassungseinheit 105 angepasst wurde. Durch Ändern der Helligkeit/Dunkelheit der Felder, die den Elementen in der angepassten Distanzmatrix entsprechen, in Übereinstimmung mit den Werten der Felder, ist es möglich, das Qualitätsproblem des Datensatzes, das durch die für die Reihenfolgeänderung verwendete Kennzeichnung verursacht wird, visuell darzustellen.
  • Insbesondere vergleicht die Visualisierungseinheit 106 die Werte der Felder der angepassten Distanzmatrix mit einem vorbestimmten Schwellenwert, und wenn ein Wert kleiner als der vorbestimmte Schwellenwert ist, wird die Farbe des Feldes dunkler eingestellt als die Farbe der Felder, deren Werte gleich wie oder größer als der vorbestimmte Schwellenwert sind.
  • Bevor die durch das Evaluierungsbildschirmbild erreichte Wirkung beschrieben wird, wird zunächst ein „guter Datensatz“ beschrieben.
  • Hier wird davon ausgegangen, dass es sich bei dem Datensatz um einen Datensatz für eine Anomalieerkennung handelt. Daher ist es wünschenswert, dass die anormalen Proben und die normalen Proben möglichst unterschiedliche Eigenschaften aufweisen. Für die Messdatenkennzeichnung, bei der es sich um eine Kennzeichnung handelt, von der erwartet wird, dass sie nichts mit der Erkennung von Anomalie und Normalität zu tun hat, wird erwartet, dass sich die Merkmale der Proben nicht ändern, auch wenn sich ihre Klassen unterscheiden. Auf Grundlage des vorstehend beschriebenen, wird ein „guter Datensatz“ in diesem Beispiel als ein Datensatz definiert, der die folgenden zwei Bedingungen erfüllt.
  • Die erste Bedingung ist, dass die Distanz zwischen Proben verschiedener Klassen der Untersuchungsergebniskennzeichnung groß ist. Mit anderen Worten ist die Ähnlichkeit zwischen Proben verschiedener Klassen der Untersuchungsergebniskennzeichnung niedrig.
  • Die zweite Bedingung ist, dass die Distanzen zwischen verschiedenen Proben in der Messdatenkennzeichnung gestreutsind. Mit anderen Worten kann die Ähnlichkeit zwischen Proben niedrig oder hoch sein, unabhängig davon, ob die Klasse der Messdatenkennzeichnung gleich oder unterschiedlich ist.
  • Durch Visualisieren der angepassten Distanzmatrix, die durch Anpassen der Distanzmatrix um die Reihenfolge von Klassen in einer markierten Kennzeichnung erhalten wird, kann visuell untersucht werden, ob der Datensatz die beiden oben genannten Bedingungen erfüllt.
  • Beispielsweise kann die Reihenfolge von Proben angepasst werden, indem die Proben in eine normale und eine anormale Klasse der Untersuchungsergebniskennzeichnung eingeteilt werden. Wie in 5A dargestellt, kann bestätigt werden, dass die erste Bedingung erfüllt ist, wenn die Distanzen zwischen den Proben in der normalen Klasse und die Distanzen zwischen den Proben in der anomalen Klasse beide kleiner als ein vorbestimmter Schwellenwert sind und somit die Farbe der entsprechenden Felder dunkel ist, und wenn die Distanzen zwischen den Proben in der normalen Klasse und den Proben in der anomalen Klasse gleich wie oder größer als der vorbestimmte Schwellenwert sind und somit die Farbe der entsprechenden Felder hell ist.
  • Im Gegensatz dazu kann die Reihenfolge der Proben angepasst werden, indem die Proben in eine 12. Juni-Klasse und eine 13. Juni-Klasse der Untersuchungsergebniskennzeichnung eingeteilt werden. Wenn die hellen Felder und die dunklen Felder für beide Proben in gleichen Klassen und in unterschiedlichen Klassen gestreut sind, wie in 5B dargestellt, kann bestätigt werden, dass die zweite Bedingung erfüllt ist.
  • Andererseits kann beispielsweise die Reihenfolge von Proben angepasst werden, indem die Proben in eine normale und eine anormale Klasse der Untersuchungsergebniskennzeichnung eingeteilt werden. Wenn die hellen Felder und die dunklen Felder für beide Proben in gleichen Klassen und in unterschiedlichen Klassen gestreut sind, wie in 6A dargestellt, kann bestätigt werden, dass die erste Bedingung nicht erfüllt ist.
  • Die Reihenfolge von Proben kann angepasst werden, indem die Proben in eine 12. Juni-Klasse und eine 13. Juni-Klasse der Untersuchungsergebniskennzeichnung eingeteilt werden. Wie in 6B dargestellt, kann bestätigt werden, dass die zweite Bedingung erfüllt ist, wenn die Distanzen zwischen den Proben in der 12. Juni-Klasse und die Distanzen zwischen den Proben in der 13. Juni-Klasse kleiner als ein vorbestimmter Schwellenwert sind und somit die Farbe der entsprechenden Felder dunkel ist, und wenn die Distanzen zwischen den Proben in der 12. Juni-Klasse und den Proben in der 13. Juni-Klasse gleich wie oder größer als der vorbestimmte Schwellenwert sind und somit die Farbe der entsprechenden Felder hell ist.
  • In einem solchen Fall kann die Ursache für die Verschlechterung des Untersuchungsergebnisses in der Variation der Daten im Messzeitpunkt spezifiziert werden.
  • Obwohl oben ein Beispiel beschrieben wurde, in dem die Reihenfolge von Proben durch die jeweiligen Klassen in einer Kennzeichnung angepasst wird, ist die Anpassung nicht auf ein solches Beispiel beschränkt.
  • Wie in 6A dargestellt, kann beispielsweise, nachdem die Reihenfolge der Proben durch Einteilung der Proben in eine normale Klasse und eine anormale Klasse der Untersuchungsergebniskennzeichnung angepasst wurde, die Reihenfolge der Proben in der normalen Klasse und die Reihenfolge der Proben in der anormalen Klasse durch weitere Einteilung jeder Klasse in eine 12. Juni-Klasse und eine 13. Juni-Klasse der Messdatenkennzeichnung angepasst werden.
  • In einem solchen Fall werden die Proben in der normalen Klasse und die Proben in der anormalen Klasse jeweils weiter in eine 12. Juni-Klasse und eine 13. Juni-Klasse eingeteilt, wie z. B. in 7 dargestellt.
  • Wenn zu diesem Zeitpunkt die hellen und dunklen Matrixelemente in der normalen und der anormalen Klasse durch Messdaten (durch Messdatenkennzeichnungen) nahe beieinander angeordnet sind, wie in 7 dargestellt, kann die Ursache für die Verschlechterung des Untersuchungsergebnisses spezifiziert werden, in der Variation der Daten des Messdatums zu liegen.
  • Im Folgenden wird ein Interpretationsverfahren für ein visualisiertes Evaluierungsbildschirmbild erläutert.
  • In 8 bis 12 sind vier Beispiele für angepasste Distanzmatrizen, die als Evaluierungsbildschirmbilder visualisiert sind, dargestellt, bei denen die Reihenfolge von neun Proben in einem Datensatz um drei Klassen einer Kennzeichnung angepasst wurde.
  • In den 8 bis 12 sind die drei Klassen jeweils mit 1 bis 3 nummeriert, und es wird davon ausgegangen, dass die angepasste Distanzmatrix durch Anordnen der Proben in der Distanzmatrix in aufsteigender Reihenfolge erzeugt wird.
  • Wenn, wie in 8 dargestellt, nur die diagonalen Abschnitte in der angepassten Distanzmatrix 120 eine geringe Helligkeit aufweisen und die anderen Abschnitte eine hohe Helligkeit haben, kann bestimmt werden, dass die durch die entsprechende Kennzeichnung verursachte Variation in den Daten aufgetreten ist, weil die Proben in derselben Klasse einander ähnlich sind, aber nicht ähnlich zu den Proben in anderen Klassen. Wenn es zum Beispiel zwei Klassen gibt, sieht das Ergebnis wie in 6B aus.
  • Wenn sich die Helligkeit zwischen den verschiedenen Klassen nicht ändert und alle Felder dunkel gefärbt sind, wie in der angepassten Distanzmatrix 121 in 9 dargestellt, kann bestimmt werden, dass alle Datenstücke ähnlich sind und somit keine durch die Kennzeichnung verursachte Datenschwankung aufgetreten ist.
  • Wenn, wie in der angepassten Distanzmatrix 122 in 10 dargestellt, alle Felder außer den diagonalen Feldern, die denselben Proben entsprechen, hell gefärbt sind, kann bestimmt werden, dass alle Datenstücke unabhängig von der Klasse variieren. In einem solchen Fall gibt es keine durch die Kennzeichnung verursachte Datenschwankung, aber es besteht eine hohe Wahrscheinlichkeit, dass es ein Problem mit der Datenqualität gibt, weil der Datensatz komplett verstreut ist.
  • Wenn die Helligkeit der diagonalen Abschnitte (siehe 8) und die Helligkeit der Felder, die die Werte zwischen den Proben in Klasse 1 und den Proben in Klasse 3 angeben, gering ist, kann wie in der in 11 dargestellten angepassten Distanzmatrix 123 bestimmt werden, dass nur die Daten der Klasse 2 andere Eigenschaften als die Daten der anderen Klassen aufweisen. Wenn die Klassen beispielsweise Datenmessende darstellen, ist es möglich, visuell zu bestätigen, dass die Daten des Messenden, der Klasse 2 (Messender 2) entspricht, sich von den Daten anderer Messender (Messende 1 und 3) unterscheiden. Dadurch ist es möglich, den Faktor der Verschlechterung der Datenqualität zu untersuchen, wie z. B. die Möglichkeit eines Fehlers im Messverfahren, das durch den Messenden 2 angewendet wird.
  • Wie in der in 12 dargestellten angepassten Distanzmatrix 124 kann, wenn die Proben, die zu den Klassen 1 und 3 gehören, ähnlich sind, die Proben, die zu Klasse 2 gehören, den Proben, die zu den Klassen 1 und 3 gehören, nicht ähnlich sind, und verschiedene Proben, die zu Klasse 2 gehören, einander nicht ähnlich sind, bestimmt werden, dass nur die Daten von Klasse 2 sich von den Daten der Klassen 1 und 3 unterscheiden und die Daten von Klasse 2 variabel sind.
  • Zur Visualisierung können auf der linken und oberen Seite der angepassten Distanzmatrix Informationen, welche die Klassen angeben, angezeigt werden, wie in den 5 bis 7 dargestellt, so dass die Reihenfolge der für die Sortierung verwendeten Klassen von Kennzeichnung deutlich wird.
  • 13 ist ein Blockdiagramm, das ein Beispiel für eine Hardware-Konfiguration der Datenvisualisierungsvorrichtung 100 darstellt.
  • Die Datenvisualisierungsvorrichtung 100 kann durch einen Computer 130, der eine Eingabeeinrichtung 131, eine Anzeigeeinrichtung 132, eine Speichereinrichtung 133, einen Arbeitsspeicher 134 und einen Prozessor 135 aufweist, implementiert werden.
  • Die Eingabeeinrichtung 131 ist eine Einrichtung, in die ein Benutzer eine Anweisung eingibt, wie z. B. eine Maus, ein Berührungsbildschirm, eine Tastatur, eine Gestenbedienung-Eingabeeinrichtung eines Head-Mounted Display (HMD) oder eine Eye-Tracking-Eingabeeinrichtung.
  • Die Anzeigeeinrichtung 132 ist eine Einrichtung zum Anzeigen einer Anwendung, wie z. B. eine Anzeige zur Darstellung eines visualisierten Bildes für einen Benutzer. Die Anzeigeeinrichtung 132 umfasst zum Beispiel auch ein durchsichtiges HMD.
  • Die Speichereinrichtung 133 ist eine Speichereinrichtung und umfasst eine Festplatte (HDD) oder ein Solid-State-Laufwerk (SSD).
  • Der Arbeitsspeicher 134 ist eine temporäre Speichereinrichtung und umfasst ein Random-Access-Memory (RAM).
  • Der Prozessor 135 ist eine Verarbeitungsschaltung wie zum Beispiel eine zentrale Verarbeitungseinheit (CPU).
  • Zum Beispiel kann die Eingabeeinheit 101 durch den Prozessor 135 unter Verwendung der Eingabeeinrichtung 131 implementiert werden.
  • Die Anzeigeeinheit 107 kann unter Verwendung der Anzeigeeinrichtung 132 durch den Prozessor 135 implementiert werden.
  • Die Speichereinheit 102 kann unter Verwendung des Arbeitsspeichers 134 durch den Prozessor 135 implementiert werden.
  • Die Datenbeschaffungseinheit 103, die Distanzmatrix-Berechnungseinheit 104, die Reihenfolgeanpassungseinheit 105 und die Visualisierungseinheit 106 können durch den Prozessor 135 implementiert werden, der in der Speichereinrichtung 133 gespeicherte Programme in den Arbeitsspeicher 134 einliest und die Programme ausführt.
  • Solche Programme können über ein Netzwerk bereitgestellt sein oder können auf einem Aufzeichnungsmedium aufgezeichnet und bereitgestellt sein. Das heißt, solche Programme können zum Beispiel als Programmprodukte bereitgestellt sein.
  • 14 ist ein Flussdiagramm, das eine Verarbeitung durch die Datenvisualisierungsvorrichtung 100 gemäß der ersten Ausführungsform darstellt.
  • Die Datenbeschaffungseinheit 103 beschafft einen Datensatz DS und seine Kennzeichnungsinformationen LI von der Speichereinheit 102 (Schritt S10). Der beschaffte Datensatz DS und seine Kennzeichnungsinformationen LI werden der Distanzmatrix-Berechnungseinheit 104 zugeführt.
  • Die Distanzmatrix-Berechnungseinheit 104 erzeugt eine Distanzmatrix, die aus den Ähnlichkeiten zwischen den jeweiligen Proben des Datensatzes DS besteht (Schritt S11). Beispielsweise berechnet die Distanzmatrix-Berechnungseinheit 104 die Distanz zwischen den Proben für jede Kombination von Proben im Datensatz DS und erzeugt auf der Grundlage der berechneten Distanzen zwischen den Proben eine Distanzmatrix, bei der es sich um eine Matrix handelt, bei der die Anzahl von Zeilen und die Anzahl von Spalten jeweils gleich der Anzahl von Proben ist.
  • Die Eingabeeinheit 101 nimmt dann eine Kennzeichnungsmarkierung von einem Benutzer an, um die Reihenfolge der Proben in der Distanzmatrix anzupassen (Schritt S12). Die Benutzerinformationen Ul, die die markierte Kennzeichnung angeben, werden an die Reihenfolgeanpassungseinheit 105 weitergeleitet. Hier wird die markierte Kennzeichnung auch als eine Zielkennzeichnung bezeichnet.
  • Die Reihenfolgeanpassungseinheit 105 passt die von der Distanzmatrix-Berechnungseinheit 104 erzeugte Distanzmatrix so an, dass Proben nach einer Klasse der markierten Kennzeichnung angeordnet werden, um eine angepasste Distanzmatrix zu erzeugen (Schritt S13).
  • Die Visualisierungseinheit 106 erzeugt ein Evaluierungsbildschirmbild, das die angepasste Distanzmatrix visualisiert, und veranlasst, dass das Evaluierungsbildschirmbild auf der Anzeigeeinheit 107 erscheint (Schritt S14). Beispielsweise erzeugt die Visualisierungseinheit 106 in Übereinstimmung mit den Werten der Elemente in der angepassten Distanzmatrix, in der die Reihenfolge durch die Reihenfolgeanpassungseinheit 105 angepasst wurde, ein Evaluierungsbildschirmbild, indem sie die Helligkeit der Farbe der Felder, die diese Werte enthalten, bestimmt.
  • Die Reihenfolgeanpassungseinheit 105 bestimmt dann, ob die Visualisierungsverarbeitung fortgesetzt werden soll oder nicht (Schritt S15). Wenn beispielsweise Benutzerinformationen Ul, die eine Kennzeichnung angeben, von der Eingabeeinheit 101 gesendet werden, bestimmt die Reihenfolgeanpassungseinheit 105, dass die Visualisierungsverarbeitung fortgesetzt wird. Wenn Benutzerinformationen Ul, die eine Anweisung zum Beenden der Verarbeitung angeben, von der Eingabeeinheit 101 gesendet werden, bestimmt die Reihenfolgeanpassungseinheit 105, dass die Visualisierungsverarbeitung nicht fortgesetzt wird. Wenn die Visualisierungsverarbeitung fortgesetzt wird (Ja in Schritt S14), kehrt die Verarbeitung zu Schritt S12 zurück, und wenn die Visualisierungsverarbeitung nicht fortgesetzt wird (Nein in Schritt S14), endet die Verarbeitung.
  • Wie oben beschrieben, ist es gemäß der ersten Ausführungsform möglich, durch Anpassung der Reihenfolge der Proben in einer Distanzmatrix mit einer beliebigen Kennzeichnung und durch Visualisierung der angepassten Distanzmatrix die durch eine markierte Kennzeichnung verursachte Variation in einem Datensatz intuitiv auszudrücken. Dies kann ein Problem in der Qualität des Datensatzes aufzeigen, das durch die bei der Anpassung verwendeten Kennzeichnungen verursacht wird.
  • Zweite Ausführungsform
  • In der ersten Ausführungsform wird das Ergebnis der Anpassung der Reihenfolge von Proben in einer Distanzmatrix durch eine markierte Kennzeichnung visualisiert, und ein Benutzer interpretiert die Variation in den Daten.
  • In der zweiten Ausführungsform wird der Grad der Datenvariation im Voraus berechnet, um die Markierung einer Kennzeichnung zur Anpassung der Reihenfolge zu unterstützen. Alternativ wird der berechnete Variationsgrad zur automatischen Markierung der Kennzeichnung für die Anpassung der Reihenfolge verwendet.
  • 15 ist ein Blockdiagramm, das schematisch die Konfiguration einer Datenvisualisierungsvorrichtung 200 gemäß der zweiten Ausführungsform darstellt.
  • Die Datenvisualisierungsvorrichtung 200 weist eine Eingabeeinheit 101, eine Speichereinheit 102, eine Datenbeschaffungseinheit 103, Distanzmatrix-Berechnungseinheit 104, eine Reihenfolgeanpassungseinheit 105, eine Visualisierungseinheit 106, eine Anzeigeeinheit 107, eine Variationsberechnungseinheit 208 und eine Reihenfolgeanpassungsunterstützungseinheit 209 auf.
  • Die Eingabeeinheit 101, die Speichereinheit 102, die Datenbeschaffungseinheit 103, die Distanzmatrix-Berechnungseinheit 104, die Reihenfolgeanpassungseinheit 105, die Visualisierungseinheit 106 und die Anzeigeeinheit 107 der Datenvisualisierungsvorrichtung 200 gemäß der zweiten Ausführungsform sind jeweils die gleichen wie die Eingabeeinheit 101, die Speichereinheit 102, die Datenbeschaffungseinheit 103, die Distanzmatrix-Berechnungseinheit 104, die Reihenfolgeanpassungseinheit 105, die Visualisierungseinheit 106 und die Anzeigeeinheit 107 der Datenvisualisierungsvorrichtung 100 gemäß der ersten Ausführungsform.
  • Die Datenbeschaffungseinheit 103 leitet jedoch den beschafften Datensatz DS und seine Kennzeichnungsinformationen LI auch an die Variationsberechnungseinheit 208 weiter, und die Distanzmatrix-Berechnungseinheit 104 leitet die erzeugte Distanzmatrix auch an die Variationsberechnungseinheit 208 weiter.
  • Die Variationsberechnungseinheit 208 berechnet den Variationsgrad mehrerer Proben und Daten, der durch jede Kennzeichnung verursacht wird.
  • In der ersten Ausführungsform wird das Qualitätsproblem durch den Benutzer aufgedeckt, der die visualisierte angepasste Distanzmatrix interpretiert. Wenn z. B. die Helligkeit der diagonalen Abschnitte, in denen sich dieselben Klassen überschneiden, gering ist und die Helligkeit der anderen Abschnitte hoch ist, wie in der angepassten Abstandsmatrix 120 in 8 dargestellt, kann bestimmt werden, dass durch eine Kennzeichnung eine Variation verursacht wird.
  • Die Rolle der Variationsberechnungseinheit 208 besteht darin, die Besonderheiten als numerische Werte zu quantifizieren, anstatt dass der Benutzer die Besonderheiten einer solchen Distanzmatrix interpretiert. Die Variationsberechnungseinheit 208 kann den „Grad der durch eine spezifische Kennzeichnung verursachten Datenvariation“ quantifizieren. Eine spezifische Verarbeitung durch die Variationsberechnungseinheit 208 wird nun erläutert.
  • Es wird nun ein Beispiel erläutert, in dem eine durch eine bestimmte Kennzeichnung verursachte Datenvariation für einen Datensatz mit N Proben (wobei N eine ganze Zahl von 2 oder größer ist) berechnet wird.
  • Die Anzahl von Klassen, die in der zu berechnenden Kennzeichnung enthalten sind, ist C (wobei C eine ganze Zahl von 2 oder größer ist), und jede Klasse wird als Klasse 1, Klasse 2..., Klasse C dargestellt.
  • Eine angepasste Distanzmatrix M wird durch Anpassen der Proben in einer aus dem Datensatz berechneten Distanzmatrix erhalten, so dass sie in der Reihenfolge 1, 2... und C auftreten. In diesem Beispiel wird davon ausgegangen, dass die Distanzmatrix aus der Bhattacharyya-Distanz zwischen den Proben besteht.
  • Die Anzahl von Elementen in M ist N×N. Da die Proben der Distanzmatrix durch eine Kennzeichnung mit C Klassen angepasst werden, gibt es C×C Regionen oder Submatrizen in der angepassten Distanzmatrix M. Diese Submatrizen werden mit D11, D12..., DCC bezeichnet, wie in 16 dargestellt.
  • Eine Submatrix Dij besteht aus Proben, die zur Klasse i gehören (wobei i eine ganze Zahl ist, die 1≤i≤C erfüllt), und Proben, die zur Klasse j gehören (wobei j eine ganze Zahl ist, die 1≤j≤C erfüllt).
  • Die Submatrix Dij ist eine Ni×Nj-Matrix, wobei Ni die Anzahl von Proben ist, die zur Klasse i gehören, und Nj die Anzahl von Proben ist, die zur Klasse j gehören. Jedes Element von Dij wird mit dkl (ij) bezeichnet.
  • Hier wird der Durchschnittswert µij der Elemente der Submatrix berechnet, um ein repräsentativer Wert für jeden Abschnitt zu sein, der jeder Submatrix Dij entspricht.
  • Die Symmetrie der angepassten Distanzmatrix M ermöglicht eine Berechnung von µij unter Verwendung des schraffierten Abschnitts in 17. Wenn i=j ist, ist Dij eine symmetrische Matrix und somit wird der Durchschnittswert nur unter Verwendung der Elemente rechts oben der diagonalen Linie berechnet wird. Da µijji ist, muss für den Abschnitt, in dem i>j ist, keine Berechnung durchgeführt werden.
  • Die folgenden Gleichungen (1) sind Gleichungen zur Berechnung von µij. if  i = j ,   μ i j = μ i i = 2 N i ( N i 1 ) k = 1 N i 1 i = k + 1 N i d k l ( i ƒ )
    Figure DE112020006501T5_0001
    if  i j ,   μ i j = 2 N i ( N i 1 ) k = 1 N i i = 1 N j d k l ( i ƒ )
    Figure DE112020006501T5_0002
  • Der Durchschnittswert µij wird als repräsentativer Wert der Submatrix Dij verwendet, aber die zweite Ausführungsform ist nicht auf ein solches Beispiel beschränkt. So kann beispielsweise der Medianwert der in der Submatrix Dij enthaltenen Elemente als repräsentativer Wert der Submatrix Dij verwendet werden.
  • Als qualitative Bedeutung des Durchschnittswerts µij, wenn i ≠ j, kann µij als Ausdruck, der die Ähnlichkeit zwischen Daten der Klasse i und Daten der Klasse j darstellt, betrachtet werden. Ist µ12 beispielsweise ein kleiner Wert, wird davon ausgegangen, dass die Daten von Klasse 1 den Daten von Klasse 2 ähnlich sind und dass die durch den Unterschied in den Klassen verursachte Datenvariation nicht aufgetreten ist. Wenn i=j ist, stellt der Durchschnittswert µij den Grad der Variation zwischen Datenelementen dar, die derselben Klasse angehören.
  • In einem Zustand, in dem eine durch eine Kennzeichnung verursachte Datenvariation auftritt, wie in 6B oder 8 dargestellt, sind die Werte der Elemente der angepassten Distanzmatrix, die in Dii enthalten sind und sich auf der diagonalen Linie der Distanzmatrix befinden, klein, und die Werte der anderen Elemente sind groß. Der Grad einer Datenvariation V, der durch eine bestimmte Kennzeichnung verursacht wird, kann also beispielsweise wie Gleichung (2) unten formuliert werden. V = 2 C ( C 1 ) i = 1 c 1 j = i + 1 c μ i j 1 C i = 1 c μ i i
    Figure DE112020006501T5_0003
  • Der linke Term von Gleichung (2) berechnet alle Kombinationen von µij, wenn i≠j und den Durchschnitt davon. Dies gibt an, wie sehr die Daten zwischen verschiedenen Klassen variieren.
  • Der rechte Term von Gleichung (2) berechnet alle Kombinationen von µij, wenn i=j und den Durchschnitt davon. Dies gibt an, wie sehr sich die Daten in gleichen Klassen streuen.
  • Wie in 6B oder 8 dargestellt, erhöht sich der Wert V, wenn eine durch eine Kennzeichnung verursachte Datenvariation auftritt. Es ist wünschenswert, dass V einen großen Wert für die zu identifizierende Kennzeichnung im Datensatz hat (hier die Untersuchungsergebniskennzeichnung) und einen kleinen Wert für eine Kennzeichnung, die voraussichtlich nicht mit der zu identifizierenden Kennzeichnung zusammenhängt (hier die Messdatenkennzeichnung).
  • Wie oben beschrieben, berechnet die Variationsberechnungseinheit 208 bei mehreren Klassen für jede im Voraus vergebene Kennzeichnung den Variationsgrad V, der durch Subtraktion des repräsentativen Werts der Ähnlichkeiten zwischen in dieselbe Klasse klassifizierten Proben vom repräsentativen Wert der Ähnlichkeiten zwischen in verschiedene Klassen klassifizierten Proben berechnet wird. Wenn der Datensatz beispielsweise mit fünf Kennzeichnungen gegeben ist, werden durch diese Verarbeitung fünf Vs, die den jeweiligen Kennzeichnungen entsprechen, erhalten.
  • Die Reihenfolgeanpassungsunterstützungseinheit 209 veranlasst die Anzeigeeinheit 107, ein Variationsergebnis-Bildschirmbild als ein von der Variationsberechnungseinheit 208 erhaltenes Ergebnis anzuzeigen, und präsentiert das Ergebnis einem Benutzer, um den Benutzer bei der Markierung der für die Anpassung zu verwendenden Kennzeichnung zu unterstützen. Das Variationsergebnis-Bildschirmbild ist z.B. ein Bild zur Anzeige von Kennzeichnungen in absteigender Reihenfolge des Variationsgrades V. Der Benutzer kann eine Zielkennzeichnung durch Bezugnahme auf einen solchen Bildschirm markieren.
  • Die Reihenfolgeanpassungsunterstützungseinheit 209 kann eine angepasste Distanzmatrix erzeugen, indem sie die Reihenfolgeanpassungseinheit 105 über das von der Variationsberechnungseinheit 208 erhaltene Ergebnis informiert und automatisch die Reihenfolge der in der Distanzmatrix enthaltenen Proben anpasst, anstatt das Bild des Variationsergebnisses anzuzeigen. Beispielsweise kann die Reihenfolgeanpassungsunterstützungseinheit 209 die Kennzeichnung mit dem höchsten Variationsgrad als die Zielkennzeichnung markieren und die Reihenfolgeanpassungseinheit 105 veranlassen, eine angepasste Distanzmatrix in Übereinstimmung mit der Zielkennzeichnung zu erzeugen. Alternativ dazu kann die Reihenfolgeanpassungsunterstützungseinheit 209 mehrere Kennzeichnungen in absteigender Reihenfolge des Variationsgrades als Zielkennzeichnungen markieren. Alternativ kann die Reihenfolgeanpassungsunterstützungseinheit 209 die Kennzeichnung mit dem höchsten Variationsgrad und die Kennzeichnung mit dem niedrigsten Variationsgrad als die Zielkennzeichnungen markieren.
  • Die Datenvisualisierungsvorrichtung 200 gemäß der zweiten Ausführungsform kann auch, wie in 13 dargestellt, durch den Computer 130 implementiert sein.
  • Beispielsweise können die Variationsberechnungseinheit 208 und die Reihenfolgeanpassungsunterstützungseinheit 209 durch den Prozessor 135 implementiert sein, der in der Speichereinrichtung 133 gespeicherte Programme in den Arbeitsspeicher 134 lädt und die Programme ausführt.
  • 18 ist ein Flussdiagramm, das eine erste Verarbeitung durch die Datenvisualisierungsvorrichtung 200 gemäß der zweiten Ausführungsform darstellt.
  • Die erste Verarbeitung ist eine Verarbeitung, in der die Reihenfolgeanpassungsunterstützungseinheit 209 die Anzeigeeinheit 107 veranlasst, ein Variationsergebnis-Bildschirmbild als das von der Variationsberechnungseinheit 208 erhaltene Ergebnis anzuzeigen.
  • Die Datenbeschaffungseinheit 103 beschafft einen Datensatz DS und seine Kennzeichnungsinformationen LI von der Speichereinheit 102 (Schritt S20). Der beschaffte Datensatz DS und seine Kennzeichnungsinformationen LI werden der Distanzmatrix-Berechnungseinheit 104 und der Distanzmatrix-Berechnungseinheit 208 zugeführt.
  • Die Distanzmatrix-Berechnungseinheit 104 berechnet eine Distanzmatrix, die aus den Ähnlichkeiten zwischen den jeweiligen Proben des Datensatzes DS besteht (Schritt S21). Die erzeugte Abstandsmatrix wird an die Reihenfolgeanpassungseinheit 105 und die Variationsberechnungseinheit 208 weitergeleitet.
  • Die Variationsberechnungseinheit 208 wiederholt dann die Verarbeitung der Schritte S23 und S24 so oft, wie es der Anzahl von Kennzeichnungen entspricht, die durch die Kennzeichnungsinformationen LI angegeben werden (Schritte S22 und S25).
  • In Schritt S23 spezifiziert die Variationsberechnungseinheit 208 eine Kennzeichnung, für die der Variationsgrad V noch nicht aus den durch die Kennzeichnungsinformationen LI angegebenen Kennzeichnungen berechnet wurde, und passt die Reihenfolge der in der Distanzmatrix enthaltenen Proben entsprechend der spezifizierten Kennzeichnung an.
  • In Schritt S24 berechnet die Variationsberechnungseinheit 208 den Grad der Datenvariation V, der durch die spezifizierte Kennzeichnung verursacht wird, auf der Grundlage der angepassten Distanzmatrix.
  • Die Reihenfolgeanpassungsunterstützungseinheit 209 veranlasst dann die Anzeigeeinheit 107, ein Variationsergebnis-Bildschirmbild anzuzeigen, das den Variationsgrad V angibt, der von der Variationsberechnungseinheit 208 berechnet wird (Schritt S26).
  • Die Eingabeeinheit 101 nimmt dann eine Kennzeichnungsmarkierung von einem Benutzer an, um die Reihenfolge der in der Distanzmatrix enthaltenen Proben anzupassen (Schritt S27). Die Benutzerinformationen Ul, die die markierte Kennzeichnung angeben, werden an die Reihenfolgeanpassungseinheit 105 weitergeleitet. Der Benutzer kann sich auf das auf der Anzeigeeinheit 107 angezeigte Variationsergebnis-Bildschirmbild beziehen und eine Kennzeichnung markieren.
  • Die Reihenfolgeanpassungseinheit 105 passt die von der Distanzmatrix-Berechnungseinheit 104 erzeugte Distanzmatrix so an, dass die Proben nach den jeweiligen Klassen in der markierten Kennzeichnung angeordnet sind, um eine angepasste Distanzmatrix zu erzeugen (Schritt S28).
  • Die Visualisierungseinheit 106 erzeugt ein Evaluierungsbildschirmbild, das die angepasste Distanzmatrix visualisiert, und veranlasst, dass das Evaluierungsbildschirmbild auf der Anzeigeeinheit 107 erscheint (Schritt S29).
  • Die Reihenfolgeanpassungseinheit 105 bestimmt dann, ob die Visualisierungsverarbeitung fortgesetzt werden soll oder nicht (Schritt S30). Wenn beispielsweise Benutzerinformationen Ul, die eine Kennzeichnung angeben, von der Eingabeeinheit 101 gesendet werden, bestimmt die Reihenfolgeanpassungseinheit 105, dass die Visualisierungsverarbeitung fortgesetzt wird. Wenn Benutzerinformationen Ul, die eine Anweisung zum Beenden der Verarbeitung angeben, von der Eingabeeinheit 101 gesendet werden, bestimmt die Reihenfolgeanpassungseinheit 105, dass die Visualisierungsverarbeitung nicht fortgesetzt wird. Wenn die Visualisierungsverarbeitung fortgesetzt wird (Ja in Schritt S30), kehrt die Verarbeitung zu Schritt S27 zurück, und wenn die Visualisierungsverarbeitung nicht fortgesetzt wird (Nein in Schritt S30), endet die Verarbeitung.
  • 19 ist ein Flussdiagramm, das eine zweite Verarbeitung durch die Datenvisualisierungsvorrichtung 200 gemäß der zweiten Ausführungsform darstellt.
  • Die zweite Verarbeitung ist eine Verarbeitung, in der die Reihenfolgeanpassungsunterstützungseinheit 209 eine Kennzeichnung auf der Grundlage des von der Variationsberechnungseinheit 208 erhaltenen Variationsergebnisses markiert.
  • Die Datenbeschaffungseinheit 103 beschafft einen Datensatz DS und seine Kennzeichnungsinformationen LI von der Speichereinheit 102 (Schritt S40). Der beschaffte Datensatz DS und seine Kennzeichnungsinformationen LI werden der Distanzmatrix-Berechnungseinheit 104 und der Distanzmatrix-Berechnungseinheit 208 zugeführt.
  • Die Distanzmatrix-Berechnungseinheit 104 berechnet eine Distanzmatrix, die aus den Ähnlichkeiten zwischen den jeweiligen Proben des Datensatzes DS besteht (Schritt S41). Die erzeugte Abstandsmatrix wird an die Reihenfolgeanpassungseinheit 105 und die Variationsberechnungseinheit 208 weitergeleitet.
  • Die Variationsberechnungseinheit 208 wiederholt dann die Verarbeitung der Schritte S43 und S44 so oft, wie es der Anzahl von Kennzeichnungen entspricht, die durch die Kennzeichnungsinformationen LI angegeben werden (Schritte S42 und S45).
  • In Schritt S43 spezifiziert die Variationsberechnungseinheit 208 eine Kennzeichnung, für die der Variationsgrad V noch nicht aus den durch die Kennzeichnungsinformationen LI angegebenen Kennzeichnungen berechnet wurde, und passt die Reihenfolge der in der Distanzmatrix enthaltenen Proben entsprechend der spezifizierten Kennzeichnung an.
  • In Schritt S44 berechnet die Variationsberechnungseinheit 208 den Grad der Datenvariation V, der durch die spezifizierte Kennzeichnung verursacht wird, auf der Grundlage der angepassten Distanzmatrix.
  • Die Reihenfolgeanpassungsunterstützungseinheit 209 markiert dann eine Kennzeichnung in Übereinstimmung mit dem Variationsgrad V, der von der Variationsberechnungseinheit 208 berechnet wird (Schritt S46). Zum Beispiel kann die Reihenfolgeanpassungsunterstützungseinheit 209 die Kennzeichnung mit dem größten Variationsgrad V markieren.
  • Die Reihenfolgeanpassungseinheit 105 passt dann die von der Distanzmatrix-Berechnungseinheit 104 erzeugte Distanzmatrix so an, dass die Proben nach den jeweiligen Klassen in der markierten Kennzeichnung angeordnet sind, um eine angepasste Distanzmatrix zu erzeugen (Schritt S47).
  • Die Visualisierungseinheit 106 erzeugt ein Evaluierungsbildschirmbild, das die angepasste Distanzmatrix visualisiert, und veranlasst, dass das Evaluierungsbildschirmbild auf der Anzeigeeinheit 107 erscheint (Schritt S48).
  • Wie oben beschrieben, ist es gemäß der zweiten Ausführungsform möglich, die Anpassung von in der Distanzmatrix enthaltenen Proben zu unterstützen oder zu automatisieren, indem vorab die durch jede Kennzeichnung verursachte Datenvariation durch die Variationsberechnungseinheit 208 erhalten wird.
  • In Schritt S46 des in 19 dargestellten Flussdiagramms kann die Reihenfolgeanpassungsunterstützungseinheit 209 mehrere Kennzeichnungen bestimmen, so dass durch die Schritte S47 und S48 mehrere Evaluierungsbildschirmbilder auf der Anzeigeeinheit 107 erscheinen. In einem solchen Fall kann die Reihenfolgeanpassungsunterstützungseinheit 209 mehrere Kennzeichnungen in absteigender Reihenfolge des Variationsgrads V markieren.
  • In der zweiten Ausführungsform können eine automatische Kennzeichnungsmarkierung und eine Kennzeichnungsmarkierung durch den Benutzer kombiniert werden. Zum Beispiel wird ein Evaluierungsbildschirmbild für eine automatisch markierte Kennzeichnung angezeigt, wie in 19 dargestellt, und dann wird zum Beispiel ein Variationsergebnisbildschirmbild als Reaktion auf eine Anweisung des Benutzers angezeigt, und der Benutzer kann eine Kennzeichnung markieren.
  • Dritte Ausführungsform
  • 20 ist ein Blockdiagramm, das schematisch die Konfiguration einer Datenvisualisierungsvorrichtung 300 gemäß einer dritten Ausführungsform darstellt.
  • Die Datenvisualisierungsvorrichtung 300 weist eine Speichereinheit 102, eine Datenbeschaffungseinheit 103, eine Distanzmatrix-Berechnungseinheit 104, eine Anzeigeeinheit 107 und eine Variationsberechnungseinheit 308 auf.
  • Die Speichereinheit 102, die Datenbeschaffungseinheit 103, die Distanzmatrix-Berechnungseinheit 104 und die Anzeigeeinheit 107 der Datenvisualisierungsvorrichtung 300 gemäß der dritten Ausführungsform sind jeweils die gleichen wie die Speichereinheit 102, die Datenbeschaffungseinheit 103, die Distanzmatrix-Berechnungseinheit 104 und die Anzeigeeinheit 107 der Datenvisualisierungsvorrichtung 100 gemäß der ersten Ausführungsform.
  • Es ist zu beachten, dass sich die Datenvisualisierungsvorrichtung 300 gemäß der dritten Ausführungsform von der Datenvisualisierungsvorrichtung 200 gemäß der zweiten Ausführungsform dadurch unterscheidet, dass sie nicht die Eingabeeinheit 101, die Reihenfolgeanpassungseinheit 105, die Visualisierungseinheit 106 und die Reihenfolgeanpassungsunterstützungseinheit 209 umfasst.
  • Ähnlich wie die Variationsberechnungseinheit 208 gemäß der zweiten Ausführungsform berechnet die Variationsberechnungseinheit 308 den Grad einer Datenvariation, der durch jede Kennzeichnung verursacht wird, die durch die Kennzeichnungsinformationen LI angegeben werden.
  • Die Variationsberechnungseinheit 308 veranlasst dann die Anzeigeeinheit 107, ein Variationsergebnis-Bildschirmbild anzuzeigen, das den berechneten Variationsgrad angibt.
  • Das Variationsergebnis-Bildschirmbild kann z. B. ein Bildschirmbild sein, das eine vorgegebene Anzahl von Kennzeichnungen in absteigender Reihenfolge des Variationsgrades V anzeigt, oder ein Bildschirmbild, das den Variationsgrad V aller Kennzeichnungen anzeigt. Mit anderen Worten, die Variationsberechnungseinheit 308 kann bewirken, dass mindestens eine Kennzeichnung, die in allen von den Kennzeichnungsinformationen LI angegebenen Kennzeichnungen enthalten ist, und ein Variationsgrad, der der mindestens einen Kennzeichnung entspricht, auf dem Variationsergebnis-Bildschirmbild erscheinen.
  • 21 ist ein Flussdiagramm, das eine Verarbeitung durch die Datenvisualisierungsvorrichtung 300 gemäß der dritten Ausführungsform darstellt.
  • Die Datenbeschaffungseinheit 103 beschafft einen Datensatz DS und seine Kennzeichnungsinformationen LI von der Speichereinheit 102 (Schritt S50). Der beschaffte Datensatz DS und seine Kennzeichnungsinformationen LI werden der Distanzmatrix-Berechnungseinheit 104 und der Distanzmatrix-Berechnungseinheit 308 zugeführt.
  • Die Distanzmatrix-Berechnungseinheit 104 berechnet eine Distanzmatrix, die aus den Ähnlichkeiten zwischen den jeweiligen Proben des Datensatzes DS besteht (Schritt S51). Die erzeugte Distanzmatrix wird an die Reihenfolgeanpassungseinheit 105 und die Variationsberechnungseinheit 308 weitergeleitet.
  • Die Variationsberechnungseinheit 308 wiederholt dann die Verarbeitung der Schritte S53 und S54 so oft, wie es der Anzahl von Kennzeichnungen entspricht, die durch die Kennzeichnungsinformationen LI angegeben werden (Schritte S52 und S55).
  • In Schritt S53 spezifiziert die Variationsberechnungseinheit 308 eine Kennzeichnung, für die der Variationsgrad V noch nicht aus den durch die Kennzeichnungsinformationen LI angegebenen Kennzeichnungen berechnet wurde, und passt die Reihenfolge der in der Distanzmatrix enthaltenen Proben entsprechend der spezifizierten Kennzeichnung an.
  • In Schritt S54 berechnet die Variationsberechnungseinheit 308 den Grad der Datenvariation V, der durch die spezifizierte Kennzeichnung verursacht wird, auf der Grundlage der angepassten Distanzmatrix.
  • Die Variationsberechnungseinheit 308 veranlasst dann die Anzeigeeinheit 107, ein Variationsergebnis-Bildschirmbild anzuzeigen, das den berechneten Variationsgrad V angibt (Schritt S56).
  • Gemäß der dritten Ausführungsform ist es möglich, durch Darstellung des Variationsgrades V jeder Kennzeichnung für den Benutzer, die Kennzeichnung zu zeigen, die das Qualitätsproblem des Datensatzes verursacht.
  • Ein Beispiel für den Datensatz, der von den oben beschriebenen Datenvisualisierungsvorrichtungen 100 bis 300 gemäß der ersten bis dritten Ausführungsformen verarbeitet wird, umfasst jeweils eine Verarbeitung von Tondaten, die zum Zweck einer automatischen Erfassung eines Bearbeitungsfehlers beim Schneiden durch eine Laserverarbeitungsmaschine gesammelt werden. Diese Daten können durch Anbringen eines akustischen Sensors oder Mikrofons am Verarbeitungskopf der Verarbeitungsmaschine gesammelt werden. Da der Zweck darin besteht, einen Verarbeitungsfehler zu erfassen, wird jedem Datenstück eine „Untersuchungsergebniskennzeichnung“ beigefügt, die das Vorhandensein oder Fehlen eines Fehlers angibt. Es wird erwartet, dass das Vorhandensein oder Fehlen eines Verarbeitungsfehlers schließlich durch maschinelles Lernen aus den Besonderheiten der Verarbeitungstondaten erfasst werden.
  • Die Datenvisualisierungsvorrichtungen 100 bis 300 werden zur Visualisierung und Quantifizierung der Datenqualität als Vorstufe zum Datenlernen verwendet. Wenn die Datenvisualisierungsvorrichtungen 100 bis 300 die Qualitätsverschlechterung und den Verschlechterungsfaktor bestätigen, kann die Datenqualität verbessert werden, indem Maßnahmen ergriffen werden, wie z. B. das „Aussortieren von Daten für das Lernen (d. h. die Nichtverwendung von Daten, die eine Qualitätsverschlechterung verursachen)“ oder die „Verbesserung des Datensammlungsverfahrens“, je nach dem Ergebnis.
  • Zum Zeitpunkt der Datensammlung werden auch Kennzeichnungsinformationen aufgezeichnet, von denen erwartet wird, dass sie nicht mit dem Untersuchungsergebnis in Zusammenhang stehen, wie z. B. der „Messzeitpunkt“, der „Messende“, die „Einrichtungsnummer“ oder der „Messort“, und der durch jede Kennzeichnung verursachte Grad der Datenvariation wird durch die in den ersten bis dritten Ausführungsformen beschriebene Verarbeitung visualisiert und quantifiziert.
  • In den ersten bis dritten Ausführungsformen werden Zeitreihendaten verarbeitet, die eindimensionale Werte für jeden Zeitpunkt angeben, aber bei einer Probe muss es sich nicht notwendigerweise um Daten handeln, die eindimensionale Werte für jeden Zeitpunkt angeben. Es ist auch möglich, Zeitreihendaten zu verwenden, die mehrdimensionale Werte für jeden Zeitpunkt angeben, oder Daten, die durch eine Besonderheitenextraktionsverarbeitung eines eindimensionalen Signals in mehrdimensionale Daten umgewandelt werden. Bei den Daten kann es sich um beliebige Daten außer Zeitreihendaten handeln.
  • Obwohl die in den zweiten und dritten Ausführungsformen beschriebenen Variationsberechnungseinheiten 208 und 308 jeweils den Variationsgrad für jede „Kennzeichnung“ berechnen, können die Variationsberechnungseinheiten 208 und 308 den „durch jede Klasse verursachten Variationsgrad“ berechnen, der in einer Kennzeichnung von Interesse enthalten ist.
  • Unter der Annahme, dass der Grad der durch die Klasse c verursachten Datenvariation (wobei c eine ganze Zahl ist, die 1≤c≤C erfüllt) beispielsweise V(c) ist, kann V(c) wie in Gleichung (3) unten formuliert werden. V ( c ) = V o u t ( c ) V i n ( c ) V o u t ( c ) = 1 C 1 k = 1 c μ c k δ c ( k ) δ c ( k ) = { 1 ( k c ) 0 ( k = c ) V i n ( c ) = μ c c
    Figure DE112020006501T5_0004
  • Wie in Gleichung (3) wird V(c) durch die Differenz zwischen der Interklassenvariation Vout(c) und der Intraklassenvariation Vin(c) berechnet.
  • Vout(c) gibt an, wie weit die Proben von Klasse c von den Proben anderer Klassen abweichen, und Vin(c) gibt an, wie stark die Proben von Klasse c voneinander abweichen.
  • Wenn beispielsweise V(c) für alle Klassen 1 bis 3 für die in 11 dargestellte angepasste Distanzmatrix 123 bestimmt wird, ist der Wert von V(2) größer als die Werte von V(1) und V(3). Auf diese Weise ist es möglich, quantitativ anzugeben, dass nur die Proben von Klasse 2 Eigenschaften aufweisen, die sich von denen der anderen Klassen unterscheiden.
  • Es ist wünschenswert, dass V(c) einen großen Wert für die zu identifizierende in den Klassen enthaltene Kennzeichnung im Datensatz hat (hier die Untersuchungsergebniskennzeichnung) und einen kleinen Wert für die in einer Kennzeichnung enthaltenen Klassen, die voraussichtlich nicht mit der zu identifizierenden Kennzeichnung zusammenhängt (hier die Messdatenkennzeichnung).
  • Wenn nur die in der Kennzeichnung enthaltenen Klassen, von denen erwartet wird, dass sie in keinem Zusammenhang mit dem ursprünglichen Identifikationsziel stehen (z. B. der Messende, das Messdatum oder die Einrichtungsnummer usw.), die Ziele der Berechnung sind, kann V(c) nach folgender Gleichung (4) berechnet werden. V ( c ) = V o u t ( c ) + V i n ( c )
    Figure DE112020006501T5_0005
  • Das heißt, dass, wenn eine Klasse aus den mehreren Klassen, für die der Variationsgrad V(c) zu berechnen ist, die Zielklasse ist, die Variationsgradberechnungseinheiten 208 und 308 den Variationsgrad V(c) durch Subtrahieren eines repräsentativen Werts der Ähnlichkeiten zwischen Proben, die in die Zielklasse klassifiziert sind, von einem repräsentativen Wert der Ähnlichkeiten zwischen Proben, die in die Zielklassen klassifiziert sind, und Proben, die in Klassen klassifiziert sind, die sich von den Zielklassen unterscheiden, berechnen können.
  • Alternativ können die Variationsberechnungseinheiten 208 und 308 den Variationsgrad V(c) durch Addieren des repräsentativen Werts der Ähnlichkeiten zwischen den Proben, die in die Zielklasse klassifiziert sind, und Proben, die in Klassen klassifiziert sind, die sich von den Zielklassen unterscheiden, zu dem repräsentativen Wert der Ähnlichkeiten zwischen den Proben, die in die Zielklasse klassifiziert sind, berechnen.
  • Die Reihenfolgeanpassungsunterstützungseinheit 209 oder die Variationsberechnungseinheit 308 können ein Variationsergebnis-Bildschirmbild erzeugen, das die mehreren Klassen und den Variationsgrad V(c) entsprechend jeder der Klassen anzeigt und das Variationsergebnis-Bildschirmbild veranlasst, auf der Anzeigeeinheit 107 zu erscheinen.
  • In einem solchen Fall erhöht sich der Wert in der Klasse, „die sich von den Daten der anderen Klassen unterscheidet“ und „die eine große Variation zwischen den Datenelementen derselben Klasse aufweist“, wie z. B. Klasse 2 der angepassten Distanzmatrix 124, die in 12 dargestellt ist, und diese Klasse kann als Faktor für eine Qualitätsverschlechterung angesehen werden. Wie oben beschrieben, können die Variationsberechnungseinheiten 208 und 308 den Variationsgrad V, der durch eine Kennzeichnung verursacht wird, und den Variationsgrad V(c), der durch jede Klasse der Kennzeichnung verursacht wird, für alle Kennzeichnungen berechnen. Es ist zu beachten, dass der Variationsgrad V auch als Grad einer Kennzeichnungsvariation bezeichnet wird und der Variationsgrad V(c) auch als Grad einer Klassenvariation bezeichnet wird.
  • V und V(c) können für die Submatrizen Dii nach Anpassung durch eine bestimmte Kennzeichnung berechnet werden. In einem solchen Fall sortieren die Variationsberechnungseinheiten 208 und 308 die Proben, die in den Submatrizen Dii enthalten sind, die diagonal in der angepassten Distanzmatrix M positioniert sind, die um eine bestimmte Kennzeichnung (z. B. eine Untersuchungsergebniskennzeichnung) um eine andere bestimmte Kennzeichnung angepasst wird, um eine neu angepasste Distanzmatrix Mi zu erhalten, und erhalten dann die Variationsgrade Vi und Vi(c) aus der neu angepassten Distanzmatrix Mi durch das gleiche Verfahren. Zu diesem Zeitpunkt können V und V(c) endgültig berechnet werden, z. B. indem der Durchschnitt von Vi und Vi(c) erhalten wird. Dieses Verfahren kann verwendet werden, wenn eine Kennzeichnung mit einer großen Variation im Voraus bekannt ist, um den Variationsgrad der anderen Kennzeichnungen zu berechnen. Auf diese Weise kann der Variationsgrad, der durch andere Kennzeichnungen verursacht wird, berechnet werden, ohne von der zuerst angepassten Kennzeichnung beeinflusst zu werden.
  • Wie vorstehend beschrieben, können die Variationsberechnungseinheiten 208 und 308 den „Grad einer durch jede in einer spezifischen Kennzeichnung enthaltenen Klasse verursachten Datenvariation“ berechnen.
  • Wenn zum Beispiel ein Benutzer über die Eingabeeinheit 101 eine Kennzeichnung markiert, kann die Variationsberechnungseinheit 208 den Variationsgrad V(c) jeder in der Kennzeichnung enthaltenen Klasse berechnen. Die Variationsberechnungseinheiten 208 und 308 können den Variationsgrad V für jede Kennzeichnung und den Variationsgrad V(c) für jede Klasse berechnen und die berechneten Ergebnisse V und V(c) auf dem Variationsergebnis-Bildschirmbild anzeigen.
  • In den oben beschriebenen ersten und zweiten Ausführungsformen wird ein Evaluierungsbildschirmbild erzeugt, indem der Wert der Felder einer angepassten Distanzmatrix mit einem vorgegebenen Schwellenwert verglichen wird und die Farbe eines Feldes dunkler gemacht wird als die Farbe des Feldes, dessen Wert gleich wie oder größer als der vorgegebene Schwellenwert ist, wenn der Wert kleiner als der vorgegebene Schwellenwert ist. Die angepasste Distanzmatrix kann beispielsweise als Wärmekarte visualisiert werden und die Werte der Felder der angepassten Distanzmatrix können in „Farbtönen“ ausgedrückt werden. Die angepasste Distanzmatrix kann beispielsweise als Wärmekarte visualisiert werden, wobei die Farbe umso dunkler ist, je kleiner der Wert ist, und umso heller die Farbe, je größer ist der Wert. Es ist auch möglich, die Wärmekarte-Darstellung mit einer Schwellenwertdarstellung zu kombinieren. So kann beispielsweise ein Darstellungsverfahren gewählt werden, bei dem alle Felder, die eine vorgegebene Obergrenze überschreiten, mit der „hellsten Farbe in der Wärmekarte“ (z. B. weiß) visualisiert sind, alle Felder unterhalb der vorgegebenen Untergrenze mit der „dunkelsten Farbe in der Wärmekarte“ (z. B. schwarz) visualisiert sind, und die übrigen Felder entsprechend der Wärmekarte visualisiert sind.
  • Bezugszeichenliste
  • 100, 200, 300
    Datenvisualisierungsvorrichtung;
    101
    Eingabeeinheit;
    102
    Speichereinheit;
    103
    Datenbeschaffungseinheit;
    104
    Distanzmatrix-Be- rechnungseinheit;
    105
    Reihenfolgeanpassungseinheit;
    106
    Visualisierungsein- heit;
    107
    Anzeigeeinheit;
    208, 308
    Variationsberechnungseinheit;
    209
    Reihen- folgeanpassungsunterstützungseinheit.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • JP 2015225637 [0005]

Claims (20)

  1. Informationsverarbeitungsvorrichtung, umfassend: eine Ähnlichkeitsmatrix-Erzeugungseinheit, die eingerichtet ist, eine Ähnlichkeitsmatrix aus einem Datensatz zu erzeugen, der eine Vielzahl von Proben aufweist, wobei die Ähnlichkeitsmatrix eine Vielzahl von Spalten, die horizontal entsprechend einer Reihenfolge angeordnet sind, in der die Vielzahl von Proben angeordnet sind, und eine Vielzahl von Zeilen, die vertikal entsprechend der Reihenfolge angeordnet sind, aufweist, wobei die Ähnlichkeitsmatrix eine Ähnlichkeit zwischen einer Probe, die einer der Spalten entspricht, und einer Probe, die einer der Zeilen entspricht, in einem Feld speichert, das durch die eine der Spalten und die eine der Zeilen spezifiziert ist; eine Reihenfolgeanpassungseinheit, die eingerichtet ist, eine angepasste Ähnlichkeitsmatrix zu erzeugen, indem sie auf Kennzeichnungsinformationen Bezug nimmt, die ein Ergebnis einer Kennzeichnung jeder der Proben mit einer Vielzahl von Kennzeichnungen angeben, die jeweils eine Vielzahl von Klassen aufweisen, und die Reihenfolge in der Ähnlichkeitsmatrix so anpassen, dass die Proben nach jeder der Klassen einer in der Vielzahl von Kennzeichnungen markierten Zielkennzeichnung angeordnet sind; eine Visualisierungseinheit, die eingerichtet ist, ein Evaluierungsbildschirmbild zu erzeugen, das jedes Feld der angepassten Ähnlichkeitsmatrix mit einer der Ähnlichkeit entsprechenden Helligkeit angibt; und eine Anzeigeeinheit, die eingerichtet ist, das Evaluierungsbildschirmbild anzuzeigen.
  2. Informationsverarbeitungsvorrichtung nach Anspruch 1, weiterhin umfassend: eine Eingabeeinheit, die eingerichtet ist, eine Markierung der Zielkennzeichnung in der Vielzahl von Kennzeichnungen zu akzeptieren.
  3. Informationsverarbeitungsvorrichtung nach Anspruch 1, weiterhin umfassend: eine Variationsberechnungseinheit, die eingerichtet ist, den Variationsgrad der Proben, der durch jede der Kennzeichnungen verursacht wird, zu berechnen; eine Reihenfolgeanpassungsunterstützungseinheit, die eingerichtet ist, ein Variationsergebnis-Bildschirmbild zu erzeugen, das die Kennzeichnungen und den Variationsgrad entsprechend jeder der Kennzeichnungen anzeigt und das Variationsergebnis-Bildschirmbild veranlasst, auf der Anzeigeeinheit zu erscheinen; und eine Eingabeeinheit, die eingerichtet ist, eine Markierung der Zielkennzeichnung in den Kennzeichnungen zu akzeptieren.
  4. Informationsverarbeitungsvorrichtung nach Anspruch 1, weiterhin umfassend: eine Variationsberechnungseinheit, die eingerichtet ist, einen Variationsgrad der Proben, der durch jede der Kennzeichnungen verursacht wird, zu berechnen und die Kennzeichnungen, die den höchsten Variationsgrad aufweisen, als die Zielkennzeichnungen zu markieren.
  5. Informationsverarbeitungsvorrichtung nach Anspruch 3 oder 4, wobei der Variationsgrad durch Subtrahieren eines repräsentativen Werts von Ähnlichkeiten zwischen Proben, die in eine gleiche Klasse klassifiziert sind, von einem repräsentativen Wert von Ähnlichkeiten zwischen Proben, die in verschiedene Klassen aus der Vielzahl von Klassen klassifiziert sind, berechnet wird.
  6. Informationsverarbeitungsvorrichtung nach Anspruch 1, weiterhin umfassend: eine Variationsberechnungseinheit, die eingerichtet ist, einen Variationsgrad der Proben, der durch jede der Klassen verursacht wird, zu berechnen; und eine Reihenfolgeanpassungsunterstützungseinheit, die eingerichtet ist, ein Variationsergebnis-Bildschirmbild zu erzeugen, das die Klassen und den Variationsgrad entsprechend jeder der Klassen anzeigt und das Variationsergebnis-Bildschirmbild veranlasst, auf der Anzeigeeinheit zu erscheinen.
  7. Informationsverarbeitungsvorrichtung nach Anspruch 6, wobei, wenn eine Klasse der Vielzahl von Klassen, für die der Variationsgrad zu berechnen ist, eine Zielklasse ist, der Variationsgrad durch Subtrahieren eines repräsentativen Werts von Ähnlichkeiten zwischen Proben, die in die Zielklasse klassifiziert sind, von einem repräsentativen Wert von Ähnlichkeiten zwischen den Proben, die in die Zielklassen klassifiziert sind, und Proben, die in Klassen klassifiziert sind, die sich von den Zielklassen unterscheiden, berechnet wird.
  8. Informationsverarbeitungsvorrichtung nach Anspruch 6, wobei, wenn eine Klasse der Vielzahl von Klassen, für die der Variationsgrad zu berechnen ist, eine Zielklasse ist, der Variationsgrad durch Addieren eines repräsentativen Werts von Ähnlichkeiten zwischen Proben, die in die Zielklasse klassifiziert sind, zu einem repräsentativen Wert von Ähnlichkeiten zwischen den Proben, die in die Zielklassen klassifiziert sind, und Proben, die in Klassen klassifiziert sind, die sich von den Zielklassen unterscheiden, berechnet wird.
  9. Informationsverarbeitungsvorrichtung nach einem der Ansprüche 1 bis 8, wobei das Evaluierungsbildschirmbild die Vielzahl von Klassen der Zielkennzeichnung in Korrelation mit der Vielzahl von Spalten und der Vielzahl von Zeilen der angepassten Ähnlichkeitsmatrix angibt.
  10. Informationsverarbeitungsvorrichtung, umfassend: eine Variationsberechnungseinheit, die eingerichtet ist, sich auf Kennzeichnungsinformationen zu beziehen, die ein Ergebnis einer Kennzeichnung jeder einer Vielzahl von Proben, die in einem Datensatz enthalten sind, mit einer Vielzahl von Kennzeichnungen, die jeweils eine Vielzahl von Klassen aufweisen, angeben, einen Variationsgrad der Proben zu berechnen, der durch jede der Kennzeichnungen verursacht wird, und ein Variationsergebnis-Bildschirmbild zu erzeugen, das mindestens eine Kennzeichnung, die in der Vielzahl von Kennzeichnungen enthalten ist, und den Variationsgrad, der der mindestens einen Kennzeichnung entspricht, anzeigt; und eine Anzeigeeinheit, die eingerichtet ist, das Variationsergebnis-Bildschirmbild anzuzeigen.
  11. Informationsverarbeitungsvorrichtung nach Anspruch 10, wobei der Variationsgrad durch Subtrahieren eines repräsentativen Werts von Ähnlichkeiten zwischen Proben, die in eine gleiche Klasse der Vielzahl von Klassen klassifiziert sind, von einem repräsentativen Wert von Ähnlichkeiten zwischen Proben, die in verschiedene Klassen der Vielzahl von Klassen klassifiziert sind, berechnet wird.
  12. Informationsverarbeitungsvorrichtung, umfassend: eine Variationsberechnungseinheit, die eingerichtet ist, sich auf Kennzeichnungsinformationen zu beziehen, die ein Ergebnis einer Kennzeichnung jeder einer Vielzahl von Proben, die in einem Datensatz enthalten sind, mit einer Vielzahl von Kennzeichnungen, die jeweils eine Vielzahl von Klassen aufweisen, angeben, einen Variationsgrad der Proben zu berechnen, der durch jede der Klassen verursacht wird, und ein Variationsergebnis-Bildschirmbild zu erzeugen, das die Klassen und den Variationsgrad, der jeder der Klassen entspricht, anzeigt; und eine Anzeigeeinheit, die eingerichtet ist, das Variationsergebnis-Bildschirmbild anzuzeigen.
  13. Informationsverarbeitungsvorrichtung nach Anspruch 12, wobei, wenn eine Klasse der Vielzahl von Klassen, für die der Variationsgrad zu berechnen ist, eine Zielklasse ist, der Variationsgrad durch Subtrahieren eines repräsentativen Werts von Ähnlichkeiten zwischen Proben, die in die Zielklasse klassifiziert sind, von einem repräsentativen Wert von Ähnlichkeiten zwischen den Proben, die in die Zielklassen klassifiziert sind, und Proben, die in Klassen klassifiziert sind, die sich von den Zielklassen unterscheiden, berechnet wird.
  14. Informationsverarbeitungsvorrichtung nach Anspruch 12, wobei, wenn eine Klasse der Vielzahl von Klassen, für die der Variationsgrad zu berechnen ist, eine Zielklasse ist, der Variationsgrad durch Addieren eines repräsentativen Werts von Ähnlichkeiten zwischen Proben, die in eine gleiche Klasse, die in der Zielklasse enthalten ist, klassifiziert sind, zu einem repräsentativen Wert von Ähnlichkeiten zwischen Proben, die in die Zielklassen klassifiziert sind, und Proben, die in Klassen klassifiziert sind, die sich von den Zielklassen unterscheiden, berechnet wird.
  15. Programm, das einen Computer veranlasst, zu funktionieren als: eine Ähnlichkeitsmatrix-Erzeugungseinheit, die eingerichtet ist, eine Ähnlichkeitsmatrix aus einem Datensatz zu erzeugen, der eine Vielzahl von Proben aufweist, wobei die Ähnlichkeitsmatrix eine Vielzahl von Spalten, die horizontal entsprechend einer Reihenfolge angeordnet sind, in der die Vielzahl von Proben angeordnet sind, und eine Vielzahl von Zeilen, die vertikal entsprechend der Reihenfolge angeordnet sind, aufweist, wobei die Ähnlichkeitsmatrix eine Ähnlichkeit zwischen einer Probe, die einer der Spalten entspricht, und einer Probe, die einer der Zeilen entspricht, in einem Feld speichert, das durch die eine der Spalten und die eine der Zeilen spezifiziert ist; eine Reihenfolgeanpassungseinheit, die eingerichtet ist, eine angepasste Ähnlichkeitsmatrix zu erzeugen, indem sie auf Kennzeichnungsinformationen Bezug nimmt, die ein Ergebnis einer Kennzeichnung jeder der Proben mit einer Vielzahl von Kennzeichnungen angeben, die jeweils eine Vielzahl von Klassen aufweisen, und die Reihenfolge in der Ähnlichkeitsmatrix so anpassen, dass die Proben nach jeder der Klassen einer in der Vielzahl von Kennzeichnungen markierten Zielkennzeichnung angeordnet sind; eine Visualisierungseinheit, die eingerichtet ist, ein Evaluierungsbildschirmbild zu erzeugen, das jedes Feld der angepassten Ähnlichkeitsmatrix in einer der Ähnlichkeit entsprechenden Helligkeit angibt; und eine Anzeigeeinheit, die eingerichtet ist, das Evaluierungsbildschirmbild anzuzeigen.
  16. Programm, das einen Computer veranlasst, zu funktionieren als: eine Variationsberechnungseinheit, die eingerichtet ist, sich auf Kennzeichnungsinformationen zu beziehen, die ein Ergebnis einer Kennzeichnung jeder einer Vielzahl von Proben, die in einem Datensatz enthalten sind, mit einer Vielzahl von Kennzeichnungen, die jeweils eine Vielzahl von Klassen aufweisen, angeben, Variationsgrade der Proben zu berechnen, die durch jede der Kennzeichnungen verursacht werden, und ein Variationsergebnis-Bildschirmbild zu erzeugen, das mindestens eine Kennzeichnung, die in der Vielzahl von Kennzeichnungen enthalten ist, und den Variationsgrad, der der mindestens einen Kennzeichnung entspricht, anzeigt; und eine Anzeigeeinheit, die eingerichtet ist, das Variationsergebnis-Bildschirmbild anzuzeigen.
  17. Programm, das einen Computer veranlasst, zu funktionieren als: eine Variationsberechnungseinheit, die eingerichtet ist, sich auf Kennzeichnungsinformationen zu beziehen, die ein Ergebnis einer Kennzeichnung jeder einer Vielzahl von Proben, die in einem Datensatz enthalten sind, mit einer Vielzahl von Kennzeichnungen, die jeweils eine Vielzahl von Klassen aufweisen, angeben, einen Variationsgrad jeder der Proben zu berechnen, der durch jede der Klassen verursacht wird, und ein Variationsergebnis-Bildschirmbild zu erzeugen, das jede der Klassen und den Variationsgrad, der jeder der Klassen entspricht, anzeigt; und eine Anzeigeeinheit, die eingerichtet ist, das Variationsergebnis-Bildschirmbild anzuzeigen.
  18. Informationsverarbeitungsverfahren, umfassend: Erzeugen einer Ähnlichkeitsmatrix aus einem Datensatz, der eine Vielzahl von Proben aufweist, wobei die Ähnlichkeitsmatrix eine Vielzahl von Spalten, die horizontal entsprechend einer Reihenfolge angeordnet sind, in der die Vielzahl von Proben angeordnet ist, und eine Vielzahl von Zeilen, die vertikal entsprechend der Reihenfolge angeordnet sind, aufweist, wobei die Ähnlichkeitsmatrix eine Ähnlichkeit zwischen einer Probe, die einer der Spalten entspricht, und einer Probe, die einer der Zeilen entspricht, in einem Feld speichert, das durch die eine der Spalten und die eine der Zeilen spezifiziert ist; Erzeugen einer angepassten Ähnlichkeitsmatrix durch Bezugnahme auf Kennzeichnungsinformationen, die ein Ergebnis einer Kennzeichnung jeder der Proben mit einer Vielzahl von Kennzeichnungen angeben, die jeweils eine Vielzahl von Klassen aufweisen, und die Reihenfolge in der Ähnlichkeitsmatrix so anpassen, dass die Proben nach jeder der Klassen einer in der Vielzahl von Kennzeichnungen markierten Zielkennzeichnung angeordnet sind; Erzeugen eines Evaluierungsbildschirmbilds, das jedes Feld der angepassten Ähnlichkeitsmatrix in einer der Ähnlichkeit entsprechenden Helligkeit angibt; und Anzeigen des Evaluierungsbildschirmbilds.
  19. Informationsverarbeitungsverfahren, umfassend: Bezug nehmen auf Kennzeichnungsinformationen, die ein Ergebnis einer Kennzeichnung jeder einer Vielzahl von Proben, die in einem Datensatz enthalten sind, mit einer Vielzahl von Kennzeichnungen, die jeweils eine Vielzahl von Klassen aufweisen, angeben und Berechnen eines Variationsgrads jeder der Proben, der durch jede der Kennzeichnungen verursacht wird; Erzeugen eines Variationsergebnis-Bildschirmbilds, das mindestens eine Kennzeichnung, die in der Vielzahl von Kennzeichnungen enthalten ist, und den Variationsgrad, der der mindestens einen Kennzeichnung entspricht, anzeigt; und Anzeigen des Variationsergebnis-Bildschirmbilds.
  20. Informationsverarbeitungsverfahren, umfassend: Bezug nehmen auf Kennzeichnungsinformationen, die ein Ergebnis einer Kennzeichnung jeder einer Vielzahl von Proben, die in einem Datensatz enthalten sind, mit einer Vielzahl von Kennzeichnungen, die jeweils eine Vielzahl von Klassen aufweisen, angeben und Berechnen eines Variationsgrads jeder der Proben, der durch jede der Klassen verursacht wird; Erzeugen eines Variationsergebnis-Bildschirmbilds, das die Klassen und den Variationsgrad entsprechend jeder der Klassen anzeigt; und Anzeigen des Variationsergebnis-Bildschirmbilds.
DE112020006501.4T 2020-03-13 2020-03-13 Informationsverarbeitungsvorrichtung, programm, und informationsverarbeitungsverfahren Pending DE112020006501T5 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/011066 WO2021181654A1 (ja) 2020-03-13 2020-03-13 情報処理装置、プログラム及び情報処理方法

Publications (1)

Publication Number Publication Date
DE112020006501T5 true DE112020006501T5 (de) 2022-11-17

Family

ID=77671066

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112020006501.4T Pending DE112020006501T5 (de) 2020-03-13 2020-03-13 Informationsverarbeitungsvorrichtung, programm, und informationsverarbeitungsverfahren

Country Status (7)

Country Link
US (1) US20220383147A1 (de)
JP (1) JP7130153B2 (de)
KR (1) KR102552786B1 (de)
CN (1) CN115280307A (de)
DE (1) DE112020006501T5 (de)
TW (1) TWI807214B (de)
WO (1) WO2021181654A1 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114286088A (zh) * 2021-12-21 2022-04-05 长沙景嘉微电子股份有限公司 应用于图形处理器的视频花屏检测方法、设备、存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015225637A (ja) 2014-05-30 2015-12-14 アズビル株式会社 相関分析装置、相関分析方法、および相関分析用プログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005108111A (ja) 2003-10-01 2005-04-21 Research Organization Of Information & Systems グループ間分別項目決定方法および同方法を実行するためのプログラム
US8650138B2 (en) * 2008-11-26 2014-02-11 Nec Corporation Active metric learning device, active metric learning method, and active metric learning program
JP6977715B2 (ja) 2016-04-11 2021-12-08 ソニーグループ株式会社 情報処理装置、及び情報処理方法
TWI682368B (zh) * 2018-07-03 2020-01-11 緯創資通股份有限公司 利用多維度感測器資料之監控系統及監控方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015225637A (ja) 2014-05-30 2015-12-14 アズビル株式会社 相関分析装置、相関分析方法、および相関分析用プログラム

Also Published As

Publication number Publication date
CN115280307A (zh) 2022-11-01
WO2021181654A1 (ja) 2021-09-16
KR20220127347A (ko) 2022-09-19
US20220383147A1 (en) 2022-12-01
TWI807214B (zh) 2023-07-01
JPWO2021181654A1 (de) 2021-09-16
KR102552786B1 (ko) 2023-07-06
TW202134922A (zh) 2021-09-16
JP7130153B2 (ja) 2022-09-02

Similar Documents

Publication Publication Date Title
DE112016002090T5 (de) Verfahren und system zur defektklassifizierung
DE112012002805B4 (de) Ladungsteilchenstrahlvorrichtung
DE112017005640T5 (de) Informationsverarbeitungsvorrichtung und Informationsverarbeitungsverfahren
DE60303138T2 (de) Vergleichen von mustern
DE102020107179A1 (de) Verfahren zum anzeigen, benutzerschnittstelleneinheit,anzeigevorrichtung und prüfgerät
DE102020101344A1 (de) Interaktive instrumenten-messanalytik
DE112018007597T5 (de) Diagnosevorrichtung, Diagnoseverfahren und Programm
DE102018221695A1 (de) Verfahren zur quantitativen Magnetresonanzbildgebung, Magnetresonanzeinrichtung, Computerprogramm und elektronisch lesbarer Datenträger
DE112018004567T5 (de) Spektralanalyseeinrichtung und Spektralanalyseverfahren
DE102018205561A1 (de) Vorrichtung zur Klassifizierung von Signalen
DE102020110028A1 (de) Datenvorverarbeitungsverfahren und -Vorrichtung für Datenfusion
DE112020006501T5 (de) Informationsverarbeitungsvorrichtung, programm, und informationsverarbeitungsverfahren
EP1203342A2 (de) Verfahren und vorrichtung zur segmentierung einer punkteverteilung
DE112019003466T5 (de) Spektralkalibriervorrichtung und spektralkalibrierverfahren
DE102005049017A1 (de) Verfahren zur Segmentierung in einem n-dimensionalen Merkmalsraum und Verfahren zur Klassifikation auf Grundlage von geometrischen Eigenschaften segmentierter Objekte in einem n-dimensionalen Datenraum
DE112018007522T5 (de) Arbeitsanalyseeinrichtung
DE112022004085T5 (de) Verfahren und Vorrichtung zum Erzeugen synthetischer Trainingsdaten für ein Ultraschallsensormodell
DE112018007863B4 (de) Signalanzeige-steuerungseinrichtung und signalanzeige-steuerungsprogramm
EP2910937B1 (de) Verfahren zur Identifizierung einer kristallographischen Kandidatenphase eines Kristalls
DE102021210393A1 (de) Verfahren und Vorrichtung zum Betreiben eines technischen Systems
DE102021201031A1 (de) Programmerstellungsvorrichtung, Objekterkennungssystem, Ankersetzverfahren und Ankersetzprogramm
DE112020003599T5 (de) Prüfvorrichtung, prüfverfahren, prüfprogramm, lernvorrichtung, lernverfahren und lernprogramm
DE102023107278B3 (de) Verfahren zum Authentifizieren einer auf ihrem Substrat mindestens eine bedruckte Fläche aufweisenden Banknote
EP4205091B1 (de) Vorrichtung zum erzeugen einer digitalen kennung von einem mindestens ein druckbild aufweisenden exemplar eines druckerzeugnisses, smartphone oder tablet mit dieser vorrichtung und verfahren zur verwendung dieser vorrichtung
DE112018006847T5 (de) Anzeigedatenerzeugungsvorrichtung, Anzeigedatenerzeugungsverfahren und Programm

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R084 Declaration of willingness to licence