DE112020007110T5 - Vorrichtung zur bestimmung der zulänglichkeit einer datenmenge, verfahren zum bestimmen der zulänglichkeit einer datenmenge, lernmodell-erzeugungssystem, verfahren zum erzeugen eines trainierten modells und medium - Google Patents

Vorrichtung zur bestimmung der zulänglichkeit einer datenmenge, verfahren zum bestimmen der zulänglichkeit einer datenmenge, lernmodell-erzeugungssystem, verfahren zum erzeugen eines trainierten modells und medium Download PDF

Info

Publication number
DE112020007110T5
DE112020007110T5 DE112020007110.3T DE112020007110T DE112020007110T5 DE 112020007110 T5 DE112020007110 T5 DE 112020007110T5 DE 112020007110 T DE112020007110 T DE 112020007110T DE 112020007110 T5 DE112020007110 T5 DE 112020007110T5
Authority
DE
Germany
Prior art keywords
data
time
unit
probability distribution
substring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE112020007110.3T
Other languages
English (en)
Inventor
Takahiko Masuzaki
Osamu Nasu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of DE112020007110T5 publication Critical patent/DE112020007110T5/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Angegeben wird eine Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge, die in der Lage ist, die Zulänglichkeit der Datenmenge von Lerndaten mit größerer Genauigkeit zu bestimmen.
Eine Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der vorliegenden Offenbarung weist auf: eine Zeitreihendaten-Abrufeinheit zum Abrufen von Zeitreihendaten, eine Datenaufteilungseinheit zum Aufteilen der Zeitreihendaten in eine Mehrzahl von Daten-Teilketten, eine Datensatz-Erzeugungseinheit zur Erzeugung einer Mehrzahl von Daten-Teilkettensätzen, die Sätze von Daten-Teilketten sind, eine Merkmalsmengen-Berechnungseinheit zum Berechnen einer Merkmalsmenge der Daten-Teilketten, eine Wahrscheinlichkeitsverteilungs-Erzeugungseinheit zum Erzeugen einer Wahrscheinlichkeitsverteilung der Merkmalsmenge für jeden Daten-Teilkettensatz und eine Bestimmungseinheit zum Bestimmen, ob die Wahrscheinlichkeitsverteilung konvergent geworden ist oder nicht.

Description

  • TECHNISCHES GEBIET
  • Die vorliegende Offenbarung betrifft eine Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge, ein Verfahren zum Bestimmen der Zulänglichkeit einer Datenmenge, ein Programm zur Bestimmung der Zulänglichkeit einer Datenmenge, ein Lernmodell-Erzeugungssystem, ein Verfahren zum Erzeugen eines trainierten Modells und ein Programm zum Erzeugen eines trainierten Modells.
  • HINTERGRUND ZUM STAND DER TECHNIK
  • Eine Vorrichtung, die bestimmt, ob ein Gerät in Ordnung ist oder nicht, und die dafür ein gelerntes Lernmodells verwendet, das unter Verwendung von Zeitreihendaten eines ordnungsgemäßen Geräts eine Diagnose von Zeitreihendaten des zu diagnostizierenden Geräts durchführt, wird erforscht und ist in Entwicklung. Für das Lernen des Lernmodells ist es hierbei wichtig, vorab zu wissen, wie viele Daten zur Durchführung des Lernens verwendet werden sollen. Um eine Anomaliedetektion und dergleichen in einem frühen Stadium durchzuführen, wird eine möglichst frühe Durchführung des Lernens angestrebt. Andererseits muss nachgearbeitet werden, um das Lernen erneut durchzuführen, wenn das Lernen in einem Stadium durchgeführt worden ist, bei dem noch nicht genügend Daten erfasst wurden, und wenn nach dem Lernen gefunden wird, dass die Daten nicht ausreichen. Wenn umgekehrt eine große Menge an Daten eingegeben und gelernt wird, dauert das Lernen an sich lange, und es kann sein, dass es zu einem Überlernen kommt. Somit ist es notwendig, unnötige Daten in den zum Lernen erfassten Daten zu verwerfen.
  • Daher wird an einer Technik geforscht, mit der bestimmt werden kann, ob die Menge an erfassten Zeitreihendaten für die Durchführung des Lernens eines Lernmodells ausreicht oder nicht. Zum Beispiel offenbart Patentliteratur 1 eine Datenverarbeitungsvorrichtung, die eine Merkmalsmenge für jeden einzelnen durch Aufteilen von Daten in Abschnitte ermittelten Bereich berechnet, die Merkmalsmenge des Bereichs in Muster klassifiziert und das Lernen beendet, wenn die Anzahl der Muster konvergent ist.
  • LISTE DER ENTGEGENHALTUNGEN
  • PATENTLITERATUR
  • Patentliteratur 1: JP 2009-135649 A
  • ABRISS DER ERFINDUNG
  • TECHNISCHES PROBLEM
  • Jedoch bestimmt die in Patentliteratur 1 offenbarte Datenverarbeitungsvorrichtung die Zulänglichkeit von Daten nur auf Basis der Anzahl der Muster der Merkmalsmenge und kann Zeitreihendaten, die unterschiedliche Eigenschaften haben, nicht flexibel handhaben und wirft ein Problem dahingehend auf, dass die Genauigkeit der Bestimmung der Zulänglichkeit der Datenmenge abhängig von den Eigenschaften der Zeitreihendaten gering ist.
  • Die vorliegende Offenbarung soll die oben beschriebenen Probleme lösen, und sie zielt darauf ab, eine Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge zu erhalten, die in der Lage ist, die Zulänglichkeit der Datenmenge von Lerndaten mit höherer Genauigkeit zu bestimmen.
  • LÖSUNG DES PROBLEMS
  • Eine Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der vorliegenden Offenbarung weist auf: eine Zeitreihendaten-Abrufeinheit zum Abrufen von Zeitreihendaten, eine Datenaufteilungseinheit zum Aufteilen der Zeitreihendaten in eine Mehrzahl von Daten-Teilketten, eine Datensatz-Erzeugungseinheit zur Erzeugung einer Mehrzahl von Daten-Teilkettensätzen, die Sätze von Daten-Teilketten sind, eine Merkmalsmengen-Berechnungseinheit zum Berechnen einer Merkmalsmenge der Daten-Teilketten, eine Wahrscheinlichkeitsverteilungs-Erzeugungseinheit zum Erzeugen einer Wahrscheinlichkeitsverteilung der Merkmalsmenge für jeden einzelnen Daten-Teilkettensatz und eine Bestimmungseinheit zum Bestimmen, ob die Wahrscheinlichkeitsverteilung konvergent geworden ist oder nicht.
  • VORTEILHAFTE WIRKUNGEN DER ERFINDUNG
  • Eine Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der vorliegenden Offenbarung weist auf: eine Merkmalsmengen-Berechnungseinheit zum Berechnen einer Merkmalsmenge von Daten-Teilketten, eine Wahrscheinlichkeitsverteilungs-Erzeugungseinheit zum Erzeugen einer Wahrscheinlichkeitsverteilung der Merkmalsmenge für jeden einzelnen Daten-Teilkettensatz und eine Bestimmungseinheit zum Bestimmen, ob die Wahrscheinlichkeitsverteilung konvergent geworden ist oder nicht. Daher ist es möglich, nicht nur auf Basis der Anzahl der Muster der Merkmalsmenge, sondern auch auf Basis der Wahrscheinlichkeitsverteilung der Merkmalsmenge mit höherer Genauigkeit zu bestimmen, ob eine Datenmenge von Lerndaten ausreicht.
  • Figurenliste
    • 1 ist ein Konfigurationsschema, das die Konfiguration eines Lernmodell-Erzeugungssystems 1000 gemäß einer ersten Ausführungsform darstellt.
    • 2 ist ein Hardware-Konfigurationsschema, das ein Beispiel für die Hardware-Konfiguration einer Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der ersten Ausführungsform darstellt.
    • 3 ist ein Flussdiagramm, das die Arbeitsweise der Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der ersten Ausführungsform darstellt.
    • 4 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für eine Verarbeitung, bei der eine Datenaufteilungseinheit 20 gemäß der ersten Ausführungsform Zeitreihendaten aufteilt.
    • 5 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für eine Verarbeitung, bei der eine Datensatz-Erzeugungseinheit 30 gemäß der ersten Ausführungsform einen Daten-Teilkettensatz erzeugt.
    • 6 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für eine Verarbeitung, bei der eine Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 50 gemäß der ersten Ausführungsform eine Wahrscheinlichkeitsverteilung erzeugt.
    • 7 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für eine Verarbeitung, bei der die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 50 gemäß der ersten Ausführungsform eine statistische Menge berechnet.
    • 8 ist ein Konfigurationsschema, das die Konfiguration eines Lernmodell-Erzeugungssystems 2000 gemäß einer zweiten Ausführungsform darstellt.
    • 9 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für eine Merkmalsmengen-Berechnungseinheit 240 gemäß der zweiten Ausführungsform.
    • 10 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für eine Verarbeitung der Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der ersten Ausführungsform und der zweiten Ausführungsform.
    • 11 ist ein Konfigurationsschema, das die Konfiguration eines Lernmodell-Erzeugungssystems 3000 gemäß einer dritten Ausführungsform darstellt.
    • 12 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für eine Verarbeitung der Vorrichtung 300 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der dritten Ausführungsform.
    • 13 ist ein Konfigurationsschema, das die Konfiguration eines Lernmodell-Erzeugungssystems 4000 gemäß einer vierten Ausführungsform darstellt.
    • 14 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für eine Verarbeitung einer Vorrichtung 400 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der vierten Ausführungsform.
    • 15 ist ein Konfigurationsschema, das die Konfiguration eines Lernmodell-Erzeugungssystems 5000 gemäß einer fünften Ausführungsform darstellt.
    • 16 ist ein Konfigurationsschema, das die Konfiguration eines Lernmodell-Erzeugungssystems 6000 gemäß einer sechsten Ausführungsform darstellt.
    • 17 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für eine Verarbeitung einer Vorrichtung 600 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der sechsten Ausführungsform.
  • BESCHREIBUNG VON AUSFÜHRUNGSFORMEN
  • Erste Ausführungsform
  • 1 ist ein Konfigurationsschema, das die Konfiguration eines Lernmodell-Erzeugungssystems 1000 gemäß einer ersten Ausführungsform darstellt.
  • Das Lernmodell-Erzeugungssystem 1000 erfasst Zeitreihendaten und erzeugt ein Lernmodell, und es weist eine Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge, eine Zeitreihendaten-Verwaltungsvorrichtung 110 und eine Lernvorrichtung 120 auf.
  • Die Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge bestimmt, ob die von der Zeitreihendaten-Verwaltungsvorrichtung 110 erfassten Daten in einer Menge erfasst worden sind, die zum Lernen des Lernmodells durch die Lernvorrichtung 120 ausreicht.
  • Die Zeitreihendaten-Verwaltungsvorrichtung 110 verwaltet Zeitreihendaten und weist eine Zeitreihendaten-Erfassungseinheit 111, die Zeitreihendaten erfasst, und eine Zeitreihendaten-Speichereinheit 112, die die erfassten Zeitreihendaten speichert, auf.
  • Hierbei wird beispielsweise ein in einer Produktionsstätte bereitgestellter Sensor oder dergleichen als die Zeitreihendaten-Erfassungseinheit 111 verwendet, und eine Speichervorrichtung, wie ein Festplattenlaufwerk, wird als die Zeitreihendaten-Speichereinheit 112 verwendet.
  • Die Lernvorrichtung 120 lernt das Lernmodell unter Verwendung der aus der Zeitreihendaten-Verwaltungsvorrichtung 110 empfangenen Zeitreihendaten, falls die Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge bestimmt, dass eine ausreichende Datenmenge erfasst worden ist, und umfasst eine Lerndaten-Abrufeinheit 121, die die in der Zeitreihendaten-Verwaltungsvorrichtung 110 gespeicherten Zeitreihendaten als Lerndaten abruft, und eine Einheit 122 zur Erzeugung eines trainierten Modells, die das Lernmodell unter Verwendung der von der Lerndaten-Abrufeinheit 121 abgerufenen Lerndaten lernt und ein trainiertes Modell erzeugt.
  • Ähnlich wie die noch zu beschreibende Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge wird jede einzelne Funktion der Lernvorrichtung 120 durch eine Verarbeitungsvorrichtung erreicht, die ein in der Speichervorrichtung gespeichertes Programm ausführt.
  • Nun werden Details der Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge beschrieben.
  • Die Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge weist eine Zeitreihendaten-Abrufeinheit 101, eine Datenaufteilungseinheit 102, eine Datensatz-Erzeugungseinheit 103, eine Merkmalsmengen-Berechnungseinheit 104, eine Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 und eine Bestimmungseinheit 106 auf.
  • Die Zeitreihendaten-Abrufeinheit 101 ruft Zeitreihendaten ab. Die Zeitreihendaten sind beispielsweise Daten, die einen Stromwert oder einen Spannungswert angeben, der von einem an einer Fertigungsvorrichtung angebrachten Sensor aufgenommen wird, Schwingungsdaten, die eine Schwingung einer Vorrichtung angeben, die von einem Schwingungssensor detektiert wird, Tondaten, die einen Betriebston einer Vorrichtung angeben, der von einem Tonsensor detektiert wird, oder dergleichen.
  • In der ersten Ausführungsform ruft die Zeitreihendaten-Abrufeinheit 101 die zu lernenden Zeitreihendaten aus der Zeitreihendaten-Speichereinheit 112 ab. Hierbei ruft die Zeitreihendaten-Abrufeinheit 101 eine große Menge an Zeitreihendaten als Ziel für eine Bestimmung der Zulänglichkeit der Datenmenge ab. Die abgerufenen Zeitreihendaten sind digitale Daten, in denen Zeit und Daten verknüpft sind, und von denen kontinuierliche Werte mit einer spezifischen Sampling-Rate in diskrete Daten umgewandelt werden.
  • Die Datenaufteilungseinheit 102 teilt die von der Zeitreihendaten-Abrufeinheit 101 abgerufenen Zeitreihendaten in eine Mehrzahl von Daten-Teilketten auf. Das heißt, die Datenaufteilungseinheit 102 erzeugt durch Aufteilen der Zeitreihendaten eine Mehrzahl von Daten-Teilketten. Genauer extrahiert die Datenaufteilungseinheit 102 gemäß der ersten Ausführungsform W zeitlich kontinuierliche Daten aus den abgerufenen Zeitreihendaten. Die extrahierten W Daten werden als Daten-Teilkette bezeichnet.
  • Hierbei kann die Datenaufteilungseinheit 102 die Daten-Teilketten so erzeugen, dass die Mehrzahl von Daten-Teilketten Daten in einem gemeinsamen Zeitraum einschließen. Daher kann eine Situation, in der die Eigenschaften der Wellenform sich ändern, fein erfasst werden, und die Bestimmungsgenauigkeit ist verbessert.
  • Die Datensatz-Erzeugungseinheit 103 erzeugt eine Mehrzahl von Daten-Teilkettensätzen, wobei es sich um Sätze der von der Datenaufteilungseinheit 102 erzeugten Daten-Teilketten handelt. Darüber hinaus erzeugt die Datensatz-Erzeugungseinheit 103 einen zweiten Daten-Teilkettensatz durch Hinzufügen der Daten-Teilkette, die nicht in einem ersten Daten-Teilkettensatz enthalten sind, zu dem ersten Daten-Teilkettensatz. Das heißt, in der ersten Ausführungsform erzeugt die Datensatz-Erzeugungseinheit 103 durch eine schrittweise Vergrößerung der Datenmenge eine Mehrzahl von Daten-Teilkettensätzen. Darüber hinaus erzeugt die Datensatz-Erzeugungseinheit 103 in der ersten Ausführungsform eine Mehrzahl von Gruppen, die eine Mehrzahl von Daten-Teilkettensätzen einschließen. Genauer erzeugt die Datensatz-Erzeugungseinheit 103 eine erste Gruppe mit einer Mehrzahl von Daten-Teilkettensätzen und eine zweite Gruppe mit dergleichen Anzahl von Daten-Teilkettensätzen wie die erste Gruppe und mit mindestens einem Daten-Teilkettensatz, der nicht in der ersten Gruppe enthalten ist.
  • Die Merkmalsmengen-Berechnungseinheit 104 berechnet eine Merkmalsmenge der von der Datenaufteilungseinheit 102 erzeugten Daten-Teilketten. Hierbei muss die Merkmalsmenge den Daten-Teilketten nicht eins-zueins entsprechen. Das heißt, die Merkmalsmengen-Berechnungseinheit 104 kann die Merkmalsmenge für jede einzelne Daten-Teilkette berechnen oder kann die Merkmalsmenge aus der Beziehung zwischen den Daten-Teilketten berechnen, und die Merkmalsmenge der Daten-Teilketten schließt beides ein. Ferner ist die Merkmalsmenge nicht auf eine beschränkt, und es kann eine Mehrzahl von Merkmalsmengen berechnet werden. Jedoch berechnet im Folgenden die Merkmalsmengen-Berechnungseinheit 104 die Merkmalsmenge für jede einzelne Daten-Teilkette. Darüber hinaus ist die Merkmalsmenge hierin beispielsweise ein Durchschnitt oder eine Standardabweichung jeder Daten-Teilkette, ein Durchschnitt, eine Standardabweichung oder dergleichen von Absolutwerten von Steigungen von Wellenformen, die die individuelle Daten-Teilketten darstellen.
  • Die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 erzeugt eine Wahrscheinlichkeitsverteilung einer Merkmalsmenge für jeden von der Datensatz-Erzeugungseinheit 103 erzeugten Daten-Teilkettensatz. Hierbei ist die Wahrscheinlichkeitsverteilung der Merkmalsmenge eine Verteilung von Wahrscheinlichkeiten von Werten, die von den jeweiligen Merkmalsmengen der Mehrzahl von Daten-Teilketten angenommen werden. Zum Beispiel wird die Wahrscheinlichkeitsverteilung der Merkmalsmenge ermittelt durch Aufteilen eines Bereichs von Werten der Merkmalsmenge in Abschnitte mit einer konstanten Breite, Ermitteln der Zahl (Frequenz) der in den einzelnen Teilstücken enthaltenen Werte und Normalisieren der ermittelten Zahl. Darüber hinaus vergleicht in der ersten Ausführungsform die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 die Wahrscheinlichkeitsverteilungen, die jeweils aus unterschiedlichen Daten-Teilkettensätzen erzeugt worden sind, und berechnet eine Statistik der Merkmalsmenge auf Basis der Wahrscheinlichkeitsverteilung.
  • In der ersten Ausführungsform berechnet die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 als Statistik die Ähnlichkeit zwischen der Wahrscheinlichkeitsverteilung des Daten-Teilkettensatzes, der in der ersten Gruppe enthalten ist, und der Wahrscheinlichkeitsverteilung des Daten-Teilkettensatzes, der in der zweiten Gruppe enthalten ist. Als Ähnlichkeit wird beispielsweise ein euklidischer Abstand oder eine Cosinusähnlichkeit verwendet.
  • Die Bestimmungseinheit 106 bestimmt, ob oder ob nicht die von der Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 erzeugte Wahrscheinlichkeitsverteilung konvergent geworden ist. Die Bestimmungseinheit 106 bestimmt durch Bestimmen, ob oder ob nicht die Wahrscheinlichkeitsverteilung konvergent geworden ist, ob die Datenmenge ausreicht oder nicht. Das heißt, die Bestimmungseinheit 106 bestimmt auf Basis der Konvergenz in der Wahrscheinlichkeitsverteilung, dass die Datenmenge ausreicht. In der ersten Ausführungsform bestimmt die Bestimmungseinheit 106, dass die Wahrscheinlichkeitsverteilung konvergent geworden ist, falls die Ähnlichkeit zwischen der von der Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 berechneten Wahrscheinlichkeitsverteilung konvergent ist, das heißt, falls die Änderung der Merkmalsmenge, die aus der Wahrscheinlichkeitsverteilung ermittelt wird, abnimmt oder verschwindet. Die Bestimmungseinheit 106 gibt das Bestimmungsergebnis an die Lerndaten-Abrufeinheit 121 aus.
  • Darüber hinaus gibt die Bestimmungseinheit 106 das Bestimmungsergebnis an eine Anzeigevorrichtung (nicht dargestellt), wie ein Display, aus, und bewirkt, dass die Anzeigevorrichtung das Bestimmungsergebnis anzeigt.
  • Nun wird die Hardware-Konfiguration der Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der ersten Ausführungsform beschrieben. Jede Funktion der Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge wird von einem Computer verwirklicht. 2 ist ein Hardware-Konfigurationsschema, das ein Beispiel für die Hardware-Konfiguration eines Computers darstellt, der die Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der ersten Ausführungsform implementiert.
  • Die in 2 dargestellte Hardware weist eine Verarbeitungsvorrichtung 10000, wie etwa eine zentrale Verarbeitungsvorrichtung (CPU), und eine Speichervorrichtung 10001, wie etwa einen Nur-Lese-Speicher (ROM), einen Speicher mit wahlfreiem Zugriff (RAM) und eine Festplatte auf.
  • Die Zeitreihendaten-Abrufeinheit 101, die Datenaufteilungseinheit 102, die Datensatz-Erzeugungseinheit 103, die Merkmalsmengen-Berechnungseinheit 104, die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 und die Bestimmungseinheit 106, die in 1 dargestellt sind, werden von der Verarbeitungsvorrichtung 10000 implementiert, die ein in der Speichervorrichtung 10001 gespeichertes Programm ausführt. Hierbei ist die obige Konfiguration nicht auf die von einer einzigen Verarbeitungsvorrichtung 10000 und einer einzigen Speichervorrichtung 10001 implementierte Konfiguration beschränkt und kann die Konfiguration sein, die von einer Mehrzahl von Verarbeitungsvorrichtungen 10000 und einer Mehrzahl von Speichervorrichtungen 10001 implementiert wird.
  • Darüber hinaus ist ein Verfahren zum Implementieren jeder einzelnen Funktion der Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge nicht auf die oben beschriebene Kombination aus Hardware und einem Programm begrenzt und kann durch ein einzelnes Stück Hardware, wie eine Schaltung mit hohem Integrationsgrad (Large Scale Integrated Circuit, LSI), in der ein Programm implementiert ist, in einer Verarbeitungsvorrichtung erreicht werden, oder manche Funktionen können durch zweckgebundene Hardware erreicht werden und manche können durch eine Kombination aus einer Verarbeitungsvorrichtung und einem Programm erreicht werden.
  • Die Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der ersten Ausführungsform ist konfiguriert wie oben beschrieben.
  • Nun wird die Arbeitsweise der Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der ersten Ausführungsform beschrieben.
  • 3 ist ein Flussdiagramm, das die Arbeitsweise der Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der ersten Ausführungsform darstellt.
  • Darüber hinaus entsprechen in der folgenden Beschreibung die Arbeit der Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge einem Verfahren zum Bestimmen der Zulänglichkeit einer Datenmenge, und ein Programm, das einen Computer veranlasst, die Arbeit der Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge auszuführen, entspricht einem Programm zur Bestimmung der Zulänglichkeit einer Datenmenge. Ferner entspricht die Arbeit des Lernmodell-Erzeugungssystems 1000 einem Verfahren zum Erzeugen eines trainierten Modells, und ein Programm, das einen Computer veranlasst, die Arbeit des Lernmodell-Erzeugungssystems 1000 auszuführen, entspricht einem Programm zur Erzeugung eines trainierten Modells. Außerdem entspricht die Arbeit der Zeitreihendaten-Abrufeinheit 101 einem Zeitreihendaten-Abrufschritt, entspricht die Arbeit der Datenaufteilungseinheit 102 einem Datenaufteilungsschritt, entspricht die Arbeit der Datensatz-Erzeugungseinheit 103 einem Datensatz-Erzeugungsschritt, entspricht die Arbeit der Merkmalsmengen-Berechnungseinheit 104 einem Merkmalsmengen-Berechnungsschritt, entspricht die Arbeit der Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 einem Wahrscheinlichkeitsverteilungs-Erzeugungsschritt, entspricht die Arbeit der Bestimmungseinheit 106 einem Bestimmungsschritt, entspricht die Arbeit der Lerndaten-Abrufeinheit 121 einem Lerndaten-Abrufschritt und entspricht die Arbeit der Einheit 122 zum Erzeugen eines trainierten Modells einem Schritt zum Erzeugen eines trainierten Modells.
  • Zuerst ruft die Zeitreihendaten-Abrufeinheit 101 in Schritt S1 zu bestimmende Zeitreihendaten aus der Zeitreihendaten-Speichereinheit 112 ab, wenn ein Benutzer der Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge eine Eingabeschnittstelle (nicht dargestellt) bedient, um eine Forderung nach einem Beginn der Verarbeitung zum Bestimmen der Zulänglichkeit von Zeitreihendaten einzugeben.
  • Dann teilt die Datenaufteilungseinheit 102 in Schritt S2 die von der Zeitreihendaten-Abrufeinheit 101 in Schritt S1 abgerufenen Zeitreihendaten in Daten-Teilketten auf. Ein konkretes Beispiel für eine Verarbeitung, bei der die Datenaufteilungseinheit 102 die Zeitreihendaten aufteilt, wird unter Bezugnahme auf 4 beschrieben. 4 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für eine Verarbeitung, bei der die Datenaufteilungseinheit 102 gemäß der ersten Ausführungsform Zeitreihendaten aufteilt.
  • Wie in 4 dargestellt, extrahiert die Datenaufteilungseinheit 102 W zeitlich kontinuierliche Daten als Daten-Teilkette aus den abgerufenen Zeitreihendaten. Hierbei wird W als Länge der Daten-Teilkette bezeichnet. Dann erzeugt die Datenaufteilungseinheit 102 nacheinander die Mehrzahl von Daten-Teilketten, während sie die Zeit des Zieles, an dem die Daten-Teilketten extrahiert werden, graduell verrückt. Die Länge, über die die Daten-Teilketten verrückt werden, wird als Verschiebungsbreite H bezeichnet. Die Verschiebungsbreite H wird anhand eines Kompromisses zwischen der Genauigkeit der Bestimmung der Zulänglichkeit der Datenmenge und dem Rechenaufwand entschieden. Hierbei ist als Beispiel H = W/2.
  • Unter erneuter Bezugnahme auf 3 wird die folgende Arbeit beschrieben.
  • Dann erfasst die Datensatz-Erzeugungseinheit 103 in Schritt S3 die in Schritt S2 extrahierten Daten-Teilketten und erzeugt eine Mehrzahl von Daten-Teilkettensätzen. Ein konkretes Beispiel für eine Verarbeitung, bei der die Datensatz-Erzeugungseinheit 103 einen Daten-Teilkettensatz erzeugt, wird unter Bezugnahme auf 5 beschrieben. 5 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für eine Verarbeitung, bei der die Datensatz-Erzeugungseinheit 103 gemäß der ersten Ausführungsform einen Daten-Teilkettensatz erzeugt.
  • Wie in 5 dargestellt, erzeugt die Datensatz-Erzeugungseinheit 103 Daten-Teilkettensätze a, b, c und so weiter aus der Mehrzahl von Daten-Teilketten. Darüber hinaus erzeugt die Datensatz-Erzeugungseinheit 103 eine erste Gruppe und eine zweite Gruppe, die eine Mehrzahl von Teilkettensätzen enthalten, wobei die Datenmenge der Teilkettensätze schrittweise vergrößert wird. Genauer bildet die Gruppenerzeugungseinheit 13, wie in 5 dargestellt ist, die erste Gruppe aus Daten-Teilkettensätzen a, b, c, d und e, deren Proportionen bzw. Anteile in Bezug auf die Gesamtheit der Daten-Teilketten 1/6, 2/6, 3/6, 4/6 und 5/6 sind, und bildet die zweite Gruppe aus Daten-Teilkettensätzen b, c, d, e und f, deren Proportionen in Bezug auf die Gesamtheit der Daten-Teilketten 2/6, 3/6, 4/6, 5/6 und 6/6 sind.
  • Unter erneuter Bezugnahme auf 3 wird die folgende Arbeit beschrieben.
  • Dann berechnet die Merkmalsmengen-Berechnungseinheit 104 in Schritt S4 eine Mehrzahl von Merkmalsmengen für jeden Daten-Teilkettensatz. Wird zum Beispiel angenomen, dass der Daten-Teilkettensatz a 10 Daten-Teilketten einschließt, dann werden in Bezug auf a durch Berechnen der Merkmalsmenge für jede Daten-Teilkette 10 Merkmalsmengen erhalten.
  • Dann berechnet die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 in Schritt S5 die Wahrscheinlichkeitsverteilung der Merkmalsmenge für jeden Daten-Teilkettensatz. Ein konkretes Beispiel für die von der Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 erzeugte Wahrscheinlichkeitsverteilung wird unter Bezugnahme auf 6 beschrieben. 6 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für eine Verarbeitung, bei der die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 gemäß der ersten Ausführungsform eine Wahrscheinlichkeitsverteilung erzeugt.
  • Wie in 6 dargestellt ist, erzeugt die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 eine Wahrscheinlichkeitsverteilung, die die Beziehung zwischen einer Wahrscheinlichkeitsdichte y und einer Merkmalsmenge x darstellt, für jeden von den Daten-Teilkettensätzen a, b, c, d, e und f.
  • Unter erneuter Bezugnahme auf 3 wird die folgende Operation beschrieben.
  • Im Schritt S6 berechnet die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 eine Statistik der Merkmalsmenge aus der Wahrscheinlichkeitsverteilung des individuellen Daten-Teilkettensatzes.
  • Ein konkretes Beispiel für eine Verarbeitung, bei der die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 die Statistik berechnet, wird unter Bezugnahme auf 7 beschrieben. 7 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für eine Verarbeitung, bei der die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 gemäß der ersten Ausführungsform eine Statistik berechnet.
  • Zuerst berechnet die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105, wie in 7 dargestellt ist, eine Statistik durch Vergleichen der Wahrscheinlichkeitsverteilungen von a in der ersten Gruppe und b in der zweiten Gruppe und berechnet dann eine Statistik durch Vergleichen der Wahrscheinlichkeitsverteilungen von b in der ersten Gruppe und c in der zweiten Gruppe. Auf diese Weise vergleicht die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 a, b, c, d und e der ersten Gruppe mit b, c, d, e und f der zweiten Gruppe und erhält fünf Statistiken.
  • Die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 105 berechnet beispielsweise einen Absolutwert einer Differenz zwischen einem Modus m1 der Merkmalsmenge der ersten Gruppe und einem Modus m2 der Merkmalsmenge der zweiten Gruppe als Statistik des Vergleichsergebnisses der Wahrscheinlichkeitsverteilung. Alternativ dazu kann unter der Annahme, dass die Wahrscheinlichkeitsdichte der ersten Gruppe y1 (x) ist, die Wahrscheinlichkeitsdichte der zweiten Gruppe y2 (x) ist, der Mindestwert von x min ist und der Höchstwert von x max ist, die Statistik durch die folgende Gleichung berechnet werden. x = m i n m a x ( y 1 ( x ) y 2 ( x ) ) 2
    Figure DE112020007110T5_0001
  • Unter erneuter Bezugnahme auf 3 wird die folgende Operation beschrieben.
  • In Schritt S7 bestimmt die Bestimmungseinheit 106, ob die in Schritt S5 erzeugte Wahrscheinlichkeitsverteilung konvergent geworden ist. Hierbei bestimmt in der ersten Ausführungsform die Bestimmungseinheit 106, ob die Wahrscheinlichkeitsverteilung konvergent geworden ist, durch Bestimmen, ob die in Schritt S6 berechnete Statistik konvergent geworden ist.
  • Genauer vergleicht die Bestimmungseinheit 106 die Statistik gemäß dem Vergleichsergebnis des Daten-Teilkettensatzes, der eine kleine Datenmenge aufweist, beispielsweise a und b, mit der Statistik gemäß dem Vergleichsergebnis des Daten-Teilkettensatzes, der eine große Datenmenge aufweist, beispielsweise e und f, und bestimmt, ob oder ob nicht eine vorgegebene Bezugsbedingung oder eine dynamisch entschiedene Bezugsbedingung erfüllt ist, wie etwa, dass die Statistik des Daten-Teilkettensatzes, der eine große Datenmenge aufweist, näher an 0 liegt, die Differenz der Statistik graduell kleiner wird und die Statistik kleiner ist als der auf Basis der Datenmenge des Daten-Teilkettensatzes erwartete Wert. Falls die Bezugsbedingung erfüllt ist, bestimmt die Bestimmungseinheit 106 dann, dass die Menge der Zeitreihendaten ausreicht.
  • Da der erwartete Wert auf der Datenmenge des Daten-Teilkettensatzes basiert, kann ein Verfahren beispielsweise so sein, dass, wenn die Zahl des Daten-Teilkettensatzes, der in dem kleineren Daten-Teilkettensatz des Vergleichs enthalten ist, auf n gesetzt ist, ein Wert, wenn n 1 ist, auf A, A/n und dergleichen gesetzt wird. Der Grund dafür ist, dass unter der Annahme, dass der Einfluss und die Datenmenge eine lineare Beziehung aufweisen, in einem Fall, in dem die Datenmenge das n-Fache wird, der Einfluss als 1/n betrachtet wird, wenn die gleiche Menge an Daten hinzugefügt wird. Der erwartete Wert ist nicht auf A/n beschränkt und kann A/(V n), A/(n ^ 2) oder dergleichen sein.
  • Auch wenn die Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge die Oeration wie oben beschrieben beendet, kann die Bestimmungseinheit 106 das Bestimmungsergebnis an die Anzeigevorrichtung senden, um diese das Bestimmungsergebnis anzeigen zu lassen, oder das Bestimmungsergebnis an die Lernvorrichtung 120 senden, um diese das Lernmodell lernen zu lassen.
  • Genauer ruft die Lerndaten-Abrufeinheit 121 die Zeitreihendaten als die Lerndaten aus der Zeitreihendaten-Speichereinheit 112 ab, falls die Bestimmungseinheit 106 bestimmt, dass die Wahrscheinlichkeitsverteilung konvergent geworden ist, das heißt, falls bestimmt wird, dass die Datenmenge ausreicht. Hierbei sind die Lerndaten, die von der Lerndaten-Abrufeinheit 121 abgerufen werden, dieselben Daten, die von der Zeitreihendaten-Abrufeinheit 101 abgerufen werden und die von der Bestimmungseinheit 106 verwendet werden, um eine Bestimmung zu treffen. Außerdem können vorab ausgeschlossene Daten hinzugefügt werden oder zusätzliche Daten abgerufen werden, falls bestimmt wird, dass die Datenmenge nicht ausreicht.
  • Dann führt die Einheit 122 zur Erzeugung eines trainierten Modells ein Lernen des Lernmodells unter Verwendung der von der Lerndaten-Abrufeinheit 121 abgerufenen Daten durch und erzeugt ein trainiertes Modell.
  • Mit der obigen Arbeitsweise kann die Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der ersten Ausführungsform die Zulänglichkeit der Lerndaten mit größerer Genauigkeit nicht nur auf Basis der Anzahl der Muster der Merkmalsmenge, sondern auch auf Basis der Wahrscheinlichkeitsverteilung der Merkmalsmenge bestimmen.
  • Da das Lernmodell-Erzeugungssystem 1000 gemäß der ersten Ausführungsform ein Lernen des Lernmodells dann durchführt, wenn die Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge bestimmt, dass die Datenmenge ausreicht, ist es darüber hinaus möglich, das Risiko für die Erzeugung eines trainierten Modells, bei dem die Datenmenge nicht ausreicht und keine geeignete Inferenz durchgeführt werden kann oder ein wiederholtes Lernen notwendig ist, zu senken.
  • Darüber hinaus erzeugt die Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der ersten Ausführungsform den zweiten Daten-Teilkettensatz durch Hinzufügen der Daten-Teilkette, die nicht in dem ersten Daten-Teilkettensatz enthalten ist, zu dem ersten Daten-Teilkettensatz. Das heißt, die Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge erzeugt einen bestimmten Daten-Teilkettensatz und vergleicht die Wahrscheinlichkeitsverteilungen der Merkmalsmengen der jeweiligen Daten-Teilkettensätze, um die Zulänglichkeit der Datenmenge zu bestimmen. Kurz gesagt wird im Vergleich zu der dritten Ausführungsform und der vierten Ausführungsform, die weiter unten beschrieben werden, in der ersten Ausführungsform der Abschnitt, der für die Erzeugung der Wahrscheinlichkeitsverteilung genommen wird, erweitert, was ein einfaches Verfahren ist. Daher wird bewirkt, dass eine Bestimmung mit einem geringen Rechenaufwand getroffen werden kann.
  • Ferner erzeugt die Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der ersten Ausführungsform eine erste Gruppe, die eine Mehrzahl von Daten-Teilkettensätzen einschließt, und eine zweite Gruppe, die die gleiche Anzahl von Daten-Teilkettensätzen wie die erste Gruppe einschließt und die mindestens einen nicht in der ersten Gruppe enthaltenen Daten-Teilkettensatz einschließt, ein Statistikrechner berechnet eine Ähnlichkeit zwischen der Wahrscheinlichkeitsverteilung des in der ersten Gruppe enthaltenen Daten-Teilkettensatzes und der Wahrscheinlichkeitsverteilung des in der zweiten Gruppe enthaltenen Daten-Teilkettensatzes und die Bestimmungseinheit bestimmt, dass die Wahrscheinlichkeitsverteilung konvergent ist, wenn die Ähnlichkeit konvergent ist, so dass als Wirkung erhalten werden kann, dass die Ordnungsbeziehung leicht zu verstehen ist, die Sichtbarkeit gut ist und die Bestimmung der Zulänglichkeit der Datenmenge leicht zu verstehen ist.
  • Auch wenn die Beschreibung anhand der Gruppe gemacht wurde, kann die ähnliche Verarbeitung durchgeführt werden, ohne die Gruppe explizit zu bilden. Das heißt, der Vergleich zwischen der Wahrscheinlichkeitsdichte der Merkmalsmenge des Daten-Teilkettensatzes a und der von b und der Vergleich zwischen der von b und der von c können wiederholt werden.
  • Darüber hinaus berechnet die Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der ersten Ausführungsform die Merkmalsmenge für jede Daten-Teilkette, und daher ist es im Vergleich zu der zweiten Ausführungsform, die weiter unten beschrieben wird, möglich, eine Bestimmung auf der Basis des Merkmals durchzuführen, wenn jede einzelne Daten-Teilketten an sich anstelle der Beziehung zwischen den Daten-Teilketten betrachtet wird. Somit kann als Wirkung erreicht werden, dass eine Bestimmung mit hoher Genauigkeit durchgeführt werden kann, wenn das Merkmal durchaus in jeder Daten-Teilkette auftaucht.
  • Zweite Ausführungsform
  • Nun wird ein Lernmodell-Erzeugungssystem 2000 gemäß einer zweiten Ausführungsform beschrieben.
  • In der ersten Ausführungsform berechnet die in der Vorrichtung 100 zur Bestimmung der Zulänglichkeit einer Datenmenge enthaltene Merkmalsmengen-Berechnungseinheit 104 die Merkmalsmenge jeder Daten-Teilkette. In der vorliegenden Ausführungsform wird ein Beispiel beschrieben, in dem die Merkmalsmengen-Berechnungseinheit 204 eine Merkmalsmenge aus einem Vergleichspaar von Daten-Teilketten berechnet, das heißt sie berechnet eine Merkmalsmenge, die durch Vergleichen jeder Daten-Teilkette mit einer anderen Daten-Teilkette erhalten wird. Im Folgenden werden hauptsächlich Unterschiede zur ersten Ausführungsform beschrieben.
  • 8 ist ein Konfigurationsschema, das die Konfiguration eines Lernmodell-Erzeugungssystems 2000 gemäß der zweiten Ausführungsform darstellt. Das Lernmodell-Erzeugungssystem 2000 weist eine Vorrichtung 200 zur Bestimmung der Zulänglichkeit einer Datenmenge, eine Zeitreihendaten-Verwaltungsvorrichtung 210 und eine Lernvorrichtung 220 auf.
  • Ähnlich wie in der ersten Ausführungsform weist die Zeitreihendaten-Verwaltungsvorrichtung 210 eine Zeitreihendaten-Erfassungseinheit 211 und eine Zeitreihendaten-Speichereinheit 212 auf. Darüber hinaus weist die Lernvorrichtung 220 ähnlich wie in der ersten Ausführungsform auch eine Lerndaten-Abrufeinheit 221 und eine Einheit 222 zur Erzeugung eines trainierten Modells auf.
  • Die Vorrichtung 200 zur Bestimmung der Zulänglichkeit einer Datenmenge weist eine Zeitreihendaten-Abrufeinheit 201, eine Datenaufteilungseinheit 202, eine Datensatz-Erzeugungseinheit 203, eine Merkmalsmengen-Berechnungseinheit 204, eine Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 205 und eine Bestimmungseinheit 206 auf.
  • In der zweiten Ausführungsform wählt die Merkmalsmengen-Berechnungseinheit 204 zwei Daten-Teilketten, die in jedem Daten-Teilkettensatz enthalten sind, als Vergleichspaar aus und berechnet die Merkmalsmenge des ausgewählten Vergleichspaars. Das heißt, die Merkmalsmengen-Berechnungseinheit 240 berechnet einen Vergleichswert zwischen der ersten Daten-Teilkette und der zweiten Daten-Teilkette als Merkmalsmenge. Genauer entspricht die Merkmalsmenge des Vergleichspaars einer Merkmalsmenge, die einen Grad der Differenz zwischen Teilketten angibt, wie etwa einen euklidischen Abstand, falls die Teilkette als Punkt im Raum betrachtet wird, und einen Winkel, falls die Teilkette als Vektor betrachtet wird.
  • In der zweiten Ausführungsform wiederholt die Merkmalsmengen-Berechnungseinheit 204 das Auswählen des Vergleichspaars und das Berechnen der Merkmalsmenge, um die Merkmalsmengen der Mehrzahl von Vergleichspaaren zu berechnen.
  • In der zweiten Ausführungsform erzeugt die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 205 die Wahrscheinlichkeitsverteilung der Merkmalsmenge von jedem der Daten-Teilkettensätze jeder Gruppe auf Basis der von der Merkmalsmengen-Berechnungseinheit 204 berechneten Merkmalsmengen der Mehrzahl von Vergleichspaaren.
  • Ein konkretes Beispiel für eine Verarbeitung der Merkmalsmengen-Berechnungseinheit 204 wird unter Bezugnahme auf 9 beschrieben.
  • 9 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für die Merkmalsmengen-Berechnungseinheit 240 gemäß der zweiten Ausführungsform.
  • Wie in 9 dargestellt ist, wählt die Merkmalsmengen-Berechnungseinheit 240 die führende Daten-Teilkette und die zweite Daten-Teilkette des individuellen Daten-Teilkettensatzes jeder Gruppe als Vergleichspaar aus und berechnet die Merkmalsmenge. Dann wählt die Merkmalsmengen-Berechnungseinheit 240 die führende Daten-Teilkette und die dritte Daten-Teilkette als Vergleichspaar aus und berechnet die Merkmalsmenge. Dies wird wiederholt, um die Merkmalsmengen der extrahierten Vergleichspaare zu berechnen.
  • Es ist zu beachten, dass in einem Fall, bei dem der kürzeste Abstand, der von der Nearest-Neighbor-Suche berechnet wird, als die Merkmalsmenge gesetzt wird, die Merkmalsmengen-Berechnungseinheit 240 die Nearest-Neighbor-Suche unter Ausschluss desselben Datenteils in dem individuellen Daten-Teilkettensatz durchführt. Ferner kann die Merkmalsmengen-Berechnungseinheit 14 einen k-Neighbor-Abstand, der von einer k-Neighbor-Suche berechnet wird, als die Merkmalsmenge verwenden.
  • Andere Komponenten und Operationen sind die gleichen wie in der ersten Ausführungsform, und somit wird auf ihre Beschreibung verzichtet.
  • Die Vorrichtung 200 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der zweiten Ausführungsform berechnet einen Vergleichswert zwischen der ersten Daten-Teilkette und der zweiten Daten-Teilkette als Merkmalsmenge. Das heißt, die Vorrichtung 200 zur Bestimmung der Zulänglichkeit einer Datenmenge bestimmt die Zulänglichkeit der Datenmenge auf Basis der Merkmalsmenge, der durch Vergleichen der Daten-Teilketten erhalten wird. Dadurch ist es möglich, dass eine Bestimmung Zeitreihendaten mit unterschiedlichen Eigenschaften flexibel entspricht.
  • Dritte Ausführungsform
  • Nun wird eine Vorrichtung 300 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß einer dritten Ausführungsform beschrieben.
  • Wie in 10 dargestellt, wird in der ersten Ausführungsform und der zweiten Ausführungsform angenommen, dass ein Daten-Teilkettensatz schrittweise größer wird und einen vorangehenden Daten-Teilkettensatz einschließt, aber in der dritten Ausführungsform wird ein Beispiel beschrieben, in dem ein Daten-Teilkettensatz anhand eines anderen Verfahrens erzeugt wird. Im Folgenden werden hauptsächlich Unterschiede zur ersten Ausführungsform und zur zweiten Ausführungsform beschrieben.
  • 11 ist ein Konfigurationsschema, das die Konfiguration eines Lernmodell-Erzeugungssystems 3000 gemäß der dritten Ausführungsform darstellt. Das Lernmodell-Erzeugungssystem 3000 weist eine Vorrichtung 300 zur Bestimmung der Zulänglichkeit einer Datenmenge, eine Zeitreihendaten-Verwaltungsvorrichtung 310 und eine Lernvorrichtung 320 auf.
  • Ähnlich wie in den anderen Ausführungsformen weist die Zeitreihendaten-Verwaltungsvorrichtung 310 eine Zeitreihendaten-Erfassungseinheit 311 und eine Zeitreihendaten-Speichereinheit 312 auf. Darüber hinaus weist die Lernvorrichtung 320 ähnlich wie in den anderen Ausführungsformen auch eine Lerndaten-Abrufeinheit 321 und eine Einheit 322 zur Erzeugung eines trainierten Modells auf.
  • Die Vorrichtung 300 zur Bestimmung der Zulänglichkeit einer Datenmenge weist eine Zeitreihendaten-Abrufeinheit 301, eine Datenaufteilungseinheit 302, eine Datensatz-Erzeugungseinheit 303, eine Merkmalsmengen-Berechnungseinheit 304, eine Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 305 und eine Bestimmungseinheit 306 auf.
  • In der dritten Ausführungsform erzeugt die Datensatz-Erzeugungseinheit 303 einen ersten Daten-Teilkettensatz und einen zweiten Daten-Teilkettensatz, der keine Daten-Teilketten einschließt, die er mit dem ersten Daten-Teilkettensatz gemeinsam hat. Ferner erzeugt die Datensatz-Erzeugungseinheit 303 einen dritten Daten-Teilkettensatz, der durch Kombinieren des ersten Daten-Teilkettensatzes und mindestens einer in dem zweiten Daten-Teilkettensatz enthaltenen Daten-Teilkette erhalten wird. Das heißt, in der dritten Ausführungsform wiederholt die Datensatz-Erzeugungseinheit 303 die Schaffung des Daten-Teilkettensatzes, um die Mehrzahl von Daten-Teilketten in zwei Daten-Teilkettensätze aufzuteilen, während sie die Anzahl der Daten-Teilketten erhöht.
  • Darüber hinaus berechnet in der dritten Ausführungsform die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 305 einen Durchschnittswert der Merkmalsmengen auf der Basis der Wahrscheinlichkeitsverteilung, und die Bestimmungseinheit 306 bestimmt, dass die Wahrscheinlichkeitsverteilung konvergent geworden ist, falls der Durchschnittswert in einem vorgegebenen Bereich liegt. Hierbei muss der Betrag, der von der Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 305 und der Bestimmungseinheit 306 verwendet wird, kein Durchschnittswert sein und kann beispielsweise ein Mittelwert, ein unter Ausschluss von Ausreißern erhaltener Durchschnittswert oder dergleichen sein.
  • Ein konkretes Beispiel für eine Verarbeitung der Vorrichtung 300 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der dritten Ausführungsform wird unter Bezugnahme auf 12 beschrieben.
  • 12 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für eine Verarbeitung der Vorrichtung 300 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der dritten Ausführungsform.
  • Wie in 12 dargestellt, erzeugt die Datensatz-Erzeugungseinheit 303 eine Kombination aus einem bestimmten Daten-Teilkettensatz und einem Daten-Teilkettensatz, der den bestimmten Daten-Teilkettensatz nicht überlappt. Letzterer wird als zusätzlicher Daten-Teilkettensatz bezeichnet.
  • Wie in 12 dargestellt, erzeugt die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 305 außerdem die Wahrscheinlichkeitsverteilung der Merkmalsmenge für sowohl den Daten-Teilkettensatz als auch den zusätzlichen Daten-Teilkettensatz. Dann vergleicht die Bestimmungseinheit 306 die Wahrscheinlichkeitsverteilung des Daten-Teilkettensatzes mit der Wahrscheinlichkeitsverteilung des zusätzlichen Daten-Teilkettensatzes. Zum Beispiel werden zuerst a und a' in der Zeichnung verglichen, und dann werden b und b' verglichen. Falls die Verteilung der Merkmalsmenge des zusätzlichen Daten-Teilkettensatzes in dem Bereich der Verteilung der Merkmalsmenge des entsprechenden Daten-Teilkettensatzes liegt, wird dann entschieden, dass die Datenmenge ausreicht. Genauer wird in einem Verfahren entschieden, dass es ausreicht, wenn der Durchschnitt der Merkmalsmengen des zusätzlichen Daten-Teilkettensatzes g' in dem Abschnitt Durchschnitt ± Standardabweichung der Merkmalsmengen des Daten-Teilkettensatzes g liegt. Die Entscheidung kann zusätzlich zu dem Durchschnitt der Merkmalsmengen anhand eines Höchstwerts, eines Mindestwerts, eines Quartilpunkts oder dergleichen getroffen werden.
  • Es ist zu beachten, dass in 12 der Daten-Teilkettensatz, der durch Kombinieren von a und a' erhalten wird, der nächste Daten-Teilkettensatz b ist, dies aber keine Beschränkung darstellt. a und a' können dem gesamten b und einem Teil von b'entsprechen oder a und a' können einem Teil von b entsprechen.
  • Die Vorrichtung 300 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der dritten Ausführungsform erzeugt einen ersten Daten-Teilkettensatz und einen zweiten Daten-Teilkettensatz, der keine Daten-Teilketten einschließt, die er mit dem ersten Daten-Teilkettensatz gemeinsam hat, und erzeugt ferner einen dritten Daten-Teilkettensatz, der durch Kombinieren des ersten Daten-Teilkettensatzes und mindestens einer in dem zweiten Daten-Teilkettensatz enthaltenen Daten-Teilkette erhalten wird. Das heißt, durch Wiederholen der Operation des Vergleichens der Wahrscheinlichkeitsverteilungen eines bestimmten Daten-Teilkettensatzes (eines ersten Daten-Teilkettensatzes) und eines zusätzlichen Daten-Teilkettensatzes (eines zweiten Daten-Teilkettensatzes) und dann Vergleichen der Wahrscheinlichkeitsverteilungen eines Daten-Teilkettensatzes (eines dritten Daten-Teilkettensatzes), der durch Kombinieren des Daten-Teilkettensatzes und des zusätzlichen Daten-Teilkettensatzes erhalten wird, mit der Wahrscheinlichkeitsverteilung eines neuen zusätzlichen Daten-Teilkettensatzes (eines vierten Daten-Teilkettensatzes) wird die Zulänglichkeit der Datenmenge bestimmt.
  • Wie oben beschrieben können dadurch, dass keine gemeinsamen Daten-Teilketten in den zu vergleichenden Daten-Teilkettensatz einbezogen werden, die Eigenschaften der Zeitreihendaten detaillierter erfasst werden, und es kann bewirkt werden, dass die Zulänglichkeit der Datenmenge exakter bestimmt wird. Außerdem wird im Vergleich zu der ersten und der zweiten Ausführungsform auf die Verteilung in dem Daten-Teilkettensatz in einem engeren Zeitraum Bezug genommen, die Eigenschaften der Zeitreihendaten können detaillierter erfasst werden und die Zulänglichkeit der Datenmenge kann genauer bestimmt werden.
  • Außerdem kann in Kombination mit der zweiten Ausführungsform die Merkmalsmengen-Berechnungseinheit 240 die Merkmalsmenge aus dem Vergleichspaar der Daten-Teilketten berechnen.
  • Vierte Ausführungsform
  • Nun wird eine Vorrichtung 400 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß einer vierten Ausführungsform beschrieben.
  • Es wird eine Ausführungsform beschrieben, in der ein Daten-Teilkettensatz anhand eines Verfahrens erzeugt wird, das von den Vorrichtungen zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der ersten bis dritten Ausführungsform verschieden ist.
  • Im Folgenden werden hauptsächlich Unterschiede zu den anderen Ausführungsformen beschrieben.
  • 13 ist ein Konfigurationsschema, das die Konfiguration eines Lernmodell-Erzeugungssystems 4000 gemäß der vierten Ausführungsform darstellt. Das Lernmodell-Erzeugungssystem 4000 weist eine Vorrichtung 400 zur Bestimmung der Zulänglichkeit einer Datenmenge, eine Zeitreihendaten-Verwaltungsvorrichtung 410 und eine Lernvorrichtung 420 auf.
  • Ähnlich wie in den anderen Ausführungsformen weist die Zeitreihendaten-Verwaltungsvorrichtung 410 eine Zeitreihendaten-Erfassungseinheit 411 und eine Zeitreihendaten-Speichereinheit 412 auf. Darüber hinaus weist die Lernvorrichtung 420 ähnlich wie in den anderen Ausführungsformen auch eine Lerndaten-Abrufeinheit 421 und eine Einheit 422 zur Erzeugung eines trainierten Modells auf.
  • Die Vorrichtung 400 zur Bestimmung der Zulänglichkeit einer Datenmenge weist eine Zeitreihendaten-Abrufeinheit 401, eine Datenaufteilungseinheit 402, eine Datensatz-Erzeugungseinheit 403, eine Merkmalsmengen-Berechnungseinheit 404, eine Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 405 und eine Bestimmungseinheit 406 auf.
  • In der vierten Ausführungsform erzeugt die Datensatz-Erzeugungseinheit 403 einen ersten Daten-Teilkettensatz und einen zweiten Daten-Teilkettensatz, der keine Daten-Teilketten einschließt, die er mit dem ersten Daten-Teilkettensatz gemeinsam hat. Darüber hinaus erzeugt die Datensatz-Erzeugungseinheit 403 einen dritten Daten-Teilkettensatz, der keine Daten-Teilketten enthält, die er mit dem ersten Daten-Teilkettensatz und dem zweiten Daten-Teilkettensatz gemeinsam hat.
  • Auf diese Weise erzeugt die Datensatz-Erzeugungseinheit 403 wiederholt einen Daten-Teilkettensatz, der keine Daten-Teilketten enthält, die er mit anderen Daten-Teilkettensätzen gemeinsam hat.
  • Darüber hinaus berechnet in der vierten Ausführungsform die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 405 einen Durchschnittswert der Merkmalsmengen auf der Basis der Wahrscheinlichkeitsverteilung, und die Bestimmungseinheit 406 bestimmt, dass die Wahrscheinlichkeitsverteilung konvergent ist, falls der Durchschnittswert in einem vorgegebenen Bereich liegt. Ähnlich wie in der dritten Ausführungsform muss der Betrag, der von der Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 405 und der Bestimmungseinheit 406 verwendet wird, kein Durchschnittswert sein und kann beispielsweise ein Mittelwert, ein unter Ausschluss von Ausreißern erhaltener Durchschnittswert oder dergleichen sein.
  • Ein konkretes Beispiel für eine Verarbeitung der Vorrichtung 400 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der vierten Ausführungsform wird unter Bezugnahme auf 14 beschrieben.
  • 14 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für eine Verarbeitung der Vorrichtung 400 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der vierten Ausführungsform.
  • Wie in 14 dargestellt ist, erzeugt die Datensatz-Erzeugungseinheit 403 eine Mehrzahl von Daten-Teilkettensätzen, die keine gemeinsamen Daten-Teilketten einschließen. Dann vergleicht die Bestimmungseinheit 406 die Wahrscheinlichkeitsverteilungen der Merkmalsmengen der Mehrzahl von Daten-Teilkettensätzen mit denen von einem oder mehreren Daten-Teilkettensätzen. Zum Beispiel werden a, b, c, d, e und f mit g verglichen, und dann werden a, b, c, d, e, f und g mit h verglichen. Falls zum Beispiel die Wahrscheinlichkeitsverteilung der Merkmalsmenge eines neuen Daten-Teilkettensatzes in der Variation der bisherigen Verteilung der Merkmalsmengen des Daten-Teilkettensatzes liegt, wird entschieden, dass die Datenmenge ausreicht. Genauer wird entschieden, dass es ausreicht, wenn der Durchschnitt der Merkmalsmengen von h in dem N-mal-Abschnitt von Durchschnitt ± Standardabweichung von „Durchschnitt der Merkmalsmengen“ von a bis g liegt. Die Entscheidung kann zusätzlich zu dem Durchschnitt der Merkmalsmengen anhand eines Höchstwerts, eines Mindestwerts, eines Quartilpunkts oder dergleichen getroffen werden.
  • Die Vorrichtung 400 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der vierten Ausführungsform erzeugt einen ersten Daten-Teilkettensatz und einen zweiten Daten-Teilkettensatz, der keine Daten-Teilketten einschließt, die er mit dem ersten Daten-Teilkettensatz gemeinsam hat, und erzeugt ferner einen dritten Daten-Teilkettensatz, der keine Daten-Teilketten einschließt, die er mit dem ersten Daten-Teilkettensatz und dem zweiten Daten-Teilkettensatz gemeinsam hat. Das heißt, die Vorrichtung 400 zur Bestimmung der Zulänglichkeit einer Datenmenge bestimmt die Zulänglichkeit der Datenmenge durch wiederholtes Erzeugen eines Daten-Teilkettensatzes, der keine gemeinsamen Daten-Teilketten einschließt, und durch Vergleichen der Wahrscheinlichkeitsverteilungen der Merkmalsmengen der jeweiligen Daten-Teilkettensätze.
  • Wie oben beschrieben können dadurch, dass keine gemeinsamen Daten-Teilketten in den zu vergleichenden Daten-Teilkettensatz einbezogen werden, die Eigenschaften der Zeitreihendaten detaillierter erfasst werden, und es kann bewirkt werden, dass die Zulänglichkeit der Datenmenge exakter bestimmt wird. Außerdem wird im Vergleich mit der Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der dritten Ausführungsform die Datenmenge ferner in Daten-Teilkettensätze in einem kurzen Zeitraum aufgeteilt und es wird auf die jeweiligen Verteilungen Bezug genommen, und daher können die Eigenschaften detaillierter erfasst werden und es kann eine exaktere Bestimmung durchgeführt werden.
  • Außerdem kann in Kombination mit der zweiten Ausführungsform die Merkmalsmengen-Berechnungseinheit 240 die Merkmalsmenge aus dem Vergleichspaar der Daten-Teilketten berechnen.
  • Fünfte Ausführungsform
  • Nun wird eine Vorrichtung 500 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß einer fünften Ausführungsform beschrieben.
  • 15 ist ein Konfigurationsschema, das die Konfiguration eines Lernmodell-Erzeugungssystems 5000 gemäß der fünften Ausführungsform darstellt. Das Lernmodell-Erzeugungssystem 5000 weist eine Vorrichtung 500 zur Bestimmung der Zulänglichkeit einer Datenmenge, eine Zeitreihendaten-Verwaltungsvorrichtung 510 und eine Lernvorrichtung 520 auf.
  • Ähnlich wie in anderen Ausführungsformen weist die Zeitreihendaten-Verwaltungsvorrichtung 510 eine Zeitreihendaten-Erfassungseinheit 511 und eine Zeitreihendaten-Speichereinheit 512 auf. Darüber hinaus weist die Lernvorrichtung 520 ähnlich wie in den anderen Ausführungsformen auch eine Lerndaten-Abrufeinheit 521 und eine Einheit 522 zur Erzeugung eines trainierten Modells auf.
  • Die Vorrichtung 500 zur Bestimmung der Zulänglichkeit einer Datenmenge weist eine Zeitreihendaten-Abrufeinheit 501, eine Datenaufteilungseinheit 502, eine Datensatz-Erzeugungseinheit 503, eine Merkmalsmengen-Berechnungseinheit 504, eine Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 505 und eine Bestimmungseinheit 506 auf.
  • Auch wenn der Modus der Bestimmung, ob die Daten ausreichen oder nicht, bisher auf der Basis eines einzigen Vergleichsergebnisses beschrieben wurde, bestimmt die Bestimmungseinheit 506 gemäß der fünften Ausführungsform durch Kombinieren einer Mehrzahl von Vergleichsergebnissen, dass die Daten ausreichen. Zum Beispiel kann bestimmt werden, dass es ausreicht, wenn die Vergleichsergebnisse die Bezugsbedingung M-mal in einer Reihe erfüllen, oder es kann bestimmt werden, dass es ausreicht, wenn die Vergleichsergebnisse die Bezugsbedingung P-mal oder öfter in der letzten M-mal-Folge erfüllen.
  • Da die Vorrichtung 500 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der fünften Ausführungsform die Bestimmung auf Basis einer Folge von Vergleichsergebnissen statt eines einzigen trifft, ist das Risiko für eine falsche Bestimmung verringert und die Bestimmungsgenauigkeit ist verbessert.
  • Die fünfte Ausführungsform kann nach Bedarf mit der ersten bis vierten Ausführungsform kombiniert werden.
  • Sechste Ausführungsform
  • Nun wird eine sechste Ausführungsform beschrieben.
  • In der ersten bis fünften Ausführungsform wird ein einziger Ausgangspunkt verwendet, wenn die Daten-Teilketten und der Daten-Teilkettensatz abgerufen werden, aber in der sechsten Ausführungsform werden die Daten-Teilketten und der Daten-Teilkettensatz auf der Basis einer Mehrzahl von Ausgangspunkten erzeugt. Im Folgenden werden hauptsächlich Unterschiede der ersten bis zur fünften Ausführungsform beschrieben.
  • 16 ist ein Konfigurationsschema, das die Konfiguration eines Lernmodell-Erzeugungssystems 6000 gemäß der sechsten Ausführungsform darstellt. Das Lernmodell-Erzeugungssystem 6000 weist eine Vorrichtung 600 zur Bestimmung der Zulänglichkeit einer Datenmenge, eine Zeitreihendaten-Verwaltungsvorrichtung 610 und eine Lernvorrichtung 620 auf.
  • Ähnlich wie in anderen Ausführungsformen weist die Zeitreihendaten-Verwaltungsvorrichtung 610 eine Zeitreihendaten-Erfassungseinheit 611 und eine Zeitreihendaten-Speichereinheit 612 auf. Darüber hinaus weist die Lernvorrichtung 620 ähnlich wie in den anderen Ausführungsformen auch eine Lerndaten-Abrufeinheit 621 und eine Einheit 622 zur Erzeugung eines trainierten Modells auf.
  • Die Vorrichtung 600 zur Bestimmung der Zulänglichkeit einer Datenmenge weist eine Zeitreihendaten-Abrufeinheit 601, eine Datenaufteilungseinheit 602, eine Datensatz-Erzeugungseinheit 603, eine Merkmalsmengen-Berechnungseinheit 604, eine Wahrscheinlichkeitsverteilungs-Erzeugungseinheit 605 und eine Bestimmungseinheit 606 auf.
  • In der sechsten Ausführungsform erzeugt die Datensatz-Erzeugungseinheit 603 einen ersten Satz mit einer Mehrzahl von Daten-Teilkettensätzen aus Zeitreihendaten, die von einer ersten Zeit bis zu einer zweiten Zeit enthalten sind, und erzeugt einen zweiten Satz mit einer Mehrzahl von Daten-Teilkettensätzen aus Zeitreihendaten, die von einer dritten Zeit bis zu einer vierten Zeit enthalten sind. Hierbei ist der Satz eine Menge, die eine Mehrzahl von Daten-Teilkettensätzen aufweist, und ist eine Einheit, mit der die Bestimmungseinheit 606 bestimmen kann, ob die Bezugsbedingung erfüllt ist. Der erste Satz ist eine Sammlung von Daten-Teilkettensätzen auf der Basis eines ersten Ausgangspunkts, und der zweite Satz ist eine Sammlung von Daten-Teilkettensätzen auf der Basis eines zweiten Ausgangspunkts. Hierbei ist die erste Zeit ein erster Ausgangspunkt und die dritte Zeit ist ein zweiter Ausgangspunkt. Darüber hinaus sind die Position der zweiten Zeit, das heißt der Endpunkt des ersten Satzes, und die Position der dritten Zeit, das heißt der Endpunkt des zweiten Satzes, arbiträr, und was die Ordnungsbeziehung zwischen der zweiten Zeit (dem ersten Endpunkt) und der dritten Zeit (dem zweiten Endpunkt) betrifft, so kann jede die vorangehende sein, aber es wird eine Situation betrachtet, in der die dritte Zeit (der zweite Ausgangspunkt) eine Zeit ist, die später kommt als die erste Zeit (der erste Ausgangspunkt).
  • Wenn sowohl der erste Satz als auch der zweite Satz die Bezugsbedingung erfüllen, bestimmt die Bestimmungseinheit 606 dann, dass die Menge der Zeitreihendaten ausreicht. Hierbei kann die Datensatz-Erzeugungseinheit 603 ferner den dritten Satz und folgende Sätze erzeugen, und die Bestimmungseinheit 606 kann bestimmen, dass die Menge der Zeitreihendaten ausreicht, falls die Bezugsbedingung in jedem vom ersten Satz bis dritten Satz erfüllt ist.
  • Ein konkretes Beispiel für eine Verarbeitung der Vorrichtung 600 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der sechsten Ausführungsform wird unter Bezugnahme auf 17 beschrieben.
  • 17 ist ein konzeptionelles Diagramm zur Erläuterung eines konkreten Beispiels für eine Verarbeitung der Vorrichtung 600 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der sechsten Ausführungsform.
  • Wie in 17 dargestellt, erzeugt die Datensatz-Erzeugungseinheit 603 einen Daten-Teilkettensatz auf Basis des ersten Ausgangspunkts als 1a, 1b, 1c und so weiter und einen Daten-Teilkettensatz auf der Basis des zweiten Ausgangspunkts als 2a, 2b, 2c und so weiter. Dann bestimmt die Bestimmungseinheit 606, ob die Daten ausreichen, durch Bestimmen, ob die Wahrscheinlichkeitsverteilung für jeden Ausgangspunkt konvergent ist, und bestimmt durch Kombinieren der Bestimmungsergebnisse, ob die Daten ausreichen, als endgültiges Bestimmungsergebnis. Die Positionen der Ausgangspunkte können in regelmäßigen Intervallen festgelegt werden oder können nach dem Zufallsprinzip bestimmt werden.
  • Die Zieldaten müssen keine periodische Wellenform sein, aber eine Wellenform, bei der ein spezifisches Muster wiederholt auftritt, und es wird angenommen, dass eine irgendeine von den angenommenen Wellenformen zu irgendeiner Zeit auftritt. Im Falle der normalen Wellenform findet keine Vermischung nicht-angenommener Wellenformen statt, und im Falle einer Vermischung handelt es sich um eine anomale Wellenform. Auf der Basis einer solchen Annahme wird erwartet, dass eine ausreichende Menge an Daten ab dem Ausgangspunkt an der Position jedes Ausgangspunkts ungefähr die gleiche Menge an Daten ist. Daher kann dieses Verfahren verwendet werden.
  • In der Vorrichtung 600 zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der sechsten Ausführungsform erzeugt die Datensatz-Erzeugungseinheit 603 einen ersten Satz mit einer Mehrzahl von Daten-Teilkettensätzen aus Zeitreihendaten, die von einer ersten Zeit bis zu einer zweiten Zeit enthalten sind, und erzeugt einen zweiten Satz mit einer Mehrzahl von Daten-Teilkettensätzen aus Zeitreihendaten, die von einer dritten Zeit bis zu einer vierten Zeit enthalten sind, und die Bestimmungseinheit 606 bestimmt, dass die Menge an Zeitreihendaten ausreicht, falls eine vorgegebene Bedingung sowohl im ersten Satz als auch im zweiten Satz erfüllt ist. Das heißt, da die Vorrichtung 600 zur Bestimmung der Zulänglichkeit einer Datenmenge die Bestimmung nicht nur auf Basis von einem, sondern von einer Mehrzahl von Ausgangspunkten trifft, wird bewirkt, dass das Risiko für eine falsche Bestimmung verringert ist und die Bestimmungsgenauigkeit verbessert ist.
  • Darüber hinaus kann die sechste Ausführungsform nach Bedarf mit der ersten bis fünften Ausführungsform kombiniert werden.
  • Im Folgenden wird ein Modifikationsbeispiel für die Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der vorliegenden Offenbarung beschrieben.
  • Das Verfahren zum Erzeugen des Daten-Teilkettensatzes, das in den obigen Ausführungsformen beschrieben wurde, ist nur ein Beispiel, und es können auch andere Erzeugungsverfahren verwendet werden, solange das Ziel und die Funktion der Erfindung erreicht werden. Obwohl das Beispiel beschrieben wurde, in dem die Datenmenge des Daten-Teilkettensatzes in regelmäßigen Intervallen vergrößert wird, kann das Intervall graduell vergrößert (z.B. exponentiell vergrößert) werden oder das Intervall kann graduell verkleinert (z.B. logarithmisch vergrößert) werden. Im Falle der ersten Ausführungsform sind die zusätzlichen Daten in Bezug auf die bisherige Datenmenge relativ reduziert, und daher ist es vorstellbar, dass die Differenz im Vergleichsergebnis der Verteilung der Merkmalsmenge klein wird oder der Fehler im Vergleichsergebnis der Verteilung der Merkmalsmenge groß wird in Bezug auf den erwarteten Wert. Um dies zu verhindern, ist es daher effektiv, das Intervall graduell zu vergrößern. Außerdem besteht unter der Annahme, dass sich die Datenmenge einer ausreichenden Menge annähert, wenn die Daten mehr werden, die Möglichkeit, dass durch eine graduelle und feine Überprüfung der Datenmenge mit höherer Genauigkeit bestimmt werden kann, dass die Datenmenge ausreicht. In einem solchen Fall ist es effektiv, das Intervall graduell zu verkleinern.
  • Ferner kann die Datensatz-Erzeugungseinheit die Daten-Teilkette der ersten Gruppe und die Daten-Teilkette der zweiten Gruppe mit der gleichen Datenmenge erzeugen.
  • Darüber hinaus ist das Verfahren zum Vergleichen von Wahrscheinlichkeitsverteilungen, das in der oben beschriebenen Ausführungsform beschrieben wurde, nur ein Beispiel, und es können auch andere Vergleichsverfahren verwendet werden, solange das Ziel und die Funktion der Erfindung erreicht werden. Zum Beispiel kann die Wahrscheinlichkeitsverteilung jeder Gruppe durch eine Wahrscheinlichkeitsdichtefunktion approximiert werden, und die approximierten Wahrscheinlichkeitsdichtefunktionen können miteinander verglichen werden.
  • Ferner ist das Verfahren zum Erzeugen des Vergleichspaars, das in der zweiten Ausführungsform beschrieben wurde, nur ein Beispiel, und es können auch andere Erzeugungsverfahren verwendet werden, solange das Ziel und die Funktion der Erfindung erreicht werden. Zum Beispiel kann statt der Verwendung einer Kombination mit der führenden Daten-Teilkette als Vergleichspaar die Daten-Teilketten, die zeitlich nebeneinander liegen, als Vergleichspaar verwendet werden. Außerdem kann die Merkmalsmenge beispielsweise unter Verwendung eines Vergleichspaars zwischen der Daten-Teilkette des Daten-Teilkettensatzes a und der Daten-Teilkette eines anderen Daten-Teilkettensatzes berechnet werden. In diesem Fall werden Wahrscheinlichkeitsverteilungen von vier Merkmalsmengen, wie etwa von einem Paar a und b, einem Paar a und c, einem Paar a und d und einem Paar a und e, aus a, b, c, d und e der ersten Gruppe berechnet.
  • INDUSTRIELLE ANWENDBARKEIT
  • Die Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge gemäß der vorliegenden Offenbarung eignet sich beispielsweise zur Verwendung in einem Fabrikautomations(FA)-System einer Fabrik oder einem Energieerzeugungssystem eines Kraftwerks. Genauer werden als die Daten, deren Zulänglichkeit durch die Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge bestimmt wird, Daten angenommen wie ein Drehmoment, ein Strom und eine Spannung, die von einer Fertigungsanlage in einem Fabrik-FA-System und einem Sensor, der an der Fertigungsanlage angebracht ist, ausgegeben werden, Daten, die von einer Anlage in einem Kraftwerk (Elektrizitätswerk) gemessen werden, oder Daten wie ein Strom, eine Spannung und eine Temperatur, die von einem separat angebrachten Sensor ausgegeben werden. In Fabriken werden Produkte häufig wiederholt gefertigt, und es wird angenommen, dass Daten, die zur Zeit der Fertigung erfasst werden, eine periodische Wellenform sind oder eine Wellenform sind, bei der ein bestimmtes Muster oder bestimmte Muster wiederholt auftauchen, auch wenn die Wellenform keine periodische Wellenform ist. Darüber hinaus wird angenommen, dass in dem Kraftwerk eine Verarbeitung aus Aktivierung, Betrieb und Stopp als ein Zyklus wiederholt wird, und auch während des Betriebs der Testbetrieb wiederholt durchgeführt wird, und dass ein damit zusammenhängendes Wellenformmuster auftaucht.
  • BEZUGSZEICHENLISTE
  • 100, 200, 300, 400, 500, 600
    Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge,
    110, 210, 310, 410, 510, 610
    Zeitreihendaten-Verwaltungsvorrichtung,
    120, 220, 320, 420, 520, 620
    Lernvorrichtung,
    1000, 2000, 3000, 4000, 5000, 6000
    Lernmodell-Erzeugungssystem,
    101, 201, 301, 401, 501, 601
    Zeitreihendaten-Abrufeinheit,
    102, 202, 302, 402, 502, 602
    Datenaufteilungseinheit,
    103, 203, 303, 403, 503, 603
    Datensatz-Erzeugungseinheit,
    104, 204, 304, 404, 504, 604
    Merkmalsmengen-Berechnungseinheit,
    105, 205, 305, 405, 505, 605
    Wahrscheinlichkeitsverteilungs-Erzeugungseinheit,
    106, 206, 306, 406, 506, 606
    Bestimmungseinheit,
    111, 211, 311, 411, 511, 611
    Zeitreihendaten-Abrufeinheit,
    112, 212, 312, 412, 512, 612
    Zeitreihendaten-Speichereinheit,
    121, 221, 321, 421, 521, 621
    Lerndaten-Abrufeinheit,
    122, 222, 322, 422, 522, 622
    Einheit zur Erzeugung eines trainierten Modells.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • JP 2009135649 A [0004]

Claims (14)

  1. Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge, umfassend: eine Zeitreihendaten-Abrufeinheit zum Abrufen von Zeitreihendaten; eine Datenaufteilungseinheit zum Aufteilen der Zeitreihendaten in eine Mehrzahl von Daten-Teilketten; eine Datensatz-Erzeugungseinheit zum Erzeugen einer Mehrzahl von Daten-Teilkettensätzen, wobei es sich um Sätze der Daten-Teilketten handelt; eine Merkmalsmengen-Berechnungseinheit zum Berechnen einer Merkmalsmenge der Daten-Teilketten; eine Wahrscheinlichkeitsverteilungs-Erzeugungseinheit zum Erzeugen einer Wahrscheinlichkeitsverteilung der Merkmalsmenge für jeden Daten-Teilkettensatz; und eine Bestimmungseinheit zum Bestimmen, ob oder ob nicht die Wahrscheinlichkeitsverteilung konvergent geworden ist.
  2. Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge nach Anspruch 1, wobei die Datensatz-Erzeugungseinheit einen zweiten Daten-Teilkettensatz durch Hinzufügen von Daten-Teilketten, die den ersten Daten-Teilkettensatz nicht einschließen, zu dem ersten Daten-Teilkettensatz erzeugt.
  3. Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge nach Anspruch 1, wobei die Datensatz-Erzeugungseinheit einen ersten Daten-Teilkettensatz und einen zweiten Daten-Teilkettensatz, der keine Daten-Teilkette einschließt, die er mit dem ersten Daten-Teilkettensatz gemeinsam hat, erzeugt.
  4. Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge nach Anspruch 3, wobei die Datensatz-Erzeugungseinheit den ersten Daten-Teilkettensatz und einen dritten Daten-Teilkettensatz, der mindestens eine im zweiten Daten-Teilkettensatz enthaltene Daten-Teilkette einschließt, erzeugt.
  5. Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge nach Anspruch 3, wobei die Datensatz-Erzeugungseinheit einen ersten Daten-Teilkettensatz und einen dritten Daten-Teilkettensatz, der keine Daten-Teilkette einschließt, die er mit dem zweiten Daten-Teilkettensatz gemeinsam hat, erzeugt.
  6. Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge nach Anspruch 1 oder 2, wobei die Datensatz-Erzeugungseinheit eine erste Gruppe mit einer Mehrzahl der Teilketten-Datensätze und eine zweite Gruppe mit dergleichen Anzahl von Daten-Teilkettensätzen wie die erste Gruppe und mit mindestens einem Daten-Teilkettensatz, der nicht in der ersten Gruppe enthalten ist, erzeugt, die Wahrscheinlichkeitsverteilungs-Erzeugungseinheit eine Ähnlichkeit zwischen der Wahrscheinlichkeitsverteilung des Daten-Teilkettensatzes, der in der ersten Gruppe enthalten ist, und der Wahrscheinlichkeitsverteilung des Daten-Teilkettensatzes, der in der zweiten Gruppe enthalten ist, berechnet, und die Bestimmungseinheit bestimmt, dass die Wahrscheinlichkeitsverteilung konvergent geworden ist, falls die Ähnlichkeit konvergent geworden ist.
  7. Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge nach einem der Ansprüche 1 bis 6, wobei die Merkmalsmengen-Berechnungseinheit die Merkmalsmenge für jede von den Daten-Teilketten berechnet.
  8. Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge nach einem der Ansprüche 1 bis 6, wobei die Merkmalsmengen-Berechnungseinheit einen Vergleichswert zwischen der ersten Daten-Teilkette und der zweiten Daten-Teilkette als Merkmalsmenge berechnet.
  9. Vorrichtung zur Bestimmung der Zulänglichkeit einer Datenmenge nach einem der Ansprüche 1 bis 8, wobei die Datensatz-Erzeugungseinheit einen ersten Satz, der eine Mehrzahl der Daten-Teilkettensätze einschließt, aus den Zeitreihendaten berechnet, die von einer ersten Zeit bis zu einer zweiten Zeit enthalten sind, und einen zweiten Satz, der eine Mehrzahl der Daten-Teilkettensätze einschließt, aus Zeitreihendaten berechnet, die von einer dritten Zeit bis zu einer vierten Zeit enthalten sind, und die Bestimmungseinheit bestimmt, dass eine Menge der Zeitreihendaten ausreicht, falls eine vorgegebene Bedingung sowohl im ersten Satz als auch im zweiten Satz erfüllt ist.
  10. Lernmodell-Erzeugungssystem, umfassend: eine Zeitreihendaten-Abrufeinheit zum Abrufen von Zeitreihendaten; eine Datenaufteilungseinheit zum Aufteilen der Zeitreihendaten in eine Mehrzahl von Daten-Teilketten; eine Datensatz-Erzeugungseinheit zum Erzeugen einer Mehrzahl von Daten-Teilkettensätzen, wobei es sich um Sätze der Daten-Teilketten handelt; eine Merkmalsmengen-Berechnungseinheit zum Berechnen einer Merkmalsmenge der Daten-Teilketten; eine Wahrscheinlichkeitsverteilungs-Erzeugungseinheit zum Erzeugen einer Wahrscheinlichkeitsverteilung der Merkmalsmenge für jeden von den Daten-Teilkettensätzen; eine Bestimmungseinheit zum Bestimmen, ob oder ob nicht die Wahrscheinlichkeitsverteilung konvergent geworden ist; eine Lerndaten-Abrufeinheit zum Abrufen der Zeitreihendaten als Lerndaten, falls die Bestimmungseinheit bestimmt, dass die Wahrscheinlichkeitsverteilung konvergent geworden ist; und eine Einheit zur Erzeugung eines trainierten Modells zur Durchführung eines Lernens eines Lernmodells unter Verwendung der Lerndaten und zur Erzeugung eines trainierten Modells.
  11. Verfahren zur Bestimmung der Zulänglichkeit einer Datenmenge, umfassend: Abrufen von Zeitreihendaten; Aufteilen der Zeitreihendaten in eine Mehrzahl von Daten-Teilketten; Erzeugen einer Mehrzahl von Daten-Teilkettensätzen, wobei es sich um Sätze der Daten-Teilketten handelt; Berechnen einer Merkmalsmenge der Daten-Teilketten; Erzeugen einer Wahrscheinlichkeitsverteilung der Merkmalsmenge für jeden von den Daten-Teilkettensätzen; und Bestimmen, ob oder ob nicht die Wahrscheinlichkeitsverteilung konvergent geworden ist.
  12. Programm zum Bestimmen der Zulänglichkeit einer Datenmenge, das einen Computer veranlasst, alle in Anspruch 11 beschriebenen Schritte auszuführen.
  13. Verfahren zum Erzeugen eines trainierten Modells, umfassend: Abrufen von Zeitreihendaten; Aufteilen der Zeitreihendaten in eine Mehrzahl von Daten-Teilketten; Erzeugen einer Mehrzahl von Daten-Teilkettensätzen, wobei es sich um Sätze der Daten-Teilketten handelt; Berechnen einer Merkmalsmenge der Daten-Teilketten; Erzeugen einer Wahrscheinlichkeitsverteilung der Merkmalsmenge für jeden von den Daten-Teilkettensätzen; Bestimmen, ob oder ob nicht die Wahrscheinlichkeitsverteilung konvergent geworden ist; Abrufen der Zeitreihendaten als Lerndaten, falls in dem Bestimmungsschritt bestimmt wird, dass die Wahrscheinlichkeitsverteilung konvergent geworden ist; und Durchführen eines Lernens eines Lernmodells unter Verwendung der Lerndaten und Erzeugen eines trainierten Modells.
  14. Programm zum Erzeugen eines trainierten Modells, das einen Computer veranlasst, alle in Anspruch 13 beschriebenen Schritte auszuführen.
DE112020007110.3T 2020-06-26 2020-06-26 Vorrichtung zur bestimmung der zulänglichkeit einer datenmenge, verfahren zum bestimmen der zulänglichkeit einer datenmenge, lernmodell-erzeugungssystem, verfahren zum erzeugen eines trainierten modells und medium Pending DE112020007110T5 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/025227 WO2021260922A1 (ja) 2020-06-26 2020-06-26 データ量十分性判定装置、データ量十分性判定方法、データ量十分性判定プログラム、学習モデル生成システム、学習済みの学習モデル生成方法、及び学習済みの学習モデル生成プログラム

Publications (1)

Publication Number Publication Date
DE112020007110T5 true DE112020007110T5 (de) 2023-03-16

Family

ID=79282190

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112020007110.3T Pending DE112020007110T5 (de) 2020-06-26 2020-06-26 Vorrichtung zur bestimmung der zulänglichkeit einer datenmenge, verfahren zum bestimmen der zulänglichkeit einer datenmenge, lernmodell-erzeugungssystem, verfahren zum erzeugen eines trainierten modells und medium

Country Status (6)

Country Link
US (1) US20230053174A1 (de)
JP (1) JP7211562B2 (de)
CN (1) CN115836306A (de)
DE (1) DE112020007110T5 (de)
TW (1) TW202201291A (de)
WO (1) WO2021260922A1 (de)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009135649A (ja) 2007-11-29 2009-06-18 Mitsubishi Electric Corp データ処理装置及びデータ処理方法及びプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6583265B2 (ja) * 2014-03-31 2019-10-02 日本電気株式会社 監視装置、監視システム、監視方法及びプログラム
JP6632193B2 (ja) * 2015-01-16 2020-01-22 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009135649A (ja) 2007-11-29 2009-06-18 Mitsubishi Electric Corp データ処理装置及びデータ処理方法及びプログラム

Also Published As

Publication number Publication date
US20230053174A1 (en) 2023-02-16
JPWO2021260922A1 (de) 2021-12-30
WO2021260922A1 (ja) 2021-12-30
CN115836306A (zh) 2023-03-21
TW202201291A (zh) 2022-01-01
JP7211562B2 (ja) 2023-01-24

Similar Documents

Publication Publication Date Title
DE69333422T2 (de) Auffindung von Zeichenketten in einer Datenbank von Zeichenketten
DE102017125256A1 (de) Suche nach einer neuronalen Architektur
DE202017007517U1 (de) Aggregatmerkmale für maschinelles Lernen
DE112019000739T5 (de) Zeitreihengewinnung zum analysieren und korrigieren eines systemstatus
DE202017107393U1 (de) Vorhersagen eines Suchmaschinen-Einordnungssignalwerts
EP3520014B1 (de) Verfahren und system zum anonymisieren von datenbeständen
DE102022201746A1 (de) Verwaltung von rechenzentren mit maschinellem lernen
EP2854045B1 (de) Verfahren und System zum Bewerten von erhobenen Messwerten eines Systems
DE112016005266T5 (de) Schnelle Musterentdeckung für Protokollanalyse
DE102020202335A1 (de) Verfahren und Vorrichtung zum Erstellen eines Modells eines technischen Systems aus Messungen
DE112015005427T5 (de) Qualitätssteuermaschine für komplexe physikalische Systeme
DE102021127244A1 (de) Künstliche Intelligenz Optimierungsplattform
DE202022103268U1 (de) Ein auf der Ameisenlöwen-Optimierung basierendes Mehrzielsystem zur Auswahl von Merkmalen
DE102012216321A1 (de) Verfahren und System zur Nachkonstruktion von Protokollen
DE19513960A1 (de) Abbildung eines Graphen in einen Speicher
DE102013210914B4 (de) Datenverarbeitungsverfahren, Datenabfrageverfahren in Datenbank und entsprechende Einheit
DE112020007110T5 (de) Vorrichtung zur bestimmung der zulänglichkeit einer datenmenge, verfahren zum bestimmen der zulänglichkeit einer datenmenge, lernmodell-erzeugungssystem, verfahren zum erzeugen eines trainierten modells und medium
DE112020007472T5 (de) Lernnutzungssystem, nutzungsvorrichtung, lernvorrichtung, programm und lernnutzungsverfahren
EP1264253B1 (de) Verfahren und anordnung zur modellierung eines systems
Ali et al. Improving accuracy of missing data imputation in data mining
DE19963123B4 (de) Analytisches Informationssystem
DE202022102752U1 (de) Ein neuartiges System gestapelter paralleler Faltungsschichten mit einem Aufmerksamkeitsmodul zur Klassifizierung von Bildern diabetischer Fußgeschwüre und normaler Haut
DE102019214546B4 (de) Computerimplementiertes Verfahren und Vorrichtung zur Optimierung einer Architektur eines künstlichen neuronalen Netzwerks
DE102021212483A1 (de) Datenverarbeitungsvorrichtung sowie Verfahren und Programm zum tiefen Lernen eines neuronalen Netzwerkes
DE102008058016A1 (de) System und Verfahren zur rechnerbasierten Analyse großer Datenmengen

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R084 Declaration of willingness to licence