DE112021007831T5 - Programm, Bezeichnungsunterstützungs-Vorrichtung und Bezeichnungsunterstützungs-Verfahren - Google Patents

Programm, Bezeichnungsunterstützungs-Vorrichtung und Bezeichnungsunterstützungs-Verfahren Download PDF

Info

Publication number
DE112021007831T5
DE112021007831T5 DE112021007831.3T DE112021007831T DE112021007831T5 DE 112021007831 T5 DE112021007831 T5 DE 112021007831T5 DE 112021007831 T DE112021007831 T DE 112021007831T DE 112021007831 T5 DE112021007831 T5 DE 112021007831T5
Authority
DE
Germany
Prior art keywords
data
labeling
designation
unlabeled
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE112021007831.3T
Other languages
English (en)
Inventor
Naoki Sugawara
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of DE112021007831T5 publication Critical patent/DE112021007831T5/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

Eine Bezeichnungsunterstützungs-Vorrichtung (10) umfasst einen Bezieher für unbezeichnete Daten (11) und einen Bezeichnungserforderlichkeit-Bestimmer (13). Der Bezieher für unbezeichnete Daten (11) bezieht unbezeichnet Daten. Der Bezeichnungserforderlichkeit-Bestimmer (13) bestimmt auf der Grundlage von bezeichneten Daten, ob die Bezeichnung der unbezeichneten Daten notwendig ist.

Description

  • Technisches Gebiet
  • Die vorliegende Offenbarung betrifft ein Programm, eine Bezeichnungsunterstützungs-Vorrichtung und ein Bezeichnungsunterstützungs-Verfahren.
  • Technologischer Hintergrund
  • Beim maschinellen Lernen kann aus manuell bezeichneten (engl. labeled) Daten ein trainiertes Modell erzeugt werden. Zum Beispiel kann ein trainiertes Modell durch überwachtes Lernen erzeugt werden, das eine manuell angebrachte Bezeichnung (engl. label) als Grundwahrheitsdaten verwendet. Wenn die Erzeugung eines solchen trainierten Modells die Vorbereitung einer großen Menge von Trainingsdaten beinhaltet, muss die große Menge an Daten manuell bezeichnet werden. Dies kann einen großen Aufwand darstellen. Daher werden Techniken erwartet, die den Aufwand für die Bezeichnung verringern.
  • In der Patentliteratur 1 wird zum Beispiel eine Technik beschrieben, die mit dem vorstehend Gesagten zusammenhängt. Wenn bei der Bezeichnung von Zeitreihendaten die zu einem bestimmten Zeitpunkt erfassten Daten bezeichnet werden, verringert die Technik den Aufwand für die Bezeichnung der Daten, indem sie unter den unbezeichneten (engl. unlabeled) Datenelementen, die in der Nähe des Zeitpunkts erfasst wurden, automatisch den Daten, die den bezeichneten Daten ähnlich sind, die gleiche Bezeichnung zuordnet.
  • Zitierliste
  • Patentliteratur
  • Patentliteratur 1: Ungeprüfte japanische Patentanmeldung Offenlegungsnummer 2016 - 76 073
  • Kurzbeschreibung der Erfindung
  • Technisches Problem
  • Die in der Patentliteratur 1 beschriebene Technik bezeichnet jedoch automatisch unbezeichnete Daten, die in der Nähe des Zeitpunkts der Erfassung von bezeichneten Daten erfasst wurden, und kann daher unzureichend sein, um den Aufwand durch die Bezeichnung zu verringern. Wenn beispielsweise der Zeitpunkt der Erfassung von unbezeichneten Daten, die den bezeichneten Daten ähnlich sind, stark vom Zeitpunkt der Erfassung der bezeichneten Daten abweicht, ist eine separate Bezeichnung der unbezeichneten Daten erforderlich.
  • Eine Aufgabe der Offenbarung ist es, beispielsweise ein Programm zur Verfügung zu stellen, das den Aufwand für die Bezeichnung unbezeichneter Daten angemessen reduziert.
  • Lösung des Problems
  • Um die vorstehende Aufgabe zu lösen, ist ein Programm gemäß einem Aspekt der vorliegenden Offenbarung ein Programm, das einen Computer dazu veranlasst, als Beziehungsmittel für unbezeichnete Daten zu fungieren, um unbezeichnete Daten zu beziehen, und als Bezeichnungserforderlichkeit-Bestimmungsmittel (Mittel zur Bestimmung der Erforderlichkeit der Bezeichnung) zu fungieren, um auf der Grundlage von bezeichneten Daten zu bestimmen, ob eine Bezeichnung der unbezeichneten Daten erforderlich ist.
  • Vorteilhafte Wirkungen der Erfindung
  • Die Technik gemäß dem vorstehenden Aspekt der vorliegenden Offenbarung reduziert in geeigneter Weise den Aufwand für die Bezeichnung unbezeichneter Daten.
  • Kurze Beschreibung der Zeichnungen
    • 1 ist ein schematisches Diagramm eines Datenverwaltungssystems gemäß Ausführungsform 1 der vorliegenden Offenbarung;
    • 2 ist ein funktionelles Blockdiagramm einer Bezeichnungsunterstützungs-Vorrichtung gemäß Ausführungsform 1 der vorliegenden Offenbarung;
    • 3 ist ein Diagramm, das eine beispielhafte Bestimmung der Bezeichnungserforderlichkeit (Erforderlichkeit der Bezeichnung) illustriert, die von der Bezeichnungsunterstützungs-Vorrichtung gemäß Ausführungsform 1 der vorliegenden Offenbarung durchgeführt wird;
    • 4 ist ein Diagramm zur Veranschaulichung einer beispielhaften Bestimmung der Bezeichnungserforderlichkeit, die von der Bezeichnungsunterstützungs-Vorrichtung gemäß Ausführungsform 1 der vorliegenden Offenbarung durchgeführt wird;
    • 5 ist ein Diagramm der Bezeichnungsunterstützungs-Vorrichtung gemäß Ausführungsform 1 der vorliegenden Offenbarung, das eine beispielhafte Hardwarekonfiguration veranschaulicht;
    • 6 ist ein Flussdiagramm, das eine beispielhafte Bestimmung der Bezeichnungserforderlichkeit veranschaulicht, die von der Bezeichnungsunterstützungs-Vorrichtung gemäß Ausführungsform 1 der vorliegenden Offenbarung durchgeführt wird;
    • 7 ist ein Diagramm zur Veranschaulichung einer beispielhaften Bestimmung der Bezeichnungserforderlichkeit, die von einer Bezeichnungsunterstützungs-Vorrichtung gemäß Ausführungsform 2 der vorliegenden Offenbarung durchgeführt wird;
    • 8 ist ein Flussdiagramm zur Veranschaulichung einer beispielhaften Bestimmung der Bezeichnungserforderlichkeit, die von der Bezeichnungsunterstützungs-Vorrichtung gemäß Ausführungsform 2 der vorliegenden Offenbarung durchgeführt wird;
    • 9 ist ein funktionelles Blockdiagramm einer Bezeichnungsunterstützungs-Vorrichtung gemäß Ausführungsform 3 der vorliegenden Offenbarung;
    • 10 ist ein Flussdiagramm, das eine beispielhafte Bestimmung der Bezeichnungserforderlichkeit veranschaulicht, die von der Bezeichnungsunterstützungs-Vorrichtung gemäß Ausführungsform 3 der vorliegenden Offenbarung durchgeführt wird; und
    • 11 ist ein funktionelles Blockdiagramm einer Bezeichnungsunterstützungs-Vorrichtung gemäß einer Modifikation der vorliegenden Offenbarung.
  • Beschreibung von Ausführungsformen
  • Nachfolgend werden Ausführungsformen unter Bezugnahme auf die Zeichnungen beschrieben. In jeder Ausführungsform wird in einem Datenverwaltungssystem eine Bezeichnungsunterstützungs-Vorrichtung gemäß einer oder mehreren Ausführungsformen der vorliegenden Offenbarung verwendet. In den Figuren bezeichnen die gleichen Bezugszeichen die gleichen oder einander entsprechende Komponenten.
  • Ausführungsform 1
  • Unter Bezugnahme auf 1 wird ein Datenverwaltungssystem 1 gemäß Ausführungsform 1 beschrieben. Das Datenverwaltungssystem 1 umfasst eine Bezeichnungsunterstützungs-Vorrichtung 10, einen Datenserver 20, eine Datenbeziehungsvorrichtung 30, ein Endgerät 40 und eine Lernvorrichtung 50. Die Bezeichnungsunterstützungs-Vorrichtung 10, die Datenbeziehungsvorrichtung 30, das Endgerät 40 und die Lernvorrichtung 50 kommunizieren mit dem Datenserver 20. Das Datenverwaltungssystem 1 erzeugt auf der Grundlage von Daten, die vom Benutzer des Endgeräts 40 bezeichnet wurden, ein trainiertes Modell. Wie nachfolgend im Detail beschrieben, ermöglicht das Datenverwaltungssystem 1 der Bezeichnungsunterstützungs-Vorrichtung 10 zu bestimmen, ob eine Bezeichnung der von der Datenbeziehungsvorrichtung 30 gesammelten unbezeichneten Daten notwendig ist.
  • Das Datenverwaltungssystem 1 ist beispielsweise ein Datenverwaltungssystem, das in einer Fabrik betrieben wird und auf der Grundlage von in der Fabrik gesammelten Daten ein trainiertes Modell erzeugt. Der Datenserver 20, die Bezeichnungsunterstützungs-Vorrichtung 10, die Datenbeziehungsvorrichtung 30, das Endgerät 40 und die Lernvorrichtung 50 sind miteinander über ein Fabriknetzwerk verbunden, um zwischen ihnen eine Kommunikation zu ermöglichen. Das erzeugte trainierte Modell wird beispielsweise bei der Abnormitätsbestimmung verwendet, die von einer Abnormitätsbestimmungsvorrichtung (nicht dargestellt) durchgeführt wird.
  • Der Datenserver 20 ist zum Beispiel in der Fabrik installiert und mit dem Fabriknetzwerk verbunden. Der Datenserver 20 speichert die von der Datenbeziehungsvorrichtung 30 gesammelten Daten als unbezeichnete Daten in einem Speicher für unbezeichnete Daten 21. Der Datenserver 20 speichert Bezeichnungszieldaten (engl. labeling target data) in einem Speicher für Bezeichnungszieldaten 22. Bei den Bezeichnungszieldaten handelt es sich um unbezeichnete Daten, die von der Bezeichnungsunterstützungs-Vorrichtung 10 als zu bezeichnende Daten ermittelt wurden. Der Datenserver 20 speichert bezeichnete Daten in einem Speicher für bezeichnete Daten 23. Bei den bezeichneten Daten handelt es sich um Bezeichnungszieldaten, die vom Benutzer des Endgeräts 40 bezeichnet wurden. Der Datenserver 20 speichert ein von der Lernvorrichtung 50 erzeugtes trainiertes Modell in einem Modellspeicher 24. Das trainierte Modell wird von der Lernvorrichtung 50 auf der Grundlage der bezeichneten Daten erzeugt.
  • Die Datenbeziehungsvorrichtung 30 sammelt Daten, die zur Erzeugung eines trainierten Modells verwendet werden. Zum Beispiel sammelt die Datenbeziehungsvorrichtung 30 Daten, die Sensorwerte von verschiedenen in der Fabrik installierten Sensoren angeben. Die Datenbeziehungsvorrichtung 30 speichert die gesammelten Daten als unbezeichnete Daten im Datenserver 20.
  • Auf der Grundlage der im Datenserver 20 gespeicherten bezeichneten Daten bestimmt die Bezeichnungsunterstützungs-Vorrichtung 10, ob die im Datenserver 20 gespeicherten unbezeichneten Daten bezeichnet werden müssen/sollen. Die Bezeichnungsunterstützungs-Vorrichtung 10 speichert die als zu bezeichnend ermittelten unbezeichneten Daten als Bezeichnungszieldaten in den Datenserver 20. Der funktionale Aufbau der Bezeichnungsunterstützungs-Vorrichtung 10 und die Details der Bestimmung der Bezeichnungserforderlichkeit werden nachfolgend beschrieben. Die Bezeichnungsunterstützungs-Vorrichtung 10 ist ein Beispiel für eine Bezeichnungsunterstützungs-Vorrichtung gemäß einer oder mehrerer Ausführungsformen der vorliegenden Offenbarung.
  • Das Endgerät 40 ist ein mobiles Endgerät wie ein Smartphone, ein Tablet-Endgerät oder eine Mensch-Maschine-Schnittstelle (MMS), die von einem Bediener in der Fabrik bedient werden kann. Der Bediener, welcher der Benutzer des Endgeräts 40 ist, kann das Endgerät 40 bedienen, um die im Datenserver 20 gespeicherten Bezeichnungszieldaten zu identifizieren und die Bezeichnungszieldaten zu bezeichnen. Wenn der Benutzer eine Operation zur Identifizierung der Bezeichnungszieldaten durchführt, bezieht das Endgerät 40 die Bezeichnungszieldaten vom Datenserver 20 und zeigt Informationen über die Bezeichnungszieldaten auf dem Bildschirm an. Wenn der Benutzer eine Bezeichnungsoperation durchführt, speichert das Endgerät 40 bezeichnete Daten, welche die Bezeichnungszieldaten und die angehängte Bezeichnung umfassen, im Datenserver 20.
  • Die Lernvorrichtung 50 erzeugt auf der Grundlage der im Datenserver 20 gespeicherten bezeichneten Daten ein trainiertes Modell. Zum Beispiel erzeugt die Lernvorrichtung 50 ein trainiertes Modell durch überwachtes Lernen, das die angehängte Bezeichnung, die in den bezeichneten Daten enthalten ist, als Grundwahrheitsdaten verwendet. Die Lernvorrichtung 50 speichert das erzeugte trainierte Modell auf dem Datenserver 20.
  • Bezeichnete Daten werden durch Hinzufügen einer Bezeichnung zu unbezeichneten Daten erzeugt. Bezeichnete Daten umfassen als Hauptdaten die Daten, die sich von der Bezeichnung unterscheiden (diese werden im Folgenden als in den bezeichneten Daten enthaltene Hauptdaten bezeichnet). In einem Beispiel umfassen die bezeichneten Daten die Daten, die der Angabe „100 Gramm, 20 °C“ entsprechen, und ist den Daten eine Bezeichnung mit der Angabe „zu kochen“ beigefügt. Die bezeichneten Daten enthalten die Daten „100 Gramm, 20 °C“ als Hauptdaten. Zum Beispiel sind die bezeichneten Daten Daten, welche „100 Gramm, 20 °C, Bezeichnung: Zu kochen” repräsentieren.
  • Der funktionale Aufbau der Bezeichnungsunterstützungs-Vorrichtung 10 wird nun unter Bezugnahme auf 2 beschrieben. Die Bezeichnungsunterstützungs-Vorrichtung 10 umfasst einen Bezieher für unbezeichnete Daten 11, einen Bezieher für bezeichnete Daten 12, einen Bezeichnungserforderlichkeit-Bestimmer 13 und eine Bezeichnungszieldaten-Ausgabevorrichtung 14.
  • Der Bezieher für unbezeichnete Daten 11 bezieht unbezeichnete Daten, die in dem Datenserver 20 in dem Speicher für unbezeichnete Daten 21 gespeichert sind. Beispielsweise kommuniziert der Bezieher für unbezeichnete Daten 11 periodisch mit dem Datenserver 20 und bezieht neue unbezeichnete Daten, wenn die unbezeichneten Daten dem Speicher für unbezeichnete Daten 21 hinzugefügt wurden. Der Bezieher für unbezeichnete Daten 11 ist ein Beispiel für ein Beziehungsmittel für unbezeichnete Daten in einer oder mehreren Ausführungsformen der vorliegenden Offenbarung.
  • Der Bezieher für bezeichnete Daten 12 bezieht bezeichnete Daten, die in dem Datenserver 20 in dem Speicher für bezeichnete Daten 23 gespeichert sind. Der Bezieher für bezeichnete Daten 12 muss jedoch nicht alle in dem Speicher für bezeichnete Daten 23 gespeicherten Datenelemente beziehen. Wenn beispielsweise das Beziehen aller Datenelemente die Verarbeitungslast erhöht, kann der Bezieher für bezeichnete Daten 12 Daten beziehen, die für die Bestimmung der Bezeichnungserforderlichkeit (wie nachfolgend beschrieben) verwendet werden. Der Bezieher für bezeichnete Daten 12 bezieht beispielsweise Daten, die für die Bestimmung der Bezeichnungserforderlichkeit verwendet werden sollen, indem er nach dem Zufallsprinzip 100 im Speicher für bezeichnete Daten 23 gespeicherte bezeichnete Datenelemente bezieht, oder indem er die innerhalb eines vorgegebenen Zeitraums bezeichneten Daten bezieht. Insbesondere können sich die Kriterien für die Bezeichnung von Tag zu Tag ändern. Die zu beziehenden bezeichneten Daten können daher auf die innerhalb eines vorbestimmten Zeitraums bezeichneten Daten beschränkt werden.
  • Auf der Grundlage der von dem Bezieher für bezeichnete Daten 12 bezogenen bezeichneten Daten bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13, ob die Bezeichnung der von dem Bezieher für unbezeichnete Daten 11 bezogenen unbezeichneten Daten erforderlich ist. Der Bezeichnungserforderlichkeit-Bestimmer 13 ist ein Beispiel für ein Bezeichnungserforderlichkeit-Bestimmungsmittel in einer oder mehreren Ausführungsformen der vorliegenden Offenbarung.
  • Nachstehend wird die Bestimmung der Bezeichnungserforderlichkeit unter Bezugnahme auf die 3 und 4 im Detail beschrieben. Die 3 und 4 zeigen jeweils eine Verteilung von bezeichneten Daten und von unbezeichneten Daten. Zum besseren Verständnis sind die Daten in den 3 und 4 ein Satz von zwei Werten, oder mit anderen Worten, zweidimensionale Daten. Die bezeichneten Datenverteilungen in 3 und 4 sind identisch.
  • In den 3 und 4 kann der Abstand zwischen den unbezeichneten Daten und jedem bezeichneten Datenelement berechnet werden. Der Ausdruck „die unbezeichneten Daten und jedes bezeichnete Datenelement“ ist genauer gesagt „der Abstand zwischen den unbezeichneten Daten und den in den bezeichneten Daten enthaltenen Hauptdaten“. Der Einfachheit halber wird im Folgenden jedoch einfach der Ausdruck „die unbezeichneten Daten und jedes bezeichnete Datenelement“ verwendet, wenn keine Unterscheidung beabsichtigt ist.
  • Für Daten, die anders als in den 3 und 4 nicht zweidimensional dargestellt werden können, kann der Abstand auf eine bestimmte Weise berechnet werden. Für Daten, die aus zehn Werten bestehen, von denen jeder für JA oder NEIN steht, kann der Abstand zwischen Datenelementen durch Berechnung des Hamming-Abstands bestimmt werden, wobei JA als 1 und NEIN als 0 gilt. Für Daten, die ein (Daten-)Satz aus Masse und Temperatur sind, kann auch wenn die direkte Verwendung dieser numerischen Werte für die Abstandsberechnung ungeeignet ist, einer der Werte in geeigneter Weise skaliert werden, um einen geeigneten Abstand zu berechnen.
  • Der Bezeichnungserforderlichkeit-Bestimmer (engl. labeling necessity determinator) 13 berechnet den Abstand zwischen den unbezeichneten Daten und jedem bezeichneten Datenelement. Bei bezeichneten Daten mit einem Abstand zu den unbezeichneten Daten, der kleiner oder gleich einem vorbestimmten Schwellenwert ist, bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13, dass die unbezeichneten Daten nicht bezeichnet werden müssen/sollen. Ohne bezeichnete Daten, deren Abstand von den unbezeichneten Daten kleiner oder gleich dem Schwellenwert ist, bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13, dass eine Bezeichnung der unbezeichneten Daten notwendig ist. Mit anderen Worten bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13, dass die Bezeichnung nicht durchgeführt werden soll wenn es in der Nähe der unbezeichneten Daten bezeichnete Daten gibt, wohingegen der Bezeichnungserforderlichkeit-Bestimmer 13 bestimmt, dass die Bezeichnung durchgeführt werden muss, wenn es in der Nähe der unbezeichneten Daten keine bezeichneten Daten gibt.
  • In dem in 3 dargestellten Beispiel weisen keine bezeichneten Daten einen Abstand zu den unbezeichneten Daten auf, der kleiner oder gleich dem Schwellenwert ist. In dem in 3 dargestellten Beispiel bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13 also, dass die Bezeichnung der unbezeichneten Daten notwendig ist. Im Gegensatz dazu weisen in dem in 4 dargestellten Beispiel die bezeichneten Daten einen Abstand zu den unbezeichneten Daten auf, der kleiner oder gleich dem Schwellenwert ist. Daher bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13, dass die unbezeichneten Daten nicht bezeichnet werden müssen.
  • Zurückkommend auf 2 gibt die Bezeichnungszieldaten-Ausgabevorrichtung 14 die unbezeichneten Daten, die vom Bezeichnungserforderlichkeit-Bestimmer 13 als zu bezeichnen bestimmt wurden, an den Speicher für Bezeichnungszieldaten 22 im Datenserver 20 als Bezeichnungszieldaten aus.
  • Eine beispielhafte Hardwarekonfiguration der Bezeichnungsunterstützungs-Vorrichtung 10 wird nun unter Bezugnahme auf 5 beschrieben. Die in 5 dargestellte Bezeichnungsunterstützungs-Vorrichtung 10 wird durch einen Computer, wie beispielsweise einen Personal Computer, einen industriellen Personal Computer / Industriecomputer oder einen Mikrocontroller implementiert.
  • Die Bezeichnungsunterstützungs-Vorrichtung 10 umfasst einen Prozessor 1001, einen Arbeitsspeicher 1002, eine Schnittstelle 1003 und einen Sekundärspeicher 1004, die über einen Bus 1000 miteinander verbunden sind.
  • Der Prozessor 1001 ist zum Beispiel eine Zentraleinheit (CPU). Wenn der Prozessor 1001 ein im Sekundärspeicher 1004 gespeichertes Betriebsprogramm in den Arbeitsspeicher 1002 lädt und das Programm ausführt, wird eine jeweilige Funktion der Bezeichnungsunterstützungs-Vorrichtung 10 implementiert.
  • Der Arbeitsspeicher 1002 ist beispielsweise ein Hauptarbeitsspeicher, der ein Speicher mit wahlfreiem Zugriff (RAM) ist. Der Arbeitsspeicher 1002 speichert das vom Prozessor 1001 aus dem Sekundärspeicher 1004 geladene Betriebsprogramm. Der Arbeitsspeicher 1002 fungiert auch als Arbeitsspeicher, wenn der Prozessor 1001 das Betriebsprogramm ausführt.
  • Die Schnittstelle 1003 ist beispielsweise eine Eingabe-Ausgabe-Schnittstelle (E/A-Schnittstelle) wie beispielsweise eine serielle Schnittstelle, eine USB-Schnittstelle (Universal Serial Bus) oder eine Netzwerkschnittstelle.
  • Der Sekundärspeicher 1004 ist zum Beispiel ein Flash-Speicher, ein Festplattenlaufwerk (HDD) oder ein Solid-State-Laufwerk (SSD). Der Sekundärspeicher 1004 speichert das vom Prozessor 1001 ausführbare Betriebsprogramm.
  • Ein beispielhafter Vorgang der Bestimmung der Bezeichnungserforderlichkeit, die von der Bezeichnungsunterstützungs-Vorrichtung 10 durchgeführt wird, wird nun unter Bezugnahme auf 6 beschrieben. Zum Beispiel überprüft der Bezieher für unbezeichnete Daten 11 in der Bezeichnungsunterstützungs-Vorrichtung 10 periodisch den Speicher für unbezeichnete Daten 21 im Datenserver 20, und der in 6 dargestellte Vorgang wird gestartet, wenn neue unbezeichnete Daten zum Speicher für unbezeichnete Daten 21 hinzugefügt wurden.
  • Der Bezieher für unbezeichnete Daten 11 in der Bezeichnungsunterstützungs-Vorrichtung 10 bezieht unbezeichnete Daten, die in dem Speicher für unbezeichnete Daten 21 in dem Datenserver 20 gespeichert sind (Schritt S101).
  • Der Bezieher für bezeichnete Daten 12 in der Bezeichnungsunterstützungs-Vorrichtung 10 bezieht aus dem Speicher für bezeichnete Daten 23 im Datenserver 20 bezeichnete Daten (Schritt S102).
  • Der Bezeichnungserforderlichkeit-Bestimmer 13 in der Bezeichnungsunterstützungs-Vorrichtung 10 berechnet den Abstand zwischen den in Schritt S101 bezogenen unbezeichneten Daten und jedem in Schritt S102 bezogenen bezeichneten Datenelement (Schritt S103).
  • Der Bezeichnungserforderlichkeit-Bestimmer 13 bestimmt, ob der in Schritt S103 berechnete Abstand zwischen den unbezeichneten Daten und allen bezeichneten Daten kleiner oder gleich dem Schwellenwert ist (Schritt S104).
  • Wenn es bezeichnete Daten gibt, deren Abstand zu den unbezeichneten Daten kleiner oder gleich dem Schwellenwert ist (JA in Schritt S104), bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13, dass die unbezeichneten Daten nicht bezeichnet werden müssen (Schritt S105). Die Bezeichnungsunterstützungs-Vorrichtung 10 beendet daraufhin den Vorgang der Bestimmung der Bezeichnungserforderlichkeit.
  • Wenn es keine bezeichnete Daten gibt, deren Abstand zu den unbezeichneten Daten kleiner oder gleich dem Schwellenwert ist (NEIN in Schritt S104), bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13, dass eine Bezeichnung der unbezeichneten Daten notwendig ist (Schritt S106).
  • Die Bezeichnungszieldaten-Ausgabevorrichtung 14 in der Bezeichnungsunterstützungs-Vorrichtung 10 gibt die unbezeichneten Daten als Bezeichnungszieldaten an den Speicher für Bezeichnungszieldaten 22 im Datenserver 20 aus (Schritt S107). Die Bezeichnungsunterstützungs-Vorrichtung 10 beendet dann den Vorgang der Bestimmung der Bezeichnungserforderlichkeit.
  • Das Datenverwaltungssystem 1 gemäß Ausführungsform 1 weist die vorstehend beschriebene Konfiguration auf. Auf der Grundlage des Abstands zwischen unbezeichneten Daten und bezeichneten Daten bestimmt die Bezeichnungsunterstützungs-Vorrichtung 10 im Datenverwaltungssystem 1, ob eine Bezeichnung der unbezeichneten Daten notwendig ist. Auf diese Weise kann die Bezeichnungsunterstützungs-Vorrichtung 10 den Aufwand für die Bezeichnung von unbezeichneten Daten angemessen reduzieren.
  • Ausführungsform 2
  • Im Folgenden wird ein Datenverwaltungssystem 1 gemäß Ausführungsform 2 beschrieben. Die allgemeine Konfiguration des Datenverwaltungssystems 1 und der funktionale Aufbau einer Bezeichnungsunterstützungs-Vorrichtung 10 sind im Wesentlichen die gleichen wie in dem in den 1 und 2 dargestellten Beispiel der Ausführungsform 1, und Unterschiede zu Ausführungsform 1 werden im Folgenden beschrieben.
  • In Ausführungsform 1 bestimmt die Bezeichnungsunterstützungs-Vorrichtung 10 auf der Grundlage von dem Abstand zwischen den unbezeichneten Daten und den bezeichneten Daten, ob eine Bezeichnung von unbezeichneten Daten erforderlich ist. Wie vorstehend beschrieben, ist der Abstand zwischen den unbezeichneten Daten und den bezeichneten Daten genauer gesagt der Abstand zwischen den unbezeichneten Daten und den Hauptdaten, die in den bezeichneten Daten enthalten sind, und die an den unbezeichneten Daten angebrachte Bezeichnung wird bei der Bestimmung nicht verwendet.
  • So kann beispielsweise bestimmt werden, dass in Ausführungsform 1 zu bezeichnende Daten nicht bezeichnet werden sollen, wie nachstehend beschrieben. Dieses Beispiel wird im Folgenden unter Bezugnahme auf 7 beschrieben.
  • 7 zeigt die gleiche Verteilung der bezeichneten Daten wie in 3 und 4, jedoch mit anderen unbezeichneten Daten. Wie in 7 dargestellt, befinden sich mehrere Elemente von bezeichneten Daten B und bezeichneten Daten C innerhalb des Bereichs der unbezeichneten Daten, der einem Abstand kleiner oder gleich dem Schwellenwert entspricht. Bei den unbezeichneten Daten ist nicht bekannt, ob die Daten mit B oder C bezeichnet werden sollen, und es muss daher bestimmt werden, dass sie bezeichnet werden müssen. Die Bezeichnungsunterstützungs-Vorrichtung 10 gemäß Ausführungsform 1 führt die Bestimmung der Bezeichnungserforderlichkeit jedoch auf der Grundlage des Abstands zwischen den unbezeichneten Daten und den in den bezeichneten Daten enthaltenen Hauptdaten durch und bestimmt somit, dass die unbezeichneten Daten nicht bezeichnet werden müssen.
  • Um darauf zu reagieren, führt die Bezeichnungsunterstützungs-Vorrichtung 10 gemäß Ausführungsform 2, wie nachfolgend beschrieben, die Bestimmung der Bezeichnungserforderlichkeit sowohl auf der Grundlage der in den bezeichneten Daten enthaltenen Hauptdaten als auch auf der Grundlage der in den bezeichneten Daten enthaltenen angehängten Bezeichnung durch.
  • Bei bezeichneten Daten mit einem Abstand zu den unbezeichneten Daten, der kleiner oder gleich dem Schwellenwert ist, bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13 in der Bezeichnungsunterstützungs-Vorrichtung 10 gemäß Ausführungsform 2, dass die Bezeichnung der unbezeichneten Daten notwendig ist, wenn in den bezeichneten Daten mit einem Abstand, der kleiner oder gleich dem Schwellenwert ist, verschiedene Bezeichnungen enthalten sind. In dem in 7 dargestellten Beispiel enthalten die bezeichneten Daten mit einem Abstand von den unbezeichneten Daten, der kleiner oder gleich dem Schwellenwert ist, zwei Arten von Bezeichnungen, oder genauer gesagt, Bezeichnung B und Bezeichnung C. Daher bestimmt in Ausführungsform 2 der Bezeichnungserforderlichkeit-Bestimmer 13, dass die unbezeichneten Daten in dem in 7 dargestellten Beispiel bezeichnet werden müssen.
  • Der Vorgang der Bestimmung der Bezeichnungserforderlichkeit, der von der Bezeichnungsunterstützungs-Vorrichtung 10 gemäß Ausführungsform 2 durchgeführt wird, wird unter Bezugnahme auf 8 beschrieben, wobei der Schwerpunkt auf den Unterschieden zu dem in 6 dargestellten Beispiel der Ausführungsform 1 liegt.
  • Der Vorgang von Schritt S201 bis Schritt S204 ist identisch zu den Schritten S101 bis S104 in 6 und wird daher nicht beschrieben. Außerdem ist der Vorgang, wenn sich keine bezeichneten Daten in einem Abstand befinden, der kleiner oder gleich dem Schwellenwert ist (NEIN im Schritt S204), im und nach dem Schritt S207 identisch zu dem Vorgang im und nach dem Schritt S106 in 6, und wird daher nicht beschrieben.
  • Wenn sich bezeichnete Daten in einem Abstand befinden, der kleiner oder gleich dem Schwellenwert ist (JA in Schritt 204), bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13, ob in den bezeichneten Daten mit einem Abstand zu den unbezeichneten Daten von kleiner oder gleich dem Schwellenwert eine einzige Art von Bezeichnungen enthalten ist (Schritt S205).
  • Wenn in den bezeichneten Daten mit einem Abstand von den unbezeichneten Daten kleiner oder gleich dem Schwellenwert eine einzige Art von Bezeichnungen enthalten ist (JA in Schritt S205), bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13, dass die unbezeichneten Daten nicht bezeichnet werden müssen (Schritt S206). Die Bezeichnungsunterstützungs-Vorrichtung 10 beendet dann den Vorgang der Bestimmung der Bezeichnungserforderlichkeit.
  • Wenn in den bezeichneten Daten mit einem Abstand zu den unbezeichneten Daten kleiner oder gleich dem Schwellenwert mehrere Arten von Bezeichnungen enthalten sind (NEIN in Schritt S205), bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13, dass die Bezeichnung der unbezeichneten Daten notwendig ist (Schritt S207). Ein nachfolgender Vorgang ist identisch mit dem Vorgang in und nach Schritt S107 von 6 und wird daher nicht beschrieben.
  • Das Datenverwaltungssystem 1 gemäß Ausführungsform 2 weist die vorstehend beschriebene Konfiguration auf. Die Bezeichnungsunterstützungs-Vorrichtung 10 in dem Datenverwaltungssystem 1 gemäß Ausführungsform 2 führt die Bestimmung der Bezeichnungserforderlichkeit auf der Grundlage der in den bezeichneten Daten enthaltenen Hauptdaten sowie der in den bezeichneten Daten enthaltenen beigefügten Bezeichnung durch. Somit kann die Bezeichnungsunterstützungs-Vorrichtung 10 gemäß Ausführungsform 2 den Aufwand der Bezeichnung unbezeichneter Daten angemessener reduzieren als die Bezeichnungsunterstützungs-Vorrichtung 10 gemäß Ausführungsform 1.
  • Ausführungsform 3
  • Im Folgenden wird ein Datenverwaltungssystem 1 gemäß Ausführungsform 3 beschrieben. Die allgemeine Konfiguration des Datenverwaltungssystems 1 ist im Wesentlichen dieselbe wie die des in 1 dargestellten Beispiels von Ausführungsform 1, und im Folgenden werden Unterschiede zu Ausführungsform 1 beschrieben.
  • Wie auch in 9 dargestellt, unterscheidet sich eine Bezeichnungsunterstützungs-Vorrichtung 10 gemäß Ausführungsform 3 von der Struktur aus Ausführungsform 1 darin, dass sie anstelle des Beziehers für bezeichnete Daten 12 einen Modell-Bezieher 15 enthält. Der Modell-Bezieher 15 bezieht das trainierte Modell aus dem Modellspeicher 24 in dem Datenserver 20.
  • Wie nachstehend beschrieben, unterscheidet sich auch der Bezeichnungserforderlichkeit-Bestimmer 13 von der entsprechenden Komponente aus Ausführungsform 1. Auf der Grundlage von dem trainierten Modell, das durch den Modell-Bezieher 15 bezogen wurde, bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13 in Ausführungsform 3, ob eine Bezeichnung von unbezeichneten Daten notwendig ist. Genauer gesagt verwendet der Bezeichnungserforderlichkeit-Bestimmer 13 in Ausführungsform 3 das trainierte Modell, um die Bezeichnung abzuleiten, die den unbezeichneten Daten angehängt/zugeordnet werden soll. Wenn eine während der Ableitung (engl. interference) ermittelte Wahrscheinlichkeit größer als oder gleich einem vorbestimmten Schwellenwert ist, bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13, dass die unbezeichneten Daten nicht bezeichnet werden müssen. Wenn die Wahrscheinlichkeit kleiner als der Schwellenwert ist, bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13, dass die Bezeichnung der unbezeichneten Daten notwendig ist. Wie nachfolgend im Detail beschrieben, ist die Wahrscheinlichkeit ein Index, der den Grad der Zuverlässigkeit der Ableitung angibt.
  • Wie vorstehend beschrieben, wird das trainierte Modell von der Lernvorrichtung 50 auf der Grundlage von bezeichneten Daten erstellt. Daher kann das trainierte Modell verwendet werden, um die Bezeichnung abzuleiten, die unbezeichneten Daten angehängt werden soll. Für ein trainiertes Modell, das beispielsweise durch maschinelles Lernen mit logistischer Regression oder durch maschinelles Lernen auf der Grundlage von Deep Learning erzeugt wurde, das die Softmax-Funktion als Aktivierungsfunktion für die Ausgabeschicht verwendet, kann die Wahrscheinlichkeit für jede Bezeichnung als Ableitung bezogenen werden. Die Wahrscheinlichkeit kann ein Wert zwischen 0 und 1 sein. Die Summe der Wahrscheinlichkeits-Werte der Bezeichnungen ist 1. Ein Wahrscheinlichkeits-Wert, der näher bei 1 liegt, bedeutet eine zuverlässigere Ableitung, wohingegen ein Wahrscheinlichkeits-Wert, der näher bei 0 liegt, eine weniger zuverlässige Ableitung bedeutet.
  • Wenn zum Beispiel die für das Erlernen des Modells verwendeten unbezeichneten Daten und bezeichneten Daten dieselben wie in 3 sind, wird erwartet, dass die Wahrscheinlichkeit für Bezeichnung-A und die Wahrscheinlichkeit für Bezeichnung-C jeweils etwa 0,5 beträgt, und ein Wahrscheinlichkeits-Wert nicht viel größer als der andere sein dürfte. Wenn die unbezeichneten Daten und die bezeichneten Daten, die für das Erlernen des Modells verwendet werden, dieselben wie in 4 sind, wird erwartet, dass die Wahrscheinlichkeit für Bezeichnung-A groß ist und nahe bei 1 liegt, und dass die Wahrscheinlichkeit für Bezeichnung-B und die Wahrscheinlichkeit für Bezeichnung-C klein ist und nahe bei 0 liegt. Wenn die unbezeichneten Daten und die bezeichneten Daten, die für das Erlernen des Modells verwendet werden, dieselben wie in 7 sind, wird erwartet, dass die Wahrscheinlichkeit für Bezeichnung-B und die Wahrscheinlichkeit für Bezeichnung-C jeweils etwa 0,5 beträgt, und dass ein Wahrscheinlichkeits-Wert nicht viel größer als der andere sein dürfte. Wenn also in einem Beispiel mit einem Schwellenwert von 0,7 die für das Erlernen des Modells verwendeten unbezeichneten Daten und bezeichneten Daten dieselben wie in 3 oder 7 sind, werden die unbezeichneten Daten als zu bezeichnend eingestuft. Wenn die unbezeichneten Daten und die bezeichneten Daten, die für das Erlernen des Modells verwendet werden, dieselben wie in 4 sind, werden die unbezeichneten Daten als nicht zu bezeichnende Daten bestimmt.
  • Der Vorgang der Bestimmung der Bezeichnungserforderlichkeit, der von der Bezeichnungsunterstützungs-Vorrichtung 10 gemäß Ausführungsform 3 durchgeführt wird, wird im Folgenden unter Bezugnahme auf 10 beschrieben, wobei der Schwerpunkt auf Unterschiede zu dem in 6 dargestellten Beispiel von Ausführungsform 1 liegt. Der Vorgang der Schritte S301, S305, S306 und S307 ist zu dem Vorgang der Schritte S101, S105, S 106 und S 107 in 6 identisch und wird daher nicht beschrieben.
  • Der Modell-Bezieher 15 in der Bezeichnungsunterstützungs-Vorrichtung 10 bezieht aus dem Modellspeicher 24 im Datenserver 20 das trainierte Modell (Schritt S302).
  • Der Bezeichnungserforderlichkeit-Bestimmer 13 in der Bezeichnungsunterstützungs-Vorrichtung 10 leitet unter Verwendung des in Schritt S302 bezogenen trainierten Modells die Bezeichnung ab, die an die in Schritt S301 bezogenen unbezeichneten Daten anzuhängen ist (Schritt S303).
  • Der Bezeichnungserforderlichkeit-Bestimmer 13 bestimmt, ob die während der Ableitung in Schritt S303 gewonnene Wahrscheinlichkeit größer als oder gleich dem Schwellenwert ist (Schritt S304).
  • Wenn die Wahrscheinlichkeit größer als oder gleich dem Schwellenwert ist (JA in Schritt S304), bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13, dass die unbezeichneten Daten nicht bezeichnet werden müssen (Schritt S305). Die Bezeichnungsunterstützungs-Vorrichtung 10 beendet dann den Vorgang der Bestimmung der Bezeichnungserforderlichkeit.
  • Wenn die Wahrscheinlichkeit kleiner als der Schwellenwert ist (NEIN in Schritt S304), bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13, dass die Bezeichnung der unbezeichneten Daten notwendig ist (Schritt S306). Der Vorgang in und nach Schritt S307 ist identisch zu dem Vorgang in und nach Schritt S107 aus 6 und wird daher nicht beschrieben.
  • Das Datenverwaltungssystem 1 gemäß Ausführungsform 3 weist die vorstehend beschriebene Konfiguration auf. Die Bezeichnungsunterstützungs-Vorrichtung 10 im Datenverwaltungssystem 1 gemäß Ausführungsform 3 bestimmt auf der Grundlage von dem trainierten Modell, das aus bezeichneten Daten erzeugt wurde, ob eine Bezeichnung von unbezeichneten Daten notwendig ist. Auf diese Weise kann die Bezeichnungsunterstützungs-Vorrichtung 10 gemäß Ausführungsform 3 den Aufwand für die Bezeichnung von unbezeichneten Daten in geeigneter Weise reduzieren.
  • Modifikationen
  • In den Ausführungsformen 1 und 2 ist der für die Bestimmung des Abstands verwendete Schwellenwert vorgegeben. Der Schwellenwert kann jedoch für jede Bestimmung der Bezeichnungserforderlichkeit aktualisiert werden. Wie in 11 dargestellt, umfasst die Bezeichnungsunterstützungs-Vorrichtung 10 beispielsweise ferner einen Parameter-Speicher 16, einen Parameter-Bezieher 17 und einen Parameter-Aktualisierer 18. Der Parameter-Speicher 16 speichert einen Schwellenwert, der für die Bestimmung des Abstands verwendet wird. Der Parameter-Bezieher 17 bezieht den im Parameter-Speicher 16 gespeicherten Schwellenwert. Der Bezeichnungserforderlichkeit-Bestimmer 13 bestimmt, ob der Abstand kleiner oder gleich dem vom Parameter-Bezieher 17 bezogenen Schwellenwert ist. Der Parameter-Aktualisierer 18 aktualisiert den im Parameter-Speicher 16 gespeicherten Schwellenwert auf der Grundlage des Ergebnisses der durch den Bezeichnungserforderlichkeit-Bestimmer 13 durchgeführten Bestimmung der Bezeichnungserforderlichkeit. Der Parameter-Speicher 16 ist ein Beispiel für ein Speichermittel in einer oder mehreren Ausführungsformen der vorliegenden Offenbarung. Der Parameter-Bezieher 17 ist ein Beispiel für ein Parameter-Beziehungsmittel in einer oder mehreren Ausführungsformen der vorliegenden Offenbarung. Der Parameter-Aktualisierer 18 ist ein Beispiel für ein Parameter-Aktualisierungsmittel in einer oder mehreren Ausführungsformen der vorliegenden Offenbarung.
  • Ein Schwellenwert mag anfangs für bestimmte Bezeichnungszieldaten, für die ein geeigneter Schwellenwert unklar ist, nicht bestimmt sein. Wenn der Schwellenwert zu niedrig ist, können Daten als zu bezeichnend bestimmt werden, obwohl die Bezeichnung nicht durchgeführt werden soll. Ist der Schwellenwert zu hoch, kann es sein, dass Daten als nicht zu bezeichnend eingestuft werden, obwohl die Bezeichnung durchgeführt werden soll. So kann beispielsweise ein Schwellenwert in geeigneter Weise angepasst werden, indem der Schwellenwert für Daten, die als zu bezeichnend bestimmt werden, erhöht oder der Schwellenwert für Daten, die als nicht zu bezeichnend bestimmt werden, herabgesetzt wird.
  • Der Schwellenwert der Wahrscheinlichkeit in Ausführungsform 3 kann auch in ähnlicher Weise modifiziert werden wie die vorstehende Modifikation. Genauer gesagt kann die Bezeichnungsunterstützungs-Vorrichtung 10 in Ausführungsform 3 ferner den Parameter-Speicher 16, den Parameter-Bezieher 17 und den Parameter-Aktualisierer 18 umfassen. Der Parameter-Speicher 16 kann den für die Bestimmung der Wahrscheinlichkeit verwendeten Schwellenwert speichern.
  • In den Ausführungsformen 1 und 2 führt der Bezeichnungserforderlichkeit-Bestimmer 13 die Bestimmung der Bezeichnungserforderlichkeit auf der Grundlage des Abstands zwischen den unbezeichneten Daten und den bezeichneten Daten durch. Stattdessen kann der Bezeichnungserforderlichkeit-Bestimmer 13 den Schwerpunkt der gesamten bezeichneten Daten berechnen und die Bestimmung der Bezeichnungserforderlichkeit auf der Grundlage des Abstands zwischen den unbezeichneten Daten und dem Schwerpunkt durchführen. In Ausführungsform 2 kann der Schwerpunkt für jede Gruppe bezeichneter Daten, denen die gleiche Bezeichnung angehängt ist, berechnet werden. Die Bestimmung der Bezeichnungserforderlichkeit kann auf der Grundlage des Abstands zwischen den unbezeichneten Daten und dem Schwerpunkt jeder Gruppe durchgeführt werden.
  • In den Ausführungsformen 1 und 2 berechnet der Bezeichnungserforderlichkeit-Bestimmer 13 den Abstand für Daten. Stattdessen kann der Bezeichnungserforderlichkeit-Bestimmer 13 die Merkmalsmenge (engl. feature quantity) der Daten berechnen und dann den Abstand für die Merkmalsmenge berechnen. Bei 100-dimensionalen Daten kann der Bezeichnungserforderlichkeit-Bestimmer 13 beispielsweise auf der Grundlage der 100-dimensionalen Daten die zweidimensionale Merkmalsmenge berechnen und dann den Abstand für die berechnete zweidimensionale Merkmalsmenge berechnen. Die Vorberechnung der Merkmalsmenge reduziert den Rechenaufwand bei der Abstandsberechnung.
  • In den Ausführungsformen 1 und 2 führt der Bezeichnungserforderlichkeit-Bestimmer 13 die Bestimmung der Bezeichnungserforderlichkeit auf der Grundlage durch, ob der Abstand zwischen den unbezeichneten Daten und allen bezeichneten Daten kleiner oder gleich dem Schwellenwert ist. Stattdessen kann die Bestimmung der Bezeichnungserforderlichkeit auf der Grundlage durchgeführt werden, ob die Anzahl der bezeichneten Datenelemente, deren Abstand zu den unbezeichneten Daten kleiner oder gleich dem Schwellenwert ist, kleiner oder gleich einer vorgegebenen Anzahl ist. Bei einem hohen Schwellenwert in den Ausführungsformen 1 und 2 kann beispielsweise ein einziges bezeichnetes Datenelement dazu führen, dass viele unbezeichnete Datenelemente nicht bezeichnet werden, wodurch möglicherweise extrem wenige bezeichnete Datenelemente erzeugt werden. Dies kann vermieden werden, indem die Bestimmung der Bezeichnungserforderlichkeit auf der Grundlage durchgeführt wird, ob die Anzahl der bezeichneten Datenelemente mit einem Abstand zu den unbezeichneten Daten, der kleiner oder gleich dem Schwellenwert ist, kleiner oder gleich der vorgegebenen Anzahl ist.
  • In Ausführungsform 3 führt die Bezeichnungsunterstützungs-Vorrichtung 10 die Bestimmung der Bezeichnungserforderlichkeit auf der Grundlage eines einzigen trainierten Modells durch. Stattdessen kann die Bezeichnungsunterstützungs-Vorrichtung 10 die Bestimmung der Bezeichnungserforderlichkeit auf der Grundlage mehrerer trainierter Modelle durchführen. Genauer gesagt erzeugt die Lernvorrichtung 50 mehrere trainierte Modelle. Die Bezeichnungsunterstützungs-Vorrichtung 10 führt die Bestimmung der Bezeichnungserforderlichkeit auf der Grundlage von Ableitungen aus den mehreren trainierten Modellen durch. Die Lernvorrichtung 50 erzeugt mehrere trainierte Modelle, die beispielsweise auf unterschiedlichen Trainingsalgorithmen oder unterschiedlichen Trainingsparametern basieren. Der Bezeichnungserforderlichkeit-Bestimmer 13 in der Bezeichnungsunterstützungs-Vorrichtung 10 leitet auf der Grundlage jedes trainierten Modells die Bezeichnung ab, die den unbezeichneten Daten angehängt werden soll. In einigen Beispielen bestimmt der Bezeichnungserforderlichkeit-Bestimmer 13 einfach, dass die Bezeichnung nicht durchgeführt werden soll, wenn alle auf der Grundlage der trainierten Modelle abgeleiteten Bezeichnungen übereinstimmen. In anderen Beispielen kann der Bezeichnungserforderlichkeit-Bestimmer 13 einfach bestimmen, dass die Bezeichnung nicht durchgeführt werden soll, wenn mindestens eine vorbestimmte Anzahl von Bezeichnungen, die auf der Grundlage der trainierten Modelle abgeleitet wurden, übereinstimmen.
  • In jeder Ausführungsform sind der Datenserver 20 und die Lernvorrichtung 50 in dem Fabriknetzwerk installiert. Stattdessen können der Datenserver 20 und die Lernvorrichtung 50 Cloud-Server im Internet sein. In diesem Beispiel kommunizieren die Bezeichnungsunterstützungs-Vorrichtung 10, die Datenbeziehungsvorrichtung 30 und das Endgerät 40 über das Internet mit dem Datenserver 20. Der Datenserver 20 und die Lernvorrichtung 50 können in derselben Cloud oder in getrennten Clouds installiert sein.
  • In jeder Ausführungsform sind die Bezeichnungsunterstützungs-Vorrichtung 10, das Endgerät 40 und die Lernvorrichtung 50 separate Geräte. Stattdessen kann ein Gerät als einige oder alle dieser Geräte dienen. Zum Beispiel kann die Bezeichnungsunterstützungs-Vorrichtung 10 als das Endgerät 40 fungieren, kann das Endgerät 40 als die Lernvorrichtung 50 fungieren oder kann die Bezeichnungsunterstützungs-Vorrichtung 10 als das Endgerät 40 und als die Lernvorrichtung 50 fungieren.
  • In der in 5 dargestellten Hardwarekonfiguration umfasst die Bezeichnungsunterstützungs-Vorrichtung 10 den Sekundärspeicher 1004. Der Sekundärspeicher 1004 kann sich jedoch außerhalb der Bezeichnungsunterstützungs-Vorrichtung 10 befinden, und die Bezeichnungsunterstützungs-Vorrichtung 10 und der Sekundärspeicher 1004 können über die Schnittstelle 1003 miteinander verbunden sein. In dieser Konfiguration kann der Sekundärspeicher 1004 ein Wechseldatenträger, wie z. B. ein USB-Stick oder eine Speicherkarte, sein.
  • Anstelle der in 5 dargestellten Hardwarekonfiguration kann die Bezeichnungsunterstützungs-Vorrichtung 10 eine dedizierte Schaltung aufweisen, die eine anwendungsspezifische integrierte Schaltung (application-specific integrated circuit - ASIC) oder ein feldprogrammierbares Gate-Array (FPGA) umfasst. In der in 5 dargestellten Hardwarekonfiguration können einige Funktionen der Bezeichnungsunterstützungs-Vorrichtung 10 beispielsweise durch eine dedizierte Schaltung implementiert werden, die mit der Schnittstelle 1003 verbunden ist.
  • Das in der Bezeichnungsunterstützungs-Vorrichtung 10 verwendete Programm kann auf einem nicht transitorischen, computerlesbaren Speichermedium, wie beispielsweise einer Compact Disc Read-Only Memory (CD-ROM), einer Digital Versatile Disc (DVD), einem USB-Flash-Laufwerk, einer Speicherkarte oder einer HDD vertrieben werden. Ein spezieller oder ein allgemein verwendbarer Computer, auf dem das Programm installiert ist, kann als Bezeichnungsunterstützungs-Vorrichtung 10 fungieren.
  • Das Programm kann in einem Speicher auf einem anderen Server im Internet gespeichert sein und kann von dem Server heruntergeladen werden.
  • Das Vorstehende beschreibt einige beispielhafte Ausführungsformen zu Erklärungszwecken. Obwohl in der vorangegangenen Diskussion spezifische Ausführungsformen vorgestellt wurden, werden Fachleute erkennen, dass Änderungen in Form und Detail vorgenommen werden können, ohne vom allgemeinen Geist und (Schutz-)Bereich der Erfindung abzuweichen. Dementsprechend sind die Beschreibung und die Zeichnungen eher in einem illustrativen als in einem einschränkenden Sinne zu verstehen. Diese ausführliche Beschreibung ist daher nicht in einem einschränkenden Sinne zu verstehen, und der (Schutz-)Bereich der Erfindung wird nur durch die beigefügten Ansprüche definiert, zusammen mit dem vollen Umfang der Äquivalente, auf welche diese Ansprüche berechtigt sind.
  • Bezugszeichenliste
  • 1
    Datenverwaltungssystem
    10
    Bezeichnungsunterstützungs-Vorrichtung
    11
    Bezieher für unbezeichnete Daten
    12
    Bezieher für bezeichnete Daten
    13
    Bezeichnungserforderlichkeit-Bestimmer
    14
    Bezeichnungszieldaten-Ausgabevorrichtung
    15
    Modell-Bezieher
    16
    Parameter-Speicher
    17
    Parameter-Bezieher
    18
    Parameter-Aktualisierer
    20
    Datenserver
    21
    Speicher für unbezeichnete Daten
    22
    Speicher für Bezeichnungszieldaten
    23
    Speicher für bezeichnete Daten
    24
    Modellspeicher
    30
    Datenbeziehungsvorrichtung
    40
    Endgerät
    50
    Lernvorrichtung
    1000
    Bus
    1001
    Prozessor
    1002
    Arbeitsspeicher
    1003
    Schnittstelle
    1004
    Sekundärspeicher
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • JP 201676073 [0004]

Claims (8)

  1. Programm, das einen Computer dazu veranlasst, als Beziehungsmittel für unbezeichnete Daten zum Beziehen von unbezeichneten Daten, und Bezeichnungserforderlichkeit-Bestimmungsmittel, um auf der Grundlage von bezeichneten Daten zu bestimmen, ob eine Bezeichnung der unbezeichneten Daten notwendig ist, zu fungieren.
  2. Programm nach Anspruch 1, wobei das Bezeichnungserforderlichkeit-Bestimmungsmittel auf der Grundlage von Hauptdaten, die in den bezeichneten Daten enthalten sind, und einer angehängten Bezeichnung, die in den bezeichneten Daten enthalten ist, bestimmt, ob die Bezeichnung der unbezeichneten Daten notwendig ist.
  3. Programm nach Anspruch 1 oder 2, wobei das Bezeichnungserforderlichkeit-Bestimmungsmittel auf der Grundlage eines Abstands zwischen den Hauptdaten, die in den bezeichneten Daten und den unbezeichneten Daten enthalten sind, bestimmt, ob die Bezeichnung der unbezeichneten Daten notwendig ist.
  4. Programm nach Anspruch 1 oder 2, wobei das Bezeichnungserforderlichkeit-Bestimmungsmittel auf der Grundlage eines trainierten Modells, das aus den bezeichneten Daten erzeugt wurde, bestimmt, ob eine Bezeichnung der unbezeichneten Daten erforderlich ist.
  5. Programm nach einem der Ansprüche 1 bis 4, wobei das Bezeichnungserforderlichkeit-Bestimmungsmittel auf der Grundlage eines bezeichneten Datenelements, das in den bezeichneten Daten enthalten ist und innerhalb eines vorbestimmten Zeitraums bezeichnet wurde, bestimmt, ob die Bezeichnung der unbezeichneten Daten notwendig ist.
  6. Programm nach einem der Ansprüche 1 bis 5, wobei das Programm den Computer ferner veranlasst, als Parameter-Beziehungsmittel zum Beziehen eines in einem Speichermittel gespeicherten Parameters, und Parameter-Aktualisierungsmittel zum Aktualisieren des in dem Speichermittel gespeicherten Parameters, zu fungieren wobei das Bezeichnungserforderlichkeit-Bestimmungsmittel auf der Grundlage des von dem Parameter-Beziehungsmittel bezogenen Parameters bestimmt, ob eine Bezeichnung der unbezeichneten Daten erforderlich ist, und das Parameter-Aktualisierungsmittel den Parameter auf der Grundlage eines Bestimmungsergebnisses aktualisiert, das vom Bezeichnungserforderlichkeit-Bestimmungsmittel bereitgestellt wird.
  7. Bezeichnungsunterstützungs-Vorrichtung, aufweisend: Beziehungsmittel für unbezeichnete Daten zum Beziehen von unbezeichneten Daten; und Bezeichnungserforderlichkeit-Bestimmungsmittel, um auf der Grundlage von bezeichneten Daten zu bestimmen, ob eine Bezeichnung der unbezeichneten Daten erforderlich ist.
  8. Bezeichnungsunterstützungs-Verfahren, aufweisend: Beziehen von unbezeichneten Daten; und Bestimmen auf der Grundlage von bezeichneten Daten, ob eine Bezeichnung der unbezeichneten Daten notwendig ist.
DE112021007831.3T 2021-06-15 2021-06-15 Programm, Bezeichnungsunterstützungs-Vorrichtung und Bezeichnungsunterstützungs-Verfahren Pending DE112021007831T5 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/022730 WO2022264279A1 (ja) 2021-06-15 2021-06-15 プログラム、ラベリング支援装置及びラベリング支援方法

Publications (1)

Publication Number Publication Date
DE112021007831T5 true DE112021007831T5 (de) 2024-04-04

Family

ID=82057342

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112021007831.3T Pending DE112021007831T5 (de) 2021-06-15 2021-06-15 Programm, Bezeichnungsunterstützungs-Vorrichtung und Bezeichnungsunterstützungs-Verfahren

Country Status (5)

Country Link
US (1) US20240028617A1 (de)
JP (1) JP7086311B1 (de)
CN (1) CN117377967A (de)
DE (1) DE112021007831T5 (de)
WO (1) WO2022264279A1 (de)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016076073A (ja) 2014-10-06 2016-05-12 日本電気株式会社 データ処理装置、データ処理方法、及び、コンピュータ・プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6905892B2 (ja) * 2017-08-04 2021-07-21 株式会社日立製作所 計算機システム
JP6844468B2 (ja) * 2017-08-09 2021-03-17 富士通株式会社 データ生成プログラム、データ生成方法及びデータ生成装置
JP7029363B2 (ja) * 2018-08-16 2022-03-03 エヌ・ティ・ティ・コミュニケーションズ株式会社 ラベリング装置、ラベリング方法及びプログラム
JP6952660B2 (ja) * 2018-08-28 2021-10-20 株式会社東芝 更新支援装置、更新支援方法およびプログラム
US11651291B2 (en) * 2020-01-30 2023-05-16 Salesforce, Inc. Real-time predictions based on machine learning models

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016076073A (ja) 2014-10-06 2016-05-12 日本電気株式会社 データ処理装置、データ処理方法、及び、コンピュータ・プログラム

Also Published As

Publication number Publication date
WO2022264279A1 (ja) 2022-12-22
JP7086311B1 (ja) 2022-06-17
JPWO2022264279A1 (de) 2022-12-22
US20240028617A1 (en) 2024-01-25
CN117377967A (zh) 2024-01-09

Similar Documents

Publication Publication Date Title
DE202017007517U1 (de) Aggregatmerkmale für maschinelles Lernen
DE112021000189T5 (de) Mikrodienst-Aufspaltungsstrategie von monolithischen Anwendungen
DE102019110721A1 (de) Workflow zum trainieren eines klassifikators für die qualitätsprüfung in der messtechnik
DE102011076780A1 (de) Verfahren und eine Vorrichtung zur Zustandsüberwachung
DE102019218138A1 (de) Ein proaktives und automatisiertes System und Verfahren davon zum Reparieren eines suboptimalen Betriebs einer Maschine
DE112017005651T5 (de) Vorrichtung zur Klassifizierung von Daten
DE102011076779A1 (de) Verfahren und Vorrichtung zur Vorhersage des Zustands einer Komponente oder eines Systems, Computerprogrammprodukt
DE102012212999A1 (de) Erkennen von Komponenten eines gebündelten Softwareproduktes
EP3671632A1 (de) Bildbasierte wartungsvorhersage und detektion von fehlbedienungen
DE102019124018A1 (de) Verfahren zum Optimieren von Tests von Regelsystemen für automatisierte Fahrdynamiksysteme
EP3719811A1 (de) Konsistenz von datenkennzeichnungen bei der medizinischen bildverarbeitung zur zellklassifizierung
DE102019126195A1 (de) Verfahren zur effizienten, simulativen Applikation automatisierter Fahrfunktionen
DE112019005467T5 (de) System und verfahren zum erkennen und vorhersagen von mustern eines anomalen sensorverhaltens einer maschine
DE102016216945A1 (de) Verfahren und Vorrichtung zum Ausführen einer Funktion basierend auf einem Modellwert eines datenbasierten Funktionsmodells basierend auf einer Modellgültigkeitsangabe
DE102021127244A1 (de) Künstliche Intelligenz Optimierungsplattform
DE102018109195A1 (de) Diagnosesystem und Verfahren zum Verarbeiten von Daten eines Kraftfahrzeugs
DE102015216953A1 (de) Verfahren und Vorrichtung zum Vermessen einer zu testenden Einheit
DE102017213510A1 (de) Verfahren und Vorrichtung zum Erzeugen eines maschinellen Lernsystems, und virtuelle Sensorvorrichtung
DE112021005678T5 (de) Normieren von OCT-Bilddaten
DE112016003529T5 (de) Suchsystem
DE102020215589A1 (de) Steuern eines deep-sequence-modells mit prototypen
DE112021007831T5 (de) Programm, Bezeichnungsunterstützungs-Vorrichtung und Bezeichnungsunterstützungs-Verfahren
DE112020003659T5 (de) Verfahren zur diagnose von anomalien, vorrichtung zur diagnose von anomalienund programm zur diagnose von anomalien
DE102018122115A1 (de) Verfahren zur Umgebungserfassung eines Fahrzeugs
DE102019103257A1 (de) Vorhersagesystem und -verfahren für anlagenanomalien

Legal Events

Date Code Title Description
R012 Request for examination validly filed