DE102018006044A1 - Funk-repeater-auswahleinrichtung und maschinelle lernvorrichtung - Google Patents

Funk-repeater-auswahleinrichtung und maschinelle lernvorrichtung Download PDF

Info

Publication number
DE102018006044A1
DE102018006044A1 DE102018006044.7A DE102018006044A DE102018006044A1 DE 102018006044 A1 DE102018006044 A1 DE 102018006044A1 DE 102018006044 A DE102018006044 A DE 102018006044A DE 102018006044 A1 DE102018006044 A1 DE 102018006044A1
Authority
DE
Germany
Prior art keywords
state
multiplexed
radio
data
communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102018006044.7A
Other languages
English (en)
Inventor
Hidesato TAKAOKI
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fanuc Corp
Original Assignee
Fanuc Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fanuc Corp filed Critical Fanuc Corp
Publication of DE102018006044A1 publication Critical patent/DE102018006044A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/14Relay systems
    • H04B7/15Active relay systems
    • H04B7/155Ground-based stations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/14Relay systems
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/04Programme control other than numerical control, i.e. in sequence controllers or logic controllers
    • G05B19/042Programme control other than numerical control, i.e. in sequence controllers or logic controllers using digital processors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Numerical Control (AREA)
  • Manipulator (AREA)
  • Selective Calling Equipment (AREA)

Abstract

Eine in einer Funk-Repeater-Auswahleinrichtung umfasste maschinelle Lernvorrichtung umfasst: eine Zustandsüberwachungseinheit, die als Zustandsvariablen, die gemultiplexte Kommunikationspfaddaten, welche den Aufbauzustand der gemultiplexten Kommunikationspfade festlegen, und gemultiplexte Funkkommunikationszustandsdaten, welche einen Zustand der gemultiplexten Funkkommunikation zwischen zu verwaltenden Vorrichtungen festlegen, darstellen, überwacht; eine Bestimmungsdatenerfassungseinheit, die Bestimmungsdaten erfasst, die ein Ergebnis der Bestimmung darüber, ob der Aufbauzustand der gemultiplexten Kommunikationspfade geeignet ist oder nicht, kennzeichnen; und eine Lerneinheit, die den Aufbauzustand der gemultiplexten Kommunikationspfade und die gemultiplexten Funkkommunikationszustandsdaten in Zuordnung zueinander basierend auf den Zustandsvariablen und den Bestimmungsdaten erlernt.

Description

  • ALLGEMEINER STAND DER TECHNK
  • Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft eine Funk-Repeater-Auswahleinrichtung und eine maschinelle Lernvorrichtung.
  • Beschreibung des Standes der Technik
  • Wenn eine Maschine, wie beispielsweise ein Roboter oder eine numerisch gesteuerte Werkzeugmaschine, angewiesen oder bedient wird, kann eine Funk-Bedientafel verwendet werden, die in der Lage ist, mit der Steuervorrichtung der Maschine in Funkkommunikation zu treten. So offenbaren beispielsweise die Japanischen Patentanmeldungsschriften Nr. 2007-233817 und 2011-000652 jeweils ein System, in dem eine Anweisungs-/Bedientafel und eine Steuervorrichtung zwischen sich eine Funkkommunikation durchführen, um einer Maschine, wie einem Roboter, zu ermöglichen, gemäß einer Anweisung von der Anweisungs-/Bedientafel gesteuert zu werden.
  • Die Sicherheitsnormen für Roboter schreiben vor, dass bei Verwendung einer Funk-Anweisungs-/Bedientafel für die Anweisung/Bedienung eines Roboters oder dergleichen, der Roboter bei Unterbrechung eines Sicherheitssignals einen Schutzstopp vornehmen muss. In einer Situation, in der eine große Anzahl von Funkeinrichtungen (die nicht nur eine weitere Funk-Anweisungs-/Bedientafel, sondern auch ein von einem Arbeiter getragenes Mobiltelefon, eine externe Funkeinrichtung und dergleichen umfassen) an einem Arbeitsplatz verwendet wird und Funkleitungen belegt sind, ist es demzufolge durchaus möglich, dass die Funkkommunikation unterbrochen wird. Dadurch wird der Betrieb eines Roboters häufig gestoppt und ein komfortabler Anweisungsbetrieb kann nicht durchgeführt werden. In einer Umgebung, in der eine große Anzahl von Funkeinrichtungen vorhanden ist, ist es ferner möglich, Gegenmaßnahmen zu ergreifen, indem der Wechsel eines Funkkanals oder dergleichen unter Verwendung der z.B. in der japanischen Patentanmeldungsschrift Nr. 2015-201728 oder dergleichen offenbarten Technik durchführt wird. Selbst bei Anwendung einer solchen Technik ist es jedoch schwierig, die Unterbrechung der Funkkommunikation unter dem Einfluss des Abstands und der Positionsbeziehung zwischen einer Anweisungs-/Bedientafel und einer Steuervorrichtung, die ein zu bearbeitendes Objekt oder den Standort und Betrieb einer anderen Maschine steuert, vollständig zu verhindern.
  • Als ein Verfahren zur Lösung eines solchen Problems kann in Erwägung gezogen werden, dass z.B. eine Mehrzahl von Pfaden zum Senden von Funksignalen an Steuervorrichtungen verwendet wird, wie in 7 dargestellt. Somit wird eine redundante Datenübertragung von jedem der Funk-Repeater (wie z.B. das Senden der gleichen Daten unter Verwendung einer Mehrzahl von Funkkommunikationspfaden) durchgeführt, um die Möglichkeit der Unterbrechung der Funkkommunikation zu reduzieren. In dem in 7 gezeigten Beispiel werden nicht nur die Funkkommunikationspfade, die für die direkte Funkkommunikation von der Funk-Anweisungs-/Bedientafel zu den Steuervorrichtungen, die die zu unterweisenden Roboter steuern, verwendet werden, sondern auch die Funkkommunikationspfade, die über den dazwischen geschalteten Funk-Repeater verbunden sind, dargestellt. Neben dem Funk-Repeater werden auch die in die Steuervorrichtungen eingebetteten Funkmodule, die die zu unterweisenden Roboter steuern, als Funk-Repeater betrachtet, und über solche Funk-Repeater wird die Mehrzahl von Funkkommunikationspfaden zur Bildung eines gemultiplexten Kommunikationspfads verbunden. Durch die Durchführung einer gemultiplexten Funkkommunikation über den gemultiplexten Kommunikationspfad ist es auch dann möglich, wenn einer der Funkübertragungspfade durch ein Objekt, das sich in einer Fabrik befindet, unterbrochen wird, z.B. aufgrund der Bewegung eines Anweisungen gebenden Arbeiters, einen Abbruch der Kommunikation zwischen der Funk-Anweisungs-/Bedientafel und der Steuervorrichtung zu verhindern.
  • Bei Anwendung einer solchen Technik für jede Funk-Anweisungs-/Bedientafel wird bestimmt, welche und wie viele Funkkommunikationspfade derselben zuzuordnen sind, und unter Verwendung der zugeordneten Funkübertragungspfade wird ein gemultiplexter Kommunikationspfad gebildet. Während einer gemultiplexten Funkkommunikation unter Verwendung des gemultiplexten Kommunikationspfads wird der Sendezustand einer Funkwelle zwischen einzelnen Funkeinrichtungen überwacht und, wenn die Kommunikation nicht mehr durchgeführt werden kann oder die Funkwelle schwach ist, wird ein Wechsel zu einem anderen Funkkommunikationspfad (wie z.B. der Wechsel des verwendeten Funk-Repeaters oder ein Kanalwechsel) durchgeführt. Da an einem Arbeitsplatz eine Mehrzahl von Funk-Anweisungs-/Bedientafeln vorhanden sind, ist es notwendig, einen gemultiplexten Kommunikationspfad zu bilden oder den Funkkommunikationspfad dynamisch zu wechseln, um jeder der Vorrichtungen, die eine gemultiplexte Funkkommunikation durchführt, zu ermöglichen, komfortabel zu kommunizieren.
  • Da Funksignale jedoch einer Reflexion/Beugung/Abschwächung (gegenseitige Schwächung) unterliegen und sich eine Umwelt in Echtzeit unter dem Einfluss eines Signals einer anderen Funkeinrichtung und dergleichen ändert, ist es notwendig, eine angemessene Zuordnung von Funkkommunikationspfaden (Zuordnung eines Funk-Repeaters, der für gemultiplexte Funkkommunikation verwendet wird, einer untergeordneten Steuereinrichtung und eines Kanals) in Echtzeit durchzuführen, während der Zustand der Umwelt rechtzeitig erkannt wird, was zu einer schwierigen Aufgabe führt.
  • KURZDARSTELLUNG DER ERFINDUNG
  • Es ist daher eine Aufgabe der vorliegenden Erfindung, eine Funk-Repeater-Auswahleinrichtung und eine maschinelle Lernvorrichtung bereitzustellen, die es ermöglichen, in einer Umwelt, in der eine Mehrzahl von Funkeinrichtungen in gemischter Beziehung vorhanden sind, Funkkommunikationspfade, die zur gemultiplexten Funkkommunikation verwendet werden, so zuzuordnen, dass jede der Funkeinrichtungen bequem kommunizieren kann. Die Funk-Repeater-Auswahleinrichtung der vorliegenden Erfindung löst das vorstehend beschriebene Problem durch Auswählen einer Mehrzahl von Funk-Repeatern (Funkeinrichtungen, die jeweils die Funktion der Wiederholung einer Funkwelle aufweisen), die für eine von jeder der zu verwaltenden Vorrichtungen durchgeführte gemultiplexte Funkkommunikation verwendet werden, und durch Bewirken, dass die maschinelle Lernvorrichtung ein maschinelles Lernen des Aufbaus (oder Wechseln) eines gemultiplexten Kommunikationspfads durch bestärkendes Lernen ausführt.
  • Eine Ausführungsform der vorliegenden Erfindung ist eine Funk-Repeater-Auswahleinrichtung, die gemultiplexte Kommunikationspfade aufbaut oder wechselt, die für die Kommunikation zwischen zu verwaltenden Vorrichtungen verwendet werden, wobei die Funk-Repeater-Auswahleinrichtung umfasst: eine maschinelle Lernvorrichtung, die lernt, wie die gemultiplexten Kommunikationspfade zugeordnet werden, wobei die maschinelle Lernvorrichtung umfasst: eine Zustandsüberwachungseinheit, die als Zustandsvariablen gemultiplexte Kommunikationspfaddaten, welche den Aufbauzustand der gemultiplexten Kommunikationspfade festlegen, und gemultiplexte Funkkommunikationszustandsdaten, welche einen Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen festlegen, darstellen, überwacht; eine Bestimmungsdatenerfassungseinheit, die Bestimmungsdaten erfasst, die ein Ergebnis der Bestimmung darüber, ob der Aufbauzustand der gemultiplexten Kommunikationspfade geeignet ist oder nicht, kennzeichnen; und eine Lerneinheit, die den Aufbauzustand der gemultiplexten Kommunikationspfade und die gemultiplexten Funkkommunikationszustandsdaten in Zuordnung zueinander basierend auf den Zustandsvariablen und den Bestimmungsdaten erlernt.
  • Eine weitere Ausführungsform der vorliegenden Erfindung ist eine maschinelle Lernvorrichtung, die einen Aufbauzustand von gemultiplexten Kommunikationspfaden lernt, die für die Kommunikation zwischen den zu verwaltenden Vorrichtungen verwendet werden, wobei die maschinelle Lernvorrichtung umfasst: eine Zustandsüberwachungseinheit, die als Zustandsvariablen, die gemultiplexte Kommunikationspfaddaten, welche den Aufbauzustand der gemultiplexten Kommunikationspfade festlegen, und gemultiplexte Funkkommunikationszustandsdaten, welche einen Zustand der gemultiplexten Funkkommunikation zwischen zu verwaltenden Vorrichtungen festlegen, darstellen, überwacht; eine Bestimmungsdatenerfassungseinheit, die Bestimmungsdaten erfasst, die ein Ergebnis der Bestimmung darüber, ob der Aufbauzustand der gemultiplexten Kommunikationspfade geeignet ist oder nicht, kennzeichnen; und eine Lerneinheit, die den Aufbauzustand der gemultiplexten Kommunikationspfade und die gemultiplexten Funkkommunikationszustandsdaten in Zuordnung zueinander basierend auf den Zustandsvariablen und den Bestimmungsdaten erlernt.
  • Die vorliegende Erfindung ermöglicht eine geeignete Auswahl des Funk-Repeaters, der von jeder aus einer Mehrzahl von Funkvorrichtungen verwendet werden soll. Folglich wird das von einer Funk-Anweisungs-/Bedientafel an die Funk-Repeater-Auswahleinrichtung eines Roboters gesendete Signal nicht mehr unterbrochen, sodass einem Arbeiter ermöglicht wird, einen komfortable Anweisungsvorgang durchzuführen.
  • Figurenliste
  • Die vorstehenden und andere Aufgaben und Merkmale der vorliegenden Erfindung werden durch die folgende Beschreibung ihrer Ausführungsformen mit Bezugnahme auf die beigefügten Zeichnungen verdeutlicht, wobei:
    • 1 ein schematisches Hardware-Konfigurationsdiagramm einer Funk-Repeater-Auswahleinrichtung gemäß der ersten Ausführungsform ist;
    • 2 ein schematisches Funktionsblockdiagramm der Funk-Repeater-Auswahleinrichtung gemäß der ersten Ausführungsform ist;
    • 3 ein schematisches Funktionsblockdiagramm ist, das eine Form der Auswahleinrichtung für Funk-Repeater darstellt;
    • 4 ein schematisches Flussdiagramm ist, das eine Form eines maschinellen Lernverfahrens zeigt;
    • 5A eine Ansicht ist, die ein Neuron darstellt;
    • 5B eine Ansicht ist, die ein neuronales Netzwerk darstellt;
    • 6 ein schematisches Funktionsblockdiagramm einer Funk-Repeater-Auswahleinrichtung gemäß der zweiten Ausführungsform ist; und
    • 7 ist eine Ansicht ist, die ein Beispiel eines Systems zeigt, das eine gemultiplexte Kommunikation durchführt.
  • AUSFÜHRLICHE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
  • Im Folgenden werden die Ausführungsformen der vorliegenden Erfindung mit Bezug auf die Zeichnungen beschrieben.
  • 1 ist ein schematisches Hardware-Konfigurationsdiagramm, das eine Funk-Repeater-Auswahleinrichtung gemäß der ersten Ausführungsform und den Hauptabschnitt einer Werkzeugmaschine darstellt, die von der Funk-Repeater-Auswahleinrichtung gesteuert wird. Eine Funk-Repeater-Auswahleinrichtung 1 kann als übergeordnete Vorrichtung (wie ein Leitrechner oder eine Zellensteuerung) implementiert werden, die zu verwaltende Vorrichtungen verwaltet, wie z.B. Steuervorrichtungen (nicht dargestellt), die eine Mehrzahl von Robotern (nicht dargestellt) steuern, die an einem Arbeitsplatz, wie z.B. eine Fabrik, aufgestellt sind, numerisch gesteuerte Werkzeugmaschinen (nicht dargestellt), Funk-Repeater und Funk-Anweisungs-/Bedientafeln. Eine CPU 11, die in der Funk-Repeater-Auswahleinrichtung 1 gemäß der vorliegenden Ausführungsform umfasst ist, ist ein Prozessor, der die Funk-Repeater-Auswahleinrichtung 1 vollständig steuert. Die CPU 11 liest das in einem ROM 12 gespeicherte Systemprogramm über einen Bus 20 und steuert die gesamte Funk-Repeater-Auswahleinrichtung 1 entsprechend dem Systemprogramm. Ein RAM 13 speichert temporär Berechnungsdaten und Anzeigedaten.
  • Ein nichtflüchtiger Speicher 14 ist als Speicher konfiguriert, der einen gespeicherten Zustand auch dann hält, z.B. durch einen Backup-Prozess unter Verwendung einer nicht gezeigten Batterie, wenn die Stromquelle der Funk-Repeater-Auswahleinrichtung 1 ausgeschaltet ist. Der nichtflüchtige Speicher 14 speichert nicht nur die Dateneingabe über eine Eingabevorrichtung, wie eine nicht dargestellte Tastatur, und die Eingabe des Betriebsprogramms über eine Schnittstelle, sondern auch Verwaltungsdaten (Information, wie die Typen und verwendbaren Protokolle der zu verwaltenden Vorrichtungen, die Kommunikationsadressen der zu verwaltenden Vorrichtungen und die aktuellen Standorte, an denen sich die zu verwaltenden Vorrichtungen befinden) in Bezug auf die zu verwaltenden Vorrichtungen. Das Programm und verschiedene im nichtflüchtigen Speicher 14 gespeicherte Daten können bei dessen Ausführung/Verwendung auch auf den RAM 13 erweitert werden.
  • Im ROM 12 werden verschiedene Systemprogramme (einschließlich eines Systemprogramms zur Steuerung der Kommunikation mit einer später beschriebenen maschinellen Lernvorrichtung 100) zur Ausführung von Anweisungen, die den zu verwaltenden Vorrichtungen erteilt werden, gespeichert.
  • Die Funk-Repeater-Auswahleinrichtung 1 ist so ausgebildet, dass sie Anweisungen und Daten zu und von den zu verwaltenden Vorrichtungen durch verdrahtete Kommunikation/Funkkommunikation über eine drahtgebundene Kommunikationsschnittstelle 15 oder eine Funkkommunikationsschnittstelle 16 senden und empfangen kann. Derartige Kommunikationsschnittstellen können jedes Kommunikationsprotokoll verwenden, solange Anweisungen und Daten zu und von den zu verwaltenden Vorrichtungen gesendet und empfangen werden können.
  • Eine Schnittstelle 21 ist dazu vorgesehen, die Funk-Repeater-Auswahleinrichtung 1 und die maschinelle Lernvorrichtung 100 zu verbinden. Die maschinelle Lernvorrichtung 100 umfasst einen Prozessor 101, der die gesamte maschinelle Lernvorrichtung 100 steuert, einen ROM 102, der Systemprogramme und dergleichen speichert, einen RAM 103 zum Durchführen einer Zwischenspeicherung in jedem der Prozesse, die sich auf maschinelles Lernen beziehen, und einen nichtflüchtigen Speicher 104, der zum Speichern von Lernmodellen und dergleichen verwendet wird. Die maschinelle Lernvorrichtung 100 kann verschiedene Informationen (wie Kommunikationszustände der zu verwaltenden Vorrichtungen und deren aktuelle Standorte) überwachen, die von der Funk-Repeater-Auswahleinrichtung 1 über die Schnittstelle 21 erfasst werden können. Die Funk-Repeater-Auswahleinrichtung 1 empfängt ferner eine Anweisung zum Durchführen eines Kommunikationsaufbaus für gemultiplexte Funkkommunikation, die von der maschinellen Lernvorrichtung 100 ausgegeben wird, und gibt Anweisungen zum Aufbauen oder Wechseln eines gemultiplexten Kommunikationspfades zu den zu verwaltenden Vorrichtungen über die drahtgebundene Kommunikationsschnittstelle 15 oder die Funkkommunikationsschnittstelle 16 aus.
  • 2 ist ein schematisches Funktionsblockdiagramm der Funk-Repeater-Auswahleinrichtung 1 und der maschinellen Lernvorrichtung 100 gemäß der ersten Ausführungsform. Die maschinelle Lernvorrichtung 100 umfasst Software (wie einen Lernalgorithmus) und Hardware (wie den Prozessor 101), die der maschinellen Lernvorrichtung 100 ermöglichen, den Aufbau oder Wechsel des gemultiplexten Kommunikationspfades in Bezug auf den Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen durch einen sogenannten maschinellen Lernprozess zu erlernen. Was von der in der Funk-Repeater-Auswahleinrichtung 1 umfassten maschinellen Lernvorrichtung 100 gelernt werden soll, entspricht einer Modellstruktur, die die Korrelation zwischen dem Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen und dem Aufbau oder dem Wechsel des gemultiplexten Kommunikationspfads darstellt.
  • Wie im Funktionsblock in 2 gezeigt umfasst die in der Funk-Repeater-Auswahleinrichtung 1 umfasste maschinelle Lernvorrichtung 100 eine Zustandsüberwachungseinheit 106, die gemultiplexte Kommunikationspfaddaten S1, die den Aufbauzustand eines gemultiplexten Kommunikationspfades zeigen, und gemultiplexte Funkkommunikationszustandsdaten S2, die den Zustand der gemultiplexten Funkkommunikation (Qualität der gemultiplexten Funkkommunikation) zwischen den zu verwaltenden Vorrichtungen zeigen, als Zustandsvariablen S überwacht, die den aktuellen Zustand einer Umwelt anzeigen, eine Bestimmungsdatenerfassungseinheit 108, die Bestimmungsdaten D erfasst, die gemultiplexte Kommunikationspfadbestimmungsdaten D1 umfasst, die das Ergebnis des Bestimmens darüber, ob der Aufbauzustand des gemultiplexten Kommunikationspfads geeignet ist oder nicht, zeigen, und eine Lerneinheit 110, die das Lernen unter Verwendung der Zustandsvariablen S und der Bestimmungsdaten D durch Zuordnen der gemultiplexten Kommunikationspfaddaten S1 zum Zustand der gemultiplexten Funkkommunikation zwischen zu verwaltenden Vorrichtungen durchführt.
  • Die Zustandsüberwachungseinheit 106 kann als, z.B., eine Funktion des Prozessors 101 konfiguriert werden. Alternativ kann die Zustandsüberwachungseinheit 106 als, z.B., im ROM 102 gespeicherte Software konfiguriert werden, die die Funktion des Prozessors 101 bewirkt. Die gemultiplexten Kommunikationspfaddaten S1, die zu den von der Zustandsüberwachungseinheit 106 überwachten Zustandsgrößen S gehören, können als die Zuordnung von Funkkommunikationspfaden zu einzelnen Funk-Anweisungs-/Bedientafeln (Zuordnung von Funk-Repeatern, den Funkmodulen von Steuereinrichtungen und einem Funkkommunikationskanal, die für die gemultiplexte Funkkommunikation zu den einzelnen Funk-Anweisungs-/Bedientafeln verwendet werden) erfasst werden.
  • In einem frühen Lernstadium kann als die gemultiplexten Kommunikationspfaddaten S1 der Aufbauzustand des gemultiplexten Kommunikationspfads verwendet werden, der z.B. von einem im Aufbauen von gemultiplexter Funkkommunikation erfahrenen Arbeiter festgestellt wird und an die Funk-Repeater-Auswahleinrichtung 1 übergeben wird. In einem eher fortgeschrittenen Lernstadium kann als die gemultiplexten Kommunikationspfaddaten S1 der Aufbauzustand des gemultiplexten Kommunikationspfades verwendet werden, der in einem unmittelbar vorhergehenden Lernzyklus von der maschinellen Lernvorrichtung 100 basierend auf einem Lernergebnis aus der Lerneinheit 110 bestimmt wird. In einem solchen Fall kann es auch möglich sein, dass die maschinelle Lernvorrichtung 100 den bestimmten Aufbauzustand des gemultiplexten Kommunikationspfads pro Lernzyklus in dem RAM 13 zwischenspeichert und die Zustandsüberwachungseinheit 106 den Aufbauzustand des gemultiplexten Kommunikationspfads, der im unmittelbar vorhergehenden Lernzyklus durch die maschinelle Lernvorrichtung 100 bestimmt wird, aus dem RAM 103 erfasst.
  • Als gemultiplexte Funkkommunikationszustandsdaten S2, die zu den Zustandsgrößen S gehören, können z.B. die Funkfeldstärke der Funkkommunikation, eine Funkkommunikationserfolgsrate (gemäß einem Kommunikationsprotokoll ermittelte Kommunikationserfolgsrate, wie das Verhältnis der Anzahl der erfolgreichen Datenübertragungssitzungen zur Gesamtzahl der Datenübertragungssitzungen oder das Verhältnis der Anzahl der Male, die die Daten nur während eines vorbestimmten Zeitraums nicht erreicht haben, zur Gesamtzahl der Datenübertragungssitzungen) oder dergleichen verwendet werden, die von der Funk-Repeater-Auswahleinrichtung 1 aus jeder der zu verwaltenden Vorrichtungen erfasst wird. Die Funk-Repeater-Auswahleinrichtung 1 kann von jeder der zu verwaltenden Vorrichtungen Information über den Zustand der Funkkommunikation anfordern und Daten, wie die Funkfeldstärke der Funkkommunikation oder die Erfolgsrate der Funkkommunikation, als Reaktion darauf von der zu verwaltenden Vorrichtung erhalten. Die Zustandsüberwachungseinheit 106 kann die von jeder der zu verwaltenden Vorrichtungen erfassten Daten, wie die Funkfeldstärke der Funkkommunikation oder die von jeder der zu verwaltenden Vorrichtungen erfasste Funkkommunikationserfolgsrate, direkt als die gemultiplexten Funkkommunikationszustandsdaten S2 verwenden oder auch einen Wert, der den standardisierten Zustand der Funkkommunikation (Qualität der Funkkommunikation) darstellt, der aus den Daten, wie der Funkfeldstärke der Funkkommunikation oder der Funkkommunikationserfolgsrate von jeder der zu verwaltenden Vorrichtungen unter Verwendung eines vorbestimmten Ausdrucks berechnet wird, als die gemultiplexten Funkkommunikationszustandsdaten S2 verwenden.
  • Die Bestimmungsdatenerfassungseinheit 108 kann als, z.B., eine Funktion des Prozessors 101 konfiguriert werden. Alternativ kann die Bestimmungsdatenerfassungseinheit 108, als, z.B., im ROM 102 gespeicherte Software konfiguriert werden, die die Funktion des Prozessors 101 bewirkt. Die Bestimmungsdatenerfassungseinheit 108 kann als die Bestimmungsdaten D die gemultiplexten Kommunikationspfadbestimmungsdaten D1 als einen Wert verwenden, der das Ergebnis des Bestimmens darüber, ob der Aufbauzustand des gemultiplexten Kommunikationspfades geeignet ist oder nicht, anzeigt. Die Bestimmungsdatenerfassungseinheit 108 kann die Bestimmungsdaten D basierend auf der Funkfeldstärke der Funkkommunikation, der Funkkommunikationserfolgsrate oder dergleichen bestimmen, die erhalten werden, wenn die Zustandsüberwachungseinheit 106 die gemultiplexten Funkkommunikationszustandsdaten S2 überwacht und von jeder der zu verwaltenden Vorrichtungen erfasst. Die Bestimmungsdaten D sind ein Index, der das Ergebnis der Durchführung eines Anweisungsvorgangs durch gemultiplexte Funkkommunikation unter Verwendung jeder der Funk-Anweisungs-/Bedientafeln unter den Zustandsvariablen S anzeigt.
  • In Bezug auf die von der Lerneinheit 110 durchgeführten Lernzyklen basieren die gleichzeitig in die Lerneinheit 110 eingegebenen Zustandsvariablen S auf Daten, die einen Lernzyklus vor der Erfassung der Bestimmungsdaten D erhalten wurden. Während die in der Funk-Repeater-Auswahleinrichtung 1 umfasste maschinelle Lernvorrichtung 100 das Lernen betreibt, wird in der Umwelt die Erfassung der gemultiplexten Funkkommunikationszustandsdaten S2, die Ausführung des Anweisungsvorgangs unter Verwendung der Funk-Anweisungs-/Bedientafeln über den gemultiplexten Kommunikationspfad, der basierend auf den gemultiplexten Kommunikationspfaddaten S1 aufgebaut oder gewechselt wird, und die Erfassung der Bestimmungsdaten D wiederholt durchgeführt.
  • Die Lerneinheit 110 kann als, z.B., eine Funktion des Prozessors 101 konfiguriert werden. Alternativ kann die Lerneinheit 110 als, z.B., im ROM 102 gespeicherte Software konfiguriert werden, die die Funktion des Prozessors 101 bewirkt. Die Lerneinheit 110 lernt die gemultiplexten Kommunikationspfaddaten S1 in Bezug auf den Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen. Die Lerneinheit 110 kann das Lernen basierend auf Datensätzen, die die oben beschriebenen Zustandsvariablen S und die Bestimmungsdaten D umfassen, wiederholt durchführen. Während ein Lernzyklus für die gemultiplexten Kommunikationspfaddaten S1 in Bezug auf den Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen wiederholt wird, werden die gemultiplexten Funkkommunikationszustandsdaten S2 unter den Zustandsvariablen S aus dem Zustand der gemultiplexten Funkkommunikation erfasst, der, wie vorstehend beschrieben, einen Lernzyklus zuvor erfasst wurde, wird von den gemultiplexten Kommunikationspfaddaten S1 unter den Zustandsvariablen S angenommen, dass sie den basierend auf den vorherigen Lernergebnissen erhaltenen Aufbauzustand des gemultiplexten Kommunikationspfades anzeigen, und wird von den Bestimmungsdaten D angenommen, dass sie das Ergebnis des Bestimmens darüber, ob der aktuelle Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen in dem aktuellen Lernzyklus in dem Zustand, in dem der gemultiplexte Funkkommunikationspfad basierend auf den gemultiplexten Kommunikationspfaddaten S1 aufgebaut oder gewechselt wurde, geeignet ist oder nicht.
  • Durch Wiederholen eines solchen Lernzyklus kann die Lerneinheit 110 automatisch ein Merkmal erkennen, das die Korrelation zwischen dem Zustand der gemultiplexten Funkkommunikation unter den zu verwaltenden Vorrichtungen (gemultiplexte Funkkommunikationszustandsdaten S2) und dem Aufbauzustand des gemultiplexten Kommunikationspfades in Bezug auf den Zustand anzeigt. Zum Zeitpunkt des Beginns eines Lernalgorithmus ist die Korrelation zwischen den gemultiplexten Funkkommunikationszustandsdaten S2 und dem Aufbauzustand des gemultiplexten Kommunikationspfades im Wesentlichen unbekannt. Im Zuge des Lernens erkennt die Lerneinheit 110 jedoch allmählich das Merkmal und interpretiert die Korrelation. Wenn die Interpretation der Korrelation zwischen den gemultiplexten Funkkommunikationszustandsdaten S2 und dem Aufbauzustand des gemultiplexten Kommunikationspfades auf ein ziemlich zuverlässiges Niveau fortschreitet, kann das von der Lerneinheit 110 wiederholt ausgegebene Lernergebnis verwendet werden, um eine Aktionswahl darüber zu treffen (eine Entscheidung zu treffen), was mit dem Aufbauzustand des gemultiplexten Kommunikationspfades in Bezug auf den aktuellen Zustand (d.h. dem aktuellen Zustand der gemultiplexten Funkkommunikation zwischen zu verwaltenden Vorrichtungen) zu tun ist (wie man den gemultiplexten Kommunikationspfad aufbaut oder wechselt). Mit anderen Worten, die Lerneinheit 110 ermöglicht die Korrelation zwischen dem aktuellen Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen und dass die Aktion des Entscheidens, was mit dem Aufbauzustand des gemultiplexten Kommunikationspfades in Bezug auf den Zustand zu tun ist (wie man den gemultiplexten Kommunikationspfad aufbaut oder wechselt), allmählich einer optimalen Lösung angenähert wird.
  • Wie vorstehend beschrieben, lernt die Lerneinheit 110 in der maschinellen Lernvorrichtung 100, die in der Auswahlvorrichtung 1 des Funk-Repeaters umfasst ist, den Aufbauzustand des gemultiplexten Kommunikationspfades (Aufbau oder Wechsel des gemultiplexten Kommunikationspfades) gemäß dem Algorithmus des maschinellen Lernens unter Verwendung der von der Zustandsüberwachungseinheit 106 überwachten Zustandsvariablen S und der von der Bestimmungsdatenerfassungseinheit 108 erfassten Bestimmungsdaten D. Die Zustandsvariablen S umfassen Datensätze, die für den Einfluss von Störungen unempfindlich sind, wie beispielsweise die gemultiplexten Kommunikationspfaddaten S1 und die gemultiplexten Funkkommunikationszustandsdaten S2. Die Bestimmungsdaten D werden eindeutig bestimmt, indem der aktuelle Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen über die Funk-Repeater-Auswahleinrichtung 1 erfasst wird. Mit der in der Funk-Repeater-Auswahleinrichtung 1 umfassten maschinellen Lernvorrichtung 100 ist es daher möglich, unter Verwendung eines Lernergebnisses aus der Lerneinheit 110, den Aufbauzustand des gemultiplexten Kommunikationspfads gemäß dem Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen automatisch und genau zu bestimmen, ohne von einem Rechenvorgang oder einer Schätzung abhängig zu sein.
  • Wenn der Aufbauzustand des gemultiplexten Kommunikationspfades ohne Abhängigkeit von einem Rechenvorgang oder einer Schätzung automatisch bestimmt werden kann, indem lediglich der aktuelle Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen (gemultiplexte Funkkommunikationszustandsdaten S2) erkannt wird, kann umgehend ein geeigneter Wert bestimmt werden, der den Aufbauzustand des gemultiplexten Kommunikationspfades darstellt. Folglich ist es möglich, den gemultiplexten Kommunikationspfad dem Zustand entsprechend effizient aufzubauen oder zu wechseln.
  • In einer Modifikation der in der Funk-Repeater-Auswahleinrichtung 1 umfassten maschinellen Lernvorrichtung 100 kann die Zustandsüberwachungseinheit 106 als die Zustandsvariablen S Standortinformationsdaten S3 verwenden, die den Standort jeder der zu verwaltenden Vorrichtungen anzeigen. Unter den Standorten der zu verwaltenden Vorrichtungen können auch die Standorte der fest platzierten zu verwaltenden Vorrichtungen (wie die Steuervorrichtungen von Robotern, numerisch gesteuerten Werkzeugmaschinen und Funk-Repeater) im Voraus als Verwaltungsdaten bezüglich der zu verwaltenden Vorrichtungen festgelegt werden, die im nichtflüchtigen Speicher 14 der Funk-Repeater-Auswahleinrichtung 1 gespeichert sind. Andererseits können die Standorte der beweglichen zu verwaltenden Vorrichtungen (z. B. Funk-Anweisungs-/Bedientafeln) auch basierend auf dem Ergebnis der Erfassung der Stärken von Funkwellen in den zu verwaltenden Vorrichtungen unter Verwendung des in einer anderen zu verwaltenden Vorrichtung umfassten Funkmoduls berechnet werden.
  • Gemäß der vorstehend beschriebenen Modifikation wird der maschinellen Lernvorrichtung 100 ermöglicht, den Aufbauzustand des gemultiplexten Kommunikationspfades in Bezug auf sowohl den Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen als auch den Standort jeder der zu verwaltenden Vorrichtungen zu erlernen. Wenn sich beispielsweise Arbeiter, die Funk-Anweisungs-Bedientafeln verwenden, an einem Arbeitsplatz bewegen, ist es möglich, eine Anweisung zum Aufbauen oder zum Wechseln eines optimalen gemultiplexten Kommunikationspfads zu erteilen, indem auch deren Bewegungsorte berücksichtigt werden.
  • In einer weiteren Modifikation der in der Funk-Repeater-Auswahleinrichtung 1 umfassten maschinellen Lernvorrichtung 100 können als die von der Zustandsüberwachungseinheit 106 überwachten Zustandsvariablen S Kommunikationsverzögerungsdaten S4 verwendet werden, die den Grad der zeitlichen Verzögerung von Kommunikationsdaten zwischen einer Funk-Anweisungs-/Bedientafel und der Steuereinrichtung eines Kommunikationspartners anzeigen.
  • Gemäß der vorstehend beschriebenen Modifikation wird der maschinellen Lernvorrichtung 100 ermöglicht, den Aufbauzustand des gemultiplexten Kommunikationspfades sowohl in Bezug auf den Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen als auch auf den Grad der zeitlichen Verzögerung der Kommunikationsdaten zwischen der Funkanweisungsvorrichtung und der Steuervorrichtung des Kommunikationspartners zu lernen.
  • In noch einer weiteren Modifikation der in der Funk-Repeater-Auswahleinrichtung 1 umfassten maschinellen Lernvorrichtung 100 können als die von der Bestimmungsdatenerfassungseinheit 108 erfassten Bestimmungsdaten D nicht nur die gemultiplexten Kommunikationspfadbestimmungsdaten D1 als ein Wert, der das Ergebnis der Bestimmung darüber anzeigt, ob der Aufbauzustand des gemultiplexten Kommunikationspfads geeignet ist oder nicht, sondern auch Kommunikationsverzögerungs-Bestimmungsdaten D2, die den Grad der zeitlichen Verzögerung der Kommunikationsdaten zwischen einer Funk-Anweisungs-/Bedientafel und der Steuervorrichtung eines Kommunikationspartners anzeigen, verwendet werden.
  • Gemäß der vorstehend beschriebenen Modifikation kann die maschinelle Lernvorrichtung 100 beim Erlernen des Aufbauzustandes des gemultiplexten Kommunikationspfads in Bezug auf den Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen ferner die zeitliche Verzögerung von Kommunikationsdaten zwischen der Funk-Anweisungs-/Bedientafel und der Steuereinrichtung des Kommunikationspartners berücksichtigen.
  • In der maschinellen Lernvorrichtung 100 mit der oben beschriebenen Konfiguration ist der von der Lerneinheit 110 ausgeführte Lernalgorithmus nicht besonders beschränkt, und es kann ein bekannter Lernalgorithmus für das maschinelle Lernen verwendet werden. 3 zeigt eine Form der in 1 dargestellten Funk-Repeater-Auswahleinrichtung 1, die eine Konfiguration ist, die die Lerneinheit 110 umfasst, die bestärkendes Lernen als Beispiel für den Lernalgorithmus durchführt. Das bestärkende Lernen ist ein Verfahren, das einen Zyklus zum Überwachen des aktuellen Zustands der Umwelt, in der sich ein zu erlernendes Objekt befindet (d.h. eine Eingabe), wiederholt, während eine vorbestimmte Aktion in dem aktuellen Zustand (d.h. eine Ausgabe) durchgeführt wird und eine Belohnung für die ergriffene Aktion auf Versuch-und-Irrtum-Basis vergeben wird, und eine derartige Verfahrensweise erlernt (die die Bestimmung des Aufbauzustandes des gemultiplexten Kommunikationspfads in der maschinellen Lernvorrichtung in der vorliegenden Erfindung ist), um den Gesamtwert von Belohnungen als eine optimale Lösung zu maximieren.
  • In der maschinellen Lernvorrichtung 100, die in der in 3 dargestellten Funk-Repeater-Auswahleinrichtung 1 umfasst ist, umfasst die Lerneinheit 110 eine Belohnungsberechnungseinheit 112, die eine Belohnung R in Bezug auf das Ergebnis des Bestimmens (gleichbedeutend zu den Bestimmungsdaten D, die in einem Lernzyklus nach dem Lernzyklus, in dem die Zustandsgrößen S erfasst werden, verwendet werden), ob der Aufbauzustand des basierend auf den Zustandsgrößen S bestimmten gemultiplexten Kommunikationspfads geeignet ist oder nicht, bestimmt, und eine Wertfunktionsaktualisierungseinheit 114, die unter Verwendung der Belohnung R eine Funktion Q aktualisiert, die den Wert des Aufbauzustandes des gemultiplexten Kommunikationspfades darstellt. In der Lerneinheit 110 wiederholt die Wertfunktionsaktualisierungseinheit 114 die Aktualisierung der Funktion Q, um der Lerneinheit 110 zu ermöglichen, den Aufbauzustand des gemultiplexten Kommunikationspfades in Bezug auf den Zustand der gemultiplexten Funkkommunikation zwischen zu verwaltenden Vorrichtungen zu erlernen.
  • Ein Beispiel für den von der Lerneinheit 110 ausgeführten Algorithmus des bestärkenden Lernens wird beschrieben. Der Algorithmus in diesem Beispiel wird als Q-Learning bezeichnet. Das Q-Learning ist ein Verfahren, das einen Zustand s eines Agenten und eine vom Agenten im Zustand s wählbare Aktion a als unabhängige Variablen verwendet, um eine Funktion Q (s, a) zu erlernen, die den Wert der Aktion darstellt, wenn die Aktion a im Zustand s gewählt wird. Das Wählen der Aktion a, die die Wertfunktion Q im Zustand s maximiert, führt zu einer optimalen Lösung. Das Q-Learning wird in dem Zustand gestartet, in dem die Korrelation zwischen dem Zustand s und der Aktion a unbekannt ist. Ein Versuch-und-Irrtum-Prozess des Auswählens verschiedener Aktionen a in einem beliebigen Zustand s wird wiederholt durchgeführt, um die Wertfunktion Q wiederholt zu aktualisieren und die Wertfunktion Q der optimalen Lösung näher zu bringen. Durch Konfigurieren der Wertfunktion Q derart, dass, wenn eine Änderung in einer Umwelt (d.h. dem Zustand s) als Ergebnis der Wahl der Aktion a im Zustand s auftritt, eine Belohnung r (d.h. Gewichtung der Aktion a) entsprechend der Änderung erhalten wird und durch das Führen des Lernens derart, dass die Aktion a, die es ermöglicht, die höhere Belohnung r zu erhalten, gewählt wird, ist es möglich der Wertfunktion Q zu ermöglichen, sich innerhalb relativ kurzer Zeit der optimalen Lösung anzunähern.
  • Ein Aktualisierungsausdruck für die Wertfunktion Q kann im Allgemeinen wie nachfolgend in Ausdruck 1 dargestellt werden. In Ausdruck 1 stellen st und at einen Zustand und eine Aktion zu einem Zeitpunkt t dar. Die Aktion at ändert den Zustand st in einen Zustand st+1, während rt+1 eine Belohnung darstellt, die als Ergebnis der Änderung vom Zustand st in den Zustand st+1 erhalten wird. Der Ausdruck maxQ drückt einen Fall aus, in dem die Aktion a den Wert Q zum Zeitpunkt t + 1 (der zum Zeitpunkt t angenommen wird) maximiert. In Ausdruck 1 stellen α und γ einen Lernfaktor und einen Diskontierungsfaktor dar, die willkürlich so festgelegt werden, dass sie 0 < α ≤ 1 und 0 < γ ≤ 1 erfüllen. Q ( s t , a t ) Q ( s t , a t ) + α ( r t + 1 + γ max a Q ( s t + 1 , a ) Q ( s t , a t ) )
    Figure DE102018006044A1_0001
  • Wenn die Lerneinheit 110 das Q-Learning durchführt, entsprechen die von der Zustandsüberwachungseinheit 106 überwachten Zustandsvariablen S und die von der Bestimmungsdatenerfassungseinheit 108 erfassten Bestimmungsdaten D dem Zustand s in dem Aktualisierungsausdruck. Die Aktion des Entscheidens, was mit dem Aufbauzustand des gemultiplexten Kommunikationspfades zu tun ist (wie der gemultiplexte Kommunikationspfad aufzubauen oder zu wechseln) in Bezug auf den aktuellen Zustand (d.h. den aktuellen Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen), entspricht der Aktion a in dem Aktualisierungsausdruck. Die durch die Belohnungsberechnungseinheit 112 bestimmte Belohnung R entspricht der Belohnung r in dem Aktualisierungsausdruck. Dementsprechend aktualisiert die Wertfunktions-Aktualisierungseinheit 114 wiederholt die Funktion Q, die den Wert des Aufbauzustandes des gemultiplexten Kommunikationspfades in Bezug auf den aktuellen Zustand darstellt, durch das Q-Learning unter Verwendung der Belohnung R.
  • Die durch die Belohnungsberechnungseinheit 112 bestimmte Belohnung R kann als positive Belohnung R in einem Fall angesehen werden, in dem, z.B., nach dem Bestimmen des Aufbauzustandes des gemultiplexten Kommunikationspfads der gemultiplexte Kommunikationspfad basierend auf dem Inhalt der Bestimmung tatsächlich aufgebaut oder gewechselt wird, und wenn in diesem Zustand ein Anweisungsvorgang unter Verwendung einer Funk-Anweisungs-/Bedientafel durchgeführt wird, das Ergebnis der Bestimmung, ob der Aufbauzustand des gemultiplexten Kommunikationspfads geeignet ist oder nicht, „GEEIGNET“ ist (wie z.B. wenn sich die Funkkommunikationserfolgsrate auf einen Wert verbessert, der nicht kleiner als ein vorbestimmter Schwellenwert ist, oder wenn die Zeitverzögerung von Kommunikationsdaten zwischen der Funk-Anweisungs-/Bedientafel und der Steuervorrichtung des Kommunikationspartners innerhalb eines vorbestimmten zulässigen Wertebereichs liegt). Andererseits kann die durch die Belohnungsberechnungseinheit 112 bestimmte Belohnung R als negative Belohnung R in einem Fall angesehen werden, in dem, z.B., nach dem Bestimmen des Aufbauzustandes des gemultiplexten Kommunikationspfades, der gemultiplexte Kommunikationspfad basierend auf dem Inhalt der Bestimmung tatsächlich aufgebaut oder gewechselt wird, und wenn in diesem Zustand ein Anweisungsvorgang unter Verwendung einer Funk-Anweisungs-/Bedientafel durchgeführt wird, das Ergebnis der Bestimmung, ob der Aufbauzustand des gemultiplexten Kommunikationspfads angemessen ist oder nicht, „NICHT GEEIGNET“ ist (wie z.B. wenn die Funkkommunikationserfolgsrate auf einen Wert von nicht höher als der vorbestimmte Schwellenwert sinkt, oder wenn die Zeitverzögerung von Kommunikationsdaten zwischen der Funk-Anweisungs-/Bedientafel und der Steuervorrichtung des Kommunikationspartners einen vorbestimmten Schwellenwert überschreitet). Die Absolutwerte der positiven und negativen Belohnungen R können gleich oder voneinander unterschiedlich sein. Als eine Bestimmungsbedingung kann es ferner möglich sein, die Bestimmung durch Kombinieren einer Mehrzahl von in den Bestimmungsdaten D umfassten Werten vorzunehmen.
  • Das Ergebnis des Bestimmens, ob der Aufbauzustand des gemultiplexten Kommunikationspfades geeignet ist oder nicht, kann nicht nur in den zweiskaligen Darstellungen „GEEIGNET“ und „NICHT GEEIGNET“, sondern auch in mehrskaligen Darstellungen dargestellt werden. Als Beispiel ist es möglich, eine Konfiguration zu verwenden, bei der, wenn der maximal zulässige Wert der Zeitverzögerung von Kommunikationsdaten DRmax ist, eine Belohnung R = 5 vergeben wird, wenn der Wert DR der Zeitverzögerung der Kommunikationsdaten zwischen der Funk-Anweisungs-/Bedientafel und der Steuervorrichtung des Kommunikationspartners 0 ≤ DR < DRmax/5 erfüllt, eine Belohnung R = 2 vergeben wird, wenn der Wert DR DRmax/5 ≤ DR < DRmax/2 erfüllt, und eine Belohnung R = 1 vergeben wird, wenn der Wert DR DRmax/2 ≤ DR ≤ DRmax erfüllt. Es ist ferner möglich, eine Konfiguration zu verwenden, bei der der Wert DRmax im Frühstadium des Lernens relativ groß festgelegt wird und im Laufe des Lernens reduziert wird.
  • Die Wertfunktionsaktualisierungseinheit 114 kann eine Aktionswerttabelle aufweisen, in der die Zustandsvariablen S, die Bestimmungsdaten D und die Belohnung R geordnet in Bezug auf einen durch die Funktion Q gegebenen Aktionswert (z.B. Zahlenwert) dargestellt werden. In diesem Fall ist die Aktion der von der Wertfunktionsaktualisierungseinheit 114 vorgenommenen Aktualisierung der Funktion Q gleichbedeutend mit der von der Wertfunktionsaktualisierungseinheit 114 vorgenommenen Aktion der Aktualisierung der Aktionswerttabelle. Zum Zeitpunkt des Beginns des Q-Learning ist die Korrelation zwischen dem aktuellen Zustand der Umwelt und dem Aufbauzustand des gemultiplexten Kommunikationspfads unbekannt. Dementsprechend werden in der Aktionswerttabelle die verschiedenen Zustandsvariablen S, die verschiedenen Bestimmungsdaten D und die verschiedenen Belohnungen R in der Form erstellt, die den willkürlich bestimmten Aktionswerten zugeordnet ist (Funktion Q). Es wird angemerkt, dass die Belohnungsberechnungseinheit 112 bei Erkennen der Bestimmungsdaten D sofort die dazu entsprechende Belohnung R berechnen kann. Der berechnete Wert R wird in die Aktionswerttabelle geschrieben.
  • Wenn das Q-Learning unter Verwendung der Belohnung R gemäß der Bestimmung darüber, ob der Aufbauzustand des gemultiplexten Kommunikationspfades geeignet ist oder nicht, fortgesetzt wird, wird das Lernen in eine Richtung geführt, in der eine Aktion gewählt wird, die es ermöglicht, die höhere Belohnung R zu erhalten. Gemäß dem Zustand der Umwelt (d.h. den Zustandsvariablen S und der Bestimmungsdaten D), der sich infolge des Ergreifens der gewählten Aktion im aktuellen Zustand ändert, wird der Aktionswert (Funktion Q) der im aktuellen Zustand ergriffenen Aktion neu geschrieben, sodass die Aktionswerttabelle aktualisiert wird. Durch Wiederholung der Aktualisierung wird der in der Aktionswerttabelle angezeigte Aktionswert (Funktion Q) so umgeschrieben, dass eine geeignetere Aktion einen größeren Wert hat. So wird die unbekannte Korrelation zwischen dem aktuellen Zustand der Umwelt (dem aktuellen Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen) und der diesbezüglichen Aktion (Aufbau oder Wechsel des gemultiplexten Kommunikationspfads) schrittweise geklärt. Das heißt, die Aktualisierung der Aktionswerttabelle ermöglicht es, dass sich die Beziehung zwischen dem aktuellen Zustand der gemultiplexten Funkkommunikation zwischen zu verwaltenden Vorrichtungen und dem Aufbauzustand des gemultiplexten Kommunikationspfads schrittweise der optimalen Lösung annähern kann.
  • Mit Bezug auf 4 wird der Ablauf des oben beschriebenen Q-Learning, das von der Lerneinheit 110 durchgeführt wird (d.h. eine Form des maschinellen Lernverfahrens), näher beschrieben. Zunächst bezieht sich die Wertfunktions-Aktualisierungseinheit 114 in Schritt SA01 zu diesem Zeitpunkt auf die Aktionswerttabelle und wählt willkürlich den Aufbauzustand des gemultiplexten Kommunikationspfads (Aufbau oder Wechsel des gemultiplexten Kommunikationspfads) als eine Aktion, die im aktuellen Zustand, der durch die von der Zustandsüberwachungseinheit 106 überwachten Zustandsvariablen S angezeigt wird, zu ergreifen ist. Als Nächstes ruft die Wertfunktions-Aktualisierungseinheit 114 in Schritt SA02 die Zustandsvariablen S im aktuellen Zustand ab, die von der Zustandsüberwachungseinheit 106 überwacht werden. In Schritt SA03 ruft die Wertfunktions-Aktualisierungseinheit 114 die Bestimmungsdaten D im aktuellen Zustand ab, die von der Bestimmungsdatenerfassungseinheit 108 erfasst werden. Als Nächstes bestimmt die Wertfunktions-Aktualisierungseinheit 114 basierend auf den Bestimmungsdaten D in Schritt SA04, ob der Aufbauzustand des gemultiplexten Kommunikationspfads geeignet ist oder nicht. Wenn der Aufbauzustand des gemultiplexten Kommunikationspfads geeignet ist, wendet die Wertfunktions-Aktualisierungseinheit 114 in Schritt SA05 die von der Belohnungsberechnungseinheit 112 bestimmte positive Belohnung R auf den Aktualisierungsausdruck für die Funktion Q an. Als Nächstes aktualisiert die Wertfunktions-Aktualisierungseinheit 114 in Schritt SA06 die Aktionswerttabelle unter Verwendung der Zustandsvariablen S, der Bestimmungsdaten D, der Belohnung R und des Aktionswertes (nachaktualisierte Funktion Q) im aktuellen Zustand. Wird in Schritt SA04 bestimmt, dass der Aufbauzustand des gemultiplexten Kommunikationspfades nicht geeignet ist, wendet die Wertfunktions-Aktualisierungseinheit 114 die von der Belohnungsberechnungseinheit 112 bestimmte negative Belohnung R auf den Aktualisierungsausdruck für die Funktion Q an. Als Nächstes aktualisiert die Wertfunktion-Aktualisierungseinheit 114 in Schritt SA06 die Aktionswerttabelle unter Verwendung der Zustandsvariablen S, der Bestimmungsdaten D, der Belohnung R und des Aktionswertes (nachaktualisierte Funktion Q) im aktuellen Zustand. Die Lerneinheit 110 wiederholt die Schritte SA01 bis SA07, um die Auslösewerttabelle wiederholt zu aktualisieren und das Erlernen des Aufbauzustandes des gemultiplexten Kommunikationspfades fortzusetzen. Es wird angemerkt, dass der Prozess des Bestimmens der Belohnung R und der Prozess des Aktualisierens der Wertfunktion in den Schritten SA04 bis SA07 für jedes der in den Bestimmungsdaten D umfassten Datenelemente durchgeführt wird.
  • Wenn das oben beschriebene bestärkende Lernen beschritten wird, kann z.B. anstelle des Q-Learning ein neuronales Netzwerk verwendet werden. 5A zeigt schematisch ein Modell eines Neurons. 5B zeigt schematisch ein Modell eines dreischichtigen neuronalen Netzwerks, das durch Kombinieren der in 5A dargestellten Neuronen konfiguriert ist. Das neuronale Netzwerk kann so konfiguriert werden, dass es z.B. eine Rechenvorrichtung, eine Speichervorrichtung und dergleichen umfasst, die dazu ausgebildet sind, das Modell des Neurons nachzuahmen.
  • Das in 5A dargestellte Neuron gibt ein Ergebnis y aus, das auf eine Vielzahl von Eingaben x reagiert (die hierin beispielhaft die Eingaben x1 bis x3 sind). Die Eingaben x1 bis x3 werden mit jeweiligen Gewichten w (w1 bis w3) entsprechend den Eingängen x multipliziert. Somit erzeugt das Neuron die Ausgabe y, die durch den unten dargestellten Ausdruck 2 gegeben ist. Es wird angemerkt, dass in Ausdruck 2 die Eingaben x, die Ausgabe y und die Gewichte w jeweils ein Vektor sind, θ ein Bias ist und fk eine Aktivierungsfunktion ist. y = f k ( i = 1 n x i w i θ )
    Figure DE102018006044A1_0002
  • In das in 5B dargestellte dreischichtige neuronale Netzwerk werden die Mehrzahl von Eingaben x (die hierin beispielhaft die Eingaben x1 bis x3 sind) von der linken Seite eingegeben. Das in 5B dargestellte dreischichtige neuronale Netzwerk gibt das Ergebnis y (die hierin beispielhaft die Ergebnisse y1 bis y3 sind) von der rechten Seite aus. In dem in der Zeichnung gezeigten Beispiel werden die Eingaben x1 , x2 und x3 mit den entsprechenden Gewichten multipliziert (im Allgemeinen mit w1 bezeichnet), und jede der Eingaben x1, x2 und x3 wird in drei Neuronen N11, N12 und N13 eingegeben.
  • In 5B werden die jeweiligen Ausgaben der Neuronen N11 bis N13 im Allgemeinen mit z1 bezeichnet, was als Merkmalsvektor betrachtet werden kann, der durch Extraktion der Merkmalsgröße eines Eingabevektors erhalten wird. In dem in der Zeichnung gezeigten Beispiel werden die Merkmalsvektoren z1 mit den entsprechenden Gewichten multipliziert (im Allgemeinen mit w2 bezeichnet), und jeder der Merkmalsvektoren z1 wird in zwei Neuronen N21 und N22 eingegeben. Jeder der Merkmalsvektoren z1 stellt ein Merkmal zwischen den Gewichten w1 und w2 dar.
  • In 5B werden die jeweiligen Ausgaben der Neuronen N21 und N22 im Allgemeinen mit z2 bezeichnet, was als ein Merkmalsvektor angesehen werden kann, der durch Extraktion der Merkmalsgröße des Merkmalsvektors z1 erhalten wird. In dem in der Zeichnung gezeigten Beispiel werden die Merkmalsvektoren z2 mit den entsprechenden Gewichten multipliziert (im Allgemeinen mit w3 bezeichnet), und jeder der Merkmalsvektoren z2 wird in drei Neuronen N31, N32 und N33 eingegeben. Jeder der Merkmalsvektoren z2 stellt ein Merkmal zwischen den Gewichten w2 und w3 dar. Abschließend geben die Neuronen N31 bis N33 die jeweiligen Ergebnisse y1 bis y3 aus.
  • Es wird angemerkt, dass es auch möglich ist, ein sogenanntes Deep-Learning-Verfahren unter Verwendung eines neuronalen Netzwerks mit drei oder mehr Schichten zu verwenden.
  • In der maschinellen Lernvorrichtung 100, die in der Funk-Repeater-Auswahleinrichtung 1 umfasst ist, kann die Lerneinheit 110 den Aufbauzustand des gemultiplexten Kommunikationspfads (Ergebnisse y) ausgeben, indem sie einen Rechenvorgang in einer Mehrschichtstruktur gemäß dem vorstehend beschriebenen neuronalen Netzwerk unter Verwendung der Zustandsvariablen S und der Bestimmungsdaten D als die Eingaben x durchführt. In der maschinellen Lernvorrichtung 100, die in der Funk-Repeater-Auswahleinrichtung 1 umfasst ist, kann die Lerneinheit 110 ferner den Wert der Aktion in dem Zustand (Ergebnisse y) ausgeben, indem sie ein Rechenvorgang in einer Mehrschichtstruktur gemäß dem vorstehend beschriebenen neuronalen Netzwerk unter Verwendung des neuronalen Netzwerks als die Wertfunktion im bestärkenden Lernen und unter Verwendung der Zustandsvariablen S und der Aktion a als die Eingaben x durchführt. Es wird angemerkt, dass die Betriebsmodi eines neuronalen Netzwerks einen Lernmodus und einen Wertvorhersagemodus umfassen. Es ist beispielsweise möglich, ein Gewicht w unter Verwendung eines Lerndatensatzes im Lernmodus zu erlernen und den Wert der Aktion unter Verwendung des erlernten Gewichts w im Wertevorhersagemodus zu bestimmen. Es wird angemerkt, dass es im Wertevorhersagemodus ferner möglich ist, eine Erkennung, Klassifizierung, Inferenz und dergleichen durchzuführen.
  • Die Konfiguration der vorstehend beschriebenen Funk-Repeater-Auswahleinrichtung 1 kann als das von dem Prozessor 101 implementierte maschinelle Lernverfahren (oder Software) beschrieben werden. Das maschinelle Lernverfahren ist dazu bestimmt, den Aufbauzustand des gemultiplexten Kommunikationspfades zu erlernen und umfasst den Schritt des Bewirkens, dass die CPU eines Computers die gemultiplexten Kommunikationspfaddaten S1 und die gemultiplexten Funkkommunikationszustandsdaten S2 als die Zustandsvariablen S, die den aktuellen Zustand der Umwelt darstellen, in der die gemultiplexte Funkkommunikation durchgeführt wird, überwacht, den Schritt des Bewirkens, dass die CPU des Computers die Bestimmungsdaten D erfasst, die das Ergebnis des Bestimmens, ob der bestimmte Aufbauzustand des gemultiplexten Kommunikationspfades geeignet ist oder nicht, anzeigen, und den Schritt des Bewirkens, dass die CPU des Computers unter Verwendung der Zustandsvariablen S und der Bestimmungsdaten D die gemultiplexten Funkkommunikationszustandsdaten S2 und den Aufbauzustand des gemultiplexten Kommunikationspfades, die einander zugeordnet sind, erlernt.
  • 6 zeigt eine Funk-Repeater-Auswahleinrichtung 2 gemäß der zweiten Ausführungsform. Die Funk-Repeater-Auswahleinrichtung 2 umfasst eine maschinelle Lernvorrichtung 120 und eine Zustandsdatenerfassungseinheit 3, die die gemultiplexten Kommunikationspfaddaten S1 und die gemultiplexten Funkübertragungszustandsdaten S2, die zu den von der Zustandsüberwachungseinheit 106 überwachten Zustandsvariablen S gehören, als Zustandsdaten S0 erfasst. Die Zustandsdatenerfassungseinheit 3 kann die Zustandsdaten S0 aus den im Speicher der Funk-Repeater-Auswahleinrichtung 2 gespeicherten Datenelementen, den aus jeder der zu verwaltenden Vorrichtungen über die drahtgebundene Kommunikationsschnittstelle 15, die Funkkommunikationsschnittstelle 16 oder dergleichen erfassten Daten, den von einem Arbeiter entsprechend eingegebenen Daten und dergleichen erfassen.
  • Die maschinelle Lernvorrichtung 120 der Funk-Repeater-Auswahleinrichtung 2 umfasst nicht nur Software (wie einen Lernalgorithmus) und Hardware (wie den Prozessor 101), die es der maschinellen Lernvorrichtung 120 ermöglichen, den Aufbauzustand eines gemultiplexten Kommunikationspfades zu erlernen, sondern auch Software (wie einen Lernalgorithmus) und Hardware (wie den Prozessor 101), die es der maschinellen Lernvorrichtung 120 ermöglichen, den Aufbauzustand des gemultiplexten Kommunikationspfades, der basierend auf einem Lernergebnis bestimmt wurde, als eine Anweisung an die Funk-Repeater-Auswahlvorrichtung 2 auszugeben. Die maschinelle Lernvorrichtung 120, die in der für Funk-Repeater-Auswahleinrichtung 2 enthalten ist, kann auch eine Konfiguration aufweisen, bei der ein einzelner gemeinsam genutzter Prozessor alle Softwareelemente implementiert, einschließlich eines Lernalgorithmus, eines arithmetischen Algorithmus und dergleichen.
  • Eine Entscheidungseinheit 122 kann z.B. als Funktion des Prozessors 101 konfiguriert werden. Alternativ kann die Entscheidungseinheit 122 z.B. als eine im ROM 102 gespeicherte Software konfiguriert werden, die die Funktion des Prozessors 101 bewirkt. Die Entscheidungseinheit 122 erzeugt einen Anweisungswert C mit einer Anweisung zum Bestimmen des Aufbaus oder des Wechsels des gemultiplexten Funkkommunikationspfades in Bezug auf den aktuellen Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen basierend auf dem Ergebnis des Lernens durch die Lerneinheit 110 und gibt den erzeugten Anweisungswert C aus. Der Anweisungswert C kann Funk-Repeater (Funk-Repeater und die in Steuergeräten oder dergleichen umfassten Funkkommunikationsmodule, die als Funk-Repeater verwendet werden) für Funkkommunikationspfade, die als gemultiplexter Kommunikationspfad von jeder der Funk-Bedientafeln verwendet werden, festlegen. Der Anweisungswert C kann ferner die Differenz zwischen dem aktuell aufgebauten gemultiplexten Kommunikationspfad und einem neu aufzubauenden gemultiplexten Kommunikationspfad anzeigen. Wenn die Entscheidungseinheit 122 den Anweisungswert C an die Funk-Repeater-Auswahleinrichtung 2 ausgibt, benachrichtigt die Funk-Repeater-Auswahleinrichtung 2 jede der zu verwaltenden Vorrichtungen über den Funk-Repeater, der für die gemultiplexte Funkkommunikation basierend auf der Anweisung verwendet werden soll. Bei Bedarf benachrichtigt die Funk-Repeater-Auswahleinrichtung 2 den Funk-Repeater dahingehend (und die als Funk-Repeater oder dergleichen verwendete Steuervorrichtung), eine Verbindung von der zu verwaltenden Vorrichtung, die den Funk-Repeater verwendet, zuzulassen und die Verbindung von einer anderen Vorrichtung als der zu verwaltenden Vorrichtung, die den Funk-Repeater verwendet, zu blockieren. Dadurch ändert sich der Zustand der Umwelt.
  • Die Zustandsüberwachungseinheit 106 überwacht die Zustandsvariablen S, die sich nach der Ausgabe des Anweisungswertes C von der Entscheidungseinheit 122 an die Umwelt im nachfolgenden Lernzyklus geändert haben. Die Lerneinheit 110 erlernt den Aufbauzustand des gemultiplexten Kommunikationspfades z.B. durch Aktualisieren der Wertfunktion Q (d.h. die Aktionswerttabelle) unter Verwendung der geänderten Zustandsvariablen S. Es wird angemerkt, dass die Zustandsüberwachungseinheit 106 zu diesem Zeitpunkt auch die gemultiplexten Kommunikationspfaddaten S1 aus dem RAM 103 der maschinellen Lernvorrichtung 120 überwachen kann, wie in der ersten Ausführungsform beschrieben, anstatt die gemultiplexten Kommunikationspfaddaten S1 aus den von der Zustandsdatenerfassungseinheit 3 erfassten Zustandsdaten S0 zu erfassen.
  • Die Entscheidungseinheit 122 gibt den Anweisungswert C, der den basierend auf dem Lernergebnis bestimmten Aufbauzustand des gemultiplexten Kommunikationspfades (Aufbau oder Wechsel des gemultiplexten Kommunikationspfads) festlegt, an die Funk-Repeater-Auswahleinrichtung 2 aus. Durch Wiederholen des Lernzyklus betreibt die maschinelle Lernvorrichtung 120 das Erlernen des Aufbauzustandes des gemultiplexten Kommunikationspfads und verbessert allmählich die Zuverlässigkeit des Aufbauzustandes des von der maschinellen Lernvorrichtung 120 bestimmten gemultiplexten Kommunikationspfads.
  • Die maschinelle Lernvorrichtung 120, die in der Funk-Repeater-Auswahleinrichtung 2 mit der vorstehend beschriebenen Konfiguration umfasst ist, erreicht die gleichen Wirkungen, die von der vorstehend beschriebenen maschinellen Lernvorrichtung 100 erreicht werden. Insbesondere kann die maschinelle Lernvorrichtung 120 den Zustand der Umwelt unter Verwendung der Ausgabe von der Entscheidungseinheit 122 ändern. Andererseits kann die maschinelle Lernvorrichtung 100 bewirken, dass eine externe Vorrichtung eine der Entscheidungseinheit äquivalente Funktion auszuführt, die darin besteht zu bewirken, dass das Lernergebnis der Lerneinheit 110 in der Umwelt wiedergegeben wird.
  • Obwohl bisher die Ausführungsformen der vorliegenden Erfindung beschrieben wurden, ist die vorliegende Erfindung nicht auf nur die Beispiele in den oben beschriebenen Ausführungsformen beschränkt. Die vorliegende Erfindung kann in verschiedenen Formen durch Vornehmen geeigneter Modifikationen umgesetzt werden.
  • So sind beispielsweise die von den maschinellen Lernvorrichtungen 100 und 120 ausgeführten Lernalgorithmen, die von der maschinellen Lernvorrichtung 120 ausgeführten Rechenalgorithmen, die von den Funk-Repeater-Auswahleinrichtungen 1 und 2 ausgeführten Steueralgorithmen und dergleichen nicht auf die vorstehend beschriebenen beschränkt, und es können verschiedene Algorithmen verwendet werden.
  • Zudem weisen in der für die oben beschriebenen Ausführungsformen angegebenen Beschreibung die Funk-Repeater-Auswahlvorrichtung 1 (oder 2) und die maschinelle Lernvorrichtung 100 (oder 120) unterschiedliche CPUs auf. Die maschinelle Lernvorrichtung 100 (oder 120) kann jedoch auch durch die in der Funk-Repeater-Auswahleinrichtung 1 (oder 2) umfassten CPU 11 und das im ROM 12 gespeicherte Systemprogramm implementiert werden.
  • Außerdem zeigt jede der vorstehend beschriebenen Ausführungsformen das Beispiel, in dem die maschinelle Lernvorrichtung 100 (oder 120) in die Funk-Repeater-Auswahleinrichtung 1 (oder 2) eingebunden ist. Die maschinelle Lernvorrichtung 120 (oder 100) kann jedoch eine Konfiguration aufweisen, bei der die maschinelle Lernvorrichtung 120 (oder 100) in einem Cloud-Server vorhanden ist, der in der Lage ist, mit der Funk-Repeater-Auswahleinrichtung 1 (oder 2) über ein drahtgebundenes Kommunikationsnetzwerk oder Funkkommunikationsnetzwerk oder dergleichen zu kommunizieren.
  • Obwohl bisher die Ausführungsformen der vorliegenden Erfindung beschrieben wurden, beschränkt sich die vorliegende Erfindung nicht auf die Beispiele in den oben beschriebenen Ausführungsformen. Die vorliegende Erfindung kann in anderer Form umgesetzt werden, indem eine geeignete Modifikation an der Erfindung vorgenommen wird.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • JP 2007233817 [0002]
    • JP 2011000652 [0002]

Claims (8)

  1. Funk-Repeater-Auswahleinrichtung zum Aufbauen von gemultiplexten Kommunikationspfaden, die zur Kommunikation zwischen zu verwaltenden Vorrichtungen oder zum Wechseln zwischen denselben verwendet werden, wobei die Funk-Repeater-Auswahleinrichtung umfasst: eine maschinelle Lernvorrichtung, die lernt, wie die gemultiplexten Kommunikationspfade zugeordnet werden, wobei die maschinelle Lernvorrichtung umfasst: eine Zustandsüberwachungseinheit, die als Zustandsvariablen, die gemultiplexte Kommunikationspfaddaten, welche den Aufbauzustand der gemultiplexten Kommunikationspfade festlegen, und gemultiplexte Funkkommunikationszustandsdaten, welche einen Zustand der gemultiplexten Funkkommunikation zwischen zu verwaltenden Vorrichtungen festlegen, darstellen, überwacht; eine Bestimmungsdatenerfassungseinheit, die Bestimmungsdaten erfasst, die ein Ergebnis der Bestimmung darüber, ob der Aufbauzustand der gemultiplexten Kommunikationspfade geeignet ist oder nicht, kennzeichnen; und eine Lerneinheit, die den Aufbauzustand der gemultiplexten Kommunikationspfade und die gemultiplexten Funkkommunikationszustandsdaten in Zuordnung zueinander basierend auf den Zustandsvariablen und den Bestimmungsdaten erlernt.
  2. Funk-Repeater-Auswahleinrichtung nach Anspruch 1, wobei die Zustandsvariablen Standortinformationsdaten umfassen, die einen Standort jeder der zu verwaltenden Vorrichtungen kennzeichnen, und die Lerneinheit den Aufbauzustand der gemultiplexten Kommunikationspfade, der gemultiplexten Funkkommunikationszustandsdaten und der Standortsinformationsdaten in Zuordnung zueinander erlernt.
  3. Funk-Repeater-Auswahleinrichtung nach Anspruch 1 oder 2, wobei die Bestimmungsdaten zusätzlich zu dem Ergebnis der Bestimmung darüber, ob der Aufbauzustand des gemultiplexten Kommunikationspfads geeignet ist oder nicht, ein Ergebnis der Bestimmung darüber, ob eine Zeitverzögerung von Kommunikationsdaten zwischen den zu verwaltenden Vorrichtungen geeignet ist oder nicht, umfassen.
  4. Funk-Repeater-Auswahleinrichtung nach Anspruch 1, wobei die Lerneinheit umfasst: eine Belohnungsberechnungseinheit, die eine Belohnung in Bezug auf das Ergebnis von Bestimmungen bestimmt; und eine Wertfunktionsaktualisierungseinheit, die unter Verwendung der Belohnung eine Funktion aktualisiert, die einen Wert des Aufbauzustandes der gemultiplexten Kommunikationspfade in Bezug auf den Zustand der gemultiplexten Funkkommunikation zwischen den zu verwaltenden Vorrichtungen darstellt.
  5. Funk-Repeater-Auswahleinrichtung nach einem der Ansprüche 1 bis 4, wobei die Lerneinheit einen Rechenvorgang basierend auf den Zustandsvariablen und den Bestimmungsdaten in einer Mehrschichtstruktur durchführt.
  6. Die Funk-Repeater-Auswahleinrichtung nach einem der Ansprüche 1 bis 5, ferner umfassend: eine Entscheidungseinheit, die basierend auf einem Lernergebnis von der Lerneinheit einen durch den Aufbauzustand der gemultiplexten Kommunikationspfade definierten Anweisungswert ausgibt.
  7. Funk-Repeater-Auswahleinrichtung nach einem der Ansprüche 1 bis 6, wobei die maschinelle Lernvorrichtung in einem Cloud-Server vorhanden ist.
  8. Maschinelle Lernvorrichtung, die einen Aufbauzustand von gemultiplexten Kommunikationspfaden lernt, die zur Kommunikation zwischen zu verwaltenden Vorrichtungen verwendet werden, wobei die maschinelle Lernvorrichtung umfasst: eine Zustandsüberwachungseinheit, die als Zustandsvariablen, die gemultiplexte Kommunikationspfaddaten, welche den Aufbauzustand der gemultiplexten Kommunikationspfade festlegen, und gemultiplexte Funkkommunikationszustandsdaten, welche einen Zustand der gemultiplexten Funkkommunikation zwischen zu verwaltenden Vorrichtungen festlegen, darstellen, überwacht; eine Bestimmungsdatenerfassungseinheit, die Bestimmungsdaten erfasst, die ein Ergebnis der Bestimmung darüber, ob der Aufbauzustand der gemultiplexten Kommunikationspfade geeignet ist oder nicht, kennzeichnen; und eine Lerneinheit, die den Aufbauzustand der gemultiplexten Kommunikationspfade und die gemultiplexten Funkkommunikationszustandsdaten in Zuordnung zueinander basierend auf den Zustandsvariablen und den Bestimmungsdaten erlernt.
DE102018006044.7A 2017-07-31 2018-07-31 Funk-repeater-auswahleinrichtung und maschinelle lernvorrichtung Pending DE102018006044A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-148265 2017-07-31
JP2017148265A JP6640797B2 (ja) 2017-07-31 2017-07-31 無線中継器選択装置及び機械学習装置

Publications (1)

Publication Number Publication Date
DE102018006044A1 true DE102018006044A1 (de) 2019-01-31

Family

ID=65004358

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102018006044.7A Pending DE102018006044A1 (de) 2017-07-31 2018-07-31 Funk-repeater-auswahleinrichtung und maschinelle lernvorrichtung

Country Status (4)

Country Link
US (1) US10727930B2 (de)
JP (1) JP6640797B2 (de)
CN (1) CN109324536B (de)
DE (1) DE102018006044A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111618841A (zh) * 2019-02-28 2020-09-04 佳能株式会社 机器人装置及方法、制造物品的方法、通信设备及方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020148593A (ja) * 2019-03-13 2020-09-17 株式会社明電舎 自動操縦ロボットを制御する操作推論学習モデルの学習システム及び学習方法
JP7050023B2 (ja) * 2019-03-22 2022-04-07 Kddi株式会社 ネットワーク障害復旧システム、コンピュータプログラム及びネットワーク障害復旧方法
US20220329494A1 (en) * 2019-09-30 2022-10-13 Nec Corporation System, method, and control apparatus
DE112021000842T5 (de) * 2020-02-05 2022-11-17 Fanuc Corporation Maschinelle Lernvorrichtung, Computervorrichtung, Steuersystem und maschinelles Lernverfahren
JP7272606B2 (ja) * 2020-02-20 2023-05-12 国立大学法人京都大学 制御装置、それを備えた基地局、コンピュータに実行させるためのプログラムおよびプログラムを記録したコンピュータ読み取り可能な記録媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007233817A (ja) 2006-03-02 2007-09-13 Yaskawa Electric Corp 教示装置、コントローラ、自動機械システム、およびその無線通信方法
JP2011000652A (ja) 2009-06-16 2011-01-06 Fanuc Ltd 無線教示操作盤およびロボット制御システム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8291457B2 (en) * 2001-05-24 2012-10-16 Vixs Systems, Inc. Channel selection in a multimedia system
US20100222925A1 (en) * 2004-12-03 2010-09-02 Takashi Anezaki Robot control apparatus
US7715864B2 (en) * 2006-09-13 2010-05-11 Telefonaktiebolaget L M Ericsson (Publ) Arrangement and method for contention-based multi-access in a wireless communication system
JP2008278148A (ja) * 2007-04-27 2008-11-13 Nec Corp 通信端末、通信経路制御方法、及びプログラム
JP5772345B2 (ja) 2011-07-25 2015-09-02 富士通株式会社 パラメータ設定装置、コンピュータプログラム及びパラメータ設定方法
ES2836487T3 (es) * 2011-12-06 2021-06-25 E Vision Smart Optics Inc Sistemas, dispositivos y/o métodos para proporcionar imágenes
CN102711285B (zh) * 2012-04-28 2014-10-22 西南科技大学 一种无线自组织网络表驱动跨层路由学习方法
EP2786618B1 (de) * 2012-08-21 2016-02-10 Unify GmbH & Co. KG Verfahren und vorrichtung zur auswahl eines access points auf basis der bewegungsrichtung
WO2014105814A1 (en) * 2012-12-28 2014-07-03 E-Vision Smart Optics Inc. Double-layer electrode for electro-optic liquid crystal lens
JP6265689B2 (ja) * 2013-11-06 2018-01-24 関西電力株式会社 通信装置、無線ネットワークシステム、無線ネットワーク制御方法、及び、無線ネットワーク制御プログラム
JP2015201728A (ja) 2014-04-07 2015-11-12 株式会社日立製作所 機器制御システム及び機器制御方法
US9525617B2 (en) * 2014-05-02 2016-12-20 Cisco Technology, Inc. Distributed predictive routing using delay predictability measurements
MY177521A (en) * 2014-11-04 2020-09-17 Mimos Berhad A system and method for next hop selection in a wireless sensor network
US10084698B2 (en) * 2015-03-26 2018-09-25 Intel Corporation Selectively enabling first and second communication paths using a repeater

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007233817A (ja) 2006-03-02 2007-09-13 Yaskawa Electric Corp 教示装置、コントローラ、自動機械システム、およびその無線通信方法
JP2011000652A (ja) 2009-06-16 2011-01-06 Fanuc Ltd 無線教示操作盤およびロボット制御システム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111618841A (zh) * 2019-02-28 2020-09-04 佳能株式会社 机器人装置及方法、制造物品的方法、通信设备及方法
US11833664B2 (en) 2019-02-28 2023-12-05 Canon Kabushiki Kaisha Robot apparatus, control method for robot apparatus, method of manufacturing article using robot apparatus, communication device, communication method, control program, and recording medium

Also Published As

Publication number Publication date
CN109324536A (zh) 2019-02-12
JP6640797B2 (ja) 2020-02-05
JP2019029856A (ja) 2019-02-21
US20190036594A1 (en) 2019-01-31
US10727930B2 (en) 2020-07-28
CN109324536B (zh) 2021-04-20

Similar Documents

Publication Publication Date Title
DE102018006044A1 (de) Funk-repeater-auswahleinrichtung und maschinelle lernvorrichtung
DE102019002065B4 (de) Maschinelle Lernvorrichtung, Robotersteuervorrichtung und Robotervisionssystem, das eine maschinelle Lernvorrichtung verwendet, und maschinelles Lernverfahren
DE102017007729B4 (de) Maschinenlerneinrichtung, Robotersystem und Maschinenlernverfahren zum Lernen einer Bewegung eines Roboters, der an einer gemeinsam durch einen Menschen und einen Roboter ausgeführten Aufgabe beteiligt ist
DE102018204740B4 (de) Aktionsinformationslernvorrichtung, Robotersteuersystem und Aktionsinformationslernverfahren
DE102017008475B4 (de) Maschinenlernvorrichtung, robotersystem und maschinenlernverfahren zum erlernen eines roboter-betriebsprogramms
DE102016010064B4 (de) Numerische Steuerung mit Bearbeitungsbedingungsanpassungsfunktion zum Verringern des Auftretens von Rattern oder Werkzeugverschleiss/-bruch
DE102018001571B4 (de) Laserverarbeitungsgerät und Vorrichtung zum maschinellen Lernen
DE102018006946A1 (de) Steuerung und maschinelle lernvorrichtung
DE102018000342B4 (de) Numerische steuerung und maschinelle lernvorrichtung
DE102018005199B4 (de) Bauteilzuführvorrichtung und maschinelle lernvorrichtung
DE102018004330B4 (de) Steuerung und maschinelle Lernvorrichtung
DE69431822T2 (de) Vorrichtung und Verfahren für eine modellbasierende Prozesssteuerung
DE102018006248A1 (de) Steuervorrichtung und Lernvorrichtung
DE102016008994A1 (de) Werkzeugmaschine, simulationsvorrichtung und maschineneinlerngerät
DE102018004048B4 (de) Steuerung und Maschinenlernvorrichtung
DE102019001783A1 (de) Steuerung, maschinelle lernvorrichtung und system
DE102018010086A1 (de) Spanabführvorrichtung und Informationsverarbeitungsvorrichtung
DE102019002156A1 (de) Steuergerät und maschinelle Lernvorrichtung
DE102017003427A1 (de) Produktionssystem zur Durchführung eines Produktionsplans
DE102017010759B4 (de) Numerische steuerung
DE102019001044A1 (de) Steuervorrichtung und maschinelle lernvorrichtung
DE102018005378A1 (de) Steuergerät und Lernvorrichtung
DE102018001028B4 (de) Numerische Steuerung
DE102019112211A1 (de) Simulationsvorrichtung
DE102019006725A1 (de) Steuereinrichtung und Steuersystem

Legal Events

Date Code Title Description
R012 Request for examination validly filed