DE102017002996A1 - Maschinenlernvorrichtung, die ein lernen unter verwendung eines simulationsergebnisses durchführt, maschinensystem, herstellungssystem und maschinenlernverfahren - Google Patents

Maschinenlernvorrichtung, die ein lernen unter verwendung eines simulationsergebnisses durchführt, maschinensystem, herstellungssystem und maschinenlernverfahren Download PDF

Info

Publication number
DE102017002996A1
DE102017002996A1 DE102017002996.2A DE102017002996A DE102017002996A1 DE 102017002996 A1 DE102017002996 A1 DE 102017002996A1 DE 102017002996 A DE102017002996 A DE 102017002996A DE 102017002996 A1 DE102017002996 A1 DE 102017002996A1
Authority
DE
Germany
Prior art keywords
machine
machine learning
control command
result
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE102017002996.2A
Other languages
English (en)
Other versions
DE102017002996B4 (de
Inventor
Hiroshi Nakagawa
Takafumi KAJIYAMA
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fanuc Corp
Original Assignee
Fanuc Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fanuc Corp filed Critical Fanuc Corp
Publication of DE102017002996A1 publication Critical patent/DE102017002996A1/de
Application granted granted Critical
Publication of DE102017002996B4 publication Critical patent/DE102017002996B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/163Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1602Programme controls characterised by the control system, structure, architecture
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1671Programme controls characterised by programming, planning systems for manipulators characterised by simulation, either to verify existing program or to create and verify new program, CAD/CAM oriented, graphic oriented programming systems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1694Programme controls characterised by use of sensors other than normal servo-feedback from position, speed or acceleration sensors, perception control, multi-sensor controlled systems, sensor fusion
    • B25J9/1697Vision controlled systems
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/406Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by monitoring or safety
    • G05B19/4063Monitoring general control system
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/39Robotics, robotics to robotics hand
    • G05B2219/39298Trajectory learning
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/40Robotics, robotics mapping to robotics vision
    • G05B2219/40515Integration of simulation and planning

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Manufacturing & Machinery (AREA)
  • Manipulator (AREA)
  • Numerical Control (AREA)
  • Feedback Control In General (AREA)

Abstract

Eine Maschinenlernvorrichtung 20, die einen Steuerbefehl für eine Maschine 14 durch Maschinenlernen lernt, umfassend eine Maschinenlerneinheit 21, die das Maschinenlernen durchführt, um den Steuerbefehl auszugeben; einen Simulator 22, der eine Simulation eines Arbeitsvorgangs der Maschine 14 auf Basis des Steuerbefehls durchführt; und eine erste Ermittlungseinheit 23, die den Steuerbefehl auf Basis eines Durchführungsergebnisses der Simulation durch den Simulator ermittelt.

Description

  • HINTERGRUND DER ERFINDUNG
  • 1. Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf eine Maschinenlernvorrichtung, die ein Lernen unter Verwendung eines Simulationsergebnisses durchführt, ein Maschinensystem, ein Herstellungssystem und ein Maschinenlernverfahren.
  • 2. Beschreibung des verwandten Standes der Technik
  • In den letzten Jahren hat z. B. die Anwendung von Maschinenlernen auf eine Maschine wie z. B. einen Roboter Aufmerksamkeit erweckt und Forschung und Entwicklung zur praktischen Anwendung wurde bzw. wird durchgeführt. Beispielsweise bei einem System, das einen Steuerbefehl für eine Maschine lernt, ist es erforderlich, zu gewährleisten, dass der Steuerbefehl, der die Maschine steuert, kein Problem zeigt.
  • Unterdessen ist ein herkömmlicher Baugruppenroboter offenbart, der durch Schätzen eines Positionsfehlers über ein neuronales Netzwerk und Korrigieren von Daten eines Betriebsprogramms arbeitet (z. B. japanisches offengelegtes Patent mit der Veröffentlichungs-Nr. H09-319420 : Patentdokument 1).
  • Ferner ist eine herkömmliche Einrichtung offenbart, die einen nicht interferierenden optimalen Betrieb durch Lernen erfasst, indem ein Betriebsbefehlskandidat in Bezug auf ein virtuelles Systemmodell wiederholt eingegeben wird (z. B. japanisches Patent Nr. 5137537 : Patentdokument 2).
  • Wie oben beschrieben, gibt es diverse Vorschläge, bei denen ein Maschinenlernen auf eine Maschine angewandt wird, beim Patentdokument 1 beispielsweise besteht je nach erhaltenem Lernergebnis jedoch die Möglichkeit, dass der Steuerbefehl der Maschine eine Interferenz oder dergleichen mit der Maschine oder der Umgebung verursacht. Anders ausgedrückt ist beim Maschinenlernen die Sicherheit des Lernergebnisses nicht gewährleistet, so dass es z. B. beim Verhindern der Interferenz oder dergleichen zu Schwierigkeiten kommt, was beim Einführen des Maschinenlernens in eine Produktionslinie ein Hindernis darstellt.
  • Ferner ist es beispielsweise beim Patentdokument 2 erforderlich, da das Lernen unter Verwendung eines Beurteilungsergebnisses eines Systemmodells durchgeführt wird, dass das Systemmodell genau ist und eine Optimierung wird durch Bereitstellen einer Modellrekonfigurationseinheit ermöglicht, um die Genauigkeit des Systemmodells zu verbessern. Ein solcher Ansatz ist jedoch dahingehend nicht realistisch, dass die Genauigkeit des Optimierungsergebnisses von der Genauigkeit des Systemmodells abhängt, so dass eine Verbesserung des Systemmodells lange dauert.
  • Angesichts der oben erwähnten Probleme im Stand der Technik liegt ein Ziel der vorliegenden Erfindung in der Bereitstellung einer Maschinenlernvorrichtung, eines Maschinensystems, eines Herstellungssystems und eines Maschinenlernverfahrens, die die Sicherheit des Maschinenlernens gewährleisten können.
  • KURZDARSTELLUNG DER ERFINDUNG
  • Gemäß einem ersten Aspekt der vorliegenden Erfindung wird eine Maschinenlernvorrichtung bereitgestellt, die einen Steuerbefehl für eine Maschine durch Maschinenlernen lernt, umfassend eine Maschinenlerneinheit, die das Maschinenlernen durchführt, um den Steuerbefehl auszugeben; einen Simulator, der eine Simulation eines Arbeitsvorgangs der Maschine auf Basis des Steuerbefehls durchführt; und eine erste Ermittlungseinheit, die den Steuerbefehl auf Basis eines Durchführungsergebnisses der Simulation durch den Simulator ermittelt.
  • Die erste Ermittlungseinheit kann ermitteln, dass der Steuerbefehl gültig ist, und führt eine Eingabe des Steuerbefehls in die Maschine durch, wenn im Durchführungsergebnis der Simulation kein Problem vorliegt, und kann ermitteln, dass der Steuerbefehl ungültig ist und stoppt die Eingabe des Steuerbefehls in die Maschine, wenn im Durchführungsergebnis der Simulation ein Problem vorliegt. Wenn ein Ermittlungsergebnis von der ersten Ermittlungseinheit ungültig ist, kann die Eingabe des Steuerbefehls in die Maschine gestoppt werden und kann ein Lernen durchgeführt werden, indem eine erste Ergebnismarkierung, die von der ersten Ermittlungseinheit erhalten wird, als Schulungsdaten an die Maschinenlerneinheit bereitgestellt wird. Wenn das Ermittlungsergebnis von der ersten Ermittlungseinheit ungültig ist, kann das Lernen durchgeführt werden, indem eine erste Statusmenge, umfassend einen Teil der vom Simulator erhaltenen Berechnungsergebnisdaten oder all diese, gemeinsam mit der ersten Ergebnismarkierung an die Maschinenlerneinheit bereitgestellt werden.
  • Die Maschinenlernvorrichtung kann ferner eine zweite Ermittlungseinheit umfassen, die ein Arbeitsergebnis der Maschine durch den Steuerbefehl ermittelt, wobei, wenn ein Ermittlungsergebnis von der ersten Ermittlungseinheit gültig ist, eine Eingabe des Steuerbefehls in die Maschine durchgeführt werden kann, und ein Lernen durchgeführt werden kann, indem eine zweite Ergebnismarkierung, die von der zweiten Ermittlungseinheit erhalten wird, als Schulungsdaten an die Maschinenlerneinheit bereitgestellt wird. Wenn das Ermittlungsergebnis von der ersten Ermittlungseinheit gültig ist, kann das Lernen durchgeführt werden, indem eine zweite Statusmenge, umfassend zumindest eines von Ausgabedaten eines Sensors, der einen Status der Maschine oder einer Umgebung erkennt, internen Daten einer Steuersoftware, die die Maschine steuert, und Berechnungsdaten, die auf Basis der Ausgabedaten des Sensors oder der internen Daten der Steuersoftware erhalten werden, gemeinsam mit der zweiten Ergebnismarkierung an die Maschinenlerneinheit bereitgestellt werden.
  • Ein Status der Maschinenlerneinheit kann als erster Status aufrechterhalten werden, regulär oder wenn eine vorab spezifizierte Bedingung erfüllt ist; und der Status der Maschinenlerneinheit kann in den ersten Status zurückgesetzt werden, wenn eine Häufigkeit, mit der das Ermittlungsergebnis von der ersten Ermittlungseinheit gültig wird, abnimmt. Wenn das Ermittlungsergebnis von der ersten Ermittlungseinheit drei oder mehr Status annimmt, umfassend gültig und ungültig, kann eine Befehlsgeschwindigkeit der Maschine, die im Steuerbefehl umfasst ist, auf Basis des Status verändert werden. Die Maschinenlerneinheit kann eine Vergütungsberechnungseinheit umfassen, die eine Vergütung auf Basis eines Arbeitsstatus der Maschine berechnet; und eine Wertfunktionsaktualisierungseinheit mit einer Wertfunktion, die einen Wert für den Steuerbefehl ermittelt und die Wertfunktion auf Basis der Vergütung aktualisiert. Die Maschinenlernvorrichtung kann ein neuronales Netzwerk umfassen.
  • Gemäß einem zweiten Aspekt der vorliegenden Erfindung wird ein Maschinensystem bereitgestellt, das die Maschinenlernvorrichtung gemäß dem obigen ersten Aspekt und die Maschine umfasst, wobei das Maschinensystem eine Steuereinrichtung, die die Maschine steuert; und eine Rechnereinrichtung mit der Maschinenlernvorrichtung umfasst, die die Maschinenlerneinheit, den Simulator und die erste Ermittlungseinheit umfasst, wobei die Rechnereinrichtung und eine oder mehrere der Maschinen über ein Netzwerk verbunden sind.
  • Das Lernen der Maschinenlerneinheit kann sogar während einer tatsächlichen Produktionsarbeit durch die Maschine kontinuierlich durchgeführt werden oder kann vorab durchgeführt werden, jedoch nicht während der tatsächlichen Produktionsarbeit durch die Maschine durchgeführt werden.
  • Gemäß einem dritten Aspekt der vorliegenden Erfindung wird ein Herstellungssystem bereitgestellt, das eine Mehrzahl der Maschinensysteme gemäß dem obigen zweiten Aspekt umfasst, wobei die Maschinenlernvorrichtung in jedem der Maschinensysteme bereitgestellt ist; und eine Mehrzahl der Maschinenlernvorrichtungen, die in der Mehrzahl der Maschinensysteme bereitgestellt sind, so konfiguriert ist, dass sie Daten über ein Kommunikationsmedium untereinander teilen oder austauschen. Die Maschinenlernvorrichtung kann auf einem Cloudserver liegen.
  • Gemäß einem vierten Aspekt der vorliegenden Erfindung wird ein Maschinenlernverfahren bereitgestellt, das einen Steuerbefehl für eine Maschine durch Maschinenlernen lernt, wobei das Maschinenlernverfahren das Durchführen des Maschinenlernens zur Ausgabe des Steuerbefehls; das Durchführen einer Simulation eines Arbeitsvorgangs der Maschine auf Basis des Steuerbefehls; das Ermitteln des Steuerbefehls auf Basis eines Ergebnisses der Durchführung der Simulation; das Ermitteln, dass der Steuerbefehl gültig ist, und das Durchführen einer Eingabe des Steuerbefehls in die Maschine, wenn im Durchführungsergebnis der Simulation kein Problem vorliegt; und das Ermitteln, dass der Steuerbefehl ungültig ist, und das Stoppen der Eingabe des Steuerbefehls in die Maschine, wenn im Durchführungsergebnis der Simulation ein Problem vorliegt, umfasst.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die vorliegende Erfindung ist unter Bezugnahme auf die beiliegenden Zeichnungen besser verständlich, in denen:
  • 1 ein Schaubild ist, das ein Beispiel eines Maschinensystems schematisch veranschaulicht, auf das die vorliegende Erfindung angewandt wird;
  • 2 ein Blockschaubild ist, das eine erste Ausführungsform der Maschinenlernvorrichtung gemäß der vorliegenden Erfindung veranschaulicht;
  • 3 ein Schaubild ist, das ein Beispiel einer Verarbeitung in der in 2 veranschaulichten Maschinenlernvorrichtung erläutert;
  • 4 ein Schaubild ist, das ein Beispiel eines Prozesses zum Ausschneiden eines Teilbildes aus dem in 3 veranschaulichten Gesamtbild erläutert;
  • 5 ein Schaubild ist, das ein Konfigurationsbeispiel einer Eingabe und Ausgabe des neuronalen Netzwerks erläutert, das an die in 2 veranschaulichte Maschinenlernvorrichtung angewandt wird;
  • 6 ein Blockschaubild ist, das eine zweite Ausführungsform der Maschinenlernvorrichtung gemäß der vorliegenden Erfindung veranschaulicht; und
  • 7 ein Schaubild ist, das ein Beispiel einer Maschinenlerneinheit in der Maschinenlernvorrichtung einer Ausführungsform erläutert.
  • AUSFÜHRLICHE BESCHREIBUNG
  • Bevor eine Ausführungsform einer Maschinenlernvorrichtung, die ein Lernen unter Verwendung eines Simulationsergebnisses durchführt, eines Maschinensystems, eines Herstellungssystems und eines Maschinenlernverfahrens gemäß der vorliegenden Erfindung ausführlich beschrieben wird, werden ein Beispiel des Maschinensystems, auf das die vorliegende Erfindung angewandt wird, und dessen Probleme unter Bezugnahme auf 1 beschrieben.
  • 1 ist ein Schaubild, das ein Beispiel des Maschinensystems schematisch veranschaulicht, auf das die vorliegende Erfindung angewandt wird, wobei eine Methode veranschaulicht wird, mit der ein Roboter 14 mit einem daran angebrachten Endeffektor 13 einen Vorgang zum Herausnehmen eines Werkstücks 12 aus einem Korb 11 durchführt. Wie in 1 veranschaulicht, ist bei einem Beispiel des Maschinensystems eine dreidimensionale Messvorrichtung 15 über dem Korb 11 bereitgestellt und wird ein Tiefenbild des Werkstücks 12 von der dreidimensionalen Messvorrichtung 15 aufgenommen. Ferner lernt der Roboter 14 auf Basis des von der dreidimensionalen Messvorrichtung 15 aufgenommenen Tiefenbilds (Bild 30) den Vorgang des Herausnehmens des Werkstücks 12. Der Roboter 14 ist z. B. ein 6-achsiger Gelenkroboter, und eine Antriebswelle für jeden der Roboters 14 und des Endeffektors 13 wird durch einen Steuerbefehl (Befehl) von einer Steuereinrichtung (Maschinenlernvorrichtung) gesteuert.
  • Unterdessen kann beim Lernen eines Befehls an den Roboter 14 über das Maschinenlernen eine Interferenz auftreten, je nach dem von einer Maschinenlernvorrichtung (20) erfassten Befehl. Beispielsweise wenn der Befehl an den Roboter 14 ungeeignet (ungültig) ist, insbesondere wenn der Endeffektor 13 auf Basis eines Befehls A in 1 dazu veranlasst wird, sich zu bewegen (arbeiten), wie durch einen Lokus 16 indiziert, kommt es tendenziell zu einer Interferenz zwischen dem Endeffektor 13 (Roboter 14) und dem Korb 11.
  • Anders ausgedrückt ist es erforderlich, dass der Befehl an den Roboter 14 geeignet (gültig) ist, ist es insbesondere erforderlich, dass der Roboter 14 eine Arbeit so ausführt, dass der Endeffektor 13 und der Korb 11 auf Basis eines Befehls B in 1 miteinander nicht interferieren, wie durch einen Lokus 17 des Endeffektors 13 indiziert; wenn beispielsweise der obige Befehl A in den Roboter 14 eingegeben wird, kann es jedoch zu einer Interferenz kommen, wodurch der Korb 11, der Endeffektor 13, der Roboter 14 und der Endeffektor 13 oder ein Peripheriegerät beschädigt wird. Insbesondere führt dies in einer tatsächlichen Produktionslinie zu einem Produktionsstopp, so dass es zu einem großen Problem kommt. Ferner kann es je nach Status der Werkstücke 12 im Korb 11 vorkommen, dass der Roboter 14 aufgrund einer Interaktion mit den anderen Werkstücken 12 nicht in der Lage ist, ein Werkstück 12 erfolgreich herauszunehmen. Auch in diesem Fall kommt es zu einem Problem, bei dem die Taktzeit der Arbeit verzögert wird.
  • Im Folgenden werden Ausführungsformen einer Maschinenlernvorrichtung, eines Maschinensystems, eines Herstellungssystems und eines Maschinenlernverfahrens, die ein Lernen unter Verwendung eines Simulationsergebnisses gemäß der vorliegenden Erfindung durchführen, unter Bezugnahme auf die beiliegenden Zeichnungen ausführlich beschrieben. Auch wenn in der vorliegenden Schrift ein industrieller Roboter, der von einer Steuereinrichtung gesteuert wird, beispielhaft als Maschine beschrieben wird, ist selbstverständlich, dass die vorliegende Erfindung auch z. B. auf eine Werkzeugmaschine, eine Schmiedepressenmaschine, eine Spritzgussmaschine, einen Wartungsroboter oder dergleichen angewandt werden kann, die von einer Steuereinrichtung gesteuert werden.
  • 2 ist ein Blockschaubild, das ein erstes Beispiel der Maschinenlernvorrichtung gemäß der vorliegenden Erfindung veranschaulicht, die z. B. auf das Maschinensystem (Robotersystem) angewandt werden kann, das unter Bezugnahme auf 1 beschrieben ist. Die Maschinenlernvorrichtung 20 führt ein Maschinenlernen in Reaktion auf das Empfangen von Bildinformationen (Bild) 30 von der dreidimensionalen Messvorrichtung 15 durch und gibt einen Steuerbefehl (Befehl) an den Roboter (Maschine) 14 aus, wodurch der Arbeitsvorgang (Arbeit) gesteuert wird.
  • Wie in 2 veranschaulicht, umfasst die Maschinenlernvorrichtung 20: eine Maschinenlerneinheit 21, die ein Maschinenlernen durchführt und einen Steuerbefehl ausgibt; einen Simulator 22, der eine Simulation der Arbeit des Roboters 14 auf Basis des Steuerbefehls durchführt; eine erste Ermittlungseinheit 23, die den Steuerbefehl auf Basis eines Durchführungsergebnisses der Simulation durch den Simulator 22 ermittelt; und eine zweite Ermittlungseinheit 24, die ein Arbeitsergebnis des Roboters 14 durch den Steuerbefehl ermittelt.
  • Wenn im Durchführungsergebnis der Simulation durch den Simulator 22 kein Problem vorliegt, ermittelt die erste Ermittlungseinheit 23, dass der von der Maschinenlerneinheit 21 ausgegebene Steuerbefehl gültig ist, und gibt diesen in den Roboter 14 ein. Danach führt der Roboter 14 die Arbeit auf Basis des Steuerbefehls aus, dessen Ermittlungsergebnis von der ersten Ermittlungseinheit 23 gültig ist. Wenn unterdessen im Durchführungsergebnis der Simulation durch den Simulator 22 ein Problem vorliegt, ermittelt die erste Ermittlungseinheit 23, dass der ausgegebene Steuerbefehl ungültig ist, und stoppt die Eingabe des Steuerbefehls an den Roboter 14. Mehr im Detail wird der Steuerbefehl, dessen Ermittlungsergebnis von der ersten Ermittlungseinheit 23 ungültig ist, nicht in den Roboter 14 eingegeben, so dass der Roboter 14 veranlasst wird, eine Durchführung der Arbeit auf Basis des Steuerbefehls zu vermeiden, in Bezug auf welchen ein Problem im Durchführungsergebnis der Simulation durch den Simulator 22 ermittelt wurde.
  • Wenn das Ergebnis der Ermittlung von der ersten Ermittlungseinheit 23 ungültig ist, wird nicht nur die Eingabe des Steuerbefehls in den Roboter 14 gestoppt, sondern wird z. B. auch die erste Ergebnismarkierung 41, die von der ersten Ermittlungseinheit 23 erhalten wird, als Schulungsdaten an die Maschinenlerneinheit 21 bereitgestellt, so dass ein weiteres Lernen durchgeführt werden kann.
  • Gemäß der Maschinenlernvorrichtung 20 der ersten Ausführungsform wird daher, bevor der Roboter 14 tatsächlich betrieben wird, der Steuerbefehl vom Simulator 22 ausgeführt, so dass z. B. der Abstand zwischen dem Peripheriegerät und dem Roboter 14 und die Bewegung des Werkstücks 12 vorab simuliert werden, und die Möglichkeit des Auftretens einer Interferenz oder eines Scheiterns beim Herausnehmen des Werkstücks 12 von der ersten Ermittlungseinheit 23 ermittelt wird. Ferner wird die tatsächliche Maschine (der Roboter 14) auf Basis des Durchführungsergebnisses der Simulation durch den Simulator 22 nur betrieben, wenn beurteilt (ermittelt) wird, dass kein Problem vorliegt, wodurch es möglich ist, einen Schaden an der tatsächlichen Maschine, ein Scheitern der Arbeit oder dergleichen zu verhindern. Mehr im Detail ist es gemäß der ersten Ausführungsform möglich, die Sicherheit des Maschinenlernens zu gewährleisten, d. h. das Auftreten von Problemen wie z. B. Schaden der Maschine, Scheitern der Arbeit oder Schaden des Peripheriegeräts zu verhindern.
  • Ferner ermittelt die zweite Ermittlungseinheit 24 bei der Maschinenlernvorrichtung 20 der ersten Ausführungsform das Arbeitsergebnis des Roboters 14 durch den Steuerbefehl. Wenn das Ermittlungsergebnis von der ersten Ermittlungseinheit 23 gültig ist, wird eine Eingabe des Steuerbefehls in den Roboter 14 durchgeführt und wird eine zweite Ergebnismarkierung 44, die von der zweiten Ermittlungseinheit 24 erhalten wird, als Schulungsdaten an die Maschinenlerneinheit 21 bereitgestellt, um ein Lernen durchzuführen.
  • Weiter im Detail wird der Steuerbefehl vom Simulator 22 beurteilt, wird der Beurteilungsergebnis vom Simulator von der ersten Ermittlungseinheit 23 ermittelt, und wenn das Ermittlungsergebnis gültig ist, wird eine Eingabe des Steuerbefehls in den Roboter 14 durchgeführt, um den Roboter 14 dazu zu veranlassen, einen tatsächlichen Vorgang auszuführen. Danach wird das Betriebsergebnis (Arbeitsergebnis) des Roboters 14 von der zweiten Ermittlungseinheit 24 beurteilt (ermittelt) und gibt die zweite Ermittlungseinheit 24 die zweite Ergebnismarkierung 44 aus. Die Maschinenlerneinheit 21 führt ein Lernen des Steuerbefehles (Maschinenlernen) auf Basis der zweiten Ergebnismarkierung 44, der ersten Ergebnismarkierung 41 von der ersten Ermittlungseinheit 23 und den Schulungsdaten vom Bild 30 durch.
  • Wenn unterdessen das Ermittlungsergebnis von der ersten Ermittlungseinheit 23 ungültig ist, wird eine Eingabe des Steuerbefehls in den Roboter 14 nicht durchgeführt und wird die erste Ergebnismarkierung 41 von der ersten Ermittlungseinheit 23 an die Maschinenlerneinheit 21 ausgegeben. Danach führt die Maschinenlerneinheit 21 ein Lernen des Steuerbefehls auf Basis der ersten Ergebnismarkierung 41 und der Schulungsdaten vom Bild 30 durch.
  • 3 ist ein Schaubild, das ein Beispiel einer Verarbeitung in der in 2 veranschaulichten Maschinenlernvorrichtung erläutert, und 4 ist ein Schaubild, das ein Beispiel einer Verarbeitung zum Ausschneiden eines Teilbildes aus dem in 3 veranschaulichten Gesamtbild erläutert. Unter Bezugnahme auf die 3 und 4 folgt eine Beschreibung eines Beispiels eines Prozesses zum Bilden eines Teilbildes 32 durch Ausschneiden eines Teils des Bilds aus dem Gesamtbild 31, das von der dreidimensionalen Messeinheit 15 erfasst wurde, wie in 1 veranschaulicht Wie in 4 veranschaulicht, kann das Teilbild 32 durch Ausschneiden eines willkürlichen Abschnitts aus dem Gesamtbild 31 gebildet werden und für gewöhnlich wird der Ausschneideprozess wiederholt durchgeführt, bis der gesamte Bereich abgedeckt ist, während in regulären Intervallen versetzt wird. Beispielsweise wenn das Teilbild (32) mit horizontal 80 Pixeln und vertikal 80 Pixeln gebildet wird, während für jeweils 40 Pixeln sowohl vertikal als auch horizontal in Bezug auf das Gesamtbild 31 mit horizontal 320 Pixeln und vertikal 240 Pixeln versetzt wird, werden insbesondere solche Teilbilder erhalten, und zwar {(320 – 80)/40 + 1} × {(240 – 80)/40 + 1} = 7 × 5 = 35.
  • Das auf diese Weise gebildete Teilbild 32 wird in die Maschinenlerneinheit 25 eingegeben, die das neuronale Netzwerk verwendet, und eine Herausnahmeerfolgswahrscheinlichkeit 26 wird als Ausgabe der Maschinenlerneinheit 25 erhalten. Dies wird für alle Teilbilder wiederholt durchgeführt und ein Teilbild (32) mit der höchsten Herausnahmeerfolgswahrscheinlichkeit wird ausgewählt, um Positionsinformationen 27 (Informationen zur Position mit der höchsten Herausnahmeerfolgswahrscheinlichkeit) zu erfassen, woraus denen das Teilbild 32 ausgeschnitten wird.
  • Das neuronale Netzwerk (25) ist aus einer arithmetischen Einheit, die ein Neuronenmodell imitiert, einem Speicher und dergleichen zusammengesetzt und kann einen Universalrechner und einen Prozessor nutzen; eine Verarbeitung mit höherer Geschwindigkeit wird jedoch unter Anwendung von z. B. GPGPU (allgemeine Berechnung auf Graphikverarbeitungseinheiten), einem großskaligen PC-Cluster oder dergleichen darauf ermöglicht.
  • Die Positionsinformationen der Position 27 mit der höchsten Herausnahmeerfolgswahrscheinlichkeit wird in den Simulator 22 eingegeben, um den Betrieb des Roboters 14 (Simulation des Arbeitsvorgangs) durchzuführen. Beispielsweise ist es möglich, einen Lokus des Herausnahmevorgangs zu generieren, indem ein Vorgang wie z. B. das Transportieren des Werkstücks 12 von der Herausnahmeposition des Werkstücks 12 in eine Beförderungsposition durch eine Position unmittelbar über dem Korb 11 auf dem Simulator 22 vorab eingestellt wird.
  • Eine vereinfachte Form des Simulators 22 kann z. B. eine sein, die einen Herausnahmevorgang von der Herausnahmeposition generiert und Zeitreihendaten einer Roboterspitzenposition (Endeffektor 13) ausgibt. Die Zeitreihendaten werden an die erste Ermittlungseinheit 23 ausgegeben und durch Prüfen, ob die Roboterspitzenposition von dem vom Benutzer vorab spezifizierten Bereich abweicht, ist es möglich, das Auftreten/Nichtauftreten einer Interferenz zu prüfen, und somit ist es möglich, zu ermitteln, ob das Betriebsergebnis gültig oder ungültig ist, d. h., ob der Steuerbefehl gültig oder ungültig ist.
  • Ferner kann ein ausgeklügelterer Typ des Simulators 22 als Simulator konfiguriert sein, der eine sogenannte physikalische Simulation durchführt, bei der beispielsweise der Einfluss der Schwerkraft, die Interferenz zwischen den Werkstücken, die Last des mit dem Roboter verwendeten Motors und dergleichen Berechnungsobjekte sind, durch Modellieren, umfassend physikalische Werte wie z. B. Formmodell, Gewicht und dergleichen des Roboters 14, der Hand (Endeffektor 13), des Korbs 11, des Werkstücks 12, der Umgebung und dergleichen.
  • In diesem Fall wird es möglich, eine Simulation (Beurteilung) nicht nur in Bezug auf das Prüfen des Bereichs der Roboterspitzenposition durchzuführen, sondern auch in Bezug auf ein Scheitern des Herausnehmens durch gegenseitige Interferenz zwischen den Werkstücken oder einen überlastbedingten Fehlerstopp des Roboters. Ferner wird es möglich, eine noch höherebnige Ermittlung durch Auswählen und Kombinieren erforderlicher aus den Kriterien für die Gültig- oder Ungültig-Ermittlung durch die erste Ermittlungseinheit 23 durchzuführen, da das vom Simulator 22 erhaltene Beurteilungsergebnis weitreichende Elemente wie z. B. die Höhe des Schadens am Roboter 14 oder Werkstück 12 durch die Interferenz, den Spielraum der Interferenz und so weiter abdeckt.
  • Wie oben beschrieben, wird, wenn von der ersten Ermittlungseinheit 23 eine Ungültig-Ermittlung durchgeführt wird, der Steuerbefehl nicht in die tatsächlichen Roboter 14 (tatsächliche Maschine) eingegeben, sondern werden die erste Ergebnismarkierung 41 von der ersten Ermittlungseinheit 23 und die Schulungsdaten vom Teilbild 43, wie verwendet, in die Maschinenlerneinheit (neuronales Netzwerk) 25 eingegeben, um ein Lernen des Steuerbefehls durchzuführen. Auf diese Weise ist es z. B. möglich, eine Eingabe eines ungültigen (problematischen) Steuerbefehls in die tatsächliche Maschine zu vermeiden und die Maschinenlerneinheit 25 dazu zu veranlassen, ein Lernen durchzuführen, so dass der ungültige Steuerbefehl nicht ausgegeben wird.
  • 5 ist ein Schaubild, das ein Konfigurationsbeispiel einer Eingabe und Ausgabe des neuronalen Netzwerks erläutert, das an die in 2 veranschauliche Maschinenlernvorrichtung angewandt wird. Wie in 5 veranschaulicht, empfängt das neuronale Netzwerk 25 das Teilbild 32 als Eingabe und gibt die Herausnahmeerfolgswahrscheinlichkeit 26 aus. Wenn ein Lernen durchgeführt wird, wird z. B. der Satz aus dem verwendeten Teilbild 43 und der ersten Ergebnismarkierung 41 als Schulungsdaten verwendet und wird der Steuerbefehl durch überwachtes Lernen durchgeführt.
  • Anders ausgedrückt wird ein Fehler zwischen der Herausnahmeerfolgswahrscheinlichkeit 26, die von dem verwendeten Teilbild 43 erhalten wird, und der ersten Ergebnismarkierung 41, die vom Simulator 22 erhalten wird, durch eine Fehlerberechnungseinheit 28 berechnet und wird der Fehler rückgeführt, so dass ein Lernen durch das neuronale Netzwerk 25 durchgeführt werden kann. Insbesondere wenn es so ausgelegt ist, dass die Herausnahmeerfolgswahrscheinlichkeit 26 einen numerischen Wert in einem Bereich von „0”, der ein Scheitern darstellt, bis „1”, der einen Erfolg darstellt, annimmt, nimmt die erste Ergebnismarkierung 41 je nach Ergebnis des Erfolges/Scheitern des Herausnehmens den Wert „0” oder „1” an, so dass der Fehler durch das Ziehen der Differenz zwischen den zweien berechnet werden kann.
  • Wenn von der ersten Ermittlungseinheit 23 eine Gültig-Ermittlung (korrekt) durchgeführt wird, bedeutet dies, dass ein problemloser Betrieb (Arbeit) des Roboters 14 (tatsächliche Maschine) unabhängig von einem in diesen eingegebenen Steuersignal sichergestellt ist. Folglich wird ein Steuerbefehl eingegeben, um die tatsächliche Maschine (Roboter 14) dazu zu veranlassen, tatsächlich zu arbeiten. Danach wird das Ergebnis von einem Sensor wie z. B. einer Kamera beobachtet und ermittelt die zweite Ermittlungseinheit 24, ob das Ergebnis tatsächlich gültig wurde.
  • Das Gültig- oder Ungültig-Ergebnis (korrekt/falsch) wird als zweite Ergebnismarkierung 44 von der zweiten Ermittlungseinheit 24 an das neuronale Netzwerk 25 ausgegeben. Anders ausgedrückt empfängt das neuronale Netzwerk 25 die Schulungsdaten, die aus der zweiten Ergebnismarkierung 44 und dem verwendeten Teilbild 43 zusammengesetzt sind, und führt ein Lernen durch. Dieses Lernverfahren ähnelt dem oben beschriebenen Lernen in dem Fall, dass die erste Ergebnismarkierung 41 verwendet wird, die vom Simulator 22 erhalten wird.
  • Auch wenn die erste Ermittlungseinheit 23 und die zweite Ermittlungseinheit 24 eine Gültig/Ungültig-Ermittlung durchführen, muss das von jeder Ermittlungseinheit ausgegebene Ergebnis nicht notwendigerweise binär („0” oder „1”) sein. Beispielsweise kann eine Ermittlung durchgeführt werden, bei der eine Dreifach-Klassifizierung unter Bereitstellung von Schwellenwerten in zwei Schritten vorgenommen wird, d. h. „gültig”, „passabel” und „mangelhaft”. Dies ist darauf zurückzuführen, dass z. B. wenn der Roboter 14 an einem Hindernis wie z. B. dem Korb 11 vorbeikommt, es je nach Genauigkeit des Simulators 22 zu einer Situation kommt, in der eine Interferenz potenziell erwartet wird.
  • Beispielsweise wenn eine potenzielle Interferenz erwartet wird, ist es möglich, den Steuerbefehl genauer zu steuern, indem eine solche Konfiguration vorgenommen wird, dass die Ermittlung durch die erste Ermittlungseinheit 23 eine Ermittlung in einer dreifachen Form ist, zusätzlich umfassend „passabel (mittelmäßig)”, oder in einer Mehrfachwertform anstatt einer binären Form von „Gültig (korrekt)” und „ungültig (falsch)”. Anders ausgedrückt kann, wenn das Ermittlungsergebnis von der ersten Ermittlungseinheit 23 drei oder mehr Status (Mehrfachwerte) annimmt, umfassend gültig und ungültig, eine Steuerung auf Basis des Status durchgeführt werden, so dass der Roboter 14 durch Ändern der Befehlsgeschwindigkeit des Roboters 14, die im Steuerbefehl umfasst ist, betrieben wird, insbesondere durch Verringern der Befehlsgeschwindigkeit, wenn eine Interferenz potenzial stark erwartet wird.
  • Auf diese Weise ist es z. B. sogar dann möglich, einen Schaden des Roboters 14 oder eines Peripheriegeräts zu minimieren, wenn vom Roboter 14 eine Inferenz verursacht wird. Außerdem ist es möglich, mit dem Risiko einer Interferenz spezifischer umzugehen, indem die Anzahl der Schwellenwertstufen auf 3, 4 und so weiter erhöht und die Befehlsgeschwindigkeit für jede Stufe verändert wird.
  • Die Maschinenlernvorrichtung 20, die unter Bezugnahme auf 2 beschrieben ist, kann in der Steuervorrichtung des Roboters 14 bereitgestellt werden, es stellt sich jedoch heraus, dass die Gerätschaft übermäßig teuer wird, wenn z. B. berücksichtigt wird, dass der Roboter 14 auch für Arbeiten verwendet wird, bei denen kein Maschinenlernen durchgeführt wird. Daher kann die Rechnereinrichtung (Maschinenlernvorrichtung 20), die das Maschinenlernen durchführt, von der Steuervorrichtung des Roboters 14 getrennt bereitgestellt werden. Bei einer solchen Hardwarekonfiguration ist es lediglich erforderlich, eine Schnittstelle zum Empfangen eines Steuerbefehls auf Seite der Steuervorrichtung des Roboters 14 bereitzustellen und somit können die Kosten der Steuervorrichtung des Roboters 14 verringert werden. Außerdem ist es vorteilhafterweise auch möglich, die Leistung der Maschinenlerneinheit 21 oder des Simulators 22 auf einfache Weise zu verbessern, indem nur die Rechnereinrichtung ersetzt wird, in der die Maschinenlernvorrichtung 20 bereitgestellt wird.
  • Ferner wird es, da die Rechnereinrichtung, in der die Maschinenlernvorrichtung 20 bereitgestellt ist, und die Steuervorrichtung des Roboters 14 über ein Netzwerk verbunden sind, möglich, die Rechnereinrichtung mit einer Mehrzahl der Roboter 14 (Steuervorrichtungen) zu verbinden, und wird es außerdem möglich, ein Lernen in vielen (allen) der Roboter 14 mit der einzelnen Rechnereinrichtung durchzuführen, indem die jeweiligen der Roboter 14, die das Lernen durchführen, entsprechend gewechselt und verbunden werden. Anders ausgedrückt umfasst ein Robotersystem (Maschinensystem), das die Maschinenlernvorrichtung 20 und den Roboter 14 umfasst: die Steuervorrichtung, die den Roboter 14 steuert; und die Rechnereinrichtung mit der Maschinenlernvorrichtung 20, die die Maschinenlerneinheit 21, den Simulator 22 und die erste Ermittlungseinheit 23 umfasst, wobei die Rechnereinrichtung und einer oder mehrere Roboter 14 über ein Netzwerk verbunden werden können.
  • Bei einem Maschinensystem, das eine Produktion tatsächlich durchführt, gibt es den Fall, dass eine Verbesserung des Betriebs durch Lernen unter fortgesetzter Produktion gewünscht ist. Da das Maschinenlernen viele Schulungsdaten zum Lernen erfordert, ist es insbesondere bevorzugt, ein Lernen unter Verwendung der Daten durchzuführen, die tatsächlich für die Produktion verwendet werden, um die Lernwirkung durch Erhöhen der Häufigkeit der Durchführung eines Lernens (der Anzahl der Daten) zu verbessern.
  • In diesem Fall besteht das Problem, dass manchmal ggf. nicht gewährleistet werden kann, dass der Betrieb durch ein Lernen immer verbessert wird, und die Erfolgsrate des Betriebs kann im Gegenteil abnehmen. Dieses Problem kann gemeinsam mit dem Interferenzproblem auch zu einem Hindernis werden, wenn die Lernfunktion auf die tatsächliche Produktionslinie angewandt wird. Somit kann, wenn die Erfolgsrate des Betriebs abnimmt, eine solche Konfiguration vorgenommen werden, dass das Lernen nicht durchgeführt wird, wenn es an ein Maschinensystem angewandt wird, das eine tatsächliche Produktion durchführt. Anders ausgedrückt kann eine solche Konfiguration vorgenommen werden, dass das Lernen durch die Maschinenlerneinheit 21 kontinuierlich durchgeführt wird, z. B. sogar während des tatsächlichen Produktionsbetriebs durch den Roboter 14, oder alternativ kann es vorab und nicht während des tatsächlichen Produktionsbetriebs durch den Roboter 14 durchgeführt werden.
  • Ferner wird der Status der Maschinenlerneinheit 21 in einem Zeitpunkt aufrechterhalten, der vorab spezifiziert wurde, wie z. B. in der tatsächlichen Produktionslinieneingabestufe oder regulär, und wenn die Wahrscheinlichkeit erhöht ist, dass das Ermittlungsergebnis von der ersten Ermittlungseinheit 23 ungültig wird, wird die Maschinenlerneinheit 21 in den vorherigen Status zurückgebracht, so dass die Leistung der Maschinenlerneinheit 21 wiederhergestellt ist, wodurch es möglich wird, die Effizienz durch Lernen weiter zu verbessern. Anders ausgedrückt kann auch eine solche Konfiguration vorgenommen werden, dass der Status der Maschinenlerneinheit 21 als erster Status aufrechterhalten wird, regulär oder wenn eine vorab spezifizierte Bedingung eintritt, und wenn die Häufigkeit, mit der das Ermittlungsergebnis von der ersten Ermittlungseinheit 23 gültig wird, abnimmt, wird der Status der Maschinenlerneinheit 21 in den ersten Status zurückgebracht. Auch wenn in der oben beschriebenen ersten Ausführungsform ein Beispiel veranschaulicht ist, bei dem ein „überwachtes Lernen” angewandt wird, können auch andere Lernmethoden wie z. B. „Verstärkungslernen” angewandt werden.
  • 6 ist ein Blockschaubild, das eine zweite Ausführungsform der Maschinenlernvorrichtung gemäß der vorliegenden Erfindung veranschaulicht, wobei ein Beispiel der Maschinenlernvorrichtung veranschaulicht ist, auf die ein Durchsetzungslernen angewandt wird. Unterdessen veranschaulicht 6 ein Beispiel, bei dem ein Lokus eines Herausnahmevorgangs des Roboters 14 unter der Annahme gelernt wird, dass eine Herausnahmeposition bereits ermittelt wurde. Bei der in 6 veranschaulichten zweiten Ausführungsform wird der Betriebslokus des Roboters 14 durch eine Maschinenlerneinheit 55 generiert und in einen Simulator 52 eingegeben. Im Simulator 52 wird der Betrieb des Roboters 14 beurteilt und wird von der ersten Ermittlungseinheit 53 ermittelt, ob der Betrieb gültig oder ungültig (korrekt/falsch) ist.
  • Wenn das Ermittlungsergebnis von der ersten Ermittlungseinheit 53 gültig ist, wird eine Eingabe eines Steuerbefehls an den Roboter 14 durchgeführt und arbeitet der Roboter 14. Das Betriebsergebnis des Roboters 14 wird von der zweiten Ermittlungseinheit 54 ermittelt und das Ermittlungsergebnis wird als zweite Ergebnismarkierung 64 an die Maschinenlerneinheit 55 gesendet, während gleichzeitig eine zweite Statusmenge 65, umfassend zumindest eines von den Daten, die den Status des Roboters 14 oder der Umgebung darstellen, internen Daten einer Steuersoftware, die den Roboter 14 steuert und Berechnungsdaten, die auf Basis einer oder beider Daten erhalten werden, an die Maschinenlerneinheit 55 gesendet wird. Anders ausgedrückt wird, wenn das Ermittlungsergebnis von der ersten Ermittlungseinheit 53 gültig ist, das Lernen durchgeführt, indem eine zweite Statusmenge 65, umfassend zumindest eines von Ausgabedatum eines Sensors, der den Status des Roboters 14 oder einer Umgebung erkennt, internen Daten der Steuersoftware, die den Roboter 14 steuert, und Berechnungsdaten, die auf Basis der Ausgabedaten des Sensors und der internen Daten der Steuersoftware erhalten werden, gemeinsam mit der zweiten Ergebnismarkierung 64 an die Maschinenlerneinheit 55 bereitgestellt wird.
  • Wenn das Ermittlungsergebnis von der ersten Ermittlungseinheit 53 ungültig ist, wird der Steuerbefehl nicht in den Roboter 14 eingegeben und werden die erste Ergebnismarkierung 61, die aus der Ermittlung von der ersten Ermittlungseinheit 53 stammt, und eine erste Statusmenge 62, die aus internen Daten des Simulators 52 zusammengesetzt ist, an die Maschinenlerneinheit 55 gesendet. Anders ausgedrückt wird, wenn das Ermittlungsergebnis von der ersten Ermittlungseinheit 53 ungültig ist, ein Lernen durchgeführt, indem die erste Statusmenge 62, umfassend einen Teil der vom Simulator 52 erhaltenen Berechnungsergebnisdaten oder all diese, gemeinsam mit der ersten Ergebnismarkierung 61 an die Maschinenlerneinheit 55 bereitgestellt werden.
  • Danach wird der von der Maschinenlerneinheit 55 generierte Betriebslokus generiert, z. B. durch kurze Schritte eines gewissen Zeitraums oder einer gewissen Distanz, werden eine Simulation und Ermittlung jedes Mal durchgeführt und wird schließlich der gesamte Betriebslokus durch Wiederholen davon generiert.
  • Die Maschinenlerneinheit 55, die die erste Ergebnismarkierung 61 und die erste Statusmenge 62 oder die zweite Ergebnismarkierung 64 und die zweite Statusmenge 65 empfängt, führt z. B. ein „Verstärkungslernen” durch. Insbesondere wird ein Fall beschrieben, bei dem ein Lernen durch Anwendung von „Q-Learning” durchgeführt wird.
  • Das Q-Learning ist eine Methode zum Lernen eines Werts Q(s, a) zum Auswählen einer Aktion a unter einem gewissen Umgebungsstatus s. Anders ausgedrückt kann eine Aktion a mit dem höchsten Wert Q(s, a) unter einem gewissen Status als optimale Aktion ausgewählt werden. Am Anfang ist ein korrekter Wert des Werts Q(s, a) für die Kombination von Status s und Aktion a jedoch überhaupt nicht bekannt. Daher wählt ein Agent (Aktionsentität) diverse Aktionen a unter einem gewissen Status s aus und wird eine Vergütung zu diesem Zeitpunkt an die Aktion a vergeben. Auf diese Weise fährt der Agent fort, um die Auswahl einer besseren Aktion, d. h. eines korrekten Werts Q(s, a) zu lernen.
  • Bei der Maschinenlernvorrichtung der zweiten Ausführungsform ist, wenn ein Lernen durch Anwendung von Q-Learning durchgeführt wird, die Statusmenge s aus der ersten Ergebnismarkierung 61, die von der ersten Ermittlungseinheit 53 ausgegeben wird, und der ersten Statusmenge 62, die vom Simulator 52 ausgegeben wird, oder der zweiten Ergebnismarkierung 64, die von der zweiten Ermittlungseinheit 54 ausgegeben wird, und der zweiten Statusmenge 65, die vom Roboter 14, dem Peripheriegerät oder dergleichen ausgegeben wird, zusammengesetzt.
  • Die erste Ergebnismarkierung 61 und die zweite Ergebnismarkierung 64 umfassen z. B. das Auftreten/Nichtauftreten einer Interferenz, die Taktzeit, den Abstand zur Endposition, den Erfolg/das Scheiterns in Bezug auf das Ergreifen des Werkstücks 12 und dergleichen. Die Aktion a ist ein Steuerbefehl für den Roboter 14 und kann z. B. eine Bewegungsrichtung und eine Bewegungsgeschwindigkeit der Spitzenposition (Endeffektor 13) des Roboters 14 sein.
  • 7 ist ein Schaubild, das ein Beispiel einer Maschinenlerneinheit in der Maschinenlernvorrichtung einer Ausführungsform erläutert, wobei ein Beispiel eines Falls veranschaulicht wird, in dem ein „Verstärkungslernen (Q-Learning)” angewandt wird. Wie in 7 veranschaulicht, umfasst die Lerneinheit 55 eine Vergütungsberechnungseinheit 71 und eine Wertfunktionsaktualisierungseinheit 72. Die Vergütungsberechnungseinheit 71 berechnet eine Vergütung, z. B. einen Punktewert, beispielsweise auf Basis der ersten Ergebnismarkierung 61 und der ersten Statusmenge 62 oder der zweiten Ergebnismarkierung 64 und der zweiten Statusmenge 65.
  • Die Vergütung wird z. B. so eingestellt, dass sie in Bezug auf einen Erfolg des Vorgangs höher ist und in Bezug auf ein Scheitern des Vorgangs niedriger ist. Die Vergütung kann auch berechnet werden, z. B. auf Basis der Taktzeit des Vorgangs. In Hinblick auf die Vergütung kann ferner z. B. die Vergütung gemäß jedem Schritt berechnet werden, wie z. B. Erfolg in Bezug auf das Greifen des Handteils (Endeffektor 13) oder Erfolg in Bezug auf das Transportieren mit dem Handteil. Ferner wird z. B. wenn ermittelt wird, dass eine Interferenz verursacht wird, eine derartige Einstellung vorgenommen, dass die Vergütung verringert wird, und wird ein Prozess durchgeführt, bei dem der Vorgang zu diesem Zeitpunkt unterbrochen und von der Anfangsposition aus neu begonnen wird, wodurch es möglich wird, mit dem Lernen fortzufahren, z. B. ohne dass ein Status mit einem Problem verursacht oder dieser aufrechterhalten wird.
  • Danach hat die Wertfunktionsaktualisierungseinheit 72 z. B. eine Wertfunktion Q(s, a), die den Wert einer Aktion ermittelt, und aktualisiert die Wertfunktion je nach der oben beschriebenen Vergütung durch die Vergütungsberechnungseinheit 71. Der Steuerbefehl (Betriebslokus) wird auf Basis der aktualisierten Wertfunktion generiert und an den Simulator 52 ausgegeben, um den oben beschriebenen Prozess durchzuführen und den Roboter 14 (Maschine) zu steuern. Auf diese Weise ist es möglich, die Maschine mit dem Steuerbefehl zu steuern, dessen Sicherheit in Bezug auf das Maschinenlernen gewährleistet ist (das Auftreten eines Problems wie z. B. Schaden der Maschine, Scheitern des Vorgangs oder Schaden des Peripheriegeräts wird verhindert).
  • Nicht nur das oben beschriebene „überwachte Lernen” und „Verstärkungslernen (Q-Learning)”, sondern auch diverse Techniken wie z. B. die diversen bekannten Maschinenlerntechniken (z. B. „überwachtes Lernen”, „unüberwachtes Lernen” und Verstärkungslernen”) oder „tiefes Lernen”, das die Extraktion eines Merkmalswert per Steuereinrichtung lernt, um diese Techniken umzusetzen, können umfassend an die Maschinenlernvorrichtung gemäß der vorliegenden Erfindung angewandt werden. Ferner ist es selbstverständlich, dass die Anwendung der Maschinenlernvorrichtung gemäß der vorliegenden Erfindung nicht auf den oben beschriebenen industriellen Roboter beschränkt ist, sondern dass die Maschinenlernvorrichtung auch z. B. auf eine Werkzeugmaschine, eine Schmiedepressenmaschine, eine Spritzgussmaschine, einen Wartungsroboter oder dergleichen, wie durch eine Steuereinrichtung gesteuert, angewandt werden kann.
  • Im Obigen kann, wenn ein Herstellungssystem betrachtet wird, das eine Mehrzahl von Maschinensystemen umfasst, umfassend eine Maschinenlernvorrichtung und eine Maschine (Roboter), z. B. eine solche Konfiguration vorgenommen werden, dass die Maschinenlernvorrichtung in jedem der Maschinensysteme bereitgestellt wird und die Mehrzahl von Maschinenlernvorrichtungen, die in der Mehrzahl von Maschinensystemen bereitgestellt ist, Daten durch ein Kommunikationsmedium untereinander nutzen und austauschen. Ferner ist es auch möglich, eine solche Konfiguration vorzunehmen, dass die Maschinenlernvorrichtung auf einem Cloudserver liegt, z. B. durch ein Kommunikationsmedium wie z. B. das Internet.
  • Gemäß der Maschinenlernvorrichtung, dem Maschinensystem, dem Herstellungssystem und dem Maschinenlernverfahren, die die vorliegende Erfindung bilden, ist es möglich, den Vorteil bereitzustellen, dass die Gewährleistung der Sicherheit des Maschinenlernens möglich ist.
  • Alle Beispiele und sämtliche konditionale Sprache, wie hierin bereitgestellt, sollen pädagogischen Zwecken dienen, um dem Leser das Verstehen der Erfindung und der Konzepte, die der Erfinder beiträgt, um das Gebiet voranzubringen, zu erleichtern, und sollen nicht als Einschränkungen auf diese spezifisch genannten Beispiele und Bedingungen ausgelegt werden, und die Organisation dieser Beispiele in der Schrift zeigt auch keine Überlegenheit und Unterlegenheit der Erfindung. Auch wenn eine oder mehrere Ausführungsformen der vorliegenden Erfindung ausführlich beschrieben wurden, sei verstanden, dass diverse Modifikationen, Substitutionen und Änderungen an diesen vorgenommen werden können, ohne sich vom Geist und Umfang der Erfindung zu entfernen.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • JP 09-319420 [0003]
    • JP 5137537 [0004]

Claims (15)

  1. Maschinenlernvorrichtung (20), die einen Steuerbefehl für eine Maschine (14) durch Maschinenlernen lernt, umfassend: eine Maschinenlerneinheit (21, 25, 55), die das Maschinenlernen durchführt, um den Steuerbefehl auszugeben; einen Simulator (22, 52), der eine Simulation eines Arbeitsvorgangs der Maschine (14) auf Basis des Steuerbefehls durchführt; und eine erste Ermittlungseinheit (23, 53), die den Steuerbefehl auf Basis eines Durchführungsergebnisses der Simulation durch den Simulator (22, 52) ermittelt.
  2. Maschinenlernvorrichtung nach Anspruch 1, wobei die erste Ermittlungseinheit (23, 53): ermittelt, dass der Steuerbefehl gültig ist, und eine Eingabe des Steuerbefehls in die Maschine (14) durchführt, wenn im Durchführungsergebnis der Simulation kein Problem vorliegt, und ermittelt, dass der Steuerbefehl ungültig ist, und die Eingabe des Steuerbefehls in die Maschine (14) stoppt, wenn im Durchführungsergebnis der Simulation ein Problem vorliegt.
  3. Maschinenlernvorrichtung nach Anspruch 2, wobei dann, wenn ein Ermittlungsergebnis von der ersten Ermittlungseinheit (23, 53) ungültig ist, die Eingabe des Steuerbefehls in die Maschine (14) gestoppt wird, und ein Lernen durchgeführt wird, indem eine erste Ergebnismarkierung (41, 61), die von der ersten Ermittlungseinheit (23, 53) erhalten wird, als Schulungsdaten an die Maschinenlerneinheit (21, 25, 55) bereitgestellt wird.
  4. Maschinenlernvorrichtung nach Anspruch 3, wobei dann, wenn das Ermittlungsergebnis von der ersten Ermittlungseinheit (23) ungültig ist, das Lernen durchgeführt wird, indem eine erste Statusmenge (62), umfassend einen Teil oder alle der vom Simulator (52) erhaltenen Berechnungsergebnisdaten, gemeinsam mit der ersten Ergebnismarkierung (61) an die Maschinenlerneinheit (55) bereitgestellt werden.
  5. Maschinenlernvorrichtung nach einem der Ansprüche 2 bis 4, die ferner eine zweite Ermittlungseinheit (24, 54) umfasst, die ein Arbeitsergebnis der Maschine (14) durch den Steuerbefehl ermittelt, wobei dann, wenn ein Ermittlungsergebnis von der ersten Ermittlungseinheit (23) gültig ist, eine Eingabe des Steuerbefehls in die Maschine (14) durchgeführt wird, und ein Lernen durchgeführt wird, indem eine zweite Ergebnismarkierung (44, 64), die von der zweiten Ermittlungseinheit (24, 54) erhalten wird, als Schulungsdaten an die Maschinenlerneinheit (21, 25, 55) bereitgestellt wird.
  6. Maschinenlernvorrichtung nach Anspruch 5, wobei dann, wenn das Ermittlungsergebnis von der ersten Ermittlungseinheit (53) gültig ist, das Lernen durchgeführt wird, indem eine zweite Statusmenge (65), umfassend zumindest eines von Ausgabedaten eines Sensors, der einen Status der Maschine (14) oder einer Umgebung erkennt, internen Daten einer Steuersoftware, die die Maschine (14) steuert, und Berechnungsdaten, die auf Basis der Ausgabedaten des Sensors oder der internen Daten der Steuersoftware erhalten werden, gemeinsam mit der zweiten Ergebnismarkierung (64) an die Maschinenlerneinheit (55) bereitgestellt werden.
  7. Maschinenlernvorrichtung nach einem der Ansprüche 2 bis 6, wobei: ein Status der Maschinenlerneinheit (21) als erster Status aufrechterhalten wird, regulär oder wenn eine vorab spezifizierte Bedingung erfüllt ist; und der Status der Maschinenlerneinheit (21) in den ersten Status zurückgebracht wird, wenn eine Häufigkeit, mit der das Ermittlungsergebnis von der ersten Ermittlungseinheit (23) gültig wird, abnimmt.
  8. Maschinenlernvorrichtung nach einem der Ansprüche 2 bis 7, wobei dann, wenn das Ermittlungsergebnis von der ersten Ermittlungseinheit (23) drei oder mehr Status annimmt, umfassend gültig und ungültig, eine Befehlsgeschwindigkeit der Maschine (14), die im Steuerbefehl umfasst ist, auf Basis des Status verändert wird.
  9. Maschinenlernvorrichtung nach einem der Ansprüche 2 bis 8, wobei die Maschinenlerneinheit (55) umfasst: eine Vergütungsberechnungseinheit (71), die eine Vergütung auf Basis eines Arbeitsstatus der Maschine (14) berechnet; und eine Wertfunktionsaktualisierungseinheit (72) mit einer Wertfunktion, die einen Wert für den Steuerbefehl ermittelt und die Wertfunktion auf Basis der Vergütung aktualisiert.
  10. Maschinenlernvorrichtung nach einem der Ansprüche 1 bis 9, wobei die Maschinenlernvorrichtung (20) ein neuronales Netzwerk umfasst.
  11. Maschinensystem, das die Maschinenlernvorrichtung (20) nach einem der Ansprüche 1 bis 10 und die Maschine (14) umfasst, wobei das Maschinensystem umfasst: eine Steuereinrichtung, die die Maschine (14) steuert; und eine Rechnereinrichtung mit der Maschinenlernvorrichtung (20), umfassend die Maschinenlerneinheit (21), den Simulator (22) und die erste Ermittlungseinheit (23), wobei die Rechnereinrichtung und eine oder mehrere der Maschinen (14) über ein Netzwerk verbunden sind.
  12. Maschinensystem nach Anspruch 11, wobei das Lernen der Maschinenlerneinheit (21): sogar während einer tatsächlichen Produktionsarbeit durch die Maschine (14) kontinuierlich durchgeführt wird, oder vorab durchgeführt wird, aber nicht während der tatsächlichen Produktionsarbeit durch die Maschine (14) durchgeführt wird.
  13. Herstellungssystem, das eine Mehrzahl der Maschinensysteme nach Anspruch 11 oder 12 umfasst, wobei: die Maschinenlernvorrichtung (20) in jedem der Maschinensysteme bereitgestellt ist; und eine Mehrzahl der Maschinenlernvorrichtungen (20), die in der Mehrzahl der Maschinensysteme bereitgestellt ist, so konfiguriert ist, dass sie Daten über ein Kommunikationsmedium untereinander teilen oder austauschen.
  14. Herstellungssystem nach Anspruch 13, wobei die Maschinenlernvorrichtung (20) auf einem Cloudserver liegt.
  15. Maschinenlernverfahren, das einen Steuerbefehl für eine Maschine (14) durch Maschinenlernen lernt, wobei das Maschinenlernverfahren umfasst: Durchführen des Maschinenlernens zum Ausgeben des Steuerbefehls; Durchführen einer Simulation eines Arbeitsvorgangs der Maschine (14) auf Basis des Steuerbefehls; Ermitteln des Steuerbefehls auf Basis eines Ergebnisses der Durchführung der Simulation; Ermitteln, dass der Steuerbefehl gültig ist, und Durchführen einer Eingabe des Steuerbefehls in die Maschine (14), wenn im Durchführungsergebnis der Simulation kein Problem vorliegt; und Ermitteln, dass der Steuerbefehl ungültig ist, und Stoppen der Eingabe des Steuerbefehls in die Maschine (14), wenn im Durchführungsergebnis der Simulation ein Problem vorliegt.
DE102017002996.2A 2016-04-04 2017-03-28 Maschinenlernvorrichtung, die ein lernen unter verwendung eines simulationsergebnisses durchführt, maschinensystem, herstellungssystem und maschinenlernverfahren Active DE102017002996B4 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016-075476 2016-04-04
JP2016075476A JP6457421B2 (ja) 2016-04-04 2016-04-04 シミュレーション結果を利用して学習を行う機械学習装置,機械システム,製造システムおよび機械学習方法

Publications (2)

Publication Number Publication Date
DE102017002996A1 true DE102017002996A1 (de) 2017-10-05
DE102017002996B4 DE102017002996B4 (de) 2020-08-27

Family

ID=59886008

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102017002996.2A Active DE102017002996B4 (de) 2016-04-04 2017-03-28 Maschinenlernvorrichtung, die ein lernen unter verwendung eines simulationsergebnisses durchführt, maschinensystem, herstellungssystem und maschinenlernverfahren

Country Status (4)

Country Link
US (1) US10317854B2 (de)
JP (1) JP6457421B2 (de)
CN (1) CN107263464B (de)
DE (1) DE102017002996B4 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112018007729B4 (de) 2018-06-14 2022-09-08 Yamaha Hatsudoki Kabushiki Kaisha Maschinelle Lernvorrichtung und mit dieser ausgestattetes Robotersystem

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9069725B2 (en) 2011-08-19 2015-06-30 Hartford Steam Boiler Inspection & Insurance Company Dynamic outlier bias reduction system and method
CA3116974A1 (en) 2014-04-11 2015-10-15 Hartford Steam Boiler Inspection And Insurance Company Improving future reliability prediction based on system operational and performance data modelling
US10600691B2 (en) 2016-10-07 2020-03-24 Xcelsis Corporation 3D chip sharing power interconnect layer
US10672745B2 (en) 2016-10-07 2020-06-02 Xcelsis Corporation 3D processor
US10672663B2 (en) 2016-10-07 2020-06-02 Xcelsis Corporation 3D chip sharing power circuit
US10580757B2 (en) 2016-10-07 2020-03-03 Xcelsis Corporation Face-to-face mounted IC dies with orthogonal top interconnect layers
KR102512017B1 (ko) 2016-10-07 2023-03-17 엑셀시스 코포레이션 직접-접합된 네이티브 상호접속부 및 능동 베이스 다이
US10719762B2 (en) 2017-08-03 2020-07-21 Xcelsis Corporation Three dimensional chip structure implementing machine trained network
US10580735B2 (en) 2016-10-07 2020-03-03 Xcelsis Corporation Stacked IC structure with system level wiring on multiple sides of the IC die
JP2019086928A (ja) * 2017-11-06 2019-06-06 ファナック株式会社 制御装置及び機械学習装置
CN107918283B (zh) * 2017-12-12 2021-03-26 海南师范大学 一种批次注塑过程抗干扰的混杂稳定控制器设计方法
JP6933167B2 (ja) * 2018-03-14 2021-09-08 オムロン株式会社 ロボットの制御装置
JP6911798B2 (ja) * 2018-03-15 2021-07-28 オムロン株式会社 ロボットの動作制御装置
CN108510081A (zh) * 2018-03-23 2018-09-07 北京京东尚科信息技术有限公司 机器学习方法和平台
JP6810087B2 (ja) * 2018-03-29 2021-01-06 ファナック株式会社 機械学習装置、機械学習装置を用いたロボット制御装置及びロボットビジョンシステム、並びに機械学習方法
US10875176B2 (en) 2018-04-04 2020-12-29 Kuka Systems North America Llc Process control using deep learning training model
CN110390845A (zh) * 2018-04-18 2019-10-29 北京京东尚科信息技术有限公司 虚拟环境下机器人训练方法及装置、存储介质及计算机系统
JP7091820B2 (ja) * 2018-05-14 2022-06-28 オムロン株式会社 制御システム、学習データ作成装置、学習装置および判定装置
JP7039389B2 (ja) * 2018-05-25 2022-03-22 川崎重工業株式会社 ロボットシステム及びロボット制御方法
JP7167141B2 (ja) * 2018-05-25 2022-11-08 川崎重工業株式会社 ロボットシステム及び追加学習方法
US11133110B2 (en) * 2018-06-21 2021-09-28 Healthhelp, Llc Systems and methods for assessing whether medical procedures should be approved
JP7398373B2 (ja) 2018-07-04 2023-12-14 株式会社Preferred Networks 制御装置、システム、制御方法、及びプログラム
JP7191569B2 (ja) * 2018-07-26 2022-12-19 Ntn株式会社 把持装置
EP3611578B1 (de) * 2018-08-14 2022-04-06 OMRON Corporation Industrielle pc-vorrichtung und verfahren zum betreiben einer industriellen pc-vorrichtung
JP7175682B2 (ja) * 2018-09-06 2022-11-21 キヤノンメディカルシステムズ株式会社 診断支援装置、診断支援システム、診断支援方法、及び診断支援プログラム
JPWO2020050405A1 (ja) * 2018-09-07 2021-09-02 Ntn株式会社 作業装置
JP7125745B2 (ja) * 2018-09-14 2022-08-25 学校法人早稲田大学 自律型作業支援ロボットの環境適応性強化システム、動作シミュレーション装置及びそのプログラム
US11636292B2 (en) 2018-09-28 2023-04-25 Hartford Steam Boiler Inspection And Insurance Company Dynamic outlier bias reduction system and method
JP7110884B2 (ja) * 2018-10-01 2022-08-02 オムロン株式会社 学習装置、制御装置、学習方法、及び学習プログラム
DE102019006725B4 (de) * 2018-10-02 2023-06-01 Fanuc Corporation Steuereinrichtung und Steuersystem
EP3880411A1 (de) * 2018-11-13 2021-09-22 ABB Schweiz AG Verfahren und system zum anwenden von maschinenlernen auf eine anwendung
EP3881139A1 (de) * 2018-11-13 2021-09-22 ABB Schweiz AG Verfahren und system zur anwendung von maschinelem lernen auf eine anwendung
JP6915605B2 (ja) * 2018-11-29 2021-08-04 オムロン株式会社 画像生成装置、ロボット訓練システム、画像生成方法、及び画像生成プログラム
US11584020B2 (en) * 2018-12-04 2023-02-21 Cloudminds Robotics Co., Ltd. Human augmented cloud-based robotics intelligence framework and associated methods
JP2022511504A (ja) * 2018-12-04 2022-01-31 キャベンディッシュ ニュークリア リミテッド 制御装置の改良及び制御装置に関連する改良
JP6997068B2 (ja) * 2018-12-19 2022-01-17 ファナック株式会社 ロボット制御装置、ロボット制御システム、及びロボット制御方法
TWI709922B (zh) * 2018-12-21 2020-11-11 財團法人工業技術研究院 基於模型之機器學習系統
JP7252787B2 (ja) * 2019-02-28 2023-04-05 川崎重工業株式会社 機械学習モデル運用管理システム及び機械学習モデル運用管理方法
US11763191B2 (en) * 2019-08-20 2023-09-19 The Calany Holding S. À R.L. Virtual intelligence and optimization through multi-source, real-time, and context-aware real-world data
US11328177B2 (en) 2019-09-18 2022-05-10 Hartford Steam Boiler Inspection And Insurance Company Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models
US11615348B2 (en) 2019-09-18 2023-03-28 Hartford Steam Boiler Inspection And Insurance Company Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models
GB2617045B (en) 2019-09-18 2024-05-01 Hartford Steam Boiler Inspection And Insurance Company Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models
US11645498B2 (en) 2019-09-25 2023-05-09 International Business Machines Corporation Semi-supervised reinforcement learning
WO2021084587A1 (ja) * 2019-10-28 2021-05-06 株式会社安川電機 機械学習データ生成装置、機械学習装置、作業システム、コンピュータプログラム、機械学習データ生成方法及び作業機械の製造方法
US11599299B2 (en) 2019-11-19 2023-03-07 Invensas Llc 3D memory circuit
US11525596B2 (en) * 2019-12-23 2022-12-13 Johnson Controls Tyco IP Holdings LLP Methods and systems for training HVAC control using simulated and real experience data
EP3907171B1 (de) * 2020-05-06 2022-07-06 Hiab AB Kran, fahrzeug und verfahren für den kran
CN115968479A (zh) * 2020-08-20 2023-04-14 日立数据管理有限公司 用于自动化数据科学过程的系统和方法
TWI757999B (zh) * 2020-12-04 2022-03-11 國立陽明交通大學 即時避障系統、即時避障方法及具有即時避障功能的無人載具
JP7359176B2 (ja) * 2021-03-03 2023-10-11 横河電機株式会社 判定装置、判定方法、および、判定プログラム
JP7363839B2 (ja) * 2021-03-09 2023-10-18 横河電機株式会社 制御装置、制御方法、および、制御プログラム
JP2022143969A (ja) * 2021-03-18 2022-10-03 株式会社東芝 データ生成装置、データ生成方法、制御装置、制御方法及びプログラム
WO2023042306A1 (ja) * 2021-09-15 2023-03-23 ヤマハ発動機株式会社 画像処理装置、部品把持システム、画像処理方法および部品把持方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5137537A (de) 1974-09-26 1976-03-29 Matsushita Electric Ind Co Ltd
JPH09319420A (ja) 1996-05-31 1997-12-12 Ricoh Co Ltd 組立ロボット

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5673367A (en) * 1992-10-01 1997-09-30 Buckley; Theresa M. Method for neural network control of motion using real-time environmental feedback
JP3363846B2 (ja) * 1999-08-27 2003-01-08 富士通株式会社 実世界情報データベース構築方法及び装置と自律移動走行体学習方法
JP3782679B2 (ja) * 2001-05-09 2006-06-07 ファナック株式会社 干渉回避装置
JP2004116351A (ja) * 2002-09-25 2004-04-15 Fuji Heavy Ind Ltd 制御パラメータの最適化システム
JP2007280054A (ja) * 2006-04-06 2007-10-25 Sony Corp 学習装置および学習方法、並びにプログラム
JP5137537B2 (ja) 2007-11-28 2013-02-06 三菱電機株式会社 ロボットの作業動作最適化装置
CN101623865A (zh) * 2009-07-08 2010-01-13 北京工业大学 独轮机器人系统及其控制方法
JP5454221B2 (ja) * 2010-02-24 2014-03-26 株式会社Ihi 多関節ロボットの駆動制御方法及び多関節ロボットの配線配管保護装置
CN101973031B (zh) * 2010-08-24 2013-07-24 中国科学院深圳先进技术研究院 云机器人系统及实现方法
JP5623358B2 (ja) * 2011-09-06 2014-11-12 三菱電機株式会社 ワーク取り出し装置
JP5931685B2 (ja) * 2012-10-12 2016-06-08 日本電信電話株式会社 ロボット協調搬送計画装置、方法、プログラム
JP5765355B2 (ja) * 2013-03-18 2015-08-19 株式会社安川電機 ロボットピッキングシステム及び被加工物の製造方法
US9008840B1 (en) * 2013-04-19 2015-04-14 Brain Corporation Apparatus and methods for reinforcement-guided supervised learning
JP6429450B2 (ja) * 2013-10-31 2018-11-28 キヤノン株式会社 情報処理装置、情報処理方法
US9524418B2 (en) * 2014-06-05 2016-12-20 Promethean Limited Systems and methods for detecting, identifying and tracking objects and events over time

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5137537A (de) 1974-09-26 1976-03-29 Matsushita Electric Ind Co Ltd
JPH09319420A (ja) 1996-05-31 1997-12-12 Ricoh Co Ltd 組立ロボット

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112018007729B4 (de) 2018-06-14 2022-09-08 Yamaha Hatsudoki Kabushiki Kaisha Maschinelle Lernvorrichtung und mit dieser ausgestattetes Robotersystem
US11945115B2 (en) 2018-06-14 2024-04-02 Yamaha Hatsudoki Kabushiki Kaisha Machine learning device and robot system provided with same

Also Published As

Publication number Publication date
CN107263464B (zh) 2020-02-28
JP2017185577A (ja) 2017-10-12
CN107263464A (zh) 2017-10-20
DE102017002996B4 (de) 2020-08-27
US20170285584A1 (en) 2017-10-05
US10317854B2 (en) 2019-06-11
JP6457421B2 (ja) 2019-01-23

Similar Documents

Publication Publication Date Title
DE102017002996B4 (de) Maschinenlernvorrichtung, die ein lernen unter verwendung eines simulationsergebnisses durchführt, maschinensystem, herstellungssystem und maschinenlernverfahren
DE102018204740B4 (de) Aktionsinformationslernvorrichtung, Robotersteuersystem und Aktionsinformationslernverfahren
DE102016014264B4 (de) Maschinelle Lernvorrichtung, Blechpaketherstellungsvorrichtung, Blechpaketherstellungssystem und maschinelles Lernverfahren zum Erlernen des Stapelns von Paketblechen
DE102018209149B4 (de) Maschinenlernvorrichtung, Steuerung und Maschinenlernprogramm
DE102016015017B4 (de) Steuervorrichtung mit Lernfunktion zum Erfassen einer Rauschursache
DE102017010799B4 (de) Maschinenlernvorrichtung zum Lernen einer Bearbeitungsreihenfolge eines Robotersystems mit einer Mehrzahl von Laserbearbeitungsrobotern, dazugehöriges Robotersystem sowie Maschinenlernverfahren zum Lernen einer Bearbeitungsreihenfolge des Robotersystems mit einer Mehrzahl von Laserbearbeitungsrobotern
DE112017008089B4 (de) Vorrichtung zur Überwachung eines dreidimensionalen Raumes, Verfahren zur Überwachung eines dreidimensionalen Raumes und Programm zur Überwachung eines dreidimensionalen Raumes
DE102017011350A1 (de) Maschinenlernvorrichtung, lebensdauerprognosevorrichtung, numerische steuereinrichtung, produktionssystem und maschinenlernverfahren zum prognostizieren einer lebensdauer eines nand-flash-speichers
DE102017005349A1 (de) Maschinenlernvorrichtung, numerische steuervorrichtung und maschinenlernverfahren zum lernen eines schwellenwerts zum erkennen einer anomalen last
DE102018205015B4 (de) Einstellvorrichtung und Einstellverfahren
DE102017003943A1 (de) Zellensteuervorrichtung zum Optimieren von Bewegungen eines Produktionssystems, das Industriemaschinen umfasst
DE102018129528B4 (de) Schwingungsunterdrückungsvorrichtung
DE102016117560B4 (de) Werkzeugmaschine zum erzeugen einer geschwindigkeitsverteilung
DE102018201157B4 (de) Lernmodell-Konstruktionsvorrichtung und Steuerinformations-Optimierungsvorrichtung
DE102017000770A1 (de) Maschinelle lernvorrichtung, numerische steuerung, werkzeugmaschinensystem, herstellungssystem und maschinelles lernverfahren zum erlernen der anzeige eines bedienungsmenüs
DE102018200794A1 (de) Aktionsinformationslernvorrichtung, aktionsinformationsoptimierungssystem und aktionsinformationslernprogramm
DE102019204861A1 (de) Maschinenlernvorrichtung; steuervorrichtung und maschinelles lernverfahren
DE102018118330A1 (de) Simulationseinrichtung und Simulationsverfahren für Robotersystem
WO2021058223A1 (de) Verfahren zur effizienten, simulativen applikation automatisierter fahrfunktionen
DE102020103527A1 (de) Lernsysteme und -verfahren
DE112020006045T5 (de) Formal sicheres symbolisches bestärkendes lernen anhand von visuellen eingaben
DE102017125103A1 (de) Einstellvorrichtung und einstellsystem zum konfigurieren von einstellungen für eine mehrzahl von maschinen
DE102019003928A1 (de) Positionsinformationsanzeigesystem
DE102021109382A1 (de) System und verfahren eines monotonen neuronalen operatornetzes technisches gebiet
DE112019007889T5 (de) Bearbeitungsprogramm-umwandlungseinrichtung, numerische-steuereinrichtung und bearbeitungsprogramm-umwandlungsverfahren

Legal Events

Date Code Title Description
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06F0019000000

Ipc: G16Z0099000000

R012 Request for examination validly filed
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final