DE102018202654A1 - Vorrichtung für maschinelles Lernen, Servoregeleinrichtung, Servoregelsystem und Verfahren für maschinelles Lernen - Google Patents

Vorrichtung für maschinelles Lernen, Servoregeleinrichtung, Servoregelsystem und Verfahren für maschinelles Lernen Download PDF

Info

Publication number
DE102018202654A1
DE102018202654A1 DE102018202654.8A DE102018202654A DE102018202654A1 DE 102018202654 A1 DE102018202654 A1 DE 102018202654A1 DE 102018202654 A DE102018202654 A DE 102018202654A DE 102018202654 A1 DE102018202654 A1 DE 102018202654A1
Authority
DE
Germany
Prior art keywords
command
control
machine learning
learning
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE102018202654.8A
Other languages
English (en)
Other versions
DE102018202654B4 (de
Inventor
Naoto Sonoda
Satoshi Ikai
Ryoutarou TSUNEKI
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fanuc Corp
Original Assignee
Fanuc Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fanuc Corp filed Critical Fanuc Corp
Publication of DE102018202654A1 publication Critical patent/DE102018202654A1/de
Application granted granted Critical
Publication of DE102018202654B4 publication Critical patent/DE102018202654B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/414Structure of the control system, e.g. common controller or multiprocessor systems, interface to servo, programmable interface controller
    • G05B19/4142Structure of the control system, e.g. common controller or multiprocessor systems, interface to servo, programmable interface controller characterised by the use of a microprocessor
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B6/00Internal feedback arrangements for obtaining particular characteristics, e.g. proportional, integral or differential
    • G05B6/02Internal feedback arrangements for obtaining particular characteristics, e.g. proportional, integral or differential electric
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/33Director till display
    • G05B2219/33032Learn by changing input weights as function of position error
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/34Director, elements to supervisory
    • G05B2219/34013Servocontroller
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/36Nc in input of data, input key till input tape
    • G05B2219/36411By coarse model of robot to modify commands, learned by feedforward controller
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/42Servomotor, servo controller kind till VSS
    • G05B2219/42151Learn dynamics of servomotor system by ann

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Human Computer Interaction (AREA)
  • Manufacturing & Machinery (AREA)
  • Feedback Control In General (AREA)

Abstract

Leichte Ausführung der Einstellung in Bezug auf die Vorwärtsregelung und außerdem Verbesserung der Befehlsfolgeleistung. Eine Vorrichtung (100) für maschinelles Lernen enthält ein Kennsatz-Erfassungsmittel (102) zum Erfassen eines durch eine Servoregeleinrichtung (200) an eine Regelzielvorrichtung (300) ausgegebenen Befehls als einen Kennsatz, um die Regelzielvorrichtung anzusteuern und zu regeln, Eingangsdaten-Erfassungsmittel (101), um eine Ausgabe der auf der Grundlage des Befehls angesteuerten Regelzielvorrichtung als Eingangsdaten zu erfassen, und Lernmittel (103) zum Aufbauen eines Lernmodells in Bezug auf die Vorwärtsregelung zum Korrigieren des Befehls durch Ausführen von überwachtem Lernen unter Verwendung eines Satzes des Kennsatzes und der Eingangsdaten, der als Lehrerdaten dient.

Description

  • HINTERGRUND DER ERFINDUNG
  • Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf eine Vorrichtung für maschinelles Lernen, auf eine Servoregeleinrichtung, auf ein Servoregelsystem und auf ein Verfahren für maschinelles Lernen, um ein maschinelles Lernen in Bezug auf die Servoregelung auszuführen.
  • Verwandtes Gebiet
  • Herkömmlich ist in einer Servoregeleinrichtung eine Technik zum Korrigieren eines Befehls durch Ausführen einer Vorwärtsregelung bekannt. Ferner ist eine Technik zum Bestimmen von Parametern eines in einer vorderen Stufe eines Regelziels angeordneten Kompensators unter Verwendung von maschinellem Lernen wie etwa eines neuronalen Netzes bekannt. Zum Beispiel offenbart das Patentdokument 1 eine Konfiguration einer Servoregeleinrichtung zum Ausführen einer Rückkopplungsregelung und einer Vorwärtsregelung durch Lernen einer Differenz zwischen einer Ausgabe eines Regelziels und einer Ausgabe eines linearen Modells durch maschinelles Lernen und zum Bestimmen von Parametern eines in der vorderen Stufe des Kompensators angeordneten Kompensators auf der Grundlage des Lernergebnisses des maschinellen Lernens.
  • Patentdokument 1:
    Japanische ungeprüfte Patentanmeldungsveröffentlichung Nr. H07-210207
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die in dem Patentdokument 1 offenbarte oben beschriebene Technik bezieht sich auf eine Konfiguration zum Ausführen einer adaptiven Regelung eines Referenzmodells unter Verwendung eines linearen Modells als ein Referenzmodell, um eine Anpassung an Charakteristiken des linearen Modells auszuführen. Das lineare Modell ist z. B. ein Modell, das in der Weise gebildet ist, dass ein nichtlineares Regelziel einer Linearisierung um einen Gleichgewichtspunkt ausgesetzt wird. Um die in dem Patentdokument 1 offenbarte Technik zu verwenden, muss ein Nutzer lineare Modelle eines nach dem anderen vorbereiten. Allerdings ist die Vorbereitung linearer Modelle eines nach dem anderen für einen Nutzer unangenehm, so dass ein leichteres Verfahren zum Ausführen der Anpassung in Bezug auf die Vorwärtsregelung erwünscht ist.
  • Die Aufgabe der vorliegenden Erfindung ist es, eine Vorrichtung für maschinelles Lernen, eine Servoregeleinrichtung, ein Servoregelsystem und ein Verfahren für maschinelles Lernen zu schaffen, die ermöglichen, eine Einstellung in Bezug auf die Vorwärtsregelung leicht auszuführen und die Befehlsfolgeleistung zu verbessern.
  • (1) Eine Vorrichtung für maschinelles Lernen gemäß der vorliegenden Erfindung (z. B. die im Folgenden beschriebene Vorrichtung 100 für maschinelles Lernen) enthält ein Kennsatz-Erfassungsmittel (z. B. das im Folgenden beschriebene Kennsatz-Erfassungsmittel 102) zum Erfassen eines durch eine Servoregeleinrichtung (z. B. durch die im Folgenden beschriebene Servoregeleinrichtung 200) an eine Regelzielvorrichtung (z. B. an die im Folgenden beschriebene Regelzielvorrichtung 300) ausgegebenen Befehls als einen Kennsatz, um die Regelzielvorrichtung anzusteuern und zu regeln; Eingangsdaten-Erfassungsmittel (z. B. die im Folgenden beschriebenen Eingangsdaten-Erfassungsmittel 101), um eine Ausgabe der auf der Grundlage des Befehls angesteuerten Regelzielvorrichtung als Eingangsdaten zu erfassen, und Lernmittel (z. B. die im Folgenden beschriebenen Lernmittel 103) zum Aufbauen eines Lernmodells in Bezug auf die Vorwärtsregelung zum Korrigieren des Befehls durch Ausführen von überwachtem Lernen unter Verwendung eines Satzes des Kennsatzes und der Eingangsdaten, der als Lehrerdaten dient.
  • (2) In der Vorrichtung für maschinelles Lernen nach (1) kann die Servoregeleinrichtung eine Rückkopplungsregelung zum Korrigieren des Befehls ausführen und kann das Eingangsdaten-Erfassungsmittel die Rückkopplung in der Rückkopplungsregelung als eine Ausgabe der Regelzielvorrichtung erfassen.
  • (3) In der Vorrichtung für maschinelles Lernen nach (2) kann der Befehl ein Positionsbefehl oder ein Geschwindigkeitsbefehl oder ein Strombefehl oder irgendeine Kombination des Positionsbefehls, des Geschwindigkeitsbefehls und des Strombefehls sein und kann die Ausgabe der Regelzielvorrichtung die Positionsrückkopplung oder die Geschwindigkeitsrückkopplung oder die Stromrückkopplung oder irgendeine Kombination der Positionsrückkopplung, der Geschwindigkeitsrückkopplung und der Stromrückkopplung sein.
  • (4) In der Vorrichtung für maschinelles Lernen nach einem von (1) bis (3) kann der durch das Kennsatz-Erfassungsmittel als ein Kennsatz erfasste Befehl einen Befehl enthalten, der dafür geplant ist, an die Regelzielvorrichtung ausgegeben zu werden.
  • (5) Die Vorrichtung für maschinelles Lernen nach einem von (1) bis (4) kann ferner Funktionsausgabemittel (z. B. das Ausgabeteil 105 der Funktion zum Erzeugen des geschätzten Regelbefehls, das Ausgabeteil 106 der Funktion zum Erzeugen des geschätzten Strombefehls und das Ausgabeteil 107 der Funktion zum Erzeugen des geschätzten Spannungsbefehls, die im Folgenden beschrieben werden) zum Erzeugen und Ausgeben einer Funktion zum Erzeugen eines Korrekturwerts in der Vorwärtsregelung auf der Grundlage des durch die Lernmittel aufgebauten Lernmodells enthalten.
  • (6) Ein Servoregelsystem gemäß der vorliegenden Erfindung (z. B. das im Folgenden beschriebene Servoregelsystem 1) enthält die Vorrichtung für maschinelles Lernen nach (5) (z. B. die im Folgenden beschriebene Vorrichtung 100 für maschinelles Lernen) und die Servoregeleinrichtung (z. B. die im Folgenden beschriebene Servoregeleinrichtung 200), die einen Vorwärtsregelungskompensator (z. B. den Vorwärtsregelungskompensator 11, den Vorwärtsregelungskompensator 21 und den Vorwärtsregelungskompensator 31, die im Folgenden beschrieben werden) zum Ausführen einer Vorwärtsregelung auf der Grundlage der durch die Funktionsausgabemittel ausgegebenen Funktion enthält.
  • (7) Eine Servoregeleinrichtung gemäß der vorliegenden Erfindung (z. B. die im Folgenden beschriebene Servoregeleinrichtung 200) enthält die Vorrichtung für maschinelles Lernen nach einem von (1) bis (4) (z. B. die im Folgenden beschriebene Vorrichtung 100 für maschinelles Lernen), Funktionsausgabemittel (z. B. das Ausgabeteil 105 der Funktion zum Erzeugen des geschätzten Regelbefehls, das Ausgabeteil 106 der Funktion zum Erzeugen des geschätzten Strombefehls und das Ausgabeteil 107 der Funktion zum Erzeugen des geschätzten Spannungsbefehls, die im Folgenden beschrieben werden) zum Erzeugen und Ausgeben einer Funktion zum Erzeugen eines Korrekturwerts in der Vorwärtsregelung auf der Grundlage des durch die Lernmittel aufgebauten Lernmodells und einen Vorwärtsregelungskompensator (z. B. den Vorwärtsregelungskompensator 11, den Vorwärtsregelungskompensator 21 und den Vorwärtsregelungskompensator 31, die im Folgenden beschrieben werden) zum Ausführen einer Vorwärtsregelung auf der Grundlage der durch die Funktionsausgabemittel ausgegebenen Funktion.
  • (8) Ein Verfahren für maschinelles Lernen gemäß der Erfindung, das durch einen Computer (z. B. durch die im Folgenden beschriebene Vorrichtung 100 für maschinelles Lernen) ausgeführt wird, enthält die Schritte der Kennsatzerfassung eines durch eine Servoregeleinrichtung an eine Regelzielvorrichtung ausgegebenen Befehls, um die Regelzielvorrichtung anzusteuern und zu regeln, als einen Kennsatz, der Eingangsdatenerfassung einer Ausgabe der durch den Befehl angesteuerten Regelzielvorrichtung als Eingangsdaten und des Lernmodellaufbaus eines Lernmodells in Bezug auf die Vorwärtsregelung zum Korrigieren des Befehls durch Ausführen von überwachtem Lernen unter Verwendung eines Satzes des Kennsatzes und der Eingangsdaten, der als Lehrerdaten dient.
  • Die vorliegende Erfindung ermöglicht die leichte Ausführung einer Einstellung in Bezug auf die Vorwärtsregelung und die Verbesserung der Befehlsfolgeleistung.
  • Figurenliste
    • 1 ist ein Funktionsblockschaltplan, der eine Gesamtgrundkonfiguration einer für jeweilige Ausführungsformen der vorliegenden Erfindung gemeinsamen Ausführungsform darstellt.
    • 2A ist ein Funktionsblockschaltplan, der eine Konfiguration zur Zeit des maschinellen Lernens gemäß einer ersten Ausführungsform der vorliegenden Erfindung darstellt.
    • 2B ist ein Funktionsblockschaltplan, der eine Konfiguration zur Zeit der Vorwärtsregelung gemäß der ersten Ausführungsform der vorliegenden Erfindung darstellt.
    • 3 ist ein Funktionsblockschaltplan, der eine Konfiguration einer Vorrichtung für maschinelles Lernen gemäß der ersten Ausführungsform der vorliegenden Erfindung darstellt.
    • 4 ist ein Ablaufplan, der Gesamtgrundoperationen einer für jeweilige Ausführungsformen der vorliegenden Erfindung gemeinsamen Ausführungsform darstellt.
    • 5A ist ein Funktionsblockschaltplan, der eine Konfiguration zur Zeit des maschinellen Lernens gemäß einer zweiten Ausführungsform der vorliegenden Erfindung darstellt.
    • 5B ist ein Funktionsblockschaltplan, der eine Konfiguration zur Zeit der Vorwärtsregelung gemäß der zweiten Ausführungsform der vorliegenden Erfindung darstellt.
    • 6 ist ein Funktionsblockschaltplan, der eine Konfiguration einer Vorrichtung für maschinelles Lernen gemäß der zweiten Ausführungsform der vorliegenden Erfindung darstellt.
    • 7A ist ein Funktionsblockschaltplan, der eine Konfiguration zur Zeit des maschinellen Lernens gemäß einer dritten Ausführungsform der vorliegenden Erfindung darstellt.
    • 7B ist ein Funktionsblockschaltplan, der eine Konfiguration zur Zeit der Vorwärtsregelung gemäß der dritten Ausführungsform der vorliegenden Erfindung darstellt.
    • 8 ist ein Funktionsblockschaltplan, der eine Konfiguration einer Vorrichtung für maschinelles Lernen gemäß der dritten Ausführungsform der vorliegenden Erfindung darstellt.
  • AUSFÜHRLICHE BESCHREIBUNG DER ERFINDUNG
  • Im Folgenden werden Ausführungsformen der vorliegenden Erfindung anhand der Zeichnungen ausführlich beschrieben. Es wird angemerkt, dass in den folgenden Beschreibungen von drei Ausführungsformen die angenommenen Gesamtkonfigurationen davon zueinander gemeinsam sind und dass zunächst die für die jeweiligen Ausführungsformen gemeinsame Gesamtkonfiguration beschrieben wird.
  • Die für die jeweiligen Ausführungsformen gemeinsame Gesamtkonfiguration
  • 1 ist ein Funktionsblockschaltplan, der eine für die jeweiligen Ausführungsformen gemeinsame Gesamtkonfiguration darstellt. Wie in 1 gezeigt ist, ist ein Servoregelsystem 1, das als jede Ausführungsform dient, so konfiguriert, dass es eine Vorrichtung 100 für maschinelles Lernen, eine Servoregeleinrichtung 200 und eine Regelzielvorrichtung 300 enthält.
  • Die Vorrichtung 100 für maschinelles Lernen ist eine Vorrichtung zum Ausführen von maschinellem Lernen, um durch die Servoregeleinrichtung 200 eine Einstellung in Bezug auf die Vorwärtsregelung auszuführen. Die Vorrichtung 100 für maschinelles Lernen kann durch einen Personal Computer, durch eine Servervorrichtung, durch eine CNC (computergestützte numerische Steuerung) oder dergleichen verwirklicht werden.
  • Die Servoregeleinrichtung 200 ist eine Vorrichtung zum Ausführen einer Vorwärtsregelung unter Verwendung eines Lernmodells, das durch die Vorrichtung 100 für maschinelles Lernen aufgebaut wird, und zum Regeln des Ansteuerns der Regelzielvorrichtung 300 durch Ausführen der Rückkopplungsregelung.
  • Die Regelzielvorrichtung 300, die eine gemäß der Regelung durch die Servoregeleinrichtung 200 angesteuerte Vorrichtung ist, kann z. B. durch einen Servomotor oder durch eine Werkzeugmaschine, durch einen Roboter, durch eine industrielle Maschine oder dergleichen, der bzw. die einen Servomotor enthält, verwirklicht werden. Die oben beschriebene Servoregeleinrichtung 200 kann als eine einzelne Vorrichtung verwirklicht werden oder kann als ein Teil wie etwa einer Werkzeugmaschine, eines Roboters, einer industriellen Maschine oder dergleichen verwirklicht werden.
  • Die Vorrichtung 100 für maschinelles Lernen und die Servoregeleinrichtung 200 sind kommunikationstechnisch miteinander gekoppelt. Die Servoregeleinrichtung 200 und die Regelzielvorrichtung 300 sind ebenfalls kommunikationstechnisch miteinander gekoppelt. Eine solche Kommunikation kann z. B. durch ein in einer Fabrik aufgebautes LAN (lokales Netz) verwirklicht werden und kann eine verdrahtete Kommunikation oder eine drahtlose Kommunikation oder die Kombination davon sein. Die Kommunikationsnorm und dergleichen sind nicht besonders beschränkt. Diese Kommunikation kann über ein Netz (nicht gezeigt) wie etwa das Internet oder ein öffentliches Telephonnetz ausgeführt werden. In diesem Fall können jeweilige Vorrichtungen zueinander benachbart (z. B. in einer Fabrik) eingerichtet sein oder können sie getrennt an fernen Orten eingerichtet sein. Obgleich jede Figur für jeden Typ dieser Vorrichtungen eine einzelne Vorrichtung darstellt, gibt es keine Beschränkung der Anzahl jedes Typs dieser Vorrichtungen. Außerdem kann die Verbindung davon eine Eine-zu-viele-Verbindung oder eine Viele-zu-viele-Verbindung und nicht nur eine Eine-zu-eine-Verbindung sein.
  • Erste Ausführungsform
  • Nachfolgend ist anhand von Fig. 2A und 2B die Konfiguration gemäß der ersten Ausführungsform beschrieben. In jeweiligen Ausführungsformen einschließlich der vorliegenden Ausführungsform sind die Abschnitte, die „zur Zeit des maschinellen Lernens“ und „zur Zeit der Vorwärtsregelung“ betrieben werden, verschieden. 2A ist ein Prinzipschaltbild, das „zur Zeit des maschinellen Lernens“ entspricht, während 2B ein Prinzipschaltbild ist, das „zur Zeit der Vorwärtsregelung“ entspricht.
  • Wie in Fig. 2A und 2B gezeigt ist, ist die vorliegende Ausführungsform so konfiguriert, dass sie eine Vorrichtung 100a für maschinelles Lernen, einen Vorwärtsregelungskompensator 11, ein Subtrahierglied 12, einen PI-Regelteil 13, ein Addierglied 14 und die Regelzielvorrichtung 300a enthält. Der Vorwärtsregelungskompensator 11, das Subtrahierglied 12, der PI-Regelteil 13 und das Addierglied 14 sind die Komponenten der Servoregeleinrichtung 200a. In der vorliegenden Ausführungsform wird zusätzlich zu der Integraloperation als die Rückkopplungsregelung eine PI-Regelung, die einen Proportionalbetrieb enthält, ausgeführt. Es wird angemerkt, dass der Betrieb selbst der Servoregeleinrichtung zum Ausführen der PI-Regelung dem Fachmann auf dem Gebiet gut bekannt ist und dass die diesbezügliche ausführliche Beschreibung somit weggelassen ist.
  • In jeweiligen Ausführungsformen, die die vorliegende Ausführungsform enthalten, wird die Vorwärtsregelung zur Zeit des maschinellen Lernens nicht ausgeführt. Somit sind der Vorwärtsregelungskompensator 11 zum Ausführen der Vorwärtsregelung und die mit dem Vorwärtsregelungskompensator 11 verbundenen Signalleitungen in 2A in dem Sinn, dass sie nicht funktional sind, durch Strichlinien dargestellt. Währenddessen wird das maschinelle Lernen zur Zeit der Vorwärtsregelung nicht ausgeführt. Somit sind in 2B die Signalleitungen, über die Signale für das maschinelle Lernen zu der Vorrichtung 100a für maschinelles Lernen übertragen werden, in dem Sinn, dass sie nicht funktional sind, durch Strichlinien dargestellt.
  • Nachfolgend wird anhand von 2A eine Beschreibung eines Signalflusses zur Zeit des maschinellen Lernens in der vorliegenden Ausführungsform gegeben. Zunächst wird von einer Host-Vorrichtung (z. B. von einer numerischen Steuervorrichtung) (nicht gezeigt) ein Befehl zum Regeln des Ansteuerns der Regelzielvorrichtung 300a in die Servoregeleinrichtung 200a eingegeben. Der eingegebene Befehl wird durch das Subtrahierglied 12 unter Verwendung der Rückkopplung einer Subtraktion ausgesetzt und die Abweichung zwischen dem Befehl als ein Zielwert und der Rückkopplung als ein Ausgabewert wird in den PI-Regelteil 13 eingegeben. Es wird angemerkt, dass die Beschreibung hinsichtlich dessen, dass der Befehl verzweigt wird und ebenfalls in den Vorwärtsregelungskompensator 11 eingegeben wird, weggelassen ist, da der Vorwärtsregelungskompensator 11 zur Zeit des maschinellen Lernens wie oben beschrieben nicht funktional ist.
  • Der PI-Regelteil 13 erzeugt unter Verwendung der als „K1/s+K2“, wobei K1 eine Integralverstärkung ist und K2 eine Proportionalverstärkung ist, ausgedrückten Übertragungsfunktion aus der eingegebenen Abweichung einen Regelbefehl und gibt den erzeugten Regelbefehl an die Regelzielvorrichtung 300a aus. Es wird angemerkt, dass der Regelbefehl nicht der Korrektur durch das Addierglied 14 ausgesetzt wird, da der Vorwärtsregelungskompensator 11, wie oben beschrieben ist, zur Zeit des maschinellen Lernens nicht funktional ist.
  • Die Regelbefehlsausgabe durch den PI-Regelteil 13 wird in die Regelzielvorrichtung 300a eingegeben. Daraufhin arbeitet die Regelzielvorrichtung 300a auf der Grundlage des eingegebenen Regelbefehls. Allerdings tritt wegen des Einflusses der Last zum Ansteuern der Regelzielvorrichtung 300a, einer Störung und dergleichen zwischen dem Befehl als ein Zielwert und einem Ausgabewert eine Abweichung auf. Somit wird die Ausgabe der auf der Grundlage des Regelbefehls angesteuerten Regelzielvorrichtung 300a als Rückkopplung an das Subtrahierglied 12 ausgegeben. Daraufhin wird die Rückkopplungsregelung wiederholt, so dass die Abweichung auf der Grundlage der Rückkopplung verringert wird. Bisher ist der Ablauf der Rückkopplungsregelung in der Servoregeleinrichtung 200a beschrieben worden.
  • Parallel zu der Rückkopplungsregelung wird der durch den PI-Regelteil 13 ausgegebene Regelbefehl verzweigt und ebenfalls in die Vorrichtung 100a für maschinelles Lernen eingegeben. Die Ausgabe der auf der Grundlage des Regelbefehls angesteuerten Regelzielvorrichtung 300a wird ebenfalls an die Vorrichtung 100a für maschinelles Lernen ausgegeben. Daraufhin führt die Vorrichtung 100a für maschinelles Lernen auf der Grundlage dieser zwei Eingaben das maschinelle Lernen aus. Um den Inhalt des maschinellen Lernens zu beschreiben, wird zunächst anhand von 3 eine Beschreibung der in der Vorrichtung 100a für maschinelles Lernen enthaltenen Funktionsblöcke gegeben.
  • Wie in 3 gezeigt ist, ist die Vorrichtung 100a für maschinelles Lernen so konfiguriert, dass sie einen Eingangsdaten-Erfassungsteil 101, einen Kennsatz-Erfassungsteil 102, einen Lernteil 103, einen Lernmodell-Speicherteil 104 und einen Ausgabeteil 105 der Funktion zum Erzeugen des geschätzten Regelbefehls enthält.
  • Der Eingangsdaten-Erfassungsteil 101 ist ein Teil zum Erfassen der Ausgabe der auf der Grundlage des Regelbefehls angesteuerten Regelzielvorrichtung 300a als Eingangsdaten (auch als Merkmalsbetrag bezeichnet) und zur Ausgabe der erfassten Eingangsdaten an den Lernteil 103.
  • Der Kennsatz-Erfassungsteil 102 ist ein Teil zum Erfassen des durch den PI-Regelteil 13 ausgegebenen Regelbefehls als einen Kennsatz und zum Ausgeben des erfassten Kennsatzes an den Lernteil 103.
  • Im Folgenden werden die Ausgabe als Eingangsdaten und der Regelbefehl als ein Kennsatz zu einem Satz gebildet und in den Lernteil 103 eingegeben. Der Satz, der Eingangsdaten und einen Kennsatz enthält, entspricht bei dem maschinellen Lernen Lehrerdaten.
  • Der Lernteil 103 baut durch Ausführen des maschinellen Lernens, überwachtes Lernen genannt, auf der Grundlage der wie oben beschrieben eingegebenen Lehrerdaten ein Lernmodell auf. Da das überwachte Lernen selbst dem Fachmann auf dem Gebiet gut bekannt ist, wird angemerkt, dass die ausführliche Beschreibung davon weggelassen ist und dass nur der Grundriss davon beschrieben ist.
  • In einem Beispiel wird das überwachte Lernen durch ein neuronales Netz ausgeführt, das in einer Kombination mit Perceptron konfiguriert ist. Genauer wird für das neuronale Netz der Satz von Eingangsdaten und eines in den Lehrerdaten enthaltenen Kennsatzes bereitgestellt und wird das Lernen wiederholt, während die Gewichtung für jedes Perceptron geändert wird, um die Ausgabe des neuronalen Netzes an den Kennsatz anzupassen. In einem Beispiel wird ein Gewichtungswert in der Weise eingestellt, dass durch Wiederholen der Verarbeitung des Ausführens der Vorwärtsfortpflanzung und daraufhin des Ausführens der Rückwärtsfortpflanzung (auch als ein Verfahren der Rückwärtsfortpflanzung von Fehlern bezeichnet) ein Fehler in der Ausgabe jedes Perceptrons verringert wird. Auf diese Weise wird durch Lernen von Charakteristiken der Lehrerdaten ein Lernmodell zum Schätzen eines Ergebnisses von der Eingabe rekursiv erfasst.
  • Das obige überwachte Lernen soll einen Fehler zwischen einem Kennsatz und Ausgangsdaten beseitigen, während wie oben beschrieben Gewichtungswerte geändert werden. In der vorliegenden Ausführungsform ist der Kennsatz der Regelbefehl, der der Regelzielvorrichtung 300a gegeben wird, während die Eingabe die Ausgabe der Regelzielvorrichtung 300a ist. Im Idealfall entspricht das Lernmodell, das aufgebaut wird, wenn der Lernteil 103 das Lernen wiederholt, einer inversen Funktion zur Anpassung des Eingangswerts des Regelbefehls, der an die Regelzielvorrichtung 300a gegeben wird, an den Ausgabewert der Regelzielvorrichtung 300a.
  • Es wird angemerkt, dass das neuronale Netz, das durch den Lernteil 103 zum Lernen verwendet werden soll, ein Dreischichttyp sein kann oder ein weiter geschichteter Typ sein kann. Das Lernen kann durch sogenanntes tiefes Lernen ausgeführt werden. Das durch den Lernteil 103 aufgebaute Lernmodell wird an einen Lernmodell-Speicherteil 104 ausgegeben.
  • Der Lernmodell-Speicherteil 104 ist ein Speicherteil zum Speichern des Lernmodells, das durch den Lernteil 103 aufgebaut und an den Lernmodell-Speicherteil 104 ausgegeben wird. Der Ausgabeteil 105 der Funktion zum Erzeugen des geschätzten Regelbefehls erfasst das Lernmodell von dem Lernmodell-Speicherteil 104 zur Zeit der Vorwärtsregelung. Der Ausgabeteil 105 der Funktion zum Erzeugen des geschätzten Regelbefehls erzeugt eine Funktion zum Erzeugen des geschätzten Regelbefehls, die eine Funktion zum Annähern der Ausgabe an den Kennsatz auf der Grundlage des erfassten Lernmodells ist, und gibt die erzeugte Funktion zum Erzeugen des geschätzten Regelbefehls an den Vorwärtsregelungskompensator 11 aus. Die Funktion zum Erzeugen des geschätzten Regelbefehls wird zur Zeit der im Folgenden beschriebenen Vorwärtsregelung durch den Vorwärtsregelungskompensator 11 verwendet.
  • Bisher sind die Funktionsblöcke der Vorrichtung 100a für maschinelles Lernen beschrieben worden. Um diese Funktionsblöcke zu verwirklichen, enthält die Vorrichtung 100a für maschinelles Lernen eine Arithmetikverarbeitungseinheit wie etwa eine CPU (Zentraleinheit). Ferner enthält die Vorrichtung 100a für maschinelles Lernen eine Zusatzspeichervorrichtung wie etwa eine HDD (ein Festplattenlaufwerk) zum Speichern verschiedener Regelprogramme und eine Hauptspeichervorrichtung wie etwa RAM (Schreib-Lese-Speicher) zum vorübergehenden Speichern von Daten, die erforderlich sind, wenn die Arithmetikverarbeitungsvorrichtung ein Programm ausführt.
  • Daraufhin liest die Arithmetikverarbeitungsvorrichtung in der Vorrichtung 100a für maschinelles Lernen von der Zusatzspeichervorrichtung eine Anwendung und ein BS und entwickelt in der Hauptspeichervorrichtung die gelesene Anwendung und das BS, um auf der Grundlage der gelesenen Anwendung und des BS eine Arithmetikverarbeitung auszuführen. Außerdem steuert die Arithmetikverarbeitungsvorrichtung auf der Grundlage des Arithmetikergebnisses verschiedene Typen von Hardware, die in jeder Vorrichtung vorgesehen sind. Dadurch werden die Funktionsblöcke der Vorrichtung 100a für maschinelles Lernen der vorliegenden Ausführungsform verwirklicht. Das heißt, die vorliegende Ausführungsform kann durch Zusammenwirken von Hardware und Software verwirklicht werden.
  • In einem spezifischen Beispiel kann die Vorrichtung 100a für maschinelles Lernen durch einen Personal Computer, durch eine Servervorrichtung, durch eine CNC (computergestützte numerische Steuerung) oder dergleichen verwirklicht werden. Die Vorrichtung 100a für maschinelles Lernen umfasst eine große Menge an Berechnung, die dem maschinellen Lernen zugeordnet ist. Somit werden in einem Beispiel für die dem maschinellen Lernen zugeordnete Arithmetikverarbeitung vorzugsweise eine GPU (Graphikverarbeitungseinheiten), die in einem Personal Computer angebracht sind, und eine GPGPU (General-Purpose Computing on Graphics Processing Units) genannte Technologie verwendet, wodurch ermöglicht wird, eine Hochgeschwindigkeitsverarbeitung auszuführen. Darüber hinaus kann unter Verwendung mehrerer Computer, die mit einer solchen GPU ausgestattet sind, ein Computerverbund aufgebaut sein, so dass die mehreren in dem Computerverbund enthaltenen Computer eine Parallelverarbeitung ausführen, um eine schnellere Verarbeitung auszuführen. Es wird angemerkt, dass eine Vorrichtung 100b für maschinelles Lernen in einer zweiten Ausführungsform und eine Vorrichtung 100c für maschinelles Lernen in einer dritten Ausführungsform, die im Folgenden beschrieben werden, ebenfalls auf dieselbe Weise wie die Vorrichtung 100a für maschinelles Lernen in der vorliegenden Ausführungsform verwirklicht werden können.
  • Nachfolgend wird anhand von 2B eine Beschreibung eines Signalflusses zur Zeit der Vorwärtsregelung gegeben, die ausgeführt wird, nachdem das wie oben beschriebene maschinelle Lernen ausgeführt worden ist. Zunächst wird in derselben Weise wie zur Zeit des maschinellen Lernens von einer Host-Vorrichtung (z. B. numerischen Steuervorrichtung) (nicht gezeigt) an die Servoregeleinrichtung 200a ein Befehl zum Regeln des Ansteuerns der Regelzielvorrichtung 300a eingegeben. Der eingegebene Befehl wird unter Verwendung der Rückkopplung durch das Subtrahierglied 12 einer Subtraktion ausgesetzt und die Abweichung zwischen dem Befehl als ein Zielwert und der Rückkopplung als ein Ausgabewert wird in den PI-Regelteil 13 eingegeben. Da der Vorwärtsregelungskompensator 11 zur Zeit der Vorwärtsregelung funktional ist, wird der eingegebene Befehl verzweigt und in den Vorwärtsregelungskompensator 11 eingegeben.
  • Der Vorwärtsregelungskompensator 11 erzeugt auf der Grundlage der oben beschriebenen Funktion zum Erzeugen des geschätzten Regelbefehls aus dem Eingangsbefehl einen Korrekturwert. Daraufhin wird der erzeugte Korrekturwert an das Addierglied 14 ausgegeben.
  • Wie oben beschrieben wurde, ist die Funktion zum Erzeugen des geschätzten Regelbefehls eine inverse Funktion zum Angleichen des Eingangswerts des Regelbefehls, der an die Regelzielvorrichtung 300a gegeben wird, an den Ausgabewert der Regelzielvorrichtung 300a über das maschinelle Lernen. Somit wird im Idealfall ermöglicht, dass der Befehl und die Ausgabe unter Verwendung des Korrekturwerts auf denselben Wert korrigiert werden.
  • Selbst wenn die Korrektur unter Verwendung des Korrekturwerts ausgeführt wird, können der Befehl und die Ausgabe allerdings in einigen Fällen nicht angeglichen werden, da der Einfluss einer Störung oder dergleichen in der Regelzielvorrichtung 300a auftritt. Somit nimmt die vorliegende Ausführungsform außer der Korrektur durch den Vorwärtsregelungskompensator 11 die Rückkopplungsregelung an, die in Bezug auf 2A beschrieben worden ist, um den Einfluss der Störung oder dergleichen zu unterbinden.
  • In der vorliegenden Ausführungsform ermöglicht ein solches Verfahren, den Wert des Regelbefehls geeignet zu machen, was eine Befehlsfolgeleistung zu verbessern ermöglicht. In diesem Fall ist ein Nutzer leicht in der Lage, eine Einstellung in Bezug auf die Vorwärtsregelung ausführen, ohne dass er ein lineares Modell oder dergleichen, das als ein Referenzmodell dient, zu erzeugen braucht. In der oben beschriebenen Ausführungsform ist angenommen, dass die PI-Regelung ausgeführt wird. Alternativ kann z. B. eine PID-Regelung ausgeführt werden, in der ferner ein Differentialelement kombiniert ist.
  • Nachfolgend werden anhand des Ablaufplans aus 4 die Operationen der Vorrichtung 100a für maschinelles Lernen der vorliegenden Ausführungsform beschrieben. In Schritt S11 bestimmt die Vorrichtung 100a für maschinelles Lernen, ob die Betriebsart der Vorrichtung 100a für maschinelles Lernen aktuell auf eine „Betriebsart für maschinelles Lernen“ oder auf eine „Vorwärtsregelungs-Betriebsart“ (die in dem Ablaufplan in der Weise dargestellt ist, dass sie nicht auf die „Betriebsart für maschinelles Lernen“ eingestellt ist) eingestellt ist.
  • Falls die Betriebsart der Vorrichtung 100a für maschinelles Lernen aktuell auf die „Betriebsart für maschinelles Lernen“ eingestellt ist, wird in der Bestimmung des Schritts S11 Ja erhalten und geht die Verarbeitung zu Schritt S12 über. Dagegen wird in der Bestimmung des Schritts S11 Nein erhalten und geht die Verarbeitung zu Schritt S16 über, falls die Betriebsart der Vorrichtung 100a für maschinelles Lernen aktuell nicht auf die „Betriebsart für maschinelles Lernen“ eingestellt ist. In Schritt S12 und Schritt S13 erfasst der Eingangsdaten-Erfassungsteil 101 bzw. der Kennsatz-Erfassungsteil 102 der Vorrichtung 100a für maschinelles Lernen Eingangsdaten und einen Kennsatz. Der spezifische Inhalt dieser Daten ist wie oben beschrieben.
  • In Schritt S14 führt der Lernteil 103 der Vorrichtung 100a für maschinelles Lernen unter Verwendung der Eingangslehrerdaten das maschinelle Lernen aus. Der spezifische Inhalt des maschinellen Lernens unter Verwendung der Lehrerdaten ist ebenfalls wie oben beschrieben.
  • In Schritt S15 aktualisiert der Lernteil 103 das Lernmodell durch Ausgeben des aufgebauten Lernmodells an den Lernmodell-Speicherteil 104. Danach kehrt die Verarbeitung zu Schritt S11 zurück.
  • Dadurch, dass die Verarbeitung von Schritt S11 bis Schritt S15 auf diese Weise wiederholt wird, wird das Lernen fortgesetzt. Falls während dieser Wiederholung die Betriebsart gewechselt wird und auf die Vorwärtsregelungs-Betriebsart eingestellt wird, wird bei der Bestimmung des Schritts S11 Nein erhalten und geht die Verarbeitung zu Schritt S16. Die Einstellung kann z. B. durch einen Nutzer gewechselt werden oder kann alternativ gewechselt werden, falls der Fehlerwert zwischen der Ausgabe des Lernmodells und einem Kennsatz gleich oder kleiner einem vorgegebenen Wert ist, oder kann eingestellt werden, nachdem das maschinelle Lernen in einer vorgegebenen Anzahl wiederholt worden ist.
  • In Schritt S16 erfasst der Ausgabeteil 105 der Funktion zum Erzeugen des geschätzten Regelbefehls das in dem Lernmodell-Speicherteil 104 gespeicherte Lernmodell.
  • In Schritt S17 erzeugt der Ausgabeteil 105 der Funktion zum Erzeugen des geschätzten Regelbefehls eine Funktion zum Erzeugen des geschätzten Regelbefehls, die eine Funktion zum Annähern der Ausgabe an einen Kennsatz auf der Grundlage des erfassten Lernmodells ist, und gibt er die erzeugte Funktion zum Erzeugen des geschätzten Regelbefehls an den Vorwärtsregelungskompensator 11 aus. Die Operationen der Servoregeleinrichtung 200a einschließlich des Vorwärtsregelungskompensators 11 zur Zeit der Vorwärtsregelung sind wie oben beschrieben. Bisher ist die erste Ausführungsform beschrieben worden. Nachfolgend wird eine zweite Ausführungsform beschrieben, die eine Änderung der oben beschriebenen ersten Ausführungsform ist.
  • Zweite Ausführungsform
  • Nachfolgend wird anhand von Fig. 5A und 5B die Konfiguration gemäß der zweiten Ausführungsform beschrieben. 5A ist ein Prinzipschaltbild, das „zur Zeit des maschinellen Lernens“ entspricht, während 5B ein Prinzipschaltbild ist, das „zur Zeit der Vorwärtsregelung“ entspricht.
  • Es wird angemerkt, dass die Grundfunktionen und die Konfiguration der zweiten Ausführungsform mit jenen der oben beschriebenen ersten Ausführungsform gemeinsam sind, so dass die doppelten Beschreibungen davon im Folgenden weggelassen sind und verschiedene Gegenstände zwischen der ersten Ausführungsform und der zweiten Ausführungsform ausführlich beschrieben sind.
  • Wie in Fig. 5A und 5B gezeigt ist, ist die vorliegende Ausführungsform so konfiguriert, dass sie eine Vorrichtung 100b für maschinelles Lernen, einen Vorwärtsregelungskompensator 21, ein Subtrahierglied 22, einen Positionsregelteil 23, ein Addierglied 24, ein Subtrahierglied 25, ein Geschwindigkeitsregelteil 26, ein Addierglied 27, eine Regelzielvorrichtung 300b und einen Integrator 29 enthält.
  • Der Vorwärtsregelungskompensator 21, das Subtrahierglied 22, der Positionsregelteil 23, das Addierglied 24, das Subtrahierglied 25, der Geschwindigkeitsregelteil 26, das Addierglied 27 und der Integrator 29 sind die Komponenten einer Servoregeleinrichtung 200b.
  • In der vorliegenden Ausführungsform werden als die Rückkopplungsregelung die Geschwindigkeitsrückkopplung und die durch Integration der Geschwindigkeitsrückkopplung erzeugte Positionsrückkopplung ausgeführt. Es wird angemerkt, dass die Rückkopplungsregelung selbst, die die Geschwindigkeitsrückkopplung und die Positionsrückkopplung enthält, wie im Fall der Servoregeleinrichtung zum Ausführen der PI-Regelung in der ersten Ausführungsform dem Fachmann auf dem Gebiet gut bekannt sind und dass die diesbezügliche ausführliche Beschreibung somit weggelassen ist.
  • Wie in der ersten Ausführungsform wird in der zweiten Ausführungsform die Vorwärtsregelung zur Zeit des maschinellen Lernens ebenfalls nicht ausgeführt. Somit sind in 5A der Vorwärtsregelungskompensator 21 zum Ausführen der Vorwärtsregelung und die Signalleitungen, die mit dem Vorwärtsregelungskompensator 21 verbunden sind, in dem Sinn, dass sie nicht funktional sind, durch Strichlinien dargestellt. Währenddessen wird das maschinelle Lernen zur Zeit der Vorwärtsregelung nicht ausgeführt. Somit sind in 5B die Signalleitungen, über die Signale für das maschinelle Lernen an die Vorrichtung 100b für maschinelles Lernen übertragen werden, in dem Sinn, dass sie nicht funktional sind, durch Strichlinien dargestellt.
  • Nachfolgend wird anhand von 5A eine Beschreibung eines Signalflusses zur Zeit des maschinellen Lernens in der vorliegenden Ausführungsform gegeben. Zunächst wird von der Host-Vorrichtung (z. B. von der numerischen Steuervorrichtung) (nicht gezeigt) ein Positionsbefehl zum Regeln des Ansteuerns der Regelzielvorrichtung 300b in die Servoregeleinrichtung 200b eingegeben. Der eingegebene Positionsbefehl wird unter Verwendung der Positionsrückkopplung durch das Subtrahierglied 22 einer Subtraktion ausgesetzt und die Positionsabweichung, die die Abweichung ist, die zwischen dem Positionsbefehl und der Positionsrückkopplung auftritt, wird in den Positionsregelteil 23 eingegeben.
  • Der Positionsregelteil 23 verarbeitet die Positionsabweichung, um einen Geschwindigkeitsbefehl zu erzeugen, und gibt den erzeugten Geschwindigkeitsbefehl an den Geschwindigkeitsregelteil 26 aus. Da der Rückkopplungskompensator 21 wie oben beschrieben zur Zeit des maschinellen Lernens nicht funktional ist, wird der Geschwindigkeitsbefehl nicht der Korrektur durch das Addierglied 24 ausgesetzt.
  • Der durch den Positionsregelteil 23 ausgegebene Geschwindigkeitsbefehl wird unter Verwendung der Geschwindigkeitsrückkopplung durch das Subtrahierglied 25 einer Subtraktion ausgesetzt und die Geschwindigkeitsabweichung, die die Abweichung ist, die zwischen dem Geschwindigkeitsbefehl und der Geschwindigkeitsrückkopplung auftritt, wird in den Geschwindigkeitsregelteil 26 eingegeben.
  • Der Geschwindigkeitsregelteil 26 erzeugt durch Geschwindigkeitsschleifenverarbeitung wie etwa Proportionalberechnung und Integralberechnung auf der Grundlage der Geschwindigkeitsabweichung einen Strombefehl und gibt den erzeugten Strombefehl an die Regelzielvorrichtung 300b aus. Da der Vorwärtsregelungskompensator 21 wie oben beschrieben zur Zeit des maschinellen Lernens nicht funktional ist, wird angemerkt, dass der Strombefehl nicht der Korrektur durch das Addierglied 27 ausgesetzt wird.
  • Der durch den Geschwindigkeitsregelteil 26 ausgegebene Strombefehl wird in die Regelzielvorrichtung 300b eingegeben. Daraufhin arbeitet die Regelzielvorrichtung 300b auf der Grundlage des eingegebenen Strombefehls. An einem Ansteuerteil (Servomotor) der Regelzielvorrichtung 300b ist ein Geschwindigkeitsdetektor angebracht. Die durch den Geschwindigkeitsdetektor detektierte Geschwindigkeitsrückkopplung wird verzweigt und an das Subtrahierglied 25 bzw. an den Integrator 29 ausgegeben. Das Subtrahierglied 25 führt unter Verwendung der Geschwindigkeitsrückkopplung wie oben beschrieben eine Subtraktion aus.
  • Der Integrator 29 integriert die Geschwindigkeitsrückkopplung, um eine Positionsrückkopplung zu erzeugen, und gibt die erzeugte Positionsrückkopplung an das Subtrahierglied 22 aus. Das Subtrahierglied 22 führt unter Verwendung der Positionsrückkopplung wie oben beschrieben eine Subtraktion aus.
  • Wie oben beschrieben wurde, tritt wegen des Einflusses der Last zum Ansteuern der Regelzielvorrichtung 300b, einer Störung und dergleichen zwischen dem Positionsbefehl als ein Zielwert und der Positionsrückkopplung als ein Ausgabewert eine Positionsabweichung auf. Wie oben beschrieben wurde, wird somit die Rückkopplungsregelung wiederholt, damit die Positionsabweichung verringert wird. Bisher ist der Ablauf der Rückkopplungsregelung in der Servoregeleinrichtung 200b beschrieben worden.
  • Parallel zu der Rückkopplungsregelung wird der durch den Geschwindigkeitsregelteil 26 ausgegebene Strombefehl verzweigt und ebenfalls in die Vorrichtung 100b für maschinelles Lernen eingegeben. Die Positionsrückkopplung, die durch den Integrator 29 durch Integration der Geschwindigkeitsrückkopplung, die durch die auf der Grundlage des Regelbefehls angesteuerte Regelzielvorrichtung 300b ausgegeben wird, erzeugt wird, wird ebenfalls an die Vorrichtung 100b für maschinelles Lernen ausgegeben. Obgleich die Signalleitungen in der Figur nicht gezeigt sind, wird die Geschwindigkeitsbefehlsausgabe durch den Positionsregelbefehl 23 verzweigt und ebenfalls in die Vorrichtung 100b für maschinelles Lernen eingegeben.
  • Die Vorrichtung 100b für maschinelles Lernen führt das maschinelle Lernen auf der Grundlage dieser Eingaben aus. Es wird angemerkt, dass die Funktionen selbst in den jeweiligen Funktionsblöcken der Vorrichtung 100b für maschinelles Lernen mit jenen der oben beschriebenen Vorrichtung 100a für maschinelles Lernen gemeinsam sind und dass die doppelten Beschreibungen somit weggelassen sind.
  • In der vorliegenden Ausführungsform erfasst der Eingangsdaten-Erfassungsteil 101 die durch den Integrator 29 durch Integration erzeugte Positionsrückkopplung als Eingangsdaten (auch als ein Merkmalsbetrag bezeichnet). Der Kennsatz-Erfassungsteil 102 erfasst die Strombefehlsausgabe durch den Geschwindigkeitsregelteil 26 und die Geschwindigkeitsbefehlsausgabe durch den Positionsregelteil 23 als Kennsätze. Das heißt, in der vorliegenden Ausführungsform wird ein Mehr-Kennsatz-Lernen unter Verwendung mehrerer Kennsätze ausgeführt.
  • Im Folgenden werden die Positionsrückkopplung als Eingangsdaten und der Satz des Strombefehls und des Geschwindigkeitsbefehls als Kennsätze zu einem Satz gebildet und in den Lernteil 103 eingegeben. Der Satz der Eingangsdaten und der Kennsätze entspricht den Lehrerdaten beim maschinellen Lernen.
  • Der Lernteil 103 baut durch Ausführen des maschinellen Lernens, überwachtes Lernen genannt, auf der Grundlage der Lehrerdateneingabe wie oben beschrieben ein Lernmodell auf. Der Inhalt des überwachten Lernens ist derselbe wie er in der ersten Ausführungsform beschrieben worden ist. Es wird angemerkt, dass in der zweiten Ausführungsform ein Ausgabeteil 106 der Funktion zum Erzeugen des geschätzten Strombefehls, der anstelle des Ausgabeteils 105 der Funktion zum Erzeugen des geschätzten Regelbefehls verwendet ist, auf der Grundlage des Lernmodells eine Funktion zum Erzeugen des geschätzten Strombefehls ausgibt. Der Rückkopplungskompensator 21 in der zweiten Ausführungsform gibt auf der Grundlage der Funktion zum Erzeugen des geschätzten Strombefehls zwei Korrekturwerte, die im Folgenden beschrieben werden, als erste Korrektur und zweite Korrektur aus.
  • Nachfolgend wird anhand von 5B eine Beschreibung eines Signalflusses zur Zeit der Vorwärtsregelung, die ausgeführt wird, nachdem das wie oben beschriebene maschinelle Lernen ausgeführt worden ist, gegeben. Zunächst wird in derselben Weise wie zur Zeit des maschinellen Lernens von einer Host-Vorrichtung (z. B. von einer numerischen Steuervorrichtung) (nicht gezeigt) ein Positionsbefehl zum Regeln des Ansteuerns der Regelzielvorrichtung 300b an die Servoregeleinrichtung 200b ausgegeben. Da der Vorwärtsregelungskompensator 21 zur Zeit der Vorwärtsregelung funktional ist, wird der Eingangspositionsbefehl verzweigt und in den Vorwärtsregelungskompensator 21 eingegeben. Daraufhin erzeugt der Vorwärtsregelungskompensator 21 aus dem eingegebenen Befehl auf der Grundlage der oben beschriebenen Funktion zum Erzeugen des geschätzten Strombefehls zwei Korrekturwerte. Die erzeugten Korrekturwerte werden an das Addierglied 24 bzw. an das Addierglied 27 ausgegeben. Der verzweigte Positionsbefehl wird durch das Subtrahierglied 22 der Subtraktion ausgesetzt und als Positionsabweichung in den Positionsregelteil 23 eingegeben.
  • Der Positionsregelteil 23 verarbeitet die Positionsabweichung, um einen Geschwindigkeitsbefehl zu erzeugen, und gibt den erzeugten Geschwindigkeitsbefehl an den Geschwindigkeitsregelteil 26 aus. Der durch den Positionsregelteil 23 ausgegebene Geschwindigkeitsbefehl wird durch das Addierglied 24 unter Verwendung der ersten Korrektur (eines Korrekturwerts, der dem überwachten Lernen mit dem Geschwindigkeitsbefehl als ein Kennsatz entspricht), die durch den Vorwärtsregelungskompensator 21 ausgegeben wird, der Korrektur ausgesetzt und ferner unter Verwendung der Geschwindigkeitsrückkopplung durch das Subtrahierglied 25 einer Subtraktion ausgesetzt und daraufhin in den Geschwindigkeitsregelteil 26 eingegeben.
  • Der Geschwindigkeitsregelteil 26 erzeugt auf der Grundlage der Eingabe durch Geschwindigkeitsschleifenverarbeitung wie etwa Proportionalberechnung und Integralberechnung einen Strombefehl und gibt den erzeugten Strombefehl an die Regelzielvorrichtung 300b aus. Der durch den Geschwindigkeitsregelteil 26 ausgegebene Strombefehl wird unter Verwendung der durch den Vorwärtsregelungskompensator 21 ausgegebenen zweiten Korrektur (eines Korrekturwerts, der dem überwachten Lernen mit dem Strombefehl als ein Kennsatz entspricht) einer Korrektur ausgesetzt und an die Regelzielvorrichtung 300b ausgegeben. Die Regelzielvorrichtung 300b wird auf der Grundlage des Regelbefehls angesteuert.
  • Dementsprechend nimmt die vorliegende Ausführungsform zum Unterbinden des Einflusses einer Störung oder dergleichen außer den zwei Typen von Korrekturen durch den Vorwärtsregelungskompensator 21 die Positionsrückkopplung und die Geschwindigkeitsrückkopplung an, die anhand von 5A beschrieben worden sind.
  • Außerdem ermöglicht ein solches Verfahren in der zweiten Ausführungsform wie in der oben beschriebenen ersten Ausführungsform, dass die jeweiligen Befehle geeignete Werte erhalten, wodurch eine Verbesserung der Befehlsfolgeleistung ermöglicht wird. In diesem Fall kann ein Nutzer leicht eine Einstellung in Bezug auf die Vorwärtsregelung ausführen, ohne ein lineares Modell oder dergleichen, das als ein Referenzmodell dient, erzeugen zu müssen.
  • Es wird angemerkt, dass die Operationen der Vorrichtung 100b für maschinelles Lernen in der zweiten Ausführungsform ähnlich jenen der anhand von 4 beschriebenen Vorrichtung 100a für maschinelles Lernen in der ersten Ausführungsform sind, so dass doppelte Beschreibungen davon weggelassen sind. Bisher ist die zweite Ausführungsform beschrieben worden. Nachfolgend wird eine Beschreibung einer dritten Ausführungsform gegeben, die eine Änderung der ersten Ausführungsform oder der zweiten Ausführungsform, die oben beschrieben worden sind, ist.
  • Dritte Ausführungsform
  • Nachfolgend wird anhand von 7A und 7B die Konfiguration gemäß der dritten Ausführungsform beschrieben. 7A ist ein Prinzipschaltbild, das „zur Zeit des maschinellen Lernens“ entspricht, während 7B ein Prinzipschaltbild ist, das „zur Zeit der Vorwärtsregelung“ entspricht.
  • Es wird angemerkt, dass die Grundfunktionen und die Konfiguration der dritten Ausführungsform mit jenen der ersten Ausführungsform und der zweiten Ausführungsform, die oben beschrieben worden sind, gemeinsam sind und dass somit doppelte Beschreibungen davon im Folgenden weggelassen sind und unterschiedliche Gegenstände von der ersten Ausführungsform und der zweiten Ausführungsform ausführlich beschrieben sind.
  • Wie in Fig. 7A und 7B gezeigt ist, ist die vorliegende Ausführungsform so konfiguriert, dass sie eine Vorrichtung 100c für maschinelles Lernen, einen Vorwärtsregelungskompensator 31, ein Subtrahierglied 32, einen Positionsregelteil 33, ein Addierglied 34, ein Subtrahierglied 35, einen Geschwindigkeitsregelteil 36, ein Addierglied 37, ein Subtrahierglied 38, einen Stromregelteil 39, ein Addierglied 40, einen Verstärker 41, eine Regelzielvorrichtung 300c und einen Integrator 43 enthält.
  • Der Vorwärtsregelungskompensator 31, das Subtrahierglied 32, der Positionsregelteil 33, das Addierglied 34, das Subtrahierglied 35, der Geschwindigkeitsregelteil 36, das Addierglied 37, das Subtrahierglied 38, der Stromregelteil 39, der Addierer 40, der Verstärker 41 und der Integrator 43 sind die Komponenten der Servoregeleinrichtung 200c. In der vorliegenden Ausführungsform werden eine Stromrückkopplung, eine Geschwindigkeitsrückkopplung und die Positionsrückkopplung, die durch Integration der Geschwindigkeitsrückkopplung erzeugt wird, als die Rückkopplungsregelung ausgeführt. Es wird angemerkt, dass die Rückkopplungsregelung selbst einschließlich der Stromrückkopplung, der Geschwindigkeitsrückkopplung und der Positionsrückkopplung wie im Fall der Servoregeleinrichtungen in der ersten Ausführungsform bzw. in der zweiten Ausführungsform dem Fachmann auf dem Gebiet bekannt sind, so dass die diesbezügliche ausführliche Beschreibung weggelassen ist.
  • Außerdem wird in der dritten Ausführungsform wie in der ersten Ausführungsform die Rückkopplungsregelung zur Zeit des maschinellen Lernens nicht ausgeführt. Somit sind in 7A der Vorwärtsregelungskompensator 31 zum Ausführen der Vorwärtsregelung und die mit dem Vorwärtsregelungskompensator 31 verbundenen Signalleitungen in dem Sinn, dass sie nicht funktional sind, durch Strichlinien dargestellt. Währenddessen wird das maschinelle Lernen zur Zeit der Vorwärtsregelung nicht ausgeführt. Somit sind in 7B die Signalleitungen, über die Signale für das maschinelle Lernen zu der Vorrichtung 100c für maschinelles Lernen übertragen werden, in dem Sinn, dass sie nicht funktional sind, durch Strichlinien dargestellt.
  • Nachfolgend wird anhand von 7A eine Beschreibung eines Signalflusses zur Zeit des maschinellen Lernens in der vorliegenden Ausführungsform gegeben. Zunächst wird ein Positionsbefehl zum Regeln des Ansteuerns der Regelzielvorrichtung 300c von einer Host-Vorrichtung (z. B. von einer numerischen Steuervorrichtung) (nicht gezeigt) in die Servoregeleinrichtung 200c eingegeben.
  • Der eingegebene Positionsbefehl wird unter Verwendung der Positionsrückkopplung durch das Subtrahierglied 32 der Subtraktion ausgesetzt und die Positionsabweichung, die die zwischen dem Positionsbefehl und der Positionsrückkopplung auftretende Abweichung ist, wird in den Positionsregelteil 33 eingegeben.
  • Der Positionsregelteil 33 verarbeitet die Positionsabweichung, um einen Geschwindigkeitsbefehl zu erzeugen, und gibt den erzeugten Geschwindigkeitsbefehl an den Geschwindigkeitsregelteil 36 aus. Da der Vorwärtsregelungskompensator 31 zur Zeit des maschinellen Lernens wie oben beschrieben nicht funktional ist, wird der Geschwindigkeitsbefehl nicht der Korrektur durch das Addierglied 34 ausgesetzt. Der durch den Positionsregelteil 33 ausgegebene Geschwindigkeitsbefehl wird unter Verwendung der Geschwindigkeitsrückkopplung durch das Subtrahierglied 35 einer Subtraktion ausgesetzt und die Geschwindigkeitsabweichung, die die zwischen dem Geschwindigkeitsbefehl und der Geschwindigkeitsrückkopplung auftretende Abweichung ist, wird in den Geschwindigkeitsregelteil 36 eingegeben.
  • Der Geschwindigkeitsregelteil 36 erzeugt durch Geschwindigkeitsschleifenverarbeitung wie etwa Proportionalberechnung und Integralberechnung auf der Grundlage der Geschwindigkeitsabweichung einen Strombefehl und gibt den erzeugten Strombefehl an den Stromregelteil 39 aus. Da der Vorwärtsregelungskompensator 31 wie oben beschrieben zur Zeit des maschinellen Lernens nicht funktional ist, wird angemerkt, dass der Strombefehl nicht der Korrektur durch das Addierglied 37 ausgesetzt wird. Der durch den Geschwindigkeitsregelteil 36 ausgegebene Strombefehl wird unter Verwendung der Stromrückkopplung durch das Subtrahierglied 38 der Subtraktion ausgesetzt und die Stromabweichung, die die zwischen dem Strombefehl und der Stromrückkopplung auftretende Abweichung ist, wird in den Stromregelteil 39 eingegeben.
  • Der Stromregelteil 39 verarbeitet die Stromabweichung, um einen Spannungsbefehl zu erzeugen, und gibt den erzeugten Spannungsbefehl an den Verstärker 41 aus. Da der Vorwärtsregelungskompensator 31 wie oben beschrieben zur Zeit des maschinellen Lernens nicht funktional ist, wird angemerkt, dass der Spannungsbefehl nicht der Korrektur durch das Addierglied 40 ausgesetzt wird.
  • Der Verstärker 41 erzeugt auf der Grundlage des Spannungsbefehls einen Ansteuerstrom zum Ansteuern der Regelzielvorrichtung 300c und gibt den erzeugten Ansteuerstrom an die Regelzielvorrichtung 300c aus. Der Ansteuerstrom wird in die Regelzielvorrichtung 300c eingegeben. Daraufhin arbeitet die Regelzielvorrichtung 300c auf der Grundlage des eingegebenen Ansteuerstroms.
  • An dem Ansteuerteil (Servomotor) der Regelzielvorrichtung 300c ist ein Geschwindigkeitsdetektor angebracht. Die durch den Geschwindigkeitsdetektor detektierte Geschwindigkeitsrückkopplung wird verzweigt und an das Subtrahierglied 35 bzw. an den Integrator 43 ausgegeben. Das Subtrahierglied 35 führt unter Verwendung der Geschwindigkeitsrückkopplung wie oben beschrieben eine Subtraktion aus.
  • Der Integrator 43 integriert die Geschwindigkeitsrückkopplung, um eine Positionsrückkopplung zu erzeugen, und gibt die erzeugte Positionsrückkopplung an das Subtrahierglied 32 aus. Das Subtrahierglied 32 führt unter Verwendung der Positionsrückkopplung wie oben beschrieben eine Subtraktion aus.
  • Wie oben beschrieben wurde, tritt wegen des Einflusses der Last zum Ansteuern der Regelzielvorrichtung 300c, wegen einer Störung und dergleichen zwischen dem Positionsbefehl als ein Zielwert und der Positionsrückkopplung als ein Ausgabewert eine Positionsabweichung auf. Somit wird die Rückkopplungsregelung wie oben beschrieben wiederholt, damit die Positionsabweichung verringert wird. Bisher ist der Ablauf der Rückkopplungsregelung in der Servoregeleinrichtung 200c beschrieben worden.
  • Parallel zu der Rückkopplungsregelung wird der durch den Stromregelteil 39 ausgegebene Spannungsbefehl verzweigt und ebenfalls in die Vorrichtung 100c für maschinelles Lernen eingegeben. Die durch den Integrator 43 durch Integration der Geschwindigkeitsrückkopplung, die durch die auf der Grundlage des Regelbefehls angesteuerte Regelzielvorrichtung 300c ausgegeben wird, erzeugte Positionsrückkopplung wird ebenfalls an die Vorrichtung 100c für maschinelles Lernen ausgegeben. Obgleich die Signalleitungen in den Figuren nicht gezeigt sind, wird außerdem der durch den Positionsregelteil 33 ausgegebene Geschwindigkeitsbefehl verzweigt und ebenfalls in die Vorrichtung 100c für maschinelles Lernen eingegeben. Obgleich die Signalleitungen in den Figuren nicht gezeigt sind, wird der durch den Geschwindigkeitsregelteil 36 ausgegebene Strombefehl ähnlich verzweigt und ebenfalls in die Vorrichtung 100c für maschinelles Lernen eingegeben.
  • Die Vorrichtung 100c für maschinelles Lernen führt auf der Grundlage dieser Eingaben das maschinelle Lernen aus. Es wird angemerkt, dass die Funktionen selbst in den jeweiligen Funktionsblöcken der Vorrichtung 100c für maschinelles Lernen mit jenen der oben beschriebenen Vorrichtung 100a für maschinelles Lernen gemeinsam sind, so dass die doppelten Beschreibungen davon weggelassen sind.
  • In der vorliegenden Ausführungsform erfasst der Eingangsdaten-Erfassungsteil 101 als Eingangsdaten (auch als ein Merkmalsbetrag bezeichnet) die durch den Integrator 43 durch Integration erzeugte Positionsrückkopplung. Der Kennsatz-Erfassungsteil 102 erfasst als Kennsätze die Spannungsbefehlsausgabe durch den Stromregelteil 39, die Geschwindigkeitsbefehlsausgabe durch den Positionsregelteil 33 und die Strombefehlsausgabe durch den Geschwindigkeitsregelteil 36. Das heißt, in der vorliegenden Ausführungsform wird unter Verwendung mehrerer Kennsätze ein Mehr-Kennsatz-Lernen ausgeführt.
  • Im Folgenden werden die Positionsrückkopplung als Eingangsdaten und der Spannungsbefehl, der Strombefehl und der Geschwindigkeitsbefehl als Kennsätze zu einem Satz gebildet und in den Lernteil 103 eingegeben. Der Satz der Eingangsdaten und der Kennsätze entspricht in dem maschinellen Lernen Lehrerdaten.
  • Der Lernteil 103 baut durch Ausführen des maschinellen Lernens, überwachtes Lernen genannt, auf der Grundlage der Lehrerdateneingabe wie oben beschrieben ein Lernmodell auf. Der Inhalt des überwachten Lernens ist derselbe, wie er in der ersten Ausführungsform beschrieben worden ist. Es wird angemerkt, dass in der dritten Ausführungsform ein Ausgabeteil 107 der Funktion zum Erzeugen des geschätzten Spannungsbefehls, der anstelle des Ausgabeteils 105 der Funktion zum Erzeugen des geschätzten Strombefehls verwendet ist, auf der Grundlage des Lernmodells eine Funktion zum Erzeugen des geschätzten Spannungsbefehls auf der Grundlage des Lernmodells ausgibt. Der Vorwärtsregelungskompensator 31 in der dritten Ausführungsform gibt auf der Grundlage der Funktion zum Erzeugen des geschätzten Spannungsbefehls drei Korrekturwerte als erste Korrektur, zweite Korrektur und dritte Korrektur, die im Folgenden beschrieben werden, aus.
  • Nachfolgend wird anhand von 7B eine Beschreibung eines Signalflusses zur Zeit der Vorwärtsregelung, die ausgeführt wird, nachdem das maschinelle Lernen wie oben beschrieben ausgeführt worden ist, gegeben. Zunächst wird in derselben Weise wie zur Zeit des maschinellen Lernens von einer Host-Vorrichtung (z. B. von einer numerischen Steuervorrichtung) (nicht gezeigt) ein Positionsbefehl zum Regeln des Ansteuerns der Regelzielvorrichtung 300c in die Servoregeleinrichtung 200c eingegeben. Da zur Zeit der Vorwärtsregelung der Vorwärtsregelungskompensator 31 funktional ist, wird der Eingangspositionsbefehl verzweigt und in den Vorwärtsregelungskompensator 31 eingegeben. Daraufhin erzeugt der Vorwärtsregelungskompensator 31 aus dem Eingangsbefehl auf der Grundlage der oben beschriebenen Funktion zum Erzeugen des geschätzten Spannungsbefehls drei Korrekturwerte. Die erzeugten Korrekturwerte werden an das Addierglied 34, an das Addierglied 37 bzw. an das Addierglied 40 ausgegeben. Der verzweigte Positionsbefehl wird durch das Subtrahierglied 32 unter Verwendung der Positionsrückkopplung der Subtraktion der Positionsrückkopplung ausgesetzt und als Positionsabweichung in den Positionsregelteil 33 eingegeben.
  • Der Positionsregelteil 33 verarbeitet die Positionsabweichung, um einen Geschwindigkeitsbefehl zu erzeugen, und gibt den erzeugten Geschwindigkeitsbefehl an den Geschwindigkeitsregelteil 36 aus. Der durch den Positionsregelteil 33 ausgegebene Geschwindigkeitsbefehl wird unter Verwendung der durch den Vorwärtsregelungskompensator 31 ausgegebenen ersten Korrektur (eines Korrekturwerts, der dem überwachten Lernen mit dem Geschwindigkeitsbefehl als ein Kennsatz entspricht) der Korrektur durch das Addierglied 34 ausgesetzt und ferner unter Verwendung der Geschwindigkeitsrückkopplung durch das Subtrahierglied 35 einer Subtraktion ausgesetzt und daraufhin in den Geschwindigkeitsregelteil 36 eingegeben.
  • Der Geschwindigkeitsregelteil 36 erzeugt auf der Grundlage der Eingabe durch Geschwindigkeitsschleifenverarbeitung wie etwa Proportionalberechnung und Integralberechnung einen Strombefehl und gibt den erzeugten Strombefehl an den Stromregelteil 39 aus. Der durch den Geschwindigkeitsregelteil 36 ausgegebene Strombefehl wird unter Verwendung der durch den Vorwärtsregelungskompensator 31 ausgegebenen zweiten Korrektur (eines Korrekturwerts, der dem überwachten Lernen mit dem Strombefehl als ein Kennsatz entspricht) einer Korrektur ausgesetzt und ferner unter Verwendung der Stromrückkopplung durch das Subtrahierglied 38 einer Subtraktion ausgesetzt und daraufhin in den Stromregelteil 39 eingegeben.
  • Der Stromregelteil 39 verarbeitet die Eingabe, um einen Spannungsbefehl zu erzeugen, und gibt den erzeugten Spannungsbefehl an den Verstärker 41 aus. Der durch den Stromregelteil 39 ausgegebene Spannungsbefehl wird unter Verwendung der durch den Vorwärtsregelungskompensator 31 ausgegebenen dritten Korrektur (eines Korrekturwerts, der dem überwachten Lernen mit dem Spannungsbefehl als ein Kennsatz entspricht) einer Korrektur ausgesetzt und in den Verstärker 41 eingegeben.
  • Der Verstärker 41 erzeugt auf der Grundlage des Spannungsbefehls einen Ansteuerstrom zum Ansteuern der Regelzielvorrichtung 300c und gibt den erzeugten Ansteuerstrom an die Regelzielvorrichtung 300c aus. Der Ansteuerstrom wird in die Regelzielvorrichtung 300c eingegeben. Daraufhin arbeitet die Regelzielvorrichtung 300c auf der Grundlage des eingegebenen Ansteuerstroms.
  • Dementsprechend nimmt die vorliegende Ausführungsform zum Unterbinden des Einflusses einer Störung und dergleichen außer den drei Korrekturtypen durch den Vorwärtsregelungskompensator 31 die Positionsrückkopplung, die Geschwindigkeitsrückkopplung und die Stromrückkopplung, die anhand von 7A beschrieben worden sind, an.
  • Außerdem ermöglicht ein solches Verfahren in der dritten Ausführungsform wie in der ersten Ausführungsform und in der zweiten Ausführungsform, die oben beschrieben worden sind, dass die jeweiligen Befehle geeignete Werte erhalten, wodurch eine Verbesserung der Befehlsfolgeleistung ermöglicht wird. In diesem Fall kann ein Nutzer leicht eine Einstellung in Bezug auf die Vorwärtsregelung ausführen, ohne ein lineares Modell oder dergleichen, das als ein Referenzmodell dient, erzeugen zu müssen. Es wird angemerkt, dass die Operationen der Vorrichtung 100c für maschinelles Lernen in der dritten Ausführungsform ähnlich jenen der Vorrichtung 100a für maschinelles Lernen in der ersten Ausführungsform, die anhand von 4 beschrieben ist, sind und dass somit die doppelten Beschreibungen davon weggelassen sind.
  • Bisher sind drei Ausführungsformen gemäß der vorliegenden Erfindung beschrieben worden. Jede der oben beschriebenen Ausführungsformen ist eine bevorzugte Ausführungsform der vorliegenden Erfindung, wobei der Schutzumfang der vorliegenden Erfindung aber nicht nur auf die oben beschriebenen jeweiligen Ausführungsformen beschränkt ist. Im Schutzumfang sind verschiedene Änderungen verfügbar, ohne von dem Hauptpunkt der vorliegenden Erfindung abzuweichen. Zum Beispiel sind die Formen, nachdem sie wie im Folgenden beschriebenen geändert worden sind, verfügbar.
  • Eine Änderung, in der eine Servoregeleinrichtung eine Vorrichtung für maschinelles Lernen enthält.
  • In jeder der oben beschriebenen Ausführungsformen ist die Vorrichtung 100 für maschinelles Lernen mit einer von der Servoregeleinrichtung 200 getrennten Vorrichtung konfiguriert. Alternativ können einige oder alle der Funktionen der Vorrichtung 100 für maschinelles Lernen durch die Servoregeleinrichtung 200 verwirklicht werden.
  • Freiheit der Systemkonfiguration
  • In jeder der oben beschriebenen Ausführungsformen sind die Vorrichtung 100 für maschinelles Lernen und die Servoregeleinrichtung 200 kommunikationstechnisch als eine eineindeutige Menge verbunden. Alternativ können als ein Beispiel eine Einheit einer Vorrichtung 100 für maschinelles Lernen und mehrere Servoregeleinrichtungen 200 direkt miteinander oder über ein Netz kommunikationstechnisch verbunden sein, so dass das maschinelle Lernen in jeder der Servoregeleinrichtungen 200 ausgeführt wird. In diesem Fall kann ein System der verteilten Verarbeitung angenommen werden, in dem jeweilige Funktionen der Vorrichtung 100 für maschinelles Lernen nach Bedarf auf mehrere Server verteilt sind. Alternativ können jeweilige Funktionen der Vorrichtung 100 für maschinelles Lernen unter Verwendung von Funktionen virtueller Server oder dergleichen in einer Cloud verwirklicht werden. Im Fall einer Konfiguration, die mehrere Regelzielvorrichtungen 300 enthält, die jeweils mehreren Servoregeleinrichtungen 200 mit demselben Typennamen oder mit derselben Spezifikation oder in derselben Serie entsprechen, können die Lernergebnisse durch jeweilige Servoregeleinrichtungen 200 gemeinsam genutzt werden. Eine solche Konfiguration ermöglicht den Aufbau eines optimaleren Modells.
  • Online-Lernen, Stapel-Lernen und Mini-Stapel-Lernen
  • Das oben beschriebene überwachte Lernen durch den Lernteil 103 kann durch Online-Lernen, durch Stapel-Lernen oder durch Mini-Stapel-Lernen ausgeführt werden. Das obige Online-Lernen ist ein Lernverfahren, in dem überwachtes Lernen jedes Mal, wenn die Regelzielvorrichtung 300 angesteuert wird und Lehrerdaten erzeugt werden, sofort ausgeführt wird. Das obige Stapel-Lernen ist ein Lernverfahren, in dem die Regelzielvorrichtung 300 angesteuert wird und, während Lehrerdaten wiederholt erzeugt werden, mehrere Lehrerdaten, die der Wiederholung entsprechen, gesammelt werden und daraufhin unter Verwendung aller gesammelten Lehrerdaten ein überwachtes Lernen ausgeführt wird. Das obige Mini-Stapel-Lernen ist ein Lernverfahren, das einem Zwischenlernverfahren zwischen dem Online-Lernen und dem Stapel-Lernen entspricht, in dem jedes Mal, wenn Lehrerdaten in einem bestimmten Umfang angesammelt worden sind, ein überwachtes Lernen ausgeführt wird.
  • Für die Ausgabe geplanter Befehl
  • In jeder der Ausführungsformen wird ein Befehl zum Regeln des Ansteuerns der Regelzielvorrichtung 300 von einer Host-Vorrichtung (z. B. von einer numerischen Steuervorrichtung) (nicht gezeigt) in die Servoregeleinrichtung 200 eingegeben. Der Befehl, der auf der Grundlage eines in die Host-Vorrichtung (z. B. in die numerische Steuervorrichtung) eingebetteten Verarbeitungsprogramms oder dergleichen erzeugt wird, wird normalerweise in Echtzeit ausgegeben. Alternativ ermöglicht der Vorgriff eines Verarbeitungsprogramms den Vorgriff auf den Inhalt des Befehls, der dafür geplant ist ausgegeben zu werden. Somit kann als Eingangsdaten in das überwachte Lernen ein Befehl, der dafür geplant ist, ausgegeben zu werden, d. h. ein künftiger Befehl, verwendet werden.
  • Auswahl des Kennsatzes und Korrektur
  • Sowohl in der zweiten Ausführungsform als auch in der dritten Ausführungsform, die oben beschrieben sind, wird das Mehr-Kennsatz-Lernen ausgeführt, da es als effizient angesehen wird. Alternativ kann in Abhängigkeit von den Umständen in jeder Ausführungsform das Lernen nur mit einem Kennsatz ausgeführt werden. In einem Beispiel kann in der zweiten Ausführungsform nur der Strombefehl als ein Kennsatz verwendet werden. Alternativ kann in einem Beispiel in der dritten Ausführungsform nur der Spannungsbefehl als ein Kennsatz verwendet werden. Wie in 5B gezeigt ist, wird das maschinelle Lernen in der zweiten Ausführungsform in der Weise ausgeführt, dass zwei Werte als ein Korrekturwert zu dem Geschwindigkeitsbefehl (erste Korrektur) und als ein Korrekturwert zu dem Strombefehl (zweite Korrektur) ausgegeben werden. Alternativ kann das maschinelle Lernen in der Weise ausgeführt werden, dass nur einer von ihnen ausgegeben wird. Ähnlich wird das maschinelle Lernen in der dritten Ausführungsform, wie in 7B gezeigt ist, in der Weise ausgeführt, dass drei Werte als ein Korrekturwert zu dem Geschwindigkeitsbefehl (erste Korrektur), als ein Korrekturwert zu dem Strombefehl (zweite Korrektur) und als ein Korrekturwert zu dem Spannungsbefehl (dritte Korrektur) ausgegeben werden. Alternativ kann das maschinelle Lernen in der Weise ausgeführt werden, dass nur zwei oder einer von ihnen ausgegeben werden bzw. wird.
  • Jede der oben beschriebenen Ausführungsformen kann durch Hardware, durch Software oder durch eine Kombination davon implementiert werden. Die Implementierung durch Software bedeutet hier die Implementierung durch einen Computer, der ein Programm liest und ausführt. Wenn sie mit Hardware konfiguriert sind, können ein Teil der Ausführungsformen oder alle z. B. mit einer integrierten Schaltung (IC) wie etwa mit einer LSI (hochintegrierten Schaltung), mit einer ASIC (anwendungsspezifischen integrierten Schaltung), mit einer logischen Anordnung und mit einer FPGA (frei programmierbaren logischen Anordnung) konfiguriert sein.
  • Falls ein Teil der Ausführungsformen oder alle mit einer Kombination aus Software und Hardware konfiguriert sind, ist ein Computer konfiguriert mit: einer Speichereinheit wie etwa einer Festplatte und einem ROM, die bzw. der ein Programm speichert, das alle in dem Ablaufplan dargestellten Operationen der Servoregeleinrichtung oder einen Teil davon beschreibt; DRAM, der für die Berechnung notwendige Daten speichert; einer CPU; und einem Bus, der jede Einheit verbindet; in dem Informationen, die für die Berechnung notwendig sind, in dem DRAM gespeichert werden und das Programm in der CPU betrieben wird, wodurch alle Funktionen oder ein Teil davon verwirklich werden können. Ein Programm wird unter Verwendung verschiedener Typen computerlesbarer Medien gespeichert und kann einem Computer zugeführt werden. Die computerlesbaren Medien erhalten verschiedene Typen konkreter Speichermedien. Beispiele der computerlesbaren Medien enthalten: ein magnetisches Aufzeichnungsmedium (z. B. eine Diskette, ein Magnetband, ein Festplattenlaufwerk), ein magnetooptisches Aufzeichnungsmedium (z. B. eine magnetooptische Platte), eine CD-ROM (einen Nur-Lese-Speicher), eine CD-R, eine CD-R/W, einen Halbleiterspeicher (z. B. einen Masken-ROM, einen PROM (programmierbaren ROM), einen EPROM (löschbaren PROM), einen Flash-ROM und einen RAM (Schreib-Lese-Speicher)).
  • Bezugszeichenliste
  • 1
    Servoregelsystem
    11, 21, 31
    Vorwärtsregelungskompensator
    12, 22, 25, 32, 35, 38
    Subtrahierglied
    13
    PI-Regelteil
    14, 24, 27, 34, 37, 40
    Addierglied
    23, 33
    Positionsregelteil
    26, 36
    Geschwindigkeitsregelteil
    29, 43
    Integrator
    39
    Stromregelteil
    41
    Verstärker
    100
    Vorrichtung für maschinelles Lernen
    101
    Eingangsdaten-Erfassungsteil
    102
    Kennsatz-Erfassungsteil
    103
    Lernteil
    104
    Lernmodell-Speicherteil
    105
    Ausgabeteil der Funktion zum Erzeugen des geschätzten
    Regelbefehls
    106
    Ausgabeteil der Funktion zum Erzeugen des geschätzten
    Strombefehls
    107
    Ausgabeteil der Funktion zum Erzeugen des geschätzten Spannungsbefehls
    200
    Servoregeleinrichtung
    300
    Regelzielvorrichtung

Claims (8)

  1. Vorrichtung (100) für maschinelles Lernen, die umfasst: ein Kennsatz-Erfassungsmittel (102) zum Erfassen eines durch eine Servoregeleinrichtung (200) an eine Regelzielvorrichtung (300) ausgegebenen Befehls als einen Kennsatz, um die Regelzielvorrichtung (300) anzusteuern und zu regeln; Eingangsdaten-Erfassungsmittel (101), um eine Ausgabe der auf der Grundlage des Befehls angesteuerten Regelzielvorrichtung (300) als Eingangsdaten zu erfassen; und Lernmittel (103) zum Aufbauen eines Lernmodells in Bezug auf die Vorwärtsregelung zum Korrigieren des Befehls durch Ausführen von überwachtem Lernen unter Verwendung eines Satzes des Kennsatzes und der Eingangsdaten, der als Lehrerdaten dient.
  2. Vorrichtung (100) für maschinelles Lernen nach Anspruch 1, wobei die Servoregeleinrichtung (200) eine Rückkopplungsregelung zum Korrigieren des Befehls ausführt, und wobei das Eingangsdaten-Erfassungsmittel (101) die Rückkopplung in der Rückkopplungsregelung als eine Ausgabe der Regelzielvorrichtung (300) erfasst.
  3. Vorrichtung (100) für maschinelles Lernen nach Anspruch 2, wobei der Befehl ein Positionsbefehl oder ein Geschwindigkeitsbefehl oder ein Strombefehl oder irgendeine Kombination des Positionsbefehls, des Geschwindigkeitsbefehls und des Strombefehls ist, und wobei die Ausgabe der Regelzielvorrichtung (300) die Positionsrückkopplung oder die Geschwindigkeitsrückkopplung oder die Stromrückkopplung oder irgendeine Kombination der Positionsrückkopplung, der Geschwindigkeitsrückkopplung und der Stromrückkopplung ist.
  4. Vorrichtung (100) für maschinelles Lernen nach einem der Ansprüche 1 bis 3, wobei der durch das Kennsatz-Erfassungsmittel (102) als ein Kennsatz erfasste Befehl einen Befehl enthält, der dafür geplant ist, an die Regelzielvorrichtung (300) ausgegeben zu werden.
  5. Vorrichtung (100) für maschinelles Lernen nach einem der Ansprüche 1 bis 4, wobei die Vorrichtung (100) für maschinelles Lernen ferner umfasst: Funktionsausgabemittel (105, 106, 107) zum Erzeugen und Ausgeben einer Funktion zum Erzeugen eines Korrekturwerts in der Vorwärtsregelung auf der Grundlage des durch die Lernmittel (103) aufgebauten Lernmodells.
  6. Servoregelsystem (1), das umfasst: die Vorrichtung (100) für maschinelles Lernen nach Anspruch 5; und die Servoregeleinrichtung (200), die einen Vorwärtsregelungskompensator (11, 21, 31) zum Ausführen einer Vorwärtsregelung auf der Grundlage der durch die Funktionsausgabemittel (105, 106, 107) ausgegebenen Funktion enthält.
  7. Servoregeleinrichtung (200), die umfasst: die Vorrichtung (100) für maschinelles Lernen nach einem der Ansprüche 1 bis 4; Funktionsausgabemittel (105, 106, 107) zum Erzeugen und Ausgeben einer Funktion zum Erzeugen eines Korrekturwerts in der Vorwärtsregelung auf der Grundlage des durch die Lernmittel (103) aufgebauten Lernmodells; und einen Vorwärtsregelungskompensator (11, 21, 31) zum Ausführen einer Vorwärtsregelung auf der Grundlage der durch die Funktionsausgabemittel (105, 106, 107) ausgegebenen Funktion.
  8. Verfahren für maschinelles Lernen, das durch einen Computer (100) ausgeführt wird, wobei das Verfahren für maschinelles Lernen die folgenden Schritte umfasst: Kennsatzerfassung eines durch eine Servoregeleinrichtung (200) an eine Regelzielvorrichtung (300) ausgegebenen Befehls, um die Regelzielvorrichtung (300) anzusteuern und zu regeln, als einen Kennsatz; Eingangsdatenerfassung einer Ausgabe der durch den Befehl angesteuerten Regelzielvorrichtung (300) als Eingangsdaten; und Lernmodellaufbau eines Lernmodells in Bezug auf die Vorwärtsregelung zum Korrigieren des Befehls durch Ausführen von überwachtem Lernen unter Verwendung eines Satzes des Kennsatzes und der Eingangsdaten, der als Lehrerdaten dient.
DE102018202654.8A 2017-03-29 2018-02-22 Vorrichtung für maschinelles Lernen, Servoregeleinrichtung, Servoregelsystem und Verfahren für maschinelles Lernen Active DE102018202654B4 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-065050 2017-03-29
JP2017065050A JP6514257B2 (ja) 2017-03-29 2017-03-29 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法

Publications (2)

Publication Number Publication Date
DE102018202654A1 true DE102018202654A1 (de) 2018-10-04
DE102018202654B4 DE102018202654B4 (de) 2024-07-04

Family

ID=63524571

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102018202654.8A Active DE102018202654B4 (de) 2017-03-29 2018-02-22 Vorrichtung für maschinelles Lernen, Servoregeleinrichtung, Servoregelsystem und Verfahren für maschinelles Lernen

Country Status (4)

Country Link
US (1) US10935939B2 (de)
JP (1) JP6514257B2 (de)
CN (1) CN108693832B (de)
DE (1) DE102018202654B4 (de)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6490131B2 (ja) * 2017-03-31 2019-03-27 ファナック株式会社 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法
JP6536978B1 (ja) * 2018-03-15 2019-07-03 オムロン株式会社 学習装置、学習方法、及びそのプログラム
JP6519896B1 (ja) * 2018-03-15 2019-05-29 オムロン株式会社 学習装置、学習方法、及びそのプログラム
JP2020039613A (ja) * 2018-09-11 2020-03-19 株式会社三洋物産 遊技機
JP2020039611A (ja) * 2018-09-11 2020-03-19 株式会社三洋物産 遊技機
JP2020039615A (ja) * 2018-09-11 2020-03-19 株式会社三洋物産 遊技機
JP2020039612A (ja) * 2018-09-11 2020-03-19 株式会社三洋物産 遊技機
CN109684727B (zh) * 2018-12-20 2023-04-25 华润电力技术研究院有限公司 孪生体模型构建方法、装置和计算机设备
US20240077840A1 (en) * 2019-10-11 2024-03-07 Tadano Ltd. Control system, and crane
CN110703608B (zh) * 2019-11-18 2021-08-06 南京工业大学 一种液压伺服执行机构智能运动控制方法
EP4196854A1 (de) * 2020-08-17 2023-06-21 5G3I Ltd Systeme und verfahren zur verbesserten steuerung elektronischer schaltungen
US20220065135A1 (en) * 2020-08-25 2022-03-03 General Electric Company Gas turbine alignment assembly and method
US11216752B1 (en) 2020-12-01 2022-01-04 OctoML, Inc. Optimizing machine learning models
JP2023048388A (ja) * 2021-09-28 2023-04-07 オムロン株式会社 制御装置、制御システム、および制御方法
JP2024124173A (ja) * 2023-03-02 2024-09-12 オムロン株式会社 制御対象に対するフィードフォワード制御に関する機械学習のための装置、教師データの生成プログラム、および教師データの生成方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2923000B2 (ja) * 1990-07-27 1999-07-26 株式会社日立製作所 サーボ制御装置
JPH07210207A (ja) 1994-01-17 1995-08-11 Hitachi Ltd 適応制御装置
JP2004038428A (ja) 2002-07-02 2004-02-05 Yamatake Corp 制御対象モデル生成方法、制御パラメータ調整方法、制御対象モデル生成プログラムおよび制御パラメータ調整プログラム
US8868221B1 (en) 2008-08-22 2014-10-21 Marvell International Ltd. Adaptive neural net feed forward system and method for adaptive control of mechanical systems
JP5339999B2 (ja) * 2009-04-03 2013-11-13 ファナック株式会社 干渉チェック機能を有する数値制御装置
CN102053628B (zh) 2009-10-27 2014-10-22 北京航空航天大学 基于神经网络的伺服控制系统及方法
US9360849B2 (en) 2010-10-27 2016-06-07 Makino Milling Machine Co., Ltd. Numerical control method
JP5731933B2 (ja) 2011-08-30 2015-06-10 川崎重工業株式会社 適応制御装置および適応制御方法ならびに射出成形機の制御装置および制御方法
KR101490664B1 (ko) 2011-10-13 2015-02-05 미쓰비시덴키 가부시키가이샤 서보 제어 장치
US10481565B2 (en) 2014-11-11 2019-11-19 Applied Brain Research Inc. Methods and systems for nonlinear adaptive control and filtering

Also Published As

Publication number Publication date
JP6514257B2 (ja) 2019-05-15
JP2018169695A (ja) 2018-11-01
DE102018202654B4 (de) 2024-07-04
US10935939B2 (en) 2021-03-02
US20180284703A1 (en) 2018-10-04
CN108693832A (zh) 2018-10-23
CN108693832B (zh) 2019-12-06

Similar Documents

Publication Publication Date Title
DE102018202654B4 (de) Vorrichtung für maschinelles Lernen, Servoregeleinrichtung, Servoregelsystem und Verfahren für maschinelles Lernen
DE102018203956B4 (de) Maschinelle Lernvorrichtung, Servosteuerungsvorrichtung, Servosteuerungssystem und maschinelles Lernverfahren
DE102018204740B4 (de) Aktionsinformationslernvorrichtung, Robotersteuersystem und Aktionsinformationslernverfahren
DE102017002996B4 (de) Maschinenlernvorrichtung, die ein lernen unter verwendung eines simulationsergebnisses durchführt, maschinensystem, herstellungssystem und maschinenlernverfahren
DE102017008475B4 (de) Maschinenlernvorrichtung, robotersystem und maschinenlernverfahren zum erlernen eines roboter-betriebsprogramms
DE102018205015B4 (de) Einstellvorrichtung und Einstellverfahren
DE102017010799B4 (de) Maschinenlernvorrichtung zum Lernen einer Bearbeitungsreihenfolge eines Robotersystems mit einer Mehrzahl von Laserbearbeitungsrobotern, dazugehöriges Robotersystem sowie Maschinenlernverfahren zum Lernen einer Bearbeitungsreihenfolge des Robotersystems mit einer Mehrzahl von Laserbearbeitungsrobotern
DE102016015017B4 (de) Steuervorrichtung mit Lernfunktion zum Erfassen einer Rauschursache
DE102018200794B4 (de) Aktionsinformations-lernvorrichtung, aktionsinformations-optimierungssystem und aktionsinformations-lernprogramm
DE102018201157B4 (de) Lernmodell-Konstruktionsvorrichtung und Steuerinformations-Optimierungsvorrichtung
DE102018003769B4 (de) Vorrichtung für maschinelles Lernen, Servosteuersystem und Verfahren zum maschinellen Lernen
DE102018209951A1 (de) Maschinenlerngerät, servosteuergerät, servosteuersystem und maschinenlernverfahren
DE102019204861A1 (de) Maschinenlernvorrichtung; steuervorrichtung und maschinelles lernverfahren
DE102019217130A1 (de) Ausgabevorrichtung, steuervorrichtung und verfahren zum ausgeben von bewertungsfunktionen und maschinellen lernergebnissen
DE102019202701A1 (de) Einstelleinrichtung und Einstellverfahren
DE102018004048A1 (de) Steuerung und Maschinenlernvorrichtung
DE102020122373A1 (de) Vorrichtung für maschinelles Lernen, Servosteuervorrichtung, Servosteuersystem und Verfahren für maschinelles Lernen
DE102019209104A1 (de) Ausgabevorrichtung, Steuervorrichtung und Ausgabeverfahren für einen Bewertungsfunktionswert
DE102019112211A1 (de) Simulationsvorrichtung
DE102018003244A1 (de) Numerische Steuerung
DE102019216190A1 (de) Ausgabevorrichtung, Steuervorrichtung und Verfahren zum Ausgeben eines Bewertungsfunktionswerts
DE102019212814A1 (de) Vorrichtung für maschinelles Lernen, Steuersystem und Verfahren für maschinelles Lernen
DE112020006576T5 (de) Numerisches Steuergerät
DE102020103527A1 (de) Lernsysteme und -verfahren
DE102019104922A1 (de) Kollisionspositionsschätzvorrichtung und maschinenlernvorrichtung

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R016 Response to examination communication
R016 Response to examination communication
R018 Grant decision by examination section/examining division