DE102016117773B4 - Werkzeugmaschine, die eine optimale Beschleunigung/Verlangsamung erzeugt, Simulationsvorrichtung und Maschinenlernvorrichtung - Google Patents
Werkzeugmaschine, die eine optimale Beschleunigung/Verlangsamung erzeugt, Simulationsvorrichtung und Maschinenlernvorrichtung Download PDFInfo
- Publication number
- DE102016117773B4 DE102016117773B4 DE102016117773.3A DE102016117773A DE102016117773B4 DE 102016117773 B4 DE102016117773 B4 DE 102016117773B4 DE 102016117773 A DE102016117773 A DE 102016117773A DE 102016117773 B4 DE102016117773 B4 DE 102016117773B4
- Authority
- DE
- Germany
- Prior art keywords
- axis
- section
- learning
- reward
- movement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 106
- 230000001133 acceleration Effects 0.000 title claims abstract description 38
- 238000004088 simulation Methods 0.000 title claims description 17
- 230000033001 locomotion Effects 0.000 claims abstract description 156
- 238000003754 machining Methods 0.000 claims abstract description 58
- 238000011156 evaluation Methods 0.000 claims abstract description 38
- 238000004364 calculation method Methods 0.000 claims abstract description 24
- 230000008859 change Effects 0.000 claims abstract description 20
- 230000006870 function Effects 0.000 claims description 33
- 230000001105 regulatory effect Effects 0.000 claims description 14
- 230000009471 action Effects 0.000 description 50
- 238000000034 method Methods 0.000 description 16
- 238000004422 calculation algorithm Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 11
- 238000013500 data storage Methods 0.000 description 8
- 230000036461 convulsion Effects 0.000 description 6
- 238000007726 management method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000005553 drilling Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000003014 reinforcing effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000002542 deteriorative effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/416—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by control of velocity, acceleration or deceleration
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/408—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by data handling or data format, e.g. reading, buffering or conversion of data
- G05B19/4083—Adapting programme, configuration
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/402—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by control arrangements for positioning, e.g. centring a tool relative to a hole in the workpiece, additional detection means to correct position
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/416—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by control of velocity, acceleration or deceleration
- G05B19/4163—Adaptive control of feed or cutting velocity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/31—From computer integrated manufacturing till monitoring
- G05B2219/31412—Calculate machining time, update as function of load, speed
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/33—Director till display
- G05B2219/33056—Reinforcement learning, agent acts, receives reward, emotion, action selective
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/39—Robotics, robotics to robotics hand
- G05B2219/39295—Learn position correction values to be added to reference values
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/41—Servomotor, servo controller till figures
- G05B2219/41367—Estimator, state observer, space state controller
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/49—Nc machine tool, till multiple
- G05B2219/49061—Calculate optimum operating, machining conditions and adjust, adapt them
Abstract
Werkzeugmaschine (1), die zumindest eine Achse auf Basis eines durch ein Programm befohlenen Befehlspfads eines Werkzeugs antreibt, um eine Bearbeitung eines Werkstücks vorzunehmen, wobei die Werkzeugmaschine (1)
einen Betriebsbewertungsabschnitt (3), der einen Betrieb der Werkzeugmaschine (1) bewertet und Bewertungsdaten ausgibt; und
eine Maschinenlernvorrichtung (20), die ein Maschinenlernen einer Bestimmung eines Bewegungsausmaßes der Achse vornimmt,
umfasst, wobei die Maschinenlernvorrichtung (20)
einen Zustandsbeobachtungsabschnitt (21), der Daten, die zumindest eine Achsenposition der Achse der Werkzeugmaschine (1) beinhalten, als Zustandsdaten und die von dem Betriebsbewertungsabschnitt (3) ausgegebenen Bewertungsdaten erlangt,
einen Belohnungsbedingungsfestlegeabschnitt (23), der eine Belohnungsbedingung festlegt,
einen Belohnungsberechnungsabschnitt (24), der auf Basis der durch den Zustandsbeobachtungsabschnitt (21) erlangten Zustandsdaten eine Belohnung berechnet,
einen Bewegungsausmaßregulierungslernabschnitt (25), der das Maschinenlernen der Bestimmung des Bewegungsausmaßes der Achse vornimmt, und
einen Bewegungsausmaßausgabeabschnitt (27), der das Bewegungsausmaß der Achse auf Basis des Ergebnisses des Maschinenlernens der Bestimmung des Bewegungsausmaßes der Achse durch den Bewegungsausmaßregulierungslernabschnitt (25) und der Zustandsdaten so bestimmt, dass eine Beschleunigung des Werkzeugs optimal wird, und das bestimmte Bewegungsausmaß ausgibt,
aufweist, und
der Bewegungsausmaßregulierungslernabschnitt (25) so ausgebildet ist, dass er das Maschinenlernen der Bestimmung des Bewegungsausmaßes der Achse auf Basis des bestimmten Bewegungsausmaßes der Achse, der durch den Zustandsbeobachtungsabschnitt (21) nach einem Betrieb der Werkzeugmaschine (1) auf Basis des ausgegebenen Bewegungsausmaßes der Achse erlangten Zustandsdaten, und der durch den Belohnungsberechnungsabschnitt (23) berechneten Belohnung vornimmt, wobei
der Belohnungsberechnungsabschnitt (23) eine positive Belohnung berechnet, wenn eine kombinierte Geschwindigkeit der Achse erhöht wird, und eine negative Belohnung berechnet, wenn ein Werkzeug von dem Befehlspfad abweicht, wenn eine Veränderung in einem zeitdifferentiellen Element der N-ten Ordnung (wobei N eine beliebige natürliche Zahl ist) einer Geschwindigkeit des Werkzeugs groß ist, und wenn es bei der Werkzeugmaschine (1) zu einem Anprall kommt.
einen Betriebsbewertungsabschnitt (3), der einen Betrieb der Werkzeugmaschine (1) bewertet und Bewertungsdaten ausgibt; und
eine Maschinenlernvorrichtung (20), die ein Maschinenlernen einer Bestimmung eines Bewegungsausmaßes der Achse vornimmt,
umfasst, wobei die Maschinenlernvorrichtung (20)
einen Zustandsbeobachtungsabschnitt (21), der Daten, die zumindest eine Achsenposition der Achse der Werkzeugmaschine (1) beinhalten, als Zustandsdaten und die von dem Betriebsbewertungsabschnitt (3) ausgegebenen Bewertungsdaten erlangt,
einen Belohnungsbedingungsfestlegeabschnitt (23), der eine Belohnungsbedingung festlegt,
einen Belohnungsberechnungsabschnitt (24), der auf Basis der durch den Zustandsbeobachtungsabschnitt (21) erlangten Zustandsdaten eine Belohnung berechnet,
einen Bewegungsausmaßregulierungslernabschnitt (25), der das Maschinenlernen der Bestimmung des Bewegungsausmaßes der Achse vornimmt, und
einen Bewegungsausmaßausgabeabschnitt (27), der das Bewegungsausmaß der Achse auf Basis des Ergebnisses des Maschinenlernens der Bestimmung des Bewegungsausmaßes der Achse durch den Bewegungsausmaßregulierungslernabschnitt (25) und der Zustandsdaten so bestimmt, dass eine Beschleunigung des Werkzeugs optimal wird, und das bestimmte Bewegungsausmaß ausgibt,
aufweist, und
der Bewegungsausmaßregulierungslernabschnitt (25) so ausgebildet ist, dass er das Maschinenlernen der Bestimmung des Bewegungsausmaßes der Achse auf Basis des bestimmten Bewegungsausmaßes der Achse, der durch den Zustandsbeobachtungsabschnitt (21) nach einem Betrieb der Werkzeugmaschine (1) auf Basis des ausgegebenen Bewegungsausmaßes der Achse erlangten Zustandsdaten, und der durch den Belohnungsberechnungsabschnitt (23) berechneten Belohnung vornimmt, wobei
der Belohnungsberechnungsabschnitt (23) eine positive Belohnung berechnet, wenn eine kombinierte Geschwindigkeit der Achse erhöht wird, und eine negative Belohnung berechnet, wenn ein Werkzeug von dem Befehlspfad abweicht, wenn eine Veränderung in einem zeitdifferentiellen Element der N-ten Ordnung (wobei N eine beliebige natürliche Zahl ist) einer Geschwindigkeit des Werkzeugs groß ist, und wenn es bei der Werkzeugmaschine (1) zu einem Anprall kommt.
Description
- Die vorliegende Erfindung betrifft eine Werkzeugmaschine und insbesondere eine Werkzeugmaschine, die bei der Steuerung jeder Achse eine optimale Beschleunigung/Verlangsamung erzeugt, sowie entsprechende Simulationsvorrichtungen und Maschinenlernvorrichtungen.
- Bei der herkömmlichen Bearbeitung einer Komponente, einer Form oder dergleichen wird ein Bearbeitungsprogramm erzeugt und eine Werkzeugmaschine auf Basis des erzeugten Bearbeitungsprogramms so gesteuert, dass sie die Bearbeitung vornimmt. Eine Bearbeitungsgeschwindigkeit zur Vornahme der Bearbeitung wird in dem Bearbeitungsprogramm als eine Bewegungsgeschwindigkeit einer Achse befohlen, wobei es sich um eine Maximalgeschwindigkeit der relativen Bewegung (Werkzeugbewegung) zwischen einem Werkzeug und einem Bearbeitungsobjekt handelt. Doch tatsächlich werden zur Zeit des Beginns der Bearbeitung, oder in einem Eckenbereich, einem Krümmungsbereich oder dergleichen Bewegungsdaten an eine Werkzeugmaschine ausgegeben, in denen eine Bewegungsgeschwindigkeit jeder Achse gemäß einer Beschleunigungs/Verlangsamungs-Zeitkonstanten jeder Achse verändert ist. Und obwohl für ein Bearbeitungsobjekt ein zulässiger Fehler und eine Zielbearbeitungszeit bestehen, reguliert ein Betreiber einer Werkzeugmaschine den zulässigen Fehler und die Zielbearbeitungszeit unter Verifikation der Bearbeitungsoberflächenqualität des Bearbeitungsobjekts durch Ändern einer Beschleunigungs/Verlangsamungs-Zeitkonstanten oder Ändern einer in einem Programm befohlenen Geschwindigkeit. Es ist zu beachten, dass in der Beschreibung die Bearbeitungsgenauigkeit, die einen Fehler in der Form eines tatsächlichen Bearbeitungsobjekts in Bezug auf eine Befehlsposition, d.h., den Grad, bis zu dem eine Formveränderung des Bearbeitungsobjekts sanft ist (ein Kratzer oder ein Knick unauffällig ist), angibt, als Bearbeitungsoberflächenqualität bezeichnet wird.
- Als verwandte Technik, die mit der Regulierung von Parametern wie einer Beschleunigungs/Verlangsamungs-Zeitkonstanten und einer Geschwindigkeit bei einer solchen Bearbeitung verbunden ist, offenbart die
JP 2003-058 218 A JP 2006-043 836 A - Im Allgemeinen kann eine Erhöhung der Bearbeitungsoberflächenqualität an einem Eckenbereich oder einem Krümmungsbereich auf eine solche Weise verwirklicht werden, dass eine Beschleunigung/Verlangsamung zur Steuerung eines Werkzeugs bei der Vornahme der Bearbeitung als Ganzes verringert wird, doch wird dadurch eine gesamte Bearbeitungsgeschwindigkeit verringert. Andererseits kann eine Beschleunigung/Verlangsamung so festgelegt werden, dass sie als Ganzes hoch ist, um die Bearbeitungsgeschwindigkeit zu erhöhen. Doch wenn ein Werkzeug durch eine derartige Einstellung an einem Eckenbereich oder in der Nähe eines Krümmungsbereichs rasch verlangsamt und beschleunigt wird, besteht die Wahrscheinlichkeit, dass in der Maschine eine Schwingung auftritt, wodurch die Bearbeitungsoberflächenqualität verschlechtert wird (die Bearbeitungsoberfläche zerkratzt wird).
-
8A und8B sind Diagramme, die jeweils ein Beispiel zeigen, bei dem in einem Eckenbereich eines Werkzeugpfads, der durch ein Bearbeitungsprogramm befohlen wird, plötzlich eine Beschleunigung/Verlangsamung auftritt. - Wenn sich die Geschwindigkeit eines Werkzeugs bei verschiedenen Bearbeitungen wie etwa dem in
8A gezeigten Drehen an einer Drehbank und dem in8B gezeigten Bohren plötzlich verändert, kommt es aufgrund des Einflusses der Änderung zu Schwingungen in der Maschine, die eine Verschlechterung der Bearbeitungsoberflächenqualität in einem Eckenbereich oder einem Krümmungsbereich verursachen. Wenn eine Beschleunigung/Verlangsamung unter Finden eines Ausgleichs zwischen der Verbesserung der Bearbeitungsoberflächenqualität und der Verringerung der Bearbeitungszeit unter Berücksichtigung jedes Elements, das mit der Bewegung einer Achse verbunden ist, vorgenommen wird, um diese Erscheinung zu verhindern, muss der Betreiber viel Mühe aufwänden und kann es sein, dass er dennoch nicht in der Lage ist, die Geschwindigkeit oder die Beschleunigung zu optimieren. - Was diese Probleme betrifft, können die Techniken des Stands der Technik, die in der
JP 2003-058 218 A JP 2006-043 836 A - Die
DE 10 2016 008 994 A1 zeigt eine Werkzeugmaschine mit einem Betriebsbeurteilungsabschnitt, der Beurteilungsdaten zu einem Betrieb der Werkzeugmaschine ausgibt, und einem Maschineneinlerngerät, das ein Einlernen der Maschine des Bewegungsumfangs einer Achse durchführt. - Die
US 2015/0094846 A1 - Die
US 2011/0010073 A1 - KURZDARSTELLUNG DER ERFINDUNG
- Angesichts der obigen Umstände hat die vorliegende Erfindung die Aufgabe, eine Werkzeugmaschine bereitzustellen, die bei der Steuerung jeder Achse eine optimale Beschleunigung/Verlangsamung erzeugt, sowie entsprechende Simulationsvorrichtungen und Maschinenlernvorrichtungen.
- Diese Aufgabe wird durch eine Werkzeugmaschine mit den Merkmalen von Anspruch 1, eine Simulationsvorrichtung mit den Merkmalen von Anspruch 4 und eine Maschinenlernvorrichtung mit den Merkmalen von Anspruch 5 gelöst. Vorteilhafte Weiterbildungen der Erfindung ergeben sich aus den abhängigen Ansprüchen.
- Bei der vorliegenden Erfindung wird ein Veränderungsausmaß von einer Position einer Achse einer Werkzeugmaschine zu einer bestimmten Zeit zu einer Position der Achse im nächsten Augenblick erhalten. Bei einem solchen Veränderungsausmaß handelt es sich um Daten, die als ein von einer numerischen Steuereinheit ausgegebener Befehlsimpuls bezeichnet werden. Herkömmlich kann es sein, dass kein optimales Veränderungsausmaß erhalten wird, da ein Techniker eines Werkzeugmaschinenherstellers zur Vornahme einer Regulierung eine Beschleunigungs/Verlangsamungs-Zeitkonstante für jede Achse festlegt. Daher wird ein Bewegungsausmaß einer Achse optimiert, um eine Bewegung eines Werkzeugs mit einer geringeren Beschleunigungsveränderung zu verwirklichen, ohne eine Zeit für jede Bearbeitung stark zu verändern, wodurch eine qualitativ hochwertige Bearbeitung verwirklicht wird.
- Die Werkzeugmaschine treibt zumindest eine Achse auf Basis eines durch ein Programm befohlenen Befehlspfads eines Werkzeugs an, um eine Bearbeitung eines Werkstücks vorzunehmen. Die Werkzeugmaschine weist einen Betriebsbewertungsabschnitt, der einen Betrieb der Werkzeugmaschine bewertet und Bewertungsdaten ausgibt; und eine Maschinenlernvorrichtung, die ein Maschinenlernen einer Bestimmung eines Bewegungsausmaßes der Ache vornimmt, auf. Die Maschinenlernvorrichtung weist einen Zustandsbeobachtungsabschnitt, der Daten, die zumindest eine Achsenposition der Achse der Werkzeugmaschine beinhalten, als Zustandsdaten und die von dem Betriebsbewertungsabschnitt ausgegebenen Bewertungsdaten erlangt, einen Belohnungsbedingungsfestlegeabschnitt, der eine Belohnungsbedingung festlegt, einen Belohnungsberechnungsabschnitt, der auf Basis der durch den Zustandsbeobachtungsabschnitt erlangten Zustandsdaten eine Belohnung berechnet, einen Bewegungsausmaßregulierungslernabschnitt, der das Maschinenlernen der Bestimmung des Bewegungsausmaßes der Achse vornimmt, und einen Bewegungsausmaßausgabeabschnitt, der das Bewegungsausmaß der Achse auf Basis des Ergebnisses des Maschinenlernens der Bestimmung des Bewegungsausmaßes der Achse durch den Bewegungsausmaßregulierungslernabschnitt und der Zustandsdaten so bestimmt, dass eine Beschleunigung des Werkzeugs optimal wird, und das bestimmte Bewegungsausmaß ausgibt, auf. Der Bewegungsausmaßregulierungslernabschnitt ist so ausgebildet, dass er das Maschinenlernen der Bestimmung des Bewegungsausmaßes der Achse auf Basis des bestimmten Bewegungsausmaßes der Achse, der durch den Zustandsbeobachtungsabschnitt nach einem Betrieb der Werkzeugmaschine auf Basis des ausgegebenen Bewegungsausmaßes der Achse erlangten Zustandsdaten und der durch den Belohnungsberechnungsabschnitt berechneten Belohnung vornimmt.
- Der Belohnungsberechnungsabschnitt berechnet eine positive Belohnung, wenn eine kombinierte Geschwindigkeit der Achse erhöht wird, und eine negative Belohnung, wenn ein Werkzeug von dem Befehlspfad abweicht, wenn eine Veränderung in einem zeitdifferentiellen Element der N-ten Ordnung (wobei N eine beliebige natürliche Zahl ist) einer Geschwindigkeit des Werkzeugs groß ist, und wenn es bei der Werkzeugmaschine zu einem Anprall kommt.
- Die Werkzeugmaschine kann an zumindest eine andere Werkzeugmaschine angeschlossen sein und einen Austausch oder eine gemeinsame Verwendung des Maschinenlernergebnisses mit der anderen Werkzeugmaschine vornehmen.
- Der Bewegungsausmaßregulierungslernabschnitt kann so ausgebildet sein, dass er das Maschinenlernen unter Verwendung des regulierten Bewegungsausmaßes der Achse und einer Bewertungsfunktion, in der die durch den Zustandsbeobachtungsabschnitt erlangten Zustandsdaten durch ein Argument ausgedrückt sind, so vornimmt, dass die Belohnung maximal wird.
- Eine Simulationsvorrichtung simuliert eine Werkzeugmaschine, die zumindest eine Achse auf Basis eines durch ein Programm befohlenen Befehlspfads eines Werkzeugs antreibt, um eine Bearbeitung eines Werkstücks vorzunehmen. Die Simulationsvorrichtung weist einen Betriebsbewertungsabschnitt, der einen Simulationsbetrieb der Werkzeugmaschine bewertet und Bewertungsdaten ausgibt; und eine Maschinenlernvorrichtung, die ein Maschinenlernen einer Bestimmung eines Bewegungsausmaßes der Ache vornimmt, auf. Die Maschinenlernvorrichtung weist einen Zustandsbeobachtungsabschnitt, der simulierte Daten, die zumindest eine Achsenposition der Achse der Werkzeugmaschine beinhalten, als Zustandsdaten und die von dem Betriebsbewertungsabschnitt ausgegebenen Bewertungsdaten erlangt, einen Belohnungsberechnungsabschnitt, der auf Basis der durch den Zustandsbeobachtungsabschnitt erlangten Zustandsdaten eine Belohnung berechnet, einen Bewegungsausmaßregulierungslernabschnitt, der das Maschinenlernen der Bestimmung des Bewegungsausmaßes der Achse vornimmt, und einen Bewegungsausmaßausgabeabschnitt, der das Bewegungsausmaß der Achse auf Basis des Ergebnisses des Maschinenlernens der Bestimmung des Bewegungsausmaßes der Achse durch den Bewegungsausmaßregulierungslernabschnitt und der Zustandsdaten so bestimmt, dass eine Beschleunigung des Werkzeugs optimal wird, und das bestimmte Bewegungsausmaß ausgibt, auf Der Bewegungsausmaßregulierungslernabschnitt ist so ausgebildet, dass er das Maschinenlernen der Bestimmung des Bewegungsausmaßes der Achse auf Basis des bestimmten Bewegungsausmaßes der Achse, der durch den Zustandsbeobachtungsabschnitt nach einem Simulationsbetrieb der Werkzeugmaschine auf Basis des ausgegebenen Bewegungsausmaßes der Achse erlangten Zustandsdaten und der durch den Belohnungsberechnungsabschnitt berechneten Belohnung vornimmt.
- Eine Maschinenlernvorrichtung, die ein Maschinenlernen einer Regulierung eines Bewegungsausmaßes von zumindest einer Achse einer Werkzeugmaschine vorgenommen hat, weist einen Lernergebnisspeicherabschnitt, der ein Maschinenlernergebnis einer Bestimmung des Bewegungsausmaßes der Achse speichert; einen Zustandsbeobachtungsabschnitt, der Zustandsdaten erlangt, die zumindest eine Achsenposition der Achse der Werkzeugmaschine beinhalten; und einen Bewegungsausmaßausgabeabschnitt, der das Bewegungsausmaß der Achse auf Basis des in dem Lernergebnisspeicherabschnitt gespeicherten Maschinenlernergebnisses und den Zustandsdaten so bestimmt, dass eine Beschleunigung eines Werkzeugs der Werkzeugmaschine optimal wird, und das bestimmte Bewegungsausmaß ausgibt, auf. Nach Ausführungsformen der vorliegenden Erfindung wird es durch die Aufnahme des Maschinenlernens in die Bestimmung eines optimalen Bewegungsausmaßes jeder Achse möglich, jede Achse mit einer optimalen Beschleunigung/Verlangsamung zu steuern und eine Bearbeitung eines Werkstücks unter Aufrechterhalten der Bearbeitungsoberflächenqualität in einem kürzeren Zeitraum zu verwirklichen.
- Figurenliste
- Die obigen und andere Aufgaben und Merkmale der vorliegenden Erfindung werden aus der Beschreibung der folgenden Ausführungsformen unter Bezugnahme auf die beiliegenden Zeichnungen offensichtlich werden, wobei
-
1A und1B Diagramme zur Beschreibung eines Beispiels sind, bei dem eine Beschleunigung/Verlangsamung jeder Achse bei der Bearbeitung eines Werkstücks durch die Aufnahme einer Maschinenlernvorrichtung in eine Werkzeugmaschine nach der vorliegenden Erfindung optimiert wird; -
2 ein Diagramm zur Beschreibung des grundlegenden Konzepts eines bestärkenden Lernalgorithmus ist; -
3 ein Bilddiagramm im Hinblick auf das Maschinenlernen der Werkzeugmaschine nach einer Ausführungsform der vorliegenden Erfindung ist; -
4 ein Diagramm zur Beschreibung der einzelnen Daten im Hinblick auf jede Achse der Werkzeugmaschine bei der Ausführungsform ist; -
5 ein Funktionsblockdiagramm der Werkzeugmaschine nach der Ausführungsform der vorliegenden Erfindung ist; -
6 ein Ablaufdiagramm zur Beschreibung des durch die Maschinenlernvorrichtung von5 vorgenommenen Maschinenlernens ist; -
7 ein Funktionsblockdiagramm einer Simulationsvorrichtung nach einer Ausführungsform der vorliegenden Erfindung ist; -
8A und8B Diagramme zur Beschreibung der Verringerung der Bearbeitungsoberflächenqualität bei der Bearbeitung eines Werkstücks sind. - AUSFÜHRLICHE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN
- Bei der vorliegenden Erfindung wird eine Maschinenlernvorrichtung, die als künstliche Intelligenz wirkt, in eine Werkzeugmaschine, die ein Werkstück bearbeitet, aufgenommen, und wird ein Maschinenlernen bezüglich der Bestimmung eines Bewegungsausmaßes zur Regulierung einer Beschleunigung/Verlangsamung jeder Achse der Werkzeugmaschine bei der Bearbeitung des Werkstücks auf Basis eines Bearbeitungsprogramms vorgenommen, wodurch die Beschleunigung/Verlangsamung (eine Veränderung eines Bewegungsausmaßes) jeder Achse der Werkzeugmaschine wie in
1A und1B gezeigt so reguliert wird, dass sie bei der Bearbeitung des Werkstücks zu jeder Zeit optimal ist. Bei der Regulierung der Beschleunigung/Verlangsamung jeder Achse wird auf eine schnellere Bewegung eines Werkzeugs, das Vermeiden einer Abweichung von dem Werkzeugpfad, und das Vermeiden des Auftretens eines Anpralls abgezielt. Daher wird die Bearbeitung eines Werkstücks unter Aufrechterhalten seiner Bearbeitungsoberflächenqualität in einem kürzeren Zeitraum verwirklicht. - Nachstehend wird eine kurze Beschreibung des Maschinenlernens, das in eine Werkzeugmaschine nach der vorliegenden Erfindung eingebracht werden soll, gegeben werden.
- Das Maschinenlernen
- Im Allgemeinen ist das Maschinenlernen je nach seinem Ziel oder den Bedingungen in verschiedene Algorithmen wie etwa überwachtes Lernen und nicht überwachtes Lernen klassifiziert. Die vorliegende Erfindung hat die Aufgabe, die Bestimmung eines Bewegungsausmaßes zur Regulierung einer Beschleunigung/Verlangsamung jeder Achse einer Werkzeugmaschine bei der Bearbeitung eines Werkstücks auf Basis eines Bearbeitungsprogramms zu erlernen. Angesichts des Umstands, dass es schwer ist, eindeutig anzugeben, welche Art von Handlung (Regulierung eines Bewegungsausmaßes jeder Achse) in Bezug auf einen Bewegungspfad eines Werkzeugs auf Basis eines ausgegebenen Bewegungsausmaßes jeder Achse passend durchgeführt werden soll, wird ein bestärkender Lernalgorithmus eingesetzt, bei dem eine Maschinenlernvorrichtung eine Handlung zur Erreichung eines Ziels nur unter Erhalt einer Belohnung automatisch erlernt.
-
2 ist ein Diagramm zur Beschreibung des grundlegenden Konzepts eines bestärkenden Lernalgorithmus. - Beim bestärkenden Lernen werden das Lernen eines Agenten und eine Handlung durch die Wechselwirkungen zwischen einem Agenten (Maschinenlernvorrichtung), der als lernendes Subjekt wirkt, und einer Umgebung (Steuerzielsystem), die als Steuerziel wirkt, vorangetrieben.
- Genauer erfolgen die folgenden Wechselwirkungen zwischen dem Agenten und der Umgebung:
- (1) Der Agent beobachtet einen Umgebungszustand
st zu einer bestimmten Zeit. - (2) Der Agent wählt auf Basis eines Beobachtungsergebnisses und des früheren Lernens eine Handlung at, deren Vornahme dem Agenten gestattet ist, und nimmt diese vor.
- (3) Nach der Vornahme der Handlung at ändert sich der Umgebungszustand
st zu einem nächsten Zustandst+1 . - (4) Der Agent erhält auf Basis der Zustandsänderung als Ergebnis der Handlung
at eine Belohnungrt+1 . - (5) Der Agent treibt das Lernen auf Basis des Zustands
st , der Handlungat , der Belohnungrt+1 , und eines früheren Lernergebnisses voran. - Beim Lernen der obigen Verarbeitung (
5 ) erlangt der Agent die Zuordnung eines beobachteten Zustandsst , einer Handlungat und einer Belohnungrt+1 als Bezugsinformation zur Bestimmung des Umfangs einer Belohnung, die der Agent in der Zukunft erhalten kann. Wenn zum Beispiel die Anzahl der Zustände, die der Agent zu jeder Zeit aufweisen darf, m beträgt, und die Anzahl der Handlungen, die der Agent ergreifen darf, n beträgt, erhält der Agent durch wiederholtes Vornehmen von Handlungen eine zweidimensionale Anordnung von m x n, worin Belohnungenrt+1 , die Paaren von Zuständenst und Handlungenat entsprechen, gespeichert sind. - Unter Verwendung einer Wertfunktion (Bewertungsfunktion), die auf Basis der erhaltenen Zuordnung angibt, bis zu welchem Grad ein gegenwärtiger Zustand oder eine gegenwärtige Handlung von Wert ist, aktualisiert der Agent die Wertfunktion (Bewertungsfunktion), während er wiederholt Handlungen vornimmt, um eine optimale Handlung, die einem Zustand entspricht, zu erlernen.
- Eine „Zustandswertfunktion“ ist eine Wertfunktion, die angibt, bis zu welchem Grad ein bestimmter Zustand
st von Wert ist. Die Zustandswertfunktion wird als Funktion ausgedrückt, die einen Zustand als Argument verwendet und beim Lernen aus wiederholten Handlungen auf Basis einer Belohnung, die in Bezug auf eine Handlung in einem bestimmten Zustand erhalten wird, eines Werts eines zukünftigen Zustands, der sich durch die Handlung geändert hat, oder dergleichen aktualisiert wird. Die Aktualisierungsformel der Zustandswertfunktion ist gemäß einem bestärkenden Lernalgorithmus definiert. Zum Beispiel ist die Zustandswertfunktion beim TD(Temporal-Difference)-Lernen, das einer der bestärkenden Lernalgorithmen ist, durch die folgende Formel (1) definiert. Es ist zu beachten, dass in der folgenden Formel (1) α als Lernkoeffizient bezeichnet wird, γ als Diskontierungsfaktor bezeichnet wird, und der Lernkoeffizient und der Diskontierungsfaktor so definiert sind, dass sie jeweils zwischen 0 < α ≤ 1 und 0 < γ ≤ 1 fallen. - Zudem ist eine „Handlungswertfunktion“ eine Wertfunktion, die angibt, bis zu welchen Grad eine Handlung at in einem bestimmten Zustand
st von Wert ist. Die Handlungswertfunktion ist als Funktion ausgedrückt, die einen Zustand und eine Handlung als Argumente benutzt und beim Lernen aus wiederholten Handlungen auf Basis einer Belohnung, die in Bezug auf eine Handlung in einem bestimmten Zustand erhalten wird, eines Handlungswerts eines zukünftigen Zustands, der sich durch die Handlung geändert hat, oder dergleichen aktualisiert wird. Die Aktualisierungsformel der Handlungswertfunktion ist gemäß einem bestärkenden Lernalgorithmus definiert. Zum Beispiel ist die Handlungswertfunktion beim Q-Lernen, das einer der typischen bestärkenden Lernalgorithmen ist, durch die folgende Formel (2) definiert. Es ist zu beachten, dass in der folgenden Formel (2) α als Lernkoeffizient bezeichnet wird, γ als Diskontierungsfaktor bezeichnet wird, und der Lernkoeffizient und der Diskontierungsfaktor so definiert sind, dass sie jeweils zwischen 0 < α ≤ 1 und 0 < γ ≤ 1 fallen. - Es ist zu beachten, dass als Verfahren zum Speichern einer Wertfunktion (Bewertungsfunktion) als Lernergebnis neben einem Verfahren, das eine Näherungsfunktion verwendet, und einem Verfahren, das ein Array verwendet, zum Beispiel dann, wenn der Zustand s viele Zustände annimmt, ein Verfahren verfügbar ist, das eine überwachte Lernvorrichtung wie etwa eine SVM (Support Vector Machine) mit einer Mehrfachwertausgabe oder ein neurales Netzwerk verwendet, die mit einem Zustand
st und einer Handlung at als Eingaben einen Wert (eine Bewertung) ausgeben. - Ferner wird bei der Wahl einer Handlung bei der obigen Verarbeitung (
2 ) unter Verwendung einer Wertfunktion (Bewertungsfunktion), die durch das vergangene Lernen erzeugt wurde, eine Handlung at gewählt, bei der eine Belohnung (rt+1 + rt+2 + ...) im Lauf der Zukunft in einem gegenwärtigen Zustand maximal wird (eine Handlung zur Änderung zu einem wertvollsten Zustand, wenn eine Zustandswertfunktion verwendet wird, oder einer wertvollsten Handlung in dem Zustand, wenn eine Handlungswertfunktion verwendet wird). Es ist zu beachten, dass ein Agent während des Lernens bei der Wahl einer Handlung bei der obigen Verarbeitung (2 ) zum Zweck des Vorantreibens des Lernens eine zufällige Handlung mit einer konstanten Wahrscheinlichkeit wählen kann (ε-Greedy-Verfahren). - Wie oben beschrieben wird das Lernen durch wiederholtes Vornehmen der obigen Verarbeitungen (
1 ) bis (5) vorangetrieben. Das Lernen kann selbst in einer neuen Umgebung nach dem Abschluss des Lernens in einer bestimmten Umgebung durch zusätzliches Lernen so vorangetrieben werden, dass es an die neue Umgebung angepasst wird. - Entsprechend wird das Lernen wie bei der vorliegenden Erfindung auf die Bestimmung eines Bewegungsausmaßes zur Regulierung einer Beschleunigung/Verlangsamung jeder Achse zu jeder Zeit bei der Bearbeitung eines Werkstücks auf Basis eines Bearbeitungsprogramms angewendet. Daher wird selbst bei einer Anwendung des Lernens auf die Steuerung einer neuen Werkzeugmaschine ein neues Bearbeitungsprogramm auf der Basis des Lernens der Bestimmung eines Bewegungsausmaßes zur Regulierung einer Beschleunigung/Verlangsamung jeder Achse zu jeder Zeit bei der vergangenen Bearbeitung eines Werkstücks zusätzlich als neue Umgebung erlernt, wodurch es möglich wird, das weitere Lernen der Bestimmung des Bewegungsausmaßes zur Regulierung der Beschleunigung/Verlangsamung jeder Achse zu jeder Zeit bei der Bearbeitung des Werkstücks auf Basis des Bearbeitungsprogramms in einem kurzen Zeitraum vorzunehmen.
- Zudem setzt das bestärkende Lernen ein System ein, bei dem mehrere Agenten über ein Netzwerk oder dergleichen miteinander verbunden sind, und Informationen über Zustände s, Handlungen a, Belohnungen r oder dergleichen unter den Agenten geteilt werden und auf jedes Lernen angewendet werden, wodurch jeder der Agenten ein verteiltes bestärkendes Lernen unter Berücksichtigung der Umgebungen der anderen Agenten vornimmt, was die Vornahme eines leistungsfähigen Lernens gestattet. Und bei der vorliegenden Erfindung wird den Werkzeugmaschinen dann, wenn mehrere Agenten (Maschinenlernvorrichtungen), die mehrere Umgebungen (Werkzeugmaschinen, die als Steuerziele wirken) steuern, in einem Zustand, in dem sie miteinander über ein Netzwerk oder dergleichen verbunden sind, ein verteiltes Maschinenlernen vornehmen, gestattet, die Bestimmung eines Bewegungsausmaßes zur Regulierung einer Beschleunigung/Verlangsamung jeder Achse zu jeder Zeit bei der Bearbeitung eines Werkstücks auf Basis eines Bearbeitungsprogramms leistungsfähig zu erlernen.
- Obwohl verschiedene Verfahren wie etwa das Q-Lernen, ein SARSA-Verfahren, das TD-Lernen und ein AC-Verfahren allgemein als bestärkende Lernalgorithmen bekannt sind, ist zu beachten, dass jeder beliebige der obigen bestärkenden Algorithmen auf die vorliegende Erfindung angewendet werden kann. Da jeder der bestärkenden Lernalgorithmen allgemein bekannt ist, wird in der Beschreibung auf ihre ausführliche Beschreibung verzichtet werden.
- Nachstehend wird auf Basis einer bestimmten Ausführungsform eine Beschreibung der Werkzeugmaschine der vorliegenden Erfindung, in die eine Maschinenlernvorrichtung eingebracht wurde, gegeben werden.
- Ausführungsform
-
3 ist ein Diagramm, das ein Bild hinsichtlich des Maschinenlernens der Bestimmung eines Bewegungsausmaßes zur Regulierung einer Beschleunigung/Verlangsamung jeder Achse zu jeder Zeit bei einer Werkzeugmaschine, in die eine als künstliche Intelligenz wirkende Maschinenlernvorrichtung nach einer Ausführungsform der vorliegenden Erfindung eingebracht wurde, zeigt. Es ist zu beachten, dass3 nur Aufbauten zeigt, die für die Beschreibung des Maschinenlernens durch die Werkzeugmaschine nach der Ausführungsform nötig sind. - Bei der Ausführungsform werden eine Fortbewegungsrichtung eines Werkzeugs, ein Abweichungsausmaß von einem Werkzeugpfad, eine gegenwärtige Geschwindigkeit jeder Achse, ein zeitdifferentielles Element der N-ten Ordnung (eine Beschleunigung, ein Rucken, ...) der gegenwärtigen Geschwindigkeit jeder Achse, das Auftreten eines Anpralls, oder dergleichen als Informationen, um die Maschinenlernvorrichtung
20 dazu zu bringen, eine Umgebung (Zustandst in dem obigen Abschnitt „(1) Das Maschinenlernen“) zu bestimmen, in die Maschinenlernvorrichtung20 eingegeben. Jeder dieser Werte enthält Daten, die von jedem Abschnitt der Werkzeugmaschine1 erlangt wurden, und Daten, die durch einen Betriebsbewertungsabschnitt3 auf Basis der erlangten Daten berechnet wurden. -
4 ist ein Diagramm zur Beschreibung der einzelnen Daten im Zusammenhang mit einer Werkzeugmaschine1 nach der Ausführungsform. - Bei der Werkzeugmaschine
1 nach der Ausführungsform wird ein Befehlspfad, der durch Analysieren eines Bearbeitungsprogramms erhalten wurde, in einem Speicher (nicht gezeigt) gespeichert. Neben einer Achsenposition (xt ,zt ) jeder Achse, einer Bewegungsgeschwindigkeit (δxt-1 ,δzt-1 ) jeder Achse, und einer Beschleunigung (δxt-1-δxt-2, δzt-1 - δzt-2) jeder Achse zu der Zeit t, die von der Werkzeugmaschine1 erhalten werden, beinhalten die oben beschriebenen Eingangsdaten Daten, die durch den Betriebsbewertungsabschnitt3 auf Basis der einzelnen oben beschriebenen Daten berechnet wurden, wie etwa eine Entfernung d, um die jede Achsenposition von dem Befehlspfad abweicht. - Es ist zu beachten, dass
4 ein Beispiel für die einzelnen Eingangsdaten in einem zweidimensionalen X-Z-Koordinatensystem zeigt. Doch wenn die Werkzeugmaschine drei oder mehr Achsen aufweist, kann die Anzahl der Dimensionen der Eingangsdaten passend erhöht werden, um der Anzahl der Achsen zu entsprechen. - Bei der Ausführungsform gibt die Maschinenlernvorrichtung
20 ein Bewegungsausmaß jeder Achse in einem nächsten Augenblick (einem gegenwärtigen Zyklus in dem Steuerzyklus einer Steuervorrichtung) als Ausgangsdaten in Bezug auf eine Umgebung aus (Handlung at in dem obigen Abschnitt „(1) Das Maschinenlernen“). Es ist zu beachten, dass bei der vorliegenden Ausführungsform ein Bewegungsausmaß jeder Achse, das in einem bestimmten Zyklus ausgegeben wird, innerhalb des Zyklus ohne Verzögerung durch einen Servomotor, der die jeweilige Achse antreibt, verbraucht (bewegt) wird. Daher wird das Bewegungsausmaß (Ausgabe in einem Steuerzyklus) nachstehend als Bewegungsgeschwindigkeit eines Werkzeugs behandelt. - Zudem werden der Maschinenlernvorrichtung
20 bei der Ausführungsform ein Anstieg der kombinierten Geschwindigkeit der jeweiligen Achsen (positive Belohnung), eine Bewegung in eine Richtung, die zu der befohlenen Richtung entgegengesetzt ist (negative Belohnung), eine große Veränderung bei einem zeitdifferentiellen Element der N-ten Ordnung (wobei N eine beliebige natürliche Zahl ist) einer Geschwindigkeit eines Werkzeugs (negative Belohnung), ein Überschreiten einer Maximalgeschwindigkeit (negative Belohnung), das Auftreten eines Anpralls (negative Belohnung), oder dergleichen als Belohnung (Belohnungrt in dem obigen Abschnitt „(1) Das Maschinenlernen“) gegeben. Die Belohnung wird durch den Betriebsbewertungsabschnitt3 auf Basis des Grad des Erreichens jeder Belohnung gemäß den Eingangsdaten, Ausgangsdaten, oder dergleichen berechnet. Es ist zu beachten, dass ein Betreiber gemäß den Bearbeitungsinhalten eines Bearbeitungsprogramms in der Werkzeugmaschine1 passend festlegen kann, welche Daten zur Bestimmung der Belohnung verwendet werden. Zum Beispiel kann bei einer Bohrbearbeitung eine unvollständige Bildung eines Lochs als negative Belohnung definiert werden. - Überdies nimmt die Maschinenlernvorrichtung
20 bei der Ausführungsform das Maschinenlernen auf Basis der oben beschriebenen Eingangsdaten, Ausgangsdaten und Belohnungen vor. Bei dem Maschinenlernen wird ein Zustandst durch die Kombination von Eingangsdaten zu einer bestimmten Zeit definiert, ist die Ausgabe eines Bewegungsausmaßes, die in Bezug auf den definierten Zustandst vorgenommen wird, einer Handlung at gleichwertig, und ist ein Wert, der auf Basis von Eingangsdaten, die als Ergebnis der Ausgabe des Bewegungsausmaßes infolge der Handlungat neu erhalten wurden, bewertet und berechnet wurde, einer Belohnungrt1 gleichwertig. Wie in dem oben beschriebenen Abschnitt „(1) Das Maschinenlernen“ werden der Zustandst , die Handlung at, und die Belohnungrt+1 auf die Aktualisierungsformel einer Wertfunktion (Bewertungsfunktion), die einem Maschinenlernalgorithmus entspricht, angewendet, um das Lernen voranzutreiben. - Nachstehend wird unter Bezugnahme auf das Funktionsblockdiagramm von
5 eine Beschreibung der Funktion der Werkzeugmaschine1 der Ausführungsform gegeben werden. -
5 ist ein Funktionsblockdiagramm der Werkzeugmaschine der Ausführungsform. - Die Werkzeugmaschine
1 der Ausführungsform ist mit Aufbauten und peripheren Einrichtungen (nicht gezeigt), die bei der Werkzeugmaschine als Standard bereitgestellt sind, wie etwa einem Antriebsabschnitt (nicht gezeigt) wie z.B. einem Servomotor, der bei der Bearbeitung eines Werkstücks jede Achse antreibt, und einem Servosteuerabschnitt (nicht gezeigt), der den Servomotor steuert, einem numerischen Steuerabschnitt2 , der den Antriebsabschnitt und die peripheren Einrichtungen steuert, einem Betriebsbewertungsabschnitt3 , der den Betrieb der Werkzeugmaschine auf Basis des Betriebs des Antriebsabschnitts oder der peripheren Einrichtungen und den einzelnen Daten, die von dem numerischen Steuerabschnitt2 erlangt wurden, bewertet, einem Anpralldetektionsabschnitt4 , der durch einen Anprallsensor oder dergleichen, welcher einen bei der Werkzeugmaschine auftretenden Anprall detektiert, gebildet ist, und einer Maschinenlernvorrichtung20 , die als künstliche Intelligenz, welche das Maschinenlernen vornimmt, wirkt, versehen. - Wenn die Aufbauten der Werkzeugmaschine, die in dem Blockdiagramm von
5 gezeigt sind, mit den in2 gezeigten Elementen des bestärkenden Lernens verglichen werden, entspricht die Maschinenlernvorrichtung20 von5 dem „Agenten“ von2 , und entspricht eine bei der Werkzeugmaschine1 von5 bereitgestellte Gesamtheit, die den Antriebsabschnitt, die peripheren Einrichtungen, den numerischen Steuerabschnitt2 oder dergleichen beinhaltet, der „Umgebung“ von2 . Es ist zu beachten, dass angenommen wird, dass die Werkzeugmaschine1 mit den Aufbauten allgemeiner Werkzeugmaschinen versehen ist, und auf ausführliche Beschreibungen anderer Aufbauten als jener, die für die Beschreibung des Betriebs des Maschinenlernens bei der vorliegenden Ausführungsform speziell nötig sind, verzichtet werden wird. - Der numerische Steuerabschnitt
2 analysiert ein Bearbeitungsprogramm, das aus einem Speicher (nicht gezeigt) gelesen wurde oder über eine Eingabeeinrichtung (nicht gezeigt) oder dergleichen eingegeben wurde, und steuert jeden Abschnitt der Werkzeugmaschine1 auf Basis der Steuerdaten, die als Ergebnis der Analyse erhalten wurden. Im Allgemeinen nimmt der numerische Steuerabschnitt2 eine Steuerung auf Basis eines Analyseergebnisses des Bearbeitungsprogramms vor. Doch bei dieser Ausführungsform wird die Steuerung jeder Achse, die das Werkzeug der Werkzeugmaschine1 antreibt, gemäß einem von der Maschinenlernvorrichtung20 ausgegebenen Bewegungsausmaß jeder Achse vorgenommen. - Der Betriebsbewertungsabschnitt
3 bewertet ein mit jedem Steuerzyklus von der Maschinenlernvorrichtung20 ausgegebenes Bewegungsausmaß jeder Achse der Werkzeugmaschine auf Basis einer von dem numerischen Steuerabschnitt2 erlangten Position jeder Achse der Werkzeugmaschine1 , eines durch ein Bearbeitungsprogramm, das durch den numerischen Steuerabschnitt2 analysiert wurde, erhaltenen Befehlspfads eines Werkzeugs, einer durch das Bearbeitungsprogramm befohlenen Vorschubgeschwindigkeit (Maximalgeschwindigkeit), und dergleichen, und meldet der Maschinenlernvorrichtung20 ein Bewertungsergebnis. Die Bewertung einer Handlung durch den Betriebsbewertungsabschnitt3 wird verwendet, um eine Belohnung beim Lernen der Maschinenlernvorrichtung20 zu berechnen. - Beispiele für die Bewertung einer Handlung beinhalten den Winkel zwischen einer Bewegungsrichtung auf Basis eines Bewegungsausmaßes jeder Achse der Werkzeugmaschine
1 und einer Bewegungsrichtung eines durch ein Bearbeitungsprogramm befohlenen Befehlspfads in der Nähe einer gegenwärtigen Position, die durch Positionen der jeweiligen Achsen der Werkzeugmaschine1 erfasst wird, ein Abweichungsausmaß einer gegenwärtigen Position eines Werkzeugs von einem Befehlspfad, und den Unterschied zwischen einer Bewegungsgeschwindigkeit auf Basis von Bewegungsausmaßen der jeweiligen Achsen und einer durch ein Bearbeitungsprogramm befohlenen Maximalgeschwindigkeit in der Nähe einer gegenwärtigen Position, und eine Größe des absoluten Werts eines Ruckens (einer Größe einer Veränderung einer Beschleunigung). Doch eine Handlung kann auf eine beliebige andere Weise als die oben angeführten bewertet werden, solange eine Bewertung der Qualität der von der Maschinenlernvorrichtung20 ausgegebenen Handlung ermöglicht wird. - Die Maschinenlernvorrichtung
20 , die das Maschinenlernen vornimmt, ist mit einem Zustandsbeobachtungsabschnitt21 , einem Zustandsdatenspeicherabschnitt22 , einem Belohnungsbedingungsfestlegeabschnitt23 , einem Belohnungsberechnungsabschnitt24 , einem Bewegungsausmaßregulierungslernabschnitt25 , einem Lernergebnisspeicherabschnitt26 , und einem Bewegungsausmaßausgabeabschnitt27 versehen. Die Maschinenlernvorrichtung20 kann in der Werkzeugmaschine1 bereitgestellt sein, oder kann in einem Personalcomputer oder dergleichen außerhalb der Werkzeugmaschine1 bereitgestellt sein. - Der Zustandsbeobachtungsabschnitt
21 beobachtet über den numerischen Steuerabschnitt2 alle Daten hinsichtlich der Werkzeugmaschine1 und erlangt die beobachteten Daten in der Maschinenlernvorrichtung20 . Zudem erlangt der Zustandsbeobachtungsabschnitt21 in der Maschinenlernvorrichtung20 ein Bewertungsergebnis eines Betriebs durch den Betriebsbewertungsabschnitt3 als Zustandsdaten. Die Zustandsdaten, die in der Maschinenlernvorrichtung20 erlangt werden, beinhalten neben einer Achsenposition oder einer Geschwindigkeit jeder Achse und eines zeitdifferentiellen Elements der N-ten Ordnung (einer Beschleunigung, eines Ruckens, ...) einer Geschwindigkeit jeder Achse, die oben beschrieben wurden, die Temperatur, den Strom, die Spannung, den Druck, die Zeit, das Drehmoment, die Kraft, den Stromverbrauch, einen Berechnungswert, der durch Vornehmen der arithmetischen Bearbeitung jeder physikalischen Größe berechnet wurde, oder dergleichen. - Zudem beinhaltet das Bewertungsergebnis des Betriebs durch den Betriebsbewertungsabschnitt
3 den Winkel zwischen einem Befehlswert und einer Bewegungsrichtung eines Werkzeugs, ein Ausmaß der Abweichung von einem Bereich, in dem ein zulässiger Fehler zu einem Werkzeugpfad einer gegenwärtigen Position eines Werkzeugs addiert ist, den Unterschied zwischen einer Bewegungsgeschwindigkeit eines Werkzeugs und einer befohlenen Maximalgeschwindigkeit, eine Größe des absoluten Werts eines Ruckens (eine Größe einer Veränderung einer Beschleunigung), oder dergleichen. Es ist zu beachten, dass eine Größe des absoluten Werts eines Ruckens als Maßstab einer Größe eines Anpralls verwendet wird. Daher sind nicht notwendigerweise sowohl ein Wert eines Anpralls, der durch einen Anpralldetektionsabschnitt4 detektiert wird, als auch eine Größe des absoluten Werts eines Ruckens, die von dem Betriebsbewertungsabschnitt3 erlangt wird, erforderlich, sondern kann auch nur eines davon als Zustandsdaten erlangt werden. - Der Zustandsdatenspeicherabschnitt
22 erhält und speichert Zustandsdaten und gibt die gespeicherten Zustandsdaten an den Belohnungsberechnungsabschnitt24 und den Bewegungsausmaßregulierungslernabschnitt25 aus. Die in den Zustandsdatenspeicherabschnitt22 eingegebenen Zustandsdaten können Daten sein, die durch die jüngste Bearbeitungstätigkeit erlangt wurden, oder Daten sein, die durch eine frühere Bearbeitungstätigkeit erlangt wurden. Zudem ist es auch möglich, dass der Zustandsdatenspeicherabschnitt22 Zustandsdaten, die in einer anderen Werkzeugmaschine40 oder in einem zentralen Verwaltungssystem30 gespeichert sind, erhält und speichert, oder ist es möglich, dass der Zustandsdatenspeicherabschnitt22 Zustandsdaten, die in dem Zustandsdatenspeicherabschnitt22 gespeichert sind, an eine andere Werkzeugmaschine40 oder das zentrale Verwaltungssystem30 ausgibt. - Der Belohnungsbedingungsfestlegeabschnitt
23 legt Bedingungen für die Vergabe von Belohnungen bei dem durch einen Betreiber oder dergleichen festgelegten Maschinenlernen fest. Es werden positive und negative Belohnungen vergeben, die passend festgelegt werden können. Zudem kann eine Eingabe in den Belohnungsbedingungsfestlegeabschnitt23 über einen Personalcomputer, ein Tablet-Terminal oder dergleichen, der oder das in dem zentralen Verwaltungssystem verwendet wird, vorgenommen werden. Doch durch eine Eingabe über eine nicht gezeigte MDI(manuelle Dateneingabe)-Vorrichtung der Werkzeugmaschine1 wird es möglich, Bedingungen für die Vergabe von Belohnungen leicht festzulegen. - Der Belohnungsberechnungsabschnitt
24 analysiert Zustandsdaten, die von dem Zustandsbeobachtungsabschnitt21 oder dem Zustandsdatenspeicherabschnitt22 eingegeben werden, auf Basis von Bedingungen, die durch den Belohnungsbedingungsfestlegeabschnitt23 festgelegt wurden, und gibt berechnete Belohnungen an den Bewegungsausmaßregulierungslernabschnitt25 aus. - Nachstehend wird eine Beschreibung von Beispielen für Belohnungsbedingungen, die durch den Belohnungsbedingungsfestlegeabschnitt
23 bei der Ausführungsform festgelegt werden, gegeben werden. - Belohnung 1: Erhöhung der kombinierten Geschwindigkeit der jeweiligen Achsen
- Positive Belohnung und negative Belohnung
- Da die Zykluszeit der Bearbeitung zunimmt, wenn eine kombinierte Geschwindigkeit der jeweiligen Achsen eine frühere kombinierte Geschwindigkeit der jeweiligen Achsen überschreitet, wird je nach einem Ausmaß des Geschwindigkeitsanstiegs eine positive Belohnung vergeben.
- Da andererseits ein Fehler oder dergleichen in der Werkzeugmaschine
1 auftritt, wenn eine kombinierte Geschwindigkeit der jeweiligen Achsen eine befohlene Maximalgeschwindigkeit überschreitet oder wenn eine Geschwindigkeit jeder Achse eine Maximalgeschwindigkeit für jede Achse, die in der Werkzeugmaschine1 festgelegt ist, überschreitet, wird je nach einem Ausmaß der Geschwindigkeitsüberschreitung eine negative Belohnung vergeben. - Belohnung 2: Bewegung in eine Richtung, die sich von der befohlenen Richtung unterscheidet
- Wenn sich im Hinblick auf einen Winkel, der zwischen einer Bewegungsrichtung eines Werkzeugs auf Basis eines Bewegungsausmaßes jeder Achse der Werkzeugmaschine
1 und einer durch ein Bearbeitungsprogramm befohlenen Bewegungsrichtung in der Nähe einer aus einer Position jeder Achse erfassten gegenwärtigen Position des Werkzeugs gebildet wird, die Bewegungsrichtung des Werkzeugs stark von dem durch das Bearbeitungsprogramm befohlenen Befehlspfad unterscheidet, wird je nach einem Ausmaß des Unterschieds eine negative Belohnung vergeben. Als ein Beispiel für eine negative Belohnung kann dann, wenn ein zwischen einer Bewegungsrichtung eines Werkzeugs und einer Bewegungsrichtung eines Befehlspfads gebildeter Winkel größer als ein vorgeschriebener Winkel (zum Beispiel innerhalb von ±45 Grad) ist, ein Wert, der durch Multiplizieren des Unterschieds mit einem vorgeschriebenen Koeffizienten erhalten wird, als negative Belohnung vergeben werden. Zudem kann dann, wenn der Winkel einfach 180 Grad (in einer zu der Bewegungsrichtung des Befehlspfads entgegengesetzte Richtung) übersteigt, eine negative Belohnung vergeben werden. - Belohnung 3: Große Veränderung in dem zeitdifferentiellen Element der N-ten Ordnung (wobei N eine beliebige natürliche Zahl ist) der Geschwindigkeit des Werkzeugs (negative Belohnung)
- Wenn eine Veränderung in einem zeitdifferentiellen Element der N-ten Ordnung (wobei N eine beliebige natürliche Zahl ist, Beschleunigung, Rucken, oder dergleichen) einer Geschwindigkeit jeder Achse der Werkzeugmaschine
1 einen vorab festgelegten vorgeschriebenen Wert übersteigt, wird je nach dem Ausmaß des Übersteigens durch die Veränderung eine negative Belohnung vergeben. - Belohnung 4: Abweichung von dem Werkzeugpfad
- Wenn eine gegenwärtige Position eines Werkzeugs von einem durch ein Bearbeitungsprogramm befohlenen Befehlspfad abweicht, wird je nach dem Grad der Abweichung eine negative Belohnung vergeben. Das heißt, für die Vergabe einer negativen Belohnung kann der Abweichungsgrad auf dem Ausmaß der Entfernung zwischen einer gegenwärtigen Position eines Werkzeugs und einem Befehlspfad beruhen.
- Belohnung 5: Auftreten eines Anpralls (negative Belohnung)
- Wenn durch den Anpralldetektionsabschnitt
4 , der in der Werkzeugmaschine1 bereitgestellt ist, ein Anprall, der einen vorab festgelegten vorgeschriebenen Wert übersteigt, detektiert wird, wird je nach dem Ausmaß des Übersteigens durch den Anprall eine negative Belohnung vergeben. - Der Bewegungsausmaßregulierungslernabschnitt
25 nimmt auf Basis von Zustandsdaten einschließlich von Eingabedaten und dergleichen, eines Ergebnisses einer von ihm selbst vorgenommenen Regulierung eines Bewegungsausmaßes jeder Achse der Werkzeugmaschine, und einer Belohnung, die durch den Belohnungsberechnungsabschnitt24 berechnet wurde, ein Maschinenlernen (bestärkendes Lernen) vor. - Hier ist bei dem Maschinenlernen, das durch den Bewegungsausmaßregulierungslernabschnitt
25 vorgenommen wird, ein Zustandst durch die Kombination aus Zustandsdaten zu einer bestimmten Zeit t definiert, und ist die Bestimmung eines Bewegungsausmaßes jede Achse gemäß dem definierten Zustandst einer Handlung at gleichwertig, wird ein Bewegungsausmaß jeder Achse, das durch den später beschriebenen Bewegungsausmaßausgabeabschnitt27 bestimmt wird, an den numerischen Steuerabschnitt2 ausgegeben, und ist ein Wert, der durch den Belohnungsberechnungsabschnitt24 auf Basis von Daten berechnet wird, die erhalten werden, wenn jede Achse der Werkzeugmaschine1 auf Basis des durch den numerischen Steuerabschnitt2 bestimmten Bewegungsausmaßes jeder Achse bewegt wird, einer Belohnungrt+1 gleichwertig. Eine Wertfunktion, die beim Lernen verwendet wird, wird je nach dem angewendeten Lernalgorithmus bestimmt. Wenn zum Beispiel das Q-Lernen verwendet wird, ist es nur nötig, eine Handlungswertfunktion Q(st ,at ) gemäß der obigen Formel (2) zu aktualisieren, um das Lernen voranzutreiben. - Unter Bezugnahme auf das Ablaufdiagramm von
6 wird eine Beschreibung des Ablaufs des Maschinenlernens, das durch den Bewegungsausmaßregulierungslernabschnitt25 der Maschinenlernvorrichtung20 von2 vorgenommen wird, beschrieben werden. Die Verarbeitung wird nachstehend anhand von jeweiligen Schritten erklärt. - (Schritt
SA01 ): Wenn das Maschinenlernen beginnt, erlangt der Zustandsbeobachtungsabschnitt21 Daten hinsichtlich eines Bearbeitungszustands der Werkzeugmaschine1 . - (Schritt
SA02 ): Der Bewegungsausmaßregulierungslernabschnitt25 bestimmt auf Basis der Daten hinsichtlich des Bearbeitungszustands, die durch den Zustandsbeobachtungsabschnitt21 erlangt wurden, einen gegenwärtigen Zustandst . - (Schritt
SA03 ): Der Bewegungsausmaßregulierungslernabschnitt25 wählt auf Basis eines früheren Lernergebnisses und des in SchrittSA02 bestimmten Zustands eine Handlung at (Bestimmung eines Bewegungsausmaßes jeder Achse). - (Schritt
SA04 ): Die Handlung at, die in SchrittSA03 gewählt wurde, wird vorgenommen. - (Schritt
SA05 ): Der Zustandsbeobachtungsabschnitt21 erlangt Daten hinsichtlich eines Bearbeitungszustands, die einen Zustand der Werkzeugmaschine1 zeigen, In diesem Stadium ändert sich der Zustand der Werkzeugmaschine1 mit einem zeitlichen Übergang von der Zeit t zu der Zeit t+1 als Ergebnis der Handlungst , die in SchrittSA04 vorgenommen wurde. - (Schritt
SA06 ): Der Belohnungsberechnungsabschnitt24 berechnet auf Basis der Daten hinsichtlich des Bewertungsergebnisses, die in SchrittSA05 erlangt wurden, eine Belohnung rt+1. - (Schritt
SA07 ): Der Bewegungsausmaßregulierungslernabschnitt25 treibt das Lernen auf Basis des Zustandsst , der in SchrittSA02 bestimmt wurde, der Handlungat , die in SchrittSA03 gewählt wurde, und der Belohnungrt+1 , die in SchrittSA06 berechnet wurde, voran und kehrt dann zu SchrittSA02 zurück. - Unter erneuter Bezugnahme auf
5 speichert der Lernergebnisspeicherabschnitt26 ein Lernergebnis des Bewegungsausmaßregulierungslernabschnitts25 . Und wenn von dem Bewegungsausmaßregulierungslernabschnitt25 ein Lernergebnis erneut verwendet wird, gibt der Lernergebnisspeicherabschnitt26 das gespeicherte Lernergebnis an den Bewegungsausmaßregulierungslernabschnitt25 aus. Wie oben beschrieben kann ein Lernergebnis auf eine solche Weise gespeichert werden, dass eine Wertfunktion, die einem zu verwendenden Maschinenlernalgorithmus entspricht, durch eine Näherungsfunktion, ein Array oder eine überwachte Lernvorrichtung wie etwa eine SVM mit einer Mehrfachwertausgabe oder ein neurales Netzwerk oder dergleichen gespeichert wird. - Es ist zu beachten, dass es auch möglich ist, dass der Lernergebnisspeicherabschnitt
26 ein Lernergebnis, das in einer anderen Werkzeugmaschine40 oder einem zentralen Verwaltungssystem30 gespeichert ist, erhält und speichert, oder dass der Lernergebnisspeicherabschnitt26 ein in dem Lernergebnisspeicherabschnitt26 gespeichertes Lernergebnis an eine andere Werkzeugmaschine40 oder das zentrale Verwaltungssystem30 ausgibt. - Der Bewegungsausmaßausgabeabschnitt
27 bestimmt auf Basis eines Lernergebnisses des Bewegungsausmaßregulierungslernabschnitts25 und der gegenwärtigen Zustandsdaten ein Bewegungsausmaß jeder Achse. Hier entspricht die Bestimmung eines Bewegungsausmaßes jeder Achse der bei dem Maschinenlernen verwendeten „Handlung at“. Als Verfahren zur Bestimmung der Bewegungsausmaße der jeweiligen Achsen können zum Beispiel vorab Kombinationen der Bewegungsausmaße der jeweiligen Achsen in positiven und negativen Richtungen (Handlung1 : (Bewegungsausmaß derX -Achse, Bewegungsausmaß der Z-Achse) = (1, 0), Handlung2 : Bewegungsausmaß derX -Achse, Bewegungsausmaß der Z-Achse) = (2, 0), ..., Handlung n: (Bewegungsausmaß derX -Achse, Bewegungsausmaß derZ -Achse) = (δxmax ,δzmax )) als wählbare Handlung vorbereitet werden, und kann eine Handlung, durch die auf Basis eines früheren Lernergebnisses in der Zukunft eine maximale Belohnung erhalten werden wird, gewählt werden. Zudem kann das oben beschriebene ε-Greedy-Verfahren eingesetzt werden und das Lernen durch die Wahl einer zufälligen Handlung mit einer vorgeschriebenen Wahrscheinlichkeit vorangetrieben werden. - Danach gibt der Bewegungsausmaßausgabeabschnitt
27 das bestimmte Bewegungsausmaß jeder Achse an den numerischen Steuerabschnitt2 aus. Dann treibt der numerische Steuerabschnitt2 jede Achse der Werkzeugmaschine1 auf Basis des von dem Bewegungsausmaßausgabeabschnitt27 ausgegebenen Bewegungsausmaßes jeder Achse an. - Dann bewertet der Betriebsbewertungsabschnitt
3 erneut ein Antriebsergebnis jeder Achse, erlangt die Maschinenlernvorrichtung20 ein Bewertungsergebnis und einen gegenwärtigen Zustand der Werkzeugmaschine1 , und wird das Lernen unter Verwendung der eingegebenen Zustandsdaten wiederholt vorgenommen. Dadurch wird die Erlangung eines noch besseren Lernergebnisses gestattet. - Wenn als Ergebnis des oben beschriebenen Lernens der Maschinenlernvorrichtung
20 eine optimale Beschleunigung/Verlangsamung an jeder Position auf einem Befehlspfad bestätigt ist, beendet die Maschinenlernvorrichtung20 das Lernen. Von der Maschinenlernvorrichtung20 , die das Lernen abgeschlossen hat, ausgegebene Daten, die durch Sammeln eines Bewegungsausmaßes (Befehlsimpulse) jeder Achse über eine Runde eines Werkzeugpfads erhalten wurden, sind Bewegungsdaten eines Werkzeugs gleichwertig. - Wenn die Werkzeugmaschine die Bearbeitung unter Verwendung der Lerndaten, für die das Lernen abgeschlossen wurde, tatsächlich vornimmt, kann die Maschinenlernvorrichtung
20 einen wiederholten Betrieb unter Verwendung der Lerndaten, für die das Lernen abgeschlossen wurde, so wie sie sind, vornehmen, anstatt ein neues Lernen vorzunehmen. - Zudem kann die Maschinenlernvorrichtung
20 , die das Lernen abgeschlossen hat (oder die Maschinenlernvorrichtung20 , bei der abgeschlossene Lerndaten von anderen Maschinenlernvorrichtungen20 in den Lernspeicherabschnitt26 kopiert wurden), an einer anderen Werkzeugmaschine40 angebracht werden, um einen wiederholenden Betrieb unter Verwendung der Lerndaten, für die das Lernen abgeschlossen wurde, so wie sie sind, vorzunehmen. - Überdies kann die Werkzeugmaschine
1 dann, wenn die Werkzeugmaschine1 in einem Zustand, in dem die Lernfunktion der Maschinenlernvorrichtung20 , die das Lernen abgeschlossen hat, aktiv belassen wird, mit einer anderen Werkzeugmaschine40 verbunden wird, um die Bearbeitung eines Werkstücks fortzusetzen, ferner individuelle Unterschiede, zeitliche Veränderungen oder dergleichen, die sich für jede Werkzeugmaschine unterscheiden, erlernen und einen Betrieb vornehmen, während sie einen besseren Bearbeitungspfad für die Werkzeugmaschine sucht. - Es ist zu beachten, dass bei der wie oben beschriebenen Vornahme einer Lerntätigkeit unter Verwendung des numerischen Steuerabschnitts
2 der Werkzeugmaschine der numerische Steuerabschnitt2 das Lernen auf Basis der virtuellen Bearbeitung eines Werkstücks ohne tatsächliches Betreiben der Werkzeugmaschine1 vornehmen kann. Zudem kann die Maschinenlernvorrichtung20 wie in7 gezeigt in eine Simulationsvorrichtung5 , die mit einem Simulationsabschnitt6 , der den Betrieb der Werkzeugmaschine gesondert simuliert, versehen ist, aufgenommen werden, um eine Lerntätigkeit auf Basis eines Simulationsergebnisses des Simulationsabschnitts6 vorzunehmen. Auf jeden Fall ist erwünscht, dass ein Werkstück nicht tatsächlich bearbeitet wird, da in dem Anfangsstadium des Lernens wahrscheinlich ein Bewegungsausmaß ausgegeben werden wird, das eine große Abweichung von einem Befehlspfad verursacht. - Ferner kann die Maschinenlernvorrichtung
20 der Werkzeugmaschine1 das Maschinenlernen einzeln vornehmen. Doch wenn jede von mehreren Werkzeugmaschinen1 ferner mit einem Abschnitt versehen ist, der zur Kommunikation nach außen verwendet wird, wird es möglich, Daten, die in jedem der Zustandsdatenspeicherabschnitte22 gespeichert sind, und ein Lernergebnis, das in jedem der Lernergebnisspeicherabschnitte26 gespeichert ist, zu senden/empfangen und gemeinsam zu verwenden. Dadurch wird ein leistungsfähigeres Maschinenlernen gestattet. Wenn das Lernen zum Beispiel mit einem Bewegungsausmaß, das innerhalb eines vorgeschriebenen Bereichs verändert wird, vorgenommen wird, wird das Lernen unter mehreren Werkzeugmaschinen1 und40 auf eine solche Weise vorangetrieben, dass Zustandsdaten und Lerndaten zwischen den Werkzeugmaschinen1 ausgetauscht werden, während ein Werkstück mit unterschiedlichen Bewegungsausmaßen, die innerhalb eines vorgeschriebenen Bereichs variieren, bearbeitet wird. Dadurch wird ein leistungsfähiges Lernen gestattet. - Um wie oben beschrieben Zustandsdaten und Lerndaten zwischen mehreren Werkzeugmaschinen
1 und40 auszutauschen, kann eine Kommunikation über einen Host-Computer wie etwa das zentrale Verwaltungssystem30 vorgenommen werden, können die Werkzeugmaschinen1 und40 direkt miteinander kommunizieren, oder kann eine Cloud verwendet werden. Doch zur Handhabung großer Datenmengen ein vorzugsweise ein Kommunikationsabschnitt mit einer höheren Kommunikationsgeschwindigkeit bereitgestellt. - Im Vorhergehenden wurde eine Ausführungsform der vorliegenden Erfindung beschrieben. Die vorliegende Erfindung ist jedoch nicht nur auf das Beispiel der obigen Ausführungsform beschränkt, sondern kann durch passende Abwandlungen in verschiedenen Formen ausgeführt werden.
Claims (5)
- Werkzeugmaschine (1), die zumindest eine Achse auf Basis eines durch ein Programm befohlenen Befehlspfads eines Werkzeugs antreibt, um eine Bearbeitung eines Werkstücks vorzunehmen, wobei die Werkzeugmaschine (1) einen Betriebsbewertungsabschnitt (3), der einen Betrieb der Werkzeugmaschine (1) bewertet und Bewertungsdaten ausgibt; und eine Maschinenlernvorrichtung (20), die ein Maschinenlernen einer Bestimmung eines Bewegungsausmaßes der Achse vornimmt, umfasst, wobei die Maschinenlernvorrichtung (20) einen Zustandsbeobachtungsabschnitt (21), der Daten, die zumindest eine Achsenposition der Achse der Werkzeugmaschine (1) beinhalten, als Zustandsdaten und die von dem Betriebsbewertungsabschnitt (3) ausgegebenen Bewertungsdaten erlangt, einen Belohnungsbedingungsfestlegeabschnitt (23), der eine Belohnungsbedingung festlegt, einen Belohnungsberechnungsabschnitt (24), der auf Basis der durch den Zustandsbeobachtungsabschnitt (21) erlangten Zustandsdaten eine Belohnung berechnet, einen Bewegungsausmaßregulierungslernabschnitt (25), der das Maschinenlernen der Bestimmung des Bewegungsausmaßes der Achse vornimmt, und einen Bewegungsausmaßausgabeabschnitt (27), der das Bewegungsausmaß der Achse auf Basis des Ergebnisses des Maschinenlernens der Bestimmung des Bewegungsausmaßes der Achse durch den Bewegungsausmaßregulierungslernabschnitt (25) und der Zustandsdaten so bestimmt, dass eine Beschleunigung des Werkzeugs optimal wird, und das bestimmte Bewegungsausmaß ausgibt, aufweist, und der Bewegungsausmaßregulierungslernabschnitt (25) so ausgebildet ist, dass er das Maschinenlernen der Bestimmung des Bewegungsausmaßes der Achse auf Basis des bestimmten Bewegungsausmaßes der Achse, der durch den Zustandsbeobachtungsabschnitt (21) nach einem Betrieb der Werkzeugmaschine (1) auf Basis des ausgegebenen Bewegungsausmaßes der Achse erlangten Zustandsdaten, und der durch den Belohnungsberechnungsabschnitt (23) berechneten Belohnung vornimmt, wobei der Belohnungsberechnungsabschnitt (23) eine positive Belohnung berechnet, wenn eine kombinierte Geschwindigkeit der Achse erhöht wird, und eine negative Belohnung berechnet, wenn ein Werkzeug von dem Befehlspfad abweicht, wenn eine Veränderung in einem zeitdifferentiellen Element der N-ten Ordnung (wobei N eine beliebige natürliche Zahl ist) einer Geschwindigkeit des Werkzeugs groß ist, und wenn es bei der Werkzeugmaschine (1) zu einem Anprall kommt.
- Werkzeugmaschine (1) nach
Anspruch 1 , wobei die Werkzeugmaschine (1) an zumindest eine andere Werkzeugmaschine (40) angeschlossen ist und einen Austausch oder eine gemeinsame Verwendung des Maschinenlernergebnisses mit der anderen Werkzeugmaschine (40) vornimmt. - Werkzeugmaschine (1) nach
Anspruch 1 , wobei der Bewegungsausmaßregulierungslernabschnitt (25) so ausgebildet ist, dass er das Maschinenlernen unter Verwendung des regulierten Bewegungsausmaßes der Achse und einer Bewertungsfunktion, in der die durch den Zustandsbeobachtungsabschnitt (21) erlangten Zustandsdaten durch ein Argument ausgedrückt sind, so vornimmt, dass die Belohnung maximal wird. - Simulationsvorrichtung (5) zum Simulieren einer Werkzeugmaschine (1), die zumindest eine Achse auf Basis eines durch ein Programm befohlenen Befehlspfads eines Werkzeugs antreibt, um eine Bearbeitung eines Werkstücks vorzunehmen, wobei die Simulationsvorrichtung (5) einen Betriebsbewertungsabschnitt (3), der einen Simulationsbetrieb der Werkzeugmaschine (1) bewertet und Bewertungsdaten ausgibt; und eine Maschinenlernvorrichtung (20), die ein Maschinenlernen einer Bestimmung eines Bewegungsausmaßes der Achse vornimmt, umfasst, wobei die Maschinenlernvorrichtung (20) einen Zustandsbeobachtungsabschnitt (21), der simulierte Daten, die zumindest eine Achsenposition der Achse der Werkzeugmaschine (1) beinhalten, als Zustandsdaten und die von dem Betriebsbewertungsabschnitt (3) ausgegebenen Bewertungsdaten erlangt, einen Belohnungsberechnungsabschnitt (24), der auf Basis der durch den Zustandsbeobachtungsabschnitt (21) erlangten Zustandsdaten eine Belohnung berechnet, einen Bewegungsausmaßregulierungslernabschnitt (25), der das Maschinenlernen der Bestimmung des Bewegungsausmaßes der Achse vornimmt, und einen Bewegungsausmaßausgabeabschnitt (27), der das Bewegungsausmaß der Achse auf Basis des Ergebnisses des Maschinenlernens der Bestimmung des Bewegungsausmaßes der Achse durch den Bewegungsausmaßregulierungslernabschnitt (25) und der Zustandsdaten so bestimmt, dass eine Beschleunigung des Werkzeugs optimal wird, und das bestimmte Bewegungsausmaß ausgibt, aufweist, und der Bewegungsausmaßregulierungslernabschnitt (25) so ausgebildet ist, dass er das Maschinenlernen der Bestimmung des Bewegungsausmaßes der Achse auf Basis des bestimmten Bewegungsausmaßes der Achse, der durch den Zustandsbeobachtungsabschnitt (21) nach einem Simulationsbetrieb der Werkzeugmaschine (1) auf Basis des ausgegebenen Bewegungsausmaßes der Achse erlangten Zustandsdaten, und der durch den Belohnungsberechnungsabschnitt (24) berechneten Belohnung vornimmt, wobei der Belohnungsberechnungsabschnitt (23) eine positive Belohnung berechnet, wenn eine kombinierte Geschwindigkeit der Achse erhöht wird, und eine negative Belohnung berechnet, wenn ein Werkzeug von dem Befehlspfad abweicht, wenn eine Veränderung in einem zeitdifferentiellen Element der N-ten Ordnung (wobei N eine beliebige natürliche Zahl ist) einer Geschwindigkeit des Werkzeugs groß ist, und wenn es bei der Werkzeugmaschine (1) zu einem Anprall kommt.
- Maschinenlernvorrichtung (5), die ein Maschinenlernen einer Bestimmung eines Bewegungsausmaßes von zumindest einer Achse einer Werkzeugmaschine (1) vornimmt, wobei die Maschinenlernvorrichtung (20) einen Zustandsbeobachtungsabschnitt (21), der Daten, die zumindest eine Achsenposition der Achse der Werkzeugmaschine (1) beinhalten, als Zustandsdaten erlangt; einen Belohnungsbedingungsfestlegeabschnitt (23), der eine Belohnungsbedingung festlegt, einen Belohnungsberechnungsabschnitt (24), der auf Basis der durch den Zustandsbeobachtungsabschnitt (21) erlangten Zustandsdaten eine Belohnung berechnet, einen Bewegungsausmaßregulierungslernabschnitt (25), der das Maschinenlernen der Bestimmung des Bewegungsausmaßes der Achse vornimmt, und einen Bewegungsausmaßausgabeabschnitt (27), der das Bewegungsausmaß der Achse auf Basis des Maschinenlernergebnisses der Bestimmung des Bewegungsausmaßes der Achse durch den Bewegungsausmaßregulierungslernabschnitt (25) und den Zustandsdaten so bestimmt, dass eine Beschleunigung eines Werkzeugs, das durch die Achse bewegt wird, optimal wird, und das bestimmte Bewegungsausmaß ausgibt, aufweist, und der Bewegungsausmaßregulierungslernabschnitt (25) so ausgebildet ist, dass er das Maschinenlernen der Bestimmung des Bewegungsausmaßes der Achse auf Basis des bestimmten Bewegungsausmaßes der Achse, der durch den Zustandsbeobachtungsabschnitt (21) nach einem Betrieb der Werkzeugmaschine (1) auf Basis des ausgegebenen Bewegungsausmaßes der Achse erlangten Zustandsdaten, und der durch den Belohnungsberechnungsabschnitt (24) berechneten Belohnung vornimmt, wobei der Belohnungsberechnungsabschnitt (23) eine positive Belohnung berechnet, wenn eine kombinierte Geschwindigkeit der Achse erhöht wird, und eine negative Belohnung berechnet, wenn ein Werkzeug von dem Befehlspfad abweicht, wenn eine Veränderung in einem zeitdifferentiellen Element der N-ten Ordnung (wobei N eine beliebige natürliche Zahl ist) einer Geschwindigkeit des Werkzeugs groß ist, und wenn es bei der Werkzeugmaschine (1) zu einem Anprall kommt.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015-189542 | 2015-09-28 | ||
JP2015189542A JP6219897B2 (ja) | 2015-09-28 | 2015-09-28 | 最適な加減速を生成する工作機械 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE102016117773A1 DE102016117773A1 (de) | 2017-03-30 |
DE102016117773B4 true DE102016117773B4 (de) | 2019-08-29 |
Family
ID=58282035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102016117773.3A Active DE102016117773B4 (de) | 2015-09-28 | 2016-09-21 | Werkzeugmaschine, die eine optimale Beschleunigung/Verlangsamung erzeugt, Simulationsvorrichtung und Maschinenlernvorrichtung |
Country Status (4)
Country | Link |
---|---|
US (1) | US10261497B2 (de) |
JP (1) | JP6219897B2 (de) |
CN (1) | CN106557075B (de) |
DE (1) | DE102016117773B4 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112019007433B4 (de) | 2019-06-28 | 2023-05-17 | Mitsubishi Electric Corporation | Bearbeitungsbedingung-Sucheinrichtung und Bearbeitungsbedingung-Suchverfahren |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6325504B2 (ja) * | 2015-10-28 | 2018-05-16 | ファナック株式会社 | 学習制御器の自動調整を行う機能を有するサーボ制御装置 |
JP6560707B2 (ja) * | 2017-04-20 | 2019-08-14 | ファナック株式会社 | 加工面品位評価装置 |
JP6530779B2 (ja) * | 2017-04-20 | 2019-06-12 | ファナック株式会社 | 加工不良要因推定装置 |
JP6499710B2 (ja) | 2017-04-20 | 2019-04-10 | ファナック株式会社 | 加減速制御装置 |
JP6546618B2 (ja) | 2017-05-31 | 2019-07-17 | 株式会社Preferred Networks | 学習装置、学習方法、学習モデル、検出装置及び把持システム |
JP2019020959A (ja) * | 2017-07-14 | 2019-02-07 | ファナック株式会社 | 制御装置及び学習装置 |
JP6820815B2 (ja) * | 2017-09-07 | 2021-01-27 | 株式会社日立製作所 | 学習制御システム及び学習制御方法 |
JP6930901B2 (ja) * | 2017-11-09 | 2021-09-01 | 株式会社Nttファシリティーズ | 制振制御システム、制振制御方法、振動解析装置及び振動解析方法 |
DE102019001177B4 (de) | 2018-02-19 | 2024-01-18 | Fanuc Corporation | Steuergerät, maschinelle Lernvorrichtung und System |
JP2019141869A (ja) * | 2018-02-19 | 2019-08-29 | ファナック株式会社 | 制御装置及び機械学習装置 |
JP6784722B2 (ja) * | 2018-06-28 | 2020-11-11 | ファナック株式会社 | 出力装置、制御装置、及び評価関数値の出力方法 |
JP6795562B2 (ja) * | 2018-09-12 | 2020-12-02 | ファナック株式会社 | 検査装置及び機械学習方法 |
TWI722344B (zh) | 2018-12-05 | 2021-03-21 | 財團法人工業技術研究院 | 加工參數自動產生系統 |
JP7085140B2 (ja) * | 2018-12-19 | 2022-06-16 | オムロン株式会社 | 制御装置、制御方法及び制御プログラム |
WO2020136769A1 (ja) * | 2018-12-26 | 2020-07-02 | 三菱電機株式会社 | ロボット制御装置、ロボット制御学習装置、及びロボット制御方法 |
JP7010877B2 (ja) | 2019-04-25 | 2022-01-26 | ファナック株式会社 | 機械学習装置、数値制御システム及び機械学習方法 |
US20220219322A1 (en) * | 2019-05-17 | 2022-07-14 | Telefonaktiebolaget Lm Ericsson (Publ) | Technique for Parameter Conversion Between a Robotic Device and a Controller for the Robotic Device |
WO2020246005A1 (ja) * | 2019-06-06 | 2020-12-10 | 三菱電機株式会社 | パラメータ算出装置、ロボット制御システム、ロボットシステム |
JP7349423B2 (ja) * | 2019-06-19 | 2023-09-22 | 株式会社Preferred Networks | 学習装置、学習方法、学習モデル、検出装置及び把持システム |
CN110370076A (zh) * | 2019-08-08 | 2019-10-25 | 合肥学院 | 基于加工机床的自由曲面原位测量方法 |
JP7424807B2 (ja) * | 2019-11-28 | 2024-01-30 | ファナック株式会社 | 機械学習装置、消費電力予測装置、及び制御装置 |
CN114559297B (zh) * | 2020-11-27 | 2023-09-19 | 财团法人工业技术研究院 | 刀具状态评估系统及方法 |
DE112021007088T5 (de) | 2021-04-23 | 2023-12-07 | Fanuc Corporation | Maschinenlernvorrichtung, beschleunigungs- und verlangsamungseinstellvorrichtung und computerlesbares speichermedium |
WO2023223471A1 (ja) * | 2022-05-18 | 2023-11-23 | 三菱電機株式会社 | 加工結果評価装置、加工結果評価方法、加工条件決定装置、および加工条件決定方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003058218A (ja) * | 2001-06-06 | 2003-02-28 | Fanuc Ltd | サーボモータを駆動制御する制御装置 |
JP2006043836A (ja) * | 2004-08-06 | 2006-02-16 | Mazda Motor Corp | 工作機械の加工条件設定方法、その加工条件設定プログラム、及び、その加工条件設定プログラムを記録した記録媒体 |
US20110010073A1 (en) * | 2008-07-17 | 2011-01-13 | Honeywell International Inc. | Configurable automotive controller |
US20150094846A1 (en) * | 2013-09-27 | 2015-04-02 | Siemens Aktiengesellschaft | Control device with integrated optimizer |
DE102016008994A1 (de) * | 2015-07-30 | 2017-03-09 | Fanuc Corporation | Werkzeugmaschine, simulationsvorrichtung und maschineneinlerngerät |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2961621B2 (ja) * | 1990-09-27 | 1999-10-12 | 豊田工機株式会社 | 数値制御装置の加工条件作成機能の学習方法 |
JPH0635525A (ja) * | 1992-07-16 | 1994-02-10 | Tsubakimoto Chain Co | ロボットアームの制御方法 |
JP3477792B2 (ja) * | 1994-03-04 | 2003-12-10 | 三菱電機株式会社 | モーション制御装置 |
JP3739749B2 (ja) * | 2003-01-07 | 2006-01-25 | ファナック株式会社 | 制御装置 |
JP2006110702A (ja) * | 2004-10-18 | 2006-04-27 | Fanuc Ltd | 学習制御機能を備えたロボット及びロボットの制御方法 |
JP4283214B2 (ja) * | 2004-12-16 | 2009-06-24 | ファナック株式会社 | 機械先端点の制御装置 |
JP2008225533A (ja) * | 2007-03-08 | 2008-09-25 | Fanuc Ltd | サーボ制御装置 |
JP4850956B2 (ja) | 2010-02-19 | 2012-01-11 | ファナック株式会社 | 学習制御機能を備えたロボット |
-
2015
- 2015-09-28 JP JP2015189542A patent/JP6219897B2/ja active Active
-
2016
- 2016-09-19 US US15/268,665 patent/US10261497B2/en active Active
- 2016-09-21 DE DE102016117773.3A patent/DE102016117773B4/de active Active
- 2016-09-28 CN CN201610861027.9A patent/CN106557075B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003058218A (ja) * | 2001-06-06 | 2003-02-28 | Fanuc Ltd | サーボモータを駆動制御する制御装置 |
JP2006043836A (ja) * | 2004-08-06 | 2006-02-16 | Mazda Motor Corp | 工作機械の加工条件設定方法、その加工条件設定プログラム、及び、その加工条件設定プログラムを記録した記録媒体 |
US20110010073A1 (en) * | 2008-07-17 | 2011-01-13 | Honeywell International Inc. | Configurable automotive controller |
US20150094846A1 (en) * | 2013-09-27 | 2015-04-02 | Siemens Aktiengesellschaft | Control device with integrated optimizer |
DE102016008994A1 (de) * | 2015-07-30 | 2017-03-09 | Fanuc Corporation | Werkzeugmaschine, simulationsvorrichtung und maschineneinlerngerät |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112019007433B4 (de) | 2019-06-28 | 2023-05-17 | Mitsubishi Electric Corporation | Bearbeitungsbedingung-Sucheinrichtung und Bearbeitungsbedingung-Suchverfahren |
Also Published As
Publication number | Publication date |
---|---|
US10261497B2 (en) | 2019-04-16 |
US20170090459A1 (en) | 2017-03-30 |
JP2017068325A (ja) | 2017-04-06 |
CN106557075B (zh) | 2018-10-02 |
JP6219897B2 (ja) | 2017-10-25 |
CN106557075A (zh) | 2017-04-05 |
DE102016117773A1 (de) | 2017-03-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102016117773B4 (de) | Werkzeugmaschine, die eine optimale Beschleunigung/Verlangsamung erzeugt, Simulationsvorrichtung und Maschinenlernvorrichtung | |
DE102016008994B4 (de) | Werkzeugmaschine, simulationsvorrichtung und maschineneinlerngerät | |
DE102016117560B4 (de) | Werkzeugmaschine zum erzeugen einer geschwindigkeitsverteilung | |
DE102017008475B4 (de) | Maschinenlernvorrichtung, robotersystem und maschinenlernverfahren zum erlernen eines roboter-betriebsprogramms | |
DE102016010064B4 (de) | Numerische Steuerung mit Bearbeitungsbedingungsanpassungsfunktion zum Verringern des Auftretens von Rattern oder Werkzeugverschleiss/-bruch | |
DE102016014264B4 (de) | Maschinelle Lernvorrichtung, Blechpaketherstellungsvorrichtung, Blechpaketherstellungssystem und maschinelles Lernverfahren zum Erlernen des Stapelns von Paketblechen | |
DE102018001893B4 (de) | Reinigungsprozess-Optimierungsvorrichtung und Maschinenlernvorrichtung | |
DE102016009106A1 (de) | Mit Steuerung ausgerüstete Bearbeitungsvorrichtung mit Bearbeitungszeit- Messfunktion und Messfunktion auf der Maschine | |
EP2106576B1 (de) | Verfahren zur rechnergestützten steuerung und/oder regelung eines technischen systems | |
DE102018000342A1 (de) | Numerische steuerung und maschinelle lernvorrichtung | |
DE102018010054A1 (de) | Steuerung und maschinelle Lernvorrichtung | |
DE102018003266B4 (de) | Controller und maschinelle lernvorrichtung | |
DE102018004330B4 (de) | Steuerung und maschinelle Lernvorrichtung | |
DE102019106729A1 (de) | Antriebsvorrichtung und Vorrichtung für maschinelles Lernen | |
DE102018108778A1 (de) | Beschleunigungs- und Verzögerungssteuereinheit | |
DE102019002156A1 (de) | Steuergerät und maschinelle Lernvorrichtung | |
DE102019208262A1 (de) | Verfahren und Vorrichtung zur Ermittlung von Modellparametern für eine Regelungsstrategie eines technischen Systems mithilfe eines Bayes'schen Optimierungsverfahrens | |
DE102019001044A1 (de) | Steuervorrichtung und maschinelle lernvorrichtung | |
DE102019112211A1 (de) | Simulationsvorrichtung | |
DE102018005378A1 (de) | Steuergerät und Lernvorrichtung | |
DE102019113229A1 (de) | Programmierbare Steuerung und Maschinenlernvorrichtung | |
DE102020202350A1 (de) | Verfahren und Vorrichtung zum Unterstützen einer Manöverplanung für ein automatisiert fahrendes Fahrzeug oder einen Roboter | |
DE102020124734A1 (de) | Simulationsgerät | |
WO2020187591A1 (de) | Verfahren und vorrichtung zum ansteuern eines roboters | |
DE102018002423B4 (de) | Robotersteuerung, Vorrichtung für maschinelles Lernen und Verfahren für maschinelles Lernen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R012 | Request for examination validly filed | ||
R016 | Response to examination communication | ||
R018 | Grant decision by examination section/examining division | ||
R020 | Patent grant now final | ||
R082 | Change of representative |
Representative=s name: HL KEMPNER PATENTANWAELTE, SOLICITORS (ENGLAND, DE Representative=s name: HL KEMPNER PATENTANWALT, RECHTSANWALT, SOLICIT, DE |