DE102018002785B4 - 1 - 8CController und maschinelle Lernvorrichtung - Google Patents

1 - 8CController und maschinelle Lernvorrichtung Download PDF

Info

Publication number
DE102018002785B4
DE102018002785B4 DE102018002785.7A DE102018002785A DE102018002785B4 DE 102018002785 B4 DE102018002785 B4 DE 102018002785B4 DE 102018002785 A DE102018002785 A DE 102018002785A DE 102018002785 B4 DE102018002785 B4 DE 102018002785B4
Authority
DE
Germany
Prior art keywords
state
section
bonding
robot
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE102018002785.7A
Other languages
English (en)
Other versions
DE102018002785B8 (de
DE102018002785A1 (de
Inventor
Yuuta Kobayashi
Hideki Otsuki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fanuc Corp
Original Assignee
Fanuc Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fanuc Corp filed Critical Fanuc Corp
Publication of DE102018002785A1 publication Critical patent/DE102018002785A1/de
Application granted granted Critical
Publication of DE102018002785B4 publication Critical patent/DE102018002785B4/de
Publication of DE102018002785B8 publication Critical patent/DE102018002785B8/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/04Programme control other than numerical control, i.e. in sequence controllers or logic controllers
    • G05B19/042Programme control other than numerical control, i.e. in sequence controllers or logic controllers using digital processors
    • G05B19/0423Input/output
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/163Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/005Manipulators for mechanical processing tasks
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L21/00Processes or apparatus adapted for the manufacture or treatment of semiconductor or solid state devices or of parts thereof
    • H01L21/02Manufacture or treatment of semiconductor devices or of parts thereof
    • H01L21/04Manufacture or treatment of semiconductor devices or of parts thereof the devices having potential barriers, e.g. a PN junction, depletion layer or carrier concentration layer
    • H01L21/48Manufacture or treatment of parts, e.g. containers, prior to assembly of the devices, using processes not provided for in a single one of the subgroups H01L21/06 - H01L21/326
    • H01L21/4814Conductive parts
    • H01L21/4871Bases, plates or heatsinks
    • H01L21/4882Assembly of heatsink parts
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/25Pc structure of the system
    • G05B2219/25257Microcontroller
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L23/00Details of semiconductor or other solid state devices
    • H01L23/34Arrangements for cooling, heating, ventilating or temperature compensation ; Temperature sensing arrangements
    • H01L23/40Mountings or securing means for detachable cooling or heating arrangements ; fixed by friction, plugs or springs
    • H01L23/4006Mountings or securing means for detachable cooling or heating arrangements ; fixed by friction, plugs or springs with bolts or screws
    • H01L2023/4037Mountings or securing means for detachable cooling or heating arrangements ; fixed by friction, plugs or springs with bolts or screws characterised by thermal path or place of attachment of heatsink
    • H01L2023/4068Heatconductors between device and heatsink, e.g. compliant heat-spreaders, heat-conducting bands
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S901/00Robots
    • Y10S901/02Arm motion controller
    • Y10S901/03Teaching system
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S901/00Robots
    • Y10S901/30End effector
    • Y10S901/41Tool

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Manufacturing & Machinery (AREA)
  • Condensed Matter Physics & Semiconductors (AREA)
  • Computer Hardware Design (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Power Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Manipulator (AREA)
  • Feedback Control In General (AREA)

Abstract

Controller (10; 40), der einen Roboter (60) steuert, der verwendet wird, um anhand eines Wärmeleiters eine Strahlungsplatte (3) auf ein elektrisches Bauteil (5) zu bonden, wobei der Controller umfasst:eine maschinelle Lernvorrichtung (20; 50), die einen Betriebsparameter für einen Vorgang des Bondens der Strahlungsplatte durch den Roboter (60) erlernt, wobei die maschinelle Lernvorrichtung (20; 50) umfassteinen Abschnitt zum Beobachten von Zuständen (22), der als Zustandsvariablen (S), die einen aktuellen Zustand einer Umgebung ausdrücken, Betriebsparameterdaten, welche die Betriebsparameter angeben, und Wärmeleiterzustandsdaten, die einen Zustand des Wärmeleiters angeben, beobachtet,einen Abschnitt zum Erfassen von Bestimmungsdaten (24), der Bestimmungsdaten (D), die ein Eignungsbestimmungsergebnis des Vorgangs des Bondens der Strahlungsplatte (3) angeben, erfasst, undeinen Lernabschnitt (26), der den Betriebsparameter in Verbindung mit den Wärmeleiterzustandsdaten unter Verwendung der Zustandsvariablen und der Bestimmungsdaten erlernt.

Description

  • Die vorliegende Erfindung betrifft einen Controller und eine maschinelle Lernvorrichtung und insbesondere einen Controller und eine maschinelle Lernvorrichtung, die optimale Betriebsparameter erlernen, um eine Strahlungsplatte durch einen Roboter auf ein elektronisches Element zu bonden.
  • Herkömmlicherweise sind Technologien zur Verwendung eines Roboters, um ein elektrisches Bauteil oder dergleichen auf einem Substrat zu montieren, bekannt (siehe beispielsweise die japanische Patent-Auslegeschrift JP H08 - 112 788 A ). Bei der Montage eines elektrischen Bauteils durch einen Roboter ist ein Werkzeug zum Halten des Bauteils an der Spitze eines Roboterarms angebracht, und das elektrische Bauteil oder dergleichen, das durch das Werkzeug gehalten wird, wird in eine vorgeschriebene Position auf einem Substrat gesetzt und dann daran montiert.
  • Einige elektrische Bauteile, die auf einem Substrat montiert sind, erfordern, dass eine Strahlungsplatte daran angebracht wird. Wenn eine Strahlungsplatte an einem elektrischen Bauteil angebracht wird, wie durch ein Beispiel in 8A bis 8C abgebildet, wird eine Strahlungsplatte 3 an einem elektrischen Bauteil 5 derart angebracht, dass nachdem das elektrische Bauteil 5 an einem Werkzeug montiert wurde, das an der Spitze eines Roboterarms 1 angebracht ist, die Strahlungsplatte 3, die mit einem Wärmeleiter, wie etwa einem Silikonklebstoff an ihrer Oberfläche, die das elektrische Bauteil 5 berührt, beschichtet ist, in eine vorgeschriebene Position über dem elektrischen Bauteil 5 gesetzt wird (8A), mit einer vorgeschriebenen Geschwindigkeit in eine Bondposition bewegt wird, in der die Strahlungsplatte 3 auf das elektronische Element gebondet werden soll (8B), und auf das elektrische Bauteil 5 gepresst wird (8C).
  • Dabei haben die Geschwindigkeit, mit der die Strahlungsplatte 3 in die Bondposition, in der die Strahlungsplatte 3 mit dem elektrischen Bauteil 5 gebondet werden soll, bewegt wird, und der Pressdruck und die Presszeit, mit denen die Strahlungsplatte 3 auf das elektrische Bauteil 5 gepresst wird, einen Einfluss auf den Bereich und die Schichtdicke eines Wärmeleiters zwischen der gebondeten Strahlungsplatte 3 und dem elektrischen Bauteil 5. Wenn herkömmlicherweise eine Strahlungsplatte durch einen Roboter automatisch auf ein elektrisches Bauteil gebondet wird, bringt ein Bediener dem Roboter die Bewegung zum Bonden der Strahlungsplatte im Voraus bei und führt einen Bondvorgang aus und verwaltet dabei die Schichtdicke eines Wärmeleiters zwischen der Strahlungsplatte und dem elektrischen Bauteil.
  • Wenn bewirkt wird, dass ein Roboter eine Strahlungsplatte durch Einlernen automatisch auf ein elektrisches Bauteil bondet, führt ein Bediener das Einlernen derart aus, dass der Vorgang des Roboters optimiert wird, um die Zykluszeit weiter zu verkürzen. In dem Zustand aus 8A nimmt die Zykluszeit zu, wenn die Strahlungsplatte 3 in eine Position gesetzt wird, die von dem elektrischen Bauteil 5 entfernt ist. Andererseits verkürzt sich die Zykluszeit, wenn die Strahlungsplatte 3 in eine Position gesetzt wird, die nahe an dem elektrischen Bauteil 5 ist, doch kann es sein, dass die Geschwindigkeit, mit der die Strahlungsplatte 3 in die Bondposition bewegt wird, die vorgeschriebene Geschwindigkeit nicht erreicht.
  • Wenn ferner die Geschwindigkeit, mit der die Strahlungsplatte 3 in die Bondposition bewegt wird, in dem Zustand aus 8B hoch eingestellt wird, um die Zykluszeit zu verkürzen, ist es wahrscheinlich, dass der Wärmeleiter 4 springt, wenn er mit dem elektrischen Bauteil 5 zusammenstößt, oder dass das elektrische Bauteil 5 auf Grund eines Aufpralls bei dem Zusammenstoß beschädigt wird.
  • Des Weiteren kann es sein, dass in dem Zustand aus 8C das elektrische Bauteil 5 oder das Substrat beschädigt werden, wenn der Druck, mit dem die Strahlungsplatte auf das elektrische Bauteil 5 gepresst wird, zu hoch eingestellt ist. Andererseits kann es sein, dass die Strahlungsplatte 3 nicht gut genug auf das elektrische Bauteil 5 gebondet wird oder dass keine geeignete Schichtdicke bewahrt werden kann, wenn der Druck, mit dem die Strahlungsplatte 3 auf das elektrische Bauteil 5 gepresst wird, niedrig eingestellt wird, oder wenn die Zeit, in der die Strahlungsplatte 3 auf das elektrische Bauteil 5 gepresst wird, verkürzt wird.
  • Wie zuvor beschrieben, führt die Bestimmung der Betriebsparameter zum automatischen Bonden einer Strahlungsplatte auf ein elektrisches Bauteil zu einer gewissen Zykluszeit oder Qualität eines Produkts. Geeignete Betriebsparameter ändern sich jedoch je nach einer Art eines Wärmeleiters (bezüglich der Viskosität des Wärmeleiters), einer Beschichtungsmenge, der Temperatur, der Feuchtigkeit des Wärmeleiters (die Einfluss auf die Viskosität des Wärmeleiters hat), einer Art eines Substrats oder eines elektrischen Bauteils (bezüglich der Festigkeit des Substrats oder des elektrischen Bauteils) oder dergleichen. Daher muss ein Bediener die Betriebsparameter durch Ausprobieren bestimmen. Dadurch wird die Bestimmung der Betriebsparameter zu einer enormen Belastung für den Bediener.
  • Weiterer Stand der Technik ist aus den Druckschriften DE 10 2016 011 402 A1 , DE 10 2016 010 048 A1 , DE 10 2016 009 030 A1 , EP 3 119 176 A1 , JP 2007 - 019 337 A und JP H10 - 321 653 A bekannt.
  • Angesichts des obigen Problems besteht eine Aufgabe der vorliegenden Erfindung darin, einen Controller und eine maschinelle Lernvorrichtung bereitzustellen, die in der Lage sind, optimale Betriebsparameter zum Bonden einer Strahlungsplatte auf ein elektronisches Element durch einen Roboter zu bestimmen.
  • Die Aufgabe wird erfindungsgemäß durch einen Controller und eine maschinelle Lernvorrichtung gemäß den unabhängigen Ansprüchen gelöst. Bevorzugte Ausführungsformen sind in den abhängigen Ansprüchen genannt.
  • Ein Controller gemäß der vorliegenden Erfindung erhebt Daten, wie etwa die Schichtdicke eines Wärmeleiters und die Zykluszeit, die durch das Ausführen des Vorgangs des Bondens einer Strahlungsplatte auf ein elektrisches Bauteil erzielt wird, während er die Betriebsparameter (Befehlsposition, Armgeschwindigkeit, Pressdruck und Presszeit) eines Roboters zufällig ändert, und führt ein maschinelles Lernen unter Verwendung der erhobenen Daten als Lehrerdaten aus. Dadurch ermöglicht es der Controller, Betriebsparameter abzuleiten, mit denen ein Produkt, dessen Wärmeleiter eine geeignete Schichtdicke aufweist, in einer kurzen Betriebszeit erzielt wird.
  • Ein Controller gemäß einer Ausführungsform der vorliegenden Erfindung steuert einen Roboter, der verwendet wird, um eine Strahlungsplatte anhand eines Wärmeleiters auf ein elektrisches Bauteil zu bonden. Der Controller umfasst eine maschinelle Lernvorrichtung, die einen Betriebsparameter für einen Vorgang des Bondens der Strahlungsplatte durch den Roboter erlernt. Die maschinelle Lernvorrichtung umfasst einen Abschnitt zum Beobachten von Zuständen, der als Zustandsvariablen, die einen aktuellen Zustand einer Umgebung ausdrücken, Betriebsparameterdaten, welche die Betriebsparameter angeben, und Wärmeleiterzustandsdaten, die einen Zustand des Wärmeleiters angeben, beobachtet, einen Abschnitt zum Erfassen von Bestimmungsdaten, der Bestimmungsdaten, die ein Eignungsbestimmungsergebnis des Vorgangs des Bondens der Strahlungsplatte angeben, erfasst, und einen Lernabschnitt, der den Betriebsparameter in Verbindung mit den Wärmeleiterzustandsdaten unter Verwendung der Zustandsvariablen und der Bestimmungsdaten erlernt.
  • Der Abschnitt zum Beobachten von Zuständen kann ferner als die Zustandsvariable mindestens eine von einer Information über die Art eines elektrischen Bauteils, um eine Art des elektrischen Bauteils zu identifizieren, und einer Information über die Art eines Substrats, um eine Art eines Substrats zu identifizieren, an dem das elektrische Bauteil angebracht ist, beobachten, und der Lernabschnitt kann den Betriebsparameter in Verbindung mit einer von der Information über die Art eines elektrischen Bauteils und der Information über die Art eines Substrats zusätzlich zu den Wärmeleiterzustandsdaten erlernen.
  • Der Lernabschnitt kann einen Abschnitt zum Berechnen einer Belohnung, der eine Belohnung bezüglich des Eignungsbestimmungsergebnisses berechnet, und einen Abschnitt zum Aktualisieren einer Wertfunktion, die unter Verwendung der Belohnung eine Funktion aktualisiert, die einen Wert des Betriebsparameters in Bezug auf den Zustand des Wärmeleiters ausdrückt, umfassen.
  • Der Lernabschnitt kann die Zustandsvariablen und die Bestimmungsdaten in einer Struktur aus mehreren Ebenen berechnen.
  • Der Controller kann ferner einen Entscheidungsfindungsabschnitt umfassen, der einen Befehlswert basierend auf dem Betriebsparameter gemäß einem Lernergebnis des Lernabschnitts ausgibt.
  • Der Lernabschnitt kann den Betriebsparameter in jedem von einer Vielzahl von Robotern unter Verwendung der Zustandsvariablen und der Bestimmungsdaten, die für jeden der Vielzahl von Robotern erhalten werden, erlernen.
  • Die maschinelle Lernvorrichtung kann in einem von einem Cloud-Server und einer Steuerzelle existieren.
  • Eine maschinelle Lernvorrichtung gemäß einer anderen Ausführungsform der vorliegenden Erfindung erlernt einen Betriebsparameter für einen Vorgang des Bondens einer Strahlungsplatte durch einen Roboter, der verwendet wird, um die Strahlungsplatte anhand eines Wärmeleiters auf ein elektrisches Bauteil zu bonden. Die maschinelle Lernvorrichtung umfasst: einen Abschnitt zum Beobachten von Zuständen, der als Zustandsvariablen, die einen aktuellen Zustand einer Umgebung ausdrücken, Betriebsparameterdaten, welche die Betriebsparameter angeben, und Wärmeleiterzustandsdaten, die einen Zustand des Wärmeleiters angeben, beobachtet; einen Abschnitt zum Erfassen von Bestimmungsdaten, der Bestimmungsdaten erfasst, die ein Eignungsbestimmungsergebnis des Vorgangs des Bondens der Strahlungsplatte angeben; und einen Lernabschnitt, der den Betriebsparameter in Verbindung mit den Wärmeleiterzustandsdaten unter Verwendung der Zustandsvariablen und der Bestimmungsdaten erlernt.
  • Gemäß einer Ausführungsform der vorliegenden Erfindung ist es möglich, die Zykluszeit für das automatische Bonden zu verkürzen und dabei eine geeignete Schichtdicke zu bewahren, ohne auf Arbeitskraft zurückzugreifen und ohne durch den Zustand eines Wärmeleiters oder einer Umgebung beeinflusst zu werden.
  • Die Zeichnungen zeigen:
    • 1 ein schematisches Funktionsblockdiagramm eines Controllers gemäß einer ersten Ausführungsform der vorliegenden Erfindung;
    • 2 ein schematisches Funktionsblockdiagramm, das eine Ausführungsform des Controllers zeigt;
    • 3 ein schematisches Ablaufschema, das eine Ausführungsform eines maschinellen Lernverfahrens zeigt;
    • 4A ein Diagramm zum Beschreiben eines Neurons;
    • 4B ein Diagramm zum Beschreiben eines neuronalen Netzwerks;
    • 5 ein schematische Funktionsblockdiagramm eines Controllers gemäß einer zweiten Ausführungsform der vorliegenden Erfindung;
    • 6 ein schematisches Funktionsblockdiagramm, das eine Ausführungsform eines Bauteilmontagesystems zeigt;
    • 7 ein schematisches Funktionsblockdiagramm, das eine andere Ausführungsform eines Bauteilmontagesystems zeigt; und
    • 8A bis 8C Diagramme zum Beschreiben des Vorgangs des Bondens einer Strahlungsplatte auf ein elektrisches Bauteil durch einen Roboter gemäß einer verwandten Technik.
  • 1 ist ein schematisches Funktionsblockdiagramm eines Controllers 10 gemäß einer ersten Ausführungsform.
  • Der Controller 10 kann beispielsweise als ein Controller montiert werden, der einen (nicht gezeigten) Roboter zum Bonden einer Strahlungsplatte auf ein elektrisches Bauteil, das an einem Substrat angebracht ist, steuert. Der Controller 10 umfasst eine maschinelle Lernvorrichtung 20, die über Software (wie etwa einen Lernalgorithmus) und Hardware (wie etwa die CPU eines Computers) zum spontanen Erlernen von Betriebsparametern (wie etwa Befehlsposition, Armgeschwindigkeit, Pressdruck und Presszeit) für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter durch so genanntes maschinelles Lernen verfügt. Die Betriebsparameter, die durch die maschinelle Lernvorrichtung 20 des Controllers 10 erlernt werden, entsprechen einer Modellstruktur, welche die Korrelation zwischen dem Zustand eines Wärmeleiters, der bei dem Bonden einer Strahlungsplatte verwendet wird, und den Betriebsparametern für den Vorgang des Bondens der Strahlungsplatte durch einen Roboter in dem Zustand ausdrückt.
  • Wie in dem Funktionsblock aus 1 gezeigt, umfasst die maschinelle Lernvorrichtung 20 des Controllers 10 einen Abschnitt 22 zum Beobachten von Zuständen, einen Abschnitt 24 zum Erfassen von Bestimmungsdaten und einen Lernabschnitt 26. Der Abschnitt 22 zum Beobachten von Zuständen beobachtet die Zustandsvariablen S, die den aktuellen Zustand einer Umgebung ausdrücken und die Betriebsparameterdaten S1, die Betriebsparameter angeben, die mit Bezug auf den Zustand eines Wärmeleiters, der bei dem Bonden einer Strahlungsplatte verwendet wird, eingestellt werden, und die Wärmeleiterzustandsdaten S2, die den Zustand des Wärmeleiters, der beim Bonden der Strahlungsplatte verwendet wird, angeben, umfassen. Der Abschnitt 24 zum Erfassen von Bestimmungsdaten erfasst die Bestimmungsdaten D, die ein Eignungsbestimmungsergebnis des Vorgangs des Bondens einer Strahlungsplatte durch einen Roboter mit den eingestellten Betriebsparametern angeben. Unter Verwendung der Zustandsvariablen S und der Bestimmungsdaten D erlernt der Lernabschnitt 26 die Betriebsparameterdaten S1 und die Wärmeleiterzustandsdaten S2 in Verbindung miteinander.
  • Der Abschnitt 22 zum Beobachten von Zuständen kann beispielsweise als eine der Funktionen der CPU eines Computers oder als Software zum Betätigen der CPU des Computers konfiguriert sein. Aus den Zustandsvariablen S, die durch den Abschnitt 22 zum Beobachten von Zuständen beobachtet werden, können die Betriebsparameterdaten S1 beispielsweise aus Meldedaten über Betriebsparameter, die durch einen erfahrenen Arbeiter gemeldet werden und an den Controller 10 gegeben werden, aus Protokolldaten über den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter, die von dem Roboter oder dem Controller des Roboters erfasst werden, oder dergleichen erfasst werden. Als Betriebsparameterdaten S1 können beispielsweise eine Befehlsposition, die eine Position angibt, in welcher der Vorgang des Bondens einer Strahlungsplatte beginnt, die Armgeschwindigkeit bei dem Bondvorgang, der Pressdruck und die Presszeit der Strahlungsplatte mit Bezug auf ein elektrisches Bauteil bei dem Bondvorgang oder dergleichen verwendet werden.
  • Zudem können als Wärmeleiterzustandsdaten S2 aus den Zustandsvariablen S beispielsweise Werte, die durch diverse (nicht gezeigte) Sensoren, wie etwa einen Temperatursensor und einen Feuchtigkeitssensor, die an einem Roboter angebracht sind, tatsächlich gemessen werden, Sollwerte, die von diversen Robotern, die in einem System verwendet werden, das ein elektrisches Bauteil oder dergleichen auf einem Substrat montiert, oder von den Controllern der Roboter oder dergleichen erfasst werden, verwendet werden. Als Wärmeleiterzustandsdaten S2 können beispielsweise eine Beschichtungsmenge eines Wärmeleiters (die aus einem Sollwert eines Klebegeräts erfasst wird, das den Wärmeleiter auf eine Strahlungsplatte oder dergleichen aufträgt), eine Art des Wärmeleiters (die aus einem Sollwert des Bondgeräts erfasst wird, das den Wärmeleiter auf die Strahlungsplatte oder dergleichen aufträgt), die Temperatur (die von einem Temperatursensor erfasst wird) oder die Feuchtigkeit (die von einem Feuchtigkeitssensor erfasst wird) einer Umgebung, in der ein elektrisches Bauteil oder dergleichen auf ein Substrat oder dergleichen montiert wird, verwendet werden.
  • Der Abschnitt 24 zum Erfassen von Bestimmungsdaten kann beispielsweise als eine der Funktionen der CPU eines Computers oder als Software zum Betätigen der CPU des Computers konfiguriert sein. Als Bestimmungsdaten D, die durch den Abschnitt 24 zum Erfassen von Bestimmungsdaten erfasst werden, können beispielsweise ein Wert, der durch eine (nicht gezeigte) erste Messvorrichtung, die an einem Roboter angebracht ist, tatsächlich gemessen wird, nachdem der Vorgang des Bondens einer Strahlungsplatte durch den Roboter ausgeführt wurde, ein Wert, der von einem Roboter oder einem Controller, der den Roboter steuert, erfasst wird, oder dergleichen verwendet werden. Als Bestimmungsdaten D können beispielsweise die Dicke eines Wärmeleiters zwischen einer gebondeten Strahlungsplatte und einem elektrischen Bauteil, die Zykluszeit für einen Bondvorgang durch einen Roboter oder dergleichen verwendet werden. Die Bestimmungsdaten D sind ein Index, der ein Ergebnis ausdrückt, das erzielt wird, wenn der Vorgang des Bondens einer Strahlungsplatte durch einen Roboter mit den Zustandsvariablen S ausgeführt wird, und den Zustand des Bondvorgangs indirekt ausdrückt.
  • Die erste Messvorrichtung ist eine Messvorrichtung, die verwendet wird, um die Dicke eines Wärmeleiters zwischen einer gebondeten Strahlungsplatte und einem elektrischen Bauteil zu messen. Die erste Messvorrichtung misst beispielsweise die Höhe des oberen Endes einer Strahlungsplatte, die auf einem elektrischen Bauteil positioniert ist, gegenüber einer Referenzposition. In diesem Fall wird die Höhe der Strahlungsplatte ohne den Wärmeleiter, der auf das elektrische Bauteil gelegt wird, gemessen und im Voraus als Referenzwert gespeichert, und der Referenzwert wird von einem Wert subtrahiert, der durch die erste Messvorrichtung nach einem Bondvorgang durch einen Roboter gemessen wird. Somit kann die Dicke des Wärmeleiters zwischen der gebondeten Strahlungsplatte und dem elektrischen Bauteil gemessen werden. Die Berechnung kann beispielsweise durch den Controller 10 oder den Abschnitt 22 zum Beobachten von Zuständen selber erfolgen. Die erste Messvorrichtung kann in einer beliebigen Position eines Systems, das ein elektrisches Bauteil montiert, befestigt sein oder kann an dem Arm eines Roboters angebracht sein. Als erste Messvorrichtung kann eine optische Bildgebungsvorrichtung, ein Infrarotlaser, eine Ultraschall-Messvorrichtung oder dergleichen verwendet werden.
  • Wie zuvor beschrieben werden, während die maschinelle Lernvorrichtung 20 des Controllers 10 das maschinelle Lernen fortführt, die Erfassung der Wärmeleiterzustandsdaten S2 von einem Sensor oder dergleichen, der Vorgang des Bondens einer Strahlungsplatte durch einen Roboter und die Erfassung der Bestimmungsdaten D von der ersten Messvorrichtung oder dergleichen in einer Umgebung ausgeführt.
  • Der Lernabschnitt 26 kann beispielsweise als eine der Funktionen der CPU eines Computers oder als Software zum Betätigen der CPU des Computers konfiguriert sein. Gemäß einem beliebigen Lernalgorithmus, der insgesamt als maschinelles Lernen bezeichnet wird, erlernt der Lernabschnitt 26 die Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter. Der Lernabschnitt 26 kann das Lernen basierend auf einem Datensatz, der die obigen Zustandsvariablen S und die Bestimmungsdaten D mit Bezug auf den Vorgang des Bondens einer Vielzahl von Strahlungsplatten durch einen Roboter umfasst, wiederholt ausführen. Wenn ein Lernzyklus mit Bezug auf den Vorgang des Bondens einer Vielzahl von Strahlungsplatten durch einen Roboter wiederholt ausgeführt wird, wird vorausgesetzt, dass die Betriebsparameterdaten S1 aus den Zustandsvariablen S Betriebsparameter angeben, die bis zum vorherigen Lernzyklus erzielt wurden, und dass die Bestimmungsdaten D ein Eignungsbestimmungsergebnis mit Bezug auf den Vorgang des Bondens der Strahlungsplatten durch den Roboter basierend auf den bestimmten Betriebsparametern angeben.
  • Dadurch dass ein derartiger Lernzyklus wiederholt ausgeführt wird, kann der Lernabschnitt 26 ein Merkmal, das die Korrelation zwischen dem Zustand eines Wärmeleiters (Wärmeleiterzustandsdaten S2) und den Betriebsparametern für den Vorgang des Bondens einer Heizplatte durch einen Roboter angibt, automatisch identifizieren. Obwohl die Korrelation zwischen den Wärmeleiterzustandsdaten S2 und den Betriebsparametern zu Beginn eines Lernalgorithmus im Wesentlichen unbekannt ist, identifiziert der Lernabschnitt 26 allmählich ein Merkmal, das die Korrelation angibt und die Korrelation interpretiert, wenn das Lernen fortschreitet. Wenn die Korrelation zwischen den Wärmeleiterzustandsdaten S2 und den Betriebsparametern einigermaßen zuverlässig interpretiert wird, können Lernergebnisse, die durch den Lernabschnitt 26 wiederholt ausgegeben werden, verwendet werden, um die Aktion (d.h. die Entscheidungsfindung) des Bestimmens, unter welchen Betriebsparametern der Vorgang des Aufnehmens einer Strahlungsplatte mit Bezug auf einen aktuellen Zustand (d.h. den Zustand eines Wärmeleiters) erfolgt, auszuwählen. D.h. wenn ein Lernalgorithmus fortschreitet, kann der Lernabschnitt 26 die Korrelation zwischen dem Zustand eines Wärmeleiters und der Aktion des Bestimmens, unter welchen Betriebsparametern der Vorgang des Aufnehmens einer Strahlungsplatte mit Bezug auf den Zustand einer optimalen Situation erfolgt, allmählich nähern.
  • Wie zuvor beschrieben, erlernt in der maschinellen Lernvorrichtung 20 des Controllers 10 der Lernabschnitt 26 die Betriebsparameter zum Bonden einer Strahlungsplatte auf ein elektrisches Bauteil durch einen Roboter gemäß einem maschinellen Lernalgorithmus unter Verwendung der Zustandsvariablen S, die durch den Abschnitt 22 zum Beobachten von Zuständen beobachtet werden, und der Bestimmungsdaten D, die durch den Abschnitt 24 zum Erfassen von Bestimmungsdaten erfasst werden. Die Zustandsvariablen S bestehen aus den Betriebsparameterdaten S1 und den Wärmeleiterzustandsdaten S2, die kaum durch Störungen beeinflusst werden. Zudem werden die Bestimmungsdaten D durch die Erfassung der Zykluszeit für den Vorgang des Bondens einer Heizplatte durch einen Roboter oder der Schichtdicke eines Wärmeleiters zwischen einer Strahlungsplatte und einem elektrischen Bauteil nach dem Bondvorgang einzigartig berechnet. Die Wärmeleiterzustandsdaten S2 sind beispielsweise von der Messgenauigkeit jedes Teils einer Maschine, wie von der Leistung eines Temperatursensors oder eines Feuchtigkeitssensors, abhängig, doch die Beobachtung der Wärmeleiterzustandsdaten S2, die selber hoch genau ist, wird erwartet. Zudem sind die Bestimmungsdaten D von der Messgenauigkeit der ersten Messvorrichtung abhängig, und die Erfassung der Bestimmungsdaten D, die hoch genau sind, wird erwartet. Entsprechend kann unter Verwendung der Lernergebnisse des Lernabschnitts 26 die maschinelle Lernvorrichtung 20 des Controllers 10 die Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter gemäß dem Zustand eines Wärmeleiters automatisch und genau berechnen, ohne auf eine Berechnung oder Bestimmung zurückzugreifen.
  • Wenn es möglich ist, die Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter automatisch zu berechnen, ohne auf eine Berechnung oder Schätzung zurückzugreifen, können geeignete Betriebsparameter zum Bonden der Strahlungsplatte durch den Roboter nur durch das Verständnis des Zustands eines Wärmeleiters (Wärmeleiterzustandsdaten S2), bevor der Vorgang des Bondens der Strahlungsplatte durch den Roboter beginnt, schnell bestimmt werden. Entsprechend kann der Vorgang des Bondens einer Strahlungsplatte durch einen Roboter effizient ausgeführt werden.
  • Als geändertes Beispiel der maschinellen Lernvorrichtung 20 des Controllers 10 kann der Abschnitt 22 zum Beobachten von Zuständen ferner als Zustandsvariablen S eine Information S3 über die Art eines elektrischen Bauteils und eine Information S4 über die Art eines Substrats zusätzlich zu den Betriebsparameterdaten S1 und den Wärmeleiterzustandsdaten S2 beobachten. Die Information S3 über die Art eines elektrischen Bauteils kann beispielsweise eine Form, Festigkeit oder dergleichen eines elektrischen Bauteils umfassen. Zudem kann die Information S4 über die Art eines Substrats die Festigkeit oder dergleichen eines Substrats umfassen. Der Abschnitt 22 zum Beobachten von Zuständen kann die Information S3 über die Art eines elektrischen Bauteils und die Information S4 über die Art eines Substrats beispielsweise aus Informationen über ein elektrisches Bauteil und ein Substrat, die im Voraus in dem Controller 10 eingestellt sind, erfassen. In diesem Fall können die Betriebsparameter in Verbindung mit mindestens einer von der Information S3 über die Art eines elektrischen Bauteils und der Information S4 über die Art eines Substrats zusätzlich zu den Wärmeleiterzustandsdaten S2 erlernt werden.
  • Gemäß dem obigen geänderten Beispiel kann die maschinelle Lernvorrichtung 20 Betriebsparameter für den Fall erlernen, dass der Vorgang des Bondens einer Strahlungsplatte durch einen Roboter an einem elektrischen Bauteil, das an einer spezifischen Art eines Substrats angebracht ist, ausgeführt wird oder an einer spezifischen Art eines elektrischen Bauteils ausgeführt wird. Wenn beispielsweise die Festigkeiten, Formen oder dergleichen von zwei Arten von zu bondenden elektrischen Bauteilen (Information S3 über die Art eines elektrischen Bauteils) unterschiedlich sind, selbst wenn der Zustand eines Wärmeleiters (Wärmeleiterzustandsdaten S2) im Wesentlichen der gleiche ist, könnte es vorkommen, dass sich die Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte auf den elektrischen Bauteilen geringfügig ändern. Selbst in einer derartigen Situation ermöglicht es die obige Konfiguration jedoch, die Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte gemäß den Festigkeiten, Formen oder dergleichen der elektrischen Bauteile zu optimieren (Information S3 über die Art eines elektrischen Bauteils). Alternativ könnte es vorkommen, dass die Korrelation zwischen dem Zustand eines Wärmeleiters (Wärmeleiterzustandsdaten S2) und einer Art eines elektrischen Bauteils (Information S3 über die Art eines elektrischen Bauteils) oder einer Art eines Substrats (Information S4 über die Art eines Substrats) herauszufinden ist, wenn das Lernen fortschreitet. Da in diesem Fall die Wärmeleiterzustandsdaten S2 aus der Information S3 über die Art eines elektrischen Bauteils oder der Information S4 über die Art eines Substrats einigermaßen vorhergesagt werden können, können die Betriebsparameter, um das Lernen geeignet fertigzustellen und einen Artikel aufzunehmen, optimiert werden, selbst für den Fall, dass die Messgenauigkeit des Zustands eines Wärmeleiters gering ist.
  • Als anderes geändertes Beispiel der maschinellen Lernvorrichtung 20 des Controllers 10 kann der Lernabschnitt 26 die Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch Roboter unter Verwendung der Zustandsvariablen S und der Bestimmungsdaten D, die für jeden der Vielzahl von Robotern erfasst werden, welche die gleiche Konfiguration aufweisen, erlernen. Gemäß der Konfiguration ist es möglich, eine Menge eines Datensatzes, der die Zustandsvariablen S und die Bestimmungsdaten D umfasst, die in einem gewissen Zeitraum erfasst werden, zu erhöhen. Daher können die Lerngeschwindigkeit und die Zuverlässigkeit der Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter mit einem Satz von mehreren diversen Datensätzen als Eingaben verbessert werden.
  • In der maschinellen Lernvorrichtung 20, welche die obige Konfiguration aufweist, ist ein Lernalgorithmus, der durch den Lernabschnitt 26 ausgeführt wird, nicht besonders eingeschränkt, und ein Lernalgorithmus, der als maschinelles Lernen bezeichnet wird, kann verwendet werden. 2 zeigt als Ausführungsform des in 1 gezeigten Controllers 10 eine Konfiguration, die den Lernabschnitt 26 umfasst, der Verstärkungslernen als Beispiel eines Lernalgorithmus ausführt.
  • Beim Verstärkungslernen wird ein Zyklus, der darin besteht, den aktuellen Zustand (d.h. eine Eingabe) einer Umgebung, in der ein Lernziel existiert, zu beobachten und eine vorgeschriebene Aktion (d.h. eine Ausgabe) in dem aktuellen Zustand auszuführen, und das Erteilen einer beliebigen Belohnung für die Aktion wird durch Ausprobieren wiederholt ausgeführt, um Maßnahmen (Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter in der maschinellen Lernvorrichtung der vorliegenden Anmeldung) zu erlernen, um die Summe aller Belohnungen als optimale Lösung zu maximieren.
  • In der maschinellen Lernvorrichtung 20 des in 2 gezeigten Controllers 10 umfasst der Lernabschnitt 26 einen Abschnitt 28 zum Berechnen einer Belohnung, der eine Belohnung R bezüglich eines Eignungsbestimmungsergebnisses (das den Bestimmungsdaten D entspricht, die in dem nächsten Lernzyklus verwendet werden) des Vorgangs des Bondens einer Strahlungsplatte durch einen Roboter basierend auf den Zustandsvariablen S berechnet, und umfasst einen Abschnitt 30 zum Aktualisieren einer Wertfunktion, der unter Verwendung der berechneten Belohnungen R eine Funktion Q aktualisiert, welche die Werte der Betriebsparameter für den Vorgang des Bondens der Strahlungsplatte durch den Roboter ausdrückt. Der Lernabschnitt 26 erlernt die Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter mit Bezug auf den Zustand eines Wärmeleiters derart, dass der Abschnitt 30 zum Aktualisieren einer Wertfunktion die Funktion Q wiederholt aktualisiert.
  • Es wird ein Beispiel eines Verstärkungslernalgorithmus, der durch den Lernabschnitt 26 ausgeführt wird, beschrieben. Der Algorithmus bei diesem Beispiel wird als Q-Lernen bezeichnet und drückt ein Verfahren aus, bei dem ein Zustand s eines Aktionssubjekts und eine Aktion a, die möglicherweise durch das Aktionssubjekt in dem Zustand s vorgenommen wird, als unabhängige Variablen vorausgesetzt werden, und eine Funktion Q(s, a), die einen Aktionswert ausdrückt, wenn die Aktion a in dem Zustand s ausgewählt wird, erlernt wird. Die Auswahl der Aktion a, durch welche die Wertfunktion Q in dem Zustand s maximal wird, ergibt eine optimale Lösung. Dadurch dass das Q-Lernen in einem Zustand beginnt, in dem die Korrelation zwischen dem Zustand s und der Aktion a unbekannt ist, und die Auswahl diverser Aktionen a durch Ausprobieren in einem beliebigen Zustand s wiederholt ausgeführt wird, wird die Wertfunktion Q wiederholt aktualisiert, um einer optimalen Lösung genähert zu werden. Wenn sich dabei eine Umgebung (d.h. der Zustand s) ändert, wenn die Aktion a in dem Zustand s ausgewählt wird, wird eine Belohnung r (d.h. eine Gewichtung der Aktion a) gemäß der Änderung erzielt, und das Lernen wird angeleitet, eine Aktion a auszuwählen, durch die eine höhere Belohnung r erzielt wird. Somit kann die Wertfunktion Q in einem relativ kurzen Zeitraum einer optimalen Lösung genähert werden.
  • Im Allgemeinen kann die Aktualisierungsformel der Wertfunktion Q wie die folgende Formel (1) ausgedrückt werden. In der Formel (1) drücken st und at jeweils einen Zustand und eine Aktion zu einem Zeitpunkt t aus, und der Zustand ändert sich auf st+1 mit der Aktion at. rt+1 drückt eine Belohnung aus, die erzielt wird, wenn sich der Zustand von st auf st+1 ändert. Der Term maxQ drückt Q für den Fall aus, dass eine Aktion a, durch welche die Wertfunktion Q zu dem Zeitpunkt t+1 maximal wird (die zu dem Zeitpunkt t vorausgesetzt wird), ausgeführt wird. α und γ drücken jeweils einen Lernkoeffizienten und eine Ermäßigungsrate aus, und werden willkürlich eingestellt, um jeweils in 0 < α ≤ 1 und 0 < γ ≤ 1 zu fallen. Q ( s t , a t ) Q ( s t , a t ) + α ( r t + 1 + γ max a Q ( s t + 1 , a ) Q ( s t , a t ) )
    Figure DE102018002785B4_0001
  • Wenn der Lernabschnitt 26 das Q-Lernen ausführt, entsprechen die Zustandsvariablen S, die durch den Abschnitt 22 zum Beobachten von Zuständen beobachtet werden, und die Bestimmungsdaten D, die durch den Abschnitt 24 zum Erfassen von Bestimmungsdaten erfasst werden, dem Zustand s in der Aktualisierungsformel (der obigen Formel (1)), die Aktion des Änderns der Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter mit Bezug auf einen aktuellen Zustand (d.h. den Zustand eines Wärmeleiters) entspricht der Aktion a in der Aktualisierungsformel, und die Belohnungen R, die durch den Abschnitt 28 zum Berechnen einer Belohnung berechnet werden, entsprechen der Belohnung r in der Aktualisierungsformel. Entsprechend aktualisiert der Abschnitt 30 zum Aktualisieren einer Wertfunktion die Funktion Q, welche die Werte der Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter in einem aktuellen Zustand durch das Q-Lernen unter Verwendung der Belohnungen R ausdrückt.
  • Bezüglich der Belohnungen R, die durch den Abschnitt 28 zum Berechnen einer Belohnung berechnet werden, beispielsweise wenn der Vorgang des Bondens der Strahlungsplatte durch einen Roboter basierend auf Betriebsparametern nach der Bestimmung der Betriebsparameter für den Vorgang des Bondens der Strahlungsplatte durch den Roboter ausgeführt wird,
    • (i) falls der Zustand des Vorgangs des Bondens einer Strahlungsplatte als „geeignet“ bestimmt wird (beispielsweise für den Fall, dass die Zykluszeit in einen zulässigen Bereich fällt, den Fall, dass die Schichtdicke eines Wärmeleiters zwischen der Strahlungsplatte und einem elektrischen Bauteil in einen zulässigen Bereich fällt, oder dergleichen), dann können die Belohnungen R positiv sein,
    • (ii) falls dagegen der Zustand des Vorgangs des Bondens einer Strahlungsplatte als „ungeeignet“ bestimmt wird (beispielsweise für den Fall, dass die Zykluszeit über einen zulässigen Bereich hinausgeht, den Fall, dass die Schichtdicke eines Wärmeleiters zwischen der Strahlungsplatte und einem elektrischen Bauteil über einen zulässigen Bereich hinausgeht, oder dergleichen), dann können die Belohnungen negativ sein.
  • Die absoluten Werte der positiven und negativen Belohnungen R können gleich oder unterschiedlich sein. Zudem können als Bestimmungsbedingungen eine Vielzahl von Werten, die in den Bestimmungsdaten D enthalten sind, kombiniert werden, um eine Bestimmung auszuführen.
  • Zudem kann ein Eignungsbestimmungsergebnis des Zustands des Vorgangs des Bondens einer Strahlungsplatte durch einen Roboter nicht nur zwei Stufen von „geeigneten“ und „ungeeigneten“ Ergebnissen sondern auch eine Vielzahl von Ergebnisstufen umfassen. Wenn als ein Beispiel ein Höchstwert in einem zulässigen Bereich als Zeitpunkt für den Vorgang des Bondens einer Strahlungsplatte als Tmax vorausgesetzt wird, wird die Belohnung R = 5 erteilt, falls der Zeitpunkt T des Vorgangs des Bondens der Strahlungsplatte in 0 ≤ T < Tmax/5 fällt, die Belohnung R = 2 wird erteilt, falls der Zeitpunkt T des Vorgangs des Bondens der Strahlungsplatte in Tmax/5 ≤ T < Tmax/2 fällt, und die Belohnung R = 1 wird erteilt, falls der Zeitpunkt T des Vorgangs des Bondens der Strahlungsplatte in Tmax/2 ≤ T ≤ Tmax fällt. Zudem kann Tmax eingestellt werden, um im anfänglichen Stadium des Lernens relativ größer zu sein, und kann eingestellt zu werden, um sich zu verringern, wenn das Lernen fortschreitet.
  • Der Abschnitt 30 zum Aktualisieren einer Wertfunktion kann eine Aktionswerttabelle aufweisen, in der die Zustandsvariablen S, die Bestimmungsdaten D und die Belohnungen R in Verbindung mit Aktionswerten (beispielsweise Zahlenwerten), die durch die Funktion Q ausgedrückt werden, organisiert sind. In diesem Fall ist die Aktion des Aktualisierens der Funktion Q mit dem Abschnitt 30 zum Aktualisieren einer Wertfunktion gleichwertig mit der Aktion des Aktualisierens der Aktionswerttabelle mit dem Abschnitt 30 zum Aktualisieren einer Wertfunktion. Zu Beginn des Q-Lernens ist die Korrelation zwischen dem aktuellen Zustand einer Umgebung und den Betriebsparametern für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter unbekannt. Daher werden in der Aktionswerttabelle diverse Arten der Zustandsvariablen S, der Bestimmungsdaten D und der Belohnungen R in Verbindung mit Werten (Funktion Q) der zufällig eingestellten Aktionswerte vorbereitet. Es sei zu beachten, dass der Abschnitt 28 zum Berechnen einer Belohnung die Belohnungen R, die den Bestimmungsdaten D entsprechen, sofort berechnen kann, wenn die Bestimmungsdaten D bekannt sind, und die Werte der berechneten Belohnungen R in die Aktionswerttabelle eingetragen werden.
  • Wenn das Q-Lernen unter Verwendung der Belohnung R, die einem Eignungsbestimmungsergebnis des Zustands des Vorgangs des Bondens einer Strahlungsplatte durch einen Roboter entspricht, fortgeführt wird, wird das Lernen angeleitet, um die Aktion auszuwählen, die eine höhere Belohnung R erzielt. Dann werden die Werte (Funktion Q) der Aktionswerte für eine Aktion, die in einem aktuellen Zustand ausgeführt wird, überschrieben, um die Aktionswerttabelle gemäß dem Zustand einer Umgebung (d.h. die Zustandsvariablen S und die Bestimmungsdaten D), der sich ändert, wenn die ausgewählte Aktion in dem aktuellen Zustand ausgeführt wird, zu aktualisieren. Dadurch dass die Aktualisierung wiederholt ausgeführt wird, werden die Werte (Funktion Q) der Aktionswerte, die in der Aktionswerttabelle angezeigt werden, überschrieben, um größer als eine Aktion zu sein, die besser geeignet ist. Somit wird die Korrelation zwischen einem aktuellen Zustand (dem Zustand eines Wärmeleiters) in einer unbekannten Umgebung und einer entsprechenden Aktion (Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter) allmählich offensichtlich. D.h. durch die Aktualisierung der Aktionswerttabelle wird die Beziehung zwischen dem Zustand eines Wärmeleiters und den Betriebsparametern für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter allmählich einer optimalen Lösung genähert.
  • Der Ablauf des obigen Q-Lernens (d.h. eine Ausführungsform eines maschinellen Lernverfahrens), das durch den Lernabschnitt 26 ausgeführt wird, wird mit Bezug auf 3 weiter beschrieben.
  • Zunächst wählt in Schritt SA01 der Abschnitt 30 zum Aktualisieren einer Wertfunktion mit Bezug auf eine Aktionswerttabelle zu diesem Zeitpunkt Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter als eine Aktion aus, die in einem aktuellen Zustand ausgeführt wird, der durch die Zustandsvariablen S, die durch den Abschnitt 22 zum Beobachten von Zuständen beobachtet werden, angegeben wird, zufällig aus. Als Nächstes importiert der Abschnitt 30 zum Aktualisieren einer Wertfunktion die Zustandsvariable S in dem aktuellen Zustand, der durch den Abschnitt 22 zum Beobachten von Zuständen beobachtet wird, in Schritt SA02 und importiert die Bestimmungsdaten D in dem aktuellen Zustand, die durch den Abschnitt 24 zum Erfassen von Bestimmungsdaten erfasst werden, in Schritt SA03. Dann bestimmt in Schritt SA04 der Abschnitt 30 zum Aktualisieren einer Wertfunktion, ob die Betriebsparameter für den Vorgang des Bondens der Strahlungsplatte durch den Roboter geeignet sind, basierend auf den Bestimmungsdaten D. Falls die Betriebsparameter geeignet sind, wendet der Abschnitt 30 zum Aktualisieren einer Wertfunktion eine positive Belohnung R, die durch den Abschnitt 28 zum Berechnen einer Belohnung berechnet werden, auf die Aktualisierungsformel der Funktion Q in Schritt SA05 an. Als Nächstes aktualisiert in Schritt SA06 der Abschnitt 30 zum Aktualisieren einer Wertfunktion die Aktionswerttabelle unter Verwendung der Zustandsvariablen S und der Bestimmungsdaten D in dem aktuellen Zustand, der Belohnung R und eines Wertes (aktualisierte Funktion Q) eines Aktionswertes. Falls in Schritt SA04 bestimmt wird, dass die Betriebsparameter für den Vorgang des Bondens der Strahlungsplatte durch den Roboter ungeeignet sind, wendet der Abschnitt 30 zum Aktualisieren einer Wertfunktion eine negative Belohnung R, die durch den Abschnitt 28 zum Berechnen einer Belohnung berechnet wird, auf die Aktualisierungsformel der Funktion Q in Schritt SA07 an. Dann aktualisiert in Schritt SA06 der Abschnitt 30 zum Aktualisieren einer Wertfunktion die Aktionswerttabelle unter Verwendung der Zustandsvariablen S und der Bestimmungsdaten D in dem aktuellen Zustand, der Belohnung R und des Wertes (aktualisierte Funktion Q) des Aktionswertes.
  • Der Lernabschnitt 26 aktualisiert die Aktionswerttabelle erneut, indem er die Verarbeitung der Schritte SA01 bis SA07 wiederholt ausführt und das Lernen der Betriebsparameter für den Vorgang des Bondens der Strahlungsplatte durch den Roboter fortführt.
  • Beim Fortführen des obigen Verstärkungslernens kann beispielsweise ein neuronales Netzwerk anstelle des Q-Lernens verwendet werden. 4A zeigt schematisch ein Neuronenmodell. 4B zeigt schematisch das Modell eines neuronalen Netzwerks, das drei Ebenen aufweist, in denen die in 4A gezeigten Neuronen miteinander kombiniert werden. Das neuronale Netzwerk kann beispielsweise durch eine Recheneinheit, eine Speichereinheit oder dergleichen einem Neuronenmodell folgend konfiguriert sein.
  • Das in 4A gezeigte Neuron gibt ein Ergebnis y mit Bezug auf eine Vielzahl von Eingaben x (hier beispielsweise die Eingaben x1 bis x3) aus. Die Eingaben x1 bis x3 werden jeweils mit den entsprechenden Gewichtungen w (w1 bis w3) multipliziert. Somit gibt das Neuron das Ergebnis y aus, das durch die folgende Formel (2) ausgedrückt wird. Es sei zu beachten, dass eine Eingabe x, ein Ergebnis y und eine Gewichtung w alle Vektoren sind. Zudem drückt θ einen systematischen Fehler aus, und fk drückt eine Aktivierungsfunktion aus. y = ƒ k ( i l n x i w i θ )
    Figure DE102018002785B4_0002
  • In dem neuronalen Netzwerk, das die in 4B gezeigten drei Ebenen aufweist, wird eine Vielzahl von Eingaben x (hier beispielsweise die Eingaben x1 bis x3) von der linken Seite des neuronalen Netzwerks eingegeben, und die Ergebnisse y (hier beispielsweise die Ergebnisse y1 bis y3) werden von der rechten Seite des neuronalen Netzwerks ausgegeben. Bei dem in 4B gezeigten Beispiel werden die Eingaben x1 bis x3 mit entsprechenden Gewichtungen multipliziert (insgesamt als w1 ausgedrückt) und jeweils in die drei Neuronen N11 bis N13 eingegeben.
  • In 4B werden die jeweiligen Ausgaben der Neuronen N11 bis N13 insgesamt als z1 ausgedrückt. Die Ausgaben z1 können als Merkmalsvektoren angesehen werden, die durch Entnehmen der Merkmalsbeträge der Eingangsvektoren erzielt werden. Bei dem in 4B gezeigten Beispiel werden die jeweiligen Merkmalsvektoren z1 mit entsprechenden Gewichtungen (insgesamt als w2 angegeben) multipliziert und jeweils in die beiden Neuronen N21 und N22 eingegeben. Die Merkmalsvektoren z1 drücken die Merkmale zwischen den Gewichtungen w1 und den Gewichtungen w2 aus.
  • In 4B sind die jeweiligen Ausgaben der Neuronen N21 und N22 insgesamt als z2 ausgedrückt. Die Ausgaben z2 können als Merkmalsvektoren angesehen werden, die durch Entnehmen der Merkmalsbeträge der Merkmalsvektoren z1 erzielt werden. Bei dem in 4B gezeigten Beispiel werden die jeweiligen Merkmalsvektoren z2 mit den entsprechenden Gewichtungen (insgesamt als w3 angegeben) multipliziert und jeweils in die drei Neuronen N31 bis N33 eingegeben. Die Merkmalsvektoren z2 drücken die Merkmale zwischen den Gewichtungen w2 und der Gewichtung w3 aus. Schließlich geben die Neuronen N31 bis N33 jeweils die Ergebnisse y1 bis y3 aus.
  • Es sei zu beachten, dass es möglich ist, das so genannte tiefgehende Lernen zu verwenden, bei dem ein neuronales Netzwerk, das drei oder mehrere Ebenen bildet, verwendet wird.
  • Bei der maschinellen Lernvorrichtung 20 des Controllers 10 berechnet der Lernabschnitt 26 die Zustandsvariablen S und die Bestimmungsdaten D als Eingaben x in einer Struktur aus mehreren Ebenen gemäß dem obigen neuronalen Netzwerk, um in der Lage zu sein, Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter auszugeben (Ergebnis y). Es sei zu beachten, dass der Betriebsmodus des neuronalen Netzwerks einen Lernmodus und einen Wertvorhersagemodus umfasst. Beispielsweise ist es möglich, eine Gewichtung W unter Verwendung eines Lerndatensatzes im Lernmodus zu erlernen und einen Aktionswert unter Verwendung der erlernten Gewichtung W im Wertvorhersagemodus zu bestimmen. Es sei zu beachten, dass eine Detektion, Klassifizierung, Ableitung oder dergleichen im Wertvorhersagemodus ausgeführt werden kann.
  • Die Konfiguration des obigen Controllers 10 kann als ein maschinelles Lernverfahren (oder Software) beschrieben werden, das durch die CPU eines Computers ausgeführt wird. Das maschinelle Lernverfahren ist ein maschinelles Lernverfahren zum Lernen von Betriebsparametern für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter. Die CPU eines Computers führt aus: einen Schritt des Beobachtens der Betriebsparameterdaten S1, welche die Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter angeben, und der Wärmeleiterzustandsdaten S2, die den Zustand eines Wärmeleiters als Zustandsvariablen S angeben, die den aktuellen Zustand einer Umgebung angeben, in welcher der Vorgang des Bondens der Strahlungsplatte durch den Roboter ausgeführt wird; einen Schritt des Erfassens von Bestimmungsdaten D, die ein Eignungsbestimmungsergebnis des Zustands des Vorgangs des Bondens der Strahlungsplatte durch den Roboter angeben; und einen Schritt des Lernens von Betriebsparametern für den Vorgang des Bondens der Strahlungsplatte durch den Roboter und von Wärmeleiterzustandsdaten S2 in Verbindung miteinander unter Verwendung der Zustandsvariablen S und der Bestimmungsdaten D.
  • 5 zeigt einen Controller 40 gemäß einer zweiten Ausführungsform.
  • Der Controller 40 umfasst eine maschinelle Lernvorrichtung 50 und einen Abschnitt 42 zum Erfassen von Zustandsdaten. Der Abschnitt 42 zum Erfassen von Zustandsdaten erfasst die Betriebsparameterdaten S1 und Wärmeleiterzustandsdaten S2 der Zustandsvariablen S, die durch einen Abschnitt 22 zum Beobachten von Zuständen beobachtet werden, als Zustandsdaten S0. Die Zustandsdaten S0, die durch den Abschnitt 42 zum Erfassen von Zustandsdaten erfasst werden, können auch eine Information S3 über die Art eines elektrischen Bauteils und eine Information S4 über die Art eines Substrats umfassen. Der Abschnitt 42 zum Erfassen von Zustandsdaten kann die Zustandsdaten S0 von diversen Sensoren, die an dem Gerät angebracht sind, von der zuvor beschriebenen ersten Messvorrichtung, von Sollwerten der jeweiligen Vorrichtungen, von geeigneten Dateneingaben durch einen Arbeiter oder dergleichen erfassen.
  • Die maschinelle Lernvorrichtung 50 des Controllers 40 umfasst neben Software (wie etwa einem Lernalgorithmus) und Hardware (wie etwa der CPU eines Computers) für das spontane Lernen von Betriebsparametern für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter durch maschinelles Lernen Software (wie etwa einen Rechenalgorithmus) und Hardware (wie etwa die CPU eines Computers) zum Ausgeben der erlernten Betriebsparameter für den Vorgang des Bondens der Strahlungsplatte durch den Roboter als Befehl für den Roboter (nicht gezeigt). Die maschinelle Lernvorrichtung 50 des Controllers 40 kann derart konfiguriert sein, dass eine einzige gemeinsame CPU die gesamte Software, wie etwa einen Lernalgorithmus und einen Rechenalgorithmus, ausführt.
  • Ein Entscheidungsfindungsabschnitt 52 kann beispielsweise als eine der Funktionen der CPU eines Computers oder als Software zum Betätigen der CPU des Computers konfiguriert sein. Der Entscheidungsfindungsabschnitt 52 generiert einen Befehlswert C für einen Roboter, der den Vorgang des Bondens einer Strahlungsplatte ausführt, basierend auf den Betriebsparametern für den Vorgang des Bondens der Strahlungsplatte durch den Roboter, die durch den Lernabschnitt 26 erlernt werden, und gibt diesen aus. Wenn der Entscheidungsfindungsabschnitt 52 den Befehlswert C basierend auf den Betriebsparametern für den Vorgang des Bondens der Strahlungsplatte durch den Roboter an den Roboter ausgibt, ändert sich der Zustand (Betriebsparameterdaten S1) einer Umgebung entsprechend.
  • Der Abschnitt 22 zum Beobachten von Zuständen beobachtet in einem nächsten Lernzyklus die Zustandsvariablen S, welche die Betriebsparameterdaten S1 umfassen, die sich geändert haben, nachdem die Betriebsparameter für den Vorgang des Bondens der Strahlungsplatte durch den Roboter durch den Entscheidungsfindungsabschnitt 52 für eine Umgebung angezeigt oder an diese ausgegeben wurden. Der Lernabschnitt 26 aktualisiert beispielsweise eine Wertfunktion Q (d.h. eine Aktionswerttabelle) unter Verwendung der geänderten Zustandsvariablen S, um die Betriebsparameter für den Vorgang des Bondens der Strahlungsplatte durch den Roboter zu erlernen. Basierend auf den erlernten Betriebsparametern für den Vorgang des Bondens der Strahlungsplatte durch den Roboter gibt der Entscheidungsfindungsabschnitt 52 den Befehlswert C basierend auf den Betriebsparametern für den Vorgang des Bondens der Strahlungsplatte durch den Roboter gemäß der Zustandsvariablen S an den Roboter aus. Dadurch dass der Zyklus wiederholt ausgeführt wird, fährt die maschinelle Lernvorrichtung 50 mit dem Lernen der Betriebsparameter für den Vorgang des Bondens der Strahlungsplatte durch den Roboter fort und verbessert allmählich die Zuverlässigkeit der Betriebsparameter für den Vorgang des Bondens der Strahlungsplatte durch den Roboter, die durch die maschinelle Lernvorrichtung 50 selber bestimmt werden.
  • Die maschinelle Lernvorrichtung 50 des Controllers 40, welche die obige Konfiguration aufweist, erzeugt den gleichen Effekt wie den der obigen maschinellen Lernvorrichtung 20, die in 1 und 2 gezeigt wird. Insbesondere kann die in 5 gezeigte maschinelle Lernvorrichtung 50 den Zustand einer Umgebung mit der Ausgabe des Entscheidungsfindungsabschnitts 52 ändern. Andererseits kann die maschinelle Lernvorrichtung 20 eine Funktion, die einem Entscheidungsfindungsabschnitt entspricht, auffordern, die Lernergebnisse des Lernabschnitts 26 auf eine Umgebung für ein externes Gerät (beispielsweise den Controller eines Roboters) umzusetzen.
  • 6 zeigt ein Bauteilmontagesystem 70, das Roboter 60 gemäß einer Ausführungsform umfasst.
  • Das Bauteilmontagesystem 70 umfasst eine Vielzahl von Robotern 60 und 60', die mindestens die gleiche Maschinenkonfiguration aufweisen, und ein Netzwerk 72, das die Roboter 60 und 60' miteinander verbindet. Mindestens einer von der Vielzahl von Robotern 60 und 60' ist als ein Roboter 60 konfiguriert, der den obigen Controller 40 umfasst. Zudem kann das Bauteilmontagesystem 70 Roboter 60' aufweisen, die den Controller 40 nicht umfassen. Die Roboter 60 und 60' weisen eine allgemeine Konfiguration zum Bonden einer Strahlungsplatte auf ein elektronisches Bauteil, das an einem Substrat angebracht ist, auf.
  • Bei dem Bauteilmontagesystem 70, das die obige Konfiguration aufweist, können die Roboter 60, die den Controller 40 umfassen, aus der Vielzahl von Robotern 60 und 60' Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch die Roboter 60 und 60' gemäß dem Zustand eines Wärmeleiters automatisch und genau berechnen, ohne auf eine Berechnung oder Schätzung zurückzugreifen, die Lernergebnisse des Lernabschnitts 26 verwendet. Zudem kann der Controller 40 mindestens eines der Roboter 60 die Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch Roboter, die allen Robotern 60 und 60' gemeinsam sind, basierend auf den Zustandsvariablen S und Bestimmungsdaten D, die für jeden von der anderen Vielzahl von Robotern 60 und 60' erzielt werden, erlernen, so dass die Lernergebnisse von allen Robotern 60 und 60' gemeinsam genutzt werden. Entsprechend ermöglicht es das Bauteilmontagesystem 70, die Geschwindigkeit und die Zuverlässigkeit des Lernens von Betriebsparametern für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter mit einem breiteren Bereich von Datensätzen (einschließlich der Zustandsvariablen S und Bestimmungsdaten D) als Eingaben zu verbessern.
  • 7 zeigt ein Bauteilmontagesystem 70', das Roboter 60' gemäß einer anderen Ausführungsform umfasst.
  • Das Bauteilmontagesystem 70' umfasst die maschinelle Lernvorrichtung 50 (oder 20), eine Vielzahl von Robotern 60', welche die gleiche Maschinenkonfiguration aufweisen, und ein Netzwerk 72, das den Roboter 60' und die maschinelle Lernvorrichtung 50 (oder 20) miteinander verbindet.
  • In dem Bauteilmontagesystem 70', das die obige Konfiguration aufweist, kann die maschinelle Lernvorrichtung 50 (oder 20) Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch Roboter erlernen, die allen Robotern 60' gemeinsam sind, basierend auf den Zustandsvariablen S und Bestimmungsdaten D, die für jeden der Vielzahl von Robotern 60' erzielt werden, und die Betriebsparameter für den Vorgang des Bondens der Strahlungsplatte durch Roboter gemäß dem Zustand eines Wärmeleiters automatisch und genau berechnen, ohne auf eine Berechnung oder Schätzung zurückzugreifen, welche die Lernergebnisse verwendet.
  • Bei dem Bauteilmontagesystem 70' kann die maschinelle Lernvorrichtung 50 (oder 20) eine Konfiguration aufweisen, die in einem Cloud-Server, einer Steuerzelle oder dergleichen existiert, die in dem Netzwerk 72 bereitgestellt werden. Gemäß der Konfiguration kann je nach Bedarf eine gewünschte Anzahl der Roboter 60' mit der maschinellen Lernvorrichtung 50 (oder 20) unabhängig von existierenden Standorten und Zeitpunkten der Vielzahl von Robotern 60' verbunden sein.
  • Arbeiter, die mit den Bauteilmontagesystemen 70 und 70' zu tun haben, können eine Bestimmung ausführen, ob die Zielerreichung des Lernens der Betriebsparameter für den Vorgang des Bondens einer Strahlungsplatte durch einen Roboter (d.h. die Zuverlässigkeit der Betriebsparameter für den Vorgang des Bondens der Strahlungsplatte durch den Roboter) mit der maschinellen Lernvorrichtung 50 (oder 20) eine notwendiges Niveau zu einem geeigneten Zeitpunkt nach dem Beginn des Lernens durch die maschinelle Lernvorrichtung 50 (oder 20) erreicht hat.
  • Die Ausführungsformen der vorliegenden Erfindung wurden zuvor beschrieben. Die vorliegende Erfindung ist jedoch nicht auf die Beispiele der obigen Ausführungsformen eingeschränkt und kann in diversen Modi unter Hinzufügung geeigneter Änderungen ausgeführt werden.
  • Beispielsweise sind ein Lernalgorithmus, der durch die maschinellen Lernvorrichtungen 20 und 50 ausgeführt wird, ein Rechenalgorithmus, der durch die maschinelle Lernvorrichtung 50 ausgeführt wird, und ein Steueralgorithmus, der durch die Controller 10 und 40 ausgeführt wird, nicht auf die obigen Algorithmen eingeschränkt, sondern es können diverse Algorithmen verwendet werden.
  • Zudem beschreiben die obigen Ausführungsformen ein Beispiel, bei dem die maschinellen Lernvorrichtungen 20 und 50 maschinelles Lernen an den Controllern 10 und 40 online ausführen. Die maschinellen Lernvorrichtungen 20 und 50 können jedoch die Zustandsdaten S und die Bestimmungsdaten D als Protokolldaten während der Steuerung eines Roboters durch die Controller 10 und 40 im Voraus aufzeichnen, die aufgezeichneten Protokolldaten erheben und maschinelles Lernen basierend auf den Zustandsdaten S und den Bestimmungsdaten D, die aus den erhobenen Protokolldaten erfasst werden, ausführen.

Claims (8)

  1. Controller (10; 40), der einen Roboter (60) steuert, der verwendet wird, um anhand eines Wärmeleiters eine Strahlungsplatte (3) auf ein elektrisches Bauteil (5) zu bonden, wobei der Controller umfasst: eine maschinelle Lernvorrichtung (20; 50), die einen Betriebsparameter für einen Vorgang des Bondens der Strahlungsplatte durch den Roboter (60) erlernt, wobei die maschinelle Lernvorrichtung (20; 50) umfasst einen Abschnitt zum Beobachten von Zuständen (22), der als Zustandsvariablen (S), die einen aktuellen Zustand einer Umgebung ausdrücken, Betriebsparameterdaten, welche die Betriebsparameter angeben, und Wärmeleiterzustandsdaten, die einen Zustand des Wärmeleiters angeben, beobachtet, einen Abschnitt zum Erfassen von Bestimmungsdaten (24), der Bestimmungsdaten (D), die ein Eignungsbestimmungsergebnis des Vorgangs des Bondens der Strahlungsplatte (3) angeben, erfasst, und einen Lernabschnitt (26), der den Betriebsparameter in Verbindung mit den Wärmeleiterzustandsdaten unter Verwendung der Zustandsvariablen und der Bestimmungsdaten erlernt.
  2. Controller (10; 40) nach Anspruch 1, wobei der Abschnitt zum Beobachten von Zuständen (22) ferner als die Zustandsvariable (S) mindestens eine von einer Information über die Art eines elektrischen Bauteils (5), um eine Art des elektrischen Bauteils (5) zu identifizieren, und einer Information über die Art eines Substrats, um eine Art eines Substrats zu identifizieren, an dem das elektrische Bauteil (5) angebracht ist, beobachtet, und der Lernabschnitt (26) den Betriebsparameter in Verbindung mit einer von der Information über die Art eines elektrischen Bauteils (5) und der Information über die Art eines Substrats, zusätzlich zu den Wärmeleiterzustandsdaten erlernt.
  3. Controller (10; 40) nach Anspruch 1 oder 2, wobei der Lernabschnitt (26) umfasst einen Abschnitt zum Berechnen einer Belohnung (28), der eine Belohnung (R) bezüglich des Eignungsbestimmungsergebnisses berechnet, und einen Abschnitt zum Aktualisieren einer Wertfunktion (30), der unter Verwendung der Belohnung (R) eine Funktion (Q) aktualisiert, die einen Wert des Betriebsparameters in Bezug auf den Zustand des Wärmeleiters ausdrückt.
  4. Controller (10; 40) nach einem der Ansprüche 1 bis 3, wobei der Lernabschnitt (26) die Zustandsvariablen (S) und die Bestimmungsdaten (D) in einer Struktur aus mehreren Ebenen berechnet.
  5. Controller (40) nach einem der Ansprüche 1 bis 4, ferner umfassend: einen Entscheidungsfindungsabschnitt (52), der einen Befehlswert (C) basierend auf dem Betriebsparameter gemäß einem Lernergebnis des Lernabschnitts (15) ausgibt.
  6. Controller (10; 40) nach einem der Ansprüche 1 bis 5, wobei der Lernabschnitt (26) den Betriebsparameter in jedem von einer Vielzahl von Robotern (60, 60') unter Verwendung der Zustandsvariablen (S) und der Bestimmungsdaten (D), die für jeden von der Vielzahl von Robotern (60, 60') erhalten werden, erlernt.
  7. Controller (40) nach einem der Ansprüche 1 bis 6, wobei die maschinelle Lernvorrichtung (50) in einem von einem Cloud-Server und einer Steuerzelle existiert.
  8. Maschinelle Lernvorrichtung (20; 50), die einen Betriebsparameter für einen Vorgang des Bondens einer Strahlungsplatte (3) durch einen Roboter (60) erlernt, der verwendet wird, um die Strahlungsplatte (3) anhand eines Wärmeleiters auf ein elektrisches Bauteil (5) zu bonden, wobei die maschinelle Lernvorrichtung (20; 50) umfasst: einen Abschnitt zum Beobachten von Zuständen (22), der als Zustandsvariablen (S), die einen aktuellen Zustand einer Umgebung ausdrücken, Betriebsparameterdaten, welche die Betriebsparameter angeben, und Wärmeleiterzustandsdaten, die einen Zustand des Wärmeleiters angeben, beobachtet; einen Abschnitt zum Erfassen von Bestimmungsdaten (24), der Bestimmungsdaten, die ein Eignungsbestimmungsergebnis des Vorgangs des Bondens der Strahlungsplatte (3) angeben, erfasst; und einen Lernabschnitt (26) der den Betriebsparameter in Verbindung mit den Wärmeleiterzustandsdaten unter Verwendung der Zustandsvariablen (S) und der Bestimmungsdaten (D) erlernt.
DE102018002785.7A 2017-04-13 2018-04-06 Controller und maschinelle Lernvorrichtung Active DE102018002785B8 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017-079844 2017-04-13
JP2017079844A JP6514260B2 (ja) 2017-04-13 2017-04-13 制御装置及び機械学習装置

Publications (3)

Publication Number Publication Date
DE102018002785A1 DE102018002785A1 (de) 2018-10-18
DE102018002785B4 true DE102018002785B4 (de) 2022-03-03
DE102018002785B8 DE102018002785B8 (de) 2022-06-02

Family

ID=63679077

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102018002785.7A Active DE102018002785B8 (de) 2017-04-13 2018-04-06 Controller und maschinelle Lernvorrichtung

Country Status (4)

Country Link
US (1) US10549423B2 (de)
JP (1) JP6514260B2 (de)
CN (1) CN108732963B (de)
DE (1) DE102018002785B8 (de)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11584016B2 (en) 2018-04-24 2023-02-21 Fanuc Corporation Robot controller and system
JP2020131353A (ja) * 2019-02-19 2020-08-31 パナソニックIpマネジメント株式会社 研磨加工システム、学習装置、学習装置の学習方法
DE102019205651B3 (de) * 2019-04-18 2020-08-20 Kuka Deutschland Gmbh Verfahren und System zum Ausführen von Roboterapplikationen
WO2020246005A1 (ja) * 2019-06-06 2020-12-10 三菱電機株式会社 パラメータ算出装置、ロボット制御システム、ロボットシステム
CN110682291B (zh) * 2019-10-16 2020-07-10 国网江苏省电力有限公司扬州供电分公司 一种基于vr的机器人遥操作系统及其遥操作方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08112788A (ja) 1994-10-14 1996-05-07 Canon Inc 部品挿入装置及び部品挿入方法
JPH10321653A (ja) 1997-05-19 1998-12-04 Shibaura Eng Works Co Ltd チップ状部品ボンディング装置
JP2007019337A (ja) 2005-07-08 2007-01-25 Sony Corp ボンディング装置、半導体チップの運搬装置、ボンディング方法及び半導体チップの運搬方法
EP3119176A1 (de) 2014-02-14 2017-01-18 Omron Corporation Qualitätskontrollvorrichtung, qualitätskontrollverfahren und programm
DE102016009030A1 (de) 2015-07-31 2017-02-02 Fanuc Corporation Vorrichtung für maschinelles Lernen, Robotersystem und maschinelles Lernsystem zum Lernen eines Werkstückaufnahmevorgangs
DE102016010048A1 (de) 2015-08-28 2017-03-02 Fanuc Corporation Maschinelles lernverfahren und vorrichtung zum maschinellen lernen zum erlernen eines betriebsbefehls an einen elektromotor sowie steuerung und elektromotorvorrichtung einschliesslich vorrichtung zum maschinellen lernen
DE102016011402A1 (de) 2015-09-29 2017-03-30 Fanuc Corporation Maschinelles Lernverfahren und maschinelle Lernvorrichtung zum Einlernen von Betriebsbefehlen für einen Elektromotor und Werkzeugmaschine mit maschineller Lernvorrichtung

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07335795A (ja) * 1994-06-14 1995-12-22 Fujitsu Ltd 伝熱媒体塗布方法及び伝熱媒体塗布ローラ
JPH0981205A (ja) * 1995-09-11 1997-03-28 Fujitsu Ltd 学習システム
JP2010135459A (ja) * 2008-12-03 2010-06-17 Nikon Corp 半導体パッケージおよび放熱器
US8041451B2 (en) * 2009-04-21 2011-10-18 Taiwan Semiconductor Manufacturing Company, Ltd. Method for bin-based control
US9036354B2 (en) * 2013-01-15 2015-05-19 Flextronics, Ap, Llc Heat sink thermal press for phase change heat sink material
JP6233061B2 (ja) * 2014-01-30 2017-11-22 オムロン株式会社 品質管理装置、品質管理方法
JP6264072B2 (ja) * 2014-02-10 2018-01-24 オムロン株式会社 品質管理装置及びその制御方法
JP2016092300A (ja) * 2014-11-07 2016-05-23 新光電気工業株式会社 半導体装置及び半導体装置の製造方法
JP6148316B2 (ja) * 2015-07-31 2017-06-14 ファナック株式会社 故障条件を学習する機械学習方法及び機械学習装置、並びに該機械学習装置を備えた故障予知装置及び故障予知システム
CN105798930B (zh) * 2016-04-01 2017-09-05 浙江工业大学 基于龙伯格状态观测器的柔性机械臂系统饱和补偿控制方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08112788A (ja) 1994-10-14 1996-05-07 Canon Inc 部品挿入装置及び部品挿入方法
JPH10321653A (ja) 1997-05-19 1998-12-04 Shibaura Eng Works Co Ltd チップ状部品ボンディング装置
JP2007019337A (ja) 2005-07-08 2007-01-25 Sony Corp ボンディング装置、半導体チップの運搬装置、ボンディング方法及び半導体チップの運搬方法
EP3119176A1 (de) 2014-02-14 2017-01-18 Omron Corporation Qualitätskontrollvorrichtung, qualitätskontrollverfahren und programm
DE102016009030A1 (de) 2015-07-31 2017-02-02 Fanuc Corporation Vorrichtung für maschinelles Lernen, Robotersystem und maschinelles Lernsystem zum Lernen eines Werkstückaufnahmevorgangs
DE102016010048A1 (de) 2015-08-28 2017-03-02 Fanuc Corporation Maschinelles lernverfahren und vorrichtung zum maschinellen lernen zum erlernen eines betriebsbefehls an einen elektromotor sowie steuerung und elektromotorvorrichtung einschliesslich vorrichtung zum maschinellen lernen
DE102016011402A1 (de) 2015-09-29 2017-03-30 Fanuc Corporation Maschinelles Lernverfahren und maschinelle Lernvorrichtung zum Einlernen von Betriebsbefehlen für einen Elektromotor und Werkzeugmaschine mit maschineller Lernvorrichtung

Also Published As

Publication number Publication date
CN108732963A (zh) 2018-11-02
JP2018176356A (ja) 2018-11-15
JP6514260B2 (ja) 2019-05-15
DE102018002785B8 (de) 2022-06-02
CN108732963B (zh) 2020-05-12
DE102018002785A1 (de) 2018-10-18
US20180297199A1 (en) 2018-10-18
US10549423B2 (en) 2020-02-04

Similar Documents

Publication Publication Date Title
DE102018002785B4 (de) 1 - 8CController und maschinelle Lernvorrichtung
DE102018001893B4 (de) Reinigungsprozess-Optimierungsvorrichtung und Maschinenlernvorrichtung
DE102018006946B4 (de) Steuerung und maschinelle Lernvorrichtung
DE102017011754B4 (de) Maschinenlerneinrichtung zum Lernen eines Montagevorgangs und Komponentenmontagesystem
DE102019002065B4 (de) Maschinelle Lernvorrichtung, Robotersteuervorrichtung und Robotervisionssystem, das eine maschinelle Lernvorrichtung verwendet, und maschinelles Lernverfahren
DE102017108169B4 (de) Produktionssystem, das einen Bestimmungswert einer Variablen in Bezug auf eine Produktabweichung festlegt
DE102016015873B3 (de) Vorrichtung für maschinelles Lernen, Robotersystem und maschinelles Lernsystem zum Lernen eines Werkstückaufnahmevorgangs
DE102016009030B4 (de) Vorrichtung für maschinelles Lernen, Robotersystem und maschinelles Lernsystem zum Lernen eines Werkstückaufnahmevorgangs
DE102018108780B4 (de) Bearbeitungsflächenqualitätsbewertungsvorrichtung
DE102017010799B4 (de) Maschinenlernvorrichtung zum Lernen einer Bearbeitungsreihenfolge eines Robotersystems mit einer Mehrzahl von Laserbearbeitungsrobotern, dazugehöriges Robotersystem sowie Maschinenlernverfahren zum Lernen einer Bearbeitungsreihenfolge des Robotersystems mit einer Mehrzahl von Laserbearbeitungsrobotern
DE102018003266B4 (de) Controller und maschinelle lernvorrichtung
DE102016014264B4 (de) Maschinelle Lernvorrichtung, Blechpaketherstellungsvorrichtung, Blechpaketherstellungssystem und maschinelles Lernverfahren zum Erlernen des Stapelns von Paketblechen
DE102018000342A1 (de) Numerische steuerung und maschinelle lernvorrichtung
DE112019001512T5 (de) EINSPRITZGIEßMASCHINENSYSTEM
DE102018004330B4 (de) Steuerung und maschinelle Lernvorrichtung
DE102018001571B4 (de) Laserverarbeitungsgerät und Vorrichtung zum maschinellen Lernen
DE102016009106A1 (de) Mit Steuerung ausgerüstete Bearbeitungsvorrichtung mit Bearbeitungszeit- Messfunktion und Messfunktion auf der Maschine
DE102018108778A1 (de) Beschleunigungs- und Verzögerungssteuereinheit
DE102018010086A1 (de) Spanabführvorrichtung und Informationsverarbeitungsvorrichtung
DE102018005199B4 (de) Bauteilzuführvorrichtung und maschinelle lernvorrichtung
DE102019001783A1 (de) Steuerung, maschinelle lernvorrichtung und system
DE102018002423B4 (de) Robotersteuerung, Vorrichtung für maschinelles Lernen und Verfahren für maschinelles Lernen
DE102019001044A1 (de) Steuervorrichtung und maschinelle lernvorrichtung
DE102018126434B4 (de) Testvorrichtung und Maschinenlernvorrichtung
DE102018004048A1 (de) Steuerung und Maschinenlernvorrichtung

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final