-
Hintergrund der Erfindung
-
1. Gebiet der Erfindung
-
Die vorliegende Erfindung betrifft Produktionssteuersysteme und integrierte Produktionssteuersysteme und im Besonderen ein Produktionssteuersystem und ein integriertes Produktionssteuersystem, die lernen, den Stromverbrauch für die Produktion in einer Fabrik mit einer Mehrzahl Maschinen und einer Klimaanlage zu minimieren und dabei die Temperaturanforderungen in der Fabrik sowie Produktlieferfristen einzuhalten.
-
2. Beschreibung des zugehörigen Standes der Technik
-
Fabriken sind üblicherweise mit einer Mehrzahl Maschinen (z. B. Werkzeugmaschinen) ausgestattet, wobei im Falle einer Präzisionsbearbeitung eine Klimatisierung (eine Klimaanlage) bereitgestellt wird, um die Umgebungsbedingungen in der Fabrik zu steuern, da die Temperatur in der Fabrik die Bearbeitungsgenauigkeit beeinflusst. Die Produktion in einer Fabrik wird durch einen Produktionsplan vorgeschrieben, wobei zum Herstellen der durch den Produktionsplan vorgeschriebenen Produkte innerhalb einer vorgeschriebenen Lieferfrist der Betriebszustand und die Bearbeitungsbedingungen einer Mehrzahl Maschinen und auch der Betriebszustand der Klimaanlage gesteuert werden, um in der Fabrik für die Bearbeitung erforderliche Temperaturbedingungen (Temperatur und Gleichmäßigkeit) zu erreichen.
-
Die Zeitspanne zum Fortschreiten von einem Bearbeitungsschritt zum nächsten in einem Herstellungsverfahren eines Produkts wird als Taktzeit bezeichnet, die eine Kennzahl darstellt, die in der Produktionswirtschaft häufig verwendet wird. Es wird darauf hingewiesen, dass Taktzeit manchmal mit einer anderen Bedeutung verwendet wird, hierin wird sie jedoch gemäß der Bedeutung der vorstehend beschriebenen Zeitspanne verwendet. Wenn beispielsweise NX Stück eines Produkts mit einer Taktzeit von tXMAX hergestellt werden, approximiert die Produktionsdauer für die NX Stück des Produkts, die für die Lieferfrist relevant ist, NX × tXMAX, wenn NX ausreichend groß ist.
-
Bei einer herkömmlichen Betriebsleitung trifft der Betriebsleiter, wenn ein Produktionsplan vorgelegt wird, Entscheidungen bezüglich des Betriebszustands (Start und Stopp des Betriebs) und der Bearbeitungsbedingungen einer Mehrzahl Maschinen, um die durch den Produktionsplan vorgeschriebenen Produkte bis zur vorgeschriebenen Lieferfrist herzustellen, und trifft außerdem Entscheidungen bezüglich des Betriebszustands der Klimaanlage, um in der Fabrik die erforderliche Temperatur zu erreichen, wobei die Außentemperatur und Temperaturänderungen infolge des Betriebs der Maschinen berücksichtigt werden. Ein Arbeitsplan für Fabrikarbeiter wird ebenfalls berücksichtigt, wenn die Personalsituation den Umfang betreibbarer Maschinen beeinflusst.
-
Verträge zwischen einer Fabrik und einem Energieversorgungsunternehmen enthalten eine Klausel bezüglich eines Maximalwerts einer Spitzenlaststromversorgung mit einer Zwangsbeschränkung der Stromversorgung, falls der Bedarf den Maximalwert übersteigt, was zu einer Stromunterbrechung führen kann. In den letzten Jahren enthielten Verträge mit Energieversorgungsunternehmen außerdem eine Klausel, dass die Fabriken während Zeiten erhöhten Stromverbrauchs, z. B. im Sommer, ihren Spitzenlaststrombedarf sogar unter dem Maximalwert halten sollen, wobei eine Verletzung der Klausel eine Strafe, wie etwa erhöhte Strompreise, nach sich ziehen kann. Die Schwierigkeit besteht in diesem Fall darin, dass Betriebsleiter nicht nur den Stromverbrauch in Fertigungsanlagen berücksichtigen müssen, sondern auch den Stromverbrauch von verschiedenen Fabrikgerätschaften (z. B. Stromverbrauch von Bürogeräten, Stromverbrauch von Klimaanlagen in Fabrikbüros). Die Betriebsleiter sind dafür verantwortlich, eine solche Situation zu vermeiden und gleichzeitig die Lieferfristen einzuhalten und die Produktqualität sicherzustellen. Aus diesem Grund werden Betriebsleiter herkömmlicherweise unter Facharbeitern ausgewählt.
-
Sich bei der Betriebsleitung auf eine begrenzte Zahl Facharbeiter zu verlassen, geht jedoch mit einem großen Risiko einher. Um dies in Angriff zu nehmen, wurden Steuerungsvorrichtungen entworfen, die gemäß einem gegebenen Produktionsplan durch Ausführen eines basierend auf gegebenen Betriebsleitungserfahrungen entwickelten Betriebsleitprogramms automatisch eine Betriebsproduktionsleitung durchführen.
-
Die ungeprüfte
japanische Patentveröffentlichung (Kokai) Nr. 2011-156598 offenbart ein Stromverbrauchssteuersystem, das eine Stromüberwachungseinrichtung für zu steuernde Werkzeugmaschinen umfasst und Drehbeschleunigungs-/-verzögerungsraten der Haupt- und Vorschubspindeln steuert, so dass der Stromverbrauch der Werkzeugmaschine höchstens auf einem vorgegebenen Zielwert gehalten werden kann, der sich von Zeit zu Zeit ändert.
-
Die
japanische Patentveröffentlichung Nr. 5818865 offenbart ein System zum Erreichen einer Nivellierung des Stromverbrauchs in Bezug auf eine Fertigungsanlage einschließlich einer Mehrzahl durch eine Mehrzahl Anlagengeräte durchzuführender Verfahren durch Treffen einer Auswahl von Verfahrensanordnungskombinationen basierend auf durch PERT-Analyse erhaltenen Pufferperioden für Verfahren und dem auf Informationen bezüglich jedes Verfahrens basierenden Stromverbrauch pro Zeiteinheit, wodurch der Ablauf der Verfahren sowie das Abschalten nicht genutzter Anlagengeräte gesteuert wird. Das vorstehende Dokument offenbart außerdem, dass das System den Stromverbrauch in Echtzeit misst, wobei die Drehzahl oder Drehbeschleunigungs-/-verzögerungsrate eines Motors reduziert wird, wenn der Stromverbrauch einen vorgegebenen Zielwert übersteigt.
-
Es besteht jedoch das Problem, dass mit der Entwicklung eines Betriebsleitprogramms, das in eine Vorrichtung zu installieren ist, die eine automatische Betriebsproduktionsleitung durchführt, komplizierte Arbeitsgänge und hohe Kosten verbunden sind.
-
Zusammenfassung der Erfindung
-
Ein Ziel der Erfindung besteht darin, ein kostengünstiges Produktionssteuersystem zum Steuern der Produktion in einer Fabrik bereitzustellen, die mit einer Mehrzahl Maschinen und einer Klimaanlage ausgestattet ist, um den Stromverbrauch zu senken und gleichzeitig Temperaturbeschränkungen in der Fabrik und Lieferfristen der Produkte einzuhalten.
-
Ein Produktionssteuersystem ist ein Produktionssteuersystem einer Fabrik, wobei das System umfasst: eine Mehrzahl Maschinen, eine Klimaanlage, eine Stromberechnungseinheit zum Überwachen des Stromverbrauchs einer gesamten Fabrik einschließlich des Stromverbrauchs der Mehrzahl Maschinen und der Klimaanlage und eine Temperaturinformationserzeugungseinheit zum Erzeugen von Informationen bezüglich der Temperatur in der Fabrik, wobei der Betriebszustand und die Bearbeitungsbedingungen der Mehrzahl Maschinen und der Betriebszustand der Klimaanlage gesteuert werden, um ein durch den Produktionsplan vorgeschriebenes Produkt bis zu einer vorgeschriebenen Lieferfrist herzustellen, sowie eine Maschinenlerneinheit, die eine Beziehung des Funktionszustands, der den Betriebszustand und die Bearbeitungsbedingungen der Mehrzahl Maschinen sowie den Betriebszustand der Klimaanlage umfasst, und des Umgebungszustands lernt, der eine Produktionsabschlussdauer des Produkts gemäß dem Funktionszustand, die Temperatur in der Fabrik und den Stromverbrauch der gesamten Fabrik umfasst, und den Funktionszustand ausgibt, der den Umgebungszustand gemäß einem Produktionsplan in einen gewünschten Zustand bringt.
-
Ein integriertes Produktionssteuersystem umfasst eine Mehrzahl der vorstehend beschriebenen Produktionssteuersysteme, die jeweils für eine Mehrzahl Fabriken bereitgestellt ist, und ein Kommunikationsnetzwerk, das die Mehrzahl Produktionssteuersysteme miteinander verbindet, wobei jedes der Produktionssteuersysteme ein Lernergebnis seiner Maschinenlerneinheit über das Kommunikationsnetzwerk an ein anderes Produktionssteuersystem sendet, und wobei die Mehrzahl Maschinenlerneinheiten der Mehrzahl Produktionssteuersysteme die Lernergebnisse gemeinsam nutzt.
-
Kurzbeschreibung der Zeichnungen
-
Die vorliegende Erfindung geht durch Bezugnahme auf die folgenden zugehörigen Zeichnungen genauer hervor. Es zeigt/zeigen:
-
1 eine Anordnung einer Fabrik, die mit einem Produktionsleitsystem gemäß einer ersten Ausführungsform ausgestattet ist;
-
2 ein Flussdiagramm, das einen grundlegenden Verarbeitungsbetrieb des Produktionsleitsystems der ersten Ausführungsform darstellt;
-
3 eine schematische Darstellung, die ein Modell eines Neurons veranschaulicht;
-
4 eine schematische Darstellung, die ein neuronales Netzwerk mit den Gewichten von drei Schichten D1 bis D3 veranschaulicht;
-
5 eine Anordnung einer Fabrik, die mit einem Produktionssteuersystem gemäß einer zweiten Ausführungsform ausgestattet ist;
-
6A und 6B jeweils eine beispielhafte Darstellung eines Produktionsplans und eines Arbeitsplans gemäß der zweiten Ausführungsform;
-
7 eine Anordnung einer Fabrik, die mit einem Produktionssteuersystem gemäß einer dritten Ausführungsform ausgestattet ist;
-
8A und 8B jeweils eine beispielhafte Darstellung eines Produktionsplans und eines Arbeitsplans gemäß der dritten Ausführungsform; und
-
9 eine Anordnung einer Mehrzahl Fabriken, auf die ein integriertes Produktionssteuersystem gemäß einer vierten Ausführungsform angewandt wird.
-
Genaue Beschreibung
-
Ein Produktionssteuersystem und ein integriertes Produktionssteuersystem sind nachstehend unter Bezugnahme auf die Zeichnungen beschrieben. Es versteht sich jedoch, dass die vorliegende Erfindung nicht auf die nachstehend beschriebenen Zeichnungen oder Ausführungsformen beschränkt ist.
-
1 zeigt eine Anordnung einer Fabrik, die mit einem Produktionsleitsystem gemäß einer ersten Ausführungsform ausgestattet ist.
-
Eine Fabrik umfasst eine Mehrzahl Maschinen 11A bis 11N, eine Klimaanlage 13, eine Stromberechnungseinheit 15, die den Gesamtstromverbrauch der Fabrik einschließlich des Stromverbrauchs der Mehrzahl Maschinen 11A bis 11N und der Klimaanlage 13 überwacht, und eine Temperaturinformationserzeugungseinheit 17, die Informationen bezüglich der Temperatur in der Fabrik erzeugt, wobei eine Steuereinheit 20 die Fabrik steuert. Die Steuereinheit 20 wird durch einen Computer realisiert, in dem Software installiert ist.
-
Eine Klimaanlage 13 ist nicht unbedingt eine einzelne Klimaanlage, sondern kann eine Mehrzahl Klimaanlagen umfassen. Die Steuereinheit 20 kann vor Ort für die Fabrik oder entfernt von der Fabrik bereitgestellt werden, wobei sie über ein Kommunikationsnetzwerk mit jeder Sektion der Fabrik in Verbindung steht. Es wird darauf hingewiesen, dass der Einfachheit halber hierin eine Fabrik beschrieben wird, die die vorstehend genannten Einrichtungen umfasst, die durch die Steuereinheit 20 gesteuert werden. Die Fabrik kann jedoch beispielsweise ein Büro und eine Klimaanlage für das Büro umfassen, wobei die Stromberechnungseinheit 15 den Stromverbrauch einschließlich des Stromverbrauchs der Klimaanlage des Büros berechnen kann, die Temperaturinformationserzeugungseinheit 17 Temperaturinformationen einschließlich Temperaturinformationen des Büros ausgeben kann und die Steuereinheit 20 auch die Klimaanlage des Büros steuern kann. Des Weiteren können Maschinen Maschinen umfassen, die nicht direkt an Bearbeitungsverfahren beteiligt sind, wie etwa Beleuchtungs- und Fördereinrichtungen. In diesem Fall enthalten die nicht direkt an den Bearbeitungsverfahren beteiligten Maschinen keine Steuerelemente bezüglich der Bearbeitungsbedingungen, wie etwa der Bearbeitungsgeschwindigkeit.
-
Die Steuereinheit 20 steuert den Betriebszustand und die Bearbeitungsbedingungen der Mehrzahl Maschinen 11A bis 11N und den Betriebszustand (z. B. Betriebsdauer und Leistung) der Klimaanlage 13, so dass die durch einen von außen zugeführten Produktionsplan vorgeschrieben Produkte bis zu den vorgeschriebenen Lieferfristen hergestellt werden. Der Produktionsplan enthält beispielsweise jeden Tag herzustellende Artikel, den Umfang, die Lieferfristen (Produktionsabschlussdauer) und dergleichen.
-
Die Steuereinheit 20 umfasst eine Basissteuereinheit 21 und eine Maschinenlerneinheit 23. Die Basissteuereinheit 21 umfasst eine Eingabeeinrichtung zum Eingeben von Daten betreffend den Betriebszustand und die Bearbeitungsbedingungen der Mehrzahl Maschinen 11A bis 11N und den Betriebszustand (z. B. Betriebsdauer und Leistung) der Klimaanlage 13, die Facharbeiter unter Berücksichtigung verschiedener Faktoren gemäß dem Produktionsplan erstellt haben. Die Eingabeeinrichtung wird beispielsweise durch einen Dateneingabeanschluss, der mit einer Steuerdateneingabeeinheit der Mehrzahl Maschinen 11A bis 11N und der Klimaanlage 13 verbunden ist, oder einen Computer oder dergleichen realisiert, der eine Dateneingabefunktion mit Anzeige aufweist. Den Betriebszustand und die Bearbeitungsbedingungen der Mehrzahl Maschinen 11A bis 11N betreffende Daten werden als chronologische Darstellung der durch jede Maschine zu bearbeitenden Produkte und der Bearbeitungsgeschwindigkeiten der Produkte wiedergegeben. Die Daten werden beispielsweise als sequenzielle Anzeige von Produktarten, Start- und Endzeitpunkten der Bearbeitung und Bearbeitungsbedingungen wiedergegeben. Durch Teilen eines Tages durch eine Zeiteinheit, beispielsweise durch Teilen der acht Stunden von acht Uhr bis zwölf Uhr und von dreizehn Uhr bis siebzehn Uhr durch 10 Minuten in 48 Einheiten, können Daten auch durch Angeben von zu bearbeitenden Produktarten und Bearbeitungsbedingungen für jede Zeiteinheit wiedergegeben werden. Wenn die Bearbeitungsdauer 30 Minuten beträgt, dauert die Bearbeitung 3 Einheiten lang. Es wird darauf hingewiesen, dass die Bearbeitungsdauer hierin die Zeit zum Einsetzen eines in der Maschine zu bearbeitenden Materials und zum Entfernen des fertigen Produkts umfasst. Die Bearbeitungsbedingungen umfassen beispielsweise die Bearbeitungsgeschwindigkeit und geben die Geschwindigkeitsbereiche, die eine Bearbeitung mit der gewünschten Genauigkeit ermöglichen, in Stufen an. Die Bearbeitungsdauer ist umgekehrt proportional zur Bearbeitungsgeschwindigkeit. Den Betriebszustand (z. B. Betriebsdauer und Leistung) der Klimaanlage 13 betreffende Daten werden in ähnlicher Weise wiedergegeben.
-
Solange die Maschinenlerneinheit 23 das Lernen noch nicht in ausreichendem Umfang durchgeführt hat, werden der Mehrzahl Maschinen 11A bis 11N und der Klimaanlage 13 in die Basissteuereinheit 21 eingegebene Steuerdaten zugeführt, die die Mehrzahl Maschinen 11A bis 11N und die Klimaanlage 13 betreffen. Die Mehrzahl Maschinen 11A bis 11N und die Klimaanlage 13 arbeiten gemäß der Steuerdaten. Eine Maschine A bearbeitet beispielsweise ein Produkt X über eine Bearbeitungsdauer S (mit einer Bearbeitungsgeschwindigkeit R), wiederholt den Vorgang 10 Mal (um 10 Stück des Produkts X herzustellen), unterbricht dann den Betrieb für 20 Minuten und wiederholt danach denselben Betrieb dreimal. Dadurch werden insgesamt 30 Stück des Produkts X hergestellt.
-
Der Betrieb der Mehrzahl Maschinen 11A bis 11N und der Klimaanlage 13 gemäß den Steuerdaten verbraucht Strom, erzeugt Wärme und ändert die Temperatur in der Fabrik. Die Stromberechnungseinheit 15 berechnet den Gesamtstromverbrauch der Mehrzahl Maschinen 11A bis 11N und der Klimaanlage 13 beispielsweise durch Lesen der Ausgaben von Strommessern, die jeweils für die Mehrzahl Maschinen 11A bis 11N und die Klimaanlage 13 bereitgestellt sind. Alternativ kann die Stromberechnungseinheit 15 den Gesamtstromverbrauch durch Lesen der Bearbeitungsbedingungen der Mehrzahl Maschinen 11A bis 11N und der Steuerdaten der Klimaanlage 13 berechnen, da die Bearbeitungsbedingungen der Maschinen 11A bis 11N in einer festen Beziehung zum Stromverbrauch dieser Maschinen stehen und die Leistung der Klimaanlage 13 in einer festen Beziehung zum Stromverbrauch der Klimaanlage steht.
-
Die Temperaturinformationserzeugungseinheit 17 erzeugt Temperaturinformationen durch Messen der Temperatur in der Fabrik. Die Anzahl der Stellen, an denen die Temperatur gemessen wird, ist nicht auf eine beschränkt, sondern kann mehr als eine umfassen, hierin wird jedoch davon ausgegangen, dass die Temperaturinformationen eine Temperatur umfassen. Beispielsweise in dem Fall, in dem die Temperatur während der Bearbeitung bevorzugt nicht niedriger als T°C und nicht höher als U°C sein soll, wird die niedrigste der an einer Mehrzahl Stellen gemessenen Temperaturen zur Aufnahme in die Temperaturinformationen ausgewählt, wenn die Temperaturen niedrig sind, und die höchste der an einer Mehrzahl Stellen gemessenen Temperaturen zur Aufnahme in die Temperaturinformationen ausgewählt, wenn die Temperaturen hoch sind. Die Auswahl einer Temperatur ist jedoch nicht darauf beschränkt und es kann ein Mittelwert an einer Mehrzahl Stellen gemessener Temperaturen zur Aufnahme in die Temperaturinformationen ausgewählt werden. Des Weiteren können Temperaturinformationen, abhängig von der Konfiguration der Maschinenlerneinheit 23, eine Mehrzahl Temperaturen umfassen. Die Temperaturmessung ist ferner nicht auf die Stellen in der Fabrik beschränkt, es können auch Außentemperaturen gemessen werden. Darüber hinaus können Außentemperaturänderungen betreffende Vorhersagedaten von einer externen Quelle erfasst werden.
-
Die Maschinenlerneinheit 23 umfasst eine Zustandsüberwachungseinheit 31, eine Lerneinrichtung 33 und eine Lernsteuereinheit 35. Die Zustandsüberwachungseinheit 31 erhält in jeder Zeiteinheit Daten bezüglich des Produktionsplans, jeweils für die Mehrzahl Maschinen 11A bis 11N und die Klimaanlage 13 bereitgestellte Steuerdaten, den von der Stromberechnungseinheit 15 empfangenen Gesamtstromverbrauch zu vorgegebenen Zeiten des Tages (Spitzenlaststrom) und von der Temperaturinformationserzeugungseinheit 17 empfangene Temperaturinformationen als Zustandsgrößen.
-
Die Lerneinrichtung 33 führt basierend auf den durch die Zustandsüberwachungseinheit 31 erhaltenen Zustandsgrößen ein Lernen durch und gibt, nachdem ein Lernen in ausreichendem Umfang durchgeführt worden ist, für jede der Mehrzahl Maschinen 11A bis 11N und die Klimaanlage 13 gemäß den Daten bezüglich des Produktionsplans vorgesehene Steuerdaten aus. Zu diesem Zeitpunkt kann die Lerneinrichtung 33 eine gemäß den ausgegebenen Steuerdaten erstellte Spitzenlaststromvorhersage zusammen mit Temperaturinformationen nach außen ausgeben und ferner die Taktzeit, die Produktionsabschlussdauer (Lieferzeit) und dergleichen, die sie gemäß den Steuerdaten berechnen kann, separat berechnen und nach außen ausgeben.
-
Die Lernsteuereinheit 35 umfasst eine Belohnungsberechnungseinheit, die Belohnungen berechnet, welche Erwünschtheitsgrade von Produktionsvorgängen angeben, die gemäß den Steuerdaten in der Fabrik ausgeführt werden, eine Speichereinheit, die durch die Zustandsüberwachungseinheit 31 erhaltene Zustandsgrößen und Belohnungssätze speichert, und die Lernsteuereinheit 35, die das durch die Lerneinrichtung 33 basierend auf den Zustandsgrößen und den Belohnungssätzen durchgeführte Lernen steuert.
-
Eine Beschreibung von Lernalgorithmen für die Maschinenlerneinheit 23 folgt später, zunächst wird das Lernverarbeitungsverfahren beschrieben.
-
2 ist ein Flussdiagramm, das einen grundlegenden Verarbeitungsbetrieb des Produktionsleitsystems der ersten Ausführungsform darstellt.
-
Das Produktionsleitsystem der ersten Ausführungsform steuert den Betriebszustand und die Bearbeitungsbedingungen der Mehrzahl Maschinen 11A bis 11N und den Betriebszustand (z. B. Betriebsdauer und Leistung) der Klimaanlage 13 in der Fabrik und ist nicht dazu geeignet, die Fabrik allein zu dem Zweck zu leiten, es der Maschinenlerneinheit 23 zu ermöglichen, zu lernen. Daher bestimmt, wie zuvor, ein Facharbeiter die Steuerdaten und die Fabrik wird in Schritt S101 basierend auf den Steuerdaten geleitet. Dies wird hierin als herkömmlicher Steuerbetrieb bezeichnet. Durch Durchführen eines herkömmlichen Steuerbetriebs wird für jeden Arbeitstag ein Datensatz erhalten, der Steuerdaten, die Produktionsabschlussdauer (Zeitspanne ab dem Start bis zum Abschluss einer Produktion), Änderungen des Spitzenlaststroms betreffende Daten und Änderungen der Temperaturinformationen betreffende Daten umfasst. Bei der ersten Ausführungsform sind die Belohnungen solchermaßen definiert, dass unter der Voraussetzung, dass die Lieferfrist eingehalten wird und die Temperaturbedingungen für die Bearbeitung erfüllt werden, für einen kleineren Maximalwert des Spitzenlaststromverbrauchs am Betriebstag eine höhere Belohnung vergeben wird, wobei solche Belohnungen in Verbindung mit jeweiligen Datensätzen gespeichert werden.
-
Lerndaten können durch eine Computersimulation erhalten werden, wenn die Simulation, die Datensätze als Größen verwendet, welche den Produktionsplan, den Betriebszustand und die Bearbeitungsbedingungen der Mehrzahl Maschinen 11A bis 11N und den Betriebszustand (z. B. Betriebsdauer und Leistung) der Klimaanlage 13 umfassen, hochgenaue Ergebnisse für die Produktionsabschlussdauer (Zeitspanne vom Start bis zum Abschluss der Produktion), Änderungen des Spitzenlaststroms betreffende Daten und Änderungen der Temperaturinformationen betreffende Daten bereitstellen kann, die den Steuerdatengrößen entsprechen. In diesem Fall können anhand von Simulationen zahlreiche Lerndaten erhalten werden, indem Elemente von als Größen verwendeten Datensätzen geeignet (z. B. zufällig) geändert werden.
-
In Schritt S101 wird ein herkömmlicher Steuerbetrieb für ausreichend viele Tage wiederholt, um die Datenmenge zu sammeln, die zum Lernen durch die Maschinenlerneinheit 23 erforderlich ist. Die Anzahl der Wiederholungen (Arbeitstage) wird basierend auf früheren Erfahrungen geeignet bestimmt. Da dieser Betrieb ein Betrieb der Maschinenlerneinheit 23 ist, bei dem Daten zum Durchführen des Lernens gesammelt werden, wird der Betrieb hierin auch als anfänglicher Lernbetrieb bezeichnet.
-
In der Endphase des herkömmlichen Steuerbetriebs (anfänglicher Lernbetrieb) verfügt die Lernsteuereinheit 35 über eine ausreichende Menge von Daten zum Durchführen des Lernens und die Lerneinrichtung 33 führt das Lernen basierend auf den gesammelten Daten durch. Nach einem erfolgreichen Lernen kann die Lerneinrichtung 33 einen Satz vorhergesagter Steuerdaten ausgeben, um unter Berücksichtigung des Produktionsplans gute Belohnungen zu erhalten. Ein Verfahren zum Überprüfen der Eignung der Ausgabe der Lerneinrichtung 33 kann bei Bedarf hinzugefügt werden.
-
In Schritt S103 schaltet die Steuereinheit 20 beim Bereitstellen des Betriebszustands und der Bearbeitungsbedingungen für die Mehrzahl Maschinen 11A bis 11N und des Betriebszustands (z. B. Betriebsdauer und Leistung) für die Klimaanlage 13 Steuerdatenausgaben von der Ausgabe der Basissteuereinheit 21 auf die Ausgabe der Maschinenlerneinheit 23 um.
-
In Schritt S105 werden der/die an die Mehrzahl Maschinen 11A bis 11N ausgegebene(n) Betriebszustand und Bearbeitungsbedingungen sowie der an die Klimaanlage 13 ausgegebene Betriebszustand mit den durch die Maschinenlerneinheit 23 ausgegebenen Steuerdaten gesteuert. Diese Steuerung wird hierin als Lerneinheitssteuerbetrieb bezeichnet. Danach wird der Lerneinheitssteuerbetrieb in Schritt S103 wiederholt.
-
In Schritt S103 werden beim Wiederholen des Lerneinheitssteuerbetriebs neue zum Lernen verwendbare Daten erhalten. Somit führt die Lerneinrichtung 33 bei der ersten Ausführungsform von Zeit zu Zeit ein Lernen durch, das auf dem in Schritt S103 erneut durchgeführten Lerneinheitssteuerbetrieb und dessen Ergebnissen (Produktionsabschlussdauer, Spitzenlaststromänderungen betreffende Daten und Änderungen der Temperaturinformationen betreffende Daten) basiert, um eine noch bessere Steuerung auszuführen. Dieser Lernbetrieb wird hierin als kontinuierlicher Lernbetrieb bezeichnet. Ein kontinuierlicher Lernbetrieb kann immer dann durchgeführt werden, wenn ein neuer Lerneinheitssteuerbetrieb durchgeführt wird oder wenn eine vorgegebene Anzahl Lerneinheitssteuerbetriebsvorgänge durchgeführt worden ist.
-
Die Maschinenlerneinheit 23 kann einen beliebigen Lernalgorithmus verwenden. Die Maschinelerneinheit 23 weist Funktionen zum analytischen Extrahieren, aus einem Satz in die Vorrichtung eingegebener Daten, einer nützlichen Regel, einer Wissensdarstellung, eines Entscheidungskriteriums oder dergleichen, die in dem Datensatz enthalten sind, zum Ausgeben eines Entscheidungsergebnisses und zum Erlernen von Wissen auf. Es gibt verschiedene Techniken dafür, hierin werden jedoch ”bestärkendes Lernen” und ”überwachtes Lernen” verwendet. Beispielsweise wird ”überwachtes Lernen” für den herkömmlichen Steuerbetrieb (anfänglicher Lernbetrieb) in Schritt S101 und ”bestärkendes Lernen” beim Lerneinheitssteuerbetrieb (kontinuierlicher Lernbetrieb) in Schritt S103 verwendet. Zu Beginn von Schritt S103 befindet sich die Lerneinrichtung 33 in einem Zustand, in dem das ”überwachte Lernen” abgeschlossen ist, welcher der Anfangszustand des ”bestärkenden Lernens” ist.
-
Beim Umsetzen der vorstehenden Techniken gibt es eine als ”tiefes Lernen” bezeichnete Technik, bei der eine Extraktion eines Merkmalswerts gelernt wird. Diese maschinellen Lerntechniken (die Lerneinrichtung 33) werden beispielsweise unter Verwendung von z. B. GPGPUs (General-Purpose computing on Graphics Processing Units/Universalberechnung in Grafikverarbeitungseinheiten) oder großen PC-Clustern (Rechnerverbunden) umgesetzt.
-
Als Nächstes wird die Lerneinrichtung 33 genauer beschrieben. Die Lerneinrichtung 33 weist Funktionen zum analytischen Extrahieren, aus einem Satz eingegebener Daten, einer nützlichen Regel, einer Wissensdarstellung, eines Entscheidungskriteriums oder dergleichen, die in dem Datensatz enthalten sind, zum Ausgeben eines Entscheidungsergebnisses und zum Erlernen von Wissen auf. Wie vorstehend beschrieben, umfassen Algorithmen für die Lerneinrichtung 33 ”überwachtes Lernen” und ”bestärkendes Lernen”.
-
”Bestärkendes Lernen” weist die folgenden Elemente auf.
- – Die Maschinenlerneinheit 23 der Steuervorrichtung 20 überwacht den Funktionszustand und den Umgebungszustand.
- – Die Umgebung ändert sich abhängig vom Betrieb.
- – Tatsächliche Spitzenlaststromänderungen betreffende Daten werden in Bezug auf die überwachte Umgebung (Zustandsgröße) überwacht und es wird ein Label (Belohnung) erhalten.
- – Das neuronale Netzwerk (die Funktion) wird aktualisiert, so dass in Bezug auf den Produktionsplan ein Label mit höherer Bewertung erhalten werden kann.
- – Das Lernen beginnt in einem Zustand, in dem die Maschinenlerneinheit 23 keine oder eine unvollständige Kenntnis der Folgen (Spitzenlaststrom) hat, die durch die Umgebung (Zustandsgröße) verursacht werden. Mit anderen Worten, Belohnungen können nur dann als Daten erhalten werden, wenn die Mehrzahl Maschinen (Steuervorrichtungen) 11A bis 11N und die Klimaanlage 13 tatsächlich in Betrieb gesetzt wurden. Folglich werden eine optimale Funktion und Steuerdaten zum Maximieren von Belohnungen durch Versuch und Irrtum erhalten.
- – Das Lernen kann durch Bereitstellen eines Anfangszustands, in dem das Imitieren menschlicher Tätigkeiten durch vorheriges Lernen gelernt wird, an einem guten Ausgangspunkt gestartet werden.
-
Hierin ist ”bestärkendes Lernen” ein Verfahren zum Lernen einer geeigneten Aktion im Hinblick auf die Wechselbeziehungen zwischen Aktionen und der durch die Aktionen beeinflussten Umgebung durch Lernen nicht nur einer Bestimmung und Klassifizierung, sondern auch von Aktionen, z. B. ein Lernverfahren zum Maximieren von zukünftig zu erhaltenden Belohnungen. Dies zeigt, dass Aktionen gelernt werden können, die Auswirkungen auf die Zukunft haben, beispielsweise eine genaue Berechnung eines Maximalwerts des Spitzenlaststroms bei der vorliegenden Ausführungsform. Die weitere Beschreibung verwendet Q-Lernen als Beispiel, die vorliegende Ausführungsform ist aber nicht darauf beschränkt.
-
Q-Lernen ist ein Verfahren zum Lernen eines Werts Q(s, a), der eine Aktion a in einem Umgebungszustand s auswählt. Mit anderen Worten, eine Aktion a, die einen höchsten Wert von Q(s, a) ergibt, wird als optimale Aktion ausgewählt. Zu Anfang ist der korrekte Wert von Q(s, a) für eine beliebige Kombination eines Zustands s und einer Aktion a jedoch völlig unbekannt. Dementsprechend wählt ein Agent (das Subjekt von Aktionen) verschiedene Aktionen a im Zustand s aus und erhält für jede durchgeführte Aktion a eine Belohnung. Dadurch lernt der Agent, eine bessere Aktion, d. h. einen korrekten Wert von Q(s, a), auszuwählen.
-
Des Weiteren ist es erwünscht, die Gesamtsumme der zukünftig zu erhaltenden Belohnungen zu maximieren und somit Q(s, a) = E[Σγtrt] zu erhalten. Hier repräsentiert E[] einen erwarteten Wert, t ist die Zeit, γ ist ein als Diskontierungsrate bezeichneter Parameter, der später beschrieben ist, rt ist die Belohnung zum Zeitpunkt t, Σ ist die Summierung über die Zeit t. Der erwartete Wert in dieser Gleichung wird für den Fall verwendet, dass sich der Zustand gemäß der optimalen Aktion geändert hat, und da die optimale Aktion nicht bekannt ist, wird ein Lernen durchgeführt, während nach einer optimalen Aktion gesucht wird. Eine Formel zum Aktualisieren eines solchen Werts Q(s, a) kann beispielsweise durch den Ausdruck (1) angegeben werden.
-
-
Im Ausdruck (1) ist st ein Umgebungszustand zum Zeitpunkt t und at eine zum Zeitpunkt t ausgeführte Aktion. Die Aktion at ändert den Zustand in st+1. rt+1 repräsentiert die für die Änderung des Zustands vergebene Belohnung. De Term, dem max angehängt ist, ist der Q-Wert, der mit γ multipliziert wird, wenn eine zu dem Zeitpunkt bekannte Aktion a ausgewählt wird, um den höchsten Q-Wert im Zustand st+1 zu zu ergeben. γ ist ein Parameter, der als Diskontierungsrate bezeichnet wird und 0 < γ ≤ 1 erfüllt. α ist ein Lernfaktor, der 0 < α ≤ 1 erfüllt.
-
Der Ausdruck (1) repräsentiert ein Verfahren zum Aktualisieren des Bewertungswerts Q(st, at) einer Aktion at in einem Zustand st basierend auf der als Ergebnis des Versuchs at zurückgeführten Belohnung rt+1. Q(st, at) wird erhöht, wenn die Summe der Belohnung rt+1 und des Bewertungswerts Q(st+1, max at+1) der besten Aktion max a in dem Zustand, der auf den Zustand s folgt und aus der Aktion a resultiert, größer ist als der Bewertungswert Q(st, at) der Aktion a im Zustand s; Q(st, at) wird verringert, wenn die vorstehend genannte Summe kleiner ist als Q(st, at). Mit anderen Worten, der Wert einer bestimmten Aktion in einem bestimmten Zustand wird nahe an die unmittelbar als Ergebnis zurückgeführte Belohnung und den Wert der besten Aktion im darauffolgenden aus der bestimmten Aktion resultierenden Zustand gebracht.
-
Verfahren zum Darstellen von Q(s, a) auf einem Computer umfassen ein Verfahren, bei dem für alle Zustands-/Aktionspaare (s, a) Werte in Form einer Tabelle (Aktionswerttabelle) bereitgestellt werden und ein Verfahren, bei dem eine Funktion zum Approximieren von Q(s, a) bereitgestellt wird. Durch letzteres Verfahren kann der vorstehend genannte Aktualisierungsausdruck (1) durch Anpassen des Parameters der Näherungsfunktion unter Verwendung einer Technik implementiert werden, wie etwa dem stochastischen Gradientenabstiegsverfahren. Ein neuronales Netzwerk, das später beschrieben ist, kann als Näherungsfunktion verwendet werden.
-
Ein neuronales Netzwerk kann auch als Näherungsalgorithmus für eine Wertfunktion beim überwachten Lernen, nichtüberwachten Lernen oder bestärkenden Lernen verwendet werden. Ein neuronales Netzwerk wird durch eine Recheneinrichtung, einen Speicher und andere Einrichtungen zum Implementieren eines neuronalen Netzwerks in Nachahmung eines Modells eines Neurons gebildet, wie beispielsweise in 3 gezeigt. 3 ist eine schematische Darstellung, die ein Modell eines Neurons veranschaulicht.
-
Wie in 3 gezeigt, dient ein Neuron dazu, eine Ausgabe y für eine Mehrzahl Eingänge x zu erzeugen (3 zeigt die Eingänge x1 bis x3 als Beispiel). Jede Eingabe x1 bis x3 wird mit einem der Eingabe x entsprechenden Gewicht w (w1 bis w3) multipliziert. Die Neuronen erzeugen dadurch die Ausgabe y, die durch die Gleichung (2) ausgedrückt wird. Es wird darauf hingewiesen, dass die Eingabe x, das Ergebnis y und das Gewicht w sämtlich Vektoren sind. In der untenstehenden Gleichung (2) ist θ eine systematische Messabweichung und fk eine Aktivierungsfunktion.
-
-
Ein durch Kombinieren der vorstehend beschriebenen Neuronen gebildetes dreischichtiges neuronales Netzwerk ist nachstehend unter Bezugnahme auf 4 beschrieben. 4 ist eine schematische Darstellung, die ein neuronales Netzwerk mit den Gewichten von drei Schichten D1 bis D3 veranschaulicht.
-
Wie in 4 gezeigt, wird eine Mehrzahl Eingaben x (die Eingaben x1 bis x3 werden hierin als Beispiel verwendet) auf der linken Seite des neuronalen Netzwerks eingegeben und die Ergebnisse y (die Ergebnisse y1 bis y3 werden hierin als Beispiel verwendet) werden auf der rechten Seite des Netzwerks ausgegeben.
-
Spezifischer werden die Eingaben x1 bis x3 mit einem entsprechenden Gewicht multipliziert, bevor sie in jedes von drei Neuronen N11 bis N13 eingegeben werden. Die zum Multiplizieren dieser Eingaben verwendeten Gewichte sind kollektiv mit W1 bezeichnet.
-
Die Neuronen N11 bis N13 geben jeweils z11 bis z13 aus. In 4 sind z11 bis z13 kollektiv als Merkmalsvektoren Z1 bezeichnet und können als Vektoren angesehen werden, die durch Extrahieren von Merkmalen von Eingabevektoren erhalten werden. Die Merkmalsvektoren Z1 sind Merkmalsvektoren zwischen den Gewichten W1 und W2. Z11 bis z13 werden mit einem entsprechend Gewicht multipliziert, bevor sie in jedes von zwei Neuronen N21 und N22 eingegeben werden. Die zum Multiplizieren dieser Merkmalsvektoren verwendeten Gewichte sind kollektiv mit W2 bezeichnet.
-
Die Neuronen N21 und N22 geben jeweils z21 und z22 aus. In 4 sind z21 und z22 kollektiv als Merkmalsvektoren Z2 bezeichnet. Die Merkmalsvektoren Z2 sind Merkmalsvektoren zwischen den Gewichten W2 und W3. Z21 und z22 werden mit einem entsprechenden Gewicht multipliziert, bevor sie in jedes von drei Neuronen N31 bis N33 eingegeben werden. Die zum Multiplizieren dieser Merkmalsvektoren verwendeten Gewichte sind kollektiv mit W3 bezeichnet.
-
Schließlich geben die Neuronen N31 bis N33 jeweils die Ergebnisse y1 bis y3 aus.
-
Der Betrieb des neuronalen Netzwerks umfasst einen Lernmodus und einen Wertvorhersagemodus. Beispielsweise werden die Gewichte w im Lernmodus unter Verwendung eines Lerndatensatzes gelernt und der Parameter wird im Vorhersagemodus zum Bestimmen von Aktionen verwendet, die die Steuerung der Mehrzahl Maschinen und der Klimaanlage betreffen. Hier wird nur einfachheitshalber auf ”Vorhersage” Bezug genommen, selbstverständlich kann aber eine Vielzahl von Aufgaben, wie etwa Erfassung, Klassifizierung und Inferenz, durchgeführt werden.
-
Daten, die durch einen tatsächlichen Betrieb der Mehrzahl Maschinen und der Klimaanlage im Vorhersagemodus erhalten werden, können sofort gelernt und in der darauffolgenden Aktion reflektiert werden (Online-Lernen), oder es kann eine Gruppe vorab gesammelter Daten dazu verwendet werden, ein einmaliges Lernen durchzuführen und anschließend in einem Erfassungsmodus unter Verwendung derselben Parameter ein Lernen (Batch-Lernen) durchzuführen. Der Lernmodus kann als zwischenzeitliche Vorgehensweise immer dann zwischengeschaltet werden, wenn eine bestimmte Datenmenge angesammelt worden ist.
-
Die Gewichte W1 bis W3 können durch das Error-Backpropagation-(Fehlerrückführungs-)Verfahren gelernt werden. Fehlerinformationen werden von rechts eingegeben und fließen nach links. Das Error-Backpropagation-Verfahren ist eine Technik zum Anpassen (Lernen) von Gewichten für jedes Neuron, um die Differenz zwischen der der Eingabe x entsprechenden Ausgabe y und der tatsächlichen Ausgabe y (Lehrer) zu verringern.
-
Ein solches vorstehend beschriebenes neuronales Netzwerk kann mehr als drei Schichten haben (zum tiefen Lernen). Es ist möglich, nur anhand von Lehrerdaten automatisch eine Recheneinrichtung zu erhalten, die Merkmale der Eingabe schrittweise extrahiert und ein Ergebnis zurückführt.
-
Ebenso wie beim ”bestärkenden Lernen”, kann ”überwachtes Lernen” unter Verwendung eines Algorithmus eines neuronalen Netzwerks implementiert werden, wobei das neuronale Netzwerk (eine Funktion) immer dann gemäß Lehrerdaten aktualisiert wird, wenn eine Zustandsüberwachung durchgeführt wird. Die vorstehend beschriebenen Label (Belohnungen) können als Lehrerdaten verwendet werden.
-
Bislang wurde das Produktionssteuersystem gemäß der ersten Ausführungsform beschrieben, als Nächstes wird eine zweite Ausführungsform mit konkreten Beispielen für die Steuerdaten beschrieben.
-
5 zeigt eine Anordnung einer Fabrik, die mit einem Produktionssteuersystem gemäß der zweiten Ausführungsform ausgestattet ist.
-
Ebenso wie bei der Fabrik gemäß der ersten Ausführungsform umfasst die Fabrik gemäß der zweiten Ausführungsform eine Mehrzahl Maschinen 11A bis 11N, eine Klimaanlage 13, eine Stromberechnungseinheit 15 und eine Temperaturinformationserzeugungseinheit 17, wobei eine Steuereinheit 20 die Fabrik steuert. Die Steuereinheit 20 umfasst eine Basissteuereinheit 21 und eine Maschinenlerneinheit 23 sowie einen Schalter 25 und führt basierend auf einem Produktionsplan und einem Arbeitsplan, die von außen zugeführt werden, eine Steuerung durch. Der Schalter ist eine Einrichtung zum Umschalten der Steuerung in Schritt S103 von 2 und wird wie vorstehend beschrieben durch Software implementiert.
-
Die 6A und 6B zeigen jeweils eine beispielhafte Darstellung eines Produktionsplans und eines Arbeitsplans gemäß der zweiten Ausführungsform. Der Arbeitsplan stellt Informationen bezüglich der Arbeiter bereit, die zur Arbeit in die Fabrik kommen und sich mit der Produktion beschäftigen, und beeinflusst den Umfang betreibbarer Maschinen. Wenn beispielsweise gemäß dem Arbeitsplan eine ausreichende Anzahl Arbeiter vorhanden ist, können alle Maschine 11A bis 11N jederzeit betrieben werden, wenn gemäß dem Arbeitsplan jedoch nur eine begrenzte Anzahl Arbeiter vorhanden ist, ist der Betriebszustand der Maschinen eingeschränkt, beispielsweise kann eine der Maschinen den ganzen Tag lang nicht betrieben werden oder zwei der Maschinen können nicht zur gleichen Zeit betrieben werden. Einer einfacheren Beschreibung halber wird hierin die Betreibbarkeit der Maschinen durch eine Angabe dargestellt, ob jede Maschine betreibbar oder nicht betreibbar ist. Die Informationen können jedoch nicht nur durch eine Angabe, ob jede Maschine betreibbar oder nicht betreibbar ist, sondern auch durch eine Angabe von Änderungen von Kombinationen gleichzeitig betreibbarer Maschinen dargestellt werden.
-
Ebenso wie bei der ersten Ausführungsform umfasst die Maschinenlerneinheit 23 eine Zustandsüberwachungseinheit 31, ein Lerneinrichtung 33 und eine Lernsteuereinheit 35. Die Lernsteuereinheit 35 umfasst, wie dargestellt, eine Belohnungsberechnungseinheit 41, eine Speichereinheit 43 und eine Aktualisierungseinheit 45. Die Lerneinrichtung 33 kann einen beliebigen der vorstehend beschriebenen Algorithmen verwenden. Die zweite Ausführungsform wird anhand von Beispielen für Daten, die für jede Einheit bereitgestellt werden, genauer beschrieben.
-
Wie in 6A gezeigt, umfasst der Produktionsplan Einträge für die Produktart, Produktzahl, Verfahren zum Herstellen eines Produkts und Lieferfristen und repräsentiert hier die Herstellung von nX Stück einer Produktart X mit einer Lieferfrist tx, wobei jedes Stück des Produkts X durch eine Maschine A tAX(PA(t)) Stunde(n) lang, durch eine Maschine B tBX(PB(t)) Stunde(n) lang, ... und mit einer Maschine N tNX(PN(t)) Stunde(n) lang zu bearbeiten ist. PA(t), PB(t), ..., PN(t) sind Parameter der Bearbeitungsgeschwindigkeit der Maschinen A, B, ..., N und PKMIN(t) < PK(t) < PKMAX(t), wobei K = A, B, ..., N.
-
Wie in 6B gezeigt, wird der Arbeitsplan in Form von Daten bereitgestellt, die die Betreibbarkeit jeder Maschine angeben.
-
Die folgenden Eingabedaten werden für die Basissteuereinheit 21 bereitgestellt:
- – Produktionsplan: 6A,
- – Arbeitsplan: 6B,
- – Funktion zum Erhalten der Zyklusdauer: tAX0(PA(t)), tBX0(PB(t)), ..., tNX0(PN(t)) und
- – Funktion zum Erhalten des Stromverbrauchs: pA0(PA(t)), pB0(PB(t)), ..., pN0(PN(t)), pAIR0(PAIR(t)),
wobei tAX0(PA(t)) eine Funktion zum Erhalten der Zyklusdauer der Maschine A und ebenso für die anderen ähnlichen Terme ist, pA0(PA(t)) eine Funktion zum Erhalten des Stromverbrauchs der Maschine A ist, pAIR0(PAIR(t)) eine Funktion zum Erhalten des Stromverbrauchs der Klimaanlage und ebenso für die anderen ähnlichen Terme ist.
-
Die folgenden Eingabedaten werden für die Zustandsüberwachungseinheit 31 der Maschinenlerneinheit 23 bereitgestellt:
- – Produktionsplan: 6A,
- – Arbeitsplan: 6B,
- – Stromverbrauch in der Fabrik (von der Stromberechnungseinheit 15): pTOTAL(t) und
- – Informationen bezüglich der Temperatur in der Fabrik (von der Temperaturinformationserzeugungseinheit 17): TAIR(t).
-
Zusätzlich zu dem Vorstehenden wird die Ausgabe von der Basissteuereinheit 21 an die Maschinen A bis N und die Klimaanlage oder die Ausgabe von der Lerneinrichtung 33 eingegeben.
-
Der Maschinenlerneinheit 31 werden vorab die folgenden Eingaben zugeführt:
- – Funktion zum Erhalten der Zyklusdauer: tAX0(PA(t)), tBX0(PB(t)), ..., tNX0(PN(t)),
- – Daten zum Definieren des Temperaturbereichs: TMIN, TMAX,
- – Bearbeitungsgeschwindigkeitsparameterbereiche (Ober- und Untergrenzen): PAMIN, PAMAX, PBMIN, PBMAX, ..., PNMIN, PNMAX, und
- – Klimaanlagensteuerbefehlsbereich (Ober- und Untergrenze): PAIRMIN, PAIRMAX. Die Lerneinrichtung 33 gibt Folgendes aus:
- – Bearbeitungsgeschwindigkeitsparameter: PA(t), PB(t), ..., PN(t), wobei PKMIN < PK(t) < PKMAX und K = A, B, ..., N und
- – Klimaanlagensteuerbefehl: PAIR(t), wobei PAIRMIN < PAIR(t) < PAIRMAX.
-
Die Produktionsabschlussdauer des Produkts X wird durch TXEND repräsentiert.
-
Die Lerneinrichtung führt eine Suche durch, wobei der Erfüllung der nachstehenden Bedingungen (1) und (2) Priorität gegeben wird: tXEND < tX (1) und TMIN < TAIR(t) < TMAX (2).
-
Des Weiteren führt die Lerneinrichtung ein Lernen durch, so dass der tägliche Maximalwert von pTOTAL(t) reduziert und gleichzeitig die Bedingungen (1) und (2) erfüllt werden können.
-
Ein Beispiel für ein Verfahren, bei dem ein Facharbeiter die Ausgaben bestimmt, wird nun beschrieben.
-
Zunächst approximiert, durch Annehmen einer ausreichend großen Zahl NX, die Produktionsabschlussdauer des Produkts X tXEND die Taktzeit tXMAX, weshalb die Bereiche von PA(t), PB(t), ..., PN(t) durch die folgende Gleichung bestimmt werden: tXEND = tXMAXNX = max(tAX0(PA(t)), tBX0(PB(t)), ..., tNX0(PN(t))·NX.
-
Ferner gilt die folgende Gleichung und PAIR(t) für TAIR(t) kann durch Vorhersagen von fAIR(PAIR) bestimmt werden, wobei fAIR(PAIR) die aus der Klimatisierung resultierende Temperaturänderung repräsentiert und TO(t) die Temperaturänderung ist, die aus anderen Faktoren als der Klimatisierung resultiert, wie etwa externe Luft- und Wärmequellen. TAIR(t) = TAIR(t – Δt) + fAIR(PAIR(t – Δt)) + TO(t – Δt)
-
Der Stromverbrauch in der Fabrik pTOTAL(t) wird durch die folgende Gleichung vorhergesagt und PA(t), PB(t), ..., PN(t), die den täglichen Maximalwert von pTOTAL(t) minimieren sollen, können bestimmt werden, wobei pO(t) der Stromverbrauch in der Fabrik ausschließlich des Verbrauchs der Maschinen A, B, ..., N und der Klimaanlage ist. In diesem Fall wird angenommen, dass pO(t) eine Konstante ist oder durch Überwachung vorhergesagt wird.
-
-
Wenn Parameter durch einen Menschen bestimmt werden, kann die Genauigkeit von Vorhersagen für Näherungsfehler von tXEND und Funktionen wie etwa pO(t), fAIR(PAIR) und TO(t) durch Wiederholen des Produktionsverfahrens und überwachen tatsächlicher Werte verbessert werden.
-
Es wird nun das Verfahren zum Bestimmen einer Ausgabe bei der zweiten Ausführungsform beschrieben. Die anfängliche Steuerung wird durch die Basissteuereinheit 21 durchgeführt. Die Eingabe in die Maschinenlerneinheit 23 ist beim ”überwachten Lernen” der Lehrer.
-
Die Belohnungsberechnungseinheit 41 berechnet Belohnungen anhand der folgenden Regeln:
- – Wenn die Bedingung (1) und/oder die Bedingung (2) nicht erfüllt werden, wird ein negativer Wert als Belohnung vergeben, und
- – wenn sowohl die Bedingung (1) als auch die Bedingung (2) erfüllt werden, wird ein positiver Wert als Belohnung für eine Änderung zu einer Verringerung des täglichen Maximalwerts von pTOTAL(t) und ein negativer Wert als Belohnung für eine Änderung zu einer Erhöhung des täglichen Maximalwerts von pTOTAL(t) vergeben.
-
Die Speichereinheit 43 speichert Sätze einer Eingabe, einer Belohnung und einer Ausgabe.
-
Die Aktualisierungseinheit 45 aktualisiert eine Modellformel der Lerneinrichtung 33, die zum Bestimmen einer Ausgabe basierend auf einem Satz einer Eingabe, einer Belohnung und einer Ausgabe verwendet wird.
-
Nachdem beim ”überwachten Lernen” Merkmale gelernt wurden, wird die Betriebssteuerung von der Steuerung durch die Basissteuereinheit 21 auf die Steuerung durch die Maschinenlerneinheit 23 umgeschaltet. Der Zustand der Lerneinrichtung 33 zu diesem Zeitpunkt wird als Anfangszustand des ”bestärkenden Lernens” definiert. Die Lerneinrichtung 33 kann die Modellformel durch ”bestärkendes Lernen” aktualisieren. Die Aktualisierungseinheit 45 aktualisiert die Modellformel basierend auf den Daten in der Speichereinheit 43.
-
7 zeigt eine Anordnung einer Fabrik, die mit einem Produktionssteuersystem gemäß einer dritten Ausführungsform ausgestattet ist.
-
Die Fabrik gemäß der dritten Ausführungsform hat eine vergleichbare Anordnung wie die Fabrik gemäß der zweiten Ausführungsform, unterscheidet sich jedoch dadurch, dass jede der Mehrzahl Maschinen 11A bis 11N ein Thermometer und einen Strommesser und die Klimaanlage 13 einen Strommesser umfasst. Die Steuereinheit 20 der dritten Ausführungsform hat eine vergleichbare Konfiguration wie die Steuereinheit 20 der zweiten Ausführungsform.
-
Die 8A und 8B zeigen jeweils eine beispielhafte Darstellung eines Produktionsplans und eines Arbeitsplans gemäß der dritten Ausführungsform.
-
Bei der dritten Ausführungsform lernt die Maschinenlerneinheit 23, Steuerdaten zu erzeugen, die für jede Maschine eine konstante Temperatur aufrechterhalten und den Stromverbrauch der Fabrik bei der Herstellung von drei Produktarten X, Y und Z unter Verwendung der Maschinen A, B, ..., N gemäß dem Produktionsplan von 8A und dem Arbeitsplan von 8B senken. Hier K = A, B, ..., N und L = X, Y, Z.
-
Wie in 8A gezeigt, unterscheidet sich der Produktionsplan (der Produktionsablaufplan) dahingehend, dass drei Arten von Produkten hergestellt werden, die Eintragselemente für jedes Produkt sind jedoch dieselben wie bei der zweiten Ausführungsform. Wie in 8B gezeigt, ist der Arbeitsplan derselbe wie bei der zweiten Ausführungsform. Die folgenden Eingaben werden für die Basissteuereinheit 21 bereitgestellt:
- – Produktionsplan: 8A,
- – Arbeitsplan: 8B,
- – Funktion zum Erhalten der Zyklusdauer: tKL0(PK(t)) und
- – Funktion zum Erhalten des Stromverbrauchs: pK0(PK(t)), pAIR0(PAIR(t)).
-
Die folgenden Eingaben werden für die Zustandsüberwachungseinheit 31 der Maschinenlerneinheit 23 bereitgestellt:
- – Produktionsplan: 8A,
- – Arbeitsplan: 8B,
- – Stromverbrauch jeder Vorrichtung: pK(t), pAIR(t),
- – Stromverbrauch in der Fabrik: pTOTAL(t),
- – Temperaturinformationen jeder Vorrichtung: TK(t), TAIR(t) und
- – Informationen bezüglich der Temperatur in der Fabrik: TAIR(t).
-
Der Maschinenlerneinheit 23 werden vorab die folgenden Eingaben zugeführt:
- – Definition des Temperaturbereichs: TMIN, TMAX,
- – Bearbeitungsgeschwindigkeitsparameterbereich (Ober- und Untergrenze): PKLMIN, PKLMAX, und
- – Klimaanlagensteuerbefehlsbereich: PAIRMIN, PAIRMAX.
-
Die Lerneinrichtung gibt Folgendes aus:
- – Betriebsstart-/-stoppbefehl: EKL(t), wobei EKL(t) = 0, 1,
- – Beschleunigungsparameter: PK(t), wobei PKMIN < PK(t) < PKMAX und
- – Klimaanlagensteuerbefehl: PAIR(t), wobei PAIRMIN < PAIR(t) < PAIRMAX.
-
Wenn EKL(t) = 1, wird das Produkt L durch die Maschine K zum Zeitpunkt t bearbeitet.
-
Die Produktionsabschlussdauer des Produkts L wird durch TLEND repräsentiert.
-
Die Maschinenlerneinheit 23 führt in Bezug auf alle Einheiten von K und L eine Suche durch, wobei der Erfüllung der nachstehenden Bedingungen (3) und (4) Priorität gegeben wird: tLEND < tL (3), TMIN < TK(t) < TMAX (4).
-
Des Weiteren führt die Maschinenlerneinheit 23 ein Lernen durch, so dass der tägliche Maximalwert von pTOTAL(t) reduziert und gleichzeitig die Bedingungen (3) und (4) erfüllt werden können.
-
Ein Beispiel für ein Verfahren, bei dem ein Facharbeiter die Ausgaben bestimmt, wird nun beschrieben.
-
Als Strategie für die Suche muss die erste Priorität den Produktionsplan erfüllen. Die Suche wird über die Bereiche des Betriebsstart-/-stoppbefehls und des Bearbeitungsgeschwindigkeitsparameters durchgeführt, die tLEND < tL erfüllen. Dabei wird, wenn jede Maschine nicht mehr als ein Produkt bearbeiten kann, die folgende Gleichung in Bezug auf alle Maschinen erfüllt.
-
-
Ein Klimaanlagensteuerbefehl, der die Temperaturbedingung für jeden Punkt innerhalb der Bereiche erfüllt, wird berechnet. Zunächst sei die aus der Klimatisierung resultierende Temperaturänderung fAIR(PAIR) und die aus dem Bearbeitungsgeschwindigkeitsparameter resultierende Temperaturänderung gK(PK(t)). Des Weiteren sei die aus anderen Faktoren als der Klimatisierung, wie etwa externe Luft- und Wärmequellen, resultierende Temperaturänderung TO(t) und durch Annehmen der Konstanten kK und IK kann davon ausgegangen werden, dass die folgenden Gleichungen gelten.
-
-
Alternativ wird durch Überwachen der Beziehung zwischen TAIR(t) und TK(t) der Bereich von TAIR(t) vorhergesagt und verwendet.
-
Durch Berechnen des Stromverbrauchs an jedem Punkt, an dem der Produktionsplan und die Temperaturbedingung erfüllt werden, kann die Ausgabe bestimmt werden, die den täglichen Maximalwert von pTOTAL(t) minimieren soll. Die folgende Gleichung kann erforderlichenfalls verwendet werden, wobei pO(t) den Stromverbrauch in der Fabrik ausschließlich des Stromverbrauchs der Maschinen A, B, ..., N und der Klimaanlage repräsentiert.
-
-
Wenn jedoch zwischen dem berechneten Wert und der tatsächlichen Produktionsabschlussdauer, den tatsächlichen Temperaturänderungen oder dem tatsächlichen Stromverbrauch ein Fehler vorhanden ist, ist es erforderlich, das Berechnungsverfahren zu korrigieren oder unter Berücksichtigung einer Toleranz eine erneute Berechnung durchzuführen.
-
Die anfängliche Steuerung wird durch die Basissteuereinheit 21 durchgeführt. Die Eingabe in die Maschinenlerneinheit 23 ist beim ”überwachten Lernen” der Lehrer.
-
Die Belohnungsberechnungseinheit 41 berechnet Belohnungen anhand der folgenden Regeln:
- – Wenn die Bedingung (3) und/oder die Bedingung (4) nicht für jede Einheit von K und L erfüllt werden, wird ein negativer Wert als Belohnung vergeben, und
- – wenn sowohl die Bedingung (3) als auch die Bedingung (4) für alle Einheiten von K und L erfüllt werden, wird ein positiver Wert als Belohnung für eine Änderung zu einer Verringerung des täglichen Maximalwerts von pTOTAL(t) und ein negativer Wert als Belohnung für eine Änderung zu einer Erhöhung des täglichen Maximalwerts von pTOTAL(t) vergeben.
-
Nachdem beim ”überwachten Lernen” Merkmale gelernt wurden, wird die Betriebssteuerung von der Steuerung durch die Basissteuereinheit 21 auf die Steuerung durch die Maschinenlerneinheit 23 umgeschaltet. Der Zustand der Lerneinrichtung zu diesem Zeitpunkt wird als Anfangszustand des ”bestärkenden Lernens” definiert. Die Lerneinrichtung kann, wenn sie sich in einem fortgeschrittenen Lernzustand befindet, die Modellformel durch ”bestärkendes Lernen” aktualisieren.
-
9 zeigt eine Anordnung einer Mehrzahl Fabriken, auf die ein integriertes Produktionssteuersystem gemäß einer vierten Ausführungsform angewandt wird.
-
Mehrere Fabriken 100P, 100Q, ..., 100S sind jeweils mit Steuereinheiten 20P, 20Q, ..., 20S gemäß der ersten, zweiten oder dritten Ausführungsform ausgestattet. Die Steuereinheiten 20P, 20Q, ..., 20S sind über ein Kommunikationsnetzwerk 120 kommunikationsfähig miteinander verbunden.
-
Des Weiteren ist, wie in 9 gezeigt, eine integrierte Produktionsleiteinheit 110 bereitgestellt, die über das Kommunikationsnetzwerk 120 mit den Steuereinheiten 20P, 20Q, ..., 20S wechselseitig kommunikationsfähig ist. Die integrierte Produktionsleiteinheit 110 integriert und leitet die Mehrzahl Fabriken 100P, 100Q, ..., 100S. Die integrierte Produktionsleiteinheit 110 erzeugt Produktionspläne für die Mehrzahl Fabriken 100P, 100Q, ..., 100S und sendet die derart erzeugten Produktionspläne an die jeweiligen Fabriken.
-
Bei einem integrierten Produktionssteuersystem gemäß der vierten Ausführungsform werden die Ergebnisse des durch die Steuereinheit 20I (I = P, Q, ..., S) einer Fabrik durchgeführten Lernens an die Steuereinheit 203 einer anderen Fabrik gesendet (3 = P, Q, ..., S und J = I). Mit anderen Worten, die Steuereinheiten 20P, 20Q, ..., 20S tauschen über das Kommunikationsnetzwerk 120 Lernergebnisse miteinander aus und nutzen sie gemeinsam. Wenn die Steuereinheit 20J vor dem Start ihres eigenen Lernens von der Steuereinheit 20I Lernergebnisse empfängt, verwendet sie die empfangenen Lernergebnisse als Referenz zum Definieren des Anfangszustands, und wenn sie die Ergebnisse nach dem Durchführen ihres eigenen Lernens empfängt, vergleicht sie ihre eigenen Lernergebnisse mit den Ergebnissen, die sie als Referenz für weiteres Lernen empfangen hat.
-
Das Produktionssteuersystem der vorliegenden Erfindung realisiert ein Produktionssteuersystem, ohne ein Betriebsleitprogramm zu erzeugen und ermöglicht dadurch eine Kostensenkung.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- JP 2011-156598 [0007]
- JP 5818865 [0008]