EP1093639A2

EP1093639A2 - Neuronales netz und verfahren und anordnung zum trainieren eines neuronalen netzes

Info

Publication number: EP1093639A2
Application number: EP99942765A
Authority: EP
Inventors: Volkmar Sterzing
Original assignee: Siemens AG
Current assignee: Siemens AG
Priority date: 1998-07-08
Filing date: 1999-07-01
Publication date: 2001-04-25
Also published as: JP2002520719A; WO2000003355A2; WO2000003355A3

Abstract

In einer ersten Trainingsphase wird ein erstes neuronales Netz (102) mit einem ersten Trainingsdatensatz trainiert. Das erste neuronale Netz und ein zweites neuronales Netz (103) werden in einer zweiten Trainingsphase mit einem zweiten Trainingsdatensatz trainiert, wobei Netzparameter des ersten neuronalen Netzes in der zweiten Trainingsphase unverändert bleiben.

Description

Beschreibung

Neuronales Netz und Verfahren und Anordnung zum Trainieren eines neuronalen Netzes

Die Erfindung betrifft das Trainieren eines neuronalen Netzes .

Ein solches Trainingsverfahren ist aus [1] bekannt.

Bei dem bekannten Trainingsverfahren werden Werte, die ein technisches System beschreiben, gemessen.

Unter einem technischen System ist in diesem Zusammenhang ei- ne technische Anlage, beispielsweise ein chemischer Reaktor oder eine Kläranlage, ein zu modellierender Prozeß, allgemein jedes technische System, welches unter Verwendung gemessener physikalischer Werte oder auch aufgenommener, d.h. aufgezeichneter Werte, beispielsweise bei der Bildverarbeitung, modellierbar ist, zu verstehen.

Als Basis für das Trainingsverfahren werden Werte, die das technische System beschreiben, gemessen. Die physikalischen Meßwerte werden digitalisiert und einer Vorverarbeitung un- terzogen, so daß sie mit einem Rechner verarbeitbar sind.

Anhand der gemessenen Trainingsdaten wird ein Neuronales Netz trainiert .

Ein Trainingsdatum weist mindestens eine Eingangsgröße und mindestens eine der Eingangsgröße zugeordneten Ausgangsgröße, den Zielwert, auf.

Als Trainingsverfahren kann ein Gradientenabstiegsverfahren, beispielsweise das Backpropagation-Verfahren eingesetzt werden. Ebenso können globale Optimierungsverfahren, wie z.B. das BFGS-Verfahren oder auch genetische Algorithmen eingesetzt werden.

Ferner ist es aus [2] bekannt, unter Verwendung eines Netzop- timierungsverfahrens d e Struktur eines neuronalen Netzes im Rahmen des Trainings zu optimieren, indem die Anzahl der Netzparameter (Gewichte und Verbindungen zwischen den Neuronen des neuronalen Netzes) hinsichtlich des Trainingsdatensatzes optimiert wird.

Unter einem Trainingsdatensatz ist im weiteren eine Menge mit einer beliebigen Anzahl von Trainingsdaten zu verstehen.

Ein übliches Netzoptimierungsverfahren ist das Gewichts- Prumng.

Aus [3] ist die rechnergestutzte Generierung künstlicher Trainingsdaten bekannt.

Bei der Bildung eines Modells für ein technisches System unter Verwendung eines neuronalen Netzes tritt häufig das Problem auf, daß man unter einer Vielzahl von Meßwerten, die unterschiedliche Parameter beschreiben, noch nicht diejenigen Parameter kennt, die zur Beschreibung des technischen Systems wesentlich sind, im Gegensatz zu denen, welche keine große Bedeutung aufweisen.

Bei dieser Problemstellung ist es üblich, m einer ersten Meßphase Werte eines technischen Systems zu messen und diese Werte als ersten Trainingsdatensatz zum Trainieren des neuronalen Netzes zu verwenden. Nach Abschluß dieser ersten Trainingsphase werden die Eingangsgroßen, die gemäß der ersten Trainingsphase eine geringere Bedeutung im Rahmen der Modell- beschreibung des technischen Systems innerhalb des neuronalen Netzes aufweisen, nicht mehr weiter verwendet. Es werden m einer zweiten Meßphase nur noch die Eingangsgroßen als Meßwerte des technischen Systems gemessen, deren Bedeutung hinsichtlich der Modellierung des technischen Systems, wie m der ersten Trainingsphase ermittelt, relativ

Das neuronale Netz wird mit den m der zweiten Meßphase ermittelten Werten, die einen zweiten Trainingsdatensatz bilden, m einer zweiten Trainingsphase trainiert.

In der zweiten Trainingsphase werden die Werte der ersten Trainingsphase, die in der zweiten Meßphase nicht mehr gemessen werden, nicht mehr m der zweiten Trainingsphase berücksichtigt .

In [4] ist ein Neuronales Netz mit einer Vielzahl, parallel geschalteter Neuronaler Teilnetze beschrieben, die mit einem gemeinsamen Trainingsdatensatz trainiert werden, wobei die einzelnen Teilnetze sukzessive nacheinander trainiert werden.

Aus [5] sind zwei Neuronale Netze bekannt, die derart miteinander verbunden sind, daß Ausgangswerte eines ersten Neuronalen Netzes Eingangswerte eines zweiten Neuronalen Netzes s nd. Für beide Neuronale Netze werden die gleichen Emgangs- daten verwendet.

In [6] ist ein Lernverfahren für ein Neuronales Netz beschrieben, bei dem das Neuronale Netz derart trainiert wird, daß es ein Abbild eines aktuellen Prozesses bildet. Ferner ist ein Hindergrundnetz vorgesehen, das wahrend des Betriebes mit repräsentativen Prozeßdaten derart trainiert wird, daß es ein Abbild des Prozesses über einen längeren Zeitraum ge it- telt bildet.

Somit liegt der Erfindung das Problem zugrunde, ein neuronales Netz, sowie ein Verfahren als auch eine Anordnung zum Trainieren eines neuronalen Netzes anzugeben, bei dem m ei- ner zweiten Trainingsphase nicht mehr benotigte Trainingsdaten aus einer ersten Trainingsphase im Rahmen des Trainings berücksichtigt werden können.

Das Problem wird durch das Verfahren gemäß Patentanspruch 1, das neuronale Netz gemäß Patentanspruch 11 sowie durch die Anordnung gemäß Patentanspruch 15 gelost.

Bei dem Verfahren zum rechnergestutzten Trainieren eines neu- ronalen Netzes, welches ein erstes neuronales Netz und ein zweites neuronales Netz umfaßt, wird das erste neuronale Netz m einer ersten Trainingsphase mit einem ersten Trainingsdatensatz trainiert. Das erste neuronale Netz und das zweite neuronale Netz werden m einer zweiten Trainingsphase mit ei- nem zweiten Trainingsdatensatz trainiert, wobei Netzparameter des ersten neuronalen Netzes m der zweiten Trainingsphase unverändert bleiben.

Die Anordnung zum Trainieren eines neuronalen Netzes, welches ein erstes neuronales Netz und ein zweites neuronales Netz umfaßt, weist einen Prozessor auf, der derart eingerichtet ist, daß folgende Schritte durchfuhrbar sind:

- das erste neuronale Netz wirα m einer ersten Trainingsphase mit einem ersten Trainingsdatensatz trainiert, - das erste neuronale Netz und das zweite neuronale Netz werden m einer zweiten Trainingsphase mit einem zweiten Trai- nmgsdatensatz trainiert, und

- Netzparameter des ersten neuronalen Netzes bleiben in der zweiten Trainingsphase unverändert.

Das neuronale Netz weist ein erstes neuronales Netz und ein zweites neuronales Netz auf,

- bei dem das erste neuronale Netz m einer ersten Trainingsphase mit einem ersten Trainingsdatensatz trainierbar ist, - bei dem das zweite neuronale Netz m einer zweiten Trainingsphase mit einem zweiten Trainingsdatensatz trainierbar - bei dem Netzparameter des ersten neuronalen Netzes m der zweiten Trainingsphase unveränderbar sind.

Durch die Erfindung wird die Generalisierungsleistung des trainierten neuronalen Netzes erheblich gesteigert. Gleichzeitig wird die Stabilität des durch das neuronale Netz gebildeten Modells für das technische System dadurch erhöht, daß auch unvollständige Trainingsdaten, welche die zu modellierenden Großen nicht enthalten, für die Modellierung ge- nutzt werden können.

Anschaulich ist die Erfindung darin zu sehen, daß Trainingsdaten, deren Eingangsgroßen zum Teil nicht m einer zweiten Trainingsphase gemessen und/oder verwendet werden, für die Modellierung des technischen Systems, d.h. für das Training des neuronalen Netzes, welches als Modell für das technische System verwendet wird, genutzt werden.

Vorteilhafte Weiterbildungen der Erfindung ergeben sich aus den abhangigen Ansprüchen.

In einer Weiterbildung der Erfindung ist es vorteilhaft, daß mindestens eine Eingangsgroße des ersten neuronalen Netzes als Eingangsgroße des zweiten neuronalen Netzes verwendet wird. Durch diese Weiterbildung wird die Qualltat des trainierten neuronalen Netzes hinsichtlich des zu modellierenden technischen Systems weiter verbessert.

Zur weiteren Verbesserung des neuronalen Netzes hinsichtlich der Modellierung des technischen Systems ist es m einer weiteren Ausgestaltung vorteilhaft, m der ersten Trainingsphase auf das erste neuronale Netz ein Netzoptimierungsverfahren anzuwenden, insbesondere da m der ersten Trainingsphase üblicherweise relativ wenige Trainingsdaten zur Verfugung ste- hen, und somit die Zahl der Netzparameter des ersten neuronalen Netzes möglichst gering sein sollte. Die Erfindung kann in jedem neuronalen Netz zur Modellierung eines technischen Systems vorteilhaft eingesetzt werden, insbesondere in einem System, bei dem zu Beginn des Trainings noch nicht bekannt sind, welche gemessenen Werte tatsachlich einen erheblichen Einfluß auf das technische System haben.

Ein Ausfuhrungsbeispiel der Erfindung ist in den Zeichnungen dargestellt und wird im weiteren naher dargestellt.

Es zeigen

Figur 1 eine Skizze eines neuronalen Netzes, die ein Ausfuhrungsbeispiel der Erfindung darstellt; Figuren 2a bis 2c eine Skizze einer Klaranlage mit einer Meßanordnung (Figur 2a) , ein neuronales Netz, welches mit den Trainingsdaten einer ersten

Meßphase trainiert wird (Figur 2b) und das trainierte erste neuronale Netz nach der ersten Trainingsphase (Figur 2c) ; Figur 3 die Klaranlage mit einer Meßanordnung, m der m einer zweiten Meßphase ein zweiter

Trainingsdatensatz ermittelt wird.

Fig.2a zeigt eine Klaranlage 201. Unter vorgegebenen Systemparametern 202 werden m einer ersten Trainingsphase Werte 203 der Klaranlage 201 von mindestens einem Meßgerat 204 gemessen.

In einer ersten Trainingsphase sind folgende Systemparameter 202 vorgesehen: - Uhrzeit der Messung,

- Wochentag der Messung,

- Leitfähigkeit am Zufluß der Klaranlage,

- pH-Wert am Zufluß der Klaranlage,

- Zuflußmenge, - Temperatur,

- gesamter Stickstoffgehalt . Von dem Meßgerat 204 werden an verschiedenen Stellen der Klaranlage 201 folgende Werte gemessen: - Konzentration von Ammonium C :l(NHJ),

- gesamter Stickstoffgehalt, - gesamter Phosphorgehalt,

- Konzentration von Phosphat C1PO3 ),

- Chemischer Summenstoffbedarf (CSB) ,

- gelöster Organischer Kohlenstoff (DOC) ,

- pH-Werte - log CIH3O I der Flüssigkeiten in der Klaranlage 201 an verschiedenen Stellen,

- Konzentration abflltrierbarer Stoffe,

- Konzentration absetzbarer Stoffe.

Die erste Meßphase ist dadurch gekennzeichnet, daß eine ge- genuber einer im weiteren beschriebenen zweiten Meßphase erheblich größere Anzahl unterschiedlicher Werte 203 gemessen wird, jedoch oft nur über einen relativ kurzen Zeitraum.

Die Systemparameter und die gemessenen Werte 203 zu den e- weiligen Systemparametern 202 werden jeweils als Tupel gespeichert und alle ermittelten Tupel m der ersten Meßphase bilden einen ersten Trainingsdatensatz 205.

Mit dem ersten Trainingsdatensatz wird ein erstes neuronales Netz 210 (vgl. Fig.2b) trainiert. Das erste neuronale Netz 210 weist eine Eingangsschicht 211 mit Eingangsneuronen 214, eine verdeckte Schicht 212 mit verdeckten Neuronen 215 und eine Ausgangsschicht mit Ausgangsneuronen 216 auf.

In einer ersten Trainingsphase wird das erste neuronale Netz 210 mit dem ersten Trainingsdatensatz 205 trainiert. Im Rahmen dieses Trainings werden Netzparameter (Gewichte von Kopplungen zwischen Neuronen sowie Kopplungen zwischen Neuronen) gemäß einem bekannten Trainingsverfahren, dem Backpropagati- on-Verfahren trainiert. Dabei werden die Systemparameter 202 an die Eingangsschicht 211 angelegt und es werden Ausgangsgroßen des ersten neuronalen Netzes 210 ermittelt.

Ausgangsgroßen werden mit den jeweiligen, den Systemparametern 202 zugeordneten Werten 203 derart verglichen, daß ein Trainingsfehler ermittelt wird.

Mit dem Tramingsfehler wird das erste neuronale Netz 210 trainiert .

Nach Anwendung eines aus [2] bekannten Netzoptimierungsver- fahren ergibt sich ein m Fig.2c dargestelltes trainiertes erstes neuronales Netz 220. Das trainierte erste neuronale Netz 220 weist wiederum eine Eingangsschicht 221 mit Em- gangsneuronen 224, eine verdeckte Schicht 222 mit verdeckten Neuronen 225 sowie eine Ausgangsschicht 223 mit Ausgangsneuronen 226 auf.

Jedoch sind die Netzparameter des trainierten ersten neuronalen Netzes 220 gegenüber den Netzparametern des untramierten ersten neuronalen Netzes 210 verschieden.

So sind sowohl weniger verdeckte Neuronen 225 als auch weniger Kopplungen zwischen den Neuronen der Eingangsschicht 221 und der verdeckten Schicht 222 sowie den Neuronen der Aus- gangsschicht 223 und den Neuronen der verdeckten Schicht 222 enthalten.

Die erste Trainingsphase erfolgt off-lme, d.h. wahrend der ersten Trainingsphase werden keine neuen Trainingsdaten für den ersten Trainingsdatensatz innerhalb der Klaranlage 201 ermittelt .

Die Klaranlage ist m Fig.3 mit 301 bezeichnet. In einer zweiten Trainingsphase werden nur ein Teil der Werte 203 der ersten Trainingsphase von mindestens einem Meßgerat 304 gemessen mit unterschiedlichen Systemparametern 302.

Die zweite Trainingsphase ist dadurch charakterisiert, daß eine geringere Anzahl von Werten 203 gemessen werden, diesem Fall nur der chemische Summenstoffbedarf CSB sowie die Konzentration des Ammoniums CINH« I .

Dafür wird die zweite Meßphase über einen gegenüber der ersten Meßphase längeren Zeitraum durchgeführt. Die zweite Trainingsphase kann dadurch charakterisiert sein, daß sie online erfolgt, d.h. wahrend der zweiten Trainingsphase können noch Werte 303 m der zweiten Meßphase an der Klaranlage 301 gemessen und als Trainingsdaten einem zweiten Trainingsdatensatz 305 zugeführt werden.

F g.1 zeigt ein neuronales Netz 101, welches das erste neuronale Netz 102, das der ersten Trainingsphase trainiert wurde, sowie ein zweites neuronales Netz 103 umfaßt.

Die Ausgange des ersten neuronalen Netzes 102 sind mit Eingängen des zweiten neuronalen Netzes 103 verbunden. Weitere Eingänge des zweiten neuronalen Netzes 103 sind vorgesehen zur Aufnahme von den Systemparametern, die m der zweiten Meßphase zur Messung der Werte 303 m der zweiten Meßphase verwendet wurden.

Die Systemparameter 302 der zweiten Meßphase werden als Em- gangsgroßen sowohl an das trainierte erste neuronale Netz 102 als auch an das zweite neuronale Netz 103 angelegt.

In dem trainierten ersten neuronalen Netz 102 werden zu den angelegten Eingangsgroßen Ausgangsgroßen gebildet, die an weitere Eingänge des zweiten neuronalen Netzes 103 angelegt werden. In einer verdeckten Schicht 104 des zweiten neuronalen Netzes 103 werden diese Eingangsgroßen weiter verarbeitet und einer Ausgangsschicht 105 des zweiten neuronalen Netzes 105 zugeführt. Die Ausgangsschicht 105 des neuronalen Netzes bildet ebenso die Ausgangsschicht des neuronalen Netzes 101. In der Ausgangsschicht 105 wird mindestens e ne Ausgangsgroße gebildet. Die Ausgangsgroße wird mit den gemessenen Werten 303 der zweiten Meßphase verglichen, wobei die Abweichung der Ausgangsgroße mit dem jeweiligen gemessenen Wert 303 ermittelt wird und mit dem daraus ermittelten Fehler das neuronale Netz 101 trainiert wird, derart, daß folgende Netzparameter des ersten neuronalen Netzes 102 nicht verändert werden.

Nicht verändert werden die Kopplungen und die Gewichte der Kopplungen zwischen der Eingangsschicht 221 und der verdeckten Schicht 222 sowie zwischen der verdeckten Schicht 222 und der Ausgangsschicht 223.

Es ist jedoch im Rahmen des Trainings des neuronalen Netzes 101 möglich, die Gewichte zwischen den Neuronen 226 der Ausgangsschicht 223 des trainierten ersten neuronalen Netzes 102 und Neuronen der verdeckten Schicht 104 des zweiten neuronalen Netzes 103 zu erandern und möglicherweise zu entfernen (Prunmg) , abhangig von dem zweiten Trammgsdatensatz 305.

Anschaulich wird also das neuronale Netz 101 mit dem zweiten Trammgsdatensatz 305 mit einem Lernverfahren trainiert, wobei Netzparameter des ersten neuronalen Netzes 102 nicht verändert werden.

Im folgenden wird allgemein die Erfindung noch einmal erläutert .

Es gebe einen Zusammenhang zwischen on-lme gemessenen Großen XQ, xi, X2, • • • und off-lme durch Analyse ermittelte Großen ZQ, zi, Z2 ... Wegen eines üblicherweise bestehenden, nicht bekannten Zusammenhangs der on-lme gemessenen Großen und off-line gemessenen Großen untereinander laßt sich eine Ausgangsgroße y = zo besser modellieren, wenn als Eingangsgroßen eines neuronalen Netzes sowohl die on-lme gemessene Großen als auch die offline gemessenen Großen zur Verf gung stehen, also die Ausgangsgroße gemäß folgender Vorschrift gebildet wird:

y = ZQ = f(xo xi, X2> ••• ' ^zl> ^z2' •••) ι ⁽D

wobei mit f(.) eine nichtlineare Abbildung bezeichnet wird.

In einem ersten Schritt wird das erste neuronale Netz NNl für alle off-lme gemessenen Großen zo, zι_, Z2, . • . ermittelt ge- maß folgender Vorschrift:

Z = NNl(xo, xi, X2 •••)/ ⁽2⁾

wobei mit NNl ( . ) eine nichtlmeare Abbildung, die durch das erste Neuronale Netz realisiert wird, bezeichnet wird.

Für das gesamte neuronale Netz ergibt sich folgende Abbil- dungsvorschrift :

y = NN2(x₀, xi, X2/.-./NNl(x₀, xi, ^X2, •••)), ⁽3⁾

wobei mit NN2 ( . ) eine nichtlmeare Abbildung, die durch das Neuronale Netz realisiert wird, bezeichnet wird.

Auf diese Weise ist es erstmals möglich, Trammgsdaten, deren gemessene Werte 203 m einer ersten Trainingsphase verwendet, aber m der zweiten Meßphase nicht mehr gemessen und nicht mehr verwendet werden, trotzdem für die Modellierung des technischen Systems insgesamt zu nutzen. Dieser zusatzliche Informationsgewinn fuhrt zu einer verbesserten Modellierung des technischen Systems durch ein neuronales Netz.

Mit der Erfindung wird eine effektive Nutzung der Trammgsdaten des ersten Trainingsdatensatzes 205 sowohl als Zielgroße als auch als Eingangsgroße des neuronalen Netzes 210 ermöglicht, ohne daß sich daraus Einschränkungen für den Einsatz des neuronalen Netzes 101 ergeben.

Im weiteren werden einige Alternativen und Verallgememe- rungsmoglichkeiten des oben beschriebenen Ausfuhrungsbei- spiels dargestellt:

Die Erfindung ist auf keine spezifische Struktur eines neuronalen Netzes beschrankt.

Sowohl die Anzahl der Neuronen als auch die Anzahl der Schichten m dem neuronalen Netz sind beliebig vorgebbar.

Die Erfindung kann m verschiedensten Bereichen eingesetzt werden, beispielsweise im Rahmen einer:

• Prozeßmodellierung,

• Erstellung von Qualitatsmodellen, z.B. zur Modellierung von Produkteigenschaften, deren Bedeutung zwischen unterschiedlichen Trainingsphasen variiert,

• Fmanzdatenmodellierung beispielsweise zur Berücksichtigung stärkerer Änderungen, die m einem Finanzmarkt auftreten, z.B. bei der Einführung des Euro.

Zu den Eigenschaften des trainierten ersten neuronalen Netzes 220 ist zu bemerken, daß es nicht übertrainiert sein sollte, d.h. kein Overfitt g auftreten sollte. Es ist in diesem Fall besser, eine etwas geringere Approximationsqualität des trainierten ersten neuronalen Netzes 220 in Kauf zu nehmen, um ein stabiles trainiertes erstes neuronales Netz 220 zu erreichen.

Im Rahmen dieses Dokuments wurden folgende Veröffentlichungen zitiert :

[1] A. Zeil, Simulation Neuronaler Netze, Addison Wesley Publishing, 1. Auflage, ISBN 3-89319-554-8, S. 97 - 114 und 555 - 574, 1994

[2] DE 196 11 732 Cl

[3] WO 98/10352

[4] US 5 095 443

[5] DE 43 30 847 AI

[6] DE 196 24 301 AI

Claims

Patentansprüche

1. Verfahren zum rechnergestutzten Trainieren eines Neuronalen Netzes, welches em erstes Neuronales Netz und em zwei- tes Neuronales Netz umfaßt,

- bei dem das erste Neuronale Netz m einer ersten Trainingsphase mit einem ersten Trammgsdatensatz trainiert wird,

- bei dem das erste Neuronale Netz und das zweite Neuronale Netz einer zweiten Trainingsphase mit einem zweiten Trai- ningsdatensatz trainiert werden, und

- bei dem Netzparameter des ersten Neuronalen Netzes m der zweiten Trainingsphase unverändert bleiben.

2. Verfahren nach Anspruch 1, bei dem Trammgsdaten des ersten Trainingsdatensatzes und des zweiten Trainingsdatensatzes zumindest teilweise miteinander übereinstimmen.

3. Verfahren nach Anspruch 1 oder 2, bei dem mindestens eine Ausgangsgroße des ersten Neuronalen Netzes m der zweiten Trainingsphase als Eingangsgroße des zweiten Neuronalen Netzes verwendet wird.

4. Verfahren nach einem der Ansprüche 1 bis 3, bei dem m der ersten Trainingsphase mindestens em Netzopti^¬ mierungsverfahren auf das erste Neuronale Netz angewendet wird.

5. Verfahren nach einem der Ansprüche 1 bis 4, bei dem der erste Trainingsdatensatz weniger Trainingsdaten enthalt als der zweite Trammgsdatensatz.

6. Verfahren nach einem der Ansprüche 1 bis 5,

- bei dem Werte eines technischen Systems gemessen werden, und - bei dem als Tra mgsdaten des ersten Trainingsdatensatzes und/oder des zweiten Trammgsdatensatzes die gemessenen Werte verwendet werden.

7. Verfahren nach Anspruch 6, bei dem das technische System em chemischer Reaktor ist.

8. Verfahren nach Anspruch 6, bei dem das technische System eine Klaranlage ist.

9. Verfahren nach einem der Ansprüche 1 bis 8, bei dem zumindest em Teil der Trammgsdaten des ersten Trainingsdatensatzes und/oder des zweiten Trammgsdatensatzes künstlich generiert werden.

10. Verfahren nach einem der Ansprüche 1 bis 9,

- bei dem wahrend der zweiten Trainingsphase Werte eines technischen Systems online gemessen werden, und

- bei dem die gemessenen Werte zumindest als Teil des zweiten Trainingsdatensatzes verwendet werden.

11. Neuronales Netz mit einem ersten Neuronalen Netz und einem zweiten Neuronalen Netz,

- bei dem das erste Neuronale Netz m einer ersten Trammgs- phase mit einem ersten Trammgsdatensatz tramierbar ist,

- bei dem das zweite Neuronale Netz in einer zweiten Trai- ningsphase mit einem zweiten Trainingsdatensatz tra ierbar

- bei dem Netzparameter des ersten Neuronalen Netzes m der zweiten Trainingsphase unveränderbar sind.

12. Neuronales Netz nach Anspruch 11, bei dem Trammgsdaten des ersten Trainingsdatensatzes und des zweiten Trainingsdatensatzes zumindest teilweise mitem- ander übereinstimmen.

13. Neuronales Netz nach Anspruch 11 oder 12, bei dem mindestens em Ausgang des ersten Neuronalen Netzes mit einem Eingang des zweiten Neuronalen Netzes verbunden

14. Neuronales Netz nach einem der Ansprüche 11 bis 13, bei dem der erste Trammgsdatensatz weniger Trammgsdaten enthalt als der zweite Trammgsdatensatz.

15. Anordnung zum Trainieren eines Neuronalen Netzes, welches em erstes Neuronales Netz und em zweites Neuronales Netz umfaßt, mit einem Prozessor, der derart eingerichtet ist, daß folgende Schritte durchfuhrbar sind:

- das erste Neuronale Netz wird m einer ersten Trammgspha- se mit einem ersten Trammgsdatensatz trainiert,

- das erste Neuronale Netz und das zweite Neuronale Netz werden m einer zweiten Trainingsphase mit einem zweiten Trainingsdatensatz trainiert, und

- Netzparameter des ersten Neuronalen Netzes bleiben m der zweiten Trainingsphase unverändert.

16. Anordnung nach Anspruch 15, bei der der Prozessor derart eingerichtet ist, daß Trammgsdaten des ersten Trainingsdatensatzes und des zweiten Trai- nmgsdatensatzes zumindest teilweise miteinander übereinstimmen.

17. Anordnung nach Anspruch 15 oder 16, bei der der Prozessor derart eingerichtet ist, daß mindestens eine Ausgangsgroße des ersten Neuronalen Netzes m der zweiten Trainingsphase als Eingangsgroße des zweiten Neuronalen Netzes verwendet wird.

18. Anordnung nach einem der Ansprüche 15 bis 17, bei der der Prozessor derart eingerichtet ist, daß m der ersten Trainingsphase mindestens em Netzoptimierungsverfahren auf das erste Neuronale Netz angewendet wird.

19. Anordnung nach einem der Ansprüche 15 bis 18, bei dem der erste Trammgsdatensatz weniger Trammgsdaten enthalt als der zweite Trammgsdatensatz.

20. Anordnung nach einem der Ansprüche 15 bis 19,

- mit einem Meßgerat zur Messung von Werten eines technischen Systems, welches mit dem Prozessor gekoppelt ist, und

- bei der der Prozessor derart eingerichtet ist, daß als Trammgsdaten des ersten Trainingsdatensatzes und/oder des zweiten Trammgsdatensatzes die gemessenen Werte verwendet werden.

21. Anordnung nach Anspruch 20, bei der das technische System em chemischer Reaktor ist.

22. Anordnung nach Anspruch 20, bei der das technische System eine Klaranlage ist.

23. Anordnung nach einem der Ansprüche 15 bis 22, bei der der Prozessor derart eingerichtet ist, daß zumindest em Teil der Trammgsdaten des ersten Trainingsdatensatzes und/oder des zweiten Trainingsdatensatzes kunstlich generiert werden.

24. Anordnung nach einem der Ansprüche 15 bis 23, bei der der Prozessor derart eingerichtet ist, daß

- wahrend der zweiten Trainingsphase Werte eines technischen Systems online gemessen werden, und - die gemessenen Werte zumindest als Teil des zweiten Trainingsdatensatzes verwendet werden.