-
Die Erfindung betrifft ein Verfahren zur Regelung technischer Prozesse, wobei der Prozess durch ein zumindest lokal gültiges Streckenmodell, vorzugweise mit nichtlinearen Modellstrukturen, dargestellt wird, wobei unter Nutzung des Prozessmodells zukünftige relevante Prozessgrößen und Regelgrößen vorherberechnet werden und zumindest der jeweils nächste Stelleingriff optimiert wird, sowie ein Verfahren zur Durchführung von Versuchen auf Prüfständen für ein Fahrzeug, einen Antriebsstrang oder Antriebsstrangkomponenten zum Zweck einer Optimierung kalibrierrelevanter Größen, beispielsweise Abgas- oder Schallemission, Energieumsatz, Fahrbarkeit od. dgl. unter vorgebbaren Randbedingungen, umfassend die Ansteuerung des Prüflings und der Prüfstandsstruktur ausschließlich über elektrische Signale, wobei eine Regelung zumindest eines Parameters auf Basis einer Simulation erfolgt.
-
Viele Regelungsaufgaben im Fahrzeug bzw. in seinen Antriebssystemen und auch beim Betrieb unter Laborbedingungen am Prüfstand beruhen immer noch auf PID-basierten Regelalgorithmen. Beispielsweise ist in der
CN 101067743 eine derartige Methodik beschrieben. Steigende Anforderungen hinsichtlich Qualität und Wirtschaftlichkeit lassen sich auf diese Weise jedoch oft nur mit erheblichen Aufwänden oder häufig nur unzureichend erfüllen. Hier schaffen seit vielen Jahren modellbasierte Regelungsverfahren (MBC...model based control) Abhilfe. Diese Regelkonzepte verfügen, dank ihrer adaptiven Fähigkeit, über die Eigenschaft, geeignet auf Prozessänderungen und Störungen zu reagieren. Konzentrierten sich diese Verfahren in der Anfangszeit auf die Verwendung linearer Modelle, so erfuhren in letzter Zeit nichtlineare Modellstrukturen und die hierauf basierenden Regelungsverfahren eine wachsende Bedeutung (NMBC). Als besonders geeignet haben sich in diesem Zusammenhang neuronale Realisierungen der Modellkomponenten erwiesen. Unter den MBC-Verfahren stellt die modellbasierte prädiktive Regelung (MPC) eine besonders interessante Variante dar. Deren Prinzip beruht auf der Nutzung des Prozessmodells zur Vorherberechnung zukünftiger Regelgrößen, um Rückschlüsse auf den jeweils nächsten optimalen Stelleingriff ziehen zu können. So ist in der
WO 0179945 ein Methode unter Anwendung einer adaptiven linearen MPC, jedoch ohne konsequent nichtlineares Streckenmodell sowie nichtlinearer Reglerstruktur. Weiterhin wird auch hier der Aspekt retrospektiv und prädiktiv nicht in Kombination berücksichtigt.
-
Bei den meisten industriellen Anwendungen erfolgen diese Vorausrechnungen anhand linearer Prozessmodelle, es wurden aber bereits einzelne, auf nichtlineare Modellbeschreibung basierende Verfahren (NMPC) vorgestellt und auch realisiert. Die
JP 2009068359 offenbart beispielsweise einen Regelungsansatz mit Beobachter bzw. Kalman-Filter zur Schätzung nicht messbarer Systemzustände, anhand derer eine Anpassung einer nichtlinearen Modellstruktur durchgeführt wird.
-
Das Ziel einer modellbasierten Regelung ist die Nutzung zusätzlicher Information aus der Modellbildung, sowohl für die Konzeption als auch für den Betrieb eines Reglers. Dafür gibt es klassische, zumeist auf linearen Modellen basierende Regelungsverfahren, wie etwa die Dead-Beat-Regler, Kompensationsregler, Smith-Prädiktoren oder auf Zustandsbeobachter beruhende Verfahren. Für die Anwendung bei fahrzeugtechnischen Anwendungen sind diese jedoch nicht ausreichend.
-
Die Aufgabe der vorliegenden Erfindung ist daher ein Verfahren, das ein zur Verwendung mit nichtlinearen dynamischen Simulationsmodellen geeignetes Regelverfahren beinhaltet.
-
Zur Lösung dieser Aufgabe ist das eingangs beschriebene Verfahren dadurch gekennzeichnet, dass sowohl für die Strecke als auch für den Regler parametrierbare Modelle herangezogen werden, wobei eine Prädiktion durchführt und verwendet wird, dass aber neben zukünftigem Streckenverhalten auch das aktuelle bzw. vergangene Streckenverhalten verwendet wird.
-
Gemäß einer vorteilhaften Variante ist vorgesehen, dass neben prädizierten zukünftigen Regelabweichungen auch die tatsächlich gemessenen aktuellen sowie vergangenen Prozessgrößen berücksichtigt werden.
-
Gemäß einer erfindungsgemäßen Ausführungsform wird der Verlauf der Führungsgröße postuliert, beginnend bei den Anfangsbedingungen bzw. beim Retrospektivhorizont bis hin zum Prädiktionshorizont, und wird der Prozessausgang unter Zuhilfenahme eines hinreichend parametrierten Modells ersetzt und dient somit der simulierte Verlauf des Modellausgangs als Näherung der Regelabweichung bzw. der Regelgröße.
-
Vorzugsweise kann dabei vorgesehen sein, dass das Streckenmodell zur Näherung der Regelabweichung bzw. zu ihrer Optimierung in umgekehrter Richtung des simulatorischen Informationsflusses genutzt wird.
-
Gemäß einer vorteilhaften Ausführungsform der Erfindung ist weiters vorgesehen, dass messbare aktuelle und vergangene sowie noch die zu ermittelnde zukünftige Stellgrößen zusammengefasst werden, beginnend bei den Anfangsbedingungen bzw. beim Retrospektivhorizont bis hin zum Stell- bzw. Prädiktionshorizont.
-
Eine weitere Ausführungsform der Erfindung sieht vor, dass ein die Regelabweichung minimierendes sowie die Stellgrößen bzw. deren Änderung begrenzendes Gütekriterium unter Verwendung einer genäherten Regelabweichungsgröße bestimmt wird.
-
Gemäß einer vorteilhaften Variante der Erfindung kann das Verfahren weiters dadurch gekennzeichnet sein, dass eine Realisierung der Modellkomponenten basierend auf neuronalen Netzen erfolgt, vorzugsweise mit einer TDNN_Struktur, die auch parametrische Voltera-Reihen etc. beinhalten kann und mit einem geeigneten statischen Approximationskern ausgestattet ist.
-
Eine weitere Variante der Erfindung sieht vor, dass eine Online-Optimierung eines Modellfehlerkriteriums sowie eine Begrenzung der Stellgrößen bzw. Stellgrößenänderung vorgenommen wird.
-
Weiters kann vorgesehen sein, dass der Regler nicht explizit festgelegt wird, sondern nur seine Struktur und dass ein Optimierungsverfahren als eigentlicher Regler fungiert und mittelbar zur Bestimmung optimaler Stellgrößenfolgen eingesetzt wird.
-
Eine weitere Variante des erfindungsgemäßen Verfahrens ist dadurch gekennzeichnet, dass die Reglerstruktur der Struktur des Streckenmodells entspricht.
-
Vorteilhafterweise kann vorgesehen sein, dass eine Regleroptimierung durch geeignete Adaption der Reglerparameter erfolgt.
-
Dabei kann gemäß einer vorteilhaften Variante vorgelagert eine geeignete Festlegung der Streckenmodellparameter erfolgen.
-
Zur Lösung der eingangs gestellten Aufgabe ist ein Verfahren zur Durchführung von Versuchen auf Prüfständen erfindungsgemäß dadurch gekennzeichnet, dass die Regelung gemäß einem der vorhergehenden Absätze erfolgt.
-
Insbesondere ist es vorteilhaft, wenn gemäß einem bevorzugten Ausführungsbeispiel eines derartigen Verfahrens das Verhalten eines menschlichen Fahrers durch einen technischen Regler substituiert wird, unter besonderer Berücksichtigung eines objektivierten und damit reproduzierbaren Verhaltens, wobei der Betrieb des Reglers gemäß einem der vorhergehenden Absätze erfolgt.
-
In der nachfolgenden Beschreibung soll die Erfindung anhand bevorzugter Ausführungsbeispiele und unter Bezugnahme auf die beigefügten Zeichnungsfiguren näher erläutert werden. Dabei zeigt die 1 die Struktur einer modellbasierten Regelung (model-based-control, kurz MBC), möglich sowohl mit seriell-parallel als auch parallel angeordnetem Modell, 2 ist eine Darstellung des Prinzips der modellprädiktiven Regelung (MPC), 3 zeigt die einschränkende Festlegung einer NMPRC-Regelstruktur zur indirekten Adaption der Stellgrößenverläufe, 4 ist eine schematische Darstellung einer NMPRC-Regelstruktur mit jeweils einem TDNN-MLP zur Beschreibung der Strecke und des Reglers, 5 zeigt schematisch den Aufbau eines Rollenprüfstandes mit AVL DriCon samt Integration des NMPRC-Reglers, 5 ist ein Diagramm über das wiederholte Nachfahren von Geschwindigkeitsverläufen im NEDC-Fahrzyklus zum Nachweis der Reproduzierbarkeit von Prüfstandsaufbau und Ansteuerung, und 7 zeigt ein Diagramm der separierten Stellgrößenverläufe für geregelte Beschleunigung via Fahrpedal (X-by-wire) sowie Abbremsung über die Rolle im NEDC-Fahrzyklus.
-
In
1 ist als Ausgangspunkt die klassische seriell-parallele oder parallele (kurz: S/P- oder P-)Modellanordnung mit Erweiterung zu einer modellbasierten Regelung dargestellt, deren originäre Aufgabe die Eliminierung der Regelfehler e
R(k) ist. Eine grundlegende Voraussetzung für die Anwendung ist ein zumindest lokal gültiges Streckenmodell, welches sich kontinuierlich an das Verhalten sowohl eines sich ändernden Prozesses als auch an variierende Betriebsbedingungen adaptieren kann, also für alle M Stützstellen die Modellfehler e
M(k) eliminiert. Dieses ist wie üblich anhand einer online durchzuführenden Optimierung eines Modellfehlerkriteriums sicherzustellen. Im Weiteren wird vorausgesetzt, dass trotz ggf. unterschiedlicher Modellanordnungen, für das Prozessmodell und für den Regler gleiche Strukturen verwendet werden, die sich allerdings hinsichtlich ihrer Parametrierung grundsätzlich unterscheiden. Demzufolge ergibt sich o. E. d. A. der Modellausgang entweder in Zustandsraumdarstellung
oder – in P-Modellanordnung als Differenzengleichung n-ter Ordnung
jeweils in Abhängigkeit von einem Parametervektor p. In der Gleichung (2) und nachfolgend kommen Ketten verzögerter Systemgrößen
ξχ(k) := [χT(k), χT(k – 1), ..., χT(k – (n – 1))]T (3) zur Anwendung, wobei χ als Platzhalter für Stellgröße bzw. Modell- und Prozesseingang u, Reglereingang u
R und Regelgrößen y
R bzw. je nach Modellanordnung Prozessausgang y
P und Modellausgang y fungiert. Der Ausgang des Reglers wird hingegen in Zustandsraumdarstellung
bzw. als Differenzengleichung
in Abhängigkeit vom Parametervektor p
R ermittelt. Die Regleroptimierung verlagert sich hierdurch auf eine geeignete Adaption von p
R.
-
Nun wirkt sich eine Parameteränderung ΔpR zwar direkt auf die Stellgröße u, aber auf den zu eliminierenden Regelfehler eR nur mittelbar aus, d. h. über die, den Prozess beschreibenden Funktionen, die jedoch als nicht oder ungenau bekannt vorauszusetzen sind. Und im Gegensatz zur Modelloptimierung kann daher die Auswirkung der Parameter pR auf die Zielgröße yp nicht als vollständig bekannter funktionaler Zusammenhang formuliert und somit auch nicht zur Regleroptimierung herangezogen werden. In diesem Zusammenhang kommt die oben angedeutete „Nutzung der zusätzlichen Information aus der Modellbildung” konkret zur Anwendung und zwar unter Zuhilfenahme des hinreichend parametrierten Modells bzw. seiner Abbildungsvorschrift im Austausch mit der des Prozesses. So setzt sich aus den Modell- und Regler-Zustandsraumdarstellungen (1) und (4) eine Näherung der Regelgröße yP(k) ≈ y(k) = fZR(x(k – 1), fZR(xR(k – 2), uR(k – 2), pR), p) (6) zusammen, anhand derer eine Näherung des Regelfehlers eR(k) = yS(k) – (eM(k) + y(k)) ∀ k = 1, ..., M
yS(k) – y(k) ∀ min p eM(p)e T / M(p)
e ..R(k) = (pR, p) (7) eliminiert werden kann. Die oben durchgeführte Näherung der Regelgröße gemäß Gleichung (6) kann in analoger Weise auch für die Differenzengleichungen (2) und (5) durchgeführt werden, wie weiter unten noch erläutert wird. Das hier allgemein beschriebene Regelungsverfahren konnte auch bereits erfolgreich für eine spezielle neuronale Struktur abgeleitet und verwendet werden.
-
Als modellbasierte prädiktive Regelung (model predictive control, kurz MPC) wird kein spezielles Regelungsverfahren, sondern vielmehr eine ganze Klasse von Regelungsmethoden bezeichnet. Die Methodik besteht darin, ein Prozessmodell nicht nur zum Reglerentwurf, sondern auch während des Reglerbetriebs zu verwenden, um insbesondere die zukünftigen Verläufe relevanter Prozessgrößen vorherzusagen und die Stellgrößen in spe dahingehend zu optimieren, dass eine prädizierte Regelabweichung minimal wird. Das Prinzip dieser Art von Regelung lässt sich recht anschaulich anhand einiger beispielhaft angenommen Verläufe relevanter Prozessgrößen erläutern, wie etwa in 2 dargestellt.
-
Die Ausgangssituation gemäß 2 stellt sich wie folgt dar: Bis zur aktuellen Messung M ist im unteren Diagramm links der messbare Stellgrößenverlauf u(k) ∀ k ≤ M dargestellt, welcher sich innerhalb der zulässigen Stellgrenzen u ∊ [umin; umax] bewegt. Im oberen Diagramm links sei die Reaktion des Prozesses bzw. des Modells – als messbarer Regelgrößenverlauf yP(k) ≈ y(k) ∀ k ≤ M – ebenfalls bis zur aktuellen Messung M skizziert. Die Regelgröße y bzw. yP folgt dem Sollwert yS, d, h. dem dick-dünn gestrichelten Verlauf der Führungsgröße yS(k) ∀ k ≤ M in geeigneter Weise, zumindest bis zur aktuellen Messung M. Zum Zeitpunkt k = M sei nun weiterhin angenommen, dass für ein zukünftiges Zeitfenster – bis zum sog. Prädiktionshorizont nP – ein Führungsgrößenverlauf yS(k) ∀ k = M + 1, ..., M + nP vorausgesetzt wird, wie rechts im oberen Diagramm von Bild 2 als dick-dünn gestrichelte Linie eingezeichnet. Ohne weitere Messungen – die zu diesem Zeitpunkt ohnedies nicht verfügbar sind – kann anhand eines geeignet parametrierten Prozessmodells ein Regelgrößenverlauf y(k) ∀ k = M + 1, ..., M + nP prädiziert werden. Unter der unprätentiösen Annahme, dass sich die Stellgröße u ab dem Zeitpunkt k = M nicht mehr ändert, wie rechts im unteren Diagramm als grau gepunkteter Verlauf u(k) = u(M) ∀ k > M dargestellt, ergibt sich möglicherweise ein, im oberen Diagramm grau gepunktet skizzierter Verlauf für die Regelgröße y, die der Sollwert-Trajektorie der Führungsgröße yS nur unzureichend folgt. Unter Annahme einer anderen Stellgrößenfolge sollte sich dieses Ergebnis deutlich verbessern lassen.
-
Die eigentliche Regelungsaufgabe des MPC-Verfahrens besteht nun darin, eine bis zum sog. Stellhorizont n
S ≤ n
P reichende Stellgrößenfolge u(k) ∀ k = M + 1, ..., M + n
S zu ermitteln, mit welcher alle prädizierten Regelabweichungen
|yS(k) – y(k)| ∀ k = M + 1, ..., M + nP (8) in Summe minimal werden. Dieses motiviert die Aufstellung eines Gütekriteriums
bei dem zusätzlich noch die Änderung der Stellenergie berücksichtigt werden kann, ganz im Sinn konventioneller Ansätze zur optimalen Regelung. Die Balance zwischen Regelabweichung und Stellenergieänderung erfolgt durch Festlegung der Parameter Q
k > 0, die entweder als Skalarwerte kollektiv auf jede Änderung u(k + 1) – u(k) ∀ k > M innerhalb des Stellhorizonts einwirken oder als Diagonalmatrizen zusätzlich auf jeden einzelnen Eingang u
l ∀ i = 1, ..., N
u. Das Gütekriterium JMPC kann darüber hinaus um einen Term zur Berücksichtigung der absoluten Stellenergie erweitert werden, was jedoch eine bleibende Regelabweichung verursacht.
-
In 2 ist rechts im unteren Diagramm eine bis zum Stellhorizont nS reichende Stellgrößenfolge skizziert, die offensichtlich das Gütekriterium JMPC gemäß Gleichung (9) hinreichend berücksichtigt, da der im oberen Diagramm skizzierte Verlauf der zugehörigen Regelgröße y dem dick-dünn gestrichelten Verlauf der postulierten Führungsgröße yS(k) ∀ k = M + 1, ..., M + nP deutlich besser folgt. In dieser Hinsicht stellt die modellbasierte prädiktive Regelung eine optimale Regelung dar, da zu jedem Zeitpunkt M eine optimale Stellgrößenfolge uMPC(k) ⇐ min u(k) JMPC ∀ k = M + 1, ..., M + nS (10) durch Minimierung eines Gütekriteriums ermittelt werden kann, also für jeden Abtastschritt während der Regelung. Nach dem Prinzip des zurückweichenden Horizonts wird dann nur der erste Wert der optimalen Stellgrößenfolge uMPC an den Prozess ausgegeben, d. h. die weiter in der Zukunft liegenden Einträge werden verworfen, da sie im nächsten Abtastschritt unter Berücksichtigung aktueller Prozessmessungen ohnehin neu bestimmt werden.
-
In den häufigsten Anwendungen zur modellprädiktiven Regelung kamen bislang zur Nachbildung des Prozesses lineare Modelle zum Einsatz oder zumindest um die Referenztrajektorie linearisierte Varianten. Eine Berücksichtigung nichtlinearer Prozesseigenschaften im Modell führt jedoch zu einer realistischeren Nachbildung und damit zu genaueren Modellen. Hierdurch kann auch eine Regelung, die auf nichtlinearen Modellen basiert, solche Prozesse präziser zu einem gewünschten Verhalten führen. Da viele industrielle Prozesse über ein ausgeprägtes nichtlineares Verhalten verfügen, verspricht der Einsatz nichtlinearer Modelle bzw. prädiktiver Regelungsmethoden mit nichtlinearen Simulationsmodellen ein erhebliches Potential, wie bereits anhand einer Vielzahl von Anwendungen beschrieben ist. Allerdings ist die Verbesserung der Regelgenauigkeit mit einem deutlich erhöhten Rechenaufwand verbunden. Den meisten Ansätze zur modellprädiktiven Regelung ist gemein, dass die Struktur des Reglers nicht explizit festgelegt wird, sondern ein Optimierungsverfahren als eigentlicher Regler fungiert und unmittelbar zur Bestimmung optimaler Stellgrößenfolgen eingesetzt wird. So wurde beispielsweise vorgeschlagen, die optimale Stellgrößenfolge direkt durch Minimierung des Gütekriteriums JMPC gemäß der Gleichungen (9) und (10) mittels quadratischer Programmierung bzw. Optimierung zu ermitteln.
-
Erfindungsgemäß wird nun eine nochmalige Verbesserung der bislang dargestellten Ansätze dadurch erreicht, dass ein kombiniertes Regelungsverfahren konzipiert wird, das als Ansatz sowohl zur prädiktiven als auch zur retrospektiven Regelung mit nichtlinearen Simulationsmodellen charakterisierbar ist. Es verbindet die Ansätze NMBC und den Gedanken modellprädiktiver Regelung zu einem NMPRC-Regelungskonzept, welches folglich neben prädizierten zukünftigen Regelabweichungen auch die tatsächlich gemessenen aktuellen sowie vergangenen Prozessgrößen berücksichtigt. Weiterhin soll hierbei die Reglerstruktur explizit festgelegt werden und o. E. d. A. der Struktur des Streckenmodells entsprechen. In 3 ist eine für das NMPRC-Regelungsverfahren grundsätzlich geeignete Struktur dargestellt. Hieraus wird ersichtlich, dass sich die Regleroptimierung auf eine geeignete Adaption der Reglerparameter pR und damit nur mittelbar auf die Stellgröße verlagert.
-
Wie bereits thematisiert, stellt eine Berücksichtigung der Prozessgrößen – beginnend beim Retrospektivhorizont n
R ≤ M bis hin zum Prädiktionshorizont n
P – die Basis für eine Anwendung des NMPRC-Regelungsverfahrens dar. Zunächst wird hierzu der Verlauf der Führungsgröße y
S(k) ∀ k = M – n
R + 1, ..., M + n
P als Sollwertmatrix
postuliert, die sämtliche Führungsgrößen, beginnend beim Retrospektivhorizont n
R bis hin zum Prädiktionshorizont n
P, beinhaltet. Der ohnehin nur bis zum Zeitpunkt M verfügbare und insbesondere hinsichtlich seiner nicht oder nur ungenau bekannten Abbildungsvorschrift als Regelgröße ungeeignete Prozessausgang y
P wird unter Zuhilfenahme eines hinreichend parametrierten Modells ersetzt. Somit dient der simulierte Verlauf des Modellausgangs y(k) ∀ k = M – n
R + 1, ..., M + n
P als Näherung der Regelgröße in Form einer Regelgrößenmatrix
wiederum mit sämtlichen Näherungen der Regelgröße, vom Retrospektivhorizont n
R bis hin zum Prädiktionshorizont n
P. Und schließlich werden neben den messbaren aktuellen und vergangenen auch noch die zu ermittelnden zukünftigen Stellgrößen u(k) ∀ k = M – n
R + 1, ..., M + n
P in einer Stellgrößenmatrix
zusammengefasst, wiederum beginnend beim Retrospektivhorizont n
R aber nur bis hin zum Stellhorizont n
S ≤ n
P.
-
Das in Gleichung (9) formulierte MPC-Gütekriterium lässt sich nun, unter Verwendung einer genäherten Regelabweichungsmatrix
analog ausdrücken als NMPRC-Gütekriterium
wobei die Balance zwischen Regelabweichung und Sellenergie – für alle N
u Eingänge u
i in gleicher Weise – durch Festlegung der Parametermatrix QP
R > 0 erfolgt. Sowohl die simulierten Verläufe des Modellausgangs y(k) ∀ k = M – n
R + 1, ..., M + n
P, in der genäherten Regelgrößenmatrix Y(PR) gemäß Gleichung (12), als auch die Stellgrößen u(k) ∀ k = M – n
R + 1, ..., M + n
P, in der Stellgrößenmatrix U(PR) aus der Gleichung (13), lassen sich mit dynamischen globalen Modellen realisieren. Also lässt sich anhand der Zustandsraumdarstellung nach Gleichung (6) bzw. Differenzengleichungen (2) und (5) der Reglerausgang und Regelgröße nachrangig in Abhängigkeit von den Parametervektoren p
R und p ermitteln.
-
Das NMPRC-Regelungsverfahren verbindet die Ansätze der modellbasierten Regelung (N)MBC mit den Gedanken modellprädiktiver Regelung (N)MPC zu einem kombinierten Konzept, welches neben prädizierten zukünftigen Regelabweichungen auch die tatsächlich gemessenen aktuellen sowie vergangenen Prozessgrößen nicht unberücksichtigt lässt. Letzteres ist insbesondere dann von Interesse, wenn Betriebsbereiche wiederholt durchlaufen werden. Das NMPRC-Regelungsverfahren lässt sich somit als Ansatz sowohl zur prädiktiven als auch Zur retrospektiven Regelung mit nichtlinearen dynamischen Simulationsmodellen charakterisieren. Als Modellstrukturen kommen sowohl für das Streckenmodell als auch für den eigentlichen Regler die u. a. in [14] und 115] intensiv behandelten und als vorteilhaft bewerteten TDNN-Strukturen mit dreischichtigem (N
u|N|N
y)-MLP als statischen Approximationskern zur Anwendung. So kann das Streckenmodell als TDNN-MLP-Modellgleichung
formuliert werden, mit geeignet dimensionierten Wichtungen W
1,y, W
1,u, b
1, W
2, b
2 bzw. Wichtungsgesamtvektor w
MLP und Aktivierungsfunktion σ (z. B. tanh). In
4 ist eine für das NMPRC-Regelungsverfahren geeignete Struktur mitsamt eingebetteter TDNN-MLP dargestellt, anhand derer diese performante Regelungsmethodik im Detail nachvollzogen und weiterhin konkret umgesetzt werden kann. Wie
4 weiterhin zu entnehmen ist, verlagert sich die Anpassung bzw. Optimierung des Reglers auf eine geeignete Adaption der Reglermodellparameter w
R und damit nur mittelbar auf die Stellgröße u. Diesem vorgelagert ist eine geeignete Festlegung der Streckenmodellparameter w, die fortan als wMLP bezeichnet werden.
-
Die Parametrierung des Streckenmodells im Rahmen des NMPRC-Regelungsverfahrens kann sowohl mittels Levenberg-Marquardt (kurz: LM) erfolgen oder aber mittels Backpropagatian (kurz: BP). Weiterhin können sowohl die Parametrierung als auch die Nachbildung grundsätzlich in S/P- und/oder P-Modellanordnung erfolgen. Dargestellt in 4 wird jedoch eine Formation mit der das Training des Streckenmodells bei zumutbarem Parametrieraufwand in S/P-Konfiguration erfolgen kann, um anschließend zur Simulation auf P-Anordnung zu wechseln.
-
Eine Anwendung des LM-Verfahrens auf ein TDNN-MLP in S/P-Modellanordnung zielt darauf ab, die Residuen, d. h. die Abweichungen zwischen Prozess- und TDNN-MLP-Ausgang
einer gemessenen Folge mit M Stützstellen zu eliminieren. Bei geeignetem, also möglichst kleinem μ ≥ 0, kann mit einer Wichtungsänderung
das Fehlerkriterium
mit jeder Iteration verkleinert werden, bis ein lokales Minimum erreicht wird.
-
Beim BP-Verfahren kann dagegen mit einer Wichtungsänderung
bei geeignetem – d. h. einem möglichst kleinem β ≥ 0 – das Fehlerkriterium nach Gleichung (19) lokal minimiert werden.
-
Für beide Lernverfahren sind keinerlei Modifikationen an den Streckenmodell, bzw. Modellfehlermatrizen hinsichtlich des Prädiktionshorizonts nP notwendig, da die Parametrierung des Streckenmodells ohnehin nur bis zur letzten verfügbaren Messung M des Prozessausgangs durchgeführt werden kann. Lediglich eine Verringerung des Retrospektivhorizonts nR bedingt eine geringfügige Anpassung durch entsprechende Reduzierung der Matrizengrößen. Zum Zeitpunkt M kann allerdings zur Simulation auf die P-Anordnung gewechselt werden und mit dem aktuellen Wichtungssatz wMLP sowie abhängig von der Stllgrößenmatrix U(P) bzw. den zugehörigen Eingangsfolgen ξu die Regelgrößenmatrix Y(PR) und insbesondere die Anteile Y(P) ermittelt werden. Wie nachfolgend beschrieben, kann hiermit die Adaption des NMPRC-Reglermodells durchgeführt werden.
-
Die Parametrierung des eigentlichen Reglermodells im Rahmen des NMPRC-Regelungsverfahrens kann ebenfalls mittels Levenberg-Marquardt- oder aber mittels Backpropagation-Verfahren erfolgen und zwar hinsichtlich der Reglermodellparameter w
R bzw. w
R,MLP. In Ermangelung eines Referenzverlaufs für die Stellgrößen u(k) ∀ k = M – n
R + 1, ..., M + n
P bzw. für die Stellgrößenmatrix
können Parametrierung und Nachbildung jedoch ausschließlich in P-Modellanordnung erfolgen, wie auch in
4 dargestellt. Die NMPRC-Regelaufgabe besteht nun darin, das zuvor in der Gleichung (15) formulierte Gütekriterium
und damit neben der genäherten Regelabweichung (vgl. Gl. (14))
auch die Stellenergie hinsichtlich der Reglermodellparameter w
R,MLP zu minimieren, unter der weiteren Annahme einer positiv definiten, symmetrischen Parametermatrix QP
R = QTP
R > 0.
-
Zugunsten der Übersichtlichkeit erfolgen die nachfolgenden Betrachtungen lediglich für das Backpropagation-Verfahren, lassen sich jedoch in einfacher Weise auf das LM-Verfahren übertragen. Demzufolge ergibt sich als Wichtungsänderung
worin die partiellen Ableitungen der Regelgrößenmatrix Y(PR) und der Stellgrößenmatrix U(PR) zur Anwendung kommen, die nachfolgend unter Verwendung des TDNN-MLP und damit in expliziter Abhängigkeit von den Reglermodellparametern w
R,MLP formuliert werden.
-
Zunächst sei in diesem Zusammenhang die Stellgrößenmatrix U(PR) oder vielmehr in Bezug auf Gleichung (21) ihr Retrospektivanteil
sowie ihr Prädiktivanteil
zumindest bis hin zum Stellhorizont n
S ≤ n
P, unter Verwendung einer TDNN-MLP-Struktur formuliert.
-
Als Näherungen der tatsächlichen Regelgröße y
P(k) ≈ y(k) ∀ k = M – n
R + 1, ..., M + n
P, vom Retrospektivhorizont n
R bis hin zum Prädiktionshorizont n
P, kann die Regelgrößenmatrix
unter Verwendung beider TDNN-MLP-Strukturen aus Bild 4 formuliert werden, wonach ihr Retrospektivantell
sowie ihr Prädiktivanteil
lauten. Hierbei muss beachtet werden, dass im Übergang von der Gleichung (28) auf (29) die Umschaltung des Streckenmodells von S/P- auf P-Modellanordnung erfolgt und die nicht messbaren Anteile in den Ketten verzögerter Regelgrößen
wiederum selbst über ξu vom Reglermodellparameter W
R,MLP abhängen. Dieses gilt es vornehmlich bei der Bestimmung der partiellen Ableitungen der Wichtungsänderung gemäß Gleichung (24) geeignet zu berücksichtigen. Um die Wichtungsänderung mit geringstem Aufwand zu ermitteln, können sämtliche mit
R indizierten und mit der M-ten Abtastung verfügbaren Elemente auf der rechten Seite der Gleichung (30) durch die zugehörigen Messwerte ersetzt werden.
-
Insbesondere muss aber berücksichtigt werden, dass in jedem Fall eine weitere implizite Abhängigkeit vom Reglermodellparameter w
R,MLP in den Gleichungen (25) und (26) sowie in den Gleichungen (28) und (29) inhärent vorliegt und zwar über die Ketten verzögerter Stellgrößen
so dass zur Bestimmung der partiellen Ableitungen der Wichtungsänderung gemäß Gleichung (24) nicht nur die wichtungsabhängige Modellfunktion f
MLP selbst, sondern auch die zugehörigen inneren Ableitungen gebildet werden müssen und zwar bis hin zu den Anfangsbedingungen bzw. zum Retrospektivhorizont n
R. Die Komplexität der Adaptionsregel motiviert die Anwendung des bereits im Zusammenhang mit onlinefähigen Lernverfahren vorgestellten Real Time Recurrent Learning- oder kurz RTRL-Algorithmus, welcher bei fixer Netzgröße unabhängig von der Länge M der zu erlernenden Sequenzen mit beschränktem Speicherplatz auskommt. Als weitere Maßnahme, um die Wichtungsänderung mit vertretbarem Aufwand zu ermitteln, können sämtliche verzögerten Stellgrößen in den Ketten gemäß Gleichung (31) – die mit der M-ten Abtastung aus vorhergehenden Iterationen verfügbar sind durch die zugehörigen Messwerte ersetzt werden.
-
In den vorhergehenden Betrachtungen wird das für modellprädiktive Regelungen übliche Prinzip eines zurückweichenden Horizonts automatisch berücksichtigt, da die Wichtungsänderungen gemäß der Gleichungen (20) und (24) samt aller partiellen Ableitungen mit jeder Iteration neu bestimmt werden. Abschließend sei noch vermerkt, dass zur Realisierung des NMPRC-Regelungsverfahrens die bereits in anderem Zusammenhang als vorteilhaft bewerteten TDNN-Strukturen mit dreischichtigem (Nu|N|Ny)-MLP als statischer Approximationskern sowohl für das Streckenmodell als mich für den eigentlichen Regler zur Anwendung kamen, weil hierfür u. a. ein Stabilitätskriterium verfügbar ist, welches sich in ein Lernverfahren integrieren lässt. Um für die in 4 dargestellte NMPRC-Regelstruktur eine Mindestanforderung an Robustheit gewährleisten zu können, hat die Integration des Stabilitätskriteriums sinngemäß zu erfolgen.
-
Als mögliche industrialisierte Anwendung der zuvor beschriebenen adaptiven NMPRC-Reglerstruktur wurde das Abfahren von Emissionszyklen auf Rollenprüfständen identifiziert. Bekanntermaßen hat das individuelle Fahrerverhalten der Versuchsingenieure – insbesondere im Hinblick auf die stetig sinkenden gesetzlichen Emissionsgrenzwerte – einen massiven Einfluss auf das eingefahrene Emissionsergebnis, selbst bei Einhaltung der gesetzlich vorgegebenen Test- und Prüftoleranzen. Um vor diesem Hintergrund, den Einfluss von Änderungen bei der Motorkalibrierung eindeutig erfassen bzw. bewerten zu können, ist eine hohe Reproduzierbarkeit bei der Stimulation des Prüflings bzw. des Fahrzeugs notwendig. Klassische Fahrroboter stoßen hierbei aufgrund ihrer systembedingten Ansteuerung über mechanische Stellglieder häufig an ihre Grenzen. Deshalb wurden Fahrersysteme entwickelt, welche die Fahrzeugansteuerung ausschließlich über elektrische Signale durchführt, beispielsweise das AVL-System AVL DriCon. Wie aus 5 ersichtlich, wird das Fahrersystem zur Fahrzeugbeschleunigung an Stelle des realen Fahrpedals mit dem Fahrzeugsteuergerät (ECU) verbunden, welches ansonsten mit den tatsächlich gemessenen, üblichen Eingangssignalen versorgt wird. zur Verzögerung des Fahrzeugs kann bei rein hydraulischen Bremssystemen nicht die Betriebsbremse genutzt werden, allerdings lässt sich eine Verzögerung über den Rollenprüfstand oder andere Belastungsmaschinen aufprägen. Dazu erfolgt eine unterlagerte Regelung der Fahrzeuggeschwindigkeit über eine Steigungsvorgabe mittels des Fahrersystems an den Prüfstandsrecher, welcher hierfür den Eingang zur Straßensimulation verwendet. Damit ergibt sich als einzige Restriktion dieses speziellen Drive-by-wire-Systems eine Beschränkung auf Fahrzeuge mit einem automatisierten Getriebe.
-
Die ersten Untersuchungen zur Sicherstellung hinreichender Reproduzierbarkeit eines solchen Fahrersystems im Zusammenspiel mit dem vorgestellten adaptiven Regelungskonzept erfolgten zunächst anhand einer klassischen PID-Reglerimpfementierung ohne Verwendung einer Vorsteuerung. Wie aus 6 ersichtlich, wurde die letzte Phase eines NEDC-Zyklus mit einem Fahrzeug mit Doppelkupplung dreimal wiederholt. Die bei diesen Versuchen erreichte suboptimale Regelungsgüte der Fahrzeuggeschwindigkeit ist zunächst als nachrangig und insbesondere nur als vorläufiges Zwischenergebnis zu betrachten. Entscheidend hierbei ist jedoch die Reproduzierbarkeit der Fahrpedal- und Bremsansteuerung über den Strassengradienten, was in 7 eindrucksvoll dargestellt werden konnte.
-
Die in den 6 und 7 dargestellten Versuche und weitere Voruntersuchungen haben gezeigt, dass sich das in 5 skizzierte System als ideale Plattform für weitere Untersuchungen und zur Industrialisierung des nichtlinearen modellprädiktiv-retrospektiven Regelungsverfahrens eignet. Das Ziel der aktuellem Portierungsaktivitäten ist ein, mit vertretbarem Aufwand selbstadaptierender Fahrer für Emissionszyklen. Neben einer hohen Regelgüte in Bezug auf die Sollgeschwindigkeit sollen auch Kriterien wie etwa niedriger Verbrauch oder Emissionen im Zyklus unter Einhaltung der gesetzlichen Toleranzen vorgegeben werden können.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- CN 101067743 [0002]
- WO 0179945 [0002]
- JP 2009068359 [0003]