-
Die Erfindung betrifft ein System und Verfahren zur Kalibrierung einer Steuer- und Regelvorrichtung zur Einspritzdruckregelung bei einem Verbrennungsmotor.
-
Es ist bekannt, dass Einspritzdüsen individuelle Mengen von Kraftstoff zu jedem Zylinder in einem Motor zuführen. Eine Einspritzpumpe ist eine Dosierpumpe, die für einen hohen Druck ausgelegt ist und ein Bestandteil der Einspritzanlage in Verbrennungsmotoren bildet. Die Einspritzpumpe stellt pro Hub eine definierte Menge an Kraftstoff mit dem nötigen Druck (Einspritzdruck) bereit, um den Kraftstoff durch das Einspritzventil in den Brennraum oder das Ansaugrohr zu fördern.
-
Pro Zylinder besitzt ein Motor ein Einspritzventil. Die Einspritzdüsen zerstäuben entweder im Ansaugtrakt (Saugrohreinspritzung) oder direkt im Brennraum des Zylinders (Direkteinspritzer) einen sehr feinen Kraftstoffnebel. Moderne Motoren bieten auch eine Kombination aus Direkt- und Saugrohreinspritzung. Je nach Lastbereich wechseln sich hier Saugrohr- und Direkteinspritzung ab, mit dem Ziel die Entstehung von Stickoxiden zu reduzieren. Durch diese präzise dosierte Zerstäubung des Kraftstoffs durch die Einspritzdüsen wird eine optimierte Verbrennung des Kraftstoffs erreicht, woraus eine bessere Leistungsentfaltung des Motors resultiert. Um eine solche feine Zerstäubung zu erreichen, muss der Kraftstoff mit Überdruck eingespritzt werden. Bei der Saugrohreinspritzung, wo die Einspritzdüsen über eine gemeinsame Einspritzleiste mit Kraftstoff versorgt werden, beträgt der Einspritzdruck etwa drei bis sechs Bar. Bei Direkteinspritzern, wo die Einspritzdüsen über eine Hochdruckpumpe gespeist werden, sind es bis zu 350 Bar. Der Einspritzdruck ist somit ein wichtiger Parameter für die Verbrennungsqualität des Motors.
-
Es sind vor allem zwei Ansätze zur Bestimmung und Vorhersage des Einspritzdrucks bei einem Verbrennungsmotor bekannt. Der erste Ansatz basiert auf einem physikalischen Modell, bei dem ein Soll-Einspritzdruck in Abhängigkeit von verschiedenen Parametern wie der Menge des Kraftstoffs, der Temperatur des Motors, der aktuellen Last, etc. berechnet wird. Die entsprechenden Werte in Abhängigkeit von dem Zustand des Motors sind in Form von Tabellen, Kennlinien und Diagrammen hinterlegt, vorzugsweise in einer elektronischen Steuereinheit des Fahrzeugs.
-
Ein anderer Ansatz verwendet Regressionsanalysen zur Modellierung und Vorhersage des Soll-Einspritzdrucks. Regressionsverfahren sind statistische Analyseverfahren, die zum Ziel haben, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen zu modellieren. Die Regressionsmodelle erhalten als Eingabe beispielsweise die Kraftstoffmenge, die Kraftstoffladung, die Umdrehungszahl oder die Temperatur des Motors und berechnen mittels mathematischer Verfahren wie beispielsweise die Methode der kleinsten Quadrate oder neuronaler Netze einen geschätzten Wert für den Einspritzdruck.
-
Allerdings beruhen diese Tabellen und Diagramme oder die verwendeten mathematischen Verfahren auf Expertenwissen und werden nach ihrer Implementierung nicht mehr verändert. Des Weiteren werden sie für einen individuellen Motor nicht angepasst, sondern sie sind für eine bestimmte Modellbaureihe festgelegt.
-
Die
DE 10 2010 052 857 A1 beschreibt ein System und Verfahren zur selbstlernenden Echtzeit-Charakterisierung der Kraftstoffeinspritzdüsenleistung während des Motorbetriebs. Das System umfasst einen Algorithmus für einen Motorcontroller, der ermöglicht, dass der Controller die Korrelation zwischen der Kraftstoffmasse und der Impulsbreite für jede Einspritzdüse im Motor in Echtzeit lernt, während der Motor läuft. Der Controller erkennt fortschreitend diejenigen Impulsbreiten, die die gewünschte Kraftstoffmasse erreichen, während er kontinuierlich Werte wie z. B. die Temperatur und den Kraftstoffverteilerdruck an das, was er gelernt hat, auf der Basis von verschiedenen Eingangsveränderungen anpassen kann. Der Controller verwendet dann die gelernte tatsächliche Leistung jeder Einspritzdüse, um die Impulsbreite zu befehlen, die erforderlich ist, um die gewünschte Menge an Kraftstoff für jeden Zylinder in jedem Zyklus zu erreichen.
-
Die
WO 2009/019663 A2 beschreibt einen Kraftstoffinjektor für eine Brennkraftmaschine, wobei der Kraftstoffinjektor einen Kraftstoffzufuhrkanal, der unter hohem Druck stehenden Kraftstoff enthält, und einen Drucksensor zum Messen des Kraftstoffdrucks umfasst. Unter Verwendung eines hydraulischen Verhaltensprofils zum Vorhersagen des Kraftstoffdrucks wird ein Steuersignal erzeugt, um die während des Einspritzvorgangs eingespritzte Kraftstoffmenge in Übereinstimmung mit dem vorhergesagten Kraftstoffdruck zu steuern.
-
Die
US 6 701 905 B1 beschreibt eine Kraftstoffdrucksteuerung für einen Kraftstoffmotor mit einem Algorithmus, der adaptiv gelernte Korrekturen für die Kraftstoffeinspritzimpulsbreite umfasst, um ein Basiskraftstoffdrucksteuersignal dynamisch anzupassen. Die Steuerung stellt den Kraftstoffdruck dynamisch auf eine Weise ein, dass ein Mischungsverhältnis von Luft/Kraftstoff optimiert wird anstelle der Steuerung eines vorbestimmten Kraftstoffdrucks.
-
Die der Erfindung zu Grunde liegende Aufgabe besteht nun darin, ein Verfahren und ein System zum automatischen Kalibrieren einer Steuer- und Regelvorrichtung zur Einspritzdruckregelung bei einem Verbrennungsmotor zu schaffen, das sich durch eine hohe Zuverlässigkeit und Genauigkeit auszeichnet und sich einfach implementieren lässt.
-
Gemäß der vorliegenden Erfindung wird ein Verfahren und System vorgeschlagen, durch das eine automatische Kalibrierung einer Steuer- und Regelvorrichtung zur Einspritzdruckregelung ermöglicht wird, um hierdurch die Grundlage für eine zuverlässige und genaue Ermittlung und Einstellung eines Soll-Einspritzdrucks für eine oder mehrere Kraftstoffeinspritzdüsen bei einem Verbrennungsmotor zu schaffen.
-
Diese Aufgabe wird hinsichtlich eines Verfahrens durch die Merkmale des Patentanspruchs 1, und hinsichtlich eines Systems durch die Merkmale des Patentanspruchs 8 erfindungsgemäß gelöst. Die weiteren Ansprüche betreffen bevorzugte Ausgestaltungen der Erfindung.
-
Gemäß einem ersten Aspekt stellt die Erfindung ein Verfahren zum Kalibrieren einer Steuer- und Regelvorrichtung zur Einspritzdruckregelung bei einem Verbrennungsmotor bereit. Das Verfahren umfasst das Bestimmen eines Zustandes si des Verbrennungsmotors durch ein Zustandsmodul, wobei ein Zustand si durch Daten und Messwerte von zumindest einem Parameter pi des Verbrennungsmotors definiert wird und der Wert des Einspritzdrucks zumindest teilweise von diesem Parameter pi abhängt. Eine Berechnungsfunktion fi und/oder einer Aktion ai für den Parameter pi wird von einem Lernverstärkungs-Agenten ausgewählt und ein modellierter Wert EM für den Einspritzdruck mittels der ausgewählten Berechnungsfunktion fi und/oder der Aktion ai berechnet. Von einem Umgebungsmodul wird ein realer Wert ER für den Einspritzdruck aufgrund von Messergebnissen bereitgestellt. Der modellierte Wert EM für den Einspritzdruck wird mit dem realen Wert ER für den Einspritzdruck verglichen. Das Vergleichsergebnis wird an ein Belohnungsmodul weitergegeben und eine Belohnung für das Vergleichsergebnis ermittelt. Die Belohnung für das Vergleichsergebnis wird an den Lernverstärkungs-Agenten weitergegeben und basierend auf dieser Belohnung wird erneut eine weitere Aktion aj von dem Lernverstärkungs-Agenten ausgewählt.
-
Vorteilhafterweise sind Sensoren und/oder Messvorrichtungen zur Erfassung von Messwerten der Parameter pi vorgesehen.
-
In einer vorteilhaften Weiterentwicklung sind eine positive Aktion A+, die den Wert für einen Parameter pi erhöht, eine neutrale Aktion A0, bei der der Wert des Parameters pi gleichbleibt, sowie eine negative Aktion A-, bei der sich der Wert des Parameters pi verringert, vorgesehen.
-
In einer weiteren Ausführungsform umfasst das Belohnungsmodul eine Datenbank oder Matrix oder Funktion für die Bewertung der Aktionen ai.
-
Vorteilhafterweise ist der Lernverstärkungsagent ausgebildet, einen Algorithmus aus dem verstärkenden Lernen zu verwenden.
-
In einer weiteren Ausgestaltung ist der Algorithmus als Markov-Entscheidungsprozess oder als Temporal Difference Learning (TD-Learning) oder als Q-Learning oder als DYNAQ oder als POMDP oder als SARSA oder als Monte-Carlo-Simulation ausgebildet.
-
Vorteilhaftweise stellt zumindest ein Parameter pi eine eingespritzte Kraftstoffmenge oder eine Motorumdrehungszahl oder eine Zusammensetzung eines Kraftstoffgemisches oder eine Temperatur eines Zylinders oder einen Lambda-Wert einer Lambdasonde dar.
-
Gemäß einem zweiten Aspekt stellt die Erfindung ein System zum Kalibrieren einer Steuer- und Regelvorrichtung zur Einspritzdruckregelung bei einem Verbrennungsmotor bereit. Das System umfasst ein Zustandsmodul, das ausgebildet ist, einen Zustand si des Verbrennungsmotors zu bestimmen, wobei ein Zustand si durch Daten und Messwerte von zumindest einem Parameter pi des Verbrennungsmotors definiert wird und der Wert des Einspritzdrucks zumindest teilweise von diesem Parameter pi abhängt. Zudem weist das System einen Lernverstärkungs-Agenten auf, der ausgebildet ist, eine Berechnungsfunktion fi und/oder eine Aktion ai für den Parameter pi auszuwählen und einen modellierten Wert EM für den Einspritzdruck mittels der ausgewählten Berechnungsfunktion fi und/oder der Aktion ai zu berechnen. Des Weiteren ist ein Umgebungsmodul vorgesehen, das ausgebildet ist, einen realen Wert ER für den Einspritzdruck aufgrund von Messergebnissen bereitzustellen. Das Zustandsmodul ist ausgebildet, den modellierten Wert EM für den Einspritzdruck mit dem realen Wert ER des Einspritzdrucks zu vergleichen. Des Weiteren umfasst das System ein Belohnungsmodul, das ausgebildet ist, eine Belohnung für das Vergleichsergebnis zu ermitteln und die Belohnung für das Vergleichsergebnis an den Lernverstärkungs-Agenten weiterzugeben, wobei der Lernverstärkungs-Agenten ausgebildet ist, basierend auf dieser Belohnung erneut eine weitere Aktion aj auszuwählen.
-
In einer vorteilhaften Weiterbildung sind Sensoren und/oder Messvorrichtungen zur Erfassung von Messwerten der Parameter pi vorgesehen.
-
Vorteilhafterweise sind eine positive Aktion A+, die den Wert für einen Parameter pi erhöht, eine neutrale Aktion A0, bei der der Wert des Parameters pi gleichbleibt, sowie eine negative Aktion A-, bei der sich der Wert des Parameters pi verringert, vorgesehen.
-
In einer weiteren Ausgestaltung umfasst das Belohnungsmodul eine Datenbank oder Matrix oder Funktion für die Bewertung der Aktionen ai.
-
In einer weiteren Ausführungsform ist der Lernverstärkungsagent ausgebildet, einen Algorithmus aus dem verstärkenden Lernen zu verwenden.
-
Vorteilhafterweise ist der Algorithmus als Markov-Entscheidungsprozess oder als Temporal Difference Learning (TD-Learning) oder als Q-Learning oder als DYNAQ oder als POMDP oder als SARSA oder als Monte-Carlo-Simulation ausgebildet.
-
In einer Weiterbildung stellt zumindest ein Parameter pi eine eingespritzte Kraftstoffmenge oder eine Motorumdrehungszahl oder eine Zusammensetzung eines Kraftstoffgemisches oder eine Temperatur eines Zylinders oder einen Lambda-Wert einer Lambdasonde dar.
-
Gemäß einem dritten Aspekt stellt die Erfindung ein Computerprogrammprodukt bereit, das einen ausführbaren Programmcode umfasst, der so konfiguriert ist, dass er bei seiner Ausführung das Verfahren gemäß dem ersten Aspekt ausführt.
-
Nachfolgend wird die Erfindung anhand von in der Zeichnung dargestellten Ausführungsbeispielen näher erläutert.
-
Dabei zeigt:
- 1 eine schematische Darstellung einer Steuer- und Regelvorrichtung zur Einspritzdruckregelung bei einem Verbrennungsmotor;
- 2 ein Blockdiagram zur Erläuterung eines Ausführungsbeispiels eines erfindungsgemäßen Systems;
- 3 ein Flussdiagramm zur Erläuterung der einzelnen Verfahrensschritte eines erfindungsgemäßen Verfahrens;
- 4 zeigt schematisch ein Computerprogrammprodukt gemäß einer Ausführungsform des dritten Aspekts der Erfindung.
-
Zusätzliche Kennzeichen, Aspekte und Vorteile der Erfindung oder ihrer Ausführungsbeispiele werden durch die ausführliche Beschreibung in Verbindung mit den Ansprüchen ersichtlich.
-
1 zeigt eine Steuer- und Regelvorrichtung 10 zur Einspritzdruckregelung bei einem Verbrennungsmotor eines Kraftfahrzeugs. Die Steuervorrichtung 10 umfasst eine Steuereinheit 20, die zumindest einen Sollwert 30 für den Einspritzdruck enthält. Dieser Sollwert 30 ist vorzugsweise in der Steuereinheit 20 hinterlegt, kann aber auch extern in einem separaten Speicher abgelegt sein und von der Steuereinheit 20 abgerufen werden. Des Weiteren erhält die Steuereinheit 20 aktuell gemessene Messwerte 40 für den Einspritzdruck, die von hier nicht dargestellten Sensoren ermittelt und an die Steuereinheit 20 weitergeben werden. Die Steuereinheit 20 vergleicht den Soll-Einspritzdruck mit dem gemessenen aktuellen Einspritzdruck und berechnet daraus eine Abweichung Δ.
-
Zudem sind in der Steuereinheit 20 Tabellenwerte, Datenbankeinträge und/oder Diagramme und Funktionen 50 für verschiedene weitere Parameter pi aus einer Menge von Parametern {p1,...,pi,...pn} und ihre gegenseitigen Abhängigkeiten und Wechselwirkungen hinterlegt. Bei den Parametern pi kann es sich beispielsweise um die eingespritzte Kraftstoffmenge, die Umdrehungszahl des Motors, die Öltemperatur, das Volumen der Zylinderladung, den Kraftstoffdruck, die Kopplung mit einem Getriebe, eine Last, etc. handeln. Die berechnete Abweichung Δ wird an einen Regler 70 weitergegeben. Der Regler 70 kann als PID-Regler oder H∞-Regler oder Fuzzy-Regler ausgebildet sein. Auch kann vorgesehen sein, dass die Abweichung Δ zwischen dem Ist-Einspritzdruck und dem Soll-Einspritzdruck von dem Regler 70 ermittelt wird. Unter Verwendung der hinterlegten Wertetabellen, Diagramme etc. 50 für die Parameter pi werden von dem Regler 70 Änderungswerte und Stellsignale bzw. Stellgrößen für Motoren und Aktuatoren für die Einstellung der Druckpumpen und Einspritzdüsen berechnet und an die jeweiligen Motoren und Aktuatoren weitergegeben, um durch die Änderung der Betriebswerte der jeweiligen Einspritzdüsen und/oder der gesamten Einspritzanlage den aktuellen Ist-Einspritzdruck auf den Soll-Einspritzdruck einzustellen.
-
Da die Berechnung der Stellsignale 80 durch den Regler 70 von den hinterlegten Wertetabellen, Diagrammen etc. 50 für die Parameter pi abhängt, wird erfindungsgemäß eine Anpassung und Kalibrierung dieser Parameterwerte 50 vorgenommen.
-
2 zeigt ein erfindungsgemäßes System 100 zur Kalibrierung der Steuer- und Regelvorrichtung zur Einspritzdruckregelung bei einem Verbrennungsmotor. Das erfindungsgemäße System beruht auf einem Lernverstärkungs-Agenten (LV) (Reinforcement Learning Agent) 200, der für einen bestimmten Zustand si ∈ S aus einer Menge verfügbarer Zustände zumindest eine Aktion ai ∈ A aus einer Menge verfügbarer Aktionen auswählt. Für die ausgewählte Aktion ai erhält der Agent 200 eine Belohnung ri ∈ ℝ Die Zustände si ∈ S erhält der Agent 200 von einem Zustandsmodul 300, auf das der LV-Agent 200 zugreifen kann und das vorzugsweise einen Datenspeicher 320 mit Daten von verschiedenen Sensoren und Datenquellen sowie Berechnungsergebnisse enthält. Das Zustandsmodul 300 bearbeitet die Daten von verschiedenen Parametern pi aus einem Datenspeicher 320 oder einer anderen Datenquelle und ordnet diesen verarbeiteten Daten Zustände si ∈ S zu.
-
Ein Zustand si ∈ S ist somit durch die Auswahl von bestimmten Parameterwerten von Parametern pi definiert. Dabei kann die Kraftstoffmenge, die Einlasstemperatur des Kraftstoffgemisches, die Zusammensetzung des Kraftstoffgemisches, die Temperatur des Motors, die Position der Einspritzdüsen, etc. jeweils einen Parameter pi darstellen. Ein Zustand si ist somit durch gemessene und/oder berechnete Werte von ausgewählten Parametern pi gekennzeichnet und stellt somit eine konkrete Betriebssituation des Motors dar. Die Daten bzw. Messwerte sind von einem Umgebungsmodul 400 ermittelt worden sind und wurden vorzugsweise in dem Datenspeicher 320 gespeichert. Das Umgebungsmodul 400 enthält zumindest einen Sensor 420, der vorzugsweise als Drucksensor ausgebildet ist, kann aber weitere Sensoren 440 enthalten oder mit diesen verbunden sein. In einem Belohnungsmodul 500 wird der ausgewählten Aktion ai eine Belohnung ri ∈ ℝ zugeordnet, die an den LV-Agenten 200 übermittelt wird.
-
Bei den Sensoren 440 kann es sich beispielsweise um Drucksensoren, Piezosensoren, Drehzahlsensoren, elektrische Sensoren, Temperatursensoren, Hallsensoren und/oder bildaufnehmende Sensoren wie Kameras sowie um eine Lambda-Sonde handeln. Die Sensoren 420, 440 ermitteln Messwerte wie den Einspritzdruck, die Kraftstoffmenge, die Temperatur des Motors, die Umdrehungszahl des Motors, oder einen Lambdawert, die an das Zustandsmodul 300 oder einen weiteren Prozessor weitergegeben werden. Das Zustandsmodul 300 weist vorteilhafterweise ebenfalls einen Prozessor auf, der die Daten mittels einer Softwareapplikation mit einem Algorithmus bearbeitet. Es ist aber auch denkbar, dass die Daten zunächst in einer weiteren Speichereinheit oder einem Softwaremodul gespeichert werden und erst zu einem späteren Zeitpunkt in den Datenspeicher 320 übertragen und/oder von dem Zustandsmodul 300 und/oder einem Prozessor verarbeitet werden.
-
Unter einem „Prozessor“ kann im Zusammenhang mit der Erfindung beispielsweise eine Maschine oder eine elektronische Schaltung verstanden werden. Bei einem Prozessor kann es sich insbesondere um einen Hauptprozessor (engl. Central Processing Unit, CPU), einen Mikroprozessor oder einen Mikrocontroller, beispielsweise eine anwendungsspezifische integrierte Schaltung oder einen digitalen Signalprozessor, möglicherweise in Kombination mit einer Speichereinheit zum Speichern von Programmbefehlen, etc. handeln. Auch kann unter einem Prozessor ein virtualisierter Prozessor, eine virtuelle Maschine oder eine Soft-CPU verstanden werden. Es kann sich beispielsweise auch um einen programmierbaren Prozessor handeln, der mit Konfigurationsschritten zur Ausführung des genannten erfindungsgemäßen Verfahrens ausgerüstet wird oder mit Konfigurationsschritten derart konfiguriert ist, dass der programmierbare Prozessor die erfindungsgemäßen Merkmale des Verfahrens, der Komponente, der Module, oder anderer Aspekte und/oder Teilaspekte der Erfindung realisiert.
-
Unter einer „Speichereinheit“ oder „Speichermodul“ und dergleichen kann im Zusammenhang mit der Erfindung beispielsweise ein flüchtiger Speicher in Form eines Arbeitsspeichers (engl. Random-Access Memory, RAM) oder ein dauerhafter Speicher wie eine Festplatte oder ein Datenträger oder z. B. ein wechselbares Speichermodul verstanden werden. Es kann sich bei dem Speichermodul aber auch um eine cloudbasierte Speicherlösung handeln.
-
Unter einem „Modul“ kann im Zusammenhang mit der Erfindung beispielsweise ein Prozessor und/oder eine Speichereinheit zum Speichern von Programmbefehlen verstanden werden. Beispielsweise ist der Prozessor speziell dazu eingerichtet, die Programmbefehle derart auszuführen, damit der Prozessor und/oder die Steuereinheit Funktionen ausführt, um das erfindungsgemäße Verfahren oder einen Schritt des erfindungsgemäßen Verfahrens zu implementieren oder realisieren.
-
Unter „Messwerten“ sind im Zusammenhang mit der Erfindung sowohl die Rohdaten als auch bereits aufbereitete Daten aus den Messergebnissen der Sensoren zu verstehen.
-
Der Lernverstärkungs-Agent 200 enthält Berechnungsverfahren und Algorithmen fi für mathematische Regressionsverfahren oder physikalische Modellberechnungen, die eine Korrelation zwischen ausgewählten Parametern pi ∈ P aus einer Menge von Parametern und einem Einspritzdruck von Kraftstoff bei einem Verbrennungsmotors beschreiben. Bei den mathematischen Funktionen ft kann es sich um Mittelwerte, Minimal- und Maximalwerte, Fast Fourier Transformationen, Integral- und Differentialrechnungen, Verfahren der linearen Regression, Markov-Verfahren, Wahrscheinlichkeitsverfahren wie Monte Carlo-Verfahren, Tempora Difference Learning, aber auch erweiterte Kalman-Filter, radiale Basisfunktionen, Datenfelder, konvergente neuronale Netze, künstliche neuronale Netze und/oder rückgekoppelte neuronale Netze handeln. Der LV-Agent 200 wählt für einen Zustand si eine oder mehrere dieser Berechnungsfunktionen fi aus. Er berechnet für diesen bestimmten Zustand si und mittels der ausgewählten Berechnungsfunktionen fi einen modellierten Wert des Einspritzdrucks EM, wobei der gemessene oder berechnete Wert für zumindest einen Parameter pi einen Eingabewert für die Berechnungsfunktionen fi darstellt.
-
In dem Lernverstärkungs-Agenten (Reinforcement Learning Agent) 200 sind zudem als Aktionen ai die Aktionen A+, A0 und A- definiert, die aufgrund der verwendeten Berechnungsverfahren fi ausgewählt werden, um eine Anpassung eines gemessenen oder berechneten Parameterwertes eines Parameters pi ∈ P aus der Menge der Parameter in einer Wertetabelle und dergleichen vorzunehmen. Bei den Parametern pi ∈ P handelt es sich beispielsweise um die Kraftstoffmenge, die Umdrehungszahl des Motors, den Lambdawert, die Einlasstemperatur des Kraftstoffgemisches, die Kraftstoffdichte und/oder die Zusammensetzung des Kraftstoffgemisches. Bei einer positiven Aktion A+ handelt es sich um eine Aktion, die den Wert für einen Parameter pt erhöht, bei einer neutralen Aktion A0 handelt es sich um ein Aktion, bei der der Wert des Parameters pt gleichbleibt, und bei einer negativen Aktion A- wird der Wert des Parameters pt verringert. Der LV-Agent 200 wählt für den durch diese gemessenen und berechneten Daten definierten Zustand si insbesondere eine der Aktionen A+, A0 oder A- aus zur Anpassung des Parameterwertes eines Parameters pi in einer Wertetabelle oder dergleichen. Für die ausgewählte Aktion ai berechnet der LV-Agent 200 nun den modellierten Wert des Einspritzdrucks EM, der von der ausgewählten Aktion ai für den Parameter pi abhängt.
-
Dieser berechnete Wert LM des Einspritzdrucks für eine bestimmte Aktion ai wird nun an das Zustandsmodul 300 weitergegeben. Das Umgebungsmodul 400 bestimmt aufgrund einer direkten Messung oder einer Berechnung einen realen Wert ER des Einspritzdrucks. Für die Berechnung des realen Wertes ER des Einspritzdrucks kann vorteilhafterweise ein neuronales Netz verwendet werden. Es können aber auch andere Berechnungsverfahren wie Regressionsverfahren eingesetzt werden. Der reale Einspritzdruck ER wird vorzugsweise von dem Sensor 420 gemessen.
-
Wie bereits ausgeführt, wird in dem Zustandsmodul 300 ein aktueller oder zukünftiger Zustand si durch verschiedene Datenwerte von Parametern pi definiert, beispielsweise die Kraftstoffmenge, die Umdrehungszahl des Motors, ein bestimmter Lambdawert, die aktuelle Einlasstemperatur des Kraftstoffgemisches, die aktuelle Kraftstoffdichte und/oder die Zusammensetzung des Kraftstoffgemisches. Insbesondere berechnet das Zustandsmodul 300 die aktuelle Abweichung Δ zwischen dem gemessenen (realen) Wert des Einspritzdrucks ER und dem berechneten Modellwert EM für eine ausgewählte Aktion ai durch den LV-Agenten 200.
-
In dem Zustandsmodul 300 wird nun der berechnete Modellwert EM des Einspritzdrucks mit dem tatsächlich gemessenen Wert ER des Einspritzdrucks verglichen. Der berechnete Wert EM des Einspritzdrucks beruht dabei auf den geänderten Werten für die ausgewählten Parameter pi durch den LV-Agenten 200. In dem Belohnungsmodul 500 wird der Grad der Abweichung Δ zwischen dem berechneten Modellwert EM und dem gemessenen Wert ER des Einspritzdrucks verglichen und dem Grad der Abweichung Δ eine Belohnung Bi zugeordnet. Da der Grad der Abweichung Δ von der Auswahl der jeweiligen Aktion A+, A0, A- abhängig ist, wird vorzugsweise in einer Matrix oder Funktion oder einer sonstigen Datenbank 520 der jeweiligen ausgewählten Aktion A+, A0, A- die Belohnung Bi zugeordnet. Die Belohnung Bi weist vorzugsweise die Werte +1 und -1 auf, wobei eine geringe Abweichung Δ zwischen dem berechneten Wert EM des Einspritzdrucks und dem gemessenen Wert ER des Einspritzdrucks mit +1 belohnt wird und somit verstärkt wird, während eine erhebliche Abweichung Δ mit -1 belohnt wird und somit negativ bewertet wird. Es ist aber auch denkbar, dass Werte > 1 und Werte < 1 Verwendung finden.
-
Nun beginnt ein zweiter Zyklus zur Kalibrierung des Einspritzdrucks. Hierbei kann eine andere Aktion ai und/oder eine andere Berechnungsfunktion fi und/oder ein anderer Parameter pi ausgewählt werden. Das Ergebnis wird wiederum dem Zustandsmodul 300 zugeführt und das Ergebnis des Vergleichs in dem Belohnungsmodul 500 bewertet. Der LV-Agent 200 wiederholt die Kalibrierung des Einspritzdrucks für alle vorgesehenen Aktionen ai und Parameter pi solange, bis sich eine größtmögliche Übereinstimmung zwischen dem kalibrierten Modellwert EM des Einspritzdrucks und dem gemessenen Wert ER erreicht ist. Vorzugsweise ist der Endzustand der Kalibrierung des Einspritzdrucks erreicht, wenn die Abweichung im Bereich von +/- 5% liegen.
-
Vorzugsweise wird als Algorithmus für den LV-Agenten 200 ein Markow-Entscheidungsprozess verwendet. Es kann aber auch vorgesehen sind, einen Temporal Difference Learning (TD-Learning)-Algorithmus zu verwenden. Ein LV-Agent 200 mit einem TD-Learning-Algorithmus nimmt die Anpassung der Aktionen A+, A0, A- nicht erst dann vor, wenn er die Belohnung erhält, sondern nach jeder Aktion ai auf Basis einer geschätzten erwarteten Belohnung. Des Weiteren sind auch Algorithmen wie Q-Learning und SARSA denkbar oder auch Monte-Carlo-Simulationen.
-
Gemäß dem Verfahren und des Systems der vorliegenden Erfindung wird ein verstärkendes Lernen (Reinforcement Learning) eingesetzt, um eine Steuer- und Regelvorrichtung zur Einspritzdruckregelung bei einem Verbrennungsmotor automatisch zu kalibrieren. Da verschiedene Parameter pi wie die Kraftstoffmenge, die Umdrehungszahl des Motors, oder der Sauerstoffgehalt der Kraftstoffmischung in das Berechnungsverfahren eingehen und hierfür Aktionen ai ausgewählt werden, können insbesondere nichtlineare Zusammenhänge zwischen diesen Parametern pi erfasst und berücksichtigt werden, was in herkömmlichen Steuerungsverfahren kaum möglich ist. Es handelt sich somit um eine optimierte Kalibrierungsmethode, da eine Variation von verschiedenen Parametern pi, die einen Einfluss auf den Einspritzdruck haben und miteinander wechselwirken, berücksichtigt wird. Da der LV-Agent 200 die Aktionen ai selbst auswählt und für diese jeweils eine Belohnung erhält, kann er eine optimale Kalibrierungsstrategie für die Steuer- und Regelvorrichtung 10 zur Einspritzdruckregelung bereitstellen.
-
Da die Kalibrierung der Steuer- und Regelvorrichtung 10 zur Einspritzdruckregelung automatisch und zeitgleich während des Betriebs des Verbrennungsmotors erfolgt, kann die Leistungsfähigkeit des Verbrennungsmotors erhöht werden, da eine individuelle Anpassung des Einspritzdrucks an den jeweiligen Motor in Echtzeit erfolgen kann. Dies kann zu einer Reduzierung des Schadstoffausstoßes und damit zu einer verbesserten Umweltbilanz führen. Zudem kann der Kraftstoffverbrauch des Verbrennungsmotors gesenkt werden. Darüber hinaus können Kosten für eine bisherige manuelle und damit zeitintensive Kalibrierung gesenkt werden.
-
In 3 sind die Verfahrensschritte zum Kalibrieren einer Steuer- und Regelvorrichtung zur Einspritzdruckregelung eines Verbrennungsmotors dargestellt.
-
In einem Schritt S10 erhält ein Lernverstärkungs-Agenten 200 einen Zustand si eines Verbrennungsmotors von einem Zustandsmodul 300, wobei ein Zustand si durch Daten und Messwerte von zumindest einem Parameter pi des Verbrennungsmotors definiert ist und der Wert des Einspritzdrucks zumindest teilweise von diesem Parameter pi abhängt.
-
In einem Schritt S20 wählt der LV-Agent 200 für den Zustand si zumindest eine Berechnungsfunktion fi und/oder eine Aktion ai für den Parameter pi aus.
-
In einem Schritt S30 berechnet der LV-Agent einen modellierten Wert EM für den Einspritzdruck mittels der ausgewählten Berechnungsfunktion fi und/oder der Aktion ai.
-
In einem Schritt S40 wird ein realer Wert LR für den Einspritzdruck von einem Umgebungsmodul 400 aufgrund von Messergebnissen bereitgestellt.
-
In einem Schritt S50 werden der modellierte Wert LM für den Einspritzdruck und der reale Wert LR für den Einspritzdruck miteinander verglichen.
-
In einem Schritt S60 wird das Vergleichsergebnis an das Belohnungsmodul 500 weitergegeben und eine Belohnung für das Vergleichsergebnis wird in dem Belohnungsmodul 500 ermittelt.
-
In einem Schritt S70 wird die Belohnung für das Vergleichsergebnis an den Lernverstärkungs-Agenten 200 weitergegeben und eine weitere Aktion aj wird von dem Lernverstärkungsagenten 200 basierend auf der Belohnung für das Vergleichsergebnis für den Zustand si ausgewählt.
-
4 stellt schematisch ein Computerprogrammprodukt 700 dar, das einen ausführbaren Programmcode 750 umfasst, der konfiguriert ist, um das Verfahren gemäß dem ersten Aspekt der vorliegenden Erfindung auszuführen, wenn es ausgeführt wird.
-
Mit dem Verfahren gemäß der vorliegenden Erfindung können zuverlässig optimierte Zustände si durch die Auswahl von passenden Aktionen ai gefunden werden, um eine Steuer- und Regelvorrichtung für die Einstellung des Einspritzdrucks eines Verbrennungsmotor zuverlässig und automatisch zu kalibrieren. Durch die Verwendung eines Lernverstärkungs-Agenten 200 mit einem Algorithmus des verstärkenden Lernens ist eine autonome Anpassung und Kalibrierung einer Vorrichtung zur Steuerung und Reglung des Einspritzdrucks für ein individuelles Kraftfahrzeug autonom und automatisch ermöglicht.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- DE 102010052857 A1 [0007]
- WO 2009/019663 A2 [0008]
- US 6701905 B1 [0009]