Verfahren zur Gemischsteuerung bei einem Verbrennungsmotor und Vorrichtung zu dessen Durchführung.
Die Erfindung betrifft ein Verfahren zur Gemischsteuerung bei einem Verbrennungsmotor sowie eine Vorrichtung zu dessen Durchfuhrung
Die Gemischsteuerung spielt nicht nur eine wichtige Rolle für das Betriebsverhalten eines Verbrennungsmotors, sondern ist entscheidend für die Erzielung geringerer Emissionen von schädlichen Abgasen So überfuhrt der bei Ottomotoren übliche
Dreiwegekatalysator nur dann zufriedenstellend schädliche Abgase (insbesondere Kohlenwasserstoffe, Kohlenmonoxid und Stickoxide) in unschädliche Reaktionsprodukte, wenn der Sogenannte Lambdawert (λ) des Gemisches innerhalb sehr enger Grenzen bei λ=l (stochiometrisches Verhältnis) liegt Auch bei Dieselmotoren müssen zur Erzielung geringer Emissionen und hoher Wirkungsgrade bestimmte variable Gemischverhaltnisse sehr genau erreicht werden Angesichts der zunehmenden Probleme im Bereich der Luftreinhaltung und der immer strenger werdenden Emissionsschutzbestimmungen kommt der Gemischsieuerung daher eine wichtige Rolle zu
Bei den herkömmlichen Systemen erfolgt die Einstellung des Gemisches i a durch Vorsteuerung und eine überlagerte Regelung Und zwar wird z B über eine im Abgasstrom angeordnete Lambdasonde der verbleibende Restsauerstoffgehalt im Abgas gemessen Der gewünschte stochiometrische Wert des Luft- Kraftstoffgemisches (d h λ=l) führt zu einem bestimmten Restsauerstoffgehalt Beim Abweichen von λ=l zeigt sich demgegenüber ein größerer oder kleinerer Restsauerstoffgehalt Die Lambdasonde erzeugt ein entsprechendes Ausgangssignal Diese dient als Istwert für einen PI-Regler, der die einzuspritzende Kraftstoffmenge dahingehend verändert, daß das stochiometrische oder ggf ein anderes gewünschtes Mischungsverhältnis eingehalten
wird Um die bei einer Regelung im herkömmlichen Sinn unvermeidliche Regeldifferenz möglichst klein zu halten, erfolgt durch Verwendung von statischen Kennfeldern eine betriebspunktabhangige z B von der Drosselklappenstellung und der Drehzahl abhangige Vorsteuerung der Einspritzmenge Die Kennfelder werden beim Motorenhersteller in umfangreichen Test auf Prufstanden ermittelt Dabei werden Mittelwerte im Kennfeld abgelegt, um die Serienstreuung der für die Verbrennung ausschlaggebenden Motorparameter auszugleichen Solange noch kein Regelsignal vorliegt, verwendet die Gemischregelung den im Kennfeld vorgegebenen Wert für die Einspritzmenge Aufgrund der mehrere Arbeitstakte betragende Totzeit (bis sich nämlich eine bestimmte Einspritzmenge im Abgas am Ort der Lambdasonde bemerkbar macht) ist es dieser Regelung nicht möglich, nach Last- oder Drehzahlanderungen das gewünschte Mischungsverhältnis einzuhalten In der Praxis wird aus diesem Grund wahrend Beschleunigungs- und Abbremsphasen die Lambdaregelung ganzlich inaktiviert, die Einspritzmenge wird dann nur mit Hilfe des Kennfeldes gesteuert Bei dynamischem Fahrbetrieb kommt es daher insgesamt betrachtet zu erheblichen Abweichungen von dem La bda- Sollwert, was zu entsprechend hohen Schadstoffemissionen führt Strenge Abgasbestimmungen lassen sich damit nicht oder nur unter Schwierigkeiten einhalten
In der Veröffentlichung U Lenz und D Schröder Artificial Intelhgence for Combustion Engine Control, SAE-Paper Nr 960328, Februar 1996 wird ein Verfahren zur
Bestimmung der in einen Zylinder eingesaugten Luftmasse vorgeschlagen Die
Veröffentlichung U Lenz und D Schröder Identifikation isolierter Nichtlineaπtaten mit
Neuronalen Netzen, GMA Fachausschuß 1 4 „Theoretische Verfahren der
Regelungstechnik", Workshop in Interlaken, 1996, betrifft allgemein einen sogenannten Beobachteransatz auf der Grundlage eines Neuronalen Netzes In diesen
Veröffentlichungen wird ein Verfahren der künstlichen Intelligenz, einsetzbar zur
Regelung von Verbrennungsmotoren, beschrieben, welches einen „indirekten"
Regelungsansatz durch Gewinnung von Wissen darstellt (Vorweg sei bemerkt, daß die vorliegende Erfindung im Gegensatz dazu ein neuartiges Verfahren der Kunstlichen Intelligenz lehrt, das einen „direkten" Regelungsansatz darstellt, indem das Verfahren das
Steuergesetz „lernt")
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren bereitzustellen, mit dem obige Nachteile vermieden oder zumindest gemindert werden, so daß auch strenge Abgasnormen erfüllt werden können Dazu gehört auch die Bereitstellung einer entsprechenden Vorrichtung
Diese Aufgabe wird gelost durch das Verfahren zur Gemischsteuerung gemäß Anspruch 1, welches folgende Schritte umfaßt a) Messen wenigstens einer Große, mit der die in einen Brennraum des Verbrennungsmotors gelangende Luftmasse im Zusammenhang steht (sog Eingangsgroße), b) Ermitteln wenigstens einer die zuzuführende Kraftstoffmenge steuernde Ausgangsgroße in Abhängigkeit von wenigstens der/den in a) gemessenen Eingangsgroße/n, mit Hilfe gespeicherter Abbildungsinformation, c) Zuführen der Kraftstoffmenge entsprechend der Ausgangsgroße aus b), d) Messen einer Große, die Information über das so entstandene Gemisch tragt (sog Istgroße), e) Ermitteln einer Abweichung der in d) gemessenen Istgroße von einem Sollwert für diese Große, f) Verandern der gespeicherten Abbildungsinformation in Abhängigkeit von der in e) ermittelten Abweichung für den in a) gemessenen Betriebszustand, so daß bei einem zukunftigen Durchlaufen der Schritte a) bis e) im gleichen Betriebszustand die Abweichung kleiner wird, und das damit einen Lernprozeß realisiert Dieser umfaßt sowohl die stationären als auch die dynamischen Betriebszustande
Hierbei wird der Begriff „Messen" in einem weiten Sinn verstanden, welcher die eigentliche physikalische Messung und ggf die Ableitung einer Große hieraus umfaßt Die Meßgroße kann also eine unmittelbar gemessene Große oder eine daraus abgeleitete Große sein Beispielsweise kann der Meßwertaufnehmer für die Istgroße eine Lambdasonde sein, welche ein dem Restsauerstoffgehalt des Abgases entsprechendes Signal abgibt Das „Messen" kann in diesem Beispiel zusatzlich zur Gewinnung dieses Signals auch die Ermittlung des Restsauerstoffgehalt und ggf daraus die Ermittlung des
Lambdawerts umfassen Die i a interessierende Gemischgroße ist das Gemischverhaltnis (d h der Lambdawert) Es ist möglich, eine Gemischgroße direkt zu messen oder eine Messung einer Abgasgroße vorzunehmen, die einen Ruckschluß auf die interessierende Gemischgroße (z B der Lambdawert) erlauben
Kurz gesagt lehrt die Erfindung also eine lernende Gemischsteuerung, welche das tatsachlich enthaltene Gemischverhaltnis mit einem Sollwert vergleicht und bei einer Abweichung hiervon die gespeicherte Steuerinformation dahingehend adaptiert, daß bei zukunftigem Durchlaufen des gleichen oder ahnlichen Betriebspunkts eine geringere Abweichung erreicht wird Der erfindungsgemaße Lernprozeß erzeugt dabei eine genaue Abbildung der realen Verhaltnisse unter allen relevanten Betriebsbedingungen, aus der dann die Steuerinformation zur Vermeidung jeglicher Regeldifferenz abgeleitet wird, dies gilt insbesondere auch für den dynamischen Betrieb des Verbrennungsmotors Es geht also darum, z B mit Methoden der Kunstlichen Intelligenz aus Fehlern zu lernen, um diese in Zukunft zu vermeiden
Im folgenden wird die Gemischbildung naher erläutert
Bei Kolbenmotoren werden Leistung, Verbrauch und Emission in entscheidendem Maße durch das Gemischverhaltnis (auch Luftzahl) λ beeinflußt Dieses Gemischverhaltnis λ ist definiert als Verhältnis von im Motorzylinder (Brennraum) befindlicher Luftmasse ( m cyi ) und Kraftstoffmasse ( mfcvl ),
m acvl λ = - (1)
KXm, vl
wobei Kλ der Faktor zur stochiometrischen Verbrennung ist ( K ~ 14 7 für Benzin)
Aufgabe der Motorsteuerung ist es daher, das Gemischverhaltnis in Abhängigkeit vom
Betriebspunkt nach obigen Kriterien optimal einzustellen Beispielsweise ist für einen emissionsoptimalen Betrieb eines Ottomotors mit Dreiwege-Katalysator eine Luftzahl von λ = 1,00 zu erzielen, was einem exakt stochiometrischen Gemischverhaltnis
entspricht Dieselmotore dagegen werden mit variablem, magerem Gemisch betrieben, d h mit einem λ größer als eins, bei Vollast wird das Gemisch bis hinunter zur sogenannten Rauchgrenze bei etwa λ=l,5 angefettet
Die folgende Darstellung der Gemischbildung bezieht sich beispielhaft auf Verbrennungsmotoren mit Direkteinspritzung. Wie weiter unten ausgeführt wird, ist die Erfindung auch bei anderen Motoren vorteilhaft einsetzbar.
Seit geraumer Zeit ist die Direkteinspritzung bei Dieselmotoren bekannt Hierzu zahlen auch Dieselmotoren mit Vor- oder Wirbelkammer, wenn diese effektiv Teil des Brennraums sind Benzindirekteinspritzung für Ottomotoren ist bereits vor mehr als 50 Jahren einmal in Serienfertigung gewesen, Daimler Benz Militar-Flugmotoren waren mit einer mechanischen Direkteinspritzung ausgerüstet Nach dem 2 Weltkrieg wurde eine mechanische Benzindirekteinspritzung im Mercedes-Seriensportwagen 300 SL und Lloyd-Kleinwagen eingesetzt, aber letztendlich war der mechanische Aufwand unrentabel Angesichts der steigenden Umweltschutzanforderungen, sind solchen Motoren, von denen man geringen Kraftstoffverbrauch erwartet, wieder aktuell
Der Vorteil der Direkteinspritzung liegt im Vergleich etwa zu einem konventionellen Saugrohrmotor in der exakten Zumessung des Kraftstoffs ohne den dynamischen Speichereffekt durch die dortige sog Wandfilmbildung
Es wird erwartet, daß der Wirkungsgrad von Ottomotoren im Teillastbereich neben der Benzindirekteinspritzung durch den Ersatz der Drosselklappe mittels unabhängig steuerbarer Einlaßventile (hydraulisch, elektromagnetisch) gesteigert werden kann
Nachfolgend wird die Gemischbildung beispielhaft bei verschiedenen direkteinspritzenden Kolben-Verbrennungs-motoren mathematisch beschrieben
Das Gemischverhältnis λ beim Kolben-Verbrennungsmotor wird bestimmt durch die Luft- und die Kraftstoffmasse im Zylinder Gunstig ist daher die Betrachtung der Gemischbildung als Schnittpunkt zweier Pfade, des Luft- und des Kraftstoffpfades
Zunächst soll das Ansaugverhalten, der sog. Luftpfad beschrieben werden: Der Motor saugt bei offenen Einlaßventilen und Hinunterlaufen des Kolbens Frischluft aus dem Saugrohr an. Infolge des sogenannten choked-flow-Effektes kann die Einströmgeschwindigkeit der Luft durch die Einlaßventile in die Zylinder maximal Schallgeschwindigkeit erreichen. Dadurch kann während der mit zunehmender Drehzahl kürzer werdenden Ansaugtakte kein vollständiger Druckausgleich zwischen Saugrohr und Zylinder erfolgen; der Zylinder enthält also weniger Luftmasse als bei dem thermodynamischen Saugrohrzustand entsprechend seinem Volumen möglich wäre. Vor diesem Hintergrund kann das Saugverhalten des Motors mathematisch als eine Pumpe mit nichtlinearem Wirkungsgrad beschrieben werden, die pro Ansaugtakt in den Zylinder gelangte Luftmasse (macvl ) ergibt sich zu
™a yl = .JO ~T (2) mit:
Tm = Temperatur der Luftmasse pm = Druck der Luftmasse
VD = Hubvolumen eines Zylinders
Der dimensionslose Wirkungsgrad "volumetrische Effizienz" ηvol ist bei Motoren mit Drosselklappe (Ottomotor, konventionell, Sauger oder Turbo) nichtlinear abhängig vom Saugrohrdruck und der Drehzahl des Motors (welche die Zeitdauer des Ansaugtaktes bestimmt), also
•nvc = rivol{pm. ι, ae ) (4) oder
1/voy 7lVol(Pnn »' a (5)
falls der Motor mit einer um a s verstellbaren Nockenwelle oder mit einem Schaltsaugrohr (asr ) (d h einem in der wirksamen Lange verstellbaren Saugrohr) ausgerüstet ist
Werden die Einlaßventile unabhängig von einer Nockenwelle angetrieben, das heißt, die Laststeuerung geschieht z.B über das Tastverhaltnis aa der Einlaßventiloffnung, so wird die volumetrische Effizienz bestimmt durch eben dieses Tastverhaltnis und die Drehzahl, also
ηvc = ηvo,(a ^ ») (6)
Nach Gleichung 2 wird die nach dem Ansaugtakt im Zylinder befindliche Luftmasse auch bestimmt durch den Druck und die Temperatur im Saugrohr Ist der Motor nicht mit einer Drosselklappe ausgerüstet, so entsprechen diese thermodynamischen Zustande denen der Umgebung, es kann davon ausgegangen werden, daß diese nur langsam schwanken, mit einer Adaption kann auf die Messung beider Großen verzichtet werden Wird der Verbrennungsmotor dagegen gedrosselt betrieben, so sind beide Großen schnell veränderlich, dann können z B außerdem Druck und ggf Temperatur im Saugrohr gemessen werden, um die Luftmasse in den Zylinder zu bestimmen Für die pro Arbeitsspiel in den Brennraum eingesaugte Luftmasse ergibt sich also die nichtlineare Abhängigkeit
N a = macyl = ηvolVD -j - (7)
mit der volumetrischen Effizienz in Abhängigkeit von Saugrohrdruck und Drehzahl oder Tastverhaltnis und Drehzahl Bei Schaltsaugrohren oder variabler
Nockenwellensteurungen tritt zudem noch die Abhängigkeit der volumetrischen Effizienz von diesen Steuergroßen auf
Im folgenden wird die Kraftstoffeinspritzung, der sog Kraftstoffpfad beschrieben Analog zum Ansaugverhalten kann die Kraftstoffeinspritzung mittels eines
Wirkungsgrades beschrieben werden Wurde ideales tragheitsloses Offnen und Schließen der Einspritzventile und stets gleichbleibender Benzinversorgungsdruck angenommen, so würde sich die pro Arbeitsspiel in den Zylinder eingespritzte Kraftstoffmasse beim Tastverhaltnis af berechnen zu
mfcyl = Kaf (8)
mit einer Konstanten K , bestimmt durch Ventiloffnungsquerschnitt und
Kraftstoffversorgungsdruck Durch die Dynamik der Ventilnadeln und einen geringen Versorgungsdruckverlust vor den Ventilen wird jedoch auch hier zur Beschreibung ein
Wirkungsgrad ηf eingeführt werden Dieser Wirkungsgrad hangt nichtlinear von der
Öff ungsdauer ab, also vom Tastverhältnis der Einspritzventile a. und der
Ansteuerfrequenz \ln. Damit ergibt sich die nichtlineare Abhängigkeit
NLf = mfcvl = η, («, ,?i)K~ . (9)
für die pro Arbeitsspiel in den Zylinder eingespritzte Kraftstoffrnasse
Nach Gleichung 1 und den obenstehenden Ableitungen zum Luftpfad und dem Kraftstoffpfad ist das Gemischverhältnis (die Luftzahl λ) somit bestimmt zu
λ = m-* ~ -^~ (10)
\4.7mfcvl Kλ NLj
In Fig. l wird dieser Zusammenhang beispielhaft für einen Kolben-Verbrennungsmotor mit konventioneller Einlaßventilsteuerung verdeutlicht Und zwar zeigt Fig 1 einen „Signalflußplan" für die Bildung des Gemischverhaltnis bei direkteinspritzenden Kolben- Verbrennungsmotoren mit konventioneller Einlaßventilsteuerung Die zusatzliche (dünn eingezeichnete) Abhängigkeit ηvol - /( , , cs ) gilt für Motoren mit variabler Nockenwelle (Otto- und Dieselmotoren) Dabei gilt beispielsweise für einen freisaugenden Dieselmotor pm « p0 ( ?0 =Umgebungsdruck) oder für einen gedrosselten
Ottomotor pm < p0 Bei Turbomotoren kann der Saugrohrdruck auch den Umgebungsluftdruck überschreiten Ist der betrachtete Kolben-Verbrennungsmotor statt mit einer konventionellenen Einlaßventilsteuerung mit unabhängig angetriebenen Einlaßventilen ausgerüstet, so hängt die volumetrische Effizienz z B vom Tastverhaltnis aa und der Drehzahl n ab Die Laststeuerung kann dann durch Variation des Tastverhaltnisses geschehen, der Motor saugt ungedrosselt an Das Gemischverhaltnis wird dann z.B gemäß der Veranschaulichung der Fig 2 gebildet, die einen „Signalflußplan" für die Bildung des Gemischverhaltnis bei direkteinspritzenden Kolben- Verbrennungsmotoren mit nockenwellenloser Einlaßventilsteuerung zeigt
Beim Betrieb des Verbrennungsmotors besteht nun allgemein die Aufgabe, durch eine Steuerung bzw Regelung ein gewünschtes Gemischverhaltnis einzustellen Dieses Gemischverhaltnis ist bestimmt aus dem Quotient von Luft- und Kraftstoffmasse im Zylinder Sowohl Luft- als auch Kraftstoffmasse im Zylinder sind nicht meßbar und auch nicht ohne großen Aufwand (z.B durch Kalibrierung, Zeitvarianz) durch Variation der Steuergroßen pm oder aa und af einstellbar Jedoch ist die angesaugte Luftmasse oder die eingespritzte Kraftstoffmasse - bei dem hier beispielhaft naher erläuterten
Direkteinspritzer - immer gleich für gleiche Steuergroßen bei gleichen
Motorbetriebspunkten, wenn die Zeitvarianz infolge von Alterung oder z B langsamen Zusetzen eines Ventils vernachlässigt wird Sowohl NLu und NL, sind also hier statische (ggf zeitvariante) Nichtlinearitaten und nur durch eine aufwendige Kalibrierung bestimmbar Das Gemischverhaltnis kann gemessen werden, neuartige Verfahren beruhen auf der Interpretation des Ionisierungstromes bei der elektrischen Funkenzundung (beim Ottomotor), konventionell jedoch ist die Messung mittels schneller schaltender Lambda-Sonde Der Messung mittels einer Lambda-Sonde (z B Breitband-Lambda-Sonde oder Sonde mit sprungformigem Verlauf der Sondenspannung bei λ=l) im Auspuffkrummer (sog Hosenrohr) geht jedoch eine durch das verbrennungsmotorische Arbeitsverfahren bedingte drehzahlabhangige Totzeit voraus
Aus den obigen Eriauterungen wird klar, daß die für erfindungsgemaße Verfahren vermittelte Abbildung von der Luftmassengroße (Eingangsgroße) auf die Kraftstoffmengengroße
(Ausgangsgroße) zwei nicht genau vorherbestimmbare nichthneare Funktionen umfaßt, nämlich die des Luft- und des Kraftstoffpfades Zur Vereinfachung wurde dabei beispielhaft auf direkteinspritzende Motoren Bezug genommen Wie unten naher erläutert wird, ist das erfindungsgemaße Verfahren auch auf nicht direkteinspritzende Motoren anwendbar, die einen sog Kraftstoffspeichereffekt aufweisen.
Erfindungsgemaß wird die a priori nicht genau bekannte Abbildung nicht - wie im Stand der Technik - durch eine Regelung vermittelt, sondern durch eine lernende Steuerung. Das Lernen kann im laufenden Betrieb erfolgen, bei dem die verschiedenen, in der Praxis vorkommenden Betriebspunkte (ein solcher kann z B ein Tupel eines Drehzahlwerts und eines Saugrohrdruckwerts sein) durchlaufen werden Das erfindungsgemaße Verfahren wird hierbei in jedem relevanten, d h erreichbaren Betriebspunkt durchgeführt Nachdem alle Betriebspunkte mehrmals durchlaufen worden sind - was im Normalbetrieb i a relativ schnell erzielt wird - ist die Gesamtabbildung für alle möglichen Werte der Eingangsgroße gelernt
Nach dem Anlernen liefert die Steuerung dann im laufenden Betrieb instantan - d h ohne jede Regelverzogerung - mit hoher Genauigkeit den richtigen Wert der Ausgangsgroße, und zwar auch nach einer Änderung des Betriebspunkts Vorteilhaft wird der Lernprozeß laufend weiter ausgeführt, um eine laufende Adaption an Störgrößen zu ermöglichen, welche nicht als Eingangsgroßen erfaßt werden Hierbei kann es sich zum Beispiel um verschleißbedingte Änderungen, Änderungen der Ansauglufttemperatur, der Kuhlwassertemperatur, des äußeren Luftdrucks, des Sauerstoffgehalts der Luft etc handeln
Das erfindungsgemaße Verfahren ist in der Lage, nach dem Lernen der Abbildung das Anfahren neuer Betriebspunkte ohne jegliche λ-Deviation sicherzustellen Bei herkömmlichen Regelungsansatzen tritt im Gegensatz dazu immer eine Regeldifferenz auf, die dann beispielsweise durch einen integrierenden Anteil im Regler solange zu einer Steuergroße aufintegriert wird, bis die Differenz zu null geworden ist
Die Erfindung hat damit folgende Vorteile aufgrund der Selbstadaption der Abbildungsinformation verringern sich die Anforderungen an die Genauigkeit, mit der die Abbildungsinformation für das
Gemischsteuerungskennfeld vorbekannt sein muß Dies reduziert den Aufwand für die Entwicklung einer Motorsteuerung und die Serienentwicklung betrachtlich, das erfindungsgemaße Steuerverfahren ist robust gegenüber Serienstreuungen und zeitlich veränderlichen Störgrößen, der gewünschte Lambdawert wird nicht nur im stationären Betrieb, sondern auch nach einem Wechsel des Betriebszustands (Drehzahl- und/oder Lastanderungen des
Motors) ohne Zeitverzogerung mit großer Genauigkeit eingehalten, insgesamt ergeben sich damit geringere Abgasemissionen sowie ein geringerer
Kraftstoffverbrauch
Die Erfindung leistet damit einen Beitrag zum Umweltschutz und zum schonenden Umgang mit den begrenzt vorhandenen Ressourcen
Die Erfindung laßt sich im übrigen auch im Rahmen einer Fehlerdiagnose im laufenden Betrieb einsetzen Falls nämlich der Grad der erforderlichen Adaption den hinsichtlich üblicher Serienstreuung und Storgroßeneinflusse übersteigt, laßt sich hieraus auf Fehlerzustande schließen, etwa auf unzulässig hohen Verschleiß oder einen Defekt Durch entsprechende Auswertung des Adaptionsgrads, etwa durch ein Fahrzeugdiagnosesystem, lassen sich im laufenden Betrieb Motorschaden oder Teilausfalle frühzeitig erkennen
Grundsatzlich kann das Verfahren so durchgeführt werden, daß eine oder mehrere der Verfahrensschntte a)-f) über mehrere Arbeitsspiele oder Takte eines Zylinders gemittelt durchgeführt werden Bei einem Mehrzylindermotor mit z B einem gemeinsamen Saugrohr und/oder einer gemeinsamen Lambdasonde tragen dann zu den in den Schritten a) und/oder d) gemessenen Großen aufgrund der Mittelung mehrere Zylinder und ggf mehrere Arbeitsspiele bei Bevorzugt wird das Verfahren jedoch im Takt mit den Arbeitsspielen der einzelnen Zylinder durchgeführt (Anspruch 2), d h , die Abfolge der Verfahrensschntte a)-f) wird im Rahmen eines einzelnen Arbeitstaktes eines einzelnen Zylinders jeweils einmal durchgeführt Demnach erfolgt beispielsweise die Messung im Schritt a) wahrend des Ansaugtaktes eines Zylinders Im Schritt b) wird die zuzuführende Kjaftstoffmenge auf der Grundlage dieser Messung (und ggf vorausgehender Messungen, näheres hierzu folgt unten) ermittelt Das Zuführen der Kjaftstoffmenge im Schntt c) erfolgt dann z B in dem
unmittelbar folgenden Kompressionstakt desselben Zylinders, d h im selben Arbeitsspiel wie Schritt a) bezogen auf denselben Zylinder Die folgenden Schritte d)-f) werden i a aufgrund von Totzeiteffekten verzögert durchgeführt; sie werden jedoch dem Arbeitsspiel der Schritte a)-c) und dem zugehörigen Zylinder zugeordnet. Grundsatzlich ist es möglich, das Verfahren nicht in jedem Arbeitsspiel, sondern z.B nur in jedem zweiten, dritten, usw Spiel durchzuführen. Besonders vorteilhaft ist jedoch eine Ausgestaltung, bei der das Verfahren mit den Schritten a)-f) bei jedem Arbeitsspiel jedes Zylinders einmal abgearbeitet wird
Der am meisten verbreitete Ottomotor ist ein gedrosselter Motor, welcher üblicherweise durch Verstellen einer vor einem Saugrohr angeordneten Drosselklappe gesteuert wird Bei einem solchen Motor ist die Eingangsgröße oder - bei mehreren Eingangsgroßen - eine der Eingangsgrößen vorteilhaft der Druck im Saugrohr (Anspruch 3) Dieser Druck bestimmt nämlich wesentlich die Zylinderfüllung. Es kann sich um einen Motor mit oder ohne Aufladung handeln Bei einem aufgeladenen Motor (z B einem Turbo- oder Kompressormotor) kann der Druck im Saugrohr zeitweise oder dauernd über dem Atmosphärendruck liegen.
Manche Motorkonstruktionen machen sich die Dynamik der angesaugten Luft für eine Aufladung zunutze. Bei manchen dieser Konstruktionen ist das Ansaugsystem veränderlich ausgebildet, um die dynamische Aufladung verschiedenen Betriebsbedingungen anpassen zu können (vgl. Kraftfahrtechnisches Taschenbuch, Bosch, 1991, S 373, "Schalt- Ansaugsysteme"). Beispielsweise kann die wirksame Saugrohrlange verstellt werden, um akustische Phänomene zur Füllungssteigerung zu nutzen (Stichwort Resonanzaufladung) Bei diesen Systemen ist vorteilhaft eine die Momentanstellung des Ansaugsystems charakterisierende Größe (z.B die effektive Saugrohrlange), die Eingangsgroße bzw eine der Eingangsgroßen (Anspruch 4).
Eine Weiterbildung des Typs der gedrosselten Motoren weist eine EinJaßventilsteuerung mit verstellbaren Ventilsteuerzeiten auf. Beispielsweise kann durch eine Nockenwellenverstellung eine Verschiebung der Offhungs- und Schließzeit und/oder eine Veränderung der Öffhungsdauer erzielt werden (siehe Kraftfahrtechnisches Taschenbuch a a O S 370) In diesem Fall sind vorteilhaft ein oder mehrere Ventilsteuerzeitparameter (z B
Nockenwellenverdrehung und/oder Axialverschiebung) die Eingangsgroße bzw eine der Eingangsgroßen (Anspruch 5)
Ein anderer Motortyp, der zukunftig große Bedeutung erlangen konnte, weist frei betatigbare (z B elektromagnetisch betatigbare) Einlaßventile auf Ein solcher Motor braucht keine Drosselung mehr aufzuweisen, er kann vor den Einlaßventilen mit Atmospharendruck beaufschlagt sein, da die Ventile aufgrund der freien Wählbarkeit der Offhungs- und Schließzeiten vollständig die Leistungssteuerung des Motors übernehmen können Vorteilhaft ist das Tastverhältnis und/oder die Schließ- und/oder Öffnungszeit des Einlaßventils eine Eingangsgröße bzw eine der Eingangsgroßen (Anspruch 6) Das Tastverhaltnis ist die auf die Dauer des Einlaßtaktes oder des gesamten Arbeitsspiels bezogene Öffhungsdauer
Oben wurde bereits erläutert, daß die in den Zylinder gelangende Luftmasse von der Drehzahl des Verbrennungsmotors abhangt Vorteilhaft ist daher die Drehzahl eine Eingangsgroße bzw eine der Eingangsgroßen (Anspruch 7)
Wie oben bereits ausgeführt wurde, werden Otto-Motoren mit 3 -Wege-Katalysator üblicherweise mit einem konstanten Gemischverhaltnis von λ = 1 betrieben, Dieselmotoren hingegen mit einem variablen Soll-Gemischverhaltnis Das erfindungsgemaße Verfahren eignet sich mit einer einfachen Ergänzung auch für letztere Betriebsweise, und zwar dadurch, daß, dem Soll-Gemischverhaltnis die Rolle einer Eingangsgroße zugewiesen wird (Anspruch 8) Wahrend bei einem Otto-Motor der Eingangsgroßenraum z B zweidimensional ist (er wird etwa durch Saugrohrdruck und Drehzahl aufgespannt), kommt bei dieser Ausgestaltung für einem Dieselmotor als z.B dritte Eingangsgroße das Soll-Gemischverhaltnis hinzu, so daß hier ein dreidimensionaler Eingangsgroßenraum aufgespannt wird (etwa durch Saugrohrdrucl , Drehzahl und Soll-Gemischverhaltnis)
Bevorzugt erfolgt bei dem Verbrennungsmotor die Kraftstoffzuführ durch Einspntzen Vorteilhaft ist die die zuzuführende Kraftstoffmenge steuernde Ausgangsgroße dann eine oder mehrere der folgenden Großen Einspritzdauer, Tastverhaltnis der Einspritzventiloffhung, Einspritzdruck, Of hungsgrad des Einspritzventils (Anspruch 9) Mit dem Tastverhaltnis ist auch hier die Öffhungsdauer bezogen auf die Dauer eines Arbeitstakts
oder eines Arbeitsspiels gemeint. Der Öffnungsgrad des Einspritzventils kann z.B. über den Hub der Ventilnadel gesteuert werden.
Bei den heute am meisten verbreiteten Otto-Motoren erfolgt die Kraftstoffeinspritzung nicht direkt in die Zylinder, sondern in das ihnen vorgelagerte Saugrohr. Der Kraftstoff benetzt hier zunächst die Saugrohrwand (sog. Wall-Wetting-Effect) und benötigt dann für den Übergang in die gasförmige Phase eine gewisse Zeit. Als Folge hiervon erreicht nur ein Teil der zu einem Arbeitstakt eingespritzten Kraftstoffmenge in diesem Arbeitstakt den zugeordneten Zylinder. Der übrige Teil wird erst später gasförmig und wird daher bei späteren Arbeitstakten und - bei gemeinsamer Einspritzung für mehrere Zylinder - zum Teil in nicht zugeordneten Zylindern verbrannt. Das erfindungsgemäße Verfahren ist besonders vorteilhaft bei einem Motor einsetzbar, der keinen derartigen Kraftstoffspeichereffekt aufweist da hier keine derartige Verzögerung berücksichtigt zu werden braucht (Anspruch 10). Insbesondere ist dies ein direkteinspritzender Motor. Auch Motoren, bei denen die Einspritzung in eine Vor- oder Nebenkammer erfolgt, weisen keinen Kraftstoffspeichereffekt auf, sofern nach dem Verbrennungstakt praktisch kein Kraftstoff in der Vor- bzw. Nebenkammer verbleibt.
Das Fehlen eines Kraftstoffspeichereffekts erlaubt eine besonders einfache Ausgestaltung des Verfahrens, indem die Ermittlung der Ausgangsgröße/n im Schritt b) nur auf Größen beruht, die zum aktuell durchgeführten Arbeitstakt gehören - also insbesondere auf dem Ergebnis der im unmittelbar vorausgegangenen Schritt a) erfolgten Eingangsgrößenmessung (Anspruch 11).
Das erfindungsgemäße Verfahren ist aber auch vorteilhaft bei Verbrennungsmotoren mit Kraftstoffspeichereffekt einsetzbar. Die bei einem bestimmten Arbeitstakt in einen Zylinder gelangende Kjaftstoffmenge hängt hier i.a. auch von der bei vorausgegangenen Takten eingespritzten Kjaftstoffmenge ab. Vorzugsweise werden daher bei einem solchen Motor auch Größen aus einem oder mehreren vorhergehenden Arbeitstakten in die Ermittlung der Ausgangsgröße/n im Schritt b) einbezogen (Anspruch 12). Hierbei kann es sich z.B. um die in diesen vorhergehenden Takten eingespritzten Kraftstoffmengen handeln, die sich im aktuellen Takt noch auswirken. Ihre Berücksichtigung erlaubt eine sehr genauere Steuerung der im aktuellen Takt einzuspritzenden Kjaftstoffmenge.
Vorteilhaft hat die gespeicherte Abbildungsinformation die Form eines Kennfeldes, welches die Ausgangsgroße/n direkt oder indirekt enthalt (Anspruch 13) Ein Kennfeld erhalt man beispielsweise, indem man den (i a mehrdimensionalen) Eingangsgroßenraum diskretisiert und jeder durch die Diskretisierung gebildeten Eingangsgroßenzelle eine Ausgangsgroße oder - bei einer mehrdimensionalen Abbildung - mehrere Ausgangsgroßen zuordnet Die Diskretisierung des Eingangsraums muß dabei nicht regelmäßig erfolgen, ebenso muß die Größe der Eingangsgrößenzellen nicht konstant sein Das Lernen erfolgt hierbei so, daß im Schritt f) die gespeicherten Werte einer oder mehrerer benachbarter Eingangsgroßenzellen entsprechend einer festgestellten Abweichung so verstellt werden, daß bei einem zukunftigen Betrieb in der gleichen Eingangsgroßenzelle eine kleinere Abweichung auftritt
Besonders bevorzugt erfolgt die Abbildung der Eingangsgroße/n auf die Ausgangsgroße/n sowie die Adaption der gespeicherten Abbildungsinformation durch einen Neuronal es-Netz- Algorithmus (Anspruch 14) Infolge der Parallelisierung der Datenverarbeitung in sogenannten, das Netz bildenden Neuronen kann die Verwendung eines Neuronales-Netz- Algorithmus die Berechnungszeit der Ausgangsgroße auf Basis der gespeicherten Abbildungsinformation im Vergleich zu anderen Inteφolationsverfahren (z B splines, lineare oder polynomiale Inteφolation) bei Verwendung angepaßter hardware erheblich verkürzt werden Wahrend bei der Verwendung bekannter Inteφolationsverfahren schon durch die Auswahl der Inteφolation (eventuell gar nicht vorhandenes) Vorwissen über den zu approximierenden Zusammenhang angesetzt wird, kann ein Neuronales Netz ganzlich ohne diese Vorwissen auskommen Insbesondere sind Neuronale Netze durch ihren Auswerte- und Adaptionsalgorithmus für das vorliegende lernfahige Verfahren sehr vorteilhaft einsetzbar
Gemäß dieser bevorzugten Ausgestaltung wird also ein Neuronales Netz NN so angesetzt, daß die Steuergroße des Luftpfades (z B der Saugrohrdruck) auf die Steuergröße des Kraftstoffpfades solchermaßen abgebildet wird, um so ein gewünschtes Gemischverhaltnis zu erreichen Die Steuergroße des Luftpfades wird auch aus historischer Sicht als die Steuergroße betrachtet, mit der der Fahrer die Leistungsabgabe des Verbrennungsmotors beeinflußt Das lernfahige Neuronale Netz ΛW soll dabei in Abhängigkeit von der fahrerbeeinflußten Steuergroße für den Luftpfad und ggf vom
Motorbetriebszustand (z B Drehzahl) die Steuergroße, hier z B a} für den
Kraftstoffpfad ausgeben Der Ausgang des Neuronalen Netzes entspricht also z B dem Tastverhaltnis der Einspritzventile af , der Eingangsraum des Neuronalen Netzes NN besteht in diesem Beispiel aus Saugrohrdruck pm und Motordrehzahl /?, wir schreiben also
ar = NN{pm,t.) (11)
Das Ziel der Steuerung ist, für jeden Betriebspunkt ein gewünschtes Kraftstoff-Luft- Verhältnis mit
m acvl λ = - (12)
K mj yl
zu erreichen Im weiteren vernachlässigen wir den konstanten Faktor KA Mit dem Neuronalen Netz NN als Steuerung nach ctl = al (pm,tι) = NN(pm ,tι) kann vorstehende Gleichung also als
X _ m« _. NL° fo- ") _. NL- ( P« ' ?/) (13) mfcyl NLf (af , n) NLJ [ Λ (Pnl , «), /ι]
geschrieben werden Soll ein bestimmtes Gemischverhaltnis λ iθU erreicht werden, so muß im Neuronalen Netz NN eine Abbildung gelernt werden, so daß maal = λwUmfcvl gilt, also
NLa (pm,n) ~: λsolINLf [NN {f.,»),,.] (14)
Vorteilhaft wird hierbei die Ausgangsgroße durch Verknüpfung eines die abgespeicherte Abbildungsinformation repräsentierenden Stutzwertevektors und eines von der/den Eingangsgröße/n abhangigen Aktivierungsvektors gebildet (Anspruch 15) Diese Verknüpfung
ist vorzugsweise linear, und hat insbesondere die Form eines Skalaφrodukts oder - bei mehrdimensionaler Ausgangsgröße - eines Vektor-Matrix-Produkts (Anspruch 16). Gemäß obigem Bespiel erhält man dann die Steuergröße af mit
cιf (pm,n) - Θτ A(pm,fή , (15)
wobei Θ der Stützwertevektor und A(pm,ri) der Aktivierungsvektor ist.
Es ist vorteilhaft, daß der Aktivierungsvektor normiert ist und nur vom Abstand der Eingangsgröße/n zu den Stützstellen abhängt, die der Vektordarstellung zugrunde liegen (Anspruch 17). Die Normierungsbedingung lautet z.B.
A(x)τ \ = \ . (16) d.h. die Summe aller Komponenten des Aktivierungsvektors ist stets gleich eins.
Die Abhängigkeit des Aktivierungsvektors A nur vom Abstand der Eingangsgröße/n zu den Stützstellen läßt sich dadurch ausdrücken, daß seine Komponenten At nur von einer Variablen abhängt, die dem Abstand zu der zur betrachteten Stützstelle gehörenden Komponente entspricht:
A, = A, (d, ) (17)
mit den Abständen
< = | - £ | 0*
wobei ςt die Stützstellen, d.h. die Orte der Neuronen im Eingangsraum sind.
Besonders vorteilhaft ist eine Ausgestaltung, bei der die Abbildung der Eingangsgröße/n auf die Ausgangsgröße/n im wesentlichen lokal ist (Anspruch 18) Dies bedeutet, daß bei einem bestimmten Wert der Eingangsgröße/n im wesentlichen nur derjenige/diejenigen Stützwert/e
zu der Abbildung auf die Ausgangsgroße/n beitragen, die in unmittelbarer Nachbarschaft zu der/den Eingangsgroße/n liegt/liegen Dies wird vorteilhaft dadurch realisiert, daß nur diejenige/n Komponente/n des Aktivierungsvektors nennenswert große Werte erhalt/erhalten, die im geringen Abstand zu der/den Eingangsgroße/n liegt/liegen, wahrend Komponenten in größerem Abstand vernachlassigbar klein sind oder verschwinden (Anspruch 19)
Besonders vorteilhaft hangen die Komponenten des Aktivierungsvektors vom Abstand der Eingangsgroße/n zu der zugehörigen Stutzstelle gemäß einer Zentrumsfünktion ab (Anspruch 20) Beispiele für vorteilhafte Zentrumsfunktionen sind
-- ." 1
Am ~ e σ oder A^ , wobei σ ein (ggf variabler) Breitenparameter ist
1 + σ ■ d.
Grundsatzlich braucht die "Reichweite" des Lernens nicht mit der derjenigen der Abbildung übereinstimmen So ist es z B möglich, den Lernvorgang lokal zu gestalten (d h bei einer Abweichung nur Stutzwertkomponenten in der Nahe der Abweichungsstelle zu adaptieren), hingegen die Abbildung nichtlokal durchzuführen (d h in die Abbildungsoperation auch Stutzwertkomponenten einzubeziehen, die weiter entfernt von dem abzubildenden Eingangswert liegen) Vorteilhaft werden jedoch beide Reichweiten im wesentlichen gleich gewählt, d h die Adaption der Abbildungsinformation erfolgt im wesentlichen in dem gleichen Bereich des Abstands von einer Abweichungsstelle, der auch in die Abbildung einer an dieser Stelle liegenden Eingangsgroße auf die Ausgangsgroße einbezogen wird (Anspruch 21)
Vorteilhaft erfolgt die Adaption der Abbildungsinformation im wesentlichen lokal zur Abweichungsstelle (Anspruch 22) Dies laßt sich z B durch
ΔΘl » ΔΘ (19)
ausdrucken, wobei ΔΘ ein Stutzwertekorrekturvektor ist Besonders vorteilhaft erfolgt sowohl die Adaption als auch die Abbildung lokal und mit gleicher Reichweite
Genauer erfolgt die Adaption der Abbildungsinformation vorzugsweise so, daß zu dem Stutzwertevektor ein Stutzwertekorrekturvektor addiert wird, welcher einer Verknüpfung des Abweichungswerts mit dem Aktivierungsvektor proportional ist (Anspruch 23) Bei der Verknüpfung handelt es sich insbesondere um das Produkt des Abweichungswerts mit dem Aktivierungsvektor Die Adaption erfolgt z B gemäß
Θ = ψ( >m .n)A(j,m,n) (20)
Der Faktor η in dieser Gleichung repräsentiert die Lernschrittweite Die Große e ist der gemessene Gemischfehler im Betriebspunkt, der zu
P„ .n) = HPm>") - λ .ιι (21)
als Abweichung vom hier als konstant angenommenen Sollwert definiert ist Bei Verwendung einer Breitband-lambdasonde kann auf die Große der Abweichung geschlossen werden, wahrend diese Information bei einer Lambda-Sonde mit sprungförmiger Kennlinie nur in Form einer Aussage „zu fett" oder „zu mager" vorliegt Bildlich gesprochen werden durch die Aktivierung A(pnι ι) die einzelnen Stutzwerte ausgesucht, welche nach der Beziehung
Q neu _ & al, + ΔQ 2)
adaptiert werden
Wird ein lernfahiges Verfahren wie hier Steuerung von Verbrennungsmotoren angewendet, so geschieht der Lernprozeß allein aus Sicherheits- und Akzeptanzgrunden vorzugsweise mit einem Adaptionsgesetz mit nachweisbarer Stabilität und Parameterkonvergenz (Anspruch 24) Unter "Konvergenz" wird hier die Konvergenz gegen ein globales Minimum des Abstandes zwischen λ und λsou in allen zum Lernen angefahrenen Betnebspunkten verstanden (nicht etwa nur Konvergenz gegen ein lokales Minimum) Konvergenz bedeutet dann, daß das Lernverfahren erst dann abgeschlossen sein kann, wenn der Stutzwertevektor gegen den
einzig möglichen, aber unbekannten Stutzwertevektor konvergiert Es wird Bezug genommen auf die folgende Beschreibung eines Beweises für Stabilität und Konvergenz eines bevorzugten Adaptionsgesetzes.
Vorrichtungsmäßig wird die eingangs genannte Aufgabe durch eine Vorrichtung zur Gemischsteuerung bei einem Verbrennungsmotor gemäß Anspruch 24 gelöst, die folgendes umfaßt: a) wenigstens eine Einrichtung zur Messung wenigstens einer Größe, mit der die in einen Brennraum des Verbrennungsmotors gelangende Luftmasse im Zusammenhang steht (sog. Eingangsgröße), b) wenigstens eine Stelleinrichtung zum Zufuhren von Kraftstoff; c) wenigstens eine Einrichtung zur Messung einer Größe, die Information über das so entstandene Gemisch oder dessen Verbrennung trägt (sog Istgröße); d) wenigstens einen Speicher zur Aufnahme der veränderlichen
Abbildungsinformation; e) und einen zur Ausführung des Verfahrens nach Anspruch 1 programmierten und/oder fest verdrahteten Rechner
Bezüglich vorteilhafter Ausgestaltungen der Vorrichtung wird auf die obigen Ausführungen zum Verfahren verwiesen.
Die Erfindung wird nun anhand von Ausführungsbeispielen und der angefügten Zeichnung veranschaulicht. In der Zeichnung zeigen:
Fig. 1 einen Signalflußplan für die Bildung des Gemischverhaltnisses bei einem direkteinspritzenden Kolben-Verbrennungsmotor mit herkömmlicher Einlaßsteuerung;
Fig. 2 einen Signalflußplan entsprechend Fig. 1, jedoch für einen ungedrosselten Verbrennungsmotor mit frei betätigbaren Einlaßventilen,
Fig. 3 eine Schemadarstellung eines direkt einspritzenden Otto-Motors mit herkömmlicher Einlaßventilsteuerung;
Fig 4 einen Signalflußplan entsprechend Fig 1, jedoch mit Darstellung eines Neuronales- Netz-Algorithmus, Fig 5 eine sog Parallel-Darstellung eines Neuronales-Netz-Algonthmus, Fig 6 eine Signalflußplandarstellung eines Neuronales-Netz-Algorithmus mit einer Eingangsdimension,
Fig 7 Diagramme, welche die Netzausgabe als Funktion eines eindimensionalen Eingangswerts darstellen, zur Veranschaulichung der Lokalitat der Stutzwertadaption, Fig 8 eine Veranschaulichung des Inter- und Extrapolationsverhalten eines Neuronales- Netz- Algorithmus,
Fig 9 eine einfache Lernstruktur eines Neuronales-Netz-Algonthmus, Fig 10 eine Darstellung einer beispielhaft angenommenen Nichtlineaπtat für den Luftpfad, Fig 11 ein Fig 10 entsprechende Darstellung für den Kraftstoffpfad, Fig 12 ein Diagramm des zeitlichen Verlaufs der Ausgangsgroße zum Beginn des Lernens, Fig 13 ein Diagramm gemäß Fig 12, jedoch im Verlauf des Lernens,
Fig 14 ein Diagramm gemäß Fig 12, jedoch nach nahezu abgeschlossenem Lernprozeß,
Fig 15 ein Diagramm des Gemischfehlers im Verlauf des Lernprozesses, und
Fig 16 eine Gegenüberstellung des zu erlernenden und des erlernten Zusammenhangs
Wichtig bei der Anwendung von Ansätzen mit Lernprozeß ist der Sicherheitsgedanke, die Frage also, ob das Lernen stets ohne Irrwege zum richtigen Ergebnis führt, ein mathematischer Stabilitats- und Konvergenzbeweis sollte also führbar sein Bei dem im folgenden zu beschreibenden beispielhaften Vorgehen wird ein spezielles Neuronales Netz in Abhängigkeit bestimmter meßbarer Zustandsgroßen des Verbrennungsmotores und/oder des Fahrerwunsches das Tastverhaltnis der Einspritzung durch direkteinspritzende (Magnet-)Ventile als Steuergroße ausgeben Sinnvollerweise wird das Neuronale Netz neben stationär bestimmtem Vorwissen als Korrekturglied angesetzt, welches online so adoptiert wird, daß stets das gewünschte Gemischverhaltnis adaptiert wird
Bezuglich der Bildung von Gemischverhaltnissen wird auf die Fig 1 und 2 und die dazugehörigen vorausgegangenen Ausführungen verwiesen
Die nachfolgende Darstellung von Ausführungsbeispielen soll zunächst an einem direkteinspritzenden Ottomotor mit herkömmlicher Einlaßventilsteuerung mit festen Steuerzeiten nach Fig 3 erfolgen
Die Laststeuerung bei dieser Verbrennungsmotoren-Bauart geschieht über den Lagewinkel der Drosselklappe der Fahrer steuert damit den Luftmassenstrom fna[ in das Saugrohr Bei geöffneten Einlaßventilen saugt der Zylinder wahrend der
Abwartsbewegung des Kolbens im Ansaugtakt den Luftmassenstrom mm an, bis nach dem Schließen die Frischluftmasse macyl im Zylinder zur Verbrennung zur Verfügung steht Die Frischluftmasse im Zylinder hangt dabei entscheidend von dem thermodynami sehen Saugrohrzustand Druck pm nach Gleichung 2 ab Letztendlich bestimmt der Fahrer also über die Drosselklappenlage den Luftdruck im Saugrohr und damit mittelbar die Last im Zylinder
Aus den obigen Ausführungen geht hervor, daß die nach dem Schließen der Einlaßventile im Brennraum befindliche Luftmasse maal nichthnear abhangig von einerseits der
Motordrehzahl und andererseits dem Saugrohrdruck ist
Die Motordrehzahl bestimmt nämlich die zum Ansaugen zur Verfügung stehende Zeitspanne, so daß als Faustregel gilt, daß bei niedrigerer Drehzahl mehr Frischluft gleichen thermodynamischen Zustandes wie im Saugrohr angesaugt werden kann
Durch das konstruktive Design der Ansaugkrummer und des Saugrohres wird dazu der Effekt erzielt, daß durch akustische Phaenomene (Interferenzen) in bestimmten Drehzahlbereichen eine höhere Füllung erreicht wird Dies wird bei
Verbrennungsmotoren mit variabler Saugrohrgeometrie zur Drehmomentensteigerung ausgenutzt
Bei schnellem Herablaufen des Kolbens bei geöffneten Einlaßventilen besteht im Inneren der Zylinder gegenüber dem Saugrohr ein großer Unterdaick, so daß der Zylinder aus
dem Saugrohr ansaugt Nach der thermodynamischen Durchflußgleichung für kompressible Medien jedoch kann das durchströmende Medium keine höhere als die Schallgeschwindigkeit erreichen, so daß der Massenstrom durch das Einlaßventil für verschiedene Betriebsbereiche des Motors bei wachsendem Druckunterschied nicht mehr weiter ansteigen kann (Laval Verhältnis, choked-flow-Effekt)
Insgesamt hängt also die angesaugte Luftmasse macyl bei diesem Beispiel stetig nichtlinear ab vom Saugrohrdruck und der Drehzahl, bei variabler Ansauggeomtrie zudem noch von deren Steuerwinkel oder dem der verstellbaren Einlaßnockenwelle Mathematisch schreiben wir also
"V, = NLa (Pm ή (23)
Analoge Überlegungen lassen sich für die Kraftstoff-Direkteinspritzung anstellen. Infolge der Massenträgheit der Ventilnadeln ergibt sich auch hier ein nichtlinearer Zusammenhang zwischen eingespritzter Kraftstoffmasse und Tastverhaltnis zusammen mit der Tastfrequenz (reziprok der halben Drehzahl bei Viertakt-Motoren) Ein weiterer Effekt, der die eingespritzte Kraftstoffmasse nichtlinear beeinflusst, ist der Abfall des Kraftstoffversorgungsdruckes beim Öffnen des Ventils, auch hierdurch entstehen im KraftstoffVersorgungssystem Druckschwingungen, welche das Einspritzverhalten drehzahlabhängig beeinflussen Insgesamt hangt die eingespritzte Kraftstoffmasse nach diesen Überlegungen statisch nichtlinear ab von der Ventiloffnungszeit und der Einspritzfrequenz (2/n).
Mathematisch schreiben wir also
mfcvl = NLs {af ι) (24)
Die Idee zur Gemischsteuerung besteht jetzt darin, ein Neuronales Netz NN so anzusetzen, daß die Steuergröße des Luftpfades (hier der Saugrohrdruck) auf die Steuergröße des Kraftstoffpfades solchermaßen abgebildet wird, um so ein gewünschtes Gemischverhaltnis zu erreichen
Das lernfähige Neuronale Netz NN soll dabei in Abhängigkeit des Motorbetriebszustandes (hier die Drehzahl) und der fahrerbeeinflußten Steuergröße für den Luftpfad (hier der Saugrohrdruck) die Steuergröße (hier af ) für den Kraftstoffpfad ausgeben.
Der Ausgang des Neuronalen Netzes entspricht also hier dem Tastverhältnis der Einspritzventile af , der Eingangsraum des Neuronalen Netzes NN besteht aus
Saugrohrdruck pm und Motordrehzahl //, wir schreiben also
Das Ziel der Steuerung ist, für jeden Betriebspunkt ein gewünschtes Kraftstoff-Luft- Verhältnis mit
X _ — 2S- _ , (26)
zu erreichen. Im weiteren vernachlässigen wir den konstanten Faktor Kλ . Mit dem NN als Steuerung, nach af = af (pm,n) = NN(pm,n) kann vorstehende Gleichung also als
X _ "Ϊ?2 _ NL *(P->n) = VL, (/ „,, /;) (27) mfcyl NLf (af ,n) NLf [NN (/ ,„ ,//),//]
geschrieben werden. Soll ein bestimmtes Gemischverhältnis λ oll erreicht werden, so muß im NN eine Abbildung gelernt werden, so daß mM l = λ oUmfcyl gilt, also
NL
a (p
m,n) = λ
sollNL
f [NN
. (28)
Beispielhaft für eine Vielzahl lernfähiger Neuronaler Netzarchitekturen verwenden wir ab hier das sogenannte DANN, welches den gewählten Ansatz besonders plausibel macht; außerdem gestattet dieser Algorithmus eine einfache Beweisführung für Stabilität und Parameterkonvergenz ebenso wie eine sinnvolle Interpretierbarkeit des gelernten Wissens. Das DANN ist eine besonders rechenzeitoptimale Ausgestaltung eines sogenannten RBF-Netzes mit lokaler Stützwertewirkung. Eine eingehende Beschreibung des DANN folgt unten.
Wir setzen also an
af (jpm,n) = __r A(pm,n) (29)
wobei die Stützwerte Θ des Neuronalen Netzes so adaptiert werden müssen, um beide Nichtlinearitäten in Gleichung 28 im Betriebspunkt (p„,,n) auszugleichen.
Dies soll mit dem Adaptionsansatz
® = ψ(pmJ>)Ä(py>) (30)
mit garantierter Stabilität erfolgen. Der Faktor η in dieser Gleichung repräsentiert die
Lernschrittweite. Bildlich gesprochen werden durch die Aktivierung A{pm,n) die einzelnen Stützwerte ausgesucht, welche nach der Beziehung
Θf, = Θ " + ΔΘI (31)
adaptiert werden. Nun wirken die Stützwerte beim DANN hauptsächlich lokal, ohne großen Fehler können wir
ΔΘ = ηe(pm ,n)A{pm,ri) = ΔΘ|^ n = ψ (32)
annehmen (wobei die Größe rechts neben dem Entsprichtzeichen die Kompoente des Θ - Vektors ist, die der Stelle (pm,n) nächsten liegt).
Wegen des taktdiskreten Arbeitsverfahren des Kolben-Verbrennungsmotors ersetzen wir in dieser Ableitung die kontinuierliche Ableitung (nach der Zeit) durch die Notation mit Deltagrößen, was einer Ableitung nach den Arbeitstakten des Verbrennungsmotors entsprechen soll.
Um den Stabilitätsbeweis mathematisch zu führen, untersuchen wir die Auswirkung dieser lokalen Adaption nach Gleichung 32 auf den Gemischfehler e im Betriebspunkt, der zu
<Pm,n) = λ(.p- .») - λMll (33)
als Abweichung vom hier als konstant angenommenen Sollwert definiert ist. Wir bestimmen also
woraus mit Gleichung 27
Ae(pm,n) = Aλ(pm,n) Δα (/?„,//)
(35) ΔΘI •P- ." „ Δα.CΛ,,/.) ΔΘI „
folgt. Zunächst wollen wir den ersten Quotienten der rechten Seite aus vorstehender
A Gleichung betrachten: ist kleiner oder gleich null! Dies kann ganz einfach erklärt
Aaf werden: bei konstanter Luftmasse im Zylinder nimmt die Luftzahl λ mit zunehmender eingespritzter Kraftstoffmasse mfeyl ab, das Gemisch wird fetter. Und mit zunehmendem
Tastverhältnis af , also längerer Ventilöffnungsdauer bei gleichbleibender Drehzahl, wird
naturlich auch mehr Kraftstoff eingespritzt, zumindest aber gleichviel, weniger wäre widersinnig Es gilt also nach Gleichung 27
NL,(af,n)
ΔA^"> -m-NL.jp ,n) *'<"""] = -K. ^ <0 (36)
Aa f(Pm-n) NL (af,n) NLj-(af,n)
weil ja
naturlich großer (oder evtl gleich) null ist
Nun betrachten wir den zweiten Quotienten der rechten Seite von Gleichung 35 Aus den Eigenschaften des Neuronalen Netzes DANN folgt
af(pm, )
>0 (38)
ΔΘl
was bedeutet, daß bei Verstellung eines Stutzwertes nach oben an einer bestimmten Stelle im Eingangsraum des DANN/GRNN die Ausgabe des Netzes an dieser Stelle naturlich auch steigt Damit gilt
Diese Ableitungen sind möglich, weil bei der Stutzwerteadaption wegen der Lokalitat der Stutzwertewirkung dieser Netze
ΔΘ|fc Λ - ΔΘ = e(pm,,ι)A(pm,,ή (40)
gilt
Wir können nun zusammenfassen
Ae(p
m,n) = Aλ(p
m ,n) = (41)
und mit dem Adaptionsgesetz folgt
Ae(pm,n) = „ = -kηe(pm,n) k ≥ 0 (42)
Damit ist die Beziehung
Ae(pm,n) = -kηe(pm,n) k > 0 (43)
hergeleitet, mit der die Stabilität des Adaptionsansatztes 18 bewiesen ist Dazu inteφretieren wir Gleichung 43 verbal
Das Vorzeichen der Fehleranderung ist also stets invers dem Vorzeichen des Fehlers, mit anderen Worten, ist der Fehler kleiner null (e <0), so steigt sein Wert ( Δe >0), sein Betrag wird damit kleiner Ist der Fehler großer null, so fallt sein Wert, auch hier wird somit der Betrag kleiner Somit kann der Fehler nur gegen null konvergieren
Neben der Konvergenz des Gemischfehlers im Arbeitspunkt zu null folgt aus den Eigenschaften des DANN die Konvergenz der Stutzwerte in den gelernten Arbeitspunkten gegen die einzig möglichen Stutzwerte, mit denen λ = λ∞n erreicht werden kann Diese Ableitung gilt lokal, für den Arbeitspunkt (pm,n) des Verbrennungsmotores Logisch ist, wiederum wegen der Lokalitat der
Stutzwertewirkung, daß nur in diesen Betriebspunkten der Gemischfehler mit hoher Genauigkeit ausgeglichen wird, in denen auch die Steuerung lernen kann
Zu berücksichtigen ist noch eine Lernkorrelation, nämlich eine Totzeit wegen des Viertakt-Arbeitsverfahrens. Bei den obenstehenden Ableitungen waren wir bei der Adaption davon ausgegangen, daß bei der Gemischbildung gleich der entstehende Gemischfehler zur Adaption der Einspritzsteuerung herangezogen werden kann Infolge des Viertakt-Arbeitsverfahren des Verbrennungsmotors steht jedoch bei Verwendung einer Abgas-Lambdasonde erst frühestens nach drei Takten Totzeit (Verdichten, Verbrennen, Ausschieben) ein Meßwert für die Luftzahl zur Verfügung Dargestellt ist dies in Fig 4 Diese Figur zeigt einen Signalflußplan für die Bildung des Gemischverhaltnis bei gedrosselten direkteinspritzenden Kolben- Verbrennungsmotoren Die zusatzliche (dünn eingezeichnete) Abhängigkeit 77,,,, = ( , , αcl ,_ ) gilt für Motoren mit variabler Nockenwelle oder Schaltsaugrohr Zwischen Gemischbildung und Lambda-Messung liegt eine Totzeit von drei Takten wegen des Viertakt- Arbeitsverfahren des Verbrennungsmotors
Zur Lernkorrelation müssen wir demnach bei der Adaption diese Totzeit berücksichtigen Dies geschieht zweckmaßigerweise durch eine einfache Verzögerung der Eingangswerte (pm und ri) bei der Adaption, so daß Fehlersignal und zu verstellender Stutzwert miteinander korrelieren Dagegen müssen zur Bildung des Einspritzsignals ( y ) die unverzogerten Eingangswerte herangezogen werden
Das obenstehend beschriebene Beispiel betrifft die Synthese eines Steuergesetzes für die Einspritzung bei direkteinspritzenden Verbrennungsmotoren Der Beschreibung lag ein gedrosselter Benzin-Direkt einspritzer mit konstantem Soll-Gemischverhaltnis zugrunde Kann das Soll-Gemischverhaltnis wie beispielsweise bei Dieselmotoren einen variablen Wert annehmen, so kann dieser Sollwert als zusatzliche Eingangsdimension des DANN vorgesehen werden Ebenso kann bei nockenwellenlos angetriebenen Einlaßventilen deren Steuersignal (Tastverhältnis aa ) anstelle des Saugrohrdruckes als Netzeingang herangezogen werden Sinnvoll ist bei einer realen Implementierung der Ansatz des Neuronalen Netzes als Korrekturglied neben z B off-line bestimmten Vorwissen in Form etwa einer linearen Abbildung pm -» y Dadurch kann die Lernzeit erheblich verringert werden
Die folgende Tabelle gibt uberblickartig die hier verwendete Nomenklatur wieder
m acyi Masse Frischluft im Zylinder kg fnal Massenstrom Frischluft durch Drosselstelle kg s~" ήlav Massenstrom Frischluft in den Zylinder kg s~"
THrcyi Masse Kraftstoff im Zylinder kg n Drehzahl des Kolben-Verbrennungsmotors s"
Po Umgebungsdruck der Luft (langsam veränderlich) Pa pm Luftdruck im Saugrohr Pa
R Gaskonstante J/kgm
To Lufttemperatur m der Umgebung (langsam veränderlich) A'
T Zeitkonstante der Lambdasonde s
Tm Lufttemperatur im Saugrohr A VD Hubvolumen eines Zylinders m3 acs Steuerwinkel bei variabler Nockenwellensteuerung (VANOS) rad ath Lagewinkel der Drosselklappe rad t]voi Volumetrische Effizienz — λ Luftzahl — λ~ gemessene Luftzahl —
Im folgenden wird als Beispiel für einen geeigneten lemfahigen Neuronales-Netz- Algorithmus das sogenannte DANN naher erläutert Es verbindet die Vorteile normierter RBF-Netze mit dem Vorteil der Rechenzeit- und Speicherplatzoptimierung
Bei Verwendung des sogenannten Distance Activation Neural Network DANN nach Fig 5 die eine Parallel-Darstellung eines DANN mit zwei Eingangsdimensionen zeigt, wird durch die lokale Stützwertewirkung beim Lernvorgang Parameterkonvergenz garantiert und die Problematik der sog persistent excitation umgangen Parameterkonvergenz bedeutet hierbei, daß das Neuronale Netz nur mit einem Parametersatz eine bestimmte statische Nichtlinearität approximieren kann Es besteht demnach eine eindeutige Zuordnung von gelerntem Zusammenhang und Stutzwerten des NN , dies macht das gelernte Wissen inteφretierbar Dieser im Vergleich zu anderen lemfahigen Algorithmen entscheidende Vorteil beruht auf der Form des RBF-Netzes, speziell des DANN die beim Lernen zu verstellenden Parameter wirken in der Hauptsache lokal und das Netz liefert damit eine stetige Ausgangsfunktion über dem Eingangsraum mit definiertem Inteφolationsverhalten Das Extrapolationsverhalten des DANN an Stellen, an denen
kein Wissen in Form gelernter Parameter zur Verfügung steht, ist ebenso definiert wie sinnvoll: der Ausgang des Netzes entspricht einem (gewichteten) Mittelwert des gelernten Wissens in der gelernten Umgebung; das DANN unterscheidet sich hierin erheblich vom originären RBF-Netz. Das Netz besteht aus lokal aktivierten Neuronen, d.h. hauptsächlich die Neuronen in der unmittelbaren Umgebung des Netzeinganges x werden aktiviert. Die Struktur des DANN ist unterteilbar in Aktivierung und Gewichtung. Dies veranschaulicht die in Fig. 6 gezeigte Signalflußplan-Darstellung eines DANN mit einer Eingangsdimension (d.h. skalarem Eingang x), A(x) und θ sind
Vektoren; j>(x) = _\τ A(x) . Dadurch ist es beim Lernen für das sogenannte Verfahren der verzögerten Aktivierung zugänglich.
Kurz sei nun der Algorithmus des DANN beschrieben.
Ein skalarer Schätzwert y an einer Stelle x e 9T mit einer gegebenen Menge von q
Datenpunkten (Stützwerten θj an Stützstellen ς ) (θ„ ς ), / e [l, <r/] und ς e 9T ist beim DANN definiert durch die Gleichung
1
Σ* &, 1 + σd : v = 1 lT A(D (44)
∑: 1 + σd
mit den Abständen
=| *-£ l (45)
Gleichung 44 garantiert die Beschränktheit der Aktivierung _{(x) , durch die Normierung wird
A(x)τ \ = l (46)
erreicht, das heißt, die Summe der Aktivierungen aller Neuronen ist stets gleich eins, ebenso betragt die Aktivierung eines einzelnen Neurons stets einen Wert zwischen null und eins Aus Gleichung 44 wird klar, daß bei sehr kleinem Glattungsfaktor σ nahezu nur ein einziges Neuron aktiviert wird, damit tragt also beinahe nur ein einziger Stutzwert zum Ergebnis der Auswertung bei Wird also ein Stutzwert verstellt, so wird der Netzausgang auch nur in dessen Umgebung verändert Wir nennen diesen Sachverhalt "Lokalität" der Stützwertewirkung Zur Veranschaulichung zeigt Fig 7 die Lokalitat der Stutzwertewirkung, der Netzausgang ändert sich nur in der Umgebung des verstellten Stutzwertes. Diese Feststellung ist wichtig für den Stabilitatsbeweis des Lernens bei dem erfindungsgemaßen Verfahren
Gleichung 44 definiert eine stetige beliebig nichtlineare Ausgangsfünktion y - fix) (bezeichnet geschätzte oder verstellbare Großen) mit definiertem Inter- und Extrapolationsverhalten wie in Fig 8 dargestellt Diese Figur zeigt Inter- und Extrapolationsverhalten des DANN, die Kreuze bezeichnen die vorhandenen Datenpunkte Im gelernten Bereich stimmt der durch die Stutzwerte (Kreuze) approximierte Verlauf mit der zu erlernenden Sinus-Funktion uberein Über den gelernten Bereich hinaus tendiert der Schatzwert mit zunehmender Entfernung vom nächsten Stutzwert zum Durchschnitt allen vorhandenen Wissens (Stutzwerte) Der Schatzwert an einer Auswertestelle mit großem Abstand zum gespeicherten Wissen (Datenpunkte) wird sich zum Mittelwert des vorhandenen Wissens ergeben, in der unmittelbaren Nähe eines Datenpunktes bestimmt dieser hauptsachlich den Netzausgang Werden die Stutzwerte in ihrem Gewicht S, als verstellbar definiert, so kann die einfachste, in Fig 9 dargestellte Online-Struktur zum Lernen abgeleitet werden Diese Darstellung gilt für zeitkontinuierliche Systeme Das gezeigte DANN kann alle statischen (ohne interne Zustande wie z B Gedächtnis) Nichtlinearitaten bis hin zu Unstetigkeiten (grouped activation method) abgesehen eines kleinen Approximationsfehlers wegen der endlichen Stutzwerteanzahl erlernen Bei Abbildungen mit Gedächtnis (z B wegen des oben erwähnten Speichereffekts) wird die Information über vorausgegangene Ereignisse in das Lern- und Abbildungsverhalten mit einbezogen Die in Fig 9 dargestellte Lernstruktur basiert auf einem bekannten mathematischen Fehlermodell, für das Stabilität nach der direkten Methode nach Ljapunov bewiesen ist
Eine zu erlernende eindimensionale Nichtlinearitat wie in Fig 9 soll in der DANN-Form als das Skalarprodukt _y(t) = __τ Λ[(x(0) + (~ dargestellt sein, wobei x(t) , y(t) e \R und A, S_ e 9T, der konstante Vektor 3 ist der unbekannte zu erlernende Parametervektor der Dimension n, wobei n Stutzwerte verteilt über dem Eingangsraum die reale zu erlernende Nichtlinearitat bis auf den Fehler d -> 0 mit n — > ∞ darstellen können Nach Fig 9 berechnet sich der Beobachterfehler zu e(t) = >(t) - yi ) Wird ein
Parameterfehlervektor definiert als Φ(t) = _if) - S_, so ergibt sich die Fehlergleichung zu
e(t) = dixit))τ Φit) (47)
Nach dem Fehlermodell 1 kann
Φ(t) = -e(t)_i(x(t)) , (48)
als garantiert stabiles Adaptionsgesetz gewählt werden, da wegen der Eigenschaften des DANN (Gleichung 44) der Vektor f(x(t)) in allen seinen Komponenten beschrankt ist
Dies führt zu einer monoton abnehmenden Funktion |Φ(t)| , was ja limr→∞ « (t) = # bedeutet
Bei den vorliegenden Ausführungsbeispielen wird die gezeigte Lernfähigkeit des DANN zur Synthese eines Steuergesetzes für die Kraftstoffeinspritzung verwendet, indem beim Lernen der Fehler zwischen Soll-Gemischverhaltnis und Ist-Gemischverhaltnis zu null gemacht wird
Obiges Ausführungsbeispiel soll nun an einer Simulation demonstriert werden Es soll die Fähigkeit des Ansatzes gezeigt werden, daß eine Abbildung gelernt werden kann, so daß gilt
NLa {pm,ri) = λmllNLj [NN(p„, ,y,] (49)
Zur Demonstration sei λsoll gleich 1 Zum Zweck der Veranschaulichung wird für NLa {pm, ) die statische stetige nichtlineare Beziehung
NLa <J>«>") = [l " exp(-4/ m)]exp(-77) (50) angenommen, für NLf af ,ή) nehmen wir
NLf {aj ,ri) 1 - exp(-05//) (51)
2 + a ,
an, eine nichtlineare Funktion, die mit αy monoton steigend ist Diese beiden für den
Luftpfad und den Kraftstoffpfad angenommenen Nichtlinearitaten sind in den Fig 10 und 11 dargestellt.
Sind diese Abhängigkeiten bekannt, so kann analytisch die Abbildung NN ,, berechnet werden, so daß Gleichung 49 mit NN = NN ,. erfüllt wird Mit den Beziehungen
° soll nach Gleichungen 50 und 51 ergibt sich für die Abbildung NN ,.
of {pm .n) = NN „ = 2 (52) f "" soll ι _ (i _ exp(-4 m)) exp(-05/7)
die durch die Reglersynthese zu erlernen ist
Drehzahl n sei auf Maximaldrehzahl normiert, ebenso der Saugrohrdruck auf Umgebungsdruck, diese Größen schwanken also beide zwischen 0 und 1. Zur Lernsimulation wird nun der Eingangsraum // <≡ [02,08] und pm e [θ2,08] flachendeckend durchfahren, in Fig 16 wird dies bei der gelernten Steuerflache deutlich In den Fig. 12, 13 und 14 ist dabei der zu erlernende Steuerverlauf nach Gleichung 52
und der online vom Netz erlernte Verlauf von a . wahrend des Lernvorganges dargestellt. Diese Figuren zeigen jeweils den optimalen Verlauf der Steuergröße (gestrichelt) und den vom Netz gelernten Verlauf (durchgezogen). Fig 12 zeigt dabei den Beginn des Lernens (wobei ohne jedes Vorwissen begonnen wurde), Fig. 13 den Steuergrößenverlauf während des Lernens, und in Fig. 14 ist das Lernen so gut wie abgeschlossen. Den während des Lernens schnell kleiner werdenden Gemischfehler zeigt Fig. 15.
Den dabei im Neuronalen Netz gelernten Zusammenhang stellt Fig. 16 der zu lernenden Abhängigkeit gegenüber. Die Figur zeigt den zu erlernenden und den gelernten Zusammenhang, und zwar jeweils die Steuerfläche Im Zielzusammenhang ist nur die Fläche über dem während des Lernens zu durchfahrenden Eingangsraum dargestellt, um einen einfachen Vergleich zu ermöglichen. Selbstverständlich war auch nur im durchfahrenen Eingangsraum gelernt worden, demzufolge ist auch nur dort das Wissen aussagekräftig.
Diese Simulation demonstriert, daß ohne jedes Vorwissen bereits nach größenordnungsmäßig 10000 Takten (verteilt über die verschiedenen Betriebspunkte), ein ganzes Kennfeld für die Einspritzsteuerung mit sehr großer Genauigkeit „angelernt" ist.