-
Die Erfindung betrifft ein System und Verfahren für die Kalibrierung einer Softwareapplikation zur Bestimmung des Funktionszustandes und/oder Gesundheitszustandes einer elektrischen Batterie.
-
Eine Starterbatterie, beim Kraftfahrzeug auch als Autobatterie oder als Fahrzeugbatterie bezeichnet, ist ein Akkumulator, der unter anderem die elektrische Energie für den Anlasser eines Verbrennungsmotors liefert, beispielsweise in Kraftfahrzeugen, Stromerzeugungsaggregaten oder der Gasturbine eines Flugzeuges. Als Starterbatterie werden häufig Bleiakkumulatoren eingesetzt. Ein Akkumulator, welcher nicht nur zum Starten, sondern auch als Energiequelle für den Fahrantrieb eines Elektrofahrzeugs dient, beispielsweise in Elektroautos oder Hybridfahrzeugen, wird als Traktionsbatterie bezeichnet.
-
Um ein reibungsloses Starten eines Fahrzeuges bzw. das Fahren eines Elektrofahrzeugs zu ermöglichen, ist somit der Betriebszustand der Batterie von erheblicher Bedeutung. Dabei spielt neben dem aktuellen Funktionszustand der Batterie, der die maximal mögliche Ladungsentnahme aus der Batterie und damit die verfügbare Leistung beschreibt, auch der Alterungszustand und damit die verbleibende Lebensdauer der Batterie eine wichtige Rolle. Um den Alterungszustand der Batterie abschätzen zu können, wird ein Gesundheitszustand der Batterie definiert, der Auskunft über die noch verbleibende Lebensdauer der Batterie gibt.
-
Der Funktionszustand der Batterie (engl. State of Function, SoF) wird von verschiedenen Parametern beeinflusst. Dazu gehören die Spannungsgrenzwerte, die Stromgrenzwerte, die Ladungszustandsgrenzwerte, der ohmsche Widerstand der Batterie, die Batteriesicherheitsmerkmale.
-
Dies gilt auch für den Gesundheitszustand einer Batterie (engl. State of Health, SoF), der sich auf den Alterungszustand bezieht und durch die relative elektrische Kapazität CR bestimmt werden kann. Die relative Kapazität CR wird definiert durch das Verhältnis zwischen der ursprünglichen Kapazität und der aktuell tatsächlich gegebenen Kapazität der Batterie. Die Alterung einer Batterie hängt entscheidend von der Umgebung und dem Betriebsverhalten ab. So reduzieren sehr tiefe Temperaturen und ein Fahrverhalten mit extremen Kurzstrecken die Lebensdauer der Batterie.
-
Der Gesundheitszustand einer Batterie kann am besten durch Bestimmung der relativen Kapazität gemessen werden. Allerdings ist dies aufwendig, da hierzu üblicherweise eine Werkstatt aufgesucht werden muss.
-
Es sind daher verschiedene weitere Ansätze zur Bestimmung und Vorhersage des Gesundheitszustands einer Batterie bekannt. Ein Ansatz basiert auf einem physikalischen Modell, bei dem die Lebensdauer einer Batterie in Abhängigkeit von verschiedenen Parametern wie der Umgebungstemperatur, dem Batteriezellenstrom, der Batteriezellenspannung, der Batteriezellentemperatur, dem Fahrverhalten des Fahrzeugs, etc. berechnet wird.
-
Ein anderer Ansatz verwendet Regressionsanalysen zur Modellierung und Vorhersage der Lebensdauer. Regressionsverfahren sind statistische Analyseverfahren, die zum Ziel haben, Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen zu modellieren. Die Regressionsmodelle erhalten als Eingabe beispielsweise die Umgebungstemperatur, den Batteriezellenstrom, die Batteriezellenspannung, die Batteriezellentemperatur, das Fahrverhalten des Fahrzeugs, etc. und berechnen mittels mathematischer Verfahren wie beispielsweise die Methode der kleinsten Quadrate oder neuronaler Netze einen geschätzten Wert für die Lebensdauer.
-
Des Weiteren sind elektrochemische Modelle, Stromkreismodelle, halbempirische Modelle, analytische und statistische Modelle bekannt, die die Lebensdauer einer Batterie abschätzen und entsprechend der gewählten Ausgangsparameter Abschätzungen der Lebensdauer liefern, die auch in Abhängigkeit von dem Batteriemodell manchmal gut, aber oft auch unzutreffend sind.
-
In ähnlicher Weise wird auch der Funktionszustand einer Batterie abgeschätzt, entweder durch direkte Messung der vorhandenen Spannung bzw. Ladung oder durch Modellberechnungen.
-
Allerdings beruhen all diese Vorhersagen, Diagramme und Tabellen oder die verwendeten mathematischen Verfahren auf Expertenwissen und werden nach ihrer Implementierung nicht mehr verändert. Des Weiteren werden sie für eine individuelle Batterie nicht angepasst, sondern sie sind für eine bestimmte Modellbaureihe festgelegt. Zudem kann entweder nur der Funktionszustand oder der Gesundheitszustand einer Batterie bestimmt oder abgeschätzt werden, aber eine Ermittlung von beiden Größen ist gleichzeitig nicht möglich, da die Modelle jeweils nur für die Abschätzung entweder des Gesundheitszustandes oder des Funktionszustandes ausgelegt sind.
-
Die
EP 1 691 209 B1 beschreibt ein Batteriemanagementsystem mit einem neuronalen Netzwerk, um einen internen Zustand einer in einem Batteriesystem implementierten Sekundärbatterie zu erfassen. Die Vorrichtung umfasst eine Erfassungseinheit, eine Erzeugungseinheit und eine Schätzeinheit. Die Erfassungseinheit erfasst elektrische Signale, die einen Betriebszustand der Batterie anzeigen. Die Erzeugungseinheit erzeugt unter Verwendung der elektrischen Signale einen Eingangsparameter, der zum Schätzen des internen Zustands der Batterie erforderlich ist. Die Schätzeinheit ermittelt einen Ausgabeparameter, der den Ladezustand der Batterie anzeigt, indem der Eingabeparameter für eine Berechnung mittels des neuronalen Netzwerks verwendet wird.
-
Die
US 2016/0195586 A1 beschreibt ein Batteriemanagementsystem mit einem Verfahren zum Kalibrieren eines Algorithmus zum Schätzen einer Zustandsgröße einer Batterie. Ein Messwert einer physikalischen Größe der Batterie wird zu einem ersten Zeitpunkt und zu einem zweiten Zeitpunkt gemessen, wobei für den zweiten Zeitpunkt zusätzlich ein Schätzwert ermittelt wird. Der Schätzwert wird aufgrund der Differenz eines Vergleiches zwischen dem Schätzwert und dem Messwert angepasst.
-
Die
US 2018/0252775 A1 beschreibt ein Verfahren zum Kalibrieren einer auf Coulomb-Zählung basierenden Ladezustandsschätzung (SOC-Schätzung) einer Batteriezelle. Es wird bestimmt, ob sich die Batteriezelle in einem spezifischen Ladezustand befindet. Wenn sich die Batteriezelle nicht in dem spezifischen Ladezustand befindet, wird ein Anfangswert mittels einer auf einer Leerlaufspannung (OCV) basierenden Ladezustandsschätzung kalibriert.
-
Die
US 2017/0038436 A1 beschreibt ein Verfahren zur Abschätzung des Gesundheitszustands (SOH) einer Batterie. Ein charakteristischer Ladezustand der Batterie zwischen einem vollständigen Ladungszustand und einem Entladungszustand wird bestimmt und ein Referenzzustand der Batterie basierend auf diesem charakteristischen Zustand definiert. Es werden Leerlaufspannungen der Batterie im Referenzzustand für mehrere verschiedene Ladezustände gemessen und in einem elektronischen Speicher gespeichert.
-
Die der Erfindung zu Grunde liegende Aufgabe besteht nun darin, ein Verfahren und ein System für die Kalibrierung einer Softwareapplikation zum automatischen Bestimmen des Funktionszustandes und des Gesundheitszustandes einer Batterie, insbesondere für ein Kraftfahrzeug, zu schaffen, das sich durch eine hohe Zuverlässigkeit und Genauigkeit auszeichnet und sich einfach implementieren lässt.
-
Gemäß der vorliegenden Erfindung wird ein Verfahren und System vorgeschlagen, durch das eine automatische Kalibrierung einer Softwareapplikation zur Bestimmung des Funktionszustandes und des Gesundheitszustandes einer Batterie ermöglicht wird, um hierdurch die Grundlage für eine zuverlässige und genaue Ermittlung der verfügbaren Leistung und der Lebensdauer der Batterie zu schaffen.
-
Diese Aufgabe wird hinsichtlich eines Verfahrens durch die Merkmale des Patentanspruchs 1, und hinsichtlich eines Systems durch die Merkmale des Patentanspruchs 8 erfindungsgemäß gelöst. Die weiteren Ansprüche betreffen bevorzugte Ausgestaltungen der Erfindung.
-
Gemäß einem ersten Aspekt stellt die Erfindung ein Verfahren zum Kalibrieren einer Softwareapplikation zur Bestimmung des Funktionszustandes und/oder Gesundheitszustandes einer elektrischen Batterie bereit. Das Verfahren umfasst das Bestimmen eines Zustandes Si der Batterie durch ein Zustandsmodul, wobei ein Zustand Si durch Daten und Messwerte von zumindest einem Parameter pi der Batterie definiert wird und der Wert des Funktionszustandes und/oder des Gesundheitszustandes der Batterie zumindest teilweise von diesem Parameter pi abhängt. Eine Berechnungsfunktion fi und/oder einer Aktion ai für den Parameter pi wird von einem Lernverstärkungs-Agenten ausgewählt und ein modellierter Wert FM für den Funktionszustand und/oder ein modellierter Wert HM für den Gesundheitszustand der Batterie mittels der ausgewählten Berechnungsfunktion fi und/oder der Aktion ai berechnet. Von einem Umgebungsmodul wird ein realer Wert FR für den Funktionszustand und/oder den Gesundheitszustand HR aufgrund von Messergebnissen bereitgestellt. Der modellierte Wert FM für den Funktionszustand wird mit dem realen Wert FR für den Funktionszustand verglichen und/oder der modellierte Wert HM für den Gesundheitszustand wird mit dem realen Wert HR für den Gesundheitszustand verglichen. Das Vergleichsergebnis wird an ein Belohnungsmodul weitergegeben und eine Belohnung für das Vergleichsergebnis ermittelt. Die Belohnung für das Vergleichsergebnis wird an den Lernverstärkungs-Agenten weitergegeben und basierend auf dieser Belohnung wird erneut eine weitere Aktion aj von dem Lernverstärkungs-Agenten ausgewählt.
-
Vorteilhafterweise sind Sensoren und/oder Messvorrichtungen zur Erfassung von Messwerten der Parameter pi vorgesehen.
-
In einer vorteilhaften Weiterentwicklung sind eine positive Aktion A+, die den Wert für einen Parameter pi erhöht, eine neutrale Aktion A0, bei der der Wert des Parameters Pi gleichbleibt, sowie eine negative Aktion A-, bei der sich der Wert des Parameters Pi verringert, vorgesehen.
-
In einer weiteren Ausführungsform umfasst das Belohnungsmodul eine Datenbank oder Matrix für die Bewertung der Aktionen αi.
-
Vorteilhafterweise ist der Lernverstärkungsagent ausgebildet, einen Algorithmus aus dem verstärkenden Lernen zu verwenden.
-
In einer weiteren Ausgestaltung ist der Algorithmus als Markov-Entscheidungsprozess oder als Temporal Difference Learning (TD-Learning) oder als Q-Learning oder als DYNAQ oder als POMDP (Partially Oberservable Markov Decision Process) oder als SARSA oder als Monte-Carlo-Simulation ausgebildet.
-
Vorteilhaftweise stellt zumindest ein Parameter pi eine Umgebungstemperatur oder einen Batteriezellenstrom oder eine Batteriezellenspannung oder eine Batteriezellentemperatur oder ein Fahrverhalten des Fahrzeugs dar.
-
Gemäß einem zweiten Aspekt stellt die Erfindung ein System zum Kalibrieren einer Softwareapplikation zur Bestimmung des Funktionszustandes und/oder Gesundheitszustandes einer elektrischen Batterie bereit. Das System umfasst ein Zustandsmodul, das ausgebildet ist, einen Zustand si der Batterie zu bestimmen, wobei ein Zustand si durch Daten und Messwerte von zumindest einem Parameter pi der Batterie definiert wird und der Wert des Funktionszustandes und/oder des Gesundheitszustandes der Batterie zumindest teilweise von diesem Parameter pi abhängt. Zudem weist das System einen Lernverstärkungs-Agenten auf, der ausgebildet ist, eine Berechnungsfunktion fi und/oder eine Aktion ai für den Parameter pi auszuwählen und einen modellierten Wert FM für den Funktionszustand und/oder einen modellierten Wert HR für den Gesundheitszustand der Batterie mittels der ausgewählten Berechnungsfunktion fi und/oder der Aktion ai zu berechnen. Des Weiteren ist ein Umgebungsmodul vorgesehen, das ausgebildet ist, einen realen Wert FR für den Funktionszustand und/oder einen realen Wert HR für den Gesundheitszustand aufgrund von Messergebnissen bereitzustellen. Das Zustandsmodul ist ausgebildet, den modellierten Wert FM für den Funktionszustand mit dem realen Wert FR des Funktionszustandes zu vergleichen und/oder den modellierten Wert HM für den Gesundheitszustand mit dem realen Wert HR des Gesundheitszustandes zu vergleichen. Des Weiteren umfasst das System ein Belohnungsmodul, das ausgebildet ist, eine Belohnung für das Vergleichsergebnis zu ermitteln und die Belohnung für das Vergleichsergebnis an den Lernverstärkungs-Agenten weiterzugeben, wobei der Lernverstärkungs-Agenten ausgebildet ist, basierend auf dieser Belohnung erneut eine weitere Aktion aj auszuwählen.
-
In einer vorteilhaften Weiterbildung sind Sensoren und/oder Messvorrichtungen zur Erfassung von Messwerten der Parameter Pi vorgesehen.
-
Vorteilhafterweise sind eine positive Aktion A+, die den Wert für einen Parameter pi erhöht, eine neutrale Aktion A0, bei der der Wert des Parameters Pi gleichbleibt, sowie eine negative Aktion A-, bei der sich der Wert des Parameters Pi verringert, vorgesehen.
-
In einer weiteren Ausgestaltung umfasst das Belohnungsmodul eine Datenbank oder Funktion oder Matrix für die Bewertung der Aktionen αi.
-
In einer weiteren Ausführungsform ist der Lernverstärkungsagent ausgebildet, einen Algorithmus aus dem verstärkenden Lernen zu verwenden.
-
Vorteilhafterweise ist der Algorithmus als Markov-Entscheidungsprozess oder als Temporal Difference Learning (TD-Learning) oder als DYNAQ oder als POMDP oder als Q-Learning oder als SARSA oder als Monte-Carlo-Simulation ausgebildet.
-
In einer Weiterbildung stellt zumindest ein Parameter pi eine Umgebungstemperatur oder einen Batteriezellenstrom oder eine Batteriezellenspannung oder eine Batteriezellentemperatur oder ein Fahrverhalten des Fahrzeugs dar.
-
Gemäß einem dritten Aspekt stellt die Erfindung ein Computerprogrammprodukt bereit, das einen ausführbaren Programmcode umfasst, der so konfiguriert ist, dass er bei seiner Ausführung das Verfahren gemäß dem ersten Aspekt ausführt.
-
Nachfolgend wird die Erfindung anhand von in der Zeichnung dargestellten Ausführungsbeispielen näher erläutert.
-
Dabei zeigt:
- 1 ein Blockdiagram zur Erläuterung eines Ausführungsbeispiels eines erfindungsgemäßen Systems;
- 2 ein Flussdiagramm zur Erläuterung der einzelnen Verfahrensschritte eines erfindungsgemäßen Verfahrens;
- 3 zeigt schematisch ein Computerprogrammprodukt gemäß einer Ausführungsform des dritten Aspekts der Erfindung.
-
Zusätzliche Kennzeichen, Aspekte und Vorteile der Erfindung oder ihrer Ausführungsbeispiele werden durch die ausführliche Beschreibung in Verbindung mit den Ansprüchen ersichtlich.
-
1 zeigt ein erfindungsgemäßes System 100 zur Kalibrierung einer Softwareapplikation zur Bestimmung des Funktionszustandes und/oder Gesundheitszustandes einer elektrischen Batterie. Das erfindungsgemäße System beruht auf einem Lernverstärkungs-Agenten (LV) (Reinforcement Learning Agent) 200, der für einen bestimmten Zustand si ∈ S aus einer Menge verfügbarer Zustände zumindest eine Aktion ai ∈ A aus einer Menge verfügbarer Aktionen auswählt. Für die ausgewählte Aktion ai erhält der Agent 200 eine Belohnung ri ∈ R Die Zustände si ∈ S erhält der Agent 200 von einem Zustandsmodul 300, auf das der LV-Agent 200 zugreifen kann und das vorzugsweise einen Datenspeicher 320 mit Daten von verschiedenen Sensoren und Datenquellen sowie Berechnungsergebnisse enthält. Das Zustandsmodul 300 bearbeitet die Daten von verschiedenen Parametern pi aus einem Datenspeicher 320 oder einer anderen Datenquelle und ordnet diesen verarbeiteten Daten Zustände si ∈ S zu.
-
Ein Zustand si ∈ S ist somit durch die Auswahl von bestimmten Parameterwerten von Parametern pi definiert. Dabei kann eine Umgebungstemperatur, ein Batteriezellenstrom, eine Batteriezellenspannung, eine Batteriezellentemperatur oder ein Fahrverhalten des Fahrzeugs jeweils einen Parameter pi darstellen. Ein Zustand si ist somit durch gemessene und/oder berechnete Werte von ausgewählten Parametern pi gekennzeichnet und stellt somit eine konkrete Betriebssituation der Batterie dar. Die Daten bzw. Messwerte sind von einem Umgebungsmodul 400 ermittelt worden sind und wurden vorzugsweise in dem Datenspeicher 320 gespeichert. Das Umgebungsmodul 400 enthält zumindest einen Sensor 420 ausgebildet ist, kann aber weitere Sensoren 440 oder Messvorrichtungen enthalten oder mit diesen verbunden sein. In einem Belohnungsmodul 500 wird der ausgewählten Aktion ai eine Belohnung ri ∈ R zugeordnet, die an den LV-Agenten 200 übermittelt wird.
-
Bei den Sensoren 440 kann es sich beispielsweise um elektrische Sensoren wie kapazitive und induktive Sensoren, Strommessgeräte, Spannungsmessgeräte, Temperatursensoren, Hallsensoren und/oder bildaufnehmende Sensoren wie Kameras handeln. Die Sensoren 420, 440 ermitteln Messwerte wie die Umgebungstemperatur, den Batteriezellenstrom, die Batteriezellenspannung, die Batteriezellentemperatur oder das Fahrverhalten des Fahrzeugs, die an das Zustandsmodul 300 oder einen weiteren Prozessor weitergegeben werden. Das Zustandsmodul 300 weist vorteilhafterweise ebenfalls einen Prozessor auf, der die Daten mittels eines Algorithmus bearbeitet. Es ist aber auch denkbar, dass die Daten zunächst in einer weiteren Speichereinheit oder einem Softwaremodul gespeichert werden und erst zu einem späteren Zeitpunkt in den Datenspeicher 320 übertragen und/oder von dem Zustandsmodul 300 und/oder einem Prozessor verarbeitet werden.
-
Unter einem „Prozessor“ kann im Zusammenhang mit der Erfindung beispielsweise eine Maschine oder eine elektronische Schaltung verstanden werden. Bei einem Prozessor kann es sich insbesondere um einen Hauptprozessor (engl. Central Processing Unit, CPU), einen Mikroprozessor oder einen Mikrocontroller, beispielsweise eine anwendungsspezifische integrierte Schaltung oder einen digitalen Signalprozessor, möglicherweise in Kombination mit einer Speichereinheit zum Speichern von Programmbefehlen, etc. handeln. Auch kann unter einem Prozessor ein virtualisierter Prozessor, eine virtuelle Maschine oder eine Soft-CPU verstanden werden. Es kann sich beispielsweise auch um einen programmierbaren Prozessor handeln, der mit Konfigurationsschritten zur Ausführung des genannten erfindungsgemäßen Verfahrens ausgerüstet wird oder mit Konfigurationsschritten derart konfiguriert ist, dass der programmierbare Prozessor die erfindungsgemäßen Merkmale des Verfahrens, der Komponente, der Module, oder anderer Aspekte und/oder Teilaspekte der Erfindung realisiert.
-
Unter einer „Speichereinheit“ oder „Speichermodul“ und dergleichen kann im Zusammenhang mit der Erfindung beispielsweise ein flüchtiger Speicher in Form eines Arbeitsspeichers (engl. Random-Access Memory, RAM) oder ein dauerhafter Speicher wie eine Festplatte oder ein Datenträger oder z. B. ein wechselbares Speichermodul verstanden werden. Es kann sich bei dem Speichermodul aber auch um eine cloudbasierte Speicherlösung handeln.
-
Unter einem „Modul“ kann im Zusammenhang mit der Erfindung beispielsweise ein Prozessor und/oder eine Speichereinheit zum Speichern von Programmbefehlen verstanden werden. Beispielsweise ist der Prozessor speziell dazu eingerichtet, die Programmbefehle derart auszuführen, damit der Prozessor und/oder die Steuereinheit Funktionen ausführt, um das erfindungsgemäße Verfahren oder einen Schritt des erfindungsgemäßen Verfahrens zu implementieren oder realisieren.
-
Unter „Messwerten“ sind im Zusammenhang mit der Erfindung sowohl die Rohdaten als auch bereits aufbereitete Daten aus den Messergebnissen der Sensoren zu verstehen.
-
Der Lernverstärkungs-Agent 200 enthält Berechnungsverfahren und Algorithmen fi für mathematische Regressionsverfahren oder physikalische Modellberechnungen, die eine Korrelation zwischen ausgewählten Parametern pi ∈ P aus einer Menge von Parametern und einem Funktionszustand und/oder Gesundheitszustand der Batterie beschreiben. Bei den mathematischen Funktionen ft kann es sich um Mittelwerte, Minimal- und Maximalwerte, Fast Fourier Transformationen, Integral- und Differentialrechnungen, Verfahren der linearen Regression, Markov-Verfahren, Wahrscheinlichkeitsverfahren wie Monte Carlo-Verfahren, Tempora Difference Learning, aber auch erweiterte Kalman-Filter, radiale Basisfunktionen, Datenfelder, konvergente neuronale Netze, künstliche neuronale Netze und/oder rückgekoppelte neuronale Netze handeln. Der LV-Agent 200 wählt für einen Zustand Si eine oder mehrere dieser Berechnungsfunktionen fi aus. Er berechnet für diesen bestimmten Zustand Si und mittels der ausgewählten Berechnungsfunktionen fi einen modellierten Wert des Funktionszustandes FM und/oder Gesundheitszustandes HM, wobei der gemessene oder berechnete Wert für zumindest einen Parameter pi einen Eingabewert für die Berechnungsfunktionen fi darstellt.
-
In dem Lernverstärkungs-Agenten (Reinforcement Learning Agent) 200 sind zudem als Aktionen ai die Aktionen A+, A0 und A- definiert, die aufgrund der verwendeten Berechnungsverfahren fi ausgewählt werden, um eine Anpassung eines gemessenen oder berechneten Parameterwertes eines Parameters pi ∈ P aus der Menge der Parameter in einer Wertetabelle und dergleichen vorzunehmen. Bei den Parametern pi ∈ P handelt es sich beispielsweise um die Umgebungstemperatur, den Batteriezellenstrom, die Batteriezellenspannung, die Batteriezellentemperatur oder das Fahrverhalten des Fahrzeugs. Bei einer positiven Aktion A+ handelt es sich um eine Aktion, die den Wert für einen Parameter pt erhöht, bei einer neutralen Aktion A0 handelt es sich um ein Aktion, bei der der Wert des Parameters pt gleichbleibt, und bei einer negativen Aktion A- wird der Wert des Parameters pt verringert. Der LV-Agent 200 wählt für den durch diese gemessenen und berechneten Daten definierten Zustand si insbesondere eine der Aktionen A+, A0 oder A- aus zur Anpassung des Parameterwertes eines Parameters pi in einer Wertetabelle oder dergleichen. Für die ausgewählte Aktion ai berechnet der LV-Agent 200 nun den modellierten Wert des Funktionszustandes FM und/oder des Gesundheitszustandes HM, der jeweils von der ausgewählten Aktion ai für den Parameter pi abhängt.
-
Dieser berechnete Wert FM des Funktionszustandes und/oder der berechnete Wert HR des Gesundheitszustandes der Batterie für eine bestimmte Aktion ai wird nun an das Zustandsmodul 300 weitergegeben. Das Umgebungsmodul 400 bestimmt aufgrund einer direkten Messung oder einer Berechnung einen realen Wert FR des Funktionszustandes und/oder einen realen werte HR des Gesundheitszustandes. Für die Berechnung des realen Wertes FR des Funktionszustandes und/oder des realen Wertes HR des Gesundheitszustandes kann vorteilhafterweise ein neuronales Netz verwendet werden. Es können aber auch andere Berechnungsverfahren wie Regressionsverfahren eingesetzt werden.
-
Wie bereits ausgeführt, wird in dem Zustandsmodul 300 ein aktueller oder zukünftiger Zustand si durch verschiedene Datenwerte von Parametern pi definiert, beispielsweise die Umgebungstemperatur, der Batteriezellenstrom, die Batteriezellenspannung, die Batteriezellentemperatur oder das Fahrverhalten des Fahrzeugs. Insbesondere berechnet das Zustandsmodul 300 die aktuelle Abweichung Δ zwischen dem gemessenen (realen) Wert des Funktionszustandes FR und dem berechneten Modellwert FM für eine ausgewählte Aktion ai durch den LV-Agenten 200 und/oder die aktuelle Abweichung Δ zwischen dem gemessenen (realen) Wert des Gesundheitszustandes HR und dem berechneten Modellwert HM für eine ausgewählte Aktion ai durch den LV-Agenten 200.
-
In dem Zustandsmodul 300 wird nun der berechnete Modellwert FM des Funktionszustandes mit dem tatsächlich gemessenen Wert FR des Funktionszustandes verglichen und/oder der berechnete Modellwert HM des Gesundheitszustandes mit dem tatsächlich gemessenen Wert HR des Gesundheitszustandes verglichen. Der berechnete Wert FM des Funktionszustandes beruht dabei auf den geänderten Werten für die ausgewählten Parameter pi durch den LV-Agenten 200. Dies gilt in gleicher Weise für den Gesundheitszustand HM. In dem Belohnungsmodul 500 wird der Grad der Abweichung Δ zwischen dem berechneten Modellwert FM und dem gemessenen Wert FR des Funktionszustandes verglichen und dem Grad der Abweichung Δ eine Belohnung Bi zugeordnet. Dies gilt in gleicher Weise für den Gesundheitszustand HM. Da der Grad der Abweichung Δ von der Auswahl der jeweiligen Aktion A+, A0, A- abhängig ist, wird vorzugsweise in einer Matrix oder einer sonstigen Datenbank 520 der jeweiligen ausgewählten Aktion A+, A0, A- die Belohnung Bi zugeordnet. Die Belohnung Bi weist vorzugsweise die Werte +1 und -1 auf, wobei eine geringe Abweichung Δ zwischen dem berechneten Wert FM des Funktionszustandes und dem gemessenen Wert FR des Funktionszustandes mit +1 belohnt wird und somit verstärkt wird, während eine erhebliche Abweichung Δ mit -1 belohnt wird und somit negativ bewertet wird. Es ist aber auch denkbar, dass Werte > 1 und Werte < 1 Verwendung finden. Dies gilt wiederum in gleicher Weise für den Gesundheitszustand HM. Um eine Beschädigung der Einrichtung zu vermeiden, werden stark negative Belohnungen für Aktionen, die die Einrichtung beschädigen können, vergeben.
-
Nun beginnt ein zweiter Zyklus zur Kalibrierung des Funktionszustandes und/oder Gesundheitszustandes. Hierbei kann eine andere Aktion ai und/oder eine andere Berechnungsfunktion fi und/oder ein anderer Parameter pi ausgewählt werden. Das Ergebnis wird wiederum dem Zustandsmodul 300 zugeführt und das Ergebnis des Vergleichs in dem Belohnungsmodul 500 bewertet. Der LV-Agent 200 wiederholt die Kalibrierung des Funktionszustandes und/oder Gesundheitszustandes für alle vorgesehenen Aktionen ai und Parameter pi solange, bis sich eine größtmögliche Übereinstimmung zwischen dem kalibrierten Modellwert FM des Funktionszustandes und dem gemessenen Wert FR des Funktionszustandes erreicht ist. Vorzugsweise ist der Endzustand der Kalibrierung des Funktionszustandes erreicht, wenn die Abweichung im Bereich von +/- 5% liegen. Dies gilt wiederum in gleicher Weise für den Gesundheitszustand HM. Um eine Beschädigung der Einrichtung zu vermeiden, werden stark negative Belohnungen für Aktionen, die die Einrichtung beschädigen können, vergeben.
-
Vorzugsweise wird als Algorithmus für den LV-Agenten 200 ein Markow-Entscheidungsprozess verwendet. Es kann aber auch vorgesehen sind, einen Temporal Difference Learning (TD-Learning)-Algorithmus zu verwenden. Ein LV-Agent 200 mit einem TD-Learning-Algorithmus nimmt die Anpassung der Aktionen A+, A0, A- nicht erst dann vor, wenn er die Belohnung erhält, sondern nach jeder Aktion ai auf Basis einer geschätzten erwarteten Belohnung. Des Weiteren sind auch Algorithmen wie Q-Learning und SARSA denkbar oder auch Monte-Carlo-Simulationen.
-
Gemäß dem Verfahren und des Systems der vorliegenden Erfindung wird ein verstärkendes Lernen (Reinforcement Learning) eingesetzt, um eine Softwareapplikation zur Bestimmung des Funktionszustandes und/oder Gesundheitszustandes einer elektrischen Batterie automatisch zu kalibrieren. Da verschiedene Parameter \pi wie die Umgebungstemperatur, der Batteriezellenstrom, die Batteriezellenspannung, die Batteriezellentemperatur oder das Fahrverhalten des Fahrzeugs in das Berechnungsverfahren eingehen und hierfür Aktionen ai ausgewählt werden, können insbesondere nichtlineare Zusammenhänge zwischen diesen Parametern pi erfasst und berücksichtigt werden, was in herkömmlichen Steuerungsverfahren kaum möglich ist. Es handelt sich somit um eine optimierte Kalibrierungsmethode, da eine Variation von verschiedenen Parametern pi , die einen Einfluss auf den Funktionszustand und/oder Gesundheitszustand haben und miteinander wechselwirken, berücksichtigt wird. Da der LV-Agent 200 die Aktionen ai selbst auswählt und für diese jeweils eine Belohnung erhält, kann er eine optimale Kalibrierungsstrategie für die Bestimmung des Ladezustands und/oder der Lebensdauer einer Batterie bereitstellen.
-
Durch das erfindungsgemäße Verfahren kann eine verbesserte Bestimmung und Abschätzung des Ladezustandes und der Lebensdauer einer Batterie erreicht werden, da die Kalibrierung der Parameter, die in Modellberechnungen verwendet werden, erheblich verbessert wird. Daher können Kosten für eine bisherige manuelle und damit zeitintensive Kalibrierung gesenkt werden. Darüber hinaus ist die gleichzeitige Bestimmung des Funktionszustandes und des Gesundheitszustandes einer Batterie möglich. Insgesamt kann somit das Batteriemanagement deutlich verbessert werden. Da die Abschätzung der Leistung und der Lebensdauer einer Batterie auch vom Fahrverhalten abhängt, kann insbesondere während des Fahrens der Gesundheitszustand der Batterie aktualisiert werden und gegebenenfalls angezeigt werden.
-
In 2 sind die Verfahrensschritte zum Kalibrieren einer Softwareapplikation zur Bestimmung des Funktionszustandes und/oder Gesundheitszustandes einer elektrischen Batterie dargestellt.
-
In einem Schritt S10 erhält ein Lernverstärkungs-Agenten 200 einen Zustand si einer Batterie von einem Zustandsmodul 300, wobei ein Zustand si durch Daten und Messwerte von zumindest einem Parameter pi der Batterie definiert ist und der Wert des Funktionszustandes und/oder Gesundheitszustandes zumindest teilweise von diesem Parameter pi abhängt.
-
In einem Schritt S20 wählt der LV-Agent 200 für den Zustand si zumindest eine Berechnungsfunktion fi und/oder eine Aktion ai für den Parameter pi aus.
-
In einem Schritt S30 berechnet der LV-Agent einen modellierten Wert FM für den Funktionszustandes und/oder Gesundheitszustand mittels der ausgewählten Berechnungsfunktion fi und/oder der Aktion αi.
-
In einem Schritt S40 wird ein realer Wert FR für den Funktionszustand und/oder ein realer Wert HR für den Gesundheitszustand von einem Umgebungsmodul 400 aufgrund von Messergebnissen bereitgestellt.
-
In einem Schritt S50 werden der modellierte Wert FM für den Funktionszustand und der reale Wert FR für den Funktionszustand und/oder der modellierte Wert HM für den Gesundheitszustand und der reale Wert HR für den Gesundheitszustand miteinander verglichen.
-
In einem Schritt S60 wird das Vergleichsergebnis für den Funktionszustand und/oder den Gesundheitszustand an das Belohnungsmodul 500 weitergegeben und eine Belohnung für das Vergleichsergebnis wird in dem Belohnungsmodul 500 ermittelt.
-
In einem Schritt S70 wird die Belohnung für das Vergleichsergebnis an den Lernverstärkungs-Agenten 200 weitergegeben und eine weitere Aktion aj wird von dem Lernverstärkungsagenten 200 basierend auf der Belohnung für das Vergleichsergebnis für den Zustand si ausgewählt.
-
3 stellt schematisch ein Computerprogrammprodukt 700 dar, das einen ausführbaren Programmcode 750 umfasst, der konfiguriert ist, um das Verfahren gemäß dem ersten Aspekt der vorliegenden Erfindung auszuführen, wenn es ausgeführt wird.
-
Mit dem Verfahren gemäß der vorliegenden Erfindung können zuverlässig optimierte Zustände si durch die Auswahl von passenden Aktionen ai gefunden werden, um eine Softwareapplikation zur Bestimmung eines Funktionszustandes und/oder eines Gesundheitszustandes einer Batterie zuverlässig und automatisch zu kalibrieren. Durch die Verwendung eines Lernverstärkungs-Agenten 200 mit einem Algorithmus des verstärkenden Lernens ist eine Anpassung und Kalibrierung der Parameter, die einen Einfluss auf den Funktionszustand und/oder Gesundheitszustand der Batterie haben, autonom und automatisch ermöglicht.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- EP 1691209 B1 [0012]
- US 2016/0195586 A1 [0013]
- US 2018/0252775 A1 [0014]
- US 2017/0038436 A1 [0015]