-
Einführung
-
Die vorliegende Offenlegung bezieht sich auf ein elektrisches Fahrzeugsystem und insbesondere auf ein Energiemanagementsystem für ein Elektrofahrzeug (EV), das mehrere Lasten koordiniert, um die Batterielebensdauer zu verbessern und die Reichweite des EV zu erhöhen, während es gleichzeitig den Antriebsanforderungen des Fahrers und dem Komfort der Kabine gerecht wird.
-
Derzeitige Betriebsstrategien für Elektrofahrzeuge koordinieren die verschiedenen Lastanforderungen (Antrieb, HVAC, Heizung usw.) nicht, um ihre kombinierten Auswirkungen auf die Batterienutzung und den langfristigen Zustand der Batterien zu steuern. Da mehrere Verbraucher gleichzeitig Strom von der Batterie abnehmen können, kann der Batteriestrom in die Höhe schnellen, was die Batteriealterung beschleunigen kann. Darüber hinaus können die derzeitigen Strategien die Verbraucher ohne Rücksicht auf den Effizienzzyklus der Verbraucher mit Strom versorgen. So kann eine Last, die mit einer Effizienz unterhalb der durchschnittlichen Effizienz arbeitet mehr elektrische Energie verbrauchen als die gleiche Last, die mit einer Effizienz oberhalb der durchschnittlichen Effizienz arbeitet, wenn sie in verschiedenen Zuständen eine konstante Leistung erzeugt.
-
Während die bestehenden elektrischen Fahrzeugsysteme ihren beabsichtigten Zweck erfüllen, besteht also Bedarf an einem neuen und verbesserten Energiemanagementsystem, das diese Probleme angeht.
-
Beschreibung der Erfindung
-
Gemäß mehreren Aspekten der vorliegenden Offenbarung wird ein Computer für ein Energiemanagementsystem eines Elektrofahrzeugs bereitgestellt. Der Überwachungscomputer umfasst einen Überwachungsprozessor und einen Überwachungsspeicher. Der Überwachungsspeicher beinhaltet Anweisungen, so dass der Überwachungsprozessor so programmiert ist, dass er eine Wertfunktion V auf der Grundlage einer Vielzahl von Aktionen U in einer Vielzahl von Zuständen S bestimmt. Der Überwachungsprozessor ist ferner so programmiert, dass er eine Aktion U auswählt, die mit einem höchsten Belohnungswert bei einem Zustand V assoziiert ist, der der Wertfunktion V entspricht. Die Aktion U ist eine HVAC-Subsystem-Variable. Die Zustände S beinhalten mindestens eines aus einer aus einem wiederaufladbaren Energiespeichersystem (Engl.: Rechargeable Energy Storage System, RESS) bezogene Antriebsleistung zum Betreiben eines Antriebs-Subsystem, eine aus dem RESS bezogene Grundleistungseingabe zum Betreiben eines HVAC-Subsystems, einen von dem lokalen HVAC-Prozessor bestimmten nominalen Referenz-Kabinenwärme-Eingabesollwert, einer Beschleunigung des Elektrofahrzeugs, einer aktuellen Fahrzeuggeschwindigkeit, einer durchschnittliche Fahrzeuggeschwindigkeit und einer kalibrierte Schätzung der durchschnittlichen Fahrzeuggeschwindigkeit.
-
In einem Aspekt ist der Überwachungsprozessor ferner programmiert, einen aktuellen Belohnungswert auf der Grundlage einer Änderung des Batteriekapazitätsverlusts oder des Kabinenkomforts berechnet.
-
In einem anderen Aspekt basiert die durchschnittliche Fahrzeuggeschwindigkeit auf Fahrzeug-zu-Fahrzeug-Daten (V2V-Daten) oder Fahrzeug-zu-Infrastruktur-Daten (V2X-Daten).
-
In einem anderen Aspekt basiert die kalibrierte Schätzung der Durchschnittsgeschwindigkeit des Fahrzeugs auf einer früheren Statistik für das Elektrofahrzeug oder einer Geschwindigkeitsbegrenzung.
-
In einem anderen Aspekt ist der Überwachungsprozessor ferner programmiert, einen Agenten auf der Grundlage der ausgewählten Aktion zu aktivieren.
-
In einem anderen Aspekt umfasst der Agent das HVAC-Subsystem.
-
In einem weiterer Aspekt ist der Überwachungsprozessor ferner programmiert, den Zustand S von einem Antriebs-Subsystem des Elektrofahrzeugs zu empfangen.
-
Gemäß mehreren Aspekten der vorliegenden Offenlegung wird ein Energiemanagementsystem für ein Elektrofahrzeug bereitgestellt. Das System umfasst ein wiederaufladbares Energiespeichersystem (RESS) und ein HVAC-Subsystem. Das HVAC-Subsystem umfasst einen lokalen HVAC-Prozessor und mindestens einen HVAC-Speicher. Der HVAC-Speicher beinhaltet Befehle, die von dem lokalen HVAC-Prozessor ausgeführt werden können, so dass der lokale HVAC-Prozessor programmiert ist, ein Nominalsignal zu erzeugen, das mit einer Anforderung einer Grundleistungseingabe von dem RESS assoziiert ist. Das HVAC-Subsystem umfasst ferner einen HVAC-Aktuator, der fähig ist, eine Zielausgabe über eine vorbestimmte Zeitspanne zu erzeugen, als Antwort auf das Empfangen der Grundleistungseingabe von dem RESS durch den HVAC-Aktuator. Das System beinhaltet ferner ein Antriebs-Subsystem mit einem lokalen Antriebs-Prozessor. Das Antriebs-Subsystem umfasst ferner mindestens einen Antriebs-Speicher, der Anweisungen speichert, die von dem lokalen Antriebs-Prozessor ausführbar sind, so dass der lokale Antriebs-Prozessor so programmiert ist, dass er ein Antriebssignal erzeugt, das mit einer Anforderung einer von dem RESS bezogenen Antriebsleistung assoziiert ist. Das System beinhaltet ferner einen Überwachungscomputer mit einem Überwachungsprozessor. Der Überwachungscomputer beinhaltet ferner einen Überwachungsspeicher, der Anweisungen beinhaltet, so dass der Überwachungsprozessor programmiert ist, um eine Wertfunktion V auf der Grundlage einer Vielzahl von Aktionen U in einer Vielzahl von Zuständen S zu bestimmen. Der Überwachungsprozessor ist ferner programmiert, eine Aktion auszuwählen, die mit einem höchsten Belohnungswert bei einem Zustand V assoziiert ist, der der Wertfunktion V entspricht. Die Wertfunktion V ist ein angepasster Leistungs-Eingabesollwert für das HVAC-Subsystem. Die Aktion U ist eine HVAC-Subsystem-Variable. Der Zustand S umfasst mindestens eines aus der der Antriebsleistung zum Betreiben des Antriebs-Subsystem, die Grundleistungseingabe zum Betreiben des HVAC-Subsystem, einen von dem lokalen HVAC-Prozessor bestimmten nominalen Referenz-Kabinenwärme-Eingabesollwert, eine Beschleunigung des Elektrofahrzeugs, eine aktuelle Fahrzeuggeschwindigkeit, eine durchschnittliche Fahrzeuggeschwindigkeit und eine kalibrierte Schätzung der Durchschnittsgeschwindigkeit des Fahrzeugs.
-
In einem Aspekt ist der HVAC-Aktuator konfiguriert, eine HVAC-Komponente zu betätigen, die konfiguriert ist, mit einer ersten Effizienz zu arbeiten, um eine erste Ausgabe zu erzeugen, wenn sich das Elektrofahrzeug in einem ersten Zustand befindet und die HVAC-Komponente eine erste Leistungseingabe von dem RESS erhält. Die HVAC-Komponente ist ferner konfiguriert, mit einer zweiten Effizienz zu arbeiten, um eine zweite Ausgabe zu erzeugen, wenn sich das Elektrofahrzeug in einem zweiten Zustand befindet und die HVAC-Komponente eine zweite Leistungseingabe von dem RESS erhält. Die HVAC-Komponente ist ferner konfiguriert, die Zielausgabe zu erzeugen, wenn die HVAC-Komponente eine Modulation zwischen der ersten Leistungseingabe und der zweiten Leistungseingabe über die vorbestimmte Zeitspanne erhält. Die zweite Effizienz liegt über der ersten Effizienz, so dass die elektrische Leistung, die mit der Modulation zwischen der ersten Leistungseingabe und der zweiten Leistungseingabe über die vorbestimmte Zeitspanne assoziiert ist, unter der elektrischen Leistung liegt, die mit der Grundleistungseingabe über die vorbestimmte Zeitspanne assoziiert ist.
-
In einem anderen Aspekt beinhaltet das Auswählen der Aktion durch den Überwachungsprozessor, die mit dem höchsten Belohnungswert assoziiert ist, das Erzeugen eines modulierten Leistungssignal durch den Überwachungsprozessor als Reaktion darauf, dass der Überwachungsprozessor das Nominalsignal von dem lokalen HVAC-Prozessor empfängt. Der lokale HVAC-Prozessor moduliert zwischen der ersten Leistungseingabe und der zweiten Leistungseingabe als Reaktion darauf, dass der lokale HVAC-Prozessor das modulierte Signal von dem Überwachungsprozessor empfängt.
-
In einem anderen Aspekt steuert der Überwachungsprozessor das Antriebs-Subsystem nicht.
-
In einem anderen Aspekt ist der Prozessor ferner programmiert, einen aktuellen Belohnungswert R auf der Grundlage einer Änderung des Batterie-Kapazitätsverlusts oder des Kabinenkomforts zu berechnen.
-
In einem anderen Aspekt basiert die durchschnittliche Fahrzeuggeschwindigkeit auf Fahrzeug-zu-Fahrzeug-Daten (V2V-Daten) oder Fahrzeug-zu-Infrastruktur-Daten (V2X-Daten).
-
In einem anderen Aspekt basiert die kalibrierte Schätzung der Durchschnittsgeschwindigkeit des Fahrzeugs auf einer früheren Statistik für das Elektrofahrzeug oder einer Geschwindigkeitsbegrenzung.
-
In einem anderen Aspekt ist der Prozessor ferner programmiert, einen Agenten auf der Grundlage der ausgewählten Aktion zu betätigen.
-
In einem anderen Aspekt umfasst der Agent das HVAC-Subsystem.
-
In einem anderen Aspekt ist der Überwachungsprozessor ferner programmiert, den Zustand S von einem Antriebs-Subsystem des Elektrofahrzeugs zu empfangen.
-
Gemäß mehreren Aspekten der vorliegenden Offenbarung wird ein Verfahren zum Betreiben eines Computers für ein Energiemanagementsystem eines Elektrofahrzeugs bereitgestellt. Der Computer beinhaltet einen Prozessor und einen Speicher. Das Verfahren umfasst das Bestimmen, unter Verwendung des Prozessors, einer Wertfunktion V auf der Grundlage einer Vielzahl von Aktionen U in einer Vielzahl von Zuständen S. Das Verfahren umfasst ferner das Auswählen, unter Verwendung des Prozessors, einer Aktion, die mit einem höchsten Belohnungswert assoziiert ist, der der Wertfunktion V entspricht. Die Aktion U ist eine HVAC-Subsystem-Variable. Der Zustand S ist mindestens eines aus einer aus einem wiederaufladbaren Energiespeichersystem (RESS) entnommene Leistung zum Betreiben eines Antriebs-Subsystem, einer aus dem RESS entnommene Leistung zum Betreiben eines HVAC-Subsystem, einer aktuelle Fahrzeuggeschwindigkeit, einer Beschleunigung des Elektrofahrzeugs, einem von einem lokalen HVAC-Prozessor bestimmten nominaler Referenz-Kabinenwärme-Eingabesollwert, einer durchschnittliche Fahrzeuggeschwindigkeit und einer kalibrierte Schätzung der Durchschnittsgeschwindigkeit des Fahrzeugs.
-
In einem Aspekt beinhaltet das Verfahren ferner das Berechnen eines aktuellen Belohnungswerts, unter Verwendung des Prozessors, auf der Grundlage einer Änderung eines Batterie-Kapazitätsverlusts oder des Kabinenkomforts.
-
In einem anderen Aspekt wird die Wertfunktion V berechnet auf der Grundlage einer Änderung eines Batteriekapazitätsverlusts und/oder eines Kabinenkomforts gemäß:
wobei V(S, U) eine aktuelle mehrdimensionale Tabelle V(S, U) für die Steuerungsabbildung darstellt und die aktuelle mehrdimensionale Tabelle V(S, U) eine Wertfunktion mit dem Eingangszustand S ist, um die entsprechende Aktion U bereitzustellen. Zusätzlich gibt
eine Operation zum Auswählen der Aktion U, die mit dem höchsten Belohnungswert R im Zustand S verbunden ist, aus der aktuellen mehrdimensionalen Tabelle V(S, U), an. Ferner ist π*(S) eine Strategie, die die Operation in eine Repräsentation bringt, so dass der Überwachungsprozessor die Aktion U in der aktuellen mehrdimensionalen Tabelle V(S, U), die mit dem höchsten Belohnungswert R im aktuellen Zustand S assoziiert ist, als endgültige Aktion U auswählt. Die Wertfunktion V wird ferner berechnet gemäß:
wobei die aktuelle multidimensionale Tabelle V(S, U) zu einer neuen multidimensionalen Tabelle Vnew(S, U) aktualisiert wird. Die aktuelle mehrdimensionale Tabelle V(S, U) wird mit [I-α] multipliziert und mit einem Term addiert, der einen aktuellen Belohnungswert R und einen projizierten Wert aus der aktuellen mehrdimensionalen Tabelle V(S, U) basierend auf einer nächsten Aktion U' in einem nächsten Zustand S' addiert. Außerdem ist α eine Lernrate und γ ein Diskontierungsfaktor.
-
Weitere Anwendungsbereiche werden sich aus der hierin bereitgestellten Beschreibung ergeben. Es sollte verstanden werden, dass die Beschreibung und die spezifischen Beispiele nur zur Veranschaulichung dienen und den Umfang der vorliegenden Offenbarung nicht einschränken sollen.
-
Figurenliste
-
Die hier beschriebenen Zeichnungen dienen nur Zwecken der Veranschaulichung und sollen den Umfang der vorliegenden Offenbarung in keiner Weise einschränken.
- 1 ist eine schematische Ansicht eines Beispiels eines Elektrofahrzeugs mit einem Energiemanagementsystem mit einem Computer zur Koordinierung mehrerer Stromverbraucher, um die Batterielebensdauer zu erhöhen und den Komfort in der Kabine aufrechtzuerhalten.
- 2 ist ein Blockdiagramm des Systems von 1.
- 3 ist ein Flussdiagramm eines Beispiels für ein Verfahren zum Betreiben des Systems von 1.
- 4 ist ein Diagramm einer beispielhaften Modulation der Antriebsleistung und der HVAC-Leistung.
-
Detaillierte Beschreibung
-
Die folgende Beschreibung ist lediglich beispielhafter Natur und ist nicht dazu gedacht, die vorliegende Offenbarung, Anwendung oder Verwendung einzuschränken.
-
Die vorliegende Offenbarung beschreibt ein Beispiel für ein Energiemanagementsystem (System), das mehrere Lasten koordiniert, um eine optimale Lastabgabe für eine verbesserte Reichweite des elektrischen Fahrzeugs (EV) und eine geringere Belastung der Batterie zu erreichen. Nicht einschränkende Beispiele für diese Lasten beinhalten ein Antriebs-Subsystem, ein HVAC-Subsystem, ein Batterieheiz- und -kühl-Subsystem, eine Zubehörlast und/oder andere geeignete Subsysteme. Das System verwendet eine mehrschichtige Steuerungsstrategie, bei der ein EM-Prozessor der Überwachungsschicht (Überwachungsprozessor) lokale Leistungsanforderungen (z.B. durch einen HVAC-Prozessor) auf der Grundlage von Antriebsvariablen und Vorabinformationen (z.B. integrierte Antriebs- und HVAC-Subsystem-Lieferung) anpasst oder ergänzt. Das System liefert in Echtzeit eine Feedback-Rückmeldung, z.B. in Form des Energieverbrauchs, des langfristigen Gesundheitszustands der Batterie und des Kabinenkomforts. Das System überwacht einzelne Lasten (z.B. die HVAC-Steuerung), um den Gesamtenergieverbrauch zu minimieren, indem es die an die Lastanforderer gelieferte Leistung auf der Grundlage ihrer Effizienz moduliert. Wie weiter unten näher beschrieben, setzt das System Verstärkungslemen mit einer Belohnungsmaßnahme ein, um das System während einer Entwurfsphase zu trainieren und sich dann während des Einsatzes in Echtzeit an Veränderungen anzupassen. In einem Beispiel dient das System als voreingestellte oder vom Kunden auswählbare Öko-Lastmanagementfunktion (z. B. Öko-Kühlung für HVAC), die Antriebsinformationen (z. B. Geschwindigkeit und Beschleunigung) nutzt, um andere Lasten zu verwalten und den langfristigen Gesundheitszustand der Batterie (Engl.: State Of Health, SOH) zu verbessern.
-
Ein Beispiel für ein Kraftfahrzeug 100 mit einem Energiemanagementsystem 102 (System) ist in 1 dargestellt. Das Kraftfahrzeug 100 kann ein elektrisches Landfahrzeug sein, z.B. ein Pkw oder ein Lkw. Das System 102 umfasst ein wiederaufladbares Energiespeichersystem (RESS) 104 und eine Vielzahl von Lasten 106, wobei jede Last 106 einen lokalen Prozessor 108 und einen lokalen Speicher 110 zum Speichern von Befehlen umfasst, die von dem lokalen Prozessor 108 ausgeführt werden können, so dass der lokale Prozessor 108 so programmiert ist, dass er ein Nominalsignal erzeugt, das mit einer Anforderung von Energie aus dem RESS 104 assoziiertt ist. Jede Last 106 beinahaltet ferner einen Aktuator 112, der in der Lage ist, verschiedene Komponenten 114 zu betätigen, um als Reaktion darauf, dass der Aktuator 112 den Strom von der RESS 104 empfängt, über einen vorbestimmten Zeitraum eine Sollleistung zu erzeugen. Die Aktuatoren 112 sind durch Schaltungen, Chips, Motoren oder andere elektronische und/oder mechanische Komponenten realisiert, die verschiedene Subsystem des Fahrzeugs in Übereinstimmung mit geeigneten Steuersignalen betätigen können, wie bekannt ist.
-
Wie in den nachstehenden Beispielen beschrieben, handelt es sich bei jeder Komponente 114 um eine oder mehrere Hardwarekomponenten 114, die eine mechanische oder elektromechanische Funktion ausführen können, z.B. die Einstellung der Gebläsetemperatur oder der Lüfterdrehzahl eines HVAC-Subsystem. Die Effizienz dieser Komponenten 114 hängt vom Zustand S der Umgebung ab. Eine Komponente 114, die in einem Zustand S arbeitet, kann eine Effizienz haben, die höher ist als ihre durchschnittliche Effizienz über einen bestimmten Zeitraum, und dieselbe Komponente kann in einem anderen Zustand eine Effizienz haben, die niedriger ist als die durchschnittliche Effizienz über denselben Zeitraum. Wie unten im Detail beschrieben, liefert das System 102 mehr Strom an bestimmte Komponenten, wenn diese effizienter arbeiten, um den Gesamtstromverbrauch zu senken.
-
Eine beispielhafte Last ist ein HVAC-Subsystem 116, das einen lokalen HVAC-Prozessor 118 beinhaltet. Das HVAC-Subsystem 116 umfasst ferner mindestens einen HVAC-Speicher 120 mit Anweisungen, die von dem lokalen HVAC-Prozessor 118 ausgeführt werden können, so dass der lokale HVAC-Prozessor 118 so programmiert ist, dass er ein Nominalsignal erzeugt. Das Nominalsignal ist mit einer Anforderung einer nominalen HVAC-Leistungseingabe PHVAc.nom. von der RESS 104 assoziiert, um eine nominale Referenzkabinenwärmeeingabe zu erzeugen Q cabin,nom zu erzeugen oder die Kabine auf einer Referenz-Kabinentemperatur T cabin,nom zu halten. Das HVAC-Subsystem 116 beinhaltet ferner einen HVAC-Aktuator 122, der fähig ist, verschiedene HVAC-Komponenten 124 zu betätigen, um eine Sollausgabe Q cabin,nom oder T cabin,nom über einen vorbestimmten Zeitraum zu erzeugen, wenn der HVAC-Aktuator 122 die nominale HVAC-Leistungseingabe PHVAC.nom von der RESS 104 erhält. Nicht einschränkende Beispiele für HVAC-Komponenten 124 umfassen einen Klimakompressor, einen Radiator, einen Radiatorlüfter, einen Kondensator und ein Gebläse.
-
Die HVAC-Komponente 124 ist in eine Vielzahl von Zuständen bewegbar, in denen die HVAC-Komponente 124 mit einer entsprechenden Effizienz arbeitet. Die HVAC-Komponente 124 ist konfiguriert, mit einer ersten Effizienz zu arbeiten, um eine erste Ausgabe zu erzeugen, wenn sich das Fahrzeug 100 in einem ersten Zustand befindet. Der HVAC-Aktuator 122 ist ferner konfiguriert, mit einer zweiten Effizienz zu arbeiten, um eine zweite Ausgabe zu erzeugen, wenn sich das Fahrzeug 100 in einem zweiten Zustand befindet. Das Fahrzeug 100 fährt in dem ersten Zustand mit einer ersten Fahrzeuggeschwindigkeit, und das Fahrzeug 100 fährt in dem zweiten Zustand mit einer zweiten Fahrzeuggeschwindigkeit, die über der ersten Fahrzeuggeschwindigkeit liegt, so dass die zweite Effizienz höher ist als die erste Effizienz und die zweite Ausgabe höher ist als die erste Ausgabe über einen identischen Zeitraum. Da, als lediglich ein Beispiel, der Radiator Wärme von dem Kühlmittel auf den Luftstrom durch den Radiator überträgt, kann die Effizienz des HVAC-Subsystems 116 direkt proportional zur Fahrzeuggeschwindigkeit sein, z.B. wenn das Fahrzeug 100 im ersten Zustand mit einer ersten Geschwindigkeit fährt und das Fahrzeug 100 im zweiten Zustand mit einer zweiten Geschwindigkeit fährt, die über der ersten Geschwindigkeit liegt. Wie nachstehend im Einzelnen beschrieben, kann das System 102 die an die HVAC-Komponenten gelieferte Leistung zwischen ersten und zweiten HVAC-Leistungseingaben über einen vorbestimmten Zeitraum modulieren, so dass die kumulativen ersten und zweiten Ausgaben dieselben Zielausgaben Q cabin,nom oder T cabin,nom liefern, die die HVAC-Komponente 124 zu liefern in der Lage ist, wenn sie eine feste nominale HVAC-Leistungseingabe PHVAC.nom an die HVAC-Komponenten 124 über denselben Zeitraum liefern kann. Ferner ist die kumulative modulierte Leistung PHVAC geringer als die kumulative feste nominale HVAC-Leistung PHVAC.nom über denselben Zeitraum, weil die erste HVAC-Leistungseingabe geringer ist als die nominale HVAC-Leistungseingabe Q cabin,nom, und die an die HVAC-Komponente 124 geliefert wird, wenn sie mit der niedrigeren ersten Effizienz arbeitet, und die zweite HVAC-Leistungseingabe ist höher als die nominale HVAC-Leistungseingabe Q cabin,nom, und die an die HVAC-Komponente 124 geliefert wird, wenn diese mit der höheren zweiten Effizienz arbeitet.
-
Eine andere beispielhafte Last kann ein thermisches Batteriekühl- und -heizsubsystem 126 (thermisches Subsystem 126) umfassen, das einen lokalen thermischen Prozessor 128 beinhaltet. Das thermische Subsystem 126 umfasst ferner mindestens einen thermischen Speicher 130 mit Anweisungen, die von dem lokalen thermischen Prozessor 128 ausgeführt werden können, so dass der lokale thermische Prozessor 128 so programmiert ist, dass er ein Nominalsignal erzeugt. Das Nominalsignal ist mit einer Anforderung einer nominalen thermischen Leistungseingabe von der RESS 104 assoziiert. Das thermische Subsystem 126 beinhaltet ferner einen thermischen Aktuator 132, der fähig ist, verschiedene thermische Komponenten zu betätigen, um eine Zielausgabe über einen vorbestimmten Zeitraum zu erzeugen, wenn der thermische Aktuator 132 die nominale thermische Leistungseingabe von dem RESS 104 erhält. Ähnlich wie der HVAC-Aktuator 122 ist der thermische Aktuator 132 so konfiguriert, dass er die zugehörige Zielausgabe erzeugt, wenn der thermische Aktuator 132 eine Modulation zwischen der ersten und der zweiten Leistungseingabe über die vorbestimmte Zeitspanne erhält. In einem Beispiel ist der thermische Aktuator 132 so konfiguriert, thermische Komponenten 134, wie z.B. einen Heizwiderstandsdraht oder andere geeignete Heizelemente und/oder ein Gebläse, zu betätigen. Es wird in Betracht gezogen, dass die Lasten eine beliebige Kombination aus dem HVAC-Subsystem, dem thermischen Subsystem oder anderen geeigneten Subsystem beinhalten können.
-
Noch eine weitere beispielhafte Last ist ein Antriebs-Subsystem 136, das von dem System 102 zur Koordinierung der anderen Lasten überwacht wird. Das Antriebs-Subsystem 136 beinhaltet einen lokalen Antriebs-Prozessor 138. Das Antriebs-Subsystem 136 umfasst ferner mindestens einen Antriebs-Speicher 140, in dem Anweisungen gespeichert sind, die von dem lokalen Antriebs-Prozessor 138 ausgeführt werden können, so dass der lokale Antriebs-Prozessor 138 so programmiert ist, dass er ein Antriebssignal erzeugt. Das Antriebssignal ist mit einer Anforderung der Antriebsleistung Ptrac, die von der RESS 104 bezogen wird, assoziiert. Das Antriebs-Subsytem 136 beinhaltet ferner einen Antriebs-Aktuator 142, der fähig ist, verschiedene thermische Komponenten 144, wie z.B. eine Motorantriebseinheit, zu betätigen, um als Reaktion darauf, dass der thermische Aktuator 132 die nominalen thermische Leistungseingabe von dem RESS 104 erhält, eine Zielausgabe über einen vorbestimmten Zeitraum zu erzeugen. Das System 102 moduliert nicht oder verändert nicht die Leistung Ptrac, die an das Subsystem 136 geliefert wird, und ohne den Bedarf des Fahrers zu beeinträchtigen.
-
Das System 102 beinhaltet ferner einen Überwachungscomputer 146 mit einem Überwachungsprozessor 148 und mindestens einem Überwachungsspeicher 150. Der Überwachungsspeicher 150 umfasst eine oder mehrere Formen von computerlesbaren Medien und speichert Anweisungen, die von dem Überwachungscomputer 146 zur Durchführung verschiedener Vorgänge, einschließlich der hierin offenbarten, ausgeführt werden können. Über ein Netzwerk 152 kann ein Fahrzeugkommunikationsmodul 154 dem Überwachungscomputer 146 ermöglichen, mit einem Server 156 zu kommunizieren.
-
Der Überwachungsprozessor 148 kann kommunikativ, z.B. über das Fahrzeugkommunikationsmodul 154, mit mehr als einem lokalen Prozessor 108 verbunden sein, die z. B. in elektronischen Prozessoreinheiten (ECUs) oder dergleichen im Fahrzeug 100 enthalten sind, um verschiedene Fahrzeugkomponenten 114 zu überwachen und/oder zu steuern. In diesem Beispiel ist der Überwachungsprozessor 148 mit dem lokalen Antriebs-Prozessor 138 gekoppelt, um Antriebsvariablen zu überwachen. Nicht einschränkende Beispiele für die Antriebsvariablen sind die aktuelle Fahrzeuggeschwindigkeit, die aktuelle Fahrzeugbeschleunigung und die Antriebsleistung. Darüber hinaus kann der Überwachungscomputer 146 über das Fahrzeugkommunikationsmodul 154 mit einem Navigationssystem kommunizieren, das das globale Positioniersystem (Engl.: Global Positioning Syste, GPS) 158 verwendet. Der Überwachungsprozessor 148 kann beispielsweise Standortdaten des Fahrzeugs 100, Daten zu Geschwindigkeitsbegrenzungen, Verkehrsdaten, Straßenzustände und dergleichen anfordern und empfangen. Die Standortdaten können in einer bekannten Form vorliegen, z.B. in Form von Geokoordinaten (Breiten- und Längskoordinaten).
-
Der Überwachungsprozessor 148 ist im Allgemeinen für die Kommunikation mit dem Fahrzeugkommunikationsmodul 154 über ein internes verdrahtetes und/oder drahtloses Netzwerk, z.B. einen Bus oder ähnliches im Fahrzeug 100, wie z.B. ein Prozessor Area Network (CAN) oder ähnliches, und/oder andere verdrahtete und/oder drahtlose Mechanismen eingerichtet.
-
Über das Fahrzeugkommunikationsmodul 154 kann der Überwachungsprozessor 148 Nachrichten an verschiedene Geräte im Fahrzeug 100 senden und/oder Nachrichten von den verschiedenen Geräten empfangen, z.B. Fahrzeugsensoren 160, Aktuatoren 112, Fahrzeugkomponenten 114, eine Mensch-Maschine-Schnittstelle (Engl.: Human Machine Interface, HMI) 162 usw. Die Mensch-Maschine-Schnittstelle (HMI) 162 kann so konfiguriert sein, dass das System 102 in einen Standard- oder auswählbaren Eco-Boost-Modus versetzt wird, in dem das System 102 zur Koordinierung der verschiedenen Lasten des Fahrzeugs 100 aktiviert wird. Alternativ oder zusätzlich kann in Fällen, in denen der Überwachungsprozessor eine Vielzahl von Geräten umfasst, das Fahrzeugkommunikationsnetz für die Kommunikation zwischen den Geräten verwendet werden, die in dieser Offenbarung als Überwachungscomputer 146 dargestellt werden. Ferner könne, wie weiter unten erwähnt, verschiedene Prozessoren und/oder Fahrzeugsensoren 160 Daten an den Überwachungscomputer 146 liefern.
-
Der Überwachungsprozessor 148 ist so programmiert, dass er Antriebszustände überwacht, einschließlich der aktuellen Fahrzeuggeschwindigkeit, der aktuellen Fahrzeugbeschleunigungsleistung und der Antriebsleistung. In anderen Beispielen ist der Überwachungsprozessor 148 mit Fahrzeugsensoren 160 gekoppelt, die eine Vielzahl von Geräten umfassen können, um Daten zu liefern, die Antriebszustände darstellen oder beeinflussen können. Nicht einschränkende Beispiele für die Fahrzeugsensoren 160 können Lidar-Sensoren (Light Detection and Ranging) 164 usw. beinhalten, die auf der Oberseite des Fahrzeugs, hinter der Frontscheibe des Fahrzeugs, um das Fahrzeug herum usw. angeordnet sind und relative Positionen, Größen und Formen von Objekten und/oder Bedingungen in der Umgebung des Fahrzeugs liefern. Als weiteres, nicht einschränkendes Beispiel können einer oder mehrere Radarsensoren 166, die an den Stoßstangen des Fahrzeugs befestigt sind, Daten über die Entfernungsgeschwindigkeit von Objekten (möglicherweise einschließlich zweiter Fahrzeuge) usw. relativ zum Standort des Fahrzeugs liefern. Die Fahrzeugsensoren können ferner Kamerasensor(en) 168 umfassen, z.B. für die Front-, Seiten- und Rückansicht, die Bilder aus einem Sichtfeld innerhalb und/oder außerhalb des Fahrzeugs 100 liefern.
-
Darüber hinaus kann der Überwachungsprozessor 148 so konfiguriert sein, dass er über ein Fahrzeug-zu-Fahrzeug-Kommunikationsmodul 154 oder eine Schnittstelle 162 mit Geräten außerhalb des Fahrzeugs 100 kommunizieren kann, z.B. über eine Fahrzeug-zu-Fahrzeug-Kommunikation (Engl.: Vehicle to Vehicle, V2V) 170 oder eine drahtlose Fahrzeug-zu-Infrastruktur-Kommunikation (Vehicle-to-Infrastructure, V2X) 172 mit (typischerweise über das Netzwerk 152) einem entfernten Server 156. Das Modul 154 könnte einen oder mehrere Mechanismen enthalten, über die der Überwachungsprozessor 148 kommunizieren kann, einschließlich einer beliebigen Kombination von drahtlosen (z.B. mobilfunk, drahtlosen, satellitengestützten, Mikrowellen- und Hochfrequenz-) Kommunikationsmechanismen und einer beliebigen Netzwerktopologie (oder Topologien, wenn mehrere Kommunikationsmechanismen verwendet werden). Beispiele für die Kommunikation über das Modul 154 beinhalten Mobilfunk, BLUETOOTH, IEEE 802.11, Dedicated Short Range Communications (DSRC) und/oder Wide Area Networks (WAN), einschließlich des Internets, die Datenkommunikationsdienste bereitstellen.
-
Das Netzwerk 152 beinhaltet einen oder mehrere Mechanismen, über die ein Überwachungsprozessor 148 mit einem Server 156 kommunizieren kann. Dementsprechend kann das Netzwerk 152 eines oder mehrere aus verschiedenen verdrahteten oder drahtlosen Kommunikationsmechanismen sein, einschließlich jeder gewünschten Kombination von verdrahteten (z. B. Kabel und Glasfaser) und/oder drahtlosen (z. B. mobilfunk, drahtlose, satellitengestützte, Mikrowellen- und Hochfrequenz-) Kommunikationsmechanismen und jeder gewünschten Netzwerktopologie (oder Topologien, wenn mehrere Kommunikationsmechanismen verwendet werden). Beispielhafte Kommunikationsnetzwerke umfassen drahtlose Kommunikationsnetzwerke (z.B. unter Verwendung von Bluetooth, Bluetooth Low Energy (BLE), IEEE 802.11, Fahrzeug-zu-Fahrzeug (V2V) wie Dedicated Short-Range Communications (DSRC) usw.), lokale Netzwerke (LAN) und/oder Weitverkehrsnetzwerke (WAN), einschließlich des Internets, die Datenkommunikationsdienste bereitstellen. Der Server 156 kann ein Computergerät sein, d.h. einen oder mehrere Prozessoren und einen oder mehrere Speicher beinhalten, die so programmiert sind, dass sie Operationen wie die hierin offenbarten bereitstellen. Ferner kann auf den Server 156 über das Netzwerk 152, z.B. das Internet oder ein anderes Weitverkehrsnetz, zugegriffen werden.
-
Der Überwachungsprozessor 148 kann Daten von Sensoren 160 im Wesentlichen kontinuierlich, periodisch und/oder auf Anweisung eines Servers 156 usw. empfangen und analysieren. Des Weiteren können Objektklassifizierungs- oder Objektidentifizierungstechniken verwendet werden, z.B. in einem Überwachungsprozessor 148 auf der Grundlage von Lidar-Sensor-, Kamerasensor- usw. Daten, um einen Objekttyp, z.B. ein Fahrzeug, eine Person, einen Felsen, ein Schlagloch, ein Fahrrad, ein Motorrad usw., sowie physikalische Merkmale von Objekten zu identifizieren, die einen Fahrer dazu veranlassen können, fahrbare Variablen wie die aktuelle Fahrzeuggeschwindigkeit, die aktuelle Fahrzeugbeschleunigung und die Antriebsleistung anzupassen.
-
Der Überwachungsprozessor 148 ist mit den lokalen Prozessoren 108 der Lasten gekoppelt und programmiert, eine oder mehrere Lastvariablen zu bestimmen, die von den lokalen Prozessoren der Lasten angepasst oder ergänzt werden müssen, um die von dem RESS 104 bezogene Gesamtleistung zu reduzieren. Wie unten im Detail beschrieben, ist der Überwachungsprozessor 148 programmiert, die gewünschten Kabinenreaktionen, die mit den Variablen assoziiert sind, zu interpretieren. In einem Beispiel kann der Überwachungsprozessor 148 programmiert sein, gewünschte Kabinenreaktionen zu interpretieren, wie z.B. einen nominalen Kabinentemperatur-Sollwert
T cabin,
nom oder einen nominalen Referenz-Kabinenwärme-Eingabesollwert
Q cabin,nom der durch den lokalen HVAC-Prozessor 118 gesetzt wird. Der Überwachungsprozessor 148 kann einen angepassten Kabinentemperatur-Sollwert
T cabin für den lokalen HVAC-Prozessor 118 bestimmen, der durch Gleichung 1 definiert sein kann:
wobei ƒ
RL(.) eine Korrektur oder Anpassung durch den Überwachungsprozessor 148 darstellt, und
T cabin für den von dem Überwachungsprozessor 148 angepassten Kabinentemperatur-Sollwert steht.
-
In einem anderen Beispiel kann der Überwachungsprozessor 148 programmiert sein, einen angepassten Wärme-Eingabesollwert
Q cabin zur Verwendung durch den lokalen HVAC-Prozessor 118 zu bestimmen. Der angepasste Wäre-Eingabesollwert
Q cabin kann durch die Gleichungen 2 und 3 bestimmt sein:
wobei ṁb die Strömung zu einer Passagierkabine durch ein Gebläse darstellt, c
p für eine spezifische Wärmekonstante steht,
T cabin den angepassten Kabinentemperatur-Sollwert darstellt,
Q cabin,nom einen nominalen Referenz-Kabinenwärme-Eingabesollwert repräsentiert, der zuerst von dem lokalen HVAC-Prozessor 118 bestimmt wurde, ƒ
RL (.) eine Korrektur oder Anpassung durch den Überwachungsprozessor 148 darstellt, und
Q cabin einen angepassten Wärme-Eingabesollwert für den lokalen HVAC-Prozessor 118 darstellt. Es ist denkbar, dass der Überwachungsprozessor andere Gleichungen zur Berechnung des angepassten Kabinentemperatur-Sollwerts
T cabin, des angepassten Wärme-Eingabesollwerts
Q cabin oder andere HVAC-Variablen implementieren kann.
-
Der Überwachungsprozessor 148 ist programmiert, die Auswirkungen des aktuellen Betriebs auf den Gesundheitszustand der Batterie (SOH) zu bestimmen, welche durch die Gleichungen 4, 5 und 6 definiert werden können:
wobei Q
b,nom für die nominale Batteriekapazität oder Gesamtladung steht, die ein frisches RESS 104 aufnehmen kann, Q
b(Ah) die Batteriekapazität zu einem bestimmten Zeitpunkt darstellt, Q
loss (%) für einen prozentualen Kapazitätsverlust der Batterie steht, g für eine Regression oder eine Funktion mit ihren Eingaben in dieser Formel (die während einer Entwurfs- oder Trainingsphase kalibriert wurde), T
b steht für eine Batterietemperatur, ΔSoC stellt eine Änderung des Ladezustands der Batterie dar, (Ah)
n steht für Amperestunden, definiert als Durchsatz (Gesamtverbrauch der Batterie durch Integration des Batteriestroms), ΔAh stellt eine Änderung des Durchsatzes dar, n ist eine Kalibrierungsfunktion, und ΔQ
loss stellt einen inkrementellen Kapazitätsverlust der Batterie aufgrund eines aktuellen Vorgangs dar. Es ist denkbar, dass der Überwachungsprozessor andere Gleichungen zur Berechnung des Kapazitätsverlusts der Batterie oder anderer Variablen, die sich auf den SOH-Wert der Batterie auswirken, implementiert.
-
Der Überwachungsprozessor 148 ist programmiert, eine Auswirkung des aktuellen Betriebs auf den Kabinenkomfort zu bestimmen, die durch die Gleichungen 7, 8 und 9 definiert sein kann:
wobei
T cabin eine aktuelle Kabinentemperatur darstellt, T
cabin,target für die von dem Überwachungsprozessor 148 ermittelte angepasste Kabinentemperatur steht, T
cabin,error einen Fehler in der Kabinentemperatur zwischen der aktuellen Kabinentemperatur und der angepassten Kabinentemperatur darstellt; EHT eine nominale äquivalente homogene Temperatur darstellt (eine HVAC-bezogene Variable, um zusätzliche Messgrößen, wie z.B. Feuchtigkeit, zu kombinieren, um eine von den Passagieren empfundene Temperatur zu quantifizieren) und zuerst durch den lokalen Prozessor 108 bestimmt wird; EHT
target einen angepassten EHT-Sollwert darstellt, der durch den Überwachungsprozessor 148 bestimmt wird; EHT
error einen Fehler in der äquivalenten homogenen Temperatur zwischen der gemessenen EHT und der angepassten EHT darstellt; und PMV eine vorhergesagte mittlere Bewertung oder eine vorhergesagte prozentuale Unzufriedenheit, bei der es sich um einen Index handelt, der ein von dem Fahrgast bewertetes Durchschnittsklima vorhersagt, darstellt. Es ist denkbar, dass der Überwachungsprozessor andere Gleichungen implementiert, um den Fehler in der Kabinentemperatur zwischen der angepassten Kabinentemperatur und der gemessenen Kabinentemperatur, einen Fehler in der EHT zwischen der gemessenen EHT und der nominalen EHT, die PMV oder andere Variablen für den Kabinenkomfort zu berechnen.
-
Der Überwachungsprozessor 148 ist ferner programmiert, eine modulierte Last zu ergänzen oder anzupassen, um eine Zielausgabe mit einem reduzierten Batterie-SOH-Wert zu erzeugen, z.B. durch Beziehen der geringsten Menge an elektrischer Energie aus dem RESS 104. Die modulierte Last kann das HVAC-Subsystem 116, das thermische Subsystem 126 oder andere geeignete Fahrzeug-subsysteme sein. Das System 102 moduliert nicht das Antriebs-Subsystem 136, um eine Beeinträchtigung des Fahrerbedarfs zu vermeiden.
-
In einem Beispiel implementiert der Überwachungsprozessor 148 ein physikalisch basiertes Modell zur Erweiterung der modulierten Last auf der Grundlage einer Vorschau von Antriebszuständen, die z.B. aus V2V-Kommunikationen 170, V2X-Kommunikationen 172 und anderen Netzwerkkommunikationen stammen. In Fortsetzung des vorangegangenen Beispiels kann der Überwachungsprozessor 148 programmiert werden, den lokalen HVAC-Prozessor 118 zu erweitern, indem er einen angepassten Wärme-Eingabesollwert
Q cabin innerhalb eines festen Zeitfensters T
w festlegt, das durch die Gleichungen 10 und 11 definiert sein kann:
wobei
Q cabin,nom für den nominalen Referenz-Kabinenwärme-Eingabesollwert steht, der zuerst von dem lokalen HVAC-Prozessor bestimmt wurde; g einen Kalibrierungsparameter darstellt, um den Umfang der Anpassung durch den Überwachungsprozessor 148 anzupassen, v
speed für eine aktuelle Fahrzeuggeschwindigkeit steht; v
speedave,
pre für eine durchschnittliche Fahrzeuggeschwindigkeit über ein zukünftiges Zeitfenster der Länge T
w (Vorschaufenster) steht und mit den Sensoren 160, der V2V-Kommunikation 170, der V2X-Kommunikation 172 oder einer anderen Vorschauvorrichtung angenähert werden kann; und
Q cabin den angepassten Kabinentemperatur-Sollwert darstellt, den der Überwachungsprozessor 148 für den lokalen HVAC-Prozessor 118 bestimmt.
-
In einem anderen Beispiel implementiert der Überwachungsprozessor 148 ein anderes physikalisch basiertes Modell zur Erweiterung der modulierten Last, das z.B. auf früheren Statistiken des Host-Fahrzeugs oder vorgeschriebenen Geschwindigkeitsbegrenzungen basiert. Genauer gesagt kann der Überwachungsprozessor programmiert sein, den lokalen HVAC-Prozessor 118 zu erweitern, indem er einen angepassten Wärme-Eingabesollwert
Q cabin innerhalb eines variablen Zeitfensters T
w festlegt, das durch die Gleichungen 12 und 13 definiert sein kann:
wobei v
cal eine kalibrierte Schätzung der Durchschnittsgeschwindigkeit des Fahrzeugs darstellt (unter Verwendung früherer Statistiken, Geschwindigkeitsbegrenzungen und dergleichen). Auf der Grundlage des Durchschnittsgesetzes und der kalibrierten Durchschnittsgeschwindigkeit des Fahrzeugs v
cal implementiert der Überwachungsprozessor 148 die Gleichungen 12 und 13 in Echtzeit, um eine Zeitspanne T
w zu bestimmen, in welcher die angepasste Wärmeeingabe
Q cabin gleich der ursprünglichen kumulativen Wärmeeingabe
Q cabin,nom ist, die von dem lokalen HVAC-Prozessor 118 angefordert wurde.
-
Für jede der beispielhaften modulierten Lasten erhöht der Überwachungsprozessor 148 den nominalen Sollwert, wenn die Fahrzeuggeschwindigkeit vspeed über einer durchschnittlichen Fahrzeuggeschwindigkeit vspeedave,pre oder vcal liegt, und der Überwachungsprozessor 148 senkt den nominalen Sollwert, wenn die Fahrzeuggeschwindigkeit vspeed unter der durchschnittlichen Fahrzeuggeschwindigkeit vspeedave,pre oder vcal liegt, so dass der Komponente 114 mehr Leistung zugeführt wird, wenn sie effizienter arbeitet. Es ist denkbar, dass der Überwachungsprozessor 148 andere Gleichungen zum Bestimmen des angepassten Kabinentemperatur-Sollwerts Tcabin, des angepassten Kabinentemperatur-Sollwerts Qcabin, oder andere HVAC-Variablen, implementiert.
-
Der Überwachungsprozessor 148 ist ferner konfiguriert, ein datengesteuertes Modell zum Erweitern der modulierten Last zu implementieren. Während eines Trainingsmodus in der Entwurfsphase implementiert der Überwachungsprozessor 148 Verstärkungslemen (Engl.: Reinforcement Learning, RL), um eine Nachschlagetabelle aufzubauen oder eine Steuerungsabbildung V (S, U) zu bestimmen, durch iteratives Lernen mit Belohnungs-Feedback. Später, während des Einsatzes im Feld, verwendet der Überwachungsprozessor 148 die gleiche Struktur, um die Lernsteuerung an Bord und in Echtzeit mit dem Belohnungs-Feedback anzupassen.
-
Verstärkungslernen (RL) ist eine Form des zielgerichteten maschinellen Lernens. So kann ein Agent beispielsweise aus der Interaktion mit seiner Umgebung lernen, ohne auf eine explizite Überwachung und/oder vollständige Modelle der Umgebung angewiesen zu sein. RL ist ein Rahmen, der die Interaktion zwischen dem lernenden Agenten und seiner Umgebung in Form von Zuständen S, Aktionen U und Belohnungen R modelliert. In jedem Zeitschritt empfängt ein Agent einen Zustand S, wählt eine Aktion U basierend auf einer Strategie, erhält eine skalare Belohnung und geht in den nächsten Zustand S' über. Die Zustände S, S' können auf einer oder mehreren Sensoreingaben basieren, z.B. Sensoren 160, V2V-Kommunikation 170, VZX-Kommunikation172, die indikativ für die Umweltdaten sind. Das Ziel des Agenten ist es, eine erwartete kumulative Belohnung R zu maximieren. Der Agent kann eine positive skalare Belohnung für eine positive Aktion U erhalten und eine negative skalare Belohnung für eine negative Aktion U. Der Agent „lernt“ also, indem er versucht, die erwartete kumulative Belohnung R zu maximieren. Obwohl der Agent hierin im Zusammenhang mit einem Fahrzeug beschrieben wird, kann der Agent jeden geeigneten Verstärkungslernagenten umfassen. Im vorliegenden Kontext kann der Überwachungsprozessor 148 als Agent bezeichnet werden. Während das vorliegende Beispiel des Überwachungsprozessors 148 eine mehrdimensionale Tabelle implementiert, können andere Beispiele des Überwachungscomputers 146 konfiguriert sein, ein auf einem tiefen neuronalen Netz basierendes Verstärkungslernverfahren zu implementieren.
-
Unter Bezugnahme auf
2 ist der Überwachungsprozessor 148 ferner programmiert, die Steuerungsabbildung V (S, U) und die Lernregel unter Verwendung der Gleichungen 14, 15, 16 und 17 zu bestimmen:
wobei S für die Zustände steht, wie z.B. für die Antriebsvariablen (z. B, v
speed, v
accel' P
trac usw.) und für die nominalen Referenz-Sollwerte (z. B. Q
cabin,nom,
T cabin,nom, P
HVAC, usw.); U stellt Aktionen dar, wie z.B. angepasste Sollwerte für die Lasterweiterungsvariable (z.B. ,
T cabin oder Q
cabin); R repräsentiert die Belohnungen, wie Echtzeit-Feedback in Form von Batteriealterung (z.B. Kapazitätsverlust) und Kabinenkomfort; ΔQ
loss stellt die inkrementelle Änderung des Kapazitätsverlustes der Batterie im aktuellen Betrieb dar; α|ΔT| stellt die Differenz zwischen Soll- und Ist-Temperatur in der Kabine zur Erfassung des Kabinenkomforts dar;
zeigt den Vorgang der Verwendung der V (S, U) Tabelle in der Steuerung und die Auswahl einer Aktion U mit dem höchsten V(S, U) Wert in der Tabelle bei dem aktuell gemessenen Zustand S an; π* (S) zeigt die Richtlinie an, die die Operation in eine Darstellung bringt; V (S, U) stellt eine aktuelle mehrdimensionale Tabelle V(S, U) mit den Zuständen S und Aktionen U dar und gibt eine Aktion aus U aus, die den Wert eines bestimmten U im Zustand S einfängt; α ist die Lernrate; γ ist ein Diskontierungsfaktor;
stellt einen projizierten Wert aus der aktuellen V Tabelle bei dem nächsten S und U bezeichnet durch S' sand U' dar; und Vnew(S, U) stellt eine aktualisierte mehrdimensionale Tabelle mit Zuständen S und Aktionen U dar.
-
Insgesamt verwendet der Überwachungsprozessor 148 die Gleichungen 14 bis 17 zur Aktualisierung der aktuellen V (S, U) Tabelle während des Lernens auf der Grundlage seiner Leistung, die durch den Belohnungswert R gemessen wird. Mit anderen Worten, der Belohnungswert R ist ein Leistungsmaß, das in der V (S, U) Tabelle gespeichert ist. Nach der Trainingsphase wird die endgültige V(S, U) Tabelle in die eingebettete Steuerung eingegeben und zur Bestimmung der Aktion U verwendet. Dieselbe Lernregel kann auch in der Steuerung mit einer reduzierten Lernrate weiterverwendet werden, um V (S, U) im realen Fahrzeugbetrieb langsam an die Schwankungen im Feld anzupassen.
-
Genauer gesagt ist der Überwachungsprozessor 148 im Betrieb ferner programmiert, den Zustand S vom Antriebs-Subsystem 136 des Elektrofahrzeugs 100 zu empfangen. Der Zustand S beinhaltet mindestens eines aus der Antriebsleistung Ptrac zum Betrieb des Antriebs-Subsystem 136, einer nominalen Referenz-Kabinenwärme-Eingabe Q cabin,nom die durch den lokalen HVAC-Prozessor 118 bestimmt wird, der Grundleistungseingabe PHVAC die mit der nominalen Referenz-Kabinenwärme-Eingabe Q cabin,nom assoziiert ist, einer Beschleunigung des Elektrofahrzeugs 100, einer aktuellen Fahrzeuggeschwindigkeit vspeed, einer durchschnittlichen Fahrzeuggeschwindigkeit vspeedave,pre und einer kalibrierten Schätzung der Durchschnittsgeschwindigkeit des Fahrzeugs vcal. Einer oder mehrere dieser Zustände können auf Daten von mindestens einem aus den Sensoren 160, der V2V-Kommunikation 170 und der V2X-Kommunikation 172 beruhen. Die kalibrierte Schätzung der Durchschnittsgeschwindigkeit des Fahrzeugs vcal basiert auf mindestens einer vergangenen Statistik für das Elektrofahrzeug und einem Geschwindigkeitsbegrenzung.
-
Der Überwachungsprozessor 148 ist ferner programmiert, eine Wertfunktion V (S, U) basierend auf einer Vielzahl von Aktionen U bei einer Vielzahl von Zuständen S zu bestimmen. Der Überwachungsprozessor 148 ist ferner programmiert, einen aktuellen Belohnungswert R basierend auf einer Änderung eines Batteriekapazitätsverlusts ΔQloss und/oder eines Kabinenkomforts α|ΔT| zu berechnen. In diesem Beispiel kann der aktuelle Belohnungswert R schrittweise erhöht werden, wenn die Änderung des Batteriekapazitätsverlustes abnimmt ΔQloss und/oder einer Verringerung der Differenz zwischen Soll- und Ist-Kabinentemperatur α|ΔT| beim aktuellen Betrieb.
-
Der Überwachungsprozessor 148 ist ferner programmiert, eine Aktion U auszuwählen, die mit dem höchsten Belohnungswert U, welcher dem aktuellen Zustand S und der Wertfunktion V (S, U) entspricht, assoziiert ist. In diesem Beispiel erzeugt der Überwachungsprozessor 148 das modulierte Leistungssignal in Verbindung mit der Anforderung, zwischen der ersten Leistungseingabe und der zweiten Leistungseingabe zu modulieren, als Reaktion darauf, dass der Überwachungsprozessor 148 das nominale Signal von dem lokalen HVAC-Prozessor 118 empfängt, und der lokale HVAC-Prozessor 118 moduliert zwischen der ersten Leistungseingabe und der zweiten Leistungseingabe als Reaktion darauf, dass der lokale HVAC-Prozessor 118 das modulierte Signal von dem Überwachungsprozessor 148 empfängt.
-
Der Überwachungsprozessor 148 ist ferner programmiert, einen Agenten auf der Grundlage der ausgewählten Aktion zu betätigen. In Fortsetzung des vorherigen Beispiels kann der Agent das HVAC-Subsystem 116 sein. Der Überwachungsprozessor 148 steuert nicht das Antriebs-Subsystem, so dass die Antriebsreaktion durch das System 102 nicht verändert wird und das System 102 keine Geschwindigkeits- oder Drehmomentformung berücksichtigt.
-
Nun unter Bezugnahme auf 3 ist ein Beispiel für ein Verfahren 200 zum Betreiben des Überwachungscomputers 146 für das Energiemanagementsystem 102 des in 1 dargestellten Elektrofahrzeugs 100 dargestellt. Das Verfahren 200 beginnt im Block 202 mit dem Erlernen oder Bestimmen der Wertefunktion V (S, U) durch den Überwachungsprozessor 148 basierend auf einer Vielzahl von Aktionen U in einer Vielzahl von Zuständen S, zum Beispiel während einer Trainings- oder Entwurfsphase. In diesem Beispiel ist die Aktion U eine HVAC-Subsystem-Variable, und die Zustände S beinhalten mindestens eines aus einer Leistung Ptrac , die aus einem wiederaufladbaren Energiespeichersystem (RESS) zum Betreiben eines Antriebs-Subsystems bezogen wird, einer aktuellen Fahrzeuggeschwindigkeit vspeed, einer durchschnittliche Fahrzeuggeschwindigkeit vspeedave,pre, einer kalibrierte Schätzung der Durchschnittsgeschwindigkeit des Fahrzeugs vcal, einer Beschleunigung des Elektrofahrzeugs, einem nominalen Referenz-Kabinenwärme-Eingabesollwert Qcabin,nom, der von einem lokalen HVAC-Prozessor 118 bestimmt wird, und einer Leistung PHVAC die von dem RESS zum Betreiben des HVAC-Subsystems 116 entnommen wird. Während dieser Lernphase wird die mehrdimensionale Tabelle V (S, U) aus Anfangswerten, z.B. empirisch ermittelten Daten, erstellt und mit mehreren Profilen (z. B. Zuständen S für verschiedene Fahrzyklen und HVAC-Vorgänge) getestet, und bei jedem Zeitschritt entwickeln sich die Zustände S zeitlich weiter. Der Überwachungsprozessor verwendet die Gleichungen 14 bis 17 zur Bestimmung der Aktion U für den aktuellen Zustand S.
-
Im Block 204 berechnet der Überwachungsprozessor 148 mindestens einen Belohnungswert R gemäß Gleichung 15, basierend auf einer Änderung eines Batteriekapazitätsverlust ΔQloss und/oder eines Kabinenkomforts α|ΔT|. Während der Lernphase misst der Überwachungsprozessor 148 den nächsten Zustand S' und errechnet den Belohnungswert R.
-
Im Block 206 berechnet der Überwachungsprozessor 148 mindestens eine aktualisierte Wertfunktion Vnew(S, U) basierend auf den Gleichungen 13 bis 17. Während der Lernphase aktualisiert der Überwachungsprozessor 148 die mehrdimensionale Tabelle V (S, U) basierend auf den Blöcken 202 und 204 und der Beispiel-Lernregel. Auf diese Weise wird die mehrdimensionale Tabelle V (S, U) schrittweise aktualisiert, so dass die entsprechende Belohnung R für jede mögliche Aktion U erlernt wird, und der Überwachungsprozessor 148 kann die beste Aktion U mit der höchsten Belohnung R bei einem gegebenen Zustand S wählen. Sobald die Testprofile während dieses Lernschritts verbraucht sind, wird die aktualisierte mehrdimensionale Tabelle Vnew(S, U) fertiggestellt und in den endgültigen eingebetteten Prozessor eingegeben.
-
Im Block 208 wählt der Überwachungsprozessor 148 eine Aktion U aus, die der Wertfunktion V(S, U) mit dem höchsten Belohnungswert R entspricht. In diesen Beispielen ist die Aktion U ein angepasster HVAC-Sollwert, der von dem Überwachungsprozessor 148 an den lokalen Prozessor 108 eines oder mehrerer von dem System 102 verwalteter Subsysteme gesendet wird, so dass das System 102 die an das entsprechende Subsystem gelieferte Leistung modulieren kann, um die dem RESS 104 entnommene Gesamtleistung zu verringern, während die gleiche Ausgabe von jedem Subsystem beibehalten wird.
-
Während des realen Einsatzes des Fahrzeugs dient die vorkalibrierte Wertfunktion V (S, U) als Abbildung zwischen einem beliebigen Zustand S (der die Eingabe für den Überwachungsprozessor 148 ist, z. B. Strommessungen) und die Aktion U ist die Ausgabe, die auf das Subsystem als endgültige Steuerung angewendet wird. Darüber hinaus wird dieselbe Lernregel verwendet, um die Wertfunktion V(S, U) mit dem tatsächlichen Belohnungswert R der erhalten wird weiter anzupassen. Dieses zusätzliche Lernen passt die Wertfunktion V (S, U) weiter an, was als Echtzeit-Lernalgorithmus wirkt. Insgesamt ermöglichen dieser Mechanismus und die Auswahl der Belohnung R (die die Auswirkungen der Batteriealterung und des Komforts in der Kabine berücksichtigt), dass die Abbildung im Hinblick auf die gewählte Belohnung R optimal ist.
-
Unter Bezugnahme auf 4 ist in bestimmten Anwendungsfällen die Aktion U ein Zusatz zum Kabinentemperatur-Sollwert T cabin,nom oder dem nominalen Referenz-Kabinenwärme-Eingabesollwert Qcabin,nom. Unter Berücksichtigung einer Variablen U im Zustand S (z.B. aktueller Antriebsbedarf Ptrac), wirkt die gelernte Aktion U so, dass der Überwachungsprozessor 148 den Kabinentemperatur-Sollwert schrittweise erhöht, wenn die Antriebsleistung Ptrac über einem vorbestimmten Schwellenwert liegt, so dass die erforderliche HVAC-Leistung augenblicklich unter einem mittleren HVAC-Leistungsbedarf liegt. Ebenso, wenn ein plötzlicher Einbruch der Antriebsleistung Ptrac auftritt, senkt der Überwachungsprozessor 148 den Kabinentemperatur-Sollwert schrittweise, wenn die Antriebsleistung Ptrac unter einem vorbestimmten Schwellenwert liegt, so dass die erforderliche HVAC-Leistung PHVAC augenblicklich über einem mittleren HVAC-Leistungsbedarf PHVAC liegt. Da die Anpassungen des HVAC-Leistungsbedarfs PHVAC inkrementell sind, bleibt die durchschnittliche Temperatur in der Kabine im Allgemeinen unverändert. Da die Anpassungen des HVAC-Leistungsbedarfs außerdem Änderungen der Antriebsleistung Ptrac entgegenwirken, wird der Batteriestrom aus dem RESS 104 gedämpft oder abgeflacht.
-
Im Allgemeinen können die beschriebenen Computersysteme und/oder Geräte eine beliebige Anzahl von Computerbetriebssystemen verwenden, einschließlich, aber keineswegs beschränkt auf Versionen und/oder Varianten der Ford Sync®-Anwendung, AppLink/Smart Device Link-Middleware, des Microsoft Automotive®-Betriebssystems, des Microsoft Windows®-Betriebssystems, des Unix-Betriebssystems (z. B., des Solaris®-Betriebssystems, das von der Oracle Corporation in Redwood Shores, Kalifornien, vertrieben wird), des AIX UNIX-Betriebssystems, das von International Business Machines in Armonk, New York, vertrieben wird, des Linux-Betriebssystems, des Mac OSX-Betriebssystems und des iOS-Betriebssystems, die von Apple Inc. in Cupertino, Kalifornien, vertrieben werden, des BlackBerry OS, das von Blackberry, Ltd. in Waterloo, Kanada, vertrieben wird, und des Android-Betriebssystems, das von Google, Inc. und der Open Handset Alliance entwickelt wurde, oder der QNX® CAR-Plattform für Infotainment, die von QNX Software Systems angeboten wird. Beispiele für Datenverarbeitungsgeräte beinhalten, ohne darauf beschränkt zu sein, einen Bordcomputer im Fahrzeug, eine Computer-Workstation, einen Server, einen Desktop-, Notebook-, Laptop- oder Handheld-Computer oder ein anderes Computersystem und/oder -gerät.
-
Computer und Rechengeräte enthalten im Allgemeinen computerausführbare Anweisungen, wobei die Anweisungen von einem oder mehreren Rechengeräten, wie den oben genannten, ausgeführt werden können. Computerausführbare Anweisungen können aus Computerprogrammen kompiliert oder interpretiert werden, die mit einer Vielzahl von Programmiersprachen und/oder -technologien erstellt wurden, darunter, ohne Einschränkung und entweder allein oder in Kombination, JAVA™, C, C++, MATLAB, SIMULINK, STATEFLOW, VISUAL BASIC, JAVA SCRIPT, PERL, HTML, TENSORFLOW, PYTORCH, KERAS usw. Einige dieser Anwendungen können auf einer virtuellen Maschine kompiliert und ausgeführt werden, wie z.B. der JAVA VIRTUAL MACHINE, der virtuellen Maschine DALVIK oder Ähnlichem. Im Allgemeinen empfängt ein Prozessor (z. B. ein Mikroprozessor) Anweisungen, z.B. aus einem Speicher, einem computerlesbaren Medium usw., und führt diese Anweisungen aus, wodurch einer oder mehrere Prozesse, einschließlich eines oder mehrerer der hierin beschriebenen Prozesse, ausgeführt werden. Solche Anweisungen und andere Daten können mit Hilfe einer Vielzahl von computerlesbaren Medien gespeichert und übertragen werden. Eine Datei in einer Datenverarbeitungsanlage ist im Allgemeinen eine Sammlung von Daten, die auf einem computerlesbaren Medium, wie einem Speichermedium, einem Direktzugriffsspeicher usw., gespeichert sind.
-
Der Speicher kann ein computerlesbares Medium (auch als prozessorlesbares Medium bezeichnet) umfassen, was jedes nicht-flüchtige (z. B. greifbare) Medium beinhaltet, das an der Bereitstellung von Daten (z. B. Anweisungen) beteiligt ist, die von einem Computer (z. B. von einem Prozessor eines Computers) gelesen werden können. Ein solches Medium kann viele Formen annehmen, einschließlich, aber nicht beschränkt auf nicht-flüchtige Medien und flüchtige Medien. Nichtflüchtigen Medien beinhalten beispielsweise optische oder magnetische Festplatten und andere dauerhafte Speicher. Flüchtige Medien beinhalten z.B. dynamische Direktzugriffsspeicher (DRAM), die in der Regel einen Hauptspeicher bilden. Solche Befehle können über ein oder mehrere Übertragungsmedien übertragen werden, darunter Koaxialkabel, Kupferdraht und Glasfaser, einschließlich der Drähte, die einen mit einem Prozessor eines Steuergeräts verbundenen Systembus bilden. Gängige Formen von computerlesbaren Medien beinhalten beispielsweise eine Diskette, eine flexible Platte, eine Festplatte, ein Magnetband, ein beliebiges anderes magnetisches Medium, eine CD-ROM, eine DVD, ein beliebiges anderes optisches Medium, Lochkarten, ein Papierband, ein beliebiges anderes physikalisches Medium mit Lochmustern, ein RAM, ein PROM, ein EPROM, ein FLASH EEPROM, ein beliebiger anderer Speicherchip oder eine Kassette oder ein beliebiges anderes Medium, von dem ein Computer lesen kann.
-
Datenbanken, Datenlager oder andere hierin beschriebene Datenspeicher können verschiedene Arten von Mechanismen für die Speicherung, den Zugriff und die Abfrage verschiedener Arten von Daten umfassen, einschließlich eine hierarchische Datenbank, eine Reihe von Dateien in einem Dateisystem, eine Anwendungsdatenbank in einem proprietären Format, ein relationales Datenbankmanagementsystem (RDBMS) usw. Jeder dieser Datenspeicher ist im Allgemeinen in einem Computergerät enthalten, das ein Computerbetriebssystem wie eines der oben genannten verwendet, und der Zugriff darauf erfolgt über ein Netzwerk auf eine oder mehrere der verschiedensten Arten. Auf ein Dateisystem kann von einem Computerbetriebssystem aus zugegriffen werden, und es kann Dateien enthalten, die in verschiedenen Formaten gespeichert sind. Ein RDBMS verwendet im Allgemeinen die Structured Query Language (SQL) zusätzlich zu einer Sprache zum Erstellen, Speichern, Bearbeiten und Ausführen von gespeicherten Prozeduren, wie die oben erwähnte PL/SQL-Sprache.
-
In einigen Beispielen können Systemelemente als computerlesbare Anweisungen (z. B. Software) auf einem oder mehreren Computergeräten (z. B. Servern, Personalcomputern usw.) implementiert sein, die auf dazugehörigen computerlesbaren Medien (z. B. Disketten, Speichern usw.) gespeichert sind. Ein Computerprogrammprodukt kann solche Anweisungen enthalten, die auf computerlesbaren Medien gespeichert sind, um die hierin beschriebenen Funktionen auszuführen.
-
Im Hinblick auf die hierin beschriebenen Medien, Prozesse, Systeme, Methoden, Heuristiken usw. ist zu verstehen, dass, obwohl die Schritte solcher Prozesse usw. als in einer bestimmten geordneten Reihenfolge ablaufend beschrieben wurden, solche Prozesse mit den beschriebenen Schritten in einer anderen als der hierin beschriebenen Reihenfolge durchgeführt werden können. Ferner können bestimmte Schritte gleichzeitig durchgeführt werden, andere Schritte können hinzugefügt werden oder bestimmte hierin beschriebene Schritte können weggelassen werden. Mit anderen Worten dienen die hierin enthaltenen Beschreibungen von Verfahren der Veranschaulichung bestimmter Ausführungsformen und sind keinesfalls so auszulegen, dass sie die Ansprüche einschränken.
-
Dementsprechend sollte verstanden werden, dass die obige Beschreibung nur zur Veranschaulichung gedacht und nicht einschränkend ist. Viele Ausführungsformen und Anwendungen, die über die Beispiele hinausgehen, sind für den Fachmann beim Lesen der obigen Beschreibung offensichtlich. Der Umfang der Erfindung sollte nicht unter Bezugnahme auf die obige Beschreibung, sondern stattdessen unter Bezugnahme auf die beigefügten Ansprüche bestimmt werden, zusammen mit dem vollen Umfang der Äquivalente, auf die diese Ansprüche Anspruch haben. Es ist zu erwarten und beabsichtigt, dass zukünftige Entwicklungen auf den hierin erörterten Gebieten stattfinden werden und dass die offenbarten Systeme und Methoden in solche zukünftigen Ausführungsformen einfließen werden. Zusammenfassend ist zu verstehen, dass die Erfindung modifizierbar und variierbar ist und nur durch die folgenden Ansprüche begrenzt wird.
-
Alle in den Ansprüchen verwendeten Begriffe haben ihre einfache und gewöhnliche Bedeutung, wie sie von Fachleuten verstanden wird, es sei denn, es wird ausdrücklich etwas anderes angegeben. Insbesondere sollte die Verwendung von Singularartikeln wie „ein“, „der“, „besagte“ usw. so verstanden werden, dass sie eines oder mehrere der angegebenen Elemente bezeichnen, es sei denn, ein Anspruch enthält eine ausdrückliche gegenteilige Einschränkung.
-
Die Beschreibung der vorliegenden Offenbarung ist lediglich beispielhaft, und Variationen, die nicht vom Kern der vorliegenden Offenbarung abweichen, sollen in den Anwendungsbereich der vorliegenden Offenbarung fallen. Solche Variationen sind nicht als Abweichung von Geist und Umfang der vorliegenden Offenbarung zu betrachten.