FR3097265A1 - Procédé de contrôle thermique d’un moteur - Google Patents
Procédé de contrôle thermique d’un moteur Download PDFInfo
- Publication number
- FR3097265A1 FR3097265A1 FR1906231A FR1906231A FR3097265A1 FR 3097265 A1 FR3097265 A1 FR 3097265A1 FR 1906231 A FR1906231 A FR 1906231A FR 1906231 A FR1906231 A FR 1906231A FR 3097265 A1 FR3097265 A1 FR 3097265A1
- Authority
- FR
- France
- Prior art keywords
- exp
- expert
- command
- function
- thermal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000001816 cooling Methods 0.000 claims abstract description 57
- 230000006870 function Effects 0.000 claims description 85
- 230000007704 transition Effects 0.000 claims description 31
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000012549 training Methods 0.000 claims description 2
- 238000012544 monitoring process Methods 0.000 description 14
- 230000009471 action Effects 0.000 description 6
- 238000011217 control strategy Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000002826 coolant Substances 0.000 description 1
- 239000000110 cooling liquid Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F01—MACHINES OR ENGINES IN GENERAL; ENGINE PLANTS IN GENERAL; STEAM ENGINES
- F01P—COOLING OF MACHINES OR ENGINES IN GENERAL; COOLING OF INTERNAL-COMBUSTION ENGINES
- F01P7/00—Controlling of coolant flow
- F01P7/02—Controlling of coolant flow the coolant being cooling-air
- F01P7/04—Controlling of coolant flow the coolant being cooling-air by varying pump speed, e.g. by changing pump-drive gear ratio
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60K—ARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
- B60K11/00—Arrangement in connection with cooling of propulsion units
- B60K11/08—Air inlets for cooling; Shutters or blinds therefor
- B60K11/085—Air inlets for cooling; Shutters or blinds therefor with adjustable shutters or blinds
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F01—MACHINES OR ENGINES IN GENERAL; ENGINE PLANTS IN GENERAL; STEAM ENGINES
- F01P—COOLING OF MACHINES OR ENGINES IN GENERAL; COOLING OF INTERNAL-COMBUSTION ENGINES
- F01P7/00—Controlling of coolant flow
- F01P7/02—Controlling of coolant flow the coolant being cooling-air
- F01P7/10—Controlling of coolant flow the coolant being cooling-air by throttling amount of air flowing through liquid-to-air heat exchangers
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F01—MACHINES OR ENGINES IN GENERAL; ENGINE PLANTS IN GENERAL; STEAM ENGINES
- F01P—COOLING OF MACHINES OR ENGINES IN GENERAL; COOLING OF INTERNAL-COMBUSTION ENGINES
- F01P7/00—Controlling of coolant flow
- F01P7/14—Controlling of coolant flow the coolant being liquid
- F01P7/16—Controlling of coolant flow the coolant being liquid by thermostatic control
- F01P7/164—Controlling of coolant flow the coolant being liquid by thermostatic control by varying pump speed
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60K—ARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
- B60K1/00—Arrangement or mounting of electrical propulsion units
- B60K2001/003—Arrangement or mounting of electrical propulsion units with means for cooling the electrical propulsion units
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F01—MACHINES OR ENGINES IN GENERAL; ENGINE PLANTS IN GENERAL; STEAM ENGINES
- F01P—COOLING OF MACHINES OR ENGINES IN GENERAL; COOLING OF INTERNAL-COMBUSTION ENGINES
- F01P7/00—Controlling of coolant flow
- F01P7/14—Controlling of coolant flow the coolant being liquid
- F01P2007/146—Controlling of coolant flow the coolant being liquid using valves
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F01—MACHINES OR ENGINES IN GENERAL; ENGINE PLANTS IN GENERAL; STEAM ENGINES
- F01P—COOLING OF MACHINES OR ENGINES IN GENERAL; COOLING OF INTERNAL-COMBUSTION ENGINES
- F01P2023/00—Signal processing; Details thereof
- F01P2023/08—Microprocessor; Microcomputer
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/02—Circuit arrangements for generating control signals
- F02D41/14—Introducing closed-loop corrections
- F02D41/1401—Introducing closed-loop corrections characterised by the control or regulation method
- F02D41/1405—Neural network control
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/80—Technologies aiming to reduce greenhouse gasses emissions common to all road transportation technologies
- Y02T10/88—Optimized components or subsystems, e.g. lighting, actively controlled glasses
Landscapes
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Mechanical Engineering (AREA)
- General Engineering & Computer Science (AREA)
- Transportation (AREA)
- Feedback Control In General (AREA)
- Electrical Control Of Air Or Fuel Supplied To Internal-Combustion Engine (AREA)
Abstract
L’invention concerne un procédé d’optimisation du contrôle thermique d’un moteur (10) de véhicule, ledit véhicule comprenant un dispositif de refroidissement (30) du moteur (10), ledit dispositif de refroidissement (30) comprenant au moins un actionneur (310) permettant de faire varier la capacité de refroidissement du moteur (10). Le procédé est mis en œuvre par un calculateur (20), adapté pour contrôler ledit au moins un actionneur (310) à l’aide d’une commande (u(t)), afin de réaliser le contrôle thermique du moteur (10). Le procédé comprend une première phase de fonctionnement, dite « d’exploration », une deuxième phase de fonctionnement, dite « phase d’apprentissage par imitation », et une troisième phase de fonctionnement, dite « autonome ». Figure pour l’abrégé : Fig. 1
Description
L’invention concerne un procédé d’optimisation de contrôle thermique d’un moteur électrique de véhicule, un système pour la mise en œuvre de ce procédé ainsi qu’un véhicule comprenant un tel système.
L’invention vise notamment à optimiser le contrôle thermique d’un moteur électrique de véhicule afin d’en réduire la consommation.
Dans un véhicule automobile électrique ou hybride, il est connu de contrôler la température du moteur électrique afin d’augmenter à la fois la longévité et les performances dudit moteur. En effet, il est connu que la chaleur peut entraîner une déformation des matériaux et endommager les composants électroniques du moteur ou des équipements environnants du moteur, ce qui en réduit la durée de vie.
En outre, il est important de pouvoir optimiser le contrôle thermique du moteur afin de pouvoir le maintenir dans une plage de températures acceptables, tout en limitant la consommation d’énergie électrique induite par ce contrôle thermique afin d’optimiser l’autonomie du véhicule.
Ainsi, plusieurs approches sont considérées aujourd’hui pour effectuer le contrôle thermique d’un moteur électrique de véhicule. Elles sont mises en œuvre par un dispositif de refroidissement comprenant un actionneur adapté pour faire varier la capacité de refroidissement du moteur lorsque cet actionneur est commandé par ledit dispositif de refroidissement.
Dans une solution singulière connue et basée sur des réseaux de neurones, le dispositif de refroidissement comprend un module de surveillance et un module de commande. Le module de surveillance détermine l’état du moteur, du dispositif de refroidissement et des équipements environnants du moteur tandis que le module de commande détermine la commande à envoyer à l’actionneur en fonction des états déterminés par le module de surveillance.
Dans cette solution, le module de commande peut tester plusieurs commandes de l’actionneur établies à partir de combinaisons d’états afin de déterminer la commande permettant d’optimiser le fonctionnement du moteur dans une combinaison d’états donnée. Ces nombreuses itérations peuvent être coûteuses en temps, empêchant alors le fonctionnement optimal et rapide du dispositif de refroidissement, ce qui consomme notamment une quantité notable d’énergie, puisque le dispositif de refroidissement doit être alimenté pendant toute la durée des tests.
Il existe donc le besoin d’une solution fiable et optimisée pour remédier au moins en partie à ces inconvénients.
A cette fin, l’invention a tout d’abord pour objet un procédé d’optimisation du contrôle thermique d’un moteur de véhicule, ledit véhicule comprenant un dispositif de refroidissement du moteur, ledit dispositif de refroidissement comprenant au moins un actionneur permettant de faire varier la capacité de refroidissement du moteur , le procédé est mis en œuvre par un calculateur, adapté pour contrôler ledit au moins un actionneur à l’aide d’une commande, ledit calculateur comprenant et mettant en œuvre une fonction de commande principale et une fonction de commande experte prédéterminées et comprenant une mémoire dans laquelle sont enregistrées des transitions permettant de déterminer la commande à envoyer au dispositif de refroidissement en fonction de l’état courant, désignant l’état de fonctionnement, d’un système thermique comprenant le dispositif de refroidissement et le moteur afin de réaliser le contrôle thermique du moteur, ledit procédé étant remarquable en ce qu’il comprend l’entrainement d’un algorithme d’apprentissage comprenant la mise en œuvre itérative des phases suivantes :
- une première phase de fonctionnement, dite « d’exploration », dans laquelle la fonction de commande experte contrôle le fonctionnement du système est exécutée par itération, chaque itération comportant une étape de:
- détermination d’au moins une commande dite « experte » de l’au moins un actionneur par application de la fonction de commande experte à l’état courant du système thermique et mise en œuvre de ladite fonction de commande experte,
- détermination d’un état modifié du système thermique après la mise en œuvre de ladite commande experte,
- calcul, par la mise en œuvre d’une fonction de récompense thermodynamique du moteur, d’une valeur de récompense thermique modifiée à partir de l’état modifié du système thermique, et de ladite commande experte,
- enregistrement dans la mémoire de l’ensemble, appelé « transition », comprenant l’état courant, la commande experte appliquée, également nommée « démonstration », l’état modifié et la récompense thermique modifiée, ledit état modifié devenant alors l’état courant de l’itération suivante,
- détermination d’un état modifié du système thermique après la mise en œuvre de ladite commande experte,
- calcul, par la mise en œuvre d’une fonction de récompense thermodynamique du moteur, d’une valeur de récompense thermique modifiée à partir de l’état modifié du système thermique, et de ladite commande experte,
- enregistrement dans la mémoire de l’ensemble, appelé « transition », comprenant l’état courant, la commande experte appliquée, également nommée « démonstration », l’état modifié et la récompense thermique modifiée, ledit état modifié devenant alors l’état courant de l’itération suivante,
- une deuxième phase de fonctionnement, dite « d’apprentissage par imitation », dans laquelle le calculateur modifie la fonction de commande principale afin de minimiser la différence entre la commande experte et la commande principale, à partir des transitions enregistrées dans la première phase de fonctionnement, et dans laquelle la fonction de commande experte contrôle le fonctionnement du système,
- une troisième phase de fonctionnement, dite « autonome », dans laquelle le calculateur exécute la fonction de commande principale modifiée lors de la deuxième phase de fonctionnement afin de contrôler le fonctionnement du système, et dans laquelle le calculateur détermine la commande principale et évalue s’il est pertinent que la fonction de commande principale imite la fonction de commande experte ou non.
Le procédé selon l’invention permet avantageusement de réaliser un apprentissage plus stable et fiable grâce notamment à la mise en œuvre de la phase d’exploration permettant de tester le système à partir de l’application d’une fonction de commande experte pertinente avant de mettre en œuvre la phase d’apprentissage. De plus, l’apprentissage est plus rapide. En effet, la phase d’apprentissage par itération permet à la fonction de commande principale d’acquérir rapidement l’expérience de la fonction de commande experte et ainsi d’éviter des expérimentations et des itérations inutiles. Ainsi, la fonction de commande principale converge plus rapidement et de façon stable vers son fonctionnement optimal, permettant de gérer et d’apprendre la complexité du système à contrôler.
De manière avantageuse, lors de la première phase de fonctionnement du procédé, un bruit dit « d’exploration » est ajouté à une commande experte, générée à partir de la fonction de commande experte et d’un état courant.
L’ajout d’un tel bruit d’exploration permet de modifier la commande experte et donc de modifier l’action réalisée par l’actionneur de manière à déterminer des transitions pour différentes commandes expertes.
De manière préférée, le bruit d’exploration est défini comme un signal ajouté à la commande experte et permettant de faire varier ladite commande experte.
Avantageusement, la troisième phase de fonctionnement du procédé comprend un premier mode de fonctionnement, dans lequel le système fonctionne sans utiliser les transitions enregistrées, uniquement selon une fonction d’estimation de la performance thermique du système et la fonction de commande principale générées à l’issue de la deuxième phase de fonctionnement.
Ainsi, les transitions enregistrées à l’issu de la première phase de fonctionnement pour l’exécution de la deuxième phase de fonctionnement ne sont jamais utilisées dans la troisième phase de fonctionnement.
De préférence, la troisième phase de fonctionnement du procédé comprend un deuxième mode de fonctionnement, dans lequel la fonction de commande principale agit sur le système selon la fonction de commande experte générée à l’issue de la première phase de fonctionnement pour l’ensemble des transitions enregistrées en mémoire.
De manière préférée, la troisième phase de fonctionnement du procédé comprend un troisième mode de fonctionnement, dans lequel, le calculateur détermine si la fonction de commande principale doit agir ou non selon la fonction de commande experte pour un état courant d’une transition enregistrée en mémoire, en fonction de l’estimation de la performance thermique du système, et est configuré pour mettre en œuvre une commande différente et davantage adaptée de la commande donnée par la fonction de commande experte le cas échéant.
L’invention concerne également un calculateur de contrôle thermique d’un moteur de véhicule, ledit véhicule comprenant un dispositif de refroidissement du moteur, ledit dispositif de refroidissement comprenant au moins un actionneur permettant de faire varier la capacité de refroidissement du moteur, ledit calculateur étant adapté pour contrôler ledit au moins un actionneur à l’aide d’une commande, comprenant et mettant en œuvre une fonction de commande principale et une fonction de commande experte, et comprenant une mémoire dans laquelle sont enregistrées des transitions permettant de déterminer la commande à envoyer au dispositif de refroidissement en fonction de l’état courant, désignant l’état de fonctionnement, d’un système thermique comprenant le dispositif de refroidissement et le moteur afin de réaliser le contrôle thermique du moteur, ledit calculateur étant remarquable en ce qu’il est configuré pour mettre en œuvre le procédé tel que présenté précédemment.
De préférence, le calculateur est configuré pour, lors de la première phase de fonctionnement, ajouter un bruit dit « d’exploration » à une commande experte générée à partir de la fonction de commande experte et d’un état courant.
De manière préférée, le bruit d’exploitation est défini comme un signal ajouté à la commande experte et permettant de faire varier ladite commande experte.
L’invention concerne aussi un véhicule, notamment automobile, comprenant un moteur, un dispositif de refroidissement, comprenant au moins un actionneur permettant de faire varier la capacité de refroidissement dudit moteur, et un calculateur tel que présenté ci-avant.
D’autres caractéristiques et avantages de l’invention apparaîtront encore à la lecture de la description qui va suivre. Celle-ci est purement illustrative et doit être lue en regard des dessins annexés sur lesquels :
: la figure 1 présente le système thermique d’un moteur de véhicule selon un mode de réalisation l’invention,
: la figure 2 représente la première phase de fonctionnement du procédé d’optimisation de contrôle thermique d’un moteur du véhicule selon l’invention,
: la figure 3 représente la deuxième phase de fonctionnement du procédé d’optimisation de contrôle thermique d’un moteur du véhicule selon l’invention,
: la figure 4 représente le deuxième mode de fonctionnement de la troisième phase de fonctionnement du procédé d’optimisation de contrôle thermique d’un moteur du véhicule selon l’invention,
: la figure 5 représente le troisième mode de fonctionnement de la troisième phase de fonctionnement du procédé d’optimisation de contrôle thermique d’un moteur du véhicule selon l’invention.
DISPOSITIF
Il va maintenant être décrit un véhicule automobile comprenant un dispositif de refroidissement selon l’invention. L’invention sera décrite dans le cas d’un véhicule automobile mais pourrait concerner tout type de véhicule comprenant un moteur électrique.
En référence à la figure 1, le véhicule comprend un système 5 thermique comportant un moteur 10 électrique, un calculateur 20, un dispositif de refroidissement 30 dudit moteur 10 et des équipements 40 environnants dudit moteur 10.
Le dispositif de refroidissement 30 comprend un actionneur 310, adapté pour faire varier une capacité de refroidissement du moteur 10. On notera que, dans une autre forme de réalisation, le dispositif de refroidissement 30 pourrait comprendre plusieurs actionneurs 310.
Le calculateur 20 est adapté pour recevoir des informations sur l’état du moteur 10, du dispositif de refroidissement 30 et des équipements 40 environnants. Ces informations peuvent par exemple être mesurées par un ou plusieurs capteurs du véhicule tels que par exemple un capteur de température, de vitesse ou d’humidité.
Les équipements 40 situés dans l’environnement du moteur 10 peuvent notamment être un ou plusieurs équipements 40 parmi les suivants : un onduleur, une batterie, une pompe, une vanne, une grille, un ventilateur, un radiateur, des tuyaux d’écoulements du liquide de refroidissement, etc.
Le calculateur 20 est également adapté pour contrôler l’actionneur 310 par l’application de commandes (notées utou ci-après ut (exp)) envoyées au dispositif de refroidissement 30 et agissant sur l’actionneur 310. En effet, les composantes de chaque commande ut, ut (exp)dépendent du moteur 10 et des équipements 40 environnants.
Le dispositif de refroidissement 30 peut être composé de tous types de composants seuls ou combinés permettant de refroidir un moteur 10 de véhicule. En effet, l’optimisation du contrôle thermique d’un moteur 10 de véhicule n’étant pas propre à un type de dispositif de refroidissement 30, toutes les combinaisons de composants de refroidissement sont considérées.
Par exemple, si le dispositif de refroidissement 30 comprend une pompe qui fait transiter un liquide de refroidissement vers le moteur 10, la commande ut, ut (exp)de la pompe peut être une modification du débit de la pompe. Un autre exemple est celui dans lequel le dispositif de refroidissement 30 comprend une vanne ouvrant sur l’extérieur et dont la commande ut, ut (exp)consiste à ouvrir ou fermer la vanne d’un certain angle. Dans une autre forme de réalisation, le dispositif de refroidissement 30 comprend un ventilateur comprenant des pâles et la commande ut, ut (exp)consiste à activer les pâles du ventilateur à une vitesse déterminée afin de refroidir le moteur 10. Il est également possible que le dispositif de refroidissement 30 comprenne une grille et un radiateur que la commande ut, ut (exp)consiste à ouvrir ou fermer la grille, selon une position parmi une pluralité de positions possibles, pour refroidir le radiateur lorsque celui-ci évacue la chaleur du moteur 10.
L’invention n’exclut cependant pas le fait que les commandes ut, ut (exp)définies dans les exemples précédents peuvent être utilisées simultanément ou combinées d’une manière ou d’une autre. Ainsi, la pompe, la vanne, le ventilateur, la grille et le radiateur font partie intégrante du dispositif de refroidissement 30 et ne sont pas considérées comme plusieurs dispositifs de refroidissement 30 distincts.
Le calculateur 20 peut donc déterminer une commande ut, ut (exp)commune, concernant plusieurs éléments différents d’un même dispositif de refroidissement 30.
Le calculateur 20 présente une architecture du type apprentissage rapide.
En référence aux figures 4 et 5, cette architecture comprend un module de surveillance 22, un module de commande principale 21, un module de contrôle 23, un module de commande experte 24, représentant une fonction de commande experte πexpprédéterminée de l’architecture, et un module d’exploration N. A cette fin, le calculateur 20 comprend un processeur apte à mettre en œuvre un ensemble d’instructions permettant de réaliser ces fonctions.
Le module de surveillance 22 évalue l’impact instantané d’une commande ut, ut (exp)sur le système 5. A cette fin, le module de surveillance 22 est configuré pour collecter les données générées par les capteurs afin de les transmettre au module de commande principale 21.
Le module de commande principale 21 représente l’acteur de l’architecture qui détermine et envoie une commande dite « principale » ut. A cette fin, le module de commande 21 reçoit l’état courant stdu système 5, à partir des données générées par les différents capteurs et collectées par le module de surveillance 22, et détermine au moins une commande principale utà effectuer, par application d’une fonction de commande principale prédéterminée, désignée π, à l’état courant st. Ladite fonction de commande principale π définit donc la commande utenvoyée en fonction de l’état courant stdu système 5 et définit également une stratégie de contrôle principale. Avantageusement, ce module de commande principale 21 est mis en œuvre par un réseau de neurones artificiels implémentant la fonction de commande principale π.
Le module de surveillance 22 est configuré pour déterminer l’état modifié st+1, autrement dit le nouvel état du système 5. Le module de surveillance 22 est également configuré pour déterminer une valeur de récompense thermique modifiée rt+1, par application d’une fonction de récompense thermodynamique. Ladite récompense thermique modifiée rt+1est définie comme la quantité d’entropie interne créée au cours d’une transition d’état et diverses pénalités liées au non-respect des contraintes, lesdites contraintes pouvant par exemple être liées à un seuil de température maximum, à une variation temporelle maximale de la température… Une transition d’état comprend un premier ensemble de valeurs décrivant un état courant st initial du système 5, une commande ut, ut (exp)appliquée, également nommée « démonstration », un deuxième ensemble de valeurs décrivant un état modifié st+1du système 5 et une récompense thermique modifiée rt+1. Pour ce faire, le module de surveillance 22 récupère les informations concernant la commande utenvoyée par le module de commande principale 21 et détermine l’état modifié st+1 et la récompense thermique modifiée rt+1notamment grâce aux équations de la thermodynamique.
Le module de contrôle 23, appelé « critique » dans l’architecture, est configuré pour implémenter et mettre à jour une fonction d’estimation de la performance thermique du système 5. Ladite fonction d’estimation de la performance thermique permet de calculer la somme attendue de toutes les récompenses thermiques modifiées rt+1 obtenues pour une série d’applications successives de la fonction de commande principale π à partir d’un état courant st et d’une récompense thermique courante rt, correspondant à la récompense thermique de l’état de fonctionnement actuel du système 5. Cette fonction de commande principale π est avantageusement mise en œuvre par un réseau de neurones artificiels. Ainsi, le module de contrôle 23 permet au dispositif de refroidissement 30 de fonctionner de façon optimale.
Le module de transition 25 représente le fait que l’état modifié st+1, respectivement la récompense thermique modifiée rt+1, estimé après application d’une commande ut, ut (exp)devient ensuite le nouvel état courant stdu système 5, respectivement la récompense thermique courante rtdu système 5.
Le module de commande experte 24 est configuré pour recevoir l’état courant stdu système 5, et détermine au moins une commande dite « experte » ut (exp)à effectuer, par application d’une fonction de commande experte πexpà l’état courant st. La fonction de commande experte πexpcomprend et définit des stratégies de contrôle expertes prédéterminées permettant d’optimiser le fonctionnement du dispositif de refroidissement 30.
PROCEDE
En référence aux figures 2 à 5, il va maintenant être décrit le procédé d’optimisation de contrôle thermique d’un moteur 10 du véhicule selon un mode de réalisation. Ce procédé permet de contrôler le dispositif de refroidissement 30 du moteur 10 du véhicule de façon, d’une part, à maintenir le moteur 10 du véhicule dans une plage de températures acceptables, et d’autre part, de réduire autant que possible la consommation d’énergie électrique par le dispositif de refroidissement 30 du véhicule.
Ledit procédé comprend une première phase de fonctionnement PH1, dite d’exploration du comportement de la fonction de commande experte πexp, une deuxième phase de fonctionnement PH2, dite phase d’apprentissage par imitation, et une troisième phase de fonctionnement PH3 dite autonome.
PREMIERE PHASE DE FONCTIONNEMENT
En référence à la figure 2, lors de la première phase de fonctionnement PH1, dite d’exploration, les stratégies de contrôle expertes prédéterminées du calculateur 20 sont simulées par itération. Cela permet au module de commande principale 21 et au module de contrôle 23 d’acquérir l’expérience et le comportement apportés par le module de commande experte 24.
Pour cela, la phase d’exploration PH1 comprend une étape de détermination d’au moins une commande experte ut ( exp )d’au moins un actionneur 310 à un état courant stdu système 5 thermique et mise en œuvre de ladite commande experte ut ( exp)par application de la fonction de commande experte πexppermettant le contrôle du système 5 via l’actionneur 310.
Ainsi, les stratégies de contrôle expertes du module de commande experte 24 sont exécutées par application de la fonction de commande experte πexp, notamment en ajoutant aléatoirement un bruit d’exploration variable, via le module d’exploration N, à la commande experte ut (exp), afin d’exécuter aussi dans le voisinage de la trajectoire de contrôle de la commande experte ut (exp). L’ajout du bruit d’exploration à la commande experte ut (exp)est également aléatoire de manière à exécuter parfois une commande experte ut (exp)non bruitée et parfois une commande experte ut (exp)bruitée. Par exemple, on peut ainsi obtenir, en moyenne, une action experte bruitée exécutée, définie comme une action du système 5 due à l’application d’une commande experte ut(exp)bruitée, pour dix actions expertes exécutées, définies comme des actions du système 5 dues à l’application d’une commande experte ut(exp)non bruitée. Le bruit d’exploration ajouté permet d’améliorer l’efficacité thermique du dispositif de refroidissement 30 et permet d’apprendre d’éventuelles actions optimisant davantage le fonctionnement du système 5 thermique.
La phase d’exploration PH1 comprend ensuite une étape de détermination d’un état modifié st+1du système 5 thermique après la mise en œuvre de ladite commande experte ut ( exp ). C’est notamment le module de surveillance 22 qui détermine l’état modifié st+1, autrement dit le nouvel état, du système 5 thermique.
La phase d’exploration PH1 comprend également une étape de calcul, par la mise en œuvre de la fonction de récompense thermodynamique, exécutée par le module de surveillance 22, d’une valeur de récompense thermique modifiée rt+1à partir de l’état modifié st+1du système 5 thermique, et de ladite commande experte ut ( exp ). Lors de cette étape, le module de surveillance 22 détermine une valeur de récompense thermique modifiée rt+1associée à la transition d’état du système 5 thermique observée de l’état courant stdonné vers l’état modifié st+1.
La phase d’exploration PH1 comprend ensuite une étape d’enregistrement dans une mémoire MEM de l’ensemble, appelé « transition », comprenant l’état courant st, la commande experte ut ( exp )appliquée, l’état modifié st+1et la récompense thermique modifiée rt+1, ledit état modifié st+1devenant alors l’état courant stde l’itération suivante.
La mémoire MEM comprend une mémoire experte MEM1 et une mémoire dite « de répétition » (ou replay) MEM2. Dans la mémoire experte MEM1, sont enregistrées les transitions expertes sans ajout de bruit d’exploration, autrement dit, les transitions provenant d’une expérimentation directe de la fonction de commande experte πexp. D’autre part, dans la mémoire de répétition MEM2, sont enregistrées les transitions comprenant un ajout de bruit d’exploration, permettant notamment la mise à jour de la fonction d’estimation de la performance thermique lors de la troisième phase de fonctionnement PH3, dite autonome, décrite dans les paragraphes suivants.
Ainsi, dans la mémoire MEM sont enregistrées à la fois des transitions d’état avec un ajout de bruit d’exploration et des transitions d’état sans ajout de bruit d’exploration.
DEUXIEME PHASE DE FONCTIONNEMENT
En référence à la figure 3, lors de la deuxième phase de fonctionnement PH2, les paramètres de la fonction de commande principale π du module de commande principale 21 sont modifiés de manière à minimiser la différence entre la commande principale utproposée et la commande experte ut(exp)pour un même état courant st donné. Pour cela, le module de commande principale 21 utilise les transitions enregistrées dans la mémoire experte MEM1.
Afin de vérifier que la commande principale utconverge vers la commande experte ut(exp), un comparateur est utilisé. Un signal LBCpermet de définir la différence entre la commande principale ut et la commande experte ut(exp). La modification des paramètres de la fonction de commande principale π du module de commande principale 21 est exécutée de manière à minimiser cette différence sur l’ensemble de transitions stockées dans la mémoire experte MEM1. Autrement dit, les transitions stockées dans la mémoire experte MEM1 sont utilisées pour la modification et/ou la mise à jour de la fonction de commande principale π.
Par ailleurs, lors de cette deuxième phase de fonctionnement PH2, le module de contrôle 23 est entraîné pour estimer la performance thermique du système en suivant la fonction de commande experte πexpà partir d’un état courant stdonné. La mise-à-jour de la fonction d’estimation de la performance thermique est faite à partir des transitions enregistrées dans la mémoire experte MEM1 et dans la mémoire de répétition MEM2 notamment en appliquant la relation récursive dite « de Bellman par bootstrap », comme décrit dans la publication « Continous Control With Deep Reinforcement Learning » (Lillicrap and al, 2015).
Avantageusement, la deuxième phase de fonctionnement PH2 est terminée lorsque la différence définie entre une commande experte ut(exp), exécutée par la fonction de commande experte πexp ,stockée dans la mémoire experte MEM1, et une commande principale utproposée par le module de commande principale 21, pour un même état courant stdu système 5, a atteint une précision minimale.
Il est notamment possible d’utiliser une méthode connue par l’homme du métier : la MAE, « Mean Absolute Error » en langue anglaise.
Une fois la phase de fonctionnement autonome PH3 activée et le module de commande experte 24 débranché ou éteint, et donc lorsque la fonction de commande experte πexpest inactive, la deuxième phase de fonctionnement PH2 permet à la fonction de commande principale π de pouvoir contrôler de façon efficace le fonctionnement du système 5 thermique, via l’actionneur 310.
TROISIEME PHASE DE FONCTIONNEMENT
Lors de la troisième phase de fonctionnement PH3, le système est en mode autonome. Cette troisième phase de fonctionnement PH3 peut comprendre trois modes de fonctionnement permettant le contrôle du système 5 par la fonction de commande principale π via l’actionneur 310.
Dans un premier mode de fonctionnement, l’utilisation des commandes expertes ut(exp)est inactive, puisque le module de commande experte 24 est inactif, le module de surveillance 22, le module de commande principale 21 et le module de contrôle 23 sont actifs. Il faut toutefois noter qu’à cet instant, le module de commande principale 21 et le module de contrôle 23 ont préalablement acquis l’expérience de la fonction de commande experte πexpdu module de commande experte 24 lors de la deuxième phase de fonctionnement PH2.
En référence à la figure 4, il est représenté un deuxième mode de fonctionnement de la phase de fonctionnement autonome PH3 dans laquelle le module de commande experte 24 est actif et, si le système 5 fonctionne selon un état courant stconnu par la fonction de commande experte πexpdu module de commande experte 24, alors le module de commande principale 21 fonctionne tel que la fonction de commande experte πexpdu module de commande experte 24 le préconise.
En référence à la figure 5, il est représenté un troisième mode de fonctionnement de la phase de fonctionnement autonome PH3 dans laquelle le module de commande experte 24 est actif. Selon ce troisième mode de fonctionnement, si le système 5 fonctionne selon un état courant stconnu par la fonction de commande experte πexp, alors le module de contrôle 23 peut décider de ne pas faire fonctionner le module de commande principale 21 tel que la fonction de commande experte πexple préconise, notamment lorsque le module de contrôle 23 considère que le fonctionnement proposé par la fonction de commande experte πexpn’est pas optimale.
Claims (10)
- Procédé d’optimisation du contrôle thermique d’un moteur (10) de véhicule, ledit véhicule comprenant un dispositif de refroidissement (30) du moteur (10), ledit dispositif de refroidissement (30) comprenant au moins un actionneur (310) permettant de faire varier la capacité de refroidissement du moteur (10), le procédé est mis en œuvre par un calculateur (20), adapté pour contrôler ledit au moins un actionneur (310) à l’aide d’une commande (ut, ut(exp)), ledit calculateur (20) comprenant et mettant en œuvre une fonction de commande principale (π) et une fonction de commande experte (πexp) prédéterminées et comprenant une mémoire (MEM) dans laquelle sont enregistrées des transitions permettant de déterminer la commande (ut, ut(exp)) à envoyer au dispositif de refroidissement (30) en fonction de l’état courant (st), désignant l’état de fonctionnement, d’un système (5) thermique comprenant le dispositif de refroidissement (30) et le moteur (10) afin de réaliser le contrôle thermique du moteur (10), ledit procédé étant caractérisé en ce qu’il comprend l’entrainement d’un algorithme d’apprentissage comprenant la mise en œuvre itérative des phases suivantes :
- une première phase de fonctionnement (PH1), dite « d’exploration », dans laquelle la fonction de commande experte (πexp) contrôle le fonctionnement du système (5) et est exécutée par itération, chaque itération comportant une étape de:
- détermination d’un état modifié (st+1) du système (5) thermique après la mise en œuvre de ladite commande experte (ut(exp)),
- calcul, par la mise en œuvre d’une fonction de récompense thermodynamique du moteur (10), d’une valeur de récompense thermique modifiée (rt+1) à partir de l’état modifié (st+1) du système (5) thermique, et de ladite commande experte (ut(exp)),
- enregistrement dans la mémoire (MEM) de l’ensemble, appelé « transition », comprenant l’état courant (st), la commande experte (ut(exp)) appliquée, également nommée « démonstration », l’état modifié (st+1) et la récompense thermique modifiée (rt+1), ledit état modifié (st+1) devenant alors l’état courant (st) de l’itération suivante,- une deuxième phase de fonctionnement (PH2), dite « phase d’apprentissage par imitation », dans laquelle le calculateur (20) modifie la fonction de commande principale (π) afin de minimiser la différence entre la commande experte (ut(exp)) et une commande dite « principale » (ut), à partir des transitions enregistrées dans la première phase de fonctionnement (PH1), et dans laquelle la fonction de commande experte (πexp) contrôle le fonctionnement du système (5),
- une troisième phase de fonctionnement (PH3), dite « autonome », dans laquelle le calculateur (20) exécute la fonction de commande principale (π) modifiée lors de la deuxième phase de fonctionnement (PH2) afin de contrôler le fonctionnement du système (5), et dans laquelle le calculateur (20) détermine la commande principale (ut) et évalue s’il est pertinent que la fonction de commande principale (π) imite la fonction de commande experte (πexp) ou non.
- Procédé selon la revendication 1, dans lequel lors de la première phase de fonctionnement (PH1), un bruit dit « d’exploration » est ajouté à une commande experte (ut(exp)), générée à partir de la fonction de commande experte (πexp) et d’un état courant (st).
- Procédé selon la revendication précédente, dans lequel le bruit d’exploration est défini comme un signal ajouté à la commande experte (ut(exp)) et permettant de faire varier ladite commande experte (ut(exp)).
- Procédé selon l’une quelconque des revendications précédentes, dans lequel la troisième phase de fonctionnement (PH3) comprend un premier mode de fonctionnement, dans lequel le système (5) fonctionne sans utiliser les transitions enregistrées, uniquement selon une fonction d’estimation de la performance thermique du système (5) et la fonction de commande principale (π) générées à l’issue de la deuxième phase de fonctionnement (PH2).
- Procédé selon l’une quelconque des revendications précédentes, dans lequel la troisième phase de fonctionnement (PH3) comprend un deuxième mode de fonctionnement, dans lequel la fonction de commande principale (π) agit sur le système (5) selon la fonction de commande experte (πexp) générée à l’issue de la première phase de fonctionnement (PH1) pour l’ensemble des transitions enregistrées en mémoire (MEM).
- Procédé selon l’une quelconque des revendications précédentes, dans lequel la troisième phase de fonctionnement (PH3) comprend un troisième mode de fonctionnement, dans lequel, le calculateur (20) détermine si la fonction de commande principale (π) doit agir selon la fonction de commande experte (πexp) pour un état courant (st) d’une transition enregistrée en mémoire (MEM), en fonction de l’estimation de la performance thermique du système (5).
- Calculateur (20) de contrôle thermique d’un moteur (10) de véhicule, ledit véhicule comprenant un dispositif de refroidissement (30) du moteur (10), ledit dispositif de refroidissement (30) comprenant au moins un actionneur (310) permettant de faire varier la capacité de refroidissement du moteur (10), ledit calculateur (20) étant adapté pour contrôler ledit au moins un actionneur (310) à l’aide d’une commande (ut, ut(exp)), comprenant et mettant en œuvre une fonction de commande principale (π) et une fonction de commande experte (πexp), et comprenant une mémoire (MEM) dans laquelle sont enregistrées des transitions permettant de déterminer la commande (ut) à envoyer au dispositif de refroidissement (30) en fonction de l’état courant (st), désignant l’état de fonctionnement, d’un système (5) thermique comprenant le dispositif de refroidissement (30) et le moteur (10) afin de réaliser le contrôle thermique du moteur (10), ledit calculateur (20) étant caractérisé en ce qu’il est configuré pour mettre en œuvre le procédé selon l’une des revendications 1 à 6.
- Calculateur (20) selon la revendication précédente, ledit calculateur (20) étant configuré pour, lors de la première phase de fonctionnement (PH1), ajouter un bruit dit « d’exploration » à une commande experte (ut(exp)) générée à partir de la fonction de commande experte (πexp) et d’un état courant (st).
- Calculateur (20) selon la revendication précédente, dans lequel le bruit d’exploration est défini comme un signal ajouté à la commande experte (ut(exp)) et permettant de faire varier ladite commande experte (ut(exp)).
- Véhicule, notamment automobile, comprenant un moteur (10), un dispositif de refroidissement (30), comprenant au moins un actionneur (310) permettant de faire varier la capacité de refroidissement dudit moteur (10), et un calculateur (20) selon l’une quelconque des revendications 7 à 9.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1906231A FR3097265B1 (fr) | 2019-06-12 | 2019-06-12 | Procédé de contrôle thermique d’un moteur |
PCT/EP2020/065600 WO2020249477A1 (fr) | 2019-06-12 | 2020-06-05 | Procédé de contrôle thermique d'un moteur |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1906231 | 2019-06-12 | ||
FR1906231A FR3097265B1 (fr) | 2019-06-12 | 2019-06-12 | Procédé de contrôle thermique d’un moteur |
Publications (2)
Publication Number | Publication Date |
---|---|
FR3097265A1 true FR3097265A1 (fr) | 2020-12-18 |
FR3097265B1 FR3097265B1 (fr) | 2021-05-21 |
Family
ID=67742817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR1906231A Active FR3097265B1 (fr) | 2019-06-12 | 2019-06-12 | Procédé de contrôle thermique d’un moteur |
Country Status (2)
Country | Link |
---|---|
FR (1) | FR3097265B1 (fr) |
WO (1) | WO2020249477A1 (fr) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19902923A1 (de) * | 1999-01-26 | 2000-08-03 | Daimler Chrysler Ag | Verfahren zur Funktionsüberwachung eines Kühlsystems einer Brennkraftmaschine |
EP2944786A1 (fr) * | 2014-05-17 | 2015-11-18 | MAN Truck & Bus AG | Procédé de commande ou de réglage pour un véhicule automobile |
CN109515165A (zh) * | 2018-11-30 | 2019-03-26 | 北京新能源汽车股份有限公司 | 一种电机冷却恒温控制方法及装置 |
-
2019
- 2019-06-12 FR FR1906231A patent/FR3097265B1/fr active Active
-
2020
- 2020-06-05 WO PCT/EP2020/065600 patent/WO2020249477A1/fr active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19902923A1 (de) * | 1999-01-26 | 2000-08-03 | Daimler Chrysler Ag | Verfahren zur Funktionsüberwachung eines Kühlsystems einer Brennkraftmaschine |
EP2944786A1 (fr) * | 2014-05-17 | 2015-11-18 | MAN Truck & Bus AG | Procédé de commande ou de réglage pour un véhicule automobile |
CN109515165A (zh) * | 2018-11-30 | 2019-03-26 | 北京新能源汽车股份有限公司 | 一种电机冷却恒温控制方法及装置 |
Non-Patent Citations (1)
Title |
---|
IVAN F WILDE: "NEURAL NETWORKS Contents", 26 February 2013 (2013-02-26), XP055187105, Retrieved from the Internet <URL:https://web.archive.org/web/20130226112608/http://homepage.ntlworld.com/ivan.wilde/notes/nn/nnnotespdf.pdf> [retrieved on 20150430] * |
Also Published As
Publication number | Publication date |
---|---|
WO2020249477A1 (fr) | 2020-12-17 |
FR3097265B1 (fr) | 2021-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020144292A1 (fr) | Contrôle thermique pour moteur de véhicule | |
EP2609473B1 (fr) | Procede de determination de parametres de regulation d'un systeme hvac | |
EP3314337B1 (fr) | Procédé de commande d'un facteur d'équivalence énergétique pour un véhicule automobile hybride | |
FR2954462A1 (fr) | Optimisation d'une capacite de chauffage globale d'un systeme de climatisation | |
FR3097265A1 (fr) | Procédé de contrôle thermique d’un moteur | |
WO2024069079A1 (fr) | Procédé de commande d'un système mécatronique | |
EP1462815B1 (fr) | Système et procédé de détermination de l'état de charge instantané d'une batterie, et utilisation de ce procédé dans un gestionnaire de charge | |
EP3120012B1 (fr) | Procédé de gestion du fonctionnement d'un demarreur d'un moteur thermique afin d'éviter une éventuelle surchauffe pendant le démarrage | |
EP3847520A1 (fr) | Procédé et système de pilotage et de régulation d'un système de chauffage d'un local | |
FR3018556B1 (fr) | Methode de prediction de l'etat thermique d'un demarreur | |
FR2989113A1 (fr) | Estimation d'une temperature virtuelle dans un moteur | |
EP2834490B1 (fr) | Estimation de l'etat thermique d'un moteur | |
FR2997233A1 (fr) | Gestion de batterie d'un vehicule non branche a une source d'energie externe | |
FR3099972A1 (fr) | Procédé de gestion d’un couple à fournir par un moteur électrique | |
FR3043432A1 (fr) | Procede et dispositif d'ajustement de valeurs de consigne d'une pluralite de geometries variables determinees d'une turbomachine | |
WO2023209050A1 (fr) | Modèle prédictif issu d'un apprentissage machine pour la prédiction de température d'un équipement | |
FR3012882A1 (fr) | Procede d'essai technique | |
EP3559688A1 (fr) | Caractérisation perfectionnée d'un dispositif électrochimique en opération pour un pronostic de fonctionnement futur du dispositif | |
CA3159341C (fr) | Procede de commande d'un actionneur de systeme mecanique a frottements imbriques | |
Provase | Use of convolutional neural network for sensor modeling and on-board diagnostic | |
FR3102543A1 (fr) | Procédé et système de pilotage d’un système thermique d’un bâtiment | |
CN117722287A (zh) | 发动机的控制方法、发动机的控制装置与电子设备 | |
EP4357988A1 (fr) | Procédés de gestion de l'énergie d'au moins un équipement, dispositifs électroniques et produits programmes d'ordinateur correspondants | |
FR2989111A1 (fr) | Diagnostic de validite d'estimation de temperature | |
CN114562350A (zh) | 基于可变气门升程机构的控制方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PLFP | Fee payment |
Year of fee payment: 2 |
|
PLSC | Publication of the preliminary search report |
Effective date: 20201218 |
|
PLFP | Fee payment |
Year of fee payment: 3 |
|
PLFP | Fee payment |
Year of fee payment: 4 |
|
PLFP | Fee payment |
Year of fee payment: 5 |
|
TP | Transmission of property |
Owner name: CONTINENTAL AUTOMOTIVE TECHNOLOGIES GMBH, DE Effective date: 20230807 |
|
PLFP | Fee payment |
Year of fee payment: 6 |