WO2020249477A1 - Procédé de contrôle thermique d'un moteur - Google Patents

Procédé de contrôle thermique d'un moteur Download PDF

Info

Publication number
WO2020249477A1
WO2020249477A1 PCT/EP2020/065600 EP2020065600W WO2020249477A1 WO 2020249477 A1 WO2020249477 A1 WO 2020249477A1 EP 2020065600 W EP2020065600 W EP 2020065600W WO 2020249477 A1 WO2020249477 A1 WO 2020249477A1
Authority
WO
WIPO (PCT)
Prior art keywords
expert
command
engine
thermal
phase
Prior art date
Application number
PCT/EP2020/065600
Other languages
English (en)
Inventor
Michel POVLOVITSCH SEIXAS
Julien Métayer
Mariano Sans
Original Assignee
Continental Automotive Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Continental Automotive Gmbh filed Critical Continental Automotive Gmbh
Publication of WO2020249477A1 publication Critical patent/WO2020249477A1/fr

Links

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F01MACHINES OR ENGINES IN GENERAL; ENGINE PLANTS IN GENERAL; STEAM ENGINES
    • F01PCOOLING OF MACHINES OR ENGINES IN GENERAL; COOLING OF INTERNAL-COMBUSTION ENGINES
    • F01P7/00Controlling of coolant flow
    • F01P7/02Controlling of coolant flow the coolant being cooling-air
    • F01P7/04Controlling of coolant flow the coolant being cooling-air by varying pump speed, e.g. by changing pump-drive gear ratio
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K11/00Arrangement in connection with cooling of propulsion units
    • B60K11/08Air inlets for cooling; Shutters or blinds therefor
    • B60K11/085Air inlets for cooling; Shutters or blinds therefor with adjustable shutters or blinds
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F01MACHINES OR ENGINES IN GENERAL; ENGINE PLANTS IN GENERAL; STEAM ENGINES
    • F01PCOOLING OF MACHINES OR ENGINES IN GENERAL; COOLING OF INTERNAL-COMBUSTION ENGINES
    • F01P7/00Controlling of coolant flow
    • F01P7/02Controlling of coolant flow the coolant being cooling-air
    • F01P7/10Controlling of coolant flow the coolant being cooling-air by throttling amount of air flowing through liquid-to-air heat exchangers
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F01MACHINES OR ENGINES IN GENERAL; ENGINE PLANTS IN GENERAL; STEAM ENGINES
    • F01PCOOLING OF MACHINES OR ENGINES IN GENERAL; COOLING OF INTERNAL-COMBUSTION ENGINES
    • F01P7/00Controlling of coolant flow
    • F01P7/14Controlling of coolant flow the coolant being liquid
    • F01P7/16Controlling of coolant flow the coolant being liquid by thermostatic control
    • F01P7/164Controlling of coolant flow the coolant being liquid by thermostatic control by varying pump speed
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K1/00Arrangement or mounting of electrical propulsion units
    • B60K2001/003Arrangement or mounting of electrical propulsion units with means for cooling the electrical propulsion units
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F01MACHINES OR ENGINES IN GENERAL; ENGINE PLANTS IN GENERAL; STEAM ENGINES
    • F01PCOOLING OF MACHINES OR ENGINES IN GENERAL; COOLING OF INTERNAL-COMBUSTION ENGINES
    • F01P7/00Controlling of coolant flow
    • F01P7/14Controlling of coolant flow the coolant being liquid
    • F01P2007/146Controlling of coolant flow the coolant being liquid using valves
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F01MACHINES OR ENGINES IN GENERAL; ENGINE PLANTS IN GENERAL; STEAM ENGINES
    • F01PCOOLING OF MACHINES OR ENGINES IN GENERAL; COOLING OF INTERNAL-COMBUSTION ENGINES
    • F01P2023/00Signal processing; Details thereof
    • F01P2023/08Microprocessor; Microcomputer
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/02Circuit arrangements for generating control signals
    • F02D41/14Introducing closed-loop corrections
    • F02D41/1401Introducing closed-loop corrections characterised by the control or regulation method
    • F02D41/1405Neural network control
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/80Technologies aiming to reduce greenhouse gasses emissions common to all road transportation technologies
    • Y02T10/88Optimized components or subsystems, e.g. lighting, actively controlled glasses

Definitions

  • TITLE Process for thermal control of an engine
  • the invention relates to a method for optimizing thermal control of a vehicle electric motor, a system for implementing this method and a vehicle comprising such a system.
  • the invention aims in particular to optimize the thermal control of an electric vehicle motor in order to reduce its consumption.
  • the cooling device comprises a monitoring module and a control module.
  • the monitoring module determines the state of the engine, cooling device and surrounding engine equipment while the control module determines the command to be sent to the actuator based on the states determined by the monitoring module.
  • control module can test several actuator commands established from combinations of states in order to determine the command making it possible to optimize the operation of the engine in a given combination of states. These many iterations can be time consuming, preventing the optimum and rapid operation of the cooling device, which in particular consumes a significant amount of energy, since the cooling device must be powered throughout the duration of the tests.
  • the invention firstly relates to a method for optimizing the thermal control of a vehicle engine, said vehicle comprising an engine cooling device, said cooling device comprising at least one actuator making it possible to vary the cooling capacity of the engine, the method is implemented by a computer, adapted to control said at least one actuator using a command, said computer comprising and implementing a control function main and a predetermined expert control function and comprising a memory in which are stored transitions making it possible to determine the command to be sent to the cooling device according to the current state, designating the operating state, of a thermal system comprising the cooling device and the engine in order to carry out thermal control of the engine, said method being remarkable in that it comprises makes the training of a learning algorithm comprising the iterative implementation of the following phases:
  • thermodynamic engine reward function of a modified thermal reward value from the modified state of the thermal system, and from said expert control
  • transition comprising the current state, the expert command applied, also called “demonstration”, the modified state and the modified thermal reward, said modified state then becoming the state current of the next iteration
  • second phase of operation called “learning by imitation”
  • the computer modifies the main control function in order to minimize the difference between the expert control and the main control, from the transitions recorded in the first phase of operation, and in which the expert control function controls the operation of the system
  • a third phase of operation called “autonomous” in which the computer performs the main control function modified during the second phase of operation in order to controlling the operation of the system, and in which the computer determines the main control and judges whether it is relevant whether the main control function mimics the expert control function or not.
  • the method according to the invention advantageously makes it possible to carry out a more stable and reliable learning thanks in particular to the implementation of the exploration phase making it possible to test the system from the application of an expert control function relevant before implementing the learning phase.
  • learning is faster.
  • the iteration learning phase allows the main control function to quickly gain experience of the expert control function and thus avoid unnecessary experimentation and iterations.
  • the main control function converges more quickly and stably to its optimal operation, allowing the complexity of the system to be controlled to be managed and learned.
  • a so-called "exploration" noise is added to an expert command, generated from the expert control function and from a current state.
  • the exploration noise is defined as a signal added to the expert control and making it possible to vary said expert control.
  • the third operating phase of the method comprises a first operating mode, in which the system operates without using the recorded transitions, only according to a function of estimating the thermal performance of the system and the main control function generated. at the end of the second phase of operation. [0015]
  • the transitions recorded at the end of the first operating phase for the execution of the second operating phase are never used in the third operating phase.
  • the third operating phase of the method comprises a second operating mode, in which the main control function acts on the system according to the expert control function generated at the end of the first operating phase for the 'set of transitions stored in memory.
  • the third operating phase of the method comprises a third operating mode, in which the computer determines whether or not the main control function must act according to the expert control function for a current state of a transition stored in memory, based on the thermal performance estimate of the system, and is configured to implement a different and more appropriate command from the command given by the expert control function if applicable.
  • the invention also relates to a thermal control computer for a vehicle engine, said vehicle comprising an engine cooling device, said cooling device comprising at least one actuator making it possible to vary the cooling capacity of the engine, said computer being adapted to control said at least one actuator by means of a command, comprising and implementing a main control function and an expert control function, and comprising a memory in which are recorded transitions making it possible to determine the command to be sent to the cooling device as a function of the current state, designating the operating state, of a thermal system comprising the cooling device and the engine in order to carry out the thermal control of the engine, said computer being remarkable in terms of what it is configured to implement the method as presented above.
  • the computer is configured to, during the first phase of operation, add a so-called "exploration" noise to an expert command generated from the expert command function and a current state.
  • the operating noise is defined as a signal added to the expert control and making it possible to vary said expert control.
  • the invention also relates to a vehicle, in particular a motor vehicle, comprising an engine, a cooling device, comprising at least one actuator making it possible to varying the cooling capacity of said engine, and a computer such as presented above.
  • Figure 1 shows the thermal system of a vehicle engine according to one embodiment of the invention
  • FIG. 2 represents the first phase of operation of the method of optimizing thermal control of a vehicle engine according to the invention
  • FIG. 3 represents the second operating phase of the method of optimizing thermal control of a vehicle engine according to the invention
  • FIG. 4 represents the second operating mode of the third operating phase of the method for optimizing thermal control of a vehicle engine according to the invention
  • FIG. 5 represents the third mode of operation of the third phase of operation of the method for optimizing thermal control of a vehicle engine according to the invention.
  • a motor vehicle will now be described comprising a cooling device according to the invention.
  • the invention will be described in the case of a motor vehicle but could relate to any type of vehicle comprising an electric motor.
  • the vehicle comprises a thermal system 5 comprising an electric motor 10, a computer 20, a cooling device 30 of said engine 10 and surrounding equipment 40 of said engine 10.
  • the cooling device 30 comprises an actuator 310, adapted to vary a cooling capacity of the motor 10. It will be noted that, in another embodiment, the cooling device 30 could comprise several actuators 310.
  • the computer 20 is adapted to receive information on the state of the engine 10, the cooling device 30 and the surrounding equipment 40. These information can for example be measured by one or more sensors of the vehicle such as for example a temperature, speed or humidity sensor.
  • the equipment 40 located in the environment of the engine 10 can in particular be one or more equipment 40 from the following: an inverter, a battery, a pump, a valve, a grid, a fan, a radiator, pipes of 'coolant flows, etc.
  • the computer 20 is also suitable for controlling the actuator 310 by applying commands (denoted u t or hereinafter u t (exP) ) sent to the cooling device 30 and acting on the actuator 310.
  • commands denoted u t or hereinafter u t (exP)
  • u t exP
  • the components of each command u t , u t (exP) depend on the motor 10 and the surrounding equipment 40.
  • the cooling device 30 can be made up of all types of components, alone or in combination, making it possible to cool an engine 10 of a vehicle. Indeed, the optimization of the thermal control of a vehicle engine 10 not being specific to a type of cooling device 30, all the combinations of cooling components are considered.
  • the cooling device 30 comprises a pump which transmits a cooling liquid to the engine 10
  • the command u t , u t (ex) of the pump can be a modification of the flow rate of the pump.
  • the cooling device 30 comprises a valve opening to the outside and the control of which u t , u t (exP) consists of opening or closing the valve at a certain angle.
  • the cooling device 30 comprises a fan comprising blades and the command u t , u t (exP) consists in activating the blades of the fan at a determined speed in order to cool the motor 10.
  • the cooling device 30 comprises a grille and a radiator that the command u t , u t (exP) consists in opening or closing the grille, according to one position among a plurality of possible positions, to cool the radiator when the latter removes heat from the engine 10.
  • the invention does not however exclude the fact that the commands u t , u t (exP) defined in the preceding examples can be used simultaneously or combined in one way or another.
  • the pump, the valve, the fan, the grid and the radiator form an integral part of the cooling device 30 and are not considered to be several separate cooling devices 30.
  • the computer 20 can therefore determine a common command u t , u t (ex) , concerning several different elements of the same cooling device 30.
  • the computer 20 has a fast learning type architecture.
  • this architecture comprises a monitoring module 22, a main control module 21, a control module 23, an expert control module 24, representing a predetermined expert control function tt bcr of the architecture, and an exploration module N.
  • the computer 20 comprises a processor capable of implementing a set of instructions making it possible to perform these functions.
  • the monitoring module 22 evaluates the instantaneous impact of a command u t , u t (exP) on the system 5. To this end, the monitoring module 22 is configured to collect the data generated by the sensors in order to transmit them to the main control module 21.
  • the main control module 21 represents the actor of the architecture which determines and sends a so-called "main" command u t .
  • the control module 21 receives the current state s t from the system 5, from the data generated by the various sensors and collected by the monitoring module 22, and determines at least one main command u t to be performed, by applying a predetermined main control function, designated TT, to the current state s t .
  • Said main control function p therefore defines the command u t sent as a function of the current state s t of the system 5 and also defines a main control strategy.
  • this main control module 21 is implemented by an artificial neural network implementing the main control function TT.
  • the monitoring module 22 is configured to determine the modified state s t + i , in other words the new state of the system 5.
  • the monitoring module 22 is also configured to determine a modified thermal reward value r t + i , by application of a thermodynamic reward function.
  • Said modified thermal reward r t + i is defined as the quantity of internal entropy created during a state transition and various penalties linked to non-compliance with the constraints, said constraints being able for example to be linked to a temperature threshold maximum, at a maximum temporal variation of the temperature ...
  • a state transition comprises a first set of values describing an initial current state s t of the system 5, a command u t , u t (ex) applied, also called “ demonstration ”, a second set of values describing a modified state s t + i of the system 5 and a modified thermal reward r t + i .
  • the monitoring module 22 retrieves the information relating to the command u t sent by the main control module 21 and determines the modified state s t + i and the modified thermal reward r t + i in particular thanks to the equations of the thermodynamics.
  • the control module 23, called “critical" in the architecture, is configured to implement and update a function for estimating the thermal performance of the system 5.
  • Said function for estimating the thermal performance makes it possible to calculate the expected sum of all the modified thermal rewards r t + i obtained for a series of successive applications of the main control function p from a current state s t and a current thermal reward r t , corresponding to the thermal reward of the current operating state of the system 5.
  • This main control function p is advantageously implemented by an artificial neural network.
  • the control module 23 allows the cooling device 30 to operate optimally.
  • the transition module 25 represents the fact that the modified state s t + i , respectively the modified thermal reward r t + i , estimated after application of a command u t , u t (ex) then becomes the new current state s t of system 5, respectively the current thermal reward r t of system 5.
  • the expert control module 24 is configured to receive the current state s t of the system 5, and determines at least one so-called "expert" command u t (exP) to be performed, by applying an expert control function p bcr in the current state s t .
  • the expert control function p bcr comprises and defines predetermined expert control strategies making it possible to optimize the operation of the cooling device 30.
  • Said method comprises a first phase of operation PH1, called exploration of the behavior of the expert control function p bcr , a second phase of operation PH2, called phase of learning by imitation, and a third phase of operation PH3 called autonomous.
  • the predetermined expert control strategies of the computer 20 are simulated by iteration. This allows the main control module 21 and the control module 23 to acquire the experience and behavior provided by the expert control module 24.
  • the exploration phase PH1 comprises a step of determining at least one expert command u t (exP) of at least one actuator 310 in a current state s t of the thermal system 5 and implementation of said expert control u t (exP) by application of the expert control function p bcr allowing control of the system 5 via the actuator 310.
  • the expert control strategies of the expert control module 24 are executed by applying the expert control function p bcr , in particular by randomly adding a variable exploration noise, via the exploration module N, to the expert command u t (ex) , in order to also execute in the vicinity of the control path of the expert command u t (ex) .
  • the addition of the exploration noise to the expert command u t (ex) is also random so as to sometimes execute an expert command u t (ex) without noise and sometimes an expert command u t (ex) with noise.
  • an executed noisy expert action defined as an action of the system 5 due to the application of an expert command u t (ex) noisy
  • ten executed expert actions defined as actions of the system 5 due to the application of an expert command u t (ex) not noisy.
  • the added exploration noise makes it possible to improve the thermal efficiency of the cooling device 30 and makes it possible to learn possible actions which further optimize the operation of the thermal system.
  • the exploration phase PH1 then comprises a step of determining a modified state s t + i of the thermal system 5 after the implementation of said expert command u t (ex) . It is in particular the monitoring module 22 which determines the modified state s t + i , in other words the new state, of the thermal system 5.
  • the exploration phase PH1 also comprises a step of calculating, by the implementation of the thermodynamic reward function, executed by the monitoring module 22, of a modified thermal reward value r t + i from of the modified state s t + i of the thermal system, and of said expert control u t (ex) .
  • the monitoring module 22 determines a modified thermal reward value r t + i associated with the state transition of the thermal system 5 observed from the given current state s t to the modified state s t + i .
  • the exploration phase PH1 then comprises a step of recording in a memory MEM of the assembly, called "transition", comprising the current state s t , the expert command u t (exP) applied, the modified state s t + i and the modified thermal reward r t + i , said modified state s t + i then becoming the current state s t of the following iteration.
  • transition a step of recording in a memory MEM of the assembly, called "transition”, comprising the current state s t , the expert command u t (exP) applied, the modified state s t + i and the modified thermal reward r t + i , said modified state s t + i then becoming the current state s t of the following iteration.
  • the memory MEM comprises an expert memory MEM1 and a so-called “repetition” (or replay) memory MEM2.
  • the expert memory MEM1 the expert transitions without the addition of exploration noise are recorded, in other words, the transitions originating from a direct experiment of the expert control function p bcr .
  • the repetition memory MEM2 the transitions comprising an addition of exploration noise are recorded, notably allowing the updating of the thermal performance estimation function during the third operating phase PH3, called autonomous, described in the following paragraphs.
  • the parameters of the main control function p of the main control module 21 are modified so as to minimize the difference between the main control u t proposed and the expert command u t (exP) for the same given current state s t .
  • the main control module 21 uses the transitions recorded in the expert memory MEM1.
  • a comparator is used in order to verify that the main command u t converges towards the expert command u t (ex) .
  • An LBC signal is used to define the difference between the main command u t and the expert command u t (ex) .
  • the modification of the parameters of the main control function p of the main control module 21 is executed so as to minimize this difference on the set of transitions stored in the expert memory MEM1.
  • the transitions stored in the expert memory MEM 1 are used for the modification and / or the update of the main control function TT.
  • the control module 23 is driven to estimate the thermal performance of the system by following the expert control function p bcr from a given current state s t .
  • the updating of the thermal performance estimation function is made from the transitions recorded in the expert memory MEM 1 and in the repetition memory MEM2 in particular by applying the recursive relationship known as “Bellman by bootstrap”, as described in the publication “Continous Control With Deep Reinforcement Learning” (Lillicrap and al, 2015).
  • the second phase of operation PH2 is completed when the difference defined between an expert command u t (exP) , executed by the expert command function p bcr, stored in the expert memory MEM1, and a main command u t proposed by the main control module 21, for the same current state s t of the system 5, has reached a minimum precision.
  • the second phase of operation PH2 allows the main control function p to be able to effectively control the operation of the thermal system 5, via the actuator 310.
  • This third phase of operation PH3 can include three operating modes allowing control of the system 5 by the main control function p via the actuator 310.
  • FIG. 4 there is shown a second mode of operation of the phase of autonomous operation PH3 in which the expert control module 24 is active and, if the system 5 operates according to a current state s t known by the expert control function p bcr of the expert control module 24, then the main control module 21 operates as the expert control function p bcr of the expert control module 24 recommends.
  • FIG. 5 there is shown a third operating mode of the autonomous operating phase PH3 in which the expert control module 24 is active.
  • the control module 23 can decide not to operate the main control module 21 such as the expert control function p bcr recommends it, in particular when the control module 23 considers that the operation proposed by the expert control function p bcr is not optimal.

Abstract

L'invention concerne un procédé d'optimisation du contrôle thermique d'un moteur (10) de véhicule, ledit véhicule comprenant un dispositif de refroidissement (30) du moteur (10), ledit dispositif de refroidissement (30) comprenant au moins un actionneur (310) permettant de faire varier la capacité de refroidissement du moteur (10). Le procédé est mis en œuvre par un calculateur (20), adapté pour contrôler ledit au moins un actionneur (310) à l'aide d'une commande (u(t)), afin de réaliser le contrôle thermique du moteur (10). Le procédé comprend une première phase de fonctionnement, dite « d'exploration », une deuxième phase de fonctionnement, dite « phase d'apprentissage par imitation », et une troisième phase de fonctionnement, dite « autonome ».

Description

DESCRIPTION
TITRE : Procédé de contrôle thermique d’un moteur
[Domaine technique]
[0001] L’invention concerne un procédé d’optimisation de contrôle thermique d’un moteur électrique de véhicule, un système pour la mise en œuvre de ce procédé ainsi qu’un véhicule comprenant un tel système.
[0002] L’invention vise notamment à optimiser le contrôle thermique d’un moteur électrique de véhicule afin d’en réduire la consommation.
[Etat de la technique antérieure]
[0003] Dans un véhicule automobile électrique ou hybride, il est connu de contrôler la température du moteur électrique afin d’augmenter à la fois la longévité et les performances dudit moteur. En effet, il est connu que la chaleur peut entraîner une déformation des matériaux et endommager les composants électroniques du moteur ou des équipements environnants du moteur, ce qui en réduit la durée de vie.
[0004] En outre, il est important de pouvoir optimiser le contrôle thermique du moteur afin de pouvoir le maintenir dans une plage de températures acceptables, tout en limitant la consommation d’énergie électrique induite par ce contrôle thermique afin d’optimiser l’autonomie du véhicule.
[0005] Ainsi, plusieurs approches sont considérées aujourd’hui pour effectuer le contrôle thermique d’un moteur électrique de véhicule. Elles sont mises en œuvre par un dispositif de refroidissement comprenant un actionneur adapté pour faire varier la capacité de refroidissement du moteur lorsque cet actionneur est commandé par ledit dispositif de refroidissement.
[0006] Dans une solution singulière connue et basée sur des réseaux de neurones, le dispositif de refroidissement comprend un module de surveillance et un module de commande. Le module de surveillance détermine l’état du moteur, du dispositif de refroidissement et des équipements environnants du moteur tandis que le module de commande détermine la commande à envoyer à l’actionneur en fonction des états déterminés par le module de surveillance.
[0007] Dans cette solution, le module de commande peut tester plusieurs commandes de l’actionneur établies à partir de combinaisons d’états afin de déterminer la commande permettant d’optimiser le fonctionnement du moteur dans une combinaison d’états donnée. Ces nombreuses itérations peuvent être coûteuses en temps, empêchant alors le fonctionnement optimal et rapide du dispositif de refroidissement, ce qui consomme notamment une quantité notable d’énergie, puisque le dispositif de refroidissement doit être alimenté pendant toute la durée des tests.
[0008] Il existe donc le besoin d’une solution fiable et optimisée pour remédier au moins en partie à ces inconvénients.
[Exposé de l’invention]
[0009] A cette fin, l’invention a tout d’abord pour objet un procédé d’optimisation du contrôle thermique d’un moteur de véhicule, ledit véhicule comprenant un dispositif de refroidissement du moteur, ledit dispositif de refroidissement comprenant au moins un actionneur permettant de faire varier la capacité de refroidissement du moteur , le procédé est mis en œuvre par un calculateur, adapté pour contrôler ledit au moins un actionneur à l’aide d’une commande, ledit calculateur comprenant et mettant en œuvre une fonction de commande principale et une fonction de commande experte prédéterminées et comprenant une mémoire dans laquelle sont enregistrées des transitions permettant de déterminer la commande à envoyer au dispositif de refroidissement en fonction de l’état courant, désignant l’état de fonctionnement, d’un système thermique comprenant le dispositif de refroidissement et le moteur afin de réaliser le contrôle thermique du moteur, ledit procédé étant remarquable en ce qu’il comprend l’entrainement d’un algorithme d’apprentissage comprenant la mise en œuvre itérative des phases suivantes :
a) une première phase de fonctionnement, dite « d’exploration », dans laquelle la fonction de commande experte contrôle le fonctionnement du système est exécutée par itération, chaque itération comportant une étape de:
- détermination d’au moins une commande dite « experte » de l’au moins un actionneur par application de la fonction de commande experte à l’état courant du système thermique et mise en œuvre de ladite fonction de commande experte,
- détermination d’un état modifié du système thermique après la mise en œuvre de ladite commande experte,
- calcul, par la mise en œuvre d’une fonction de récompense thermodynamique du moteur, d’une valeur de récompense thermique modifiée à partir de l’état modifié du système thermique, et de ladite commande experte,
- enregistrement dans la mémoire de l’ensemble, appelé « transition », comprenant l’état courant, la commande experte appliquée, également nommée « démonstration », l’état modifié et la récompense thermique modifiée, ledit état modifié devenant alors l’état courant de l’itération suivante, b) une deuxième phase de fonctionnement, dite « d’apprentissage par imitation », dans laquelle le calculateur modifie la fonction de commande principale afin de minimiser la différence entre la commande experte et la commande principale, à partir des transitions enregistrées dans la première phase de fonctionnement, et dans laquelle la fonction de commande experte contrôle le fonctionnement du système, c) une troisième phase de fonctionnement, dite « autonome », dans laquelle le calculateur exécute la fonction de commande principale modifiée lors de la deuxième phase de fonctionnement afin de contrôler le fonctionnement du système, et dans laquelle le calculateur détermine la commande principale et évalue s’il est pertinent que la fonction de commande principale imite la fonction de commande experte ou non.
[0010] Le procédé selon l’invention permet avantageusement de réaliser un apprentissage plus stable et fiable grâce notamment à la mise en œuvre de la phase d’exploration permettant de tester le système à partir de l’application d’une fonction de commande experte pertinente avant de mettre en œuvre la phase d’apprentissage. De plus, l’apprentissage est plus rapide. En effet, la phase d’apprentissage par itération permet à la fonction de commande principale d’acquérir rapidement l’expérience de la fonction de commande experte et ainsi d’éviter des expérimentations et des itérations inutiles. Ainsi, la fonction de commande principale converge plus rapidement et de façon stable vers son fonctionnement optimal, permettant de gérer et d’apprendre la complexité du système à contrôler.
[0011] De manière avantageuse, lors de la première phase de fonctionnement du procédé, un bruit dit « d’exploration » est ajouté à une commande experte, générée à partir de la fonction de commande experte et d’un état courant.
[0012] L’ajout d’un tel bruit d’exploration permet de modifier la commande experte et donc de modifier l’action réalisée par l’actionneur de manière à déterminer des transitions pour différentes commandes expertes.
[0013] De manière préférée, le bruit d’exploration est défini comme un signal ajouté à la commande experte et permettant de faire varier ladite commande experte.
[0014] Avantageusement, la troisième phase de fonctionnement du procédé comprend un premier mode de fonctionnement, dans lequel le système fonctionne sans utiliser les transitions enregistrées, uniquement selon une fonction d’estimation de la performance thermique du système et la fonction de commande principale générées à l’issue de la deuxième phase de fonctionnement. [0015] Ainsi, les transitions enregistrées à l’issu de la première phase de fonctionnement pour l’exécution de la deuxième phase de fonctionnement ne sont jamais utilisées dans la troisième phase de fonctionnement.
[0016] De préférence, la troisième phase de fonctionnement du procédé comprend un deuxième mode de fonctionnement, dans lequel la fonction de commande principale agit sur le système selon la fonction de commande experte générée à l’issue de la première phase de fonctionnement pour l’ensemble des transitions enregistrées en mémoire.
[0017] De manière préférée, la troisième phase de fonctionnement du procédé comprend un troisième mode de fonctionnement, dans lequel, le calculateur détermine si la fonction de commande principale doit agir ou non selon la fonction de commande experte pour un état courant d’une transition enregistrée en mémoire, en fonction de l’estimation de la performance thermique du système, et est configuré pour mettre en œuvre une commande différente et davantage adaptée de la commande donnée par la fonction de commande experte le cas échéant.
[0018] L’invention concerne également un calculateur de contrôle thermique d’un moteur de véhicule, ledit véhicule comprenant un dispositif de refroidissement du moteur, ledit dispositif de refroidissement comprenant au moins un actionneur permettant de faire varier la capacité de refroidissement du moteur, ledit calculateur étant adapté pour contrôler ledit au moins un actionneur à l’aide d’une commande, comprenant et mettant en œuvre une fonction de commande principale et une fonction de commande experte, et comprenant une mémoire dans laquelle sont enregistrées des transitions permettant de déterminer la commande à envoyer au dispositif de refroidissement en fonction de l’état courant, désignant l’état de fonctionnement, d’un système thermique comprenant le dispositif de refroidissement et le moteur afin de réaliser le contrôle thermique du moteur, ledit calculateur étant remarquable en ce qu’il est configuré pour mettre en œuvre le procédé tel que présenté précédemment.
[0019] De préférence, le calculateur est configuré pour, lors de la première phase de fonctionnement, ajouter un bruit dit « d’exploration » à une commande experte générée à partir de la fonction de commande experte et d’un état courant.
[0020] De manière préférée, le bruit d’exploitation est défini comme un signal ajouté à la commande experte et permettant de faire varier ladite commande experte.
[0021] L’invention concerne aussi un véhicule, notamment automobile, comprenant un moteur, un dispositif de refroidissement, comprenant au moins un actionneur permettant de faire varier la capacité de refroidissement dudit moteur, et un calculateur tel que présenté ci-avant.
[Description des dessins]
[0022] D’autres caractéristiques et avantages de l’invention apparaîtront encore à la lecture de la description qui va suivre. Celle-ci est purement illustrative et doit être lue en regard des dessins annexés sur lesquels :
[Fig. 1] : la figure 1 présente le système thermique d’un moteur de véhicule selon un mode de réalisation l’invention,
[Fig. 2] : la figure 2 représente la première phase de fonctionnement du procédé d’optimisation de contrôle thermique d’un moteur du véhicule selon l’invention,
[Fig. 3] : la figure 3 représente la deuxième phase de fonctionnement du procédé d’optimisation de contrôle thermique d’un moteur du véhicule selon l’invention,
[Fig. 4] : la figure 4 représente le deuxième mode de fonctionnement de la troisième phase de fonctionnement du procédé d’optimisation de contrôle thermique d’un moteur du véhicule selon l’invention,
[Fig. 5] : la figure 5 représente le troisième mode de fonctionnement de la troisième phase de fonctionnement du procédé d’optimisation de contrôle thermique d’un moteur du véhicule selon l’invention.
[Description des modes de réalisation]
[0023] DISPOSITIF
[0024] Il va maintenant être décrit un véhicule automobile comprenant un dispositif de refroidissement selon l’invention. L’invention sera décrite dans le cas d’un véhicule automobile mais pourrait concerner tout type de véhicule comprenant un moteur électrique.
[0025] En référence à la figure 1 , le véhicule comprend un système 5 thermique comportant un moteur 10 électrique, un calculateur 20, un dispositif de refroidissement 30 dudit moteur 10 et des équipements 40 environnants dudit moteur 10.
[0026] Le dispositif de refroidissement 30 comprend un actionneur 310, adapté pour faire varier une capacité de refroidissement du moteur 10. On notera que, dans une autre forme de réalisation, le dispositif de refroidissement 30 pourrait comprendre plusieurs actionneurs 310.
[0027] Le calculateur 20 est adapté pour recevoir des informations sur l’état du moteur 10, du dispositif de refroidissement 30 et des équipements 40 environnants. Ces informations peuvent par exemple être mesurées par un ou plusieurs capteurs du véhicule tels que par exemple un capteur de température, de vitesse ou d’humidité.
[0028] Les équipements 40 situés dans l’environnement du moteur 10 peuvent notamment être un ou plusieurs équipements 40 parmi les suivants : un onduleur, une batterie, une pompe, une vanne, une grille, un ventilateur, un radiateur, des tuyaux d’écoulements du liquide de refroidissement, etc.
[0029] Le calculateur 20 est également adapté pour contrôler l’actionneur 310 par l’application de commandes (notées ut ou ci-après ut(exP)) envoyées au dispositif de refroidissement 30 et agissant sur l’actionneur 310. En effet, les composantes de chaque commande ut, ut(exP) dépendent du moteur 10 et des équipements 40 environnants.
[0030] Le dispositif de refroidissement 30 peut être composé de tous types de composants seuls ou combinés permettant de refroidir un moteur 10 de véhicule. En effet, l’optimisation du contrôle thermique d’un moteur 10 de véhicule n’étant pas propre à un type de dispositif de refroidissement 30, toutes les combinaisons de composants de refroidissement sont considérées.
[0031] Par exemple, si le dispositif de refroidissement 30 comprend une pompe qui fait transiter un liquide de refroidissement vers le moteur 10, la commande ut, ut(ex ) de la pompe peut être une modification du débit de la pompe. Un autre exemple est celui dans lequel le dispositif de refroidissement 30 comprend une vanne ouvrant sur l’extérieur et dont la commande ut, ut(exP) consiste à ouvrir ou fermer la vanne d’un certain angle. Dans une autre forme de réalisation, le dispositif de refroidissement 30 comprend un ventilateur comprenant des pâles et la commande ut, ut(exP) consiste à activer les pâles du ventilateur à une vitesse déterminée afin de refroidir le moteur 10. Il est également possible que le dispositif de refroidissement 30 comprenne une grille et un radiateur que la commande ut, ut(exP) consiste à ouvrir ou fermer la grille, selon une position parmi une pluralité de positions possibles, pour refroidir le radiateur lorsque celui-ci évacue la chaleur du moteur 10.
[0032] L’invention n’exclut cependant pas le fait que les commandes ut, ut(exP) définies dans les exemples précédents peuvent être utilisées simultanément ou combinées d’une manière ou d’une autre. Ainsi, la pompe, la vanne, le ventilateur, la grille et le radiateur font partie intégrante du dispositif de refroidissement 30 et ne sont pas considérées comme plusieurs dispositifs de refroidissement 30 distincts.
[0033] Le calculateur 20 peut donc déterminer une commande ut, ut(ex ) commune, concernant plusieurs éléments différents d’un même dispositif de refroidissement 30.
[0034] Le calculateur 20 présente une architecture du type apprentissage rapide. [0035] En référence aux figures 4 et 5, cette architecture comprend un module de surveillance 22, un module de commande principale 21 , un module de contrôle 23, un module de commande experte 24, représentant une fonction de commande experte ttbcr prédéterminée de l’architecture, et un module d’exploration N. A cette fin, le calculateur 20 comprend un processeur apte à mettre en œuvre un ensemble d’instructions permettant de réaliser ces fonctions.
[0036] Le module de surveillance 22 évalue l’impact instantané d’une commande ut, ut(exP) sur le système 5. A cette fin, le module de surveillance 22 est configuré pour collecter les données générées par les capteurs afin de les transmettre au module de commande principale 21.
[0037] Le module de commande principale 21 représente l’acteur de l’architecture qui détermine et envoie une commande dite « principale » ut. A cette fin, le module de commande 21 reçoit l’état courant st du système 5, à partir des données générées par les différents capteurs et collectées par le module de surveillance 22, et détermine au moins une commande principale ut à effectuer, par application d’une fonction de commande principale prédéterminée, désignée TT, à l’état courant st. Ladite fonction de commande principale p définit donc la commande ut envoyée en fonction de l’état courant st du système 5 et définit également une stratégie de contrôle principale. Avantageusement, ce module de commande principale 21 est mis en œuvre par un réseau de neurones artificiels implémentant la fonction de commande principale TT.
[0038] Le module de surveillance 22 est configuré pour déterminer l’état modifié st+i , autrement dit le nouvel état du système 5. Le module de surveillance 22 est également configuré pour déterminer une valeur de récompense thermique modifiée rt+i , par application d’une fonction de récompense thermodynamique. Ladite récompense thermique modifiée rt+i est définie comme la quantité d’entropie interne créée au cours d’une transition d’état et diverses pénalités liées au non-respect des contraintes, lesdites contraintes pouvant par exemple être liées à un seuil de température maximum, à une variation temporelle maximale de la température... Une transition d’état comprend un premier ensemble de valeurs décrivant un état courant st initial du système 5, une commande ut, ut(ex ) appliquée, également nommée « démonstration », un deuxième ensemble de valeurs décrivant un état modifié st+i du système 5 et une récompense thermique modifiée rt+i . Pour ce faire, le module de surveillance 22 récupère les informations concernant la commande ut envoyée par le module de commande principale 21 et détermine l’état modifié st+i et la récompense thermique modifiée rt+i notamment grâce aux équations de la thermodynamique. [0039] Le module de contrôle 23, appelé « critique » dans l’architecture, est configuré pour implémenter et mettre à jour une fonction d’estimation de la performance thermique du système 5. Ladite fonction d’estimation de la performance thermique permet de calculer la somme attendue de toutes les récompenses thermiques modifiées rt+i obtenues pour une série d’applications successives de la fonction de commande principale p à partir d’un état courant st et d’une récompense thermique courante rt, correspondant à la récompense thermique de l’état de fonctionnement actuel du système 5. Cette fonction de commande principale p est avantageusement mise en œuvre par un réseau de neurones artificiels. Ainsi, le module de contrôle 23 permet au dispositif de refroidissement 30 de fonctionner de façon optimale.
[0040] Le module de transition 25 représente le fait que l’état modifié st+i , respectivement la récompense thermique modifiée rt+i , estimé après application d’une commande ut, ut(ex ) devient ensuite le nouvel état courant st du système 5, respectivement la récompense thermique courante rt du système 5.
[0041] Le module de commande experte 24 est configuré pour recevoir l’état courant st du système 5, et détermine au moins une commande dite « experte » ut(exP) à effectuer, par application d’une fonction de commande experte pbcr à l’état courant st. La fonction de commande experte pbcr comprend et définit des stratégies de contrôle expertes prédéterminées permettant d’optimiser le fonctionnement du dispositif de refroidissement 30.
[0042] PROCEDE
[0043] En référence aux figures 2 à 5, il va maintenant être décrit le procédé d’optimisation de contrôle thermique d’un moteur 10 du véhicule selon un mode de réalisation. Ce procédé permet de contrôler le dispositif de refroidissement 30 du moteur 10 du véhicule de façon, d’une part, à maintenir le moteur 10 du véhicule dans une plage de températures acceptables, et d’autre part, de réduire autant que possible la consommation d’énergie électrique par le dispositif de refroidissement 30 du véhicule.
[0044] Ledit procédé comprend une première phase de fonctionnement PH1 , dite d’exploration du comportement de la fonction de commande experte pbcr, une deuxième phase de fonctionnement PH2, dite phase d’apprentissage par imitation, et une troisième phase de fonctionnement PH3 dite autonome.
[0045] PREMIERE PHASE DE FONCTIONNEMENT
[0046] En référence à la figure 2, lors de la première phase de fonctionnement PH1 , dite d’exploration, les stratégies de contrôle expertes prédéterminées du calculateur 20 sont simulées par itération. Cela permet au module de commande principale 21 et au module de contrôle 23 d’acquérir l’expérience et le comportement apportés par le module de commande experte 24.
[0047] Pour cela, la phase d’exploration PH1 comprend une étape de détermination d’au moins une commande experte ut(exP) d’au moins un actionneur 310 à un état courant st du système 5 thermique et mise en œuvre de ladite commande experte ut(exP) par application de la fonction de commande experte pbcr permettant le contrôle du système 5 via l’actionneur 310.
[0048] Ainsi, les stratégies de contrôle expertes du module de commande experte 24 sont exécutées par application de la fonction de commande experte pbcr, notamment en ajoutant aléatoirement un bruit d’exploration variable, via le module d’exploration N, à la commande experte ut(ex ), afin d’exécuter aussi dans le voisinage de la trajectoire de contrôle de la commande experte ut(ex ). L’ajout du bruit d’exploration à la commande experte ut(ex ) est également aléatoire de manière à exécuter parfois une commande experte ut(ex ) non bruitée et parfois une commande experte ut(ex ) bruitée. Par exemple, on peut ainsi obtenir, en moyenne, une action experte bruitée exécutée, définie comme une action du système 5 due à l’application d’une commande experte ut(ex ) bruitée, pour dix actions expertes exécutées, définies comme des actions du système 5 dues à l’application d’une commande experte ut(ex ) non bruitée. Le bruit d’exploration ajouté permet d’améliorer l’efficacité thermique du dispositif de refroidissement 30 et permet d’apprendre d’éventuelles actions optimisant davantage le fonctionnement du système 5 thermique.
[0049] La phase d’exploration PH1 comprend ensuite une étape de détermination d’un état modifié st+i du système 5 thermique après la mise en œuvre de ladite commande experte ut(ex ). C’est notamment le module de surveillance 22 qui détermine l’état modifié st+i , autrement dit le nouvel état, du système 5 thermique.
[0050] La phase d’exploration PH1 comprend également une étape de calcul, par la mise en œuvre de la fonction de récompense thermodynamique, exécutée par le module de surveillance 22, d’une valeur de récompense thermique modifiée rt+i à partir de l’état modifié st+i du système 5 thermique, et de ladite commande experte ut(ex ). Lors de cette étape, le module de surveillance 22 détermine une valeur de récompense thermique modifiée rt+i associée à la transition d’état du système 5 thermique observée de l’état courant st donné vers l’état modifié st+i .
[0051] La phase d’exploration PH1 comprend ensuite une étape d’enregistrement dans une mémoire MEM de l’ensemble, appelé « transition », comprenant l’état courant st, la commande experte ut(exP) appliquée, l’état modifié st+i et la récompense thermique modifiée rt+i , ledit état modifié st+i devenant alors l’état courant st de l’itération suivante.
[0052] La mémoire MEM comprend une mémoire experte MEM1 et une mémoire dite « de répétition » (ou replay) MEM2. Dans la mémoire experte MEM1 , sont enregistrées les transitions expertes sans ajout de bruit d’exploration, autrement dit, les transitions provenant d’une expérimentation directe de la fonction de commande experte pbcr. D’autre part, dans la mémoire de répétition MEM2, sont enregistrées les transitions comprenant un ajout de bruit d’exploration, permettant notamment la mise à jour de la fonction d’estimation de la performance thermique lors de la troisième phase de fonctionnement PH3, dite autonome, décrite dans les paragraphes suivants.
[0053] Ainsi, dans la mémoire MEM sont enregistrées à la fois des transitions d’état avec un ajout de bruit d’exploration et des transitions d’état sans ajout de bruit d’exploration.
[0054] DEUXIEME PHASE DE FONCTIONNEMENT
[0055] En référence à la figure 3, lors de la deuxième phase de fonctionnement PH2, les paramètres de la fonction de commande principale p du module de commande principale 21 sont modifiés de manière à minimiser la différence entre la commande principale ut proposée et la commande experte ut(exP) pour un même état courant st donné. Pour cela, le module de commande principale 21 utilise les transitions enregistrées dans la mémoire experte MEM1.
[0056] Afin de vérifier que la commande principale ut converge vers la commande experte ut(ex ), un comparateur est utilisé. Un signal LBC permet de définir la différence entre la commande principale ut et la commande experte ut(ex ). La modification des paramètres de la fonction de commande principale p du module de commande principale 21 est exécutée de manière à minimiser cette différence sur l’ensemble de transitions stockées dans la mémoire experte MEM1. Autrement dit, les transitions stockées dans la mémoire experte MEM 1 sont utilisées pour la modification et/ou la mise à jour de la fonction de commande principale TT.
[0057] Par ailleurs, lors de cette deuxième phase de fonctionnement PH2, le module de contrôle 23 est entraîné pour estimer la performance thermique du système en suivant la fonction de commande experte pbcr à partir d’un état courant st donné. La mise-à-jour de la fonction d’estimation de la performance thermique est faite à partir des transitions enregistrées dans la mémoire experte MEM 1 et dans la mémoire de répétition MEM2 notamment en appliquant la relation récursive dite « de Bellman par bootstrap », comme décrit dans la publication « Continous Control With Deep Reinforcement Learning » (Lillicrap and al, 2015).
[0058] Avantageusement, la deuxième phase de fonctionnement PH2 est terminée lorsque la différence définie entre une commande experte ut(exP), exécutée par la fonction de commande experte pbcr, stockée dans la mémoire experte MEM1 , et une commande principale ut proposée par le module de commande principale 21 , pour un même état courant st du système 5, a atteint une précision minimale.
[0059] Il est notamment possible d’utiliser une méthode connue par l’homme du métier : la MAE, « Mean Absolute Error » en langue anglaise.
[0060] Une fois la phase de fonctionnement autonome PH3 activée et le module de commande experte 24 débranché ou éteint, et donc lorsque la fonction de commande experte pbcr est inactive, la deuxième phase de fonctionnement PH2 permet à la fonction de commande principale p de pouvoir contrôler de façon efficace le fonctionnement du système 5 thermique, via l’actionneur 310.
[0061] TROISIEME PHASE DE FONCTIONNEMENT
[0062] Lors de la troisième phase de fonctionnement PH3, le système est en mode autonome. Cette troisième phase de fonctionnement PH3 peut comprendre trois modes de fonctionnement permettant le contrôle du système 5 par la fonction de commande principale p via l’actionneur 310.
[0063] Dans un premier mode de fonctionnement, l’utilisation des commandes expertes ut(ex ) est inactive, puisque le module de commande experte 24 est inactif, le module de surveillance 22, le module de commande principale 21 et le module de contrôle 23 sont actifs. Il faut toutefois noter qu’à cet instant, le module de commande principale 21 et le module de contrôle 23 ont préalablement acquis l’expérience de la fonction de commande experte pbcr du module de commande experte 24 lors de la deuxième phase de fonctionnement PH2.
[0064] En référence à la figure 4, il est représenté un deuxième mode de fonctionnement de la phase de fonctionnement autonome PH3 dans laquelle le module de commande experte 24 est actif et, si le système 5 fonctionne selon un état courant st connu par la fonction de commande experte pbcr du module de commande experte 24, alors le module de commande principale 21 fonctionne tel que la fonction de commande experte pbcr du module de commande experte 24 le préconise. [0065] En référence à la figure 5, il est représenté un troisième mode de fonctionnement de la phase de fonctionnement autonome PH3 dans laquelle le module de commande experte 24 est actif. Selon ce troisième mode de fonctionnement, si le système 5 fonctionne selon un état courant st connu par la fonction de commande experte pbcr, alors le module de contrôle 23 peut décider de ne pas faire fonctionner le module de commande principale 21 tel que la fonction de commande experte pbcr le préconise, notamment lorsque le module de contrôle 23 considère que le fonctionnement proposé par la fonction de commande experte pbcr n’est pas optimale.

Claims

Revendications
[Revendication 1] Procédé d’optimisation du contrôle thermique d’un moteur (10) de véhicule, ledit véhicule comprenant un dispositif de refroidissement (30) du moteur (10), ledit dispositif de refroidissement (30) comprenant au moins un actionneur (310) permettant de faire varier la capacité de refroidissement du moteur (10), le procédé est mis en œuvre par un calculateur (20), adapté pour contrôler ledit au moins un actionneur (310) à l’aide d’une commande (ut, ut(exP)), ledit calculateur (20) comprenant et mettant en œuvre une fonction de commande principale (TT) et une fonction de commande experte (ttQCr) prédéterminées et comprenant une mémoire (MEM) dans laquelle sont enregistrées des transitions permettant de déterminer la commande (ut, ut(exP)) à envoyer au dispositif de refroidissement (30) en fonction de l’état courant (st), désignant l’état de fonctionnement, d’un système (5) thermique comprenant le dispositif de refroidissement (30) et le moteur (10) afin de réaliser le contrôle thermique du moteur (10), ledit procédé étant caractérisé en ce qu’il comprend l’entrainement d’un algorithme d’apprentissage comprenant la mise en œuvre itérative des phases suivantes :
a) une première phase de fonctionnement (PH1), dite « d’exploration », dans laquelle la fonction de commande experte (ttQCr) contrôle le fonctionnement du système (5) et est exécutée par itération, chaque itération comportant une étape de:
- détermination d’au moins une commande dite « experte » (ut(exP)) de l’au moins un actionneur (310) par application de la fonction de commande experte (ttQCr) à l’état courant (st) du système (5) thermique et mise en œuvre de ladite fonction de commande experte (ttQCr),
- détermination d’un état modifié (st+i) du système (5) thermique après la mise en œuvre de ladite commande experte (ut(exP)),
- calcul, par la mise en œuvre d’une fonction de récompense thermodynamique du moteur (10), d’une valeur de récompense thermique modifiée (rt+i) à partir de l’état modifié (st+i) du système (5) thermique, et de ladite commande experte (ut(exP)),
- enregistrement dans la mémoire (MEM) de l’ensemble, appelé « transition », comprenant l’état courant (st), la commande experte (ut(exP)) appliquée, également nommée « démonstration », l’état modifié (st+i) et la récompense thermique modifiée (rt+i), ledit état modifié (st+i) devenant alors l’état courant (st) de l’itération suivante,
b) une deuxième phase de fonctionnement (PH2), dite « phase d’apprentissage par imitation », dans laquelle le calculateur (20) modifie la fonction de commande principale (TT) afin de minimiser la différence entre la commande experte (ut(eXp)) et une commande dite « principale » (ut), à partir des transitions enregistrées dans la première phase de fonctionnement (PH1), et dans laquelle la fonction de commande experte (TTexp) contrôle le fonctionnement du système (5),
c) une troisième phase de fonctionnement (PH3), dite « autonome », dans laquelle le calculateur (20) exécute la fonction de commande principale (TT) modifiée lors de la deuxième phase de fonctionnement (PH2) afin de contrôler le fonctionnement du système (5), et dans laquelle le calculateur (20) détermine si la fonction de commande principale (TT) doit agir selon la fonction de commande experte (TTexp) pour un état courant (st) d’une transition enregistrée en mémoire (MEM), en fonction de l’estimation de la performance thermique du système (5).
[Revendication 2] Procédé selon la revendication 1 , dans lequel lors de la première phase de fonctionnement (PH1), un bruit dit « d’exploration » est ajouté à une commande experte (ut(exp)), générée à partir de la fonction de commande experte (TTexp) et d’un état courant (st).
[Revendication 3] Procédé selon la revendication précédente, dans lequel le bruit d’exploration est défini comme un signal ajouté à la commande experte (ut(ex )) et permettant de faire varier ladite commande experte (ut(exP)) .
[Revendication 4] Procédé selon l’une quelconque des revendications précédentes, dans lequel la troisième phase de fonctionnement (PH3) comprend un premier mode de fonctionnement, dans lequel le système (5) fonctionne sans utiliser les transitions enregistrées, uniquement selon une fonction d’estimation de la performance thermique du système (5) et la fonction de commande principale (TT) générées à l’issue de la deuxième phase de fonctionnement (PH2).
[Revendication 5] Procédé selon l’une quelconque des revendications précédentes, dans lequel la troisième phase de fonctionnement (PH3) comprend un deuxième mode de fonctionnement, dans lequel la fonction de commande principale (TT) agit sur le système (5) selon la fonction de commande experte (TTexp) générée à l’issue de la première phase de fonctionnement (PH1) pour l’ensemble des transitions enregistrées en mémoire (MEM).
[Revendication 6] Calculateur (20) de contrôle thermique d’un moteur (10) de véhicule, ledit véhicule comprenant un dispositif de refroidissement (30) du moteur (10), ledit dispositif de refroidissement (30) comprenant au moins un actionneur (310) permettant de faire varier la capacité de refroidissement du moteur (10), ledit calculateur (20) étant adapté pour contrôler ledit au moins un actionneur (310) à l’aide d’une commande (ut, ut(ex )), comprenant et mettant en œuvre une fonction de commande principale (TT) et une fonction de commande experte (pqcr), et comprenant une mémoire (MEM) dans laquelle sont enregistrées des transitions permettant de déterminer la commande (ut) à envoyer au dispositif de refroidissement (30) en fonction de l’état courant (st), désignant l’état de fonctionnement, d’un système (5) thermique comprenant le dispositif de refroidissement (30) et le moteur (10) afin de réaliser le contrôle thermique du moteur (10), ledit calculateur
(20) étant caractérisé en ce qu’il est configuré pour mettre en œuvre le procédé selon l’une des revendications 1 à 5.
[Revendication 7] Calculateur (20) selon la revendication précédente, ledit calculateur (20) étant configuré pour, lors de la première phase de fonctionnement (PH1), ajouter un bruit dit « d’exploration » à une commande experte (ut(ex )) générée à partir de la fonction de commande experte (pbcr) et d’un état courant (st).
[Revendication 8] Calculateur (20) selon la revendication précédente, dans lequel le bruit d’exploration est défini comme un signal ajouté à la commande experte (ut(ex )) et permettant de faire varier ladite commande experte (ut(ex )).
[Revendication 9] Véhicule, notamment automobile, comprenant un moteur (10), un dispositif de refroidissement (30), comprenant au moins un actionneur (310) permettant de faire varier la capacité de refroidissement dudit moteur (10), et un calculateur (20) selon l’une quelconque des revendications 6 à 8.
PCT/EP2020/065600 2019-06-12 2020-06-05 Procédé de contrôle thermique d'un moteur WO2020249477A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FRFR1906231 2019-06-12
FR1906231A FR3097265B1 (fr) 2019-06-12 2019-06-12 Procédé de contrôle thermique d’un moteur

Publications (1)

Publication Number Publication Date
WO2020249477A1 true WO2020249477A1 (fr) 2020-12-17

Family

ID=67742817

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2020/065600 WO2020249477A1 (fr) 2019-06-12 2020-06-05 Procédé de contrôle thermique d'un moteur

Country Status (2)

Country Link
FR (1) FR3097265B1 (fr)
WO (1) WO2020249477A1 (fr)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19902923A1 (de) * 1999-01-26 2000-08-03 Daimler Chrysler Ag Verfahren zur Funktionsüberwachung eines Kühlsystems einer Brennkraftmaschine
EP2944786A1 (fr) * 2014-05-17 2015-11-18 MAN Truck & Bus AG Procédé de commande ou de réglage pour un véhicule automobile
CN109515165A (zh) * 2018-11-30 2019-03-26 北京新能源汽车股份有限公司 一种电机冷却恒温控制方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19902923A1 (de) * 1999-01-26 2000-08-03 Daimler Chrysler Ag Verfahren zur Funktionsüberwachung eines Kühlsystems einer Brennkraftmaschine
EP2944786A1 (fr) * 2014-05-17 2015-11-18 MAN Truck & Bus AG Procédé de commande ou de réglage pour un véhicule automobile
CN109515165A (zh) * 2018-11-30 2019-03-26 北京新能源汽车股份有限公司 一种电机冷却恒温控制方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IVAN F WILDE: "NEURAL NETWORKS Contents", 26 February 2013 (2013-02-26), XP055187105, Retrieved from the Internet <URL:https://web.archive.org/web/20130226112608/http://homepage.ntlworld.com/ivan.wilde/notes/nn/nnnotespdf.pdf> [retrieved on 20150430] *

Also Published As

Publication number Publication date
FR3097265A1 (fr) 2020-12-18
FR3097265B1 (fr) 2021-05-21

Similar Documents

Publication Publication Date Title
WO2020144292A1 (fr) Contrôle thermique pour moteur de véhicule
EP2609473B1 (fr) Procede de determination de parametres de regulation d&#39;un systeme hvac
EP3314337B1 (fr) Procédé de commande d&#39;un facteur d&#39;équivalence énergétique pour un véhicule automobile hybride
WO2020217004A1 (fr) Système et procédé de surveillance d&#39;un moteur d&#39;aéronef
EP2932063A1 (fr) Procede de gestion d&#39;un groupe motopropulseur mettant en oeuvre une estimation de la temperature moteur a la fin d&#39;un temps d&#39;arret d&#39;un element du groupe motopropulseur
WO2020249477A1 (fr) Procédé de contrôle thermique d&#39;un moteur
WO2006037926A1 (fr) Procede et systeme ameliores d&#39;estimation d&#39;une temperature des gaz d&#39;echappement et moteur a combustion interne equipe d&#39;un tel systeme
EP3120012B1 (fr) Procédé de gestion du fonctionnement d&#39;un demarreur d&#39;un moteur thermique afin d&#39;éviter une éventuelle surchauffe pendant le démarrage
EP2494161B1 (fr) Système et procédé de commande du circuit de refroidissement d&#39;un moteur a combustion interne
FR2853081A1 (fr) Systeme et procede de determination de l&#39;etat de charge instantane d&#39;une batterie, et utilisation de ce procede dans un gestionnaire de charge
FR2804720A1 (fr) Dispositif de refroidissement d&#39;un moteur de vehicule automobile
FR3018556B1 (fr) Methode de prediction de l&#39;etat thermique d&#39;un demarreur
EP3066329A1 (fr) Procede d&#39;essai technique
EP2098745A1 (fr) Procédé de détermination automatique du point de léchage d&#39;un embrayage par apprentissage
FR2997233A1 (fr) Gestion de batterie d&#39;un vehicule non branche a une source d&#39;energie externe
EP1268992B1 (fr) Procede et dispositif de refroidissement d&#39;un moteur de vehicule automobile
EP2834490B1 (fr) Estimation de l&#39;etat thermique d&#39;un moteur
FR3007595A1 (fr) Procede de gestion d&#39;un consommateur electrique en fonction d&#39;un modele de temperature
FR2989113A1 (fr) Estimation d&#39;une temperature virtuelle dans un moteur
FR3099972A1 (fr) Procédé de gestion d’un couple à fournir par un moteur électrique
EP1694977A1 (fr) Module de supervision de la transmisson
FR3030702A1 (fr) Circuit de gestion thermique d&#39;un vehicule automobile et procede de pilotage associe
EP3907394A1 (fr) Procédé de gestion thermique d&#39;un véhicule hybride
WO2021083814A1 (fr) Procede de commande d&#39;un actionneur de systeme mecanique a frottements imbriques
FR2989111A1 (fr) Diagnostic de validite d&#39;estimation de temperature

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20729783

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20729783

Country of ref document: EP

Kind code of ref document: A1