WO2021180428A1 - Verfahren und vorrichtung zur überwachung eines elektrischen bordnetzes eines fahrzeugs - Google Patents

Verfahren und vorrichtung zur überwachung eines elektrischen bordnetzes eines fahrzeugs Download PDF

Info

Publication number
WO2021180428A1
WO2021180428A1 PCT/EP2021/053662 EP2021053662W WO2021180428A1 WO 2021180428 A1 WO2021180428 A1 WO 2021180428A1 EP 2021053662 W EP2021053662 W EP 2021053662W WO 2021180428 A1 WO2021180428 A1 WO 2021180428A1
Authority
WO
WIPO (PCT)
Prior art keywords
reward
board
power supply
basis
board power
Prior art date
Application number
PCT/EP2021/053662
Other languages
English (en)
French (fr)
Inventor
Andreas Heimrath
Joachim Froeschl
Original Assignee
Bayerische Motoren Werke Aktiengesellschaft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bayerische Motoren Werke Aktiengesellschaft filed Critical Bayerische Motoren Werke Aktiengesellschaft
Priority to CN202180014666.0A priority Critical patent/CN115135526A/zh
Priority to US17/801,306 priority patent/US20230090528A1/en
Publication of WO2021180428A1 publication Critical patent/WO2021180428A1/de

Links

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01MPROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
    • H01M10/00Secondary cells; Manufacture thereof
    • H01M10/42Methods or arrangements for servicing or maintenance of secondary cells or secondary half-cells
    • H01M10/48Accumulators combined with arrangements for measuring, testing or indicating the condition of cells, e.g. the level or density of the electrolyte
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60LPROPULSION OF ELECTRICALLY-PROPELLED VEHICLES; SUPPLYING ELECTRIC POWER FOR AUXILIARY EQUIPMENT OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRODYNAMIC BRAKE SYSTEMS FOR VEHICLES IN GENERAL; MAGNETIC SUSPENSION OR LEVITATION FOR VEHICLES; MONITORING OPERATING VARIABLES OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRIC SAFETY DEVICES FOR ELECTRICALLY-PROPELLED VEHICLES
    • B60L1/00Supplying electric power to auxiliary equipment of vehicles
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60LPROPULSION OF ELECTRICALLY-PROPELLED VEHICLES; SUPPLYING ELECTRIC POWER FOR AUXILIARY EQUIPMENT OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRODYNAMIC BRAKE SYSTEMS FOR VEHICLES IN GENERAL; MAGNETIC SUSPENSION OR LEVITATION FOR VEHICLES; MONITORING OPERATING VARIABLES OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRIC SAFETY DEVICES FOR ELECTRICALLY-PROPELLED VEHICLES
    • B60L3/00Electric devices on electrically-propelled vehicles for safety purposes; Monitoring operating variables, e.g. speed, deceleration or energy consumption
    • B60L3/0023Detecting, eliminating, remedying or compensating for drive train abnormalities, e.g. failures within the drive train
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60LPROPULSION OF ELECTRICALLY-PROPELLED VEHICLES; SUPPLYING ELECTRIC POWER FOR AUXILIARY EQUIPMENT OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRODYNAMIC BRAKE SYSTEMS FOR VEHICLES IN GENERAL; MAGNETIC SUSPENSION OR LEVITATION FOR VEHICLES; MONITORING OPERATING VARIABLES OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRIC SAFETY DEVICES FOR ELECTRICALLY-PROPELLED VEHICLES
    • B60L50/00Electric propulsion with power supplied within the vehicle
    • B60L50/50Electric propulsion with power supplied within the vehicle using propulsion power supplied by batteries or fuel cells
    • B60L50/60Electric propulsion with power supplied within the vehicle using propulsion power supplied by batteries or fuel cells using power supplied by batteries
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60LPROPULSION OF ELECTRICALLY-PROPELLED VEHICLES; SUPPLYING ELECTRIC POWER FOR AUXILIARY EQUIPMENT OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRODYNAMIC BRAKE SYSTEMS FOR VEHICLES IN GENERAL; MAGNETIC SUSPENSION OR LEVITATION FOR VEHICLES; MONITORING OPERATING VARIABLES OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRIC SAFETY DEVICES FOR ELECTRICALLY-PROPELLED VEHICLES
    • B60L58/00Methods or circuit arrangements for monitoring or controlling batteries or fuel cells, specially adapted for electric vehicles
    • B60L58/10Methods or circuit arrangements for monitoring or controlling batteries or fuel cells, specially adapted for electric vehicles for monitoring or controlling batteries
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C5/00Registering or indicating the working of vehicles
    • G07C5/08Registering or indicating performance data other than driving, working, idle, or waiting time, with or without registering driving, working, idle or waiting time
    • G07C5/0808Diagnosing performance data
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60LPROPULSION OF ELECTRICALLY-PROPELLED VEHICLES; SUPPLYING ELECTRIC POWER FOR AUXILIARY EQUIPMENT OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRODYNAMIC BRAKE SYSTEMS FOR VEHICLES IN GENERAL; MAGNETIC SUSPENSION OR LEVITATION FOR VEHICLES; MONITORING OPERATING VARIABLES OF ELECTRICALLY-PROPELLED VEHICLES; ELECTRIC SAFETY DEVICES FOR ELECTRICALLY-PROPELLED VEHICLES
    • B60L2260/00Operating Modes
    • B60L2260/40Control modes
    • B60L2260/46Control modes by self learning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/03Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for supply of electrical power to vehicle subsystems or for
    • B60R16/033Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for supply of electrical power to vehicle subsystems or for characterised by the use of electrical cells or batteries
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01MPROCESSES OR MEANS, e.g. BATTERIES, FOR THE DIRECT CONVERSION OF CHEMICAL ENERGY INTO ELECTRICAL ENERGY
    • H01M2220/00Batteries for particular applications
    • H01M2220/20Batteries in motive systems, e.g. vehicle, ship, plane

Definitions

  • the invention relates to a method and a corresponding device with which the components of an on-board electrical system can be monitored more reliably and efficiently, in particular in order to be able to predict the failure of an on-board network component at an early stage.
  • a vehicle comprises an electrical (energy) on-board network, via which several electrical consumers of the vehicle can be supplied with electrical energy.
  • the vehicle electrical system typically includes an electrical energy store for storing electrical energy and for supporting the electrical system voltage.
  • the on-board network typically includes a generator (which is driven, for example, by an internal combustion engine of the vehicle), which is set up to generate electrical energy for the on-board network.
  • the on-board network of a hybrid or electric vehicle typically includes a DC / DC converter (which is supplied, for example, by a traction battery of the vehicle), which is set up to generate or provide electrical energy for the on-board network.
  • the on-board network can be operated by means of an energy management system.
  • the energy management system can be set up to secure the energy supply of the electrical consumers through the on-board network.
  • the energy management system can include one or more controllers that are set up to regulate one or more control variables of the vehicle electrical system (such as the vehicle electrical system voltage) to a respective setpoint.
  • the energy management system can comprise or be a machine leaming-based energy management system.
  • it can Energy management system include one or more controllers that have been learned using machine learning.
  • an on-board network component e.g. the energy storage device or the generator or the DC-DC converter or a consumer
  • the failure of an on-board network component can impair the operation of a vehicle, which can lead to a safety-critical situation, especially in the case of an automated vehicle.
  • This document deals with the technical task of predicting a future and / or impending failure of a component of an on-board electrical system in an efficient and precise manner.
  • a device for monitoring an on-board power supply system, in particular an on-board power supply system of a (motor) vehicle, is described.
  • the on-board power supply system includes different on-board power supply components, such as one or more electrical energy stores, one or more electrical ones Consumers and / or one or more generators or
  • DC voltage converters (which are set up to provide electrical energy from outside in the on-board power supply system).
  • the on-board energy network is operated using a machine leaming-based (machine-learned in German) energy management system, with the energy management system being taught using reinforcement learning.
  • reinforcement learning an action that is carried out by the energy management system based on a certain state of the on-board power supply system can be assigned a reward.
  • the reward can be calculated on the basis of a specific reward function, the reward function depending on one or more measurable variables, in particular state variables, of the on-board network.
  • the energy management system can be learned within the framework of reinforcement learning in such a way that the energy management system is enabled, based on a state of the on-board power supply, to bring about an action through which the cumulative sum of future (possibly discounted) rewards is as large as possible, in particular maximally .
  • the state of the on-board power supply system can be described by one or more (measurable) state variables.
  • Exemplary state variables are:
  • the energy management system can be designed to determine measured values in relation to one or more state variables at a specific point in time.
  • the state of the on-board power supply system at the specific point in time then results from the measured values. It can then be based on the condition at which an action can be determined and effected at a certain point in time.
  • Exemplary actions are:
  • the energy management system can comprise a learned neural network (by means of reinforcement learning), which receives the measured values of the one or more state variables as input values and which provides the action to be carried out as output value.
  • the neural network can be designed to provide a Q value (determined by means of Q learning) for a pair of measured values of the one or more state variables and an action. On the basis of the Q values, the action that gives the optimal (e.g. the largest) Q value can then be selected for a large number of different possible actions.
  • the above process can be repeated at a sequence of points in time in order to permanently control and / or regulate the on-board power supply system.
  • the current status can be measured at any point in time and an action can be determined based on this (which e.g. results in the optimal Q value in each case).
  • the energy management system can have been trained for a reference on-board network, wherein the reference on-board network can correspond to the on-board energy network with fault-free and / or unaffected on-board network components.
  • the machine learning-based energy management system can include at least one regulator which is designed to regulate a measurable (state) variable of the on-board power supply system to a setpoint value.
  • the reward or the Reward function which is used when teaching the energy management system (in particular the neural network of the energy management system), can depend on a deviation of the (measured) actual value of the measurable variable from the setpoint when the reference on-board network is in operation or when the on-board energy network is in operation.
  • the reward can be greater, the smaller the deviation of the actual value from the target value. In this way, a precise setting of one or more state variables of the on-board power supply system can be achieved.
  • the device comprises a reference unit which is set up to determine a reference reward for a state of the vehicle electrical system and for an action brought about by the energy management system based on the state, which would result from operating the reference vehicle electrical system.
  • the reference unit can have been learned in the context of the learning process of the machine-learned energy management system, in particular on the basis of the rewards that have arisen within the framework of the learning process of the machine-learned energy management system for different combinations of states and actions.
  • a reference unit can thus be provided which displays the reward for a status-action pair that would result from the operation of the reference on-board network (with the on-board network components that are not impaired).
  • the reference unit can comprise at least one neural network (learned in the context of the learning process of the energy management system).
  • the device further comprises a reward unit which is set up to determine an actual reward for the state and for the action (ie for the state-action pair), which (actually) results from the operation of the on-board power supply system.
  • the actual reward and the reference reward can be determined on the basis of the same reward function.
  • the reward or the reward function in particular the actual reward and the reference reward, can depend on one or more measurable (state) variables of the on-board network.
  • the reward or the reward function, and thus the actual reward and the reference reward can include one or more reward components for the corresponding one or more measurable (state) variables of the on-board network.
  • the reward unit can be set up to determine measured values for the one or more measurable (state) variables that result as a result of the action taken when the on-board power supply system is in operation. The actual reward can then be determined on the basis of the measured values for the one or more measurable variables. In a corresponding manner, the rewards can also be determined during the learning of the energy management system and the reference unit (when the reference vehicle electrical system is in operation).
  • the device further comprises a monitoring unit which is set up to monitor the on-board power supply system on the basis of the actual reward and on the basis of the reference reward, in particular on the basis of a comparison of the actual reward and the reference reward.
  • the monitoring unit can in particular be set up to determine, on the basis of the actual reward and on the basis of the reference reward, whether or not an on-board network component of the on-board energy network is impaired.
  • the device can be set up to output a message (e.g. an error message) with regard to the on-board power supply component if it is determined that the on-board power supply component is impaired.
  • the device described in this document makes it possible to compare the (actual) reward that results for a state-action pair when the on-board power supply is in operation with the (reference) reward that arises for the state-action pair Operation of a corresponding error-free Reference vehicle electrical system results. This enables efficient and precise monitoring of the on-board power supply system. In particular, an imminent and / or impending failure of an on-board network component can be predicted in a precise manner.
  • the reference reward and / or the actual reward can each comprise one or more reward components.
  • Exemplary reward components are: a reward component in relation to a current and / or in relation to a voltage within the on-board network and / or on an on-board network component; a reward component in relation to a load and / or in relation to a load on an on-board network component; and / or a reward component in relation to a state of charge of an energy store of the on-board network.
  • the accuracy of the monitoring of the on-board energy network can be further increased.
  • a certain on-board electrical system component that threatens to fail can be identified in a precise manner.
  • the monitoring unit can be set up to determine a discrepancy between the actual reward and the reference reward, in particular a discrepancy between a reward component of the actual reward and a corresponding reward component of the reference reward.
  • the deviation threshold value can be determined in advance by simulation and / or tests, in particular specifically for a plurality of different on-board network components of the on-board network and / or for a corresponding plurality of different reward components.
  • the actual reward and the reference reward ie in particular the common reward function
  • the monitoring unit can be set up to determine, on the basis of the discrepancy between the reward components of the actual reward and the reference reward for the specific on-board network component, whether the specific on-board network component is impaired or not.
  • a (road) motor vehicle in particular a passenger car or a truck or a bus or a motorcycle
  • a (road) motor vehicle in particular a passenger car or a truck or a bus or a motorcycle
  • a method for monitoring an on-board power supply system which comprises different on-board power supply components and which is operated on the basis of a machine-learned energy management system, the energy management system being trained for a reference on-board network by means of reinforcement leaming.
  • the method comprises determining, for a state of the vehicle electrical system and for an action brought about by the energy management system based on the state, a reference reward that would result if the reference vehicle electrical system were operated.
  • the method includes determining, for the state and for the action, an actual reward that results from the operation of the on-board power supply system.
  • the method further comprises monitoring the on-board power supply system on the basis of the actual reward and on the basis of the reference reward, in particular on the basis of a comparison of the actual reward and the reference reward.
  • SW software
  • the software program can be set up to be executed on a processor (for example on a control unit of a vehicle) and thereby to execute the method described in this document.
  • the storage medium can comprise a software program which is set up to be executed on a processor and thereby to execute the method described in this document.
  • FIG. 1a shows an exemplary on-board electrical system
  • FIG. 1b shows an exemplary control loop
  • FIG. 2a shows an exemplary neural network
  • FIG. 2b shows an exemplary neuron
  • FIG. 3 shows an exemplary device for teaching a controller
  • FIG. 4 shows an exemplary device for determining the state of an on-board electrical system of a vehicle
  • FIG. 5 shows a flow chart of an exemplary method for determining the state of an on-board electrical system of a vehicle.
  • the present document deals with the reliable and precise prediction of the state of components of an on-board electrical system of a vehicle.
  • FIG. 1 shows a block diagram of an on-board network 100 that has an electrical energy store
  • 105 e.g. a lithium-ion battery
  • electrical consumers e.g. one or more electrical consumers
  • the vehicle electrical system 100 comprises an energy management system 101 which is set up to set one or more (state) variables of the vehicle electrical system 100, in particular to regulate them to a respective setpoint value.
  • An exemplary (state) variable of the vehicle electrical system 100 is the vehicle electrical system voltage 111, which, for example, can be set, in particular regulated, to a specific target value.
  • a controller can be used to set a controlled variable (e.g. the vehicle electrical system voltage 111) to a setpoint value (which changes over time).
  • 1b shows an exemplary control loop 150 in which the controlled variable 156 is set to a setpoint value 151 by means of a controller 153.
  • the controller 153 is set up to determine a manipulated variable 154 on the basis of the control error 152 (i.e. the difference) from the controlled variable 156 and (the current) setpoint 151.
  • One or more actuators of the vehicle electrical system 100 can be operated as a function of the manipulated variable 154.
  • An exemplary manipulated variable 154 is the speed at which the generator 107 is operated (e.g. by an internal combustion engine of a vehicle).
  • the control variable 156 results from the manipulated variable 154 (e.g. the value of a state variable of the vehicle electrical system 100).
  • FIGS. 2a and 2b show exemplary components of a neural network 200, in particular a feedforward network.
  • the network 200 comprises two input neurons or input nodes 202, which each receive a current value of an input variable as input value 201 at a specific point in time t.
  • the one or more input nodes 202 are part of an input layer 211.
  • the neural network 200 further comprises neurons 220 in one or more hidden layers 212 of the neural network 200.
  • Each of the neurons 220 can have the individual output values of the neurons of the preceding layer 212, 211 (or at least a part thereof) as input values.
  • Processing takes place in each of the neurons 220 in order to determine an output value of the neuron 220 as a function of the input values.
  • the output values of the neurons 220 of the last hidden layer 212 can be processed in an output neuron or output node 220 of an output layer 213 in order to determine the one or more output values 203 of the neural network 200.
  • FIG. 2b illustrates the exemplary signal processing within a neuron 220, in particular within the neurons 202 of the one or more hidden layers 212 and / or the output layer 213 223 to determine a weighted sum 224 of the input values 221 (possibly taking into account a bias or offset 227).
  • the weighted sum 224 can be mapped onto an output value 226 of the neuron 220 by an activation function 225.
  • the activation function 225 can, for example, limit the range of values.
  • a neuron 220 thus has weights 222 and / or possibly an offset 227 as neuron parameters.
  • the neuron parameters of the neurons 220 of a neural network 200 can be learned in a training phase in order to have the neural network 200 approximate a specific function and / or model a specific behavior.
  • a neural network 200 can be taught-in using the backpropagation algorithm, for example.
  • a first phase of a q th epoch of a learning algorithm for the input values 201 at the one or more input nodes 202 of the neural network 200 corresponding output values 203 can be determined at the output of the one or more output neurons 220.
  • the value of an optimization or error function can be determined on the basis of the output values 203.
  • a temporal difference (TD) error can serve as an optimization or error function, as explained below.
  • the error or the error value is propagated back from the output to the input of the neural network in order to change the neuron parameters of the neurons 220 in layers.
  • the error function determined at the output can be partially derived from each individual neuron parameter of the neural network 200 in order to determine an extent and / or a direction for adapting the individual neuron parameters.
  • This learning algorithm can be repeated iteratively for a large number of epochs until a predefined convergence and / or termination criterion is reached.
  • a controller 153 or a controller function that is set up to determine the manipulated variable 154 on the basis of the control error 152 what is known as (actor-critical) reinforcement leaming can be used, for example.
  • Q-Leaming can be used.
  • a Q-function can be learned (and e.g. through a neural network 200), whereby the Q-function can be used to select an optimal action for a certain state.
  • FIG. 3 illustrates an exemplary device 300 for teaching a controller function 303 for a controller 153, in particular for an energy management system 101.
  • the controller function 303 can be approximated, for example, by a neural network 200.
  • the controller function 303 can be described by an analytical function with one or more controller parameters.
  • Exemplary state variables 306 are the state of charge of the energy store 105, the vehicle electrical system voltage 111, the load of the generator 107, the load of an electrical consumer 106, etc.
  • the values of the one or more state variables 306 can indicate the deviation of the individual state variables from a respective setpoint value 301.
  • the values x t indicate the values of one or more control errors.
  • the controller function 303 is referred to as "actor" in the context of (actor-critical) reinforcement leaming.
  • the controller function 303 can be used to calculate the current values u t of one or more manipulated variables on the basis of the current values of the one or more state variables 306. or to determine action variables or actions 304.
  • An exemplary manipulated variable or action variable or action 304 is the requested load of the generator 107 and / or the load caused by a consumer 106.
  • the current values u t of the one or more manipulated or action variables 304 can be used to operate the system to be controlled or the controlled system 305.
  • one or more components 106, 107 of on-board electrical system 100 can be operated as a function of the current values u t of one or more manipulated or action variables 304. This brings about values x t + 1 of the one or more measurable state variables 306 at a subsequent point in time t + 1.
  • the value of a value function can be determined on the basis of the current values x t of the one or more measurable state variables 306 and on the basis of the current values u t of the one or more manipulated or action variables 304.
  • the value function can correspond to the discounted sum of (future) rewards.
  • a reward r (x t , u t ) can be awarded as a function of a specific reward function.
  • the reward can depend on, for example,
  • the reward r (x t , u t ) can have different reward terms or reward components for different controlled variables and / or state variables 306.
  • the individual reward components can be combined into a reward vector.
  • the current value 302 of the reward r (x t , u t ) (ie of the reward function) at a specific point in time t can be calculated by the unit 307.
  • the controller function 303 can be learned in such a way that the sum of the rewards discounted over time is increased, in particular maximized. Since, due to the unknown controlled system 305, it is not known how actions or manipulated variables 304 relate to the values x t of the one or more (measurable) state variables 306 (ie the values of the control errors), a "Critic" can be a state-action-value function 308 can be learned, which for each combination of a state x t of the system 305 to be regulated (ie the on-board network 100) and an action u t 304 a value Q ⁇ (x t , u t ) 310 of the sum which displays rewards discounted over time.
  • a state value function can be defined that shows the sum of the rewards r (X i , U i ) discounted over time i for a certain state x t, with the discounting factor g E [0.1].
  • V ⁇ (x t + 1 ) - Q ⁇ ( t + 1 , u t + 1 ) where u t + 1 ⁇ (x t + 1 ) with the learned controller function ⁇ () 303.
  • the value functions can be learned iteratively over time, whereby this should apply after convergence
  • the value 302 of the reward can be provided in the unit 309 for this purpose (not shown).
  • the TD error ⁇ 311 can be used to iteratively train the status-action-value function 308 and, if necessary, the controller function 303. In particular, the TD error ⁇ 311 can be used to learn the status-action-value function 308. The learned state-action value function 308 can then be used to train the controller function 303.
  • the state-action value function 308 can be approximated and / or modeled by a neural network 200 and adapted on the basis of the TD error ⁇ 311.
  • the controller function 303 can be adapted.
  • the device 300 can be set up to iteratively adapt the controller function 303 and / or the state-action-value function 308 for a plurality of times t until a convergence criterion is reached.
  • a controller function 303 for a controller 153 can thus be determined in an efficient and precise manner.
  • controllers 153 for several control or state variables 106 of a machine leaming-based energy management system 101 can be learned.
  • the method described in connection with FIG. 3 is only one example for training an energy management system 101 on the basis of reinforcement learning.
  • Another example is Q-Leaming.
  • a Q-function or a status-action-value function 308 can be learned, which is designed to provide a Q-value for a status-action pair (the Q-value, for example, indicating the sum of the discounted future rewards ).
  • the learned Q function can be used to determine corresponding Q values for several different possible actions. The action can then be selected for which the optimal (e.g. the maximum) Q value results.
  • the device 400 comprises a reference unit 400 which is set up, on the basis of the current state x t 306 of the on-board electrical system 100 and on the basis of an action u t 304 brought about by the energy management system 101, the (reference) reward r (x t , u t ) 302, in particular the (reference) reward vector, which would result in a properly functioning on-board network 100.
  • the reference unit 400 can be learned during the learning process (the controller 153) of the energy management system 101.
  • the reference unit 400 can comprise a neural network 200.
  • the device 450 further comprises a reward unit 410, which is set up on the basis of the current state x t 306 of the on-board electrical system 100 and on the basis of the action u t 304 brought about by the energy management system 101, the actual reward r (x t , u t ) 402, in particular to determine the actual reward vector which actually results when the on-board network 100 is operated (using the reward function).
  • a reward unit 410 which is set up on the basis of the current state x t 306 of the on-board electrical system 100 and on the basis of the action u t 304 brought about by the energy management system 101, the actual reward r (x t , u t ) 402, in particular to determine the actual reward vector which actually results when the on-board network 100 is operated (using the reward function).
  • the reference reward 302 and the actual reward 402 can be compared with one another in a comparison and / or checking unit 420.
  • the individual vector sizes of the reference reward vector can be compared with the corresponding vector sizes of the actual reward vector.
  • the state 405 of the vehicle electrical system 100 can then be determined based on the comparison.
  • a prediction can be made as to whether a component 105, 106, 107 of the vehicle electrical system 100 will fail within a specific time interval ahead. If necessary, the component 105, 106, 107 that will fail can also be identified. This document therefore describes the diagnosis and / or failure prediction of components 105, 106, 107 in a vehicle that has energy management based on machine leaming.
  • the energy management system 101 can, for example, have been learned on the basis of reflex augmented reinforcement leaming (RARL) or on the basis of reinforcement learning.
  • RARL reflex augmented reinforcement leaming
  • RARL is described, for example, in Heimrath et al., "Reflex-Augmented Reinforcement Learning for Operating Strategies in Automotive Electrical Energy Management", Proceeding of the 2019 International Conference on Computing, Electronics & Communications Engineering, IEEE, 2019, pp. 62-67 .
  • the contents of this document are hereby fully incorporated into this document by reference.
  • the agent learns which actions 304 are to be carried out in a certain normal state 306 of the vehicle electrical system 100.
  • An action 304 can include, for example, increasing the vehicle electrical system voltage 111.
  • the state 306 of the on-board network 100 changes and the agent receives feedback in the form of the reward (i.e. in the form of a reward 302) about the quality of its decision (i.e. the action 304).
  • This reward 302 flows into the learning process of the energy management system 101.
  • the state of the on-board electrical system 100 can include several state variables 306, such as the load on the generator 107, the (normalized) current in or from the energy store 105, the state of charge (in particular the State of Charge, SOC) of the energy store 105, the temperature of the energy store 105, etc.).
  • state variables 306 such as the load on the generator 107, the (normalized) current in or from the energy store 105, the state of charge (in particular the State of Charge, SOC) of the energy store 105, the temperature of the energy store 105, etc.).
  • This document describes a diagnostic module 450 which is at least partially integrated into the learning process of the energy management system 101.
  • the reference unit 400 can be learned during the learning process of the energy management system 101.
  • the diagnostic module 450 is enabled to predict and / or to predict a malfunction and / or the failure of a component 105, 106, 107 of the vehicle electrical system 100 quantify.
  • the diagnostic module 450 can be designed (on the basis of the reference unit 400) to predict the expected effect of the execution of an action 304 in the vehicle electrical system 100.
  • the diagnostic module 450 can be designed to compare the expected behavior of the vehicle electrical system 100 with the actual behavior of the vehicle electrical system 100 (within the comparison or checking unit 420).
  • the reference unit 400 (with a separate neural network 200) is trained in parallel and independently.
  • the agent executes an action 304 based on a certain state 306 and receives a reward 302 for this Predict action 304 in a functional (reference) on-board network 100 as reward 302.
  • the training of the reference unit 400 is also ended.
  • the energy management system 101 selects an action 304 on the basis of a specific state 306 and carries out this action 304.
  • An actually measured reward 402 can then be determined based on the actually measured variables of the on-board electrical system 100 (within the reward unit 420).
  • the reward 302 predicted by the reference unit 400 can then be compared with the actual measured reward 402 (of the vehicle electrical system 100).
  • the respective rewards 302, 402 can have different reward components, which can each be compared in pairs.
  • the comparison of the actually measured reward 402 and the predicted reward 302 indicates whether one or more components 105, 106, 107 of the on-board power supply system 100 have an actual behavior that deviates from a target behavior.
  • tolerances and / or threshold values can be established, from which an error is detected.
  • the tolerances and / or threshold values can be determined in the context of a simulation and / or on the basis of tests on vehicles (e.g. in the context of development).
  • a message can be output to the driver of the vehicle and / or to a maintenance organization for the maintenance of the vehicle. If necessary, it can be arranged that the driver of the vehicle takes over the control of the vehicle manually if it is recognized that an automated ferry operation is no longer possible due to the detected fault (e.g. a fault in the energy store 105).
  • the rewards 302, 402 can, for example, be a function of the battery current into or from the energy store 105 and / or the utilization of the generator 107. If, for example, the rewards 302, 402 are a function of the battery current and if the functional state of the generator 107 is known (e.g. based on the sensor data of a dedicated sensor), the calculated deviation of the predicted reward 302 from the actual reward 402 can be used as a quantitative indicator on the Functionality of the energy store 105 can be used. On the other hand, it is possible to infer the functionality of the generator 107 from the deviation of the rewards 402, 402 in relation to the utilization of the generator 107.
  • the weighting of the two influencing variables can be can be used within the reward 302, 402 for interpreting the deviation of the predicted reward 302 from the actual reward 402.
  • the weights of the individual reward components can be used to decide which vehicle electrical system component 105, 106, 107 is impaired.
  • FIG. 5 shows a flowchart of an exemplary (possibly computer-implemented) method 500 for monitoring an on-board power supply system 100 (of a motor vehicle), the different on-board network components 105, 106,
  • the energy management system 101 can have been trained for a reference vehicle electrical system by means of reinforcement learning.
  • the reference vehicle electrical system can correspond to the vehicle electrical system 100 in the event that the vehicle electrical system 100 has exclusively fault-free and / or unaffected vehicle electrical system components 105, 106, 107.
  • the method 500 comprises determining 501, for a state 306 of the on-board electrical system 100 and for an action 304 brought about by the energy management system 101 based on the state 306, a reference reward 302 that would result from the operation of the reference on-board electrical system.
  • a reference unit 400 can be used which is designed to provide the reference reward in each case for a state-action pair.
  • the reference unit 400 may have been taught in when the energy management system 101 was being trained by means of reinforcement learning.
  • the method 500 includes determining 502, for the state 306 and for the action 304, an actual reward 402 that results from the operation of the on-board power supply system 100.
  • the actual 402 reward can be based upon The basis of measured values for one or more measured variables of the on-board power supply system 100 can be determined.
  • the method 500 also includes monitoring 503 of the on-board power supply system 100 on the basis of the actual reward 402 and on the basis of the reference reward 302, in particular on the basis of a comparison of the actual reward 402 and the reference reward 302 402 and, on the basis of the reference reward 302, an impaired on-board electrical system component 105, 106, 107 can be identified.
  • the measures described in this document can increase the comfort and safety of an on-board power supply system 100 (for a vehicle). It can thereby be made possible to predict whether the on-board power supply 100 or parts 105, 106, 107 of the on-board power supply 100 no longer meet the requirements placed on the on-board power supply 100. Components 105, 106, 107, for which deterioration is predicted, can be repaired or replaced at an early stage before there is a noticeable impairment of on-board electrical system 100. Furthermore, the measures described can be used to provide a safe energy supply for an automated vehicle. Furthermore, quality fluctuations in the components 105, 106, 107 of an on-board network 100 can be recognized.

Landscapes

  • Engineering & Computer Science (AREA)
  • Power Engineering (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Artificial Intelligence (AREA)
  • Sustainable Development (AREA)
  • Sustainable Energy (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Manufacturing & Machinery (AREA)
  • General Chemical & Material Sciences (AREA)
  • Electrochemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Automation & Control Theory (AREA)
  • Electric Propulsion And Braking For Vehicles (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

Es wird eine Vorrichtung (450) zur Überwachung eines Energiebordnetzes (100) beschrieben, das unterschiedliche Bordnetz-Komponenten (105, 106, 107) umfasst und das anhand eines Maschine-erlernten Energiemanagementsystems (101) betrieben wird. Die Vorrichtung (450) umfasst eine Referenzeinheit (400), die eingerichtet ist, für einen Zustand (306) des Energiebordnetzes (100) und für eine basierend auf dem Zustand (306) von dem Energiemanagementsystem (101) bewirkte Aktion (304) eine Referenz-Belohnung (302) zu ermitteln, die sich bei Betrieb eines Referenz-Bordnetzes ergeben würde. Des Weiteren umfasst die Vorrichtung (450) eine Belohnungseinheit (410), die eingerichtet ist, für den Zustand (306) und für die Aktion (304) eine tatsächliche Belohnung (402) zu ermitteln, die sich bei Betrieb des Energiebordnetzes (100) ergibt. Die Vorrichtung (450) umfasst ferner einer Überwachungseinheit (420), die eingerichtet ist, das Energiebordnetz (100) auf Basis der tatsächlichen Belohnung (402) und auf Basis der Referenz-Belohnung (302) zu überwachen.

Description

Verfahren und Vorrichtung zur Überwachung eines elektrischen Bordnetzes eines Fahrzeugs
Die Erfindung betrifft ein Verfahren und eine entsprechende Vorrichtung, mit denen die Komponenten eines elektrischen Bordnetzes in zuverlässiger und effizienter überwacht werden können, insbesondere um bereits frühzeitig den Ausfall einer Bordnetz -Komponente Vorhersagen zu können.
Ein Fahrzeug umfasst ein elektrisches (Energie-) Bordnetz, über das mehrere elektrische Verbraucher des Fahrzeugs mit elektrischer Energie versorgt werden können. Das Bordnetz umfasst typischerweise einen elektrischen Energiespeicher zur Speicherung von elektrischer Energie und zur Stützung der Bordnetzspannung. Des Weiteren umfasst das Bordnetz typischerweise einen Generator (der z.B. durch einen Verbrennungsmotor des Fahrzeugs angetrieben wird), der eingerichtet ist, elektrische Energie für das Bordnetz zu erzeugen. Ferner umfasst das Bordnetz eines Hybrid- oder Elektrofahrzeugs typischerweise einen Gleichspannungswandler (der z.B. durch eine Traktionsbatterie des Fahrzeugs versorgt wird), der eingerichtet ist, elektrische Energie für das Bordnetz zu erzeugen bzw. bereitzustellen.
Das Bordnetz kann mittels eines Energiemanagementsystems betrieben werden. Das Energiemanagementsystem kann dabei eingerichtet sein, die Energieversorgung der elektrischen Verbraucher durch das Bordnetz abzusichern. Zu diesem Zweck kann das Energiemanagementsystem ein oder mehrere Regler umfassen, die eingerichtet sind, ein oder mehrere Regelgrößen des Bordnetzes (wie z.B. die Bordnetzspannung) auf einen jeweiligen Sollwert zu regeln.
Das Energiemanagementsystem kann ein Machine-Leaming basiertes Energiemanagementsystem umfassen bzw. sein. Insbesondere kann das Energiemanagementsystem ein oder mehrere Regler umfassen, die anhand von Machine-Learning angelernt wurden.
Der Ausfall einer Bordnetz-Komponente (z.B. des Energiespeichers oder des Generators oder des Gleichspannungswandlers oder eines Verbrauchers) des elektrischen Bordnetzes kann zu einer Beeinträchtigung des Betriebs eines Fahrzeugs führen, was insbesondere bei einem automatisiert fahrenden Fahrzeug zu einer sicherheitskritischen Situation führen kann.
Das vorliegende Dokument befasst sich mit der technischen Aufgabe, in effizienter und präziser Weise einen zukünftigen und/oder drohenden Ausfall einer Komponente eines elektrischen Bordnetzes zu prädizieren.
Die Aufgabe wird jeweils durch die unabhängigen Ansprüche gelöst. Vorteilhafte Ausführungsformen werden u.a. in den abhängigen Ansprüchen beschrieben. Es wird daraufhingewiesen, dass zusätzliche Merkmale eines von einem unabhängigen Patentanspruch abhängigen Patentanspruchs ohne die Merkmale des unabhängigen Patentanspruchs oder nur in Kombination mit einer Teilmenge der Merkmale des unabhängigen Patentanspruchs eine eigene und von der Kombination sämtlicher Merkmale des unabhängigen Patentanspruchs unabhängige Erfindung bilden können, die zum Gegenstand eines unabhängigen Anspruchs, einer Teilungsanmeldung oder einer Nachanmeldung gemacht werden kann. Dies gilt in gleicher Weise für in der Beschreibung beschriebene technische Lehren, die eine von den Merkmalen der unabhängigen Patentansprüche unabhängige Erfindung bilden können.
Gemäß einem Aspekt wird eine Vorrichtung (in diesem Dokument auch als Diagnosemodul bezeichnet) zur Überwachung eines Energiebordnetzes, insbesondere eines Energiebordnetzes eines (Kraft-) Fahrzeugs, beschrieben. Das Energiebordnetz umfasst unterschiedliche Bordnetz-Komponenten, wie z.B. ein oder mehrere elektrische Energiespeicher, ein oder mehrere elektrische Verbraucher und/oder ein oder mehrere Generatoren oder
Gleichspannungswandler (die eingerichtet sind, elektrische Energie von extern in dem Energiebordnetz bereitzustellen).
Das Energiebordnetz wird anhand eines Machine Leaming-basierten (auf Deutsch Maschine-erlernten) Energiemanagementsystems betrieben, wobei das Energiemanagementsystem mittels Reinforcement Learning angelernt wurde. Im Rahmen des Reinforcement Learning kann einer Aktion, die durch das Energiemanagementsystem ausgehend von einem bestimmten Zustand des Energiebordnetzes bewirkt wird, jeweils eine Belohnung zugewiesen werden. Die Belohnung kann dabei auf Basis einer bestimmten Belohnungsfunktion berechnet werden, wobei die Belohnungsfunktion von ein oder mehreren messbaren Größen, insbesondere Zustandsgrößen, des Bordnetzes abhängt. Das Energiemanagementsystem kann im Rahmen des Reinforcement Learning derart angelernt werden, dass das Energiemanagementsystem befähigt wird, ausgehend von einem Zustand des Energiebordnetzes jeweils eine Aktion zu bewirken, durch die die kumulierte Summe von zukünftigen (ggf. diskontierten) Belohnungen möglichst groß, insbesondere maximal, wird.
Der Zustand des Energiebordnetzes kann durch ein oder mehrere (messbare) Zustandsgrößen beschrieben werden. Beispielhafte Zustandsgrößen sind:
• der Strom und/oder die Spannung in dem Bordnetz und/oder an einer Bordnetz -Komponente;
• der Ladezustand eines Energiespeichers; und/oder
• die Last an einem Generator und/oder an einem Gleichspannungswandler und/oder an einem elektrischen Verbraucher.
Das Energiemanagementsystem kann ausgebildet sein, an einem bestimmten Zeitpunkt Messwerte in Bezug auf ein oder mehrere Zustandsgrößen zu ermitteln. Aus den Messwerten ergibt sich dann der Zustand des Energiebordnetzes an dem bestimmten Zeitpunkt. Es kann dann basierend auf dem Zustand an dem bestimmten Zeitpunkt eine Aktion ermittelt und bewirkt werden. Beispielhafte Aktionen sind:
• das Verändern (insbesondere das Erhöhen oder das Reduzieren) des Stroms und/oder der Spannung in dem Bordnetz und/oder an einer Bordnetz-Komponente; und/oder
• das Verändern (insbesondere das Erhöhen oder das Reduzieren) der Last an einem Generator und/oder an einem Gleichspannungswandler und/oder an einem elektrischen Verbraucher.
Das Energiemanagementsystem kann ein (mittels Reinforcement Learning) angelerntes neuronales Netz umfassen, das als Eingangswerte die Messwerte der ein oder mehreren Zustandsgrößen aufnimmt und das als Ausgangswert die zu bewirkende Aktion bereitstellt. Alternativ oder ergänzend kann das neuronale Netz ausgebildet sein, für ein Paar aus Messwerten der ein oder mehreren Zustandsgrößen und einer Aktion einen (mittels Q-Learning ermittelten) Q-Wert bereitzustellen. Es kann dann auf Basis der Q-Werte für eine Vielzahl von unterschiedlichen möglichen Aktionen die Aktion ausgewählt werden, die den optimalen (z.B. den größten) Q-Wert ergibt.
Der o.g. Prozess kann an einer Sequenz von Zeitpunkten wiederholt werden, um dauerhaft das Energiebordnetz zu steuern und/oder zu regeln. Dabei kann an jedem Zeitpunkt der jeweils aktuelle Zustand gemessen und basierend darauf eine Aktion ermittelt werden (die z.B. den jeweils optimalen Q-Wert ergibt).
Das Energiemanagementsystem kann für ein Referenz-Bordnetz angelernt worden sein, wobei das Referenz -Bordnetz dem Energiebordnetz mit fehlerfreien und/oder nicht-beeinträchtigten Bordnetz -Komponenten entsprechen kann.
Das Machine Learning-basierte Energiemanagementsystem kann zumindest einen Regler umfassen, der ausgebildet ist, eine messbare (Zustands-) Größe des Energiebordnetzes auf einen Sollwert zu regeln. Die Belohnung bzw. die Belohnungsfunktion, die beim Anlernen des Energiemanagementsystems (insbesondere des neuronalen Netzes des Energiemanagementsystems) verwendet wird, kann von einer Abweichung des (gemessenen) Istwertes der messbaren Größe von dem Sollwert bei Betrieb des Referenz -Bordnetzes bzw. bei Betrieb des Energiebordnetzes abhängen. Dabei kann die Belohnung umso größer sein, je kleiner die Abweichung des Istwertes von dem Sollwert ist. So kann eine präzise Einstellung von ein oder mehreren Zustandsgrößen des Energiebordnetzes bewirkt werden.
Die Vorrichtung umfasst eine Referenzeinheit, die eingerichtet ist, für einen Zustand des Bordnetzes und für eine basierend auf dem Zustand von dem Energiemanagementsystem bewirkte Aktion eine Referenz-Belohnung zu ermitteln, die sich bei Betrieb des Referenz -Bordnetzes ergeben würde. Dabei kann die Referenzeinheit im Rahmen des Anlernvorgangs des Maschine-erlernten Energiemanagementsystems angelernt worden sein, insbesondere anhand der Belohnungen, die sich im Rahmen des Anlemvorgangs des Maschine-erlernten Energiemanagementsystems für unterschiedliche Kombinationen von Zuständen und Aktionen ergeben haben.
Es kann somit eine Referenzeinheit bereitgestellt werden, die für ein Zustands- Aktions-Paar die Belohnung anzeigt, die sich bei Betrieb des Referenz -Bordnetzes (mit den nicht-beeinträchtigten Bordnetz -Komponenten) ergeben würde. Die Referenzeinheit kann zumindest ein (im Rahmen des Anlemvorgang des Energiemanagementsystems angelerntes) neuronales Netz umfassen.
Die Vorrichtung umfasst ferner eine Belohnungseinheit, die eingerichtet ist, für den Zustand und für die Aktion (d.h. für das Zustands- Aktions-Paar) eine tatsächliche Belohnung zu ermitteln, die sich bei Betrieb des Energiebordnetzes (tatsächlich) ergibt. Dabei können die tatsächliche Belohnung und die Referenz- Belohnung auf Basis der gleichen Belohnungsfunktion ermittelt werden. Wie bereits oben dargelegt können die Belohnung bzw. die Belohnungsfunktion, insbesondere die tatsächliche Belohnung und die Referenz -Belohnung, von ein oder mehreren messbaren (Zustands-) Größen des Bordnetzes abhängen. Insbesondere können die Belohnung bzw. die Belohnungsfunktion, und somit die tatsächliche Belohnung und die Referenz -Belohnung, ein oder mehrere Belohnungskomponenten für die entsprechenden ein oder mehreren messbaren (Zustands-) Größen des Bordnetzes umfassen.
Die Belohnungseinheit kann eingerichtet sein, Messwerte für die ein oder mehreren messbaren (Zustands-) Größen zu ermitteln, die sich infolge der bewirkten Aktion bei Betrieb des Energiebordnetzes ergeben. Die tatsächliche Belohnung kann dann auf Basis der Messwerte für die ein oder mehreren messbaren Größen ermittelt werden. In entsprechender Weise können auch die Belohnungen während des Anlernens des Energiemanagementsystems und der Referenzeinheit ermittelt werden (bei Betrieb des Referenz -Bordnetzes).
Die Vorrichtung umfasst ferner eine Überwachungseinheit, die eingerichtet ist, das Energiebordnetz auf Basis der tatsächlichen Belohnung und auf Basis der Referenz-Belohnung, insbesondere auf Basis eines Vergleichs der tatsächlichen Belohnung und der Referenz -Belohnung, zu überwachen. Die Überwachungseinheit kann insbesondere eingerichtet sein, auf Basis der tatsächlichen Belohnung und auf Basis der Referenz -Belohnung zu bestimmen, ob eine Bordnetz -Komponente des Energiebordnetzes beeinträchtigt ist oder nicht. Des Weiteren kann die Vorrichtung eingerichtet sein, einen Hinweis (z.B. eine Fehlermeldung) in Bezug auf die Bordnetz-Komponente auszugeben, wenn bestimmt wird, dass die Bordnetz -Komponente beeinträchtigt ist.
Die in diesem Dokument beschriebene Vorrichtung ermöglicht es, die (tatsächliche) Belohnung, die sich für ein Zustands- Aktions-Paar bei Betrieb des Energiebordnetzes ergibt, mit der (Referenz-) Belohnung zu vergleichen, die sich für das Zustands- Aktions-Paar bei Betrieb eines entsprechenden fehlerfreien Referenz-Bordnetzes ergibt. So kann eine effiziente und präzise Überwachung des Energiebordnetzes ermöglicht werden. Insbesondere kann so in präziser Weise ein vorausliegender und/oder drohender Ausfall einer Bordnetz -Komponente prädiziert werden.
Wie bereits oben dargelegt, können die Referenz-Belohnung und/oder die tatsächliche Belohnung jeweils ein oder mehrere Belohnungskomponenten umfassen. Beispielhafte Belohnungskomponenten sind: eine Belohnungskomponente in Bezug auf einen Strom und/oder in Bezug auf eine Spannung innerhalb des Bordnetzes und/oder an einer Bordnetz-Komponente; eine Belohnungskomponente in Bezug auf eine Last und/oder in Bezug auf eine Belastung einer Bordnetz -Komponente; und/oder eine Belohnungskomponente in Bezug auf einen Ladezustand eines Energiespeichers des Bordnetzes.
Durch die Berücksichtigung von unterschiedlichen Belohnungskomponenten für unterschiedliche Bordnetz -Komponenten kann die Genauigkeit der Überwachung des Energiebordnetzes weiter erhöht werden. Insbesondere kann in präziser Weise eine bestimmte Bordnetz -Komponente identifiziert werden, die auszufallen droht.
Die Überwachungseinheit kann eingerichtet sein, eine Abweichung der tatsächlichen Belohnung von der Referenz -Belohnung, insbesondere eine Abweichung einer Belohnungskomponente der tatsächlichen Belohnung von einer entsprechenden Belohnungskomponente der Referenz -Belohnung, zu ermitteln.
Es kann dann in präziser Weise auf Basis der Abweichung, insbesondere durch Vergleich der Abweichung mit einem Abweichungs-Schwellenwert, bestimmt werden, ob eine Bordnetz -Komponente beeinträchtigt ist oder nicht. Dabei kann der Abweichungs-Schwellenwert durch Simulation und/oder durch Tests im Vorfeld ermittelt worden sein, insbesondere spezifisch für eine Mehrzahl von unterschiedlichen Bordnetz -Komponenten des Bordnetzes und/oder für eine entsprechende Mehrzahl von unterschiedlichen Belohnungskomponenten. Die tatsächliche Belohnung und die Referenz -Belohnung (d.h. insbesondere die gemeinsame Belohnungsfunktion) können jeweils eine Belohnungskomponente für eine bestimmte Bordnetz -Komponente umfassen. Die Überwachungseinheit kann eingerichtet sein, auf Basis der Abweichung der Belohnungskomponenten der tatsächlichen Belohnung und der Referenz -Belohnung für die bestimmte Bordnetz -Komponente zu bestimmen, ob die bestimmte Bordnetz-Komponente beeinträchtigt ist oder nicht. Durch einen Vergleich von einzelnen Belohnungskomponenten kann somit in besonders präziser Weise eine beeinträchtigte Bordnetz -Komponente des Energiebordnetzes (die droht auszufallen) identifiziert werden.
Gemäß einem weiteren Aspekt wird ein (Straßen-) Kraftfahrzeug (insbesondere ein Personenkraftwagen oder ein Lastkraftwagen oder ein Bus oder ein Motorrad) beschrieben, das die in diesem Dokument beschriebene Vorrichtung umfasst.
Gemäß einem weiteren Aspekt wird ein Verfahren zur Überwachung eines Energiebordnetzes beschrieben, das unterschiedliche Bordnetz -Komponenten umfasst und das anhand eines Maschine-erlernten Energiemanagementsystems betrieben wird, wobei das Energiemanagementsystem mittels Reinforcement Leaming für ein Referenz -Bordnetz angelernt wurde. Das Verfahren umfasst das Ermitteln, für einen Zustand des Bordnetzes und für eine basierend auf dem Zustand von dem Energiemanagementsystem bewirkte Aktion, einer Referenz- Belohnung, die sich bei Betrieb des Referenz -Bordnetzes ergeben würde. Des Weiteren umfasst das Verfahren das Ermitteln, für den Zustand und für die Aktion, einer tatsächlichen Belohnung, die sich bei Betrieb des Energiebordnetzes ergibt. Das Verfahren umfasst ferner das Überwachen des Energiebordnetzes auf Basis der tatsächlichen Belohnung und auf Basis der Referenz -Belohnung, insbesondere auf Basis eines Vergleichs der tatsächlichen Belohnung und der Referenz-B el ohnung. Gemäß einem weiteren Aspekt wird ein Software (SW) Programm beschrieben. Das SW Programm kann eingerichtet werden, um auf einem Prozessor (z.B. auf einem Steuergerät eines Fahrzeugs) ausgeführt zu werden, und um dadurch das in diesem Dokument beschriebene Verfahren auszuführen.
Gemäß einem weiteren Aspekt wird ein Speichermedium beschrieben. Das Speichermedium kann ein SW Programm umfassen, welches eingerichtet ist, um auf einem Prozessor ausgeführt zu werden, und um dadurch das in diesem Dokument beschriebene Verfahren auszuführen.
Es ist zu beachten, dass die in diesem Dokument beschriebenen Verfahren, Vorrichtungen und Systeme sowohl alleine, als auch in Kombination mit anderen in diesem Dokument beschriebenen Verfahren, Vorrichtungen und Systemen verwendet werden können. Des Weiteren können jegliche Aspekte der in diesem Dokument beschriebenen Verfahren, Vorrichtungen und Systemen in vielfältiger Weise miteinander kombiniert werden. Insbesondere können die Merkmale der Ansprüche in vielfältiger Weise miteinander kombiniert werden.
Im Weiteren wird die Erfindung anhand von Ausführungsbeispielen näher beschrieben. Dabei zeigen
Figur 1a ein beispielhaftes elektrisches Bordnetz;
Figur 1b einen beispielhaften Regelkreis;
Figur 2a ein beispielhaftes neuronales Netz;
Figur 2b ein beispielhaftes Neuron;
Figur 3 eine beispielhafte Vorrichtung zum Anlernen eines Reglers;
Figur 4 eine beispielhafte Vorrichtung zur Ermittlung des Zustands eines elektrischen Bordnetzes eines Fahrzeugs; und
Figur 5 ein Ablaufdiagramm eines beispielhaften Verfahrens zur Ermittlung des Zustands eines elektrischen Bordnetzes eines Fahrzeugs. Wie eingangs dargelegt, befasst sich das vorliegende Dokument mit der zuverlässigen und präzisen Vorhersage des Zustands von Komponenten eines elektrischen Bordnetzes eines Fahrzeugs. In diesem Zusammenhang zeigt Fig. 1 ein Blockdiagramm eines Bordnetzes 100, das einen elektrischen Energiespeicher
105 (z.B. eine Lithium-Ionen Batterie), ein oder mehrere elektrische Verbraucher
106 und/oder einen Generator 107 umfasst. Des Weiteren umfasst das Bordnetz 100 ein Energiemanagementsystem 101, das eingerichtet ist, ein oder mehrere (Zustands-) Größen des Bordnetzes 100 einzustellen, insbesondere auf einen jeweiligen Sollwert zu regeln. Eine beispielhafte (Zustands-) Größe des Bordnetzes 100 ist die Bordnetzspannung 111, die z.B. auf einen bestimmten Zielwert eingestellt, insbesondere geregelt, werden kann.
Zur Einstellung einer Regelgröße (z.B. der Bordnetzspannung 111) auf einen (sich mit der Zeit ändernden) Sollwert kann ein Regler verwendet werden. Fig. 1b zeigt einen beispielhaften Regelkreis 150, bei dem die Regelgröße 156 mittels eines Reglers 153 auf einen Sollwert 151 eingestellt wird. Der Regler 153 ist eingerichtet, auf Basis des Regelfehlers 152 (d.h. der Differenz) aus Regelgröße 156 und (dem jeweils aktuellen) Sollwert 151 eine Stellgröße 154 zu ermitteln.
Ein oder mehrere Aktoren des Bordnetzes 100 (z.B. der Generator 107 und/oder ein oder mehrere elektrische Verbraucher 106) können in Abhängigkeit von der Stellgröße 154 betrieben werden. Eine beispielhafte Stellgröße 154 ist die Drehzahl, mit der der Generator 107 (z.B. durch einen Verbrennungsmotor eines Fahrzeugs) betrieben wird. Innerhalb der Regelstrecke 155, die von Eigenschaften des Bordnetzes 100 abhängig ist, ergibt sich aus der Stellgröße 154 die Regelgröße 156 (z.B. der Wert einer Zustandsgröße des Bordnetzes 100).
Eine Möglichkeit zur effizienten und flexiblen Einstellung und/oder Anpassung eines Reglers 153 ist das Anlernen des Reglers 153 bzw. das Anlemen einer Reglerfunktion mittels ein oder mehrerer neuronaler Netze. Figuren 2a und 2b zeigen beispielhafte Komponenten eines neuronalen Netzes 200, insbesondere eines Feedforward-Netzes. Das Netz 200 umfasst in dem dargestellten Beispiel zwei Eingangs-Neuronen bzw. Eingabe-Knoten 202, die zu einem bestimmten Zeitpunkt t jeweils einen aktuellen Wert einer Eingangsgröße als Eingangswert 201 aufnehmen. Die ein oder mehrere Eingangs-Knoten 202 sind Teil einer Eingangs-Schicht 211.
Das neuronale Netz 200 umfasst ferner Neuronen 220 in ein oder mehreren verdeckten Schichten 212 des neuronalen Netzes 200. Jedes der Neuronen 220 kann als Eingangswerte die einzelnen Ausgangswerte der Neuronen der vorhergehenden Schicht 212, 211 aufweisen (oder zumindest einen Teil davon).
In jedem der Neuronen 220 erfolgt eine Verarbeitung, um in Abhängigkeit von den Eingangswerten einen Ausgangswert des Neurons 220 zu ermitteln. Die Ausgangswerte der Neuronen 220 der letzten verdeckten Schicht 212 können in einem Ausgangs-Neuron bzw. Ausgabe-Knoten 220 einer Ausgangs-Schicht 213 verarbeitet werden, um die ein oder mehreren Ausgangswerte 203 des neuronalen Netzes 200 zu ermitteln.
Fig. 2b veranschaulicht die beispielhafte Signalverarbeitung innerhalb eines Neurons 220, insbesondere innerhalb der Neuronen 202 der ein oder mehreren verdeckten Schichten 212 und/oder der Ausgangs-Schicht 213. Die Eingangswerte 221 des Neurons 220 werden mit individuellen Gewichten 222 gewichtet, um in einer Summeneinheit 223 eine gewichtete Summe 224 der Eingangswerte 221 zu ermitteln (ggf. unter Berücksichtigung eines Bias bzw. Offsets 227). Durch eine Aktivierungsfunktion 225 kann die gewichtete Summe 224 auf einen Ausgangswert 226 des Neurons 220 abgebildet werden. Dabei kann durch die Aktivierungsfunktion 225 z.B. eine Begrenzung des Wertebereichs erfolgen. Für ein Neuron 220 kann z.B. eine Sigmoid-Funktion oder eine Tangens hyperbolicus (tanh)-Funktion oder eine Rectified Linear Unit (ReLU), z.B. f(x) = max(0, x) als Aktivierungsfunktion 225 verwendet werden. Ggf. kann der Wert der gewichteten Summe 224 mit einem Offset 227 verschoben werden. Ein Neuron 220 weist somit Gewichte 222 und/oder ggf. einen Offset 227 als Neuron-Parameter auf. Die Neuron-Parameter der Neuronen 220 eines neuronalen Netzes 200 können in einer Trainingsphase angelernt werden, um zu bewirken, dass das neuronale Netz 200 eine bestimmte Funktion approximiert und/oder ein bestimmtes Verhalten modelliert.
Das Anlernen eines neuronalen Netzes 200 kann z.B. anhand des Backpropagation-Algorithmus erfolgen. Zu diesem Zweck können in einer ersten Phase einer qten Epoche eines Lern- Algorithmus für die Eingangswerte 201 an den ein oder mehreren Eingangs-Knoten 202 des neuronalen Netzes 200 entsprechende Ausgangswerte 203 an dem Ausgang der ein oder mehreren Ausgangs-Neuronen 220 ermittelt werden. Auf Basis der Ausgangswerte 203 kann der Wert einer Optimierungs- bzw. Fehlerfunktion ermittelt werden. In dem vorliegenden Fall kann ein Temporal-Differenz (TD) Fehler als Optimierungs- bzw. Fehlerfunktion dienen, wie weiter unten dargelegt.
In einer zweiten Phase der qten Epoche des Lern- Algorithmus erfolgt eine Rückpropagation des Fehlers bzw. des Fehlerwertes von dem Ausgang zum Eingang des neuronalen Netzes, um schichtweise die Neuron-Parameter der Neuronen 220 zu verändern. Dabei kann die ermittelte Fehlerfunktion am Ausgang partiell nach jedem einzelnen Neuron -Parameter des neuronalen Netzes 200 abgeleitet werden, um ein Ausmaß und/oder eine Richtung zur Anpassung der einzelnen Neuron-Parameter zu ermitteln. Dieser Lern- Algorithmus kann iterativ für eine Vielzahl von Epochen wiederholt werden, bis ein vordefiniertes Konvergenz- und/oder Abbruchkriterium erreicht wird.
Zum Anlernen eines Reglers 153 bzw. einer Reglerfunktion, die eingerichtet ist, auf Basis des Regelfehlers 152 die Stellgröße 154 zu ermitteln, kann beispielsweise das sogenannte (Actor-Critic) Reinforcement Leaming verwendet werden. Als weiteres Beispiel kann Q-Leaming verwendet werden. Im Rahmen des Q-Leaming kann eine Q-Funktion erlernt (und z.B. durch ein neuronales Netz 200 approximiert werden), wobei die Q-Funktion dazu genutzt werden kann, für einen bestimmten Zustand eine optimale Aktion auszuwählen.
Fig. 3 veranschaulicht eine beispielhafte Vorrichtung 300 zum Anlernen einer Reglerfunktion 303 für einen Regler 153, insbesondere für ein Energiemanagementsystem 101. Die Reglerfunktion 303 kann z.B. durch ein neuronales Netz 200 approximiert werden. Alternativ oder ergänzend kann die Reglerfunktion 303 durch eine analytische Funktion mit ein oder mehreren Reglerparametern beschrieben werden. Eine beispielhafte Reglerfunktion ist ut = π(xt) = kxt wobei k ein Vektor mit ein oder mehreren Reglerparametern ist und wobei x der Wert eines Zustandsvektors an dem Zeitpunkt t ist, mit den Werten von ein oder mehreren Zustandsgrößen 306 des Zustands des Bordnetzes 100 ist. Beispielhafte Zustandsgrößen 306 sind der Ladezustand des Energiespeichers 105, die Bordnetzspannung 111, die Last des Generators 107, die Last eines elektrischen Verbrauchers 106, etc.
Die Werte der ein oder mehreren Zustandsgrößen 306 können die Abweichung der einzelnen Zustandsgrößen von einem jeweiligen Sollwert 301 anzeigen. In diesem Fall zeigen die Werte xt die Werte von ein oder mehreren Regelfehlern an.
Die Reglerfunktion 303 wird im Rahmen von (Actor-Critic) Reinforcement Leaming als „Actor" bezeichnet. Die Reglerfunktion 303 kann dazu genutzt werden, auf Basis der aktuellen Werte der ein oder mehreren Zustandsgrößen 306 die aktuellen Werte ut von ein oder mehreren Stell- bzw. Aktionsgrößen bzw. Aktionen 304 zu ermitteln. Eine beispielhafte Stell- bzw. Aktionsgröße bzw. Aktion 304 ist die angeforderte Last des Generators 107 und/oder die durch einen Verbraucher 106 bewirkte Last. Die aktuellen Werte ut der ein oder mehreren Stell- bzw. Aktionsgrößen 304 können dazu verwendet werden, das zu regelnde System bzw. die Regelstrecke 305 zu betreiben. Insbesondere können ein oder mehrere Komponenten 106, 107 des Bordnetzes 100 in Abhängigkeit von den aktuellen Werten ut der ein oder mehreren Stell- bzw. Aktionsgrößen 304 betrieben werden. Dies bewirkt Werte xt+1 der ein oder mehreren messbaren Zustandsgrößen 306 an einem nachfolgenden Zeitpunkt t + 1.
Auf Basis der aktuellen Werte xt der ein oder mehreren messbaren Zustandsgrößen 306 und auf Basis der aktuellen Werte ut der ein oder mehreren Stell- bzw. Aktionsgrößen 304 kann der Wert einer Wertefunktion ermittelt werden. Die Wertefunktion kann dabei der diskontierten Summe von (zukünftigen) Belohnungen entsprechen. Zu jedem Zeitpunkt t kann eine Belohnung r(xt, ut) in Abhängigkeit von einer bestimmten Belohnungsfunktion vergeben werden. Die Belohnung kann z.B. davon abhängen,
• wie gut der Ladezustand des Energiespeichers 105 auf einen bestimmten Ziel-Ladezustand eingestellt ist; und/oder
• wie nah die von den Generator 107 bewirkte Last an einer bestimmten Ziel-Last liegt.
Die Belohnung r(xt, ut) kann unterschiedliche Belohnungsterme bzw. Belohnungskomponenten für unterschiedliche Regelgrößen und/oder Zustandsgrößen 306 aufweisen. Die einzelnen Belohnungskomponenten können zu einem Belohnungsvektor zusammengefasst werden. Der aktuelle Wert 302 der Belohnung r(xt,ut) (d.h. der Belohnungsfunktion) an einem bestimmten Zeitpunkt t kann durch die Einheit 307 berechnet werden.
Die Reglerfunktion 303 kann derart angelernt werden, dass die Summe der über der Zeit diskontierten Belohnungen vergrößert, insbesondere maximiert, wird. Da aufgrund der unbekannten Regelstrecke 305 nicht bekannt ist, wie sich Aktionen bzw. Stellgrößen 304 auf die Werte xt der ein oder mehreren (messbaren) Zustandsgrößen 306 (d.h. die Werte der Regelfehler) aufweisen, kann als „Critic" eine Zustands-Aktions-Wertefunktion 308 angelernt werden, die für jede Kombination aus einem Zustand xt des zu regelnden Systems 305 (d.h. des Bordnetzes 100) und einer Aktion ut 304 einen Wert Qπ(xt,ut) 310 der Summe der über der Zeit diskontierten Belohnungen anzeigt.
Andererseits kann eine Zustands-Wertefunktion definiert werden, die für einen bestimmten Zustand xt die Summe der über der Zeit i diskontierten Belohnungen r(Xi,Ui) anzeigt,
Figure imgf000017_0001
mit dem Diskontierungsfaktor g E [0,1]. Dabei kann nach Konvergenz der Wertefunktionen angenommen werden,
Vπ(xt+1) — Qπ(t+1 , ut+1) wobei u t+1 = π(xt+1) mit der angelernten Reglerfunktion π() 303 ist. Die Wertefunktionen können iterativ mit der Zeit angelernt werden, wobei nach Konvergenz gelten sollte
Qπ(xt,ut) = r(xt,ut) + yVπ(xt+1).
Solange noch keine Konvergenz erreicht ist, kann auf Basis der o.g. Gleichung ein sogenannter Temporal-Differenz (TD) Fehler δ 311 errechnet werden (z.B. in der Einheit 309), als δ = r(xt,ut) + γVπ(xt+1) - Qπ (xt,ut) wobei der TD-Fehler δ 311 unter der Annahme Vπ(xt+1) = Qπ(xt+1, ut+1) aus dem Wert r(xt, ut) 302 der Belohnung an dem Zeitpunkt t und aus den Werten Qπ(xt,ut), Qπ(xt+1,ut+1) 310 der Zustands-Aktions-Wertefunktion 308 an den Zeitpunkten t und t + 1 berechnet werden kann. Der Wert 302 der Belohnung kann zu diesem Zweck in der Einheit 309 bereitgestellt werden (nicht dargestellt). Der TD-Fehler δ 311 kann dazu verwendet werden, iterativ die Zustands- Aktions-Wertefunktion 308 und ggf. die Reglerfunktion 303 anzulemen. Insbesondere kann der TD-Fehler δ 311 dazu verwendet werden, die Zustands- Aktions-Wertefunktion 308 anzulernen. Die angelernte Zustands-Aktions- Wertefunktion 308 kann dann dazu verwendet werden, die Reglerfunktion 303 anzulemen.
Die Zustands- Aktions-Wertefunktion 308 kann durch ein neuronales Netz 200 approximiert und/oder modelliert werden, und auf Basis des TD-Fehlers δ 311 angepasst werden. Nach Anpassen der Zustands-Aktions-Wertefunktion 308 kann die Reglerfunktion 303 angepasst werden. Die Vorrichtung 300 kann eingerichtet sein, die Reglerfunktion 303 und/oder die Zustands-Aktions-Wertefunktion 308 iterativ für eine Vielzahl von Zeitpunkten t anzupassen, bis ein Konvergenzkriterium erreicht ist. So kann in effizienter und präziser Weise eine Reglerfunktion 303 für einen Regler 153 ermittelt werden.
In entsprechender Weise können mehrere Regler 153 für mehrere Regel- bzw. Zustandsgrößen 106 eines Machine-Leaming basierten Energiemanagementsystems 101 angelernt werden.
Wie bereits oben dargelegt, ist das in Zusammenhang mit Fig. 3 beschriebene Verfahren nur ein Beispiel zum Anlemen eines Energiemanagementsystems 101 anhand von reinforcement learning. Ein weiteres Beispiel ist Q-Leaming. In diesem Fall kann eine Q-Funktion bzw. eine Zustands-Aktions-Wertefunktion 308 angelernt werden, die ausgebildet ist, für ein Zustands-Aktions-Paar einen Q-Wert bereitzustellen (wobei der Q-Wert z.B. die Summe der diskontierten zukünftigen Belohnungen anzeigt). Ausgehend von einem aktuellen Zustand können anhand der angelernten Q-Funktion für mehrere unterschiedliche mögliche Aktionen entsprechende Q-Werte ermittelt werden. Es kann dann die Aktion ausgewählt werden, für die sich der optimale (z.B. der maximale) Q-Wert ergibt. Fig. 4 zeigt eine Vorrichtung 450, die es ermöglicht, den Zustand der unterschiedlichen Komponenten 105, 106, 107 eines Bordnetzes 100 zu überwachen, insbesondere um frühzeitig einen Ausfall einer Komponente 105, 106, 107 Vorhersagen zu können. Die Vorrichtung 400 umfasst eine Referenzeinheit 400, die eingerichtet ist, auf Basis des aktuellen Zustands xt 306 des Bordnetzes 100 und auf Basis einer durch das Energiemanagementsystem 101 bewirkten Aktion ut 304 die (Referenz-) Belohnung r(xt,ut) 302, insbesondere den (Referenz-) Belohnungsvektor, zu ermitteln, die sich bei einem einwandfrei funktionierenden Bordnetz 100 ergeben würde. Die Referenzeinheit 400 kann während des Anlemvorgangs (der Regler 153) des Energiemanagementsystems 101 angelernt werden. Zu diesem Zweck kann die Referenzeinheit 400 ein neuronales Netz 200 umfassen.
Die Vorrichtung 450 umfasst ferner eine Belohnungseinheit 410, die eingerichtet ist, auf Basis des aktuellen Zustands xt 306 des Bordnetzes 100 und auf Basis der durch das Energiemanagementsystem 101 bewirkten Aktion ut 304 die tatsächliche Belohnung r(xt,ut) 402, insbesondere den tatsächlichen Belohnungsvektor, zu ermitteln, der sich bei Betrieb des Bordnetzes 100 tatsächlich ergibt (unter Verwendung der Belohnungsfunktion).
Die Referenz -Belohnung 302 und die tatsächliche Belohnung 402 können in einer Vergleichs- und/oder Überprüfungseinheit 420 miteinander verglichen werden. Insbesondere können die einzelnen Vektorgrößen des Referenz- Belohnungsvektors mit den entsprechenden Vektorgrößen des tatsächlichen Belohnungsvektors verglichen werden. Basierend auf dem Vergleich kann dann der Zustand 405 des Bordnetzes 100 ermittelt werden. Insbesondere kann basierend auf dem Vergleich eine Vorhersage darüber getroffen werden, ob eine Komponente 105, 106, 107 des Bordnetzes 100 innerhalb eines bestimmten vorausliegenden Zeitintervalls ausfallen wird. Ggf. kann auch die Komponente 105, 106,107 identifiziert werden, die ausfallen wird. In diesem Dokument wird somit die Diagnose und/oder die Ausfallvorhersage von Komponenten 105, 106, 107 in einem Fahrzeug beschrieben, das ein mit Machine Leaming-basiertes Energiemanagement aufweist. Das Energiemanagementsystem 101 kann z.B. anhand von Reflex-Augmented Reinforcement Leaming (RARL) oder anhand von Reinforcement Learning angelernt worden sein. RARL wird z.B. in Heimrath et al., „Reflex-Augmented Reinforcement Learning for Operating Strategies in Automotive Electrical Energy Management “, Proceeding of the 2019 International Conference on Computing, Electronics & Communications Engineering, IEEE, 2019, pp. 62-67, beschrieben. Der Inhalt dieses Dokument wird hiermit durch Bezugnahme vollständig in das vorliegende Dokument aufgenommen.
Der Agent, z.B. ein tiefes neuronales Netz 200, lernt dabei, welche Aktionen 304 in einem bestimmten Normalzustand 306 des Fahrzeug-Bordnetzes 100 auszuführen sind. Eine Aktion 304 kann z.B. das Erhöhen der Bordnetzspannung 111 umfassen. Nach dem Ausführen einer Aktion 304 ändert sich der Zustand 306 des Bordnetzes 100 und der Agent erhält in Form des Rewards (d.h. in Form einer Belohnung 302) eine Rückmeldung über die Qualität seiner Entscheidung (d.h. der bewirkten Aktion 304). Diese Belohnung 302 fließt in den Lernvorgang des Energiemanagementsystems 101 ein. Der Zustand des Bordnetzes 100 kann mehrere Zustandsgrößen 306 umfassen, wie z.B. die Auslastung des Generators 107, den (normalisierten) Strom in oder aus dem Energiespeicher 105, den Ladezustands (insbesondere den State of Charge, SOC) des Energiespeichers 105, die Temperatur des Energiespeichers 105, etc.).
In diesem Dokument wird ein Diagnosemodul 450 beschrieben, das zumindest teilweise in den Lemvorgang des Energiemanagementsystems 101 integriert wird. Insbesondere kann dabei die Referenzeinheit 400 während des Lernvorgangs des Energiemanagementsystems 101 angelernt werden. Dadurch wird das Diagnosemodul 450 befähigt, ein Fehlverhalten und/oder den Ausfall einer Komponente 105, 106, 107 des Bordnetzes 100 zu prädizieren und/oder zu quantifizieren. Das Diagnosemodul 450 kann ausgebildet sein (anhand der Referenzeinheit 400), die erwartete Auswirkung der Ausführung einer Aktion 304 in dem Bordnetz 100 vorherzusagen. Des Weiteren kann das Diagnosemodul 450 ausgebildet sein, das erwartete Verhalten des Bordnetzes 100 mit dem tatsächlichen Verhalten des Bordnetzes 100 zu vergleichen (innerhalb der Vergleich- bzw. Überprüfungseinheit 420).
Während des Trainings des Energiemanagementsystems 101 in einem (Referenz-) Bordnetz 100 mit funktionsfähigen Komponenten 105, 106, 107 wird parallel dazu und unabhängig die Referenzeinheit 400 (mit einem separaten neuronalen Netz 200) angelernt. Während des Trainings des Energiemanagementsystems 101 führt der Agent ausgehend von einem bestimmten Zustand 306 eine Aktion 304 aus und erhält dafür eine Belohnung 302. Diese Informationen werden für das Training der Referenzeinheit 400 verwendet, um die Referenzeinheit 400 zu befähigen, die erwartete Auswirkung der Ausführung einer Aktion 304 in einem funktionsfähigen (Referenz-) Bordnetz 100 als Belohnung 302 vorherzusagen.
Nach dem Training des Energiemanagementsystems 101 und/oder beim Einsatz während einer Fahrt in einem Fahrzeug ist auch das Training der Referenzeinheit 400 beendet. Während des Betriebs des Energiemanagementsystems 101 wählt das Energiemanagementsystem 101 ausgehend von einem bestimmten Zustand 306 jeweils eine Aktion 304 aus und führt diese Aktion 304 aus. Es kann dann basierend auf den tatsächlich gemessenen Größen des Bordnetzes 100 eine tatsächlich gemessene Belohnung 402 ermittelt werden (innerhalb der Belohnungseinheit 420).
Die von der Referenzeinheit 400 vorhergesagte Belohnung 302 (des fehlerfreien (Referenz-) Bordnetzes 100) kann dann mit der tatsächlichen gemessenen Belohnung 402 (des Bordnetzes 100) verglichen werden. Dabei können die jeweiligen Belohnungen 302, 402 unterschiedliche Belohnungskomponenten aufweisen, die jeweils paarweise verglichen werden können. Der Vergleich der tatsächlich gemessenem Belohnung 402 und der vorhergesagten Belohnung 302 zeigt an, ob ein oder mehrere Komponenten 105, 106, 107 des Energiebordnetzes 100 ein von einem Sollverhalten abweichendes Ist-Verhalten aufweisen.
Für die Differenz der Werte der Belohnungen 302, 402 und/oder der einzelnen Belohnungskomponenten können Toleranzen und/oder Schwellenwerte festgelegt werden, ab denen ein Fehlerfall detektiert wird. Die Toleranzen und/oder Schwellenwerte können im Rahmen einer Simulation und/oder auf Basis von Tests an Fahrzeugen (z.B. im Rahmen der Entwicklung) ermittelt werden.
Wenn auf Basis des Vergleichs der Belohnungen 302, 402 ein Fehler detektiert wird, so kann ein Hinweis an den Fahrer des Fahrzeugs und/oder an eine Wartungs-Organisation zur Wartung des Fahrzeugs ausgegeben werden. Ggf. kann veranlasst werden, dass der Fahrer des Fahrzeugs manuell die Führung des Fahrzeugs übernimmt, wenn erkannt wird, dass aufgrund des detektierten Fehlers (z.B. eines Fehlers des Energiespeichers 105) kein automatisierter Fährbetrieb mehr möglich ist.
Die Belohnungen 302, 402 können z.B. eine Funktion des Batteriestroms in den oder aus dem Energiespeicher 105 und/oder der Auslastung des Generators 107 sein. Wenn beispielsweise die Belohnungen 302, 402 eine Funktion des Batteriestroms sind und wenn der Funktionsfähigkeitszustand des Generators 107 (z.B. aufgrund der Sensordaten eines dedizierten Sensors) bekannt ist, so kann die berechnete Abweichung der vorhergesagten Belohnung 302 von der tatsächlichen Belohnung 402 als quantitativer Indikator auf die Funktionsfähigkeit des Energiespeichers 105 verwendet werden. Andererseits kann aus der Abweichung der Belohnungen 402, 402 in Bezug auf die Auslastung des Generators 107 auf die Funktionsfähigkeit des Generators 107 geschlossen werden.
Wenn die Belohnung 302, 402 eine Funktion des Batteriestroms und der Generatorauslastung ist, so kann die Gewichtung der beiden Einflussgrößen innerhalb der Belohnung 302, 402 für die Interpretation der Abweichung der vorhergesagten Belohnung 302 von der tatsächlichen Belohnung 402 verwendet werden. Insbesondere können die Gewichte der einzelnen Belohnungskomponenten dafür verwendet werden, zu entscheiden, welche Bordnetz-Komponente 105, 106, 107 beeinträchtigt ist.
Fig. 5 zeigt ein Ablaufdiagramm eines beispielhaften (ggf. Computer - implementierten) Verfahrens 500 zur Überwachung eines Energiebordnetzes 100 (eines Kraftfahrzeugs), das unterschiedliche Bordnetz -Komponenten 105, 106,
107 (z.B. einen elektrischen Energiespeicher 105, ein oder mehrere elektrische Verbraucher 106 und/oder einen Generator 107) umfasst und das anhand eines Maschine-erlernten Energiemanagementsystems 101 betrieben wird. Das Energiemanagementsystem 101 kann dabei mittels Reinforcement Learning für ein Referenz -Bordnetz angelernt worden sein. Dabei kann das Referenz -Bordnetz dem Energiebordnetz 100 für den Fall entsprechen, dass das Energiebordnetz 100 ausschließlich fehlerfreie und/oder nicht beeinträchtigte Bordnetz -Komponenten 105, 106, 107 aufweist.
Das Verfahren 500 umfasst das Ermitteln 501, für einen Zustand 306 des Bordnetzes 100 und für eine basierend auf dem Zustand 306 von dem Energiemanagementsystem 101 bewirkte Aktion 304, einer Referenz-Belohnung 302, die sich bei Betrieb des Referenz-Bordnetzes ergeben würde. Dabei kann eine Referenzeinheit 400 verwendet werden, die ausgebildet ist, für ein Zustands- Aktions-Paar jeweils die Referenz -Belohnung bereitzustellen. Die Referenzeinheit 400 kann beim Anlemen des Energiemanagementsystems 101 mittels Reinforcement Learning mit angelernt worden sein.
Des Weiteren umfasst das Verfahren 500 das Ermitteln 502, für den Zustand 306 und für die Aktion 304, einer tatsächlichen Belohnung 402, die sich bei Betrieb des Energiebordnetzes 100 ergibt. Die tatsächliche Belohnung 402 kann dabei auf Basis von Messwerten für ein oder mehrere Messgrößen des Energiebordnetzes 100 ermittelt werden.
Das Verfahren 500 umfasst ferner das Überwachen 503 des Energiebordnetzes 100 auf Basis der tatsächlichen Belohnung 402 und auf Basis der Referenz- Belohnung 302, insbesondere auf Basis eines Vergleichs der tatsächlichen Belohnung 402 und der Referenz -Belohnung 302. Dabei kann insbesondere auf Basis der tatsächlichen Belohnung 402 und auf Basis der Referenz -Belohnung 302 eine beeinträchtigte Bordnetz -Komponente 105, 106, 107 identifiziert werden.
Durch die in diesem Dokument beschriebenen Maßnahmen können der Komfort und die Sicherheit eines Energiebordnetzes 100 (für ein Fahrzeug) erhöht werden. Dabei kann es ermöglicht werden, vorherzusagen, ob das Energiebordnetz 100 oder Teile 105, 106, 107 des Energiebordnetzes 100 die an das Bordnetz 100 gestellten Anforderungen nicht mehr erfüllen. So können Komponenten 105, 106, 107, für die eine Verschlechterung vorhergesagt wird, frühzeitig repariert oder ausgetauscht werden, bevor eine spürbare Beeinträchtigung des Bordnetzes 100 vorliegt. Ferner kann durch die beschriebenen Maßnahmen eine sichere Energieversorgung für ein automatisiert fahrendes Fahrzeugs bereitgestellt werden. Des Weiteren können Qualitätsschwankungen bei den Komponenten 105, 106, 107 eines Bordnetzes 100 erkannt werden.
Die vorliegende Erfindung ist nicht auf die gezeigten Ausführungsbeispiele beschränkt. Insbesondere ist zu beachten, dass die Beschreibung und die Figuren nur das Prinzip der vorgeschlagenen Verfahren, Vorrichtungen und Systeme veranschaulichen sollen.

Claims

Ansprüche
1) Vorrichtung (450) zur Überwachung eines Energiebordnetzes (100), das unterschiedliche Bordnetz-Komponenten (105, 106, 107) umfasst und das anhand eines Maschine-erlernten Energiemanagementsystems (101) betrieben wird; wobei das Energiemanagementsystem (101) mittels Reinforcement Leaming für ein Referenz-Bordnetz angelernt wurde; wobei die Vorrichtung (450) umfasst,
- eine Referenzeinheit (400), die eingerichtet ist, für einen Zustand (306) des Energiebordnetzes (100) und für eine basierend auf dem Zustand (306) von dem Energiemanagementsystem (101) bewirkte Aktion (304) eine Referenz -Belohnung (302) zu ermitteln, die sich bei Betrieb des Referenz -Bordnetzes ergeben würde;
- eine Belohnungseinheit (410), die eingerichtet ist, für den Zustand (306) und für die Aktion (304) eine tatsächliche Belohnung (402) zu ermitteln, die sich bei Betrieb des Energiebordnetzes (100) ergibt; und
- eine Überwachungseinheit (420), die eingerichtet ist, das Energiebordnetz (100) auf Basis der tatsächlichen Belohnung (402) und auf Basis der Referenz-Belohnung (302), insbesondere auf Basis eines Vergleichs der tatsächlichen Belohnung (402) und der Referenz- Belohnung (302), zu überwachen.
2) Vorrichtung (450) gemäß Anspruch 1, wobei die Referenzeinheit (400) im Rahmen eines Anlernvorgangs des Maschine-erlernten Energiemanagementsystems (101) angelernt wurde, insbesondere anhand von Belohnungen (302), die sich im Rahmen eines Anlemvorgangs des Maschine- erlernten Energiemanagementsystems (101) für unterschiedliche Kombinationen von Zuständen (306) und Aktionen (304) ergeben haben.
3) Vorrichtung (450) gemäß einem der vorhergehenden Ansprüche, wobei - die Referenz-Belohnung (302) und/oder die tatsächliche Belohnung (402) jeweils ein oder mehrere Belohnungskomponenten umfassen; und
- die ein oder mehreren Belohnungskomponenten umfassen,
- eine Belohnungskomponente in Bezug auf einen Strom und/oder in Bezug auf eine Spannung innerhalb des Energiebordnetzes (100) und/oder an einer Bordnetz- Komponente (105, 106, 107);
- eine Belohnungskomponente in Bezug auf eine Last und/oder in Bezug auf eine Belastung einer Bordnetz -Komponente (105, 106, 107); und/oder
- eine Belohnungskomponente in Bezug auf einen Ladezustand eines Energiespeichers (105) des Energiebordnetzes (100).
4) Vorrichtung (450) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung (450), insbesondere die Überwachungseinheit (420), eingerichtet ist,
- eine Abweichung der tatsächlichen Belohnung (402) von der Referenz- Belohnung (302), insbesondere eine Abweichung einer Belohnungskomponente der tatsächlichen Belohnung (402) von einer entsprechenden Belohnungskomponente der Referenz -Belohnung (302), zu ermitteln; und
- auf Basis der Abweichung, insbesondere durch Vergleich mit einem Abweichungs-Schwellenwert, zu bestimmen, ob eine Bordnetz- Komponente (105, 106, 107) beeinträchtigt ist oder nicht.
5) Vorrichtung (450) gemäß Anspruch 4, wobei
- die tatsächliche Belohnung (402) und die Referenz-Belohnung (302) jeweils eine Belohnungskomponente für eine bestimmte Bordnetz- Komponente (105, 106, 107) umfassen; und - die Vorrichtung (450), insbesondere die Überwachungseinheit (420), eingerichtet ist, auf Basis der Abweichung der Belohnungskomponenten der tatsächlichen Belohnung (402) und der Referenz-Belohnung (302) für die bestimmte Bordnetz -Komponente (105, 106, 107) zu bestimmen, ob die bestimmte Bordnetz- Komponente (105, 106, 107) beeinträchtigt ist oder nicht.
6) Vorrichtung (450) gemäß einem der Ansprüche 4 bis 5, wobei der
Abweichungs-Schwellenwert durch Simulation und/oder durch Tests im Vorfeld ermittelt wurde, insbesondere spezifisch für eine Mehrzahl von unterschiedlichen Bordnetz -Komponenten (105, 106, 107) des Energiebordnetzes (100) und/oder für eine entsprechende Mehrzahl von unter schi edli chen B el ohnungskomponenten .
7) Vorrichtung (450) gemäß einem der vorhergehenden Ansprüche, wobei
- die tatsächliche Belohnung (402) und die Referenz-Belohnung (302) von ein oder mehreren messbaren Größen des Energiebordnetzes (100) abhängen;
- die tatsächliche Belohnung (402) und die Referenz-Belohnung (302) insbesondere ein oder mehrere Belohnungskomponenten für die entsprechenden ein oder mehreren messbaren Größen des Energiebordnetzes (100) umfassen; und
- die Belohnungseinheit (410) eingerichtet ist,
- Messwerte für die ein oder mehreren messbaren Größen zu ermitteln, die sich infolge der bewirkten Aktion (304) bei Betrieb des Energiebordnetzes (100) ergeben; und
- die tatsächliche Belohnung (402) auf Basis der Messwerte für die ein oder mehreren messbaren Größen zu ermitteln.
8) Vorrichtung (450) gemäß einem der vorhergehenden Ansprüche, wobei - das Maschine-erlernte Energiemanagementsystem (101) zumindest einen Regler (150) umfasst, der ausgebildet ist, eine messbare Größe des Energiebordnetzes (100) auf einen Sollwert zu regeln; und
- die tatsächliche Belohnung (402) und die Referenz-Belohnung (302) von einer Abweichung eines Istwertes der messbaren Größe von dem Sollwert bei Betrieb des Referenz -Bordnetzes bzw. bei Betrieb des Energiebordnetzes (100) abhängen.
9) Vorrichtung (450) gemäß einem der vorhergehenden Ansprüche, wobei die Referenzeinheit (400) zumindest ein neuronales Netz (200) umfasst.
10) Vorrichtung (450) gemäß einem der vorhergehenden Ansprüche, wobei die Vorrichtung (450), insbesondere die Überwachungseinheit (420), eingerichtet ist,
- auf Basis der tatsächlichen Belohnung (402) und auf Basis der Referenz-Belohnung (302) zu bestimmen, ob eine Bordnetz- Komponente (105, 106, 107) beeinträchtigt ist oder nicht; und
- einen Hinweis in Bezug auf die Bordnetz -Komponente (105, 106, 107) auszugeben, wenn bestimmt wird, dass die Bordnetz -Komponente (105, 106, 107) beeinträchtigt ist.
11) Vorrichtung (450) gemäß einem der vorhergehenden Ansprüche, wobei das Referenz-Bordnetz dem Energiebordnetz (100) mit fehlerfreien und/oder nicht-beeinträchtigten Bordnetz -Komponenten (105, 106, 107) entspricht.
12) Verfahren (500) zur Überwachung eines Energiebordnetzes (100), das unterschiedliche Bordnetz-Komponenten (105, 106, 107) umfasst und das anhand eines Maschine-erlernten Energiemanagementsystems (101) betrieben wird; wobei das Energiemanagementsystem (101) mittels Reinforcement Leaming für ein Referenz -Bordnetz angelernt wurde; wobei das Verfahren (500) umfasst, - Ermitteln (501), für einen Zustand (306) des Energiebordnetzes (100) und für eine basierend auf dem Zustand (306) von dem Energiemanagementsystem (101) bewirkte Aktion (304), einer Referenz-Belohnung (302), die sich bei Betrieb des Referenz- Bordnetzes ergeben würde;
- Ermitteln (502), für den Zustand (306) und für die Aktion (304), einer tatsächlichen Belohnung (402), die sich bei Betrieb des Energiebordnetzes (100) ergibt; und
- Überwachen (503) des Energiebordnetzes (100) auf Basis der tatsächlichen Belohnung (402) und auf Basis der Referenz -Belohnung
(302), insbesondere auf Basis eines Vergleichs der tatsächlichen Belohnung (402) und der Referenz -Belohnung (302).
PCT/EP2021/053662 2020-03-13 2021-02-15 Verfahren und vorrichtung zur überwachung eines elektrischen bordnetzes eines fahrzeugs WO2021180428A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202180014666.0A CN115135526A (zh) 2020-03-13 2021-02-15 用于监控车辆的车载网络的方法和装置
US17/801,306 US20230090528A1 (en) 2020-03-13 2021-02-15 Method and Device for Monitoring an On-Board Electrical System of a Vehicle

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102020107003.9A DE102020107003A1 (de) 2020-03-13 2020-03-13 Verfahren und Vorrichtung zur Überwachung eines elektrischen Bordnetzes eines Fahrzeugs
DE102020107003.9 2020-03-13

Publications (1)

Publication Number Publication Date
WO2021180428A1 true WO2021180428A1 (de) 2021-09-16

Family

ID=74666705

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2021/053662 WO2021180428A1 (de) 2020-03-13 2021-02-15 Verfahren und vorrichtung zur überwachung eines elektrischen bordnetzes eines fahrzeugs

Country Status (4)

Country Link
US (1) US20230090528A1 (de)
CN (1) CN115135526A (de)
DE (1) DE102020107003A1 (de)
WO (1) WO2021180428A1 (de)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240016675A1 (en) * 2022-07-15 2024-01-18 Sunrise Medical (Us) Llc Neural network-based monitoring of components and subsystems for personal mobility vehicles

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102016220561A1 (de) * 2016-10-20 2018-04-26 Bayerische Motoren Werke Aktiengesellschaft Verfahren zur Ermittlung von Fahrrouten für Landfahrzeuge
CN109552079A (zh) * 2019-01-28 2019-04-02 浙江大学宁波理工学院 一种基于规则与Q-learning增强学习的电动汽车复合能量管理方法
DE102018205797A1 (de) * 2018-04-17 2019-10-17 Bayerische Motoren Werke Aktiengesellschaft Steuerung für ein Fahrzeug, Fahrzeug und Verfahren zum Betreiben eines Energiebordnetzes eines Fahrzeugs
US20200004210A1 (en) * 2018-06-27 2020-01-02 Lg Electronics Inc. Automatic control artificial intelligence device and method for update control function
DE102018211575A1 (de) * 2018-07-12 2020-01-16 Audi Ag Verfahren zum Betrieb eines elektrischen Bordnetzes eines Kraftfahrzeugs und Kraftfahrzeug

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004004280B4 (de) 2004-01-27 2014-06-12 Audi Ag Verfahren zur Diagnose von Batterien
DE202019100641U1 (de) 2019-02-04 2019-02-08 Abb Schweiz Ag Trainingsgerät für KI-Module

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102016220561A1 (de) * 2016-10-20 2018-04-26 Bayerische Motoren Werke Aktiengesellschaft Verfahren zur Ermittlung von Fahrrouten für Landfahrzeuge
DE102018205797A1 (de) * 2018-04-17 2019-10-17 Bayerische Motoren Werke Aktiengesellschaft Steuerung für ein Fahrzeug, Fahrzeug und Verfahren zum Betreiben eines Energiebordnetzes eines Fahrzeugs
US20200004210A1 (en) * 2018-06-27 2020-01-02 Lg Electronics Inc. Automatic control artificial intelligence device and method for update control function
DE102018211575A1 (de) * 2018-07-12 2020-01-16 Audi Ag Verfahren zum Betrieb eines elektrischen Bordnetzes eines Kraftfahrzeugs und Kraftfahrzeug
CN109552079A (zh) * 2019-01-28 2019-04-02 浙江大学宁波理工学院 一种基于规则与Q-learning增强学习的电动汽车复合能量管理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HEIMRATH ANDREAS ET AL: "Reflex-Augmented Reinforcement Learning for Operating Strategies in Automotive Electrical Energy Management", 22 August 2019, 2019 INTERNATIONAL CONFERENCE ON COMPUTING, ELECTRONICS & COMMUNICATIONS ENGINEERING (ICCECE), IEEE, PAGE(S) 62 - 67, XP033679345 *
HEIMRATH ET AL.: "Proceeding of the 2019 International Conference on Computing, Electronics & Communications Engineering", 2019, IEEE, article "Reflex-Augmented Reinforcement Learning for Operating Strategies in Automotive Electrical Energy Management", pages: 62 - 67

Also Published As

Publication number Publication date
US20230090528A1 (en) 2023-03-23
DE102020107003A1 (de) 2021-09-16
CN115135526A (zh) 2022-09-30

Similar Documents

Publication Publication Date Title
DE102016013985A1 (de) Vorrichtung für maschinelles Lernen und Verfahren zum Optimieren der Laufruhe des Vorschubs der Vorschubachse einer Maschine und eine die Vorrichtung für maschinelles Lernen umfassende Motorsteuervorrichtung
WO2020109108A1 (de) Verfahren zum überwachen eines energiespeichers in einem bordnetz
DE102013211543A1 (de) Verfahren zum alterungs- und energieeffizienten Betrieb insbesondere eines Kraftfahrzeugs
WO2018077658A1 (de) Verfahren zum überwachen eines kraftfahrzeugs mit automatisierter fahrfunktion und vorrichtung zum durchführen des verfahrens
EP3519242A1 (de) Verfahren zum betreiben eines energiebordnetzes eines kraftfahrzeugs
EP3899682B1 (de) Überwachung von auf neuronalen netzwerken basierten fahrfunktionen
WO2004034166A1 (de) Vorrichtung und verfahren zur überwachung einer mehrere systeme umfassenden technischen anlage, insbesondere einer kraftwerksanlage
WO2019057871A1 (de) Verfahren zum überwachen mindestens einer komponente eines kraftfahrzeugs
DE102020212277A1 (de) Verfahren und Vorrichtung zum Bestimmen einer Restnutzungsdauer basierend auf einer prädiktiven Diagnose von Komponenten eines elektrischen Antriebssystems mithilfe Verfahren künstlicher Intelligenz
DE102016221249A1 (de) Verfahren zum Betreiben eines Bordnetzes
DE102020212414A1 (de) Verfahren zum Überwachen eines Bordnetzes eines Kraftfahrzeugs
DE102020107001A1 (de) Verfahren und Vorrichtung zur Ermittlung des Zustands eines elektrischen Bordnetzes eines Fahrzeugs
WO2021180428A1 (de) Verfahren und vorrichtung zur überwachung eines elektrischen bordnetzes eines fahrzeugs
DE102017216801A1 (de) Verfahren zum Überwachen mindestens einer Komponente eines Kraftfahrzeugs
EP3519251A1 (de) Verfahren zum betreiben eines energiebordnetzes
EP2102723A1 (de) Verfahren und vorrichtung zum diagnostizieren von funktionen und fahrzeugsystemen
DE102020210826A1 (de) Verfahren und Vorrichtung zum Steuern eines elektronischen Wandlers in einem technischen System mithilfe Methoden künstlicher Intelligenz
DE102012221277A1 (de) Fahrzeugsteuervorrichtung
DE102019203783B4 (de) Verfahren, Programm und System zur Verwendung von Signalqualitätsanforderungen im Rahmen von Sicherheitskonzepten
DE102009027517A1 (de) Verfahren zur Adaption einer Steuerungsfunktion in einem Steuergerät
DE102021201628B4 (de) Computerimplementiertes Verfahren und Vorrichtung zur Codierung und Verarbeitung von hochdimensionalen Sensorpfaddaten einer Sensoreinheit zur Steuerung eines Fahrzeugs
WO2024002693A1 (de) Verfahren zum abschätzen von modellunsicherheiten mittels eines neuronalen netzes und eine architektur des neuronalen netzes
DE102021206942A1 (de) Verfahren zum Entwickeln einer Regelstrategie für den Betrieb eines Bordnetzes
DE102015221951A1 (de) Verfahren zur Überprüfung einer Überwachungsfunktion
DE102020212287A1 (de) Verwendung von Signalintegritäten in Embedded Systemen

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21706220

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21706220

Country of ref document: EP

Kind code of ref document: A1