WO2022238082A1 - Computer-implemented method and control device for controlling a drive train of a vehicle by means of a convolutional neural network - Google Patents

Computer-implemented method and control device for controlling a drive train of a vehicle by means of a convolutional neural network Download PDF

Info

Publication number
WO2022238082A1
WO2022238082A1 PCT/EP2022/060026 EP2022060026W WO2022238082A1 WO 2022238082 A1 WO2022238082 A1 WO 2022238082A1 EP 2022060026 W EP2022060026 W EP 2022060026W WO 2022238082 A1 WO2022238082 A1 WO 2022238082A1
Authority
WO
WIPO (PCT)
Prior art keywords
powertrain
neural network
parameters
convolutional neural
implemented method
Prior art date
Application number
PCT/EP2022/060026
Other languages
German (de)
French (fr)
Inventor
Ivan SANCHES PROVASE
Original Assignee
Vitesco Technologies GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DE102021206638.0A external-priority patent/DE102021206638B4/en
Application filed by Vitesco Technologies GmbH filed Critical Vitesco Technologies GmbH
Publication of WO2022238082A1 publication Critical patent/WO2022238082A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/02Circuit arrangements for generating control signals
    • F02D41/14Introducing closed-loop corrections
    • F02D41/1401Introducing closed-loop corrections characterised by the control or regulation method
    • F02D41/1405Neural network control
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/22Safety or indicating devices for abnormal conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/02Circuit arrangements for generating control signals
    • F02D41/14Introducing closed-loop corrections
    • F02D41/1401Introducing closed-loop corrections characterised by the control or regulation method
    • F02D2041/1433Introducing closed-loop corrections characterised by the control or regulation method using a model or simulation of the system
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D2200/00Input parameters for engine control
    • F02D2200/02Input parameters for engine control the parameters being related to the engine
    • F02D2200/021Engine temperature
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D2200/00Input parameters for engine control
    • F02D2200/02Input parameters for engine control the parameters being related to the engine
    • F02D2200/10Parameters related to the engine output, e.g. engine torque or engine speed
    • F02D2200/101Engine speed
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D2200/00Input parameters for engine control
    • F02D2200/50Input parameters for engine control said parameters being related to the vehicle or its components
    • F02D2200/501Vehicle speed
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D2200/00Input parameters for engine control
    • F02D2200/60Input parameters for engine control said parameters being related to the driver demands or status
    • F02D2200/602Pedal position
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks

Definitions

  • Computer-implemented method and control apparatus for controlling a powertrain of a vehicle using a convolutional neural network.
  • the present disclosure relates to a computer-implemented method and a controller configured to execute the computer-implemented method for controlling a powertrain of a vehicle, the computer-implemented method using a convolutional neural network.
  • a bad sensor can be identified by reading its value and classified according to its three electrical diagnoses: short to ground, short to positive, and open circuit.
  • a more demanding diagnosis is the functional diagnosis: it consists in assessing whether the value provided by the sensor is appropriate for the given situation. This diagnostic is important to detect a drift in a sensor or a stuck sensor.
  • the current functional OBD is based on the comparison of a specific model with the value of the corresponding sensor: if the difference between these two values is greater than a calibratable threshold, the sensor value is considered invalid.
  • the difficulty lies in the development of such a model: Most 2 of these models require a high level of knowledge about the physics underlying the system and the development of instruments to calibrate them.
  • Physical models take as many inputs as necessary to create an image of a particular system, for example the value of the coolant temperature sensor. These physical models, also known as virtual sensors, are used as substitute values when the sensor is considered defective, or they are used to validate the sensor value when no electrical diagnostics are active, which is known as functional diagnostics. Functional diagnostics aim to detect sensor aging drift or sensor sticking, which is common for both negative and positive temperature coefficient (NTC/PTC) thermistors when operating in cold environments (e.g. below -10° C) are exposed.
  • NTC/PTC negative and positive temperature coefficient
  • the current physical model used as a reference for emulating a coolant temperature sensor uses as inputs engine speed, intake air mass, vehicle speed, ambient temperature, engine run time, engine idle time, and/or cooler activation.
  • vehicle speed is important because the faster the car drives, the higher the heat exchange between the radiator and the environment, so vehicle speed is relevant to the coolant temperature model. It is similar with the 3
  • Ambient temperature The colder the ambient air, the colder the coolant temperature. Only the direction (positive or negative) of the correlations is described here.
  • the thermal equations define the linearity or non-linearity of such correlations.
  • the physical model is in most cases a Simulink model, where unknown factors (such as convection factors, fuel enthalpy, engine efficiency, etc.) are replaced with tables (also called “maps") and constants, and subjected to a regression analysis (using data from the vehicle) to be calibrated. Once the model is calibrated, the functional OBD can be calibrated.
  • the goal of the functional diagnosis can be to detect a drifting or stuck sensor. This can be done in a number of ways, but the simplest method is to apply a positive and a negative offset around the modeled value (virtual sensor). As long as the temperature value provided by the real sensor is within this range, the sensor value is considered valid. A defective sensor is detected as soon as the value exceeds the extended range mentioned above. Typical values for the offset are around 20 °C for a temperature sensor (narrower windows are not usually used due to the performance of the current models used and the spread of the temperature sensors).
  • the aim of the present disclosure is therefore to provide a computer-implemented method and a control device which is designed to carry out the computer-implemented method which has a parameter for 4
  • a computer-implemented method for controlling a powertrain of a vehicle comprising the following steps:
  • the vehicle's powertrain is used to e.g. B. to heat the vehicle interior or to move the vehicle.
  • the powertrain of the vehicle includes one or more sensors that are used to measure parameters of the powertrain such as temperatures or flow parameters.
  • the powertrain includes a controller configured to control the powertrain models used to determine parameters of the powertrain. These models can use measured powertrain parameters as input data. A combination of measured and model-determined parameters is also conceivable.
  • a convolutional neural network configured to model a parameter of a virtual powertrain sensor.
  • a convolutional neural network is similar to an artificial neural network, except that the entries of a given vector or matrix are not evaluated flat, but evaluated together by the same "kernel".
  • the kernel 5 consists of the weight matrices and lock values associated with the applied convolution filter.
  • the neural convolutional network is trained during the development of the drive train with training data that originates from a test bench, for example.
  • the output of the convolutional neural network is used to control the vehicle's powertrain.
  • the output data of the convolutional neural network is used to control the internal combustion engine, a transmission or an electric motor of the powertrain.
  • the neuron in a neural network is a sum of linear combinations formed by multiplying the weights by the neuron's inputs and adding a gate value to Flin. Such a combination is then followed by a non-linear function.
  • Neural networks can be divided into three main types:
  • Convolutional neural networks are similar to an artificial neural network, except that the entries of a given vector or matrix are not evaluated flat, but evaluated together by the same "kernel".
  • the kernel consists of the weight matrices and lock values associated with the applied convolution filter.
  • the convolution process can be divided into three types:
  • 1-dimensional mostly used to handle time series data, it consists of a 2D filter applied unidirectionally to the data input 6
  • 2-dimensional is used for images, for example, and also consists of a 2D filter that moves in 2 dimensions (first horizontally and then vertically) over the input data (2D sweep)
  • Filter used for images that contain multiple layers (e.g. RGB layers). It consists of a 3D filter that moves in 2 dimensions (first horizontally and then vertically) over the entered data (2D sweep)
  • the one-dimensional convolution is actually a 2-D filter large enough that convolution filtering can only be applied in one axis (e.g. the time axis) instead of a 2-D sweep.
  • the convolutional neural network uses a max-pooling layer to reduce dimensionality, which has increased in proportion to the number of kernels used. Multiple convolutional layers and max-pooling layers can be used in different orders in a convolutional neural network. Then, a fully connected layer, following the classic structure of an artificial neural network, is used to deliver the neural network output.
  • Recurrent neural networks have the advantage that, as the name suggests, they are recursive, meaning that the output of any neuron can be connected to the input of the other neurons.
  • true bi-directional forward propagation can be implemented, reversing the inputs at the same time.
  • the easiest way to illustrate this is when translating languages: in German, for example, the action verb is usually at the end of the sentence. Therefore, the translator (in this case from German to English) must first read the entire sentence before starting the translation (in English, the action verb is usually in the second position of the sentence), because the meaning of the sentence changes significantly as it is not known until the last word is considered.
  • Such an analogy can also be applied to other examples of time series. Due to their architecture, however, recurrent neural networks are usually much larger and cannot be used in engine control units 7
  • ECU can be deployed without significantly increasing the cost (it even requires more memory and CPU power compared to other neural network architectures).
  • HCNN hybrid convolutional neural network
  • the output of the HCNN is written as input for the next interaction. Therefore, not only does the input matrix contain the 9 system inputs (explained in the next section), but the model itself is added as the 10th input.
  • This approach is not only inspired in the recurrent neural networks, but also in the physical model used as a reference: when solving the heat transfer equation, the heat flow is recalculated in each iteration considering the current state of the system, taking the temperature into account .
  • a neural network requires a large amount of training data to be able to correctly predict its results. Such an amount of training data is usually only available at the end of the calibration process. However, this is not a problem as the OBD tasks are also performed at the end of the calibration process due to their dependency on the other parameters of the calibration. This allows the use of a neural network instead of physical equations to model the OBD reference models (virtual sensors).
  • the advantages here are:
  • the use of the convolutional neural network therefore has the advantage that controlling the powertrain based on the calculated parameters is simple and robust.
  • controlling the powertrain of the vehicle includes using the calculated parameter of the virtual sensor for on-board diagnostics (OBD) of the powertrain of the vehicle, wherein the calculated parameter of the virtual sensor is compared with a measured parameter of a corresponding sensor of the Drive train is compared and wherein the measured parameter of the corresponding sensor is classified as valid if the comparison between the calculated parameter of the virtual sensor and the measured parameter of the corresponding sensor is within a predefined threshold.
  • OBD on-board diagnostics
  • the predefined threshold is stored in a control device of the powertrain.
  • controlling the vehicle's powertrain includes using the calculated virtual sensor parameter as an input parameter for a control function used to control the vehicle's powertrain.
  • the calculated parameter is used, for example, for a control function for controlling the internal combustion engine or an electric motor of the drive train.
  • the convolutional neural network is a hybrid convolutional neural network, ie a convolutional neural network with at least one additional feedback loop that also uses the output as input.
  • a hybrid convolutional neural network (FICNN) is a convolutional neural network with an additional feedback loop that exhibits behavior similar to a recurrent neural network, where the output (modeled value/calculated parameter) is also used as input.
  • the convolutional aspect of the neural network is important because the correlations between the entries are not just additive or linear correlations, so multiple filters must be used to get the physical correlations correct 9 reconstruct.
  • the modeled temperature value is also used as an input, mimicking the widely used approach to solving ordinary differential equations (ODE). This feedback loop is the reason for the term "hybrid" to be added to the classical convolutional neural network.
  • the hybrid convolutional neural network comprises an input layer, at least two one-dimensional convolutional layers, a maximum pooling layer, a flattening layer and an output layer.
  • the applied network structure is structured as follows:
  • the input layer consists of the relevant parameters (e.g. ten parameters: vehicle speed, ambient temperature, etc.) stacked vertically. The height of such an array is five rows for the last five values measured at a 1 Hz grid.
  • the first one-dimensional convolutional layer consists of 45 filters. Each filter has a size of 3x10 (ie 30 parameters per filter), which gives 1395 parameters of the first layer (1350 multiplicative parameters and 45 preamps).
  • the second one-dimensional convolution layer consists of 20 filters. Each filter has a size of 2x45 (so 90 parameters per filter), which gives 1820 parameters for the first layer (1800 multiplicative parameters and 20 preset values).
  • the maximum pooling tier is a maximum selection applied to the previous tier with a 2x2 window.
  • the Flatten layer converts the folded structure into a flat structure.
  • the output layer includes 21 parameters. The total number of parameters is 3236 with rectified linear activation function (ReLu) in all neurons. 10
  • no padding is used.
  • the convolutional neural network can output its first value.
  • the first line is then deleted.
  • the new inputs are used in the lower part of the input window in addition to the first output used as the new value for the tenth column.
  • the process is repeated by moving the input window down one line with each interaction.
  • the system can be used online: only the last 5 repetitions of each of the 10 input variables need to be stored.
  • Such a small input window is important not only to keep the convolutional neural network small in relation to memory (RAM), but also to reduce the load on the ECU in general by reducing the amount of variables to be stored (larger input windows could result in an impractical implementation - discussions of memory and deployment are covered later in this work).
  • the final architecture is the result of a grid search that included four main sweeps:
  • the number of filters in the first and second layer was tested in a range of 5 to 45 and 5 to 20 (with a step of 5), respectively.
  • a drop layer with a drop ratio of 10% or 20% can be added after the second convolution layer.
  • the drop layer is useful to avoid overfitting (regularization). According to one embodiment, no overfitting was found since the testing accuracy was similar to the training accuracy.
  • the powertrain parameter calculated using the convolutional neural network is a temperature parameter of the 11
  • the measured powertrain parameters and/or the determined powertrain parameters used as input parameters to the convolutional neural network are a vehicle speed, an intake air mass flow rate, a fuel cut-off Boolean value, an engine idling time, an engine running time, a pedal value, a Boolean value indicating that the engine is running and/or a PWM signal from the coolant fan.
  • the convolutional neural network is initialized with a measured ambient temperature after a predefined exposure time.
  • a setpoint of the neural network is a measured coolant temperature value.
  • the modeled coolant temperature is the output of the hybrid convolution neural network. Since the input layer is 5x10, this means that at least the first five rows of this column must be filled.
  • the modeled temperature is initialized with the ambient temperature. Although intake air mass flow is in many cases a reflection of driver demand (pedal value), this is not true for conditions such as idle speed, so pedal value can be used together with intake air mass flow to complete the engine load picture.
  • the powertrain parameter calculated using the convolution neural network is a coolant temperature at a coolant flow input of a belt starter generator of the powertrain.
  • the measured powertrain parameters and/or the determined powertrain parameters used as input parameters are a belt starter generator current, a vehicle speed, an intake air mass flow rate, a fuel cutoff boolean value, an ambient temperature, an engine speed, a cooling fan activation boolean value , an engine coolant temperature, an intake air temperature before the charge air cooler, an intake air temperature after the charge air cooler, an intake air temperature at the manifold, a pump activation signal, and/or a bypass valve activation signal. 12
  • a virtual sensor for the temperature at the input of a belt starter generator (BSG) electric motor cooled by the water/air intercooler system is reconstructed using the convolutional neural network.
  • the aim of this system is to reduce the cost of implementing a parallel hybrid powertrain by not using dedicated radiators to cool the electric motor, but using a control logic: with a pump and a bypass valve that allows both the intercooler and the BSG to work under the desired conditions.
  • the system provides data, in particular temperature data, which can be used as input data for the convolutional neural network.
  • the inputs to the system are: belt starter generator current, vehicle speed, intake air mass flow, fuel cutoff (boolean), ambient temperature, engine speed, radiator fan activation, engine coolant temperature, intake air temperature before the charge air cooler, intake air temperature after the charge air cooler, intake air temperature at the manifold, a pump activation (PWM signal) and/or a bypass valve activation (PWM signal).
  • boost fuel cutoff
  • ambient temperature ambient temperature
  • engine speed radiator fan activation
  • engine coolant temperature intake air temperature before the charge air cooler
  • intake air temperature after the charge air cooler intake air temperature at the manifold
  • PWM signal pump activation
  • PWM signal bypass valve activation
  • the training data set for training the convolutional neural network for this embodiment was 5600 seconds.
  • the training data base was obtained through measurements on a test bench. However, this relatively small data set was sufficient, mainly because the system is rich in temperature information. An 85%/15% split between training and testing was used.
  • an activation function of the convolutional neural network is a rectified linear unit function (ReLu) that returns 0 for negative inputs and passes the input as an output for positive inputs, or a hyperbolic tangent function (tanh) that satisfies equation 13 follows, where s(z) is the output and where z is any number representing any parameter.
  • Rectified linear unit (ReLu) returns 0 for negative entries and passes the input as an output for positive entries.
  • Hyperbolic tangent (tanh) "squeezes" the inputs into an output from -1 to +1 according to the equation above.
  • the sweeps for optimizing the hybrid convolutional neural network are performed randomly and not incrementally as in a "grid search" approach. Therefore, not all combinations were carried out. Once a particular combination gave the expected result, only similar combinations were evaluated.
  • the number of hidden layers is chosen based on the lowest number required to achieve a relatively good result: A first test was performed with only one convolutional layer, but even with several combinations of hyperparameters the convolutional neural network was not able to predict the correct parameter (temperature). Since the results with two layers of convolution were satisfactory, no further increment was made to prevent possible overfitting.
  • the main 29 measurements for the training data examined a wide variety of conditions and driving cycles of the vehicle, for example: a. Cold start at -30°C followed by 5 minutes idle b. Cold start at -15 °C followed by a city-like driving style c. Start at +30 °C, followed by highly dynamic driving at high loads d. Cold start at -20°C followed by a high load, highly dynamic drive cycle (possible as the test was conducted on a frozen lake in a controlled environment) e. Start at +40 °C, followed by 5 minutes idle
  • This problem could be solved according to one embodiment in the ECU software by setting a flag and inhibiting the model update during the stop/start phase, but no strategy could be easily applied when developing the model, so that was the easiest way , the exposure time and 15 to differentiate the stop/start duration with a higher margin (which facilitates the learning of the convolutional neural network during the training process).
  • three hyperparameters were examined to optimize the model: the compiler, the loss function, and the integration step.
  • three different compilers can be used: a. Stochastic gradient descent b. RMSprop c. Adam
  • Adam can be interpreted as a mixture of RMSprop and Adagrad. Adam implements the exponential moving average of the gradient to scale the learning rate instead of a simple average as in Adagrad. Also, it includes a pulse that accelerates convergence and combines it with the vibration reduction performed by RMSprop.
  • two different loss functions can be used: a. Mean absolute error b. Mean squared error
  • three different integration steps can be used: a. 0.001 b. 0.005c. 0.01
  • RAM Random Access Memory requirements are divided into two areas: RAM and Flash.
  • the convolutional (hybrid) neural network has only addition and multiplication and a simple ReLu activation (which, compared to a hyperbolic tangent, requires very little required by the CPU), but the number of parameters (about 40 times higher) leads to an average 12-fold CPU load or 8-fold calculation time with the same CPU performance. This value is still reasonable and requires minor trade-offs in the functions in the ECU.
  • the memory requirement in the flash is also high. Basically, the direct relationship between the variables is applied for the memory requirement, which according to one embodiment is 3236 in the (hybrid) convolutional neural network versus 250 for the physical reference model, which corresponds to a 13-fold increase in flash.
  • neural networks instead of classic physical-mathematical modeling can be done not only when using accuracy as a metric, but also considering the implementation of such a method in currently available flardware (ECU).
  • ECU flardware
  • a control device comprising a control unit configured to execute a computer-implemented method for controlling a powertrain of a vehicle as described above.
  • the control device is, for example, the control device dedicated to the control of the vehicle engine. According to another embodiment, it is also conceivable that the control device is part of another control device that controls other parts of the vehicle.
  • FIG. 2 shows an exemplary representation of a neuron from a neural network
  • CNN convolutional neural network
  • FIG. 5 shows an exemplary graph of a hyperbolic tangent activation function (tanh).
  • FIG. 6 shows an exemplary accuracy in a training strain starting at 23° C. followed by a city drive.
  • FIG 9 shows an exemplary environment of a belt starter generator mounted together with a charge air cooling water cooling system.
  • FIG. 10 shows an exemplary training accuracy for an inlet temperature model of a belt starter generator (training example number 1)
  • FIG. 11 shows an exemplary training accuracy for an inlet temperature model of a belt starter generator (training example number 3),
  • FIG. 1 shows an example of a stuck sensor after a cold start at an ambient temperature of minus 32°C.
  • the sensor value remains stationary and does not move.
  • the modeled coolant temperature continues to increase, as could be physically expected from the coolant temperature itself.
  • the diagnosis is made: the system switches to the modeled coolant temperature model and uses its values as for all others Functions of the ECU.
  • the sensor starts working again: it is the healing phase. Once the reading enters the extended range, the sensor is considered valid again and the system temperature switches back to the sensor reading from the surrogate model.
  • FIG. 2 shows a brief summary of the functioning of the basic neuron of a neural network.
  • the neuron is nothing more than a sum of linear combinations (z) formed by multiplying the weights (W) by the neuron's inputs and adding a preload value (b). This combination is then followed by a non-linear function (g). 20
  • FIG. 3 shows the schematic representation of a convolutional network with a global maximum pooling intermediate layer.
  • the input has n rows as a time entry with k columns as characteristics.
  • the kernel is a 2x6 matrix.
  • the output after the one-dimensional kernel convolution filtering is always a column vector.
  • filters are used to form the convolution layer, which is a horizontal concatenation of the outputs from the kernels.
  • Figure 4 shows an exemplary graph of a rectified linear unit (ReLu) activation function.
  • the ReLu activation function returns 0 for negative entries and passes the input as an output for positive entries.
  • Figure 5 shows an exemplary graph of a hyperbolic tangent activation function (tanh).
  • the hyperbolic tangent activation function "squeezes" the inputs into an output from -1 to +1 according to the following equation: follows, where s(z) is the output and where z is any number representing any parameter.
  • FIGS. 6 to 8 show the test results where the convolutional neural network was used to determine the coolant temperature of an internal combustion engine.
  • the convolutional neural network is therefore used as a virtual sensor.
  • the standard metric used in neural networks when using the MSE loss function is the Root Means Squared (RMS) accuracy, ie the square root of the sum of all deviations.
  • RMS Root Means Squared
  • the temperature difference between the sensor value and the modeled temperature value is used as a default metric to check the accuracy of the (hybrid) convolutional network.
  • RMS Root Means Squared
  • FIG. 6 shows exemplary accuracy in a training strain starting at 23°C followed by city driving.
  • Figure 7 shows an exemplary accuracy in a training strain with a cold start at -13 °C, followed by idling and parking manoeuvres.
  • FIG. 8 shows an exemplary test accuracy in a WLTC emissions test cycle.
  • FIG. 9 shows an exemplary environment of a belt starter generator mounted in conjunction with the charge air cooling water cooling system of a vehicle powertrain.
  • the hybrid convolutional neural network architecture was applied to a belt starter generator model.
  • the aim is to reconstruct a virtual sensor for the temperature at the input of an electric motor - belt starter generator (BSG) cooled by the water/air intercooler system.
  • BSG electric motor - belt starter generator
  • This system aims to reduce the cost of implementing a parallel hybrid powertrain by not using dedicated radiators to cool the electric motor, but using a control logic: with a pump and a bypass valve that allows both the intercooler and the enable the BSG to work under the desired conditions.
  • FIG. Figures 10, 11 and 12 show the verification accuracy of the hybrid convolution neural network applied to this system.
  • Figures 10 to 12 the darker curve represents the measured coolant temperature and the lighter curve represents the modeled coolant temperature through the hybrid convolution network.
  • Figure 10 shows an exemplary training accuracy for a BSG inlet temperature model (training example number 1).
  • FIG. 11 shows an exemplary training accuracy for a BSG inlet temperature model (training example number 3).
  • FIG. 12 shows an exemplary test accuracy for a BSG inlet temperature.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • Mechanical Engineering (AREA)
  • Feedback Control In General (AREA)

Abstract

The invention relates to a computer-implemented method and a control device for controlling a drive train of a vehicle, the method comprising the following steps: operating the drive train of the vehicle; measuring a plurality of parameters of the drive train and/or determining a plurality of parameters of the drive train; providing a trained convolutional neural network designed to model a parameter of a virtual sensor of the drive train; providing the measured parameters of the drive train and/or the ascertained parameters of the drive train as input data for the trained convolutional neural network and calculating the parameters of the virtual sensor of the drive train as output data by means of the convolutional neural network; controlling the drive train of the vehicle using the calculated parameters of the virtual sensor.

Description

1 1
Beschreibung description
Computerimplementiertes Verfahren und Steuervorrichtung zum Steuern eines Antriebsstrangs eines Fahrzeugs unter Verwendung eines neuronalen Faltungsnetzes. Computer-implemented method and control apparatus for controlling a powertrain of a vehicle using a convolutional neural network.
Die vorliegende Offenbarung betrifft ein computerimplementiertes Verfahren und eine Steuervorrichtung, die dazu ausgelegt ist, das computerimplementierte Verfahren zum Steuern eines Antriebsstrangs eines Fahrzeugs auszuführen, wobei das computerimplementierte Verfahren ein neuronales Faltungsnetz verwendet. The present disclosure relates to a computer-implemented method and a controller configured to execute the computer-implemented method for controlling a powertrain of a vehicle, the computer-implemented method using a convolutional neural network.
Die Verwendung von mathematischen Modellen auf physikalischer Basis ist der Standard bei der Modellentwicklung im Antriebsstrangbereich. Genauer gesagt, finden Ersatzmodelle und Diagnosemodelle (auch als virtuelle Sensoren bezeichnet), die zur Identifizierung von Sensorfehlern verwendet werden, im Bereich des Antriebsstrangs breite Anwendung, um die Anforderungen der On- Board-Diagnose (OBD) zu erfüllen. In den Anfangsjahren der Kalibrierung war die Datenmenge begrenzt heutzutage werden die Fahrzeuge aufgrund der von der Branche geforderten umfangreichen und detaillierten Validierungen einer größeren Anzahl von Tests unterzogen, bevor sie den Endkunden erreichen. The use of mathematical models based on physics is the standard in model development in the powertrain area. More specifically, surrogate models and diagnostic models (also known as virtual sensors) used to identify sensor failures are widely used in the powertrain field to meet on-board diagnostics (OBD) requirements. In the early years of calibration, the amount of data was limited. Today, due to the extensive and detailed validations required by the industry, vehicles are subjected to a greater number of tests before reaching the end customer.
Ein defekter Sensor kann durch das Ablesen seines Wertes erkannt und entsprechend seiner drei elektrischen Diagnosen klassifiziert werden: Kurzschluss gegen Masse, Kurzschluss gegen Plus und offener Stromkreis. Eine anspruchsvollere Diagnose ist die Funktionsdiagnose: Sie besteht darin, zu beurteilen, ob der durch den Sensor gelieferte Wert für die jeweilige Situation angemessen ist. Diese Diagnose ist wichtig, um eine Drift in einem Sensor oder einen festsitzenden Sensor zu erkennen. Die derzeitige funktionale OBD basiert auf dem Vergleich eines bestimmten Modells mit dem Wert des entsprechenden Sensors: Wenn die Differenz zwischen diesen beiden Werten größer als ein kalibrierbarer Schwellenwert ist, wird der Sensorwert als ungültig betrachtet. Die Schwierigkeit liegt hier in der Entwicklung eines solchen Modells: Die meisten 2 dieser Modelle erfordern ein hohes Maß an Wissen über die dem System zugrunde liegende Physik sowie die Entwicklung von Instrumenten zu ihrer Kalibrierung. Außerdem sind diese Modelle im Allgemeinen sehr spezifisch, was bedeutet, dass nur sehr wenig auf ein anderes Modell übertragen (verallgemeinert) werden kann. Ein Beispiel: Das Kühlmitteltemperaturmodell eines Verbrennungsmotors (ICE) kann nicht direkt zur Modellierung des Ladeluftkühlersystems verwendet werden: Es ist viel mehr als nur eine Anpassung der Eingaben erforderlich, was zu einer neuen Architektur des physikalischen Modells und neuen Werkzeugen zu dessen Kalibrierung führt. Darüber hinaus benötigen beide Modelle eine ebenso große Menge an Daten, um kalibriert zu werden. A bad sensor can be identified by reading its value and classified according to its three electrical diagnoses: short to ground, short to positive, and open circuit. A more demanding diagnosis is the functional diagnosis: it consists in assessing whether the value provided by the sensor is appropriate for the given situation. This diagnostic is important to detect a drift in a sensor or a stuck sensor. The current functional OBD is based on the comparison of a specific model with the value of the corresponding sensor: if the difference between these two values is greater than a calibratable threshold, the sensor value is considered invalid. The difficulty here lies in the development of such a model: Most 2 of these models require a high level of knowledge about the physics underlying the system and the development of instruments to calibrate them. Also, these models are generally very specific, which means that very little can be extrapolated (generalized) to any other model. For example, the coolant temperature model of an internal combustion engine (ICE) cannot be used directly to model the charge air cooler system: much more than just an adjustment of the inputs is required, resulting in a new architecture of the physical model and new tools to calibrate it. In addition, both models require an equally large amount of data to be calibrated.
Physikalische Modelle nehmen so viele Eingaben wie nötig auf, um ein Abbild eines bestimmten Systems zu erstellen, zum Beispiel den Wert des Kühlmitteltemperatursensors. Diese physikalischen Modelle, auch als virtuelle Sensoren bezeichnet, werden als Ersatzwerte verwendet, wenn der Sensor als defekt angesehen wird, oder sie werden zur Validierung des Sensorwertes verwendet, wenn keine elektrische Diagnose aktiv ist, was als Funktionsdiagnose bezeichnet wird. Die Funktionsdiagnose zielt darauf ab, eine alterungsbedingte Drift des Sensors oder einen festsitzenden Sensor zu erkennen, was sowohl bei Thermistoren mit negativem als auch mit positivem Temperaturkoeffizienten (NTC/PTC) häufig vorkommt, wenn sie kalten Umgebungen (z. B. unter -10 °C) ausgesetzt sind. Das aktuelle physikalische Modell, das als Referenz für die Nachbildung eines Kühlmitteltemperatursensors verwendet wird, verwendet als Eingaben eine Motordrehzahl, eine Ansaugluftmasse, eine Fahrzeuggeschwindigkeit, eine Umgebungstemperatur, eine Motorlaufzeit, eine Motorstillstandszeit und/oder eine Kühleraktivierung. Physical models take as many inputs as necessary to create an image of a particular system, for example the value of the coolant temperature sensor. These physical models, also known as virtual sensors, are used as substitute values when the sensor is considered defective, or they are used to validate the sensor value when no electrical diagnostics are active, which is known as functional diagnostics. Functional diagnostics aim to detect sensor aging drift or sensor sticking, which is common for both negative and positive temperature coefficient (NTC/PTC) thermistors when operating in cold environments (e.g. below -10° C) are exposed. The current physical model used as a reference for emulating a coolant temperature sensor uses as inputs engine speed, intake air mass, vehicle speed, ambient temperature, engine run time, engine idle time, and/or cooler activation.
Diese Größen sind für das physikalische Modell relevant. Die Fahrzeuggeschwindigkeit ist beispielsweise von Bedeutung, weil je schneller das Auto fährt, desto höher der Wärmeaustausch zwischen dem Kühler und der Umgebung ist, weshalb die Fahrzeuggeschwindigkeit für das Kühlmitteltemperaturmodell relevant ist. Ähnlich verhält es sich mit der 3 These quantities are relevant for the physical model. For example, vehicle speed is important because the faster the car drives, the higher the heat exchange between the radiator and the environment, so vehicle speed is relevant to the coolant temperature model. It is similar with the 3
Umgebungstemperatur: Je kälter die Umgebungsluft, desto kälter ist auch die Kühlmitteltemperatur. Hier wird nur die Richtung (positiv oder negativ) der Korrelationen beschrieben. Die thermischen Gleichungen definieren die Linearität oder Nichtlinearität solcher Korrelationen. Das physikalische Modell ist in den meisten Fällen ein Simulink-Modell, bei dem unbekannte Faktoren (wie Konvektionsfaktoren, Kraftstoffenthalpie, Motorwirkungsgrad usw.) durch Tabellen (auch „Kennfelder“ genannt) und Konstanten ersetzt und durch eine Regressionsanalyse (unter Verwendung von Daten aus dem Fahrzeug) kalibriert werden. Sobald das Modell kalibriert ist, kann die funktionale OBD kalibriert werden. Ambient temperature: The colder the ambient air, the colder the coolant temperature. Only the direction (positive or negative) of the correlations is described here. The thermal equations define the linearity or non-linearity of such correlations. The physical model is in most cases a Simulink model, where unknown factors (such as convection factors, fuel enthalpy, engine efficiency, etc.) are replaced with tables (also called "maps") and constants, and subjected to a regression analysis (using data from the vehicle) to be calibrated. Once the model is calibrated, the functional OBD can be calibrated.
Wie bereits erläutert, kann das Ziel der Funktionsdiagnose darin bestehen, einen driftenden oder festsitzenden Sensor zu erkennen. Dies kann auf verschiedene Weise geschehen, aber die einfachste Methode ist die Anwendung eines positiven und eines negativen Offsets um den modellierten Wert (virtueller Sensor). Solange der durch den realen Sensor gelieferte Temperaturwert innerhalb dieses Bereichs liegt, wird der Sensorwert als gültig angesehen. Ein defekter Sensor wird erkannt, sobald der Wert den oben genannten erweiterten Bereich überschreitet. Typische Werte für den Offset liegen bei etwa 20 °C für einen Temperatursensor (engere Fenster werden aufgrund der Leistungsfähigkeit der verwendeten aktuellen Modelle und der Streuung der Temperatursensoren in der Regel nicht angewendet). As explained earlier, the goal of the functional diagnosis can be to detect a drifting or stuck sensor. This can be done in a number of ways, but the simplest method is to apply a positive and a negative offset around the modeled value (virtual sensor). As long as the temperature value provided by the real sensor is within this range, the sensor value is considered valid. A defective sensor is detected as soon as the value exceeds the extended range mentioned above. Typical values for the offset are around 20 °C for a temperature sensor (narrower windows are not usually used due to the performance of the current models used and the spread of the temperature sensors).
Wie bereits erläutert, haben physikalische Modelle den Nachteil, dass sie ein hohes Maß an Wissen über die dem System zugrunde liegende Physik sowie die Entwicklung von Werkzeugen für ihre Kalibrierung erfordern. Außerdem sind diese Modelle im Allgemeinen sehr spezifisch, was bedeutet, dass nur sehr wenig auf ein anderes Modell übertragen (verallgemeinert) werden kann. As explained above, physical models have the disadvantage that they require a high level of knowledge about the physics underlying the system and the development of tools for their calibration. Also, these models are generally very specific, which means that very little can be extrapolated (generalized) to any other model.
Ziel der vorliegenden Offenbarung ist es daher, ein computerimplementiertes Verfahren sowie eine Steuervorrichtung zu schaffen, die dazu ausgelegt ist, das computerimplementierte Verfahren auszuführen, das einen Parameter zur 4 The aim of the present disclosure is therefore to provide a computer-implemented method and a control device which is designed to carry out the computer-implemented method which has a parameter for 4
Steuerung eines Antriebsstrangs eines Fahrzeugs auf einfache und zuverlässige Weise berechnen kann. Can calculate control of a drive train of a vehicle in a simple and reliable way.
Dieses Ziel wird durch ein computerimplementiertes Verfahren mit den Merkmalen des unabhängigen Anspruchs und durch eine Steuervorrichtung erreicht, die zur Ausführung des computerimplementierten Verfahrens gemäß dem unabhängigen Anspruch dient. Vorteilhafte Ausführungsformen des computerimplementierten Verfahrens und der Steuervorrichtung werden in den abhängigen Ansprüchen dargelegt. This aim is achieved by a computer-implemented method having the features of the independent claim and by a control device used to execute the computer-implemented method according to the independent claim. Advantageous embodiments of the computer-implemented method and the control device are set out in the dependent claims.
Es wird ein computerimplementiertes Verfahren zur Steuerung eines Antriebsstrangs eines Fahrzeugs spezifiziert, wobei das Verfahren die folgenden Schritte umfasst: A computer-implemented method for controlling a powertrain of a vehicle is specified, the method comprising the following steps:
Betreiben des Antriebsstrangs des Fahrzeugs. Mit anderen Worten: Der Antriebsstrang des Fahrzeugs wird genutzt, um z. B. den Fahrzeuginnenraum zu beheizen oder das Fahrzeug zu bewegen. operating the power train of the vehicle. In other words, the vehicle's powertrain is used to e.g. B. to heat the vehicle interior or to move the vehicle.
Messen einer Vielzahl von Parametern des Antriebsstrangs unter Verwendung mindestens eines Sensors des Antriebsstrangs und/oder Bestimmen einer Vielzahl von Parametern des Antriebsstrangs unter Verwendung mindestens eines Antriebsstrangmodells. Der Antriebsstrang des Fahrzeugs umfasst gemäß einer Ausführungsform einen oder mehrere Sensoren, die zur Messung von Parametern des Antriebsstrangs wie Temperaturen oder Strömungsparameter verwendet werden. Gemäß einer anderen Ausführungsform umfasst der Antriebsstrang eine Steuervorrichtung, die zur Steuerung der Antriebsstrangmodelle ausgelegt ist, die zur Bestimmung von Parametern des Antriebsstrangs dienen. Diese Modelle können gemessene Parameter des Antriebsstrangs als Eingabedaten verwenden. Auch eine Kombination aus gemessenen und modellhaft ermittelten Parametern ist denkbar. measuring a plurality of powertrain parameters using at least one powertrain sensor and/or determining a plurality of powertrain parameters using at least one powertrain model. According to one embodiment, the powertrain of the vehicle includes one or more sensors that are used to measure parameters of the powertrain such as temperatures or flow parameters. According to another specific embodiment, the powertrain includes a controller configured to control the powertrain models used to determine parameters of the powertrain. These models can use measured powertrain parameters as input data. A combination of measured and model-determined parameters is also conceivable.
Bereitstellen eines trainierten neuronalen Faltungsnetzes, das zum Modellieren eines Parameters eines virtuellen Sensors des Antriebsstrangs ausgelegt ist. Ein neuronales Faltungsnetz ähnelt einem künstlichen neuronalen Netz, jedoch werden die Einträge eines gegebenen Vektors oder einer Matrix nicht flach, sondern gemeinsam durch denselben „Kernel“ ausgewertet. Der Kernel 5 besteht aus den Gewichtungsmatrizen und Aufschaltwerten, die dem angewandten Faltungsfilter zugeordnet sind. Das neuronale Faltungsnetz wird gemäß einer Ausführungsform während der Entwicklung des Antriebsstrangs mit Trainingsdaten trainiert, die beispielsweise aus einem Prüfstand stammen. Providing a trained convolutional neural network configured to model a parameter of a virtual powertrain sensor. A convolutional neural network is similar to an artificial neural network, except that the entries of a given vector or matrix are not evaluated flat, but evaluated together by the same "kernel". the kernel 5 consists of the weight matrices and lock values associated with the applied convolution filter. According to one embodiment, the neural convolutional network is trained during the development of the drive train with training data that originates from a test bench, for example.
Bereitstellen der gemessenen Parameter des Antriebsstrangs und/oder der ermittelten Parameter des Antriebsstrangs als Eingabedaten für das trainierte neuronale Faltungsnetz und Berechnen der Parameter des virtuellen Sensors des Antriebsstrangs als Ausgabedaten mit dem neuronalen Faltungsnetz. providing the measured powertrain parameters and/or the determined powertrain parameters as input data to the trained convolutional neural network and computing the parameters of the virtual powertrain sensor as output data with the convolutional neural network.
Steuern des Antriebsstrangs des Fahrzeugs anhand der berechneten Parameter des virtuellen Sensors. Die Ausgabedaten des neuronalen Faltungsnetzes werden zum Steuern des Antriebsstrangs des Fahrzeugs verwendet. Beispielsweise werden die Ausgabedaten des neuronalen Faltungsnetzes zum Steuern des Verbrennungsmotors, eines Getriebes oder eines Elektromotors des Antriebsstrangs verwendet. Controlling the vehicle's powertrain based on the calculated parameters of the virtual sensor. The output of the convolutional neural network is used to control the vehicle's powertrain. For example, the output data of the convolutional neural network is used to control the internal combustion engine, a transmission or an electric motor of the powertrain.
Das Neuron in einem neuronalen Netz ist eine Summe von linearen Kombinationen, die durch Multiplikation der Gewichtungen mit den Eingaben des Neurons und Flinzufügen eines Aufschaltwertes gebildet werden. Auf eine solche Kombination folgt dann eine nichtlineare Funktion. The neuron in a neural network is a sum of linear combinations formed by multiplying the weights by the neuron's inputs and adding a gate value to Flin. Such a combination is then followed by a non-linear function.
Neuronale Netze können in drei Hauptarten unterteilt werden: Neural networks can be divided into three main types:
ANN - künstliches neuronales Netz CNN - neuronales Faltungsnetz RNN - rekurrentes neuronales Netz ANN - Artificial Neural Network CNN - Convolutional Neural Network RNN - Recurrent Neural Network
Neuronale Faltungsnetze ähneln einem künstlichen neuronalen Netz, jedoch werden die Einträge eines gegebenen Vektors oder einer Matrix nicht flach, sondern gemeinsam durch denselben „Kernel“ ausgewertet. Der Kernel besteht aus den Gewichtungsmatrizen und Aufschaltwerten, die dem angewandten Faltungsfilter zugeordnet sind. Das Faltungsverfahren kann in drei Arten unterteilt werden: Convolutional neural networks are similar to an artificial neural network, except that the entries of a given vector or matrix are not evaluated flat, but evaluated together by the same "kernel". The kernel consists of the weight matrices and lock values associated with the applied convolution filter. The convolution process can be divided into three types:
1 -dimensional: wird meist zur Behandlung von Zeitreihendaten verwendet und besteht aus einem 2D-Filter, der unidirektional auf die Dateneingabe angewendet wird 6 1-dimensional: mostly used to handle time series data, it consists of a 2D filter applied unidirectionally to the data input 6
2-dimensional: wird beispielsweise für Bilder verwendet und besteht ebenfalls aus einem 2D-Filter, der sich in 2 Dimensionen (zuerst horizontal und dann vertikal) über die eingegebenen Daten bewegt (2-D-Sweep) 2-dimensional: is used for images, for example, and also consists of a 2D filter that moves in 2 dimensions (first horizontally and then vertically) over the input data (2D sweep)
3-dimensional: Filter: wird für Bilder verwendet, die mehrere Ebenen enthalten (z. B. RGB-Ebenen). Er besteht aus einem 3D-Filter, der sich in 2 Dimensionen (zuerst horizontal und dann vertikal) über die eingegebenen Daten bewegt (2-D-Sweep) 3-dimensional: Filter: used for images that contain multiple layers (e.g. RGB layers). It consists of a 3D filter that moves in 2 dimensions (first horizontally and then vertically) over the entered data (2D sweep)
Mit anderen Worten, die eindimensionale Faltung ist in Wirklichkeit ein 2-D-Filter, der groß genug ist, damit die Faltungsfilterung nur in einer Achse (z. B. der Zeitachse) anstelle eines 2-D-Sweeps angewendet werden kann. In other words, the one-dimensional convolution is actually a 2-D filter large enough that convolution filtering can only be applied in one axis (e.g. the time axis) instead of a 2-D sweep.
Gemäß einer Ausführungsform verwendet das neuronale Faltungsnetz eine Max- Pooling-Schicht, um die Dimensionalität zu reduzieren, die sich proportional zur Anzahl der verwendeten Kernels erhöht hat. Mehrere Faltungsschichten und Max- Pooling-Schichten können in unterschiedlicher Reihenfolge in einem neuronalen Faltungsnetz verwendet werden. Anschließend wird eine vollständig verbundene Schicht, die der klassischen Struktur eines künstlichen neuronalen Netzes folgt, verwendet, um die Ausgabe des neuronalen Netzes zu liefern. According to one embodiment, the convolutional neural network uses a max-pooling layer to reduce dimensionality, which has increased in proportion to the number of kernels used. Multiple convolutional layers and max-pooling layers can be used in different orders in a convolutional neural network. Then, a fully connected layer, following the classic structure of an artificial neural network, is used to deliver the neural network output.
Rekurrente neuronale Netze haben den Vorteil, dass sie, wie der Name schon sagt, rekursiv sind, d. h., dass der Ausgang jedes Neurons mit dem Eingang der anderen Neuronen verbunden werden kann. Darüber hinaus kann eine echte bidirektionale Vorwärtspropagation implementiert werden, bei der die Eingänge gleichzeitig reversiert werden. Am einfachsten lässt sich dies bei der Übersetzung von Sprachen veranschaulichen: In der deutschen Sprache beispielsweise steht das Aktionsverb in der Regel am Ende des Satzes. Daher muss der Übersetzer (in diesem Fall vom Deutschen ins Englische) zunächst den gesamten Satz lesen, bevor mit der Übersetzung begonnen werden kann (im Englischen steht das Aktionsverb in der Regel an zweiter Stelle des Satzes), weil sich die Bedeutung des Satzes erheblich ändern kann, da sie erst bekannt ist, wenn das letzte Wort berücksichtigt wird. Eine solche Analogie lässt sich auch auf andere Beispiele von Zeitreihen anwenden. Aufgrund ihrer Architektur sind rekurrente neuronale Netze jedoch in der Regel sehr viel größer und können nicht in Motorsteuergeräten 7 Recurrent neural networks have the advantage that, as the name suggests, they are recursive, meaning that the output of any neuron can be connected to the input of the other neurons. In addition, true bi-directional forward propagation can be implemented, reversing the inputs at the same time. The easiest way to illustrate this is when translating languages: in German, for example, the action verb is usually at the end of the sentence. Therefore, the translator (in this case from German to English) must first read the entire sentence before starting the translation (in English, the action verb is usually in the second position of the sentence), because the meaning of the sentence changes significantly as it is not known until the last word is considered. Such an analogy can also be applied to other examples of time series. Due to their architecture, however, recurrent neural networks are usually much larger and cannot be used in engine control units 7
(ECU) eingesetzt werden, ohne die Kosten erheblich zu erhöhen (im Vergleich zu anderen neuronalen Netzarchitekturen ist sogar mehr Speicher und CPU-Leistung erforderlich). (ECU) can be deployed without significantly increasing the cost (it even requires more memory and CPU power compared to other neural network architectures).
Um diesen Mangel an Rekursion zu kompensieren, kann ein hybrides neuronales Faltungsnetz (HCNN) geschaffen werden: In dieser Architektur wird die Ausgabe des HCNN als Eingabe für die nächste Interaktion geschrieben. Daher enthält die Eingabematrix nicht nur die 9 Systemeingaben (die im nächsten Abschnitt erläutert werden), sondern das Modell selbst wird als 10. Eingabe hinzugefügt. Dieser Ansatz ist nicht nur in den rekurrenten neuronalen Netzen inspiriert, sondern auch im physikalischen Modell, das als Referenz verwendet wird: Bei der Lösung der Wärmeübertragungsgleichung wird der Wärmefluss in jeder Iteration unter Berücksichtigung des aktuellen Zustands des Systems neu berechnet, wobei die Temperatur berücksichtigt wird. To compensate for this lack of recursion, a hybrid convolutional neural network (HCNN) can be created: in this architecture, the output of the HCNN is written as input for the next interaction. Therefore, not only does the input matrix contain the 9 system inputs (explained in the next section), but the model itself is added as the 10th input. This approach is not only inspired in the recurrent neural networks, but also in the physical model used as a reference: when solving the heat transfer equation, the heat flow is recalculated in each iteration considering the current state of the system, taking the temperature into account .
Ein neuronales Netz benötigt eine große Menge an Trainingsdaten, um seine Ergebnisse korrekt Vorhersagen zu können. Eine solche Menge an Trainingsdaten ist in der Regel erst am Ende des Kalibrierungsprozesses verfügbar. Dies stellt jedoch kein Problem dar, da die OBD-Aufgaben aufgrund ihrer Abhängigkeit von den anderen Parametern der Kalibrierung ebenfalls am Ende des Kalibrierungsprozesses durchgeführt werden. Dies ermöglicht die Verwendung eines neuronalen Netzes anstelle von physikalischen Gleichungen, um die OBD- Referenzmodelle (virtuelle Sensoren) nachzubilden. Die Vorteile hier sind: A neural network requires a large amount of training data to be able to correctly predict its results. Such an amount of training data is usually only available at the end of the calibration process. However, this is not a problem as the OBD tasks are also performed at the end of the calibration process due to their dependency on the other parameters of the calibration. This allows the use of a neural network instead of physical equations to model the OBD reference models (virtual sensors). The advantages here are:
1 ) Das Modell kalibriert sich selbst: kein zusätzliches Werkzeug erforderlich1 ) The model calibrates itself: no additional tools required
2) Kein spezifisches physikalisches Wissen erforderlich: das neuronale Faltungsnetz ist robust genug, um nicht relevante Einträge zu ignorieren und trotzdem eine gute Genauigkeit zu liefern 2) No specific physics knowledge required: the convolutional neural network is robust enough to ignore irrelevant entries and still provide good accuracy
3) Hohe Übertragbarkeit: Sobald die Hauptarchitektur fertiggestellt ist, kann das Modell mit nur wenigen Änderungen an den Eingaben auf andere Systeme angewendet werden. 8 3) High portability: Once the main architecture is complete, the model can be applied to other systems with just a few changes to the inputs. 8th
Die Verwendung des neuronalen Faltungsnetzes hat daher den Vorteil, dass das Steuern des Antriebsstrangs anhand der berechneten Parameter einfach und robust ist. The use of the convolutional neural network therefore has the advantage that controlling the powertrain based on the calculated parameters is simple and robust.
Gemäß einer Ausführungsform umfasst das Steuern des Antriebsstrangs des Fahrzeugs, dass der berechnete Parameter des virtuellen Sensors für eine On- Board-Diagnose (OBD) des Antriebsstrangs des Fahrzeugs verwendet wird, wobei der berechnete Parameter des virtuellen Sensors mit einem gemessenen Parameter eines entsprechenden Sensors des Antriebsstrangs verglichen wird und wobei der gemessene Parameter des entsprechenden Sensors als gültig eingestuft wird, wenn der Vergleich zwischen dem berechneten Parameter des virtuellen Sensors und dem gemessenen Parameter des entsprechenden Sensors innerhalb einer vordefinierten Schwelle liegt. Die vordefinierte Schwelle wird gemäß einer Ausführungsform in einer Steuervorrichtung des Antriebsstrangs gespeichert. According to one embodiment, controlling the powertrain of the vehicle includes using the calculated parameter of the virtual sensor for on-board diagnostics (OBD) of the powertrain of the vehicle, wherein the calculated parameter of the virtual sensor is compared with a measured parameter of a corresponding sensor of the Drive train is compared and wherein the measured parameter of the corresponding sensor is classified as valid if the comparison between the calculated parameter of the virtual sensor and the measured parameter of the corresponding sensor is within a predefined threshold. According to one embodiment, the predefined threshold is stored in a control device of the powertrain.
Gemäß einer Ausführungsform umfasst das Steuern des Antriebsstrangs des Fahrzeugs, dass der berechnete Parameter des virtuellen Sensors als Eingabeparameter für eine Steuerfunktion verwendet wird, die zum Steuern des Antriebsstrangs des Fahrzeugs eingesetzt wird. In diesem Fall wird der berechnete Parameter zum Beispiel für eine Steuerfunktion zum Steuern des Verbrennungsmotors oder eines Elektromotors des Antriebsstrangs verwendet. According to one embodiment, controlling the vehicle's powertrain includes using the calculated virtual sensor parameter as an input parameter for a control function used to control the vehicle's powertrain. In this case, the calculated parameter is used, for example, for a control function for controlling the internal combustion engine or an electric motor of the drive train.
Gemäß einer Ausführungsform ist das neuronale Faltungsnetz ein hybrides neuronales Faltungsnetz, d. h. ein neuronales Faltungsnetz mit mindestens einer zusätzlichen Rückkopplungsschleife, die die Ausgabe auch als Eingabe verwendet. Ein hybrides neuronales Faltungsnetz (FICNN) ist ein neuronales Faltungsnetz mit einer zusätzlichen Rückkopplungsschleife, die ein ähnliches Verhalten wie ein rekurrentes neuronales Netzwerk aufweist, wobei die Ausgabe (modellierter Wert / berechneter Parameter) auch als Eingabe verwendet wird. Der Faltungsaspekt des neuronalen Netzes ist wichtig, da die Korrelationen zwischen den Einträgen nicht nur additive oder lineare Korrelationen sind, weshalb mehrere Filter verwendet werden müssen, um die physikalischen Korrelationen korrekt zu 9 rekonstruieren. Gemäß einer Ausführungsform wird der modellierte Temperaturwert auch als Eingabe verwendet, was den weit verbreiteten Ansatz zur Lösung von gewöhnlichen Differentialgleichungen (ODE) nachahmt. Diese Rückkopplungsschleife ist der Grund für den Begriff „hybrid“, der dem klassischen neuronalen Faltungsnetz hinzugefügt werden muss. According to one embodiment, the convolutional neural network is a hybrid convolutional neural network, ie a convolutional neural network with at least one additional feedback loop that also uses the output as input. A hybrid convolutional neural network (FICNN) is a convolutional neural network with an additional feedback loop that exhibits behavior similar to a recurrent neural network, where the output (modeled value/calculated parameter) is also used as input. The convolutional aspect of the neural network is important because the correlations between the entries are not just additive or linear correlations, so multiple filters must be used to get the physical correlations correct 9 reconstruct. According to one embodiment, the modeled temperature value is also used as an input, mimicking the widely used approach to solving ordinary differential equations (ODE). This feedback loop is the reason for the term "hybrid" to be added to the classical convolutional neural network.
Gemäß einer Ausführungsform umfasst das hybride neuronale Faltungsnetz eine Eingabeschicht, mindestens zwei eindimensionale Faltungsschichten, eine Maximal-Pooling-Schicht, eine Flatten-Schicht und eine Ausgabeschicht. According to one embodiment, the hybrid convolutional neural network comprises an input layer, at least two one-dimensional convolutional layers, a maximum pooling layer, a flattening layer and an output layer.
Die angewendete Netzstruktur ist wie folgt aufgebaut: The applied network structure is structured as follows:
Eingabeschicht: 5x10 Input layer: 5x10
Erste eindimensionale Faltungsschicht First one-dimensional convolution layer
Zweite eindimensionale Faltungsschicht Second one-dimensional convolution layer
Maximal-Pooling-Schicht Maximum pooling tier
Flatten-Schicht flatten layer
Ausgabeschicht: 1x1 Output layer: 1x1
Die Eingabeschicht besteht aus den relevanten Parametern (zum Beispiel zehn Parameter: Fahrzeuggeschwindigkeit, Umgebungstemperatur usw.), die vertikal gestapelt sind. Die Höhe einer solchen Anordnung hat fünf Zeilen für die letzten fünf Werte, die bei einem Raster von 1 Hz gemessen werden. Die erste eindimensionale Faltungsschicht besteht aus 45 Filtern. Jeder Filter hat eine Größe von 3x10 (also 30 Parameter pro Filter), was 1395 Parameter der ersten Schicht (1350 multiplikative Parameter und 45 Vorschaltwerte) ergibt. Die zweite eindimensionale Faltungsschicht besteht aus 20 Filtern. Jeder Filter hat eine Größe von 2x45 (also 90 Parameter pro Filter), was 1820 Parameter für die erste Schicht (1800 multiplikative Parameter und 20 Vorschaltwerte) ergibt. Die Maximal-Pooling-Schicht ist eine Maximalauswahl, die auf die vorherige Schicht mit einem Fenster von 2x2 angewendet wird. Die Flatten-Schicht wandelt die Faltungsstruktur in eine flache Struktur um. Die Ausgabeschicht umfasst 21 Parameter. Die Gesamtzahl der Parameter beträgt 3236 bei rektifizierter linearer Aktivierungsfunktion (ReLu) in allen Neuronen. 10 The input layer consists of the relevant parameters (e.g. ten parameters: vehicle speed, ambient temperature, etc.) stacked vertically. The height of such an array is five rows for the last five values measured at a 1 Hz grid. The first one-dimensional convolutional layer consists of 45 filters. Each filter has a size of 3x10 (ie 30 parameters per filter), which gives 1395 parameters of the first layer (1350 multiplicative parameters and 45 preamps). The second one-dimensional convolution layer consists of 20 filters. Each filter has a size of 2x45 (so 90 parameters per filter), which gives 1820 parameters for the first layer (1800 multiplicative parameters and 20 preset values). The maximum pooling tier is a maximum selection applied to the previous tier with a 2x2 window. The Flatten layer converts the folded structure into a flat structure. The output layer includes 21 parameters. The total number of parameters is 3236 with rectified linear activation function (ReLu) in all neurons. 10
Gemäß einer Ausführungsform wird kein Auffüllen verwendet. Sobald die ersten 5x10 Eingaben gefüllt sind (was aufgrund der Rekursion des neuronalen Faltungsnetzes 5 Sekunden erfordert), kann das neuronale Faltungsnetz seinen ersten Wert ausgeben. Die erste Zeile wird dann gelöscht. Und die neuen Eingaben werden im unteren Teil des Eingabefensters zusätzlich zur ersten Ausgabe verwendet, die als neuer Wert für die zehnte Spalte verwendet wird.According to one embodiment, no padding is used. Once the first 5x10 inputs are filled (which takes 5 seconds due to the recursion of the convolutional neural network), the convolutional neural network can output its first value. The first line is then deleted. And the new inputs are used in the lower part of the input window in addition to the first output used as the new value for the tenth column.
Der Vorgang wird wiederholt, indem das Eingabefenster bei jeder Interaktion eine Zeile nach unten verschoben wird. The process is repeated by moving the input window down one line with each interaction.
Mit einem solchen Leseschema kann das System online eingesetzt werden: Es müssen nur die letzten 5 Wiederholungen jeder der 10 Eingabevariablen gespeichert werden. Ein solch kleines Eingabefenster ist nicht nur wichtig, um das neuronale Faltungsnetz in Bezug auf den Speicher (RAM) klein zu halten, sondern auch, um die Belastung des ECU im Allgemeinen zu reduzieren, indem die Menge der zu speichernden Variablen verringert wird (größere Eingabefenster könnten zu einer nicht praktikablen Implementierung führen - Diskussionen über Speicher und Einsatz werden später in dieser Arbeit erörtert). Die endgültige Architektur ist das Ergebnis einer Rastersuche, die vier Haupt-Sweeps umfasste: With such a reading scheme, the system can be used online: only the last 5 repetitions of each of the 10 input variables need to be stored. Such a small input window is important not only to keep the convolutional neural network small in relation to memory (RAM), but also to reduce the load on the ECU in general by reducing the amount of variables to be stored (larger input windows could result in an impractical implementation - discussions of memory and deployment are covered later in this work). The final architecture is the result of a grid search that included four main sweeps:
Anzahl der Filter in der ersten Schicht Anzahl der Filter in der zweiten Schicht Drop-Schichten (optional) Number of filters in the first layer Number of filters in the second layer Drop layers (optional)
Aktivierungsfunktion activation function
Die Anzahl der Filter in der ersten und zweiten Schicht wurde in einem Bereich von 5 bis 45 bzw. 5 bis 20 (mit einem Schritt von 5) getestet. Gemäß einer Ausführungsform kann nach der zweiten Faltungsschicht eine Drop-Schicht mit einem Drop-Verhältnis von 10 % oder 20 % hinzugefügt werden. Die Drop-Schicht ist nützlich, um eine Überanpassung (Regularisierung) zu vermeiden. Gemäß einer Ausführungsform wurde keine Überanpassung festgestellt, da die Testgenauigkeit ähnlich hoch wie die Trainingsgenauigkeit war. The number of filters in the first and second layer was tested in a range of 5 to 45 and 5 to 20 (with a step of 5), respectively. According to one embodiment, a drop layer with a drop ratio of 10% or 20% can be added after the second convolution layer. The drop layer is useful to avoid overfitting (regularization). According to one embodiment, no overfitting was found since the testing accuracy was similar to the training accuracy.
Gemäß einer Ausführungsform ist der Parameter des Antriebsstrangs, der mithilfe des neuronalen Faltungsnetzes berechnet wird, ein Temperaturparameter des 11 According to one embodiment, the powertrain parameter calculated using the convolutional neural network is a temperature parameter of the 11
Antriebsstrangs. Gemäß einer Ausführungsform sind die gemessenen Parameter des Antriebsstrangs und/oder die ermittelten Parameter des Antriebsstrangs, die als Eingabeparameter für das neuronale Faltungsnetz verwendet werden, eine Fahrzeuggeschwindigkeit, ein Ansaugluftmassenstrom, ein boolescher Wert für die Kraftstoffabschaltung, eine Motorstillstandszeit, eine Motorlaufzeit, ein Pedalwert, ein boolescher Wert zur Anzeige, dass der Motor läuft, und/oder ein PWM-Signal des Kühlmittelgebläses. Gemäß einer Ausführungsform wird das neuronale Faltungsnetz nach einer vordefinierten Einwirkzeit mit einer gemessenen Umgebungstemperatur initialisiert. Gemäß einer Ausführungsform ist ein Sollwert des neuronalen Netzes ein gemessener Kühlmitteltemperaturwert. powertrain. According to one embodiment, the measured powertrain parameters and/or the determined powertrain parameters used as input parameters to the convolutional neural network are a vehicle speed, an intake air mass flow rate, a fuel cut-off Boolean value, an engine idling time, an engine running time, a pedal value, a Boolean value indicating that the engine is running and/or a PWM signal from the coolant fan. According to one embodiment, the convolutional neural network is initialized with a measured ambient temperature after a predefined exposure time. According to one embodiment, a setpoint of the neural network is a measured coolant temperature value.
Die modellierte Kühlmitteltemperatur ist die Ausgabe des hybriden neuronalen Faltungsnetzes. Da die Eingabeschicht 5x10 ist, bedeutet dies, dass mindestens die ersten fünf Zeilen dieser Spalte gefüllt sein müssen. Die modellierte Temperatur wird mit der Umgebungstemperatur initialisiert. Obwohl der Ansaugluftmassenstrom in vielen Fällen ein Abbild der Fahreranforderung (Pedalwert) ist, gilt dies nicht für Bedingungen wie die Leerlaufdrehzahl, sodass der Pedalwert zusammen mit dem Ansaugluftmassenstrom verwendet werden kann, um das Bild der Motorlast zu vervollständigen. The modeled coolant temperature is the output of the hybrid convolution neural network. Since the input layer is 5x10, this means that at least the first five rows of this column must be filled. The modeled temperature is initialized with the ambient temperature. Although intake air mass flow is in many cases a reflection of driver demand (pedal value), this is not true for conditions such as idle speed, so pedal value can be used together with intake air mass flow to complete the engine load picture.
Gemäß einer Ausführungsform ist der Parameter des Antriebsstrangs, der mithilfe des neuronalen Faltungsnetzes berechnet wird, eine Kühlmitteltemperatur an einem Kühlmittelflusseingang eines Riemenstartergenerators des Antriebsstrangs. Gemäß einer Ausführungsform sind die gemessenen Parameter des Antriebsstrangs und/oder die ermittelten Parameter des Antriebsstrangs, die als Eingabeparameter verwendet werden, ein Riemenstartergeneratorstrom, eine Fahrzeuggeschwindigkeit, ein Ansaugluftmassenstrom, ein boolescher Wert der Kraftstoffabschaltung, eine Umgebungstemperatur, eine Motordrehzahl, ein boolescher Wert der Kühlerlüfteraktivierung, eine Motorkühlmitteltemperatur, eine Ansauglufttemperatur vor dem Ladeluftkühler, eine Ansauglufttemperatur nach dem Ladeluftkühler, eine Ansauglufttemperatur am Krümmer, ein Pumpenaktivierungssignal und/oder ein Bypassventilaktivierungssignal. 12 According to one embodiment, the powertrain parameter calculated using the convolution neural network is a coolant temperature at a coolant flow input of a belt starter generator of the powertrain. According to one embodiment, the measured powertrain parameters and/or the determined powertrain parameters used as input parameters are a belt starter generator current, a vehicle speed, an intake air mass flow rate, a fuel cutoff boolean value, an ambient temperature, an engine speed, a cooling fan activation boolean value , an engine coolant temperature, an intake air temperature before the charge air cooler, an intake air temperature after the charge air cooler, an intake air temperature at the manifold, a pump activation signal, and/or a bypass valve activation signal. 12
Gemäß dieser Ausführungsform wird ein virtueller Sensor für die Temperatur am Eingang eines Elektromotors des Riemenstartgenerators (BSG), der durch das Wasser/Luft-Ladeluftkühlersystem gekühlt wurde, mithilfe des neuronalen Faltungsnetzes rekonstruiert. Ziel dieses Systems ist es, die Kosten für die Implementierung eines parallelen Hybridantriebsstrangs zu reduzieren, indem keine speziellen Kühler für die Kühlung des Elektromotors verwendet werden, sondern eine Steuerungslogik: mit einer Pumpe und einem Bypassventil, die es sowohl dem Ladeluftkühler als auch dem BSG ermöglichen, unter den gewünschten Bedingungen zu arbeiten. Das System liefert Daten, insbesondere Temperaturdaten, die als Eingabedaten für das neuronale Faltungsnetz verwendet werden können. Die Eingaben des Systems sind: ein Riemenstartergeneratorstrom, eine Fahrzeuggeschwindigkeit, ein Ansaugluftmassenstrom, eine Kraftstoffabschaltung (boolesch), eine Umgebungstemperatur, eine Motordrehzahl, eine Kühlerlüfteraktivierung, eine Motorkühlmitteltemperatur, eine Ansauglufttemperatur vor dem Ladeluftkühler, eine Ansauglufttemperatur nach dem Ladeluftkühler, eine Ansauglufttemperatur am Krümmer, eine Pumpenaktivierung (PWM-Signal) und/oder eine Bypassventilaktivierung (PWM-Signal). According to this embodiment, a virtual sensor for the temperature at the input of a belt starter generator (BSG) electric motor cooled by the water/air intercooler system is reconstructed using the convolutional neural network. The aim of this system is to reduce the cost of implementing a parallel hybrid powertrain by not using dedicated radiators to cool the electric motor, but using a control logic: with a pump and a bypass valve that allows both the intercooler and the BSG to work under the desired conditions. The system provides data, in particular temperature data, which can be used as input data for the convolutional neural network. The inputs to the system are: belt starter generator current, vehicle speed, intake air mass flow, fuel cutoff (boolean), ambient temperature, engine speed, radiator fan activation, engine coolant temperature, intake air temperature before the charge air cooler, intake air temperature after the charge air cooler, intake air temperature at the manifold, a pump activation (PWM signal) and/or a bypass valve activation (PWM signal).
Der Trainingsdatenstamm zum Trainieren des neuronalen Faltungsnetzes für diese Ausführungsform umfasste 5600 Sekunden. Der Trainingsdatenstamm wurde durch Messungen auf einem Prüfstand gewonnen. Dieser relativ kleine Datenstamm war dennoch ausreichend, vor allem weil das System reich an Temperaturinformationen ist. Es wurde eine Aufteilung von 85 %/15 % zwischen Training und Test verwendet. The training data set for training the convolutional neural network for this embodiment was 5600 seconds. The training data base was obtained through measurements on a test bench. However, this relatively small data set was sufficient, mainly because the system is rich in temperature information. An 85%/15% split between training and testing was used.
Gemäß einer Ausführungsform ist eine Aktivierungsfunktion des neuronalen Faltungsnetzes eine rektifizierte lineare Einheitsfunktion (ReLu), die bei negativen Eingaben 0 liefert und bei positiven Eingaben die Eingabe als Ausgabe übergibt, oder eine hyperbolische Tangensfunktion (tanh), die der Gleichung
Figure imgf000014_0001
13 folgt, wobei s(z) die Ausgabe ist und wobei z eine beliebige Zahl ist, die einen beliebigen Parameter repräsentiert. Gemäß dieser Ausführungsform werden zwei verschiedene Funktionen verwendet: Rektifizierte lineare Einheit (ReLu): liefert 0 für negative Einträge und übergibt die Eingabe als Ausgabe für positive Einträge. Hyperbolischer Tangens (tanh): „quetscht“ die Eingaben zu einer Ausgabe von -1 bis +1 gemäß der obigen Gleichung zusammen. Diese beiden Aktivierungsfunktionen liefern die erforderliche Genauigkeit. Jedoch können auch andere Aktivierungsfunktionen verwendet werden.
According to one embodiment, an activation function of the convolutional neural network is a rectified linear unit function (ReLu) that returns 0 for negative inputs and passes the input as an output for positive inputs, or a hyperbolic tangent function (tanh) that satisfies equation
Figure imgf000014_0001
13 follows, where s(z) is the output and where z is any number representing any parameter. According to this embodiment, two different functions are used: Rectified linear unit (ReLu): returns 0 for negative entries and passes the input as an output for positive entries. Hyperbolic tangent (tanh): "squeezes" the inputs into an output from -1 to +1 according to the equation above. These two activation functions provide the required accuracy. However, other activation functions can also be used.
Die Sweeps zur Optimierung des hybriden neuronalen Faltungsnetzes werden jedoch gemäß einer Ausführungsform zufällig und nicht inkrementeil wie bei einem „Rastersuch“-Ansatz durchgeführt. Daher wurden nicht alle Kombinationen durchgeführt. Sobald eine bestimmte Kombination das erwartete Ergebnis lieferte, wurden nur noch ähnliche Kombinationen bewertet. However, according to one embodiment, the sweeps for optimizing the hybrid convolutional neural network are performed randomly and not incrementally as in a "grid search" approach. Therefore, not all combinations were carried out. Once a particular combination gave the expected result, only similar combinations were evaluated.
Gemäß einer Ausführungsform wird die Anzahl der verborgenen Schichten basierend auf der geringsten Anzahl gewählt, die erforderlich ist, um ein relativ gutes Ergebnis zu erzielen: Ein erster Test mit nur einer Faltungsschicht wurde durchgeführt, aber selbst mit mehreren Kombinationen von Hyperparametern war das neuronale Faltungsnetz nicht in der Lage, den richtigen Parameter (Temperatur) vorherzusagen. Da die Ergebnisse mit zwei Faltungsschichten zufriedenstellend waren, wurde keine weitere Inkrementierung vorgenommen, um eine mögliche Überanpassung zu verhindern. According to one embodiment, the number of hidden layers is chosen based on the lowest number required to achieve a relatively good result: A first test was performed with only one convolutional layer, but even with several combinations of hyperparameters the convolutional neural network was not able to predict the correct parameter (temperature). Since the results with two layers of convolution were satisfactory, no further increment was made to prevent possible overfitting.
Als Anfangswert wurden 8700 Sekunden an Messungen, aufgeteilt in Lose von 300 Sekunden (eine angemessene durchschnittliche Aufwärmzeit für den Verbrennungsmotor bei unterschiedlichen Umgebungstemperaturen), gesammelt und als Haupttrainingsdaten für das hybride neuronale Faltungsnetz verwendet. Das System wies jedoch eine Kombination aus Überanpassung und schlechter Testgenauigkeit auf. Die Datenmenge wurde dann durch Feature Engineering in zwei Schritten vergrößert: Erhöhen der Umgebungstemperatur um 3 °C und der gemessenen Kühlmitteltemperatur um 3 °C, wobei alle anderen Parameter unverändert blieben. Verringern der Umgebungstemperatur um 3 °C und der 14 gemessenen Kühlmitteltemperatur um 3 °C, wobei alle anderen Parameter unverändert blieben. Nach diesen Schritten umfasste der endgültige Trainingsdatenstamm 26100 Sekunden. Gemäß einer Ausführungsform wurde ein Trainingsstamm-Split von 85%/15% verwendet. Gemäß einer anderen Ausführungsform kann eine K-fache Validierung angewendet werden. As an initial value, 8700 seconds of measurements divided into lots of 300 seconds (a reasonable average warm-up time for the combustion engine at different ambient temperatures) were collected and used as the main training data for the hybrid convolutional neural network. However, the system exhibited a combination of overfitting and poor test accuracy. The data set was then increased by feature engineering in two steps: increasing the ambient temperature by 3 °C and the measured coolant temperature by 3 °C, with all other parameters remaining unchanged. Reducing the ambient temperature by 3°C and the 14 measured coolant temperature by 3 °C, with all other parameters remaining unchanged. After these steps, the final training dataset was 26100 seconds. According to one embodiment, a training strain split of 85%/15% was used. According to another embodiment, K-fold validation may be applied.
Die wichtigsten 29 Messungen für die Trainingsdaten untersuchten eine große Vielzahl von Bedingungen und Fahrzyklen des Fahrzeugs, zum Beispiel: a. Kaltstart bei -30 °C, gefolgt von 5 Minuten Leerlauf b. Kaltstart bei -15 °C, gefolgt von einer stadtähnlichen Fahrweise c. Start bei +30 °C, gefolgt von hochdynamischem Fahren bei hoher Belastung d. Kaltstart bei -20 °C, gefolgt von einem hochdynamischen Fahrzyklus mit hoher Belastung (möglich, da der Test auf einem zugefrorenen See in einer kontrollierten Umgebung durchgeführt wurde) e. Start bei +40 °C, gefolgt von 5 Minuten Leerlauf The main 29 measurements for the training data examined a wide variety of conditions and driving cycles of the vehicle, for example: a. Cold start at -30°C followed by 5 minutes idle b. Cold start at -15 °C followed by a city-like driving style c. Start at +30 °C, followed by highly dynamic driving at high loads d. Cold start at -20°C followed by a high load, highly dynamic drive cycle (possible as the test was conducted on a frozen lake in a controlled environment) e. Start at +40 °C, followed by 5 minutes idle
Alle Tests wiesen jedoch eine Gemeinsamkeit auf: Die Motorstillstandszeit betrug mehr als 8 Stunden, was darauf hindeutet, dass der Motor für eine lange Zeit Stillstand und die Kühlmitteltemperatur durch die Umgebungstemperatur angenähert werden konnte. However, all tests had one thing in common: the engine idle time was more than 8 hours, which indicates that the engine could be idle for a long time, and the coolant temperature could be approximated by the ambient temperature.
Der Grund dafür war, dass das System die anfängliche Einwirkzeit nicht korrekt von der Stopp/Start-Strategie unterschied, da die Motorstillstandszeit und die Motorlaufzeit sowohl beim ersten Start als auch bei jedem weiteren Start zurückgesetzt werden. Da die Stopp/Start-Strategie hauptsächlich bei heißem Motor aktiv ist, führte dies dazu, dass das neuronale Faltungsnetz zunächst einen Temperaturabfall berechnete (Versuch, die Umgebungstemperatur wieder zu erreichen, sobald die Motorstillstandszeit eingestellt war, genau wie bei der Initialisierung des Modells), was nicht plausibel war. Dieses Problem konnte gemäß einer Ausführungsform in der ECU-Software gelöst werden, indem ein Flag gesetzt und die Modellaktualisierung während der Stopp/Start-Phase unterbunden wird, aber bei der Entwicklung des Modells konnte keine Strategie einfach angewandt werden, sodass der einfachste Weg darin bestand, die Einwirkzeit und 15 die Stopp/Start-Dauer mit einer höheren Marge zu differenzieren (was das Lernen des neuronalen Faltungsnetzes während des Trainingsprozesses erleichtert). The reason for this was that the system did not correctly distinguish the initial exposure time from the stop/start strategy, as the engine idle time and the engine running time are reset both on the first start and on each subsequent start. Since the stop/start strategy is mainly active when the engine is hot, this caused the convolutional neural network to first calculate a temperature drop (attempting to regain ambient temperature once the engine dwell time was set, just like when the model was initialized), which was not plausible. This problem could be solved according to one embodiment in the ECU software by setting a flag and inhibiting the model update during the stop/start phase, but no strategy could be easily applied when developing the model, so that was the easiest way , the exposure time and 15 to differentiate the stop/start duration with a higher margin (which facilitates the learning of the convolutional neural network during the training process).
Gemäß einer Ausführungsform wurden drei Hyperparameter untersucht, um das Modell zu optimieren: der Compiler, die Verlustfunktion und der Integrationsschritt. Gemäß einer Ausführungsform können drei verschiedene Compiler verwendet werden: a. Stochastischer Gradientenabstieg b. RMSprop c. Adam According to one embodiment, three hyperparameters were examined to optimize the model: the compiler, the loss function, and the integration step. According to one embodiment, three different compilers can be used: a. Stochastic gradient descent b. RMSprop c. Adam
Adam kann als eine Mischung aus RMSprop und Adagrad interpretiert werden. Adam implementiert den exponentiellen gleitenden Durchschnitt des Gradienten zur Skalierung der Lernrate anstelle eines einfachen Durchschnitts wie in Adagrad. Außerdem enthält es einen Impuls, der die Konvergenz beschleunigt und mit der durch RMSprop durchgeführten Schwingungsreduzierung kombiniert. Adam can be interpreted as a mixture of RMSprop and Adagrad. Adam implements the exponential moving average of the gradient to scale the learning rate instead of a simple average as in Adagrad. Also, it includes a pulse that accelerates convergence and combines it with the vibration reduction performed by RMSprop.
Gemäß einer Ausführungsform können zwei verschiedene Verlustfunktionen verwendet werden: a. Mittlerer absoluter Fehler b. Mittlerer quadratischer Fehler According to one embodiment, two different loss functions can be used: a. Mean absolute error b. Mean squared error
Beide Verfahren wiesen eine ähnliche Endgenauigkeit auf, wobei die mittleren quadratischen Fehler eine schnellere Konvergenz ermöglichten (10 Schleifen anstelle von 20 Schleifen). Both methods had similar final accuracy, with mean square errors allowing for faster convergence (10 loops instead of 20 loops).
Gemäß einer Ausführungsform können drei verschiedene Integrationsschritte verwendet werden: a. 0,001 b. 0,005 c. 0,01 According to one embodiment, three different integration steps can be used: a. 0.001 b. 0.005c. 0.01
Der Wert von 0,001 wurde verwendet, weil bei Verwendung von RMSprop die endgültige Konvergenz bei größeren Integrationsschritten stark beeinträchtigt wurde. Denn selbst bei der kleinsten Schrittintegration lag die Bearbeitungszeit unter 20 Minuten. Beim Deep Learning ist es üblich, zusammen mit den drei oben 16 genannten Hyperparametern eine vierte Analyse durchzuführen: eine Prüfung der Sensitivität bei zufälligem Initialisierungswert. Der Grund dafür ist, dass der Compiler, wie bei jedem anderen Optimierungsproblem auch, je nach Initialisierung (Seed) der Gewichtungen („w“) in einem lokalen Minimum stecken bleiben und den Weg zum globalen Minimum nicht finden kann; durch Variation der Art der Initialisierung kann die Robustheit des Optimierungsalgorithmus überprüft werden. Ein globaler Minimalpunkt ist jedoch keine zwingende Voraussetzung, wenn es um die Optimierung mehrerer Variablen geht. Da eine zufriedenstellende Konvergenz bei Verwendung aller genannten Compiler in den verschiedenen Durchläufen der neuronalen Faltungsnetze (wenn auch mit unterschiedlichen Leistungen) erreicht wurde, ist eine Initialisierungssensitivität nicht zwingend erforderlich. The value of 0.001 was used because when using RMSprop, the final convergence was severely compromised for larger integration steps. Because even with the smallest step integration, the processing time was less than 20 minutes. It's common in deep learning, along with the three above 16 to carry out a fourth analysis: a sensitivity test with a random initialization value. The reason for this is that, as with any other optimization problem, depending on the initialization (seed) of the weights (“w”), the compiler can get stuck in a local minimum and not find the way to the global minimum; the robustness of the optimization algorithm can be checked by varying the type of initialization. However, a global minimum point is not a mandatory requirement when it comes to optimizing multiple variables. Since satisfactory convergence was achieved when using all of the compilers mentioned in the various runs of the neural convolutional networks (albeit with different performance), initialization sensitivity is not absolutely necessary.
Ein weiteres Merkmal von Faltungsnetzen jeglicher Art ist ihre Größe und ihr CPU- Bedarf: Ihre Präzision und hohe Generalisierung haben ihren Preis, wenn es um Speicher und CPU geht. Another characteristic of convolutional networks of any kind is their size and CPU requirements: their precision and high generalization come at a price when it comes to memory and CPU.
Der Speicherbedarf ist in zwei Bereiche unterteilt: RAM und Flash. Der zusätzliche Bedarf an RAM im Vergleich zu den derzeitigen physikalischen Modellen ergibt sich aus der Tatsache, dass in der Regel größere Eingaben erforderlich sind. Im Fall der Studie, eine Matrix von 5x10 statt einer ähnlichen 1x7 Eingabe im Referenzmodell, sodass ein Speicher für diese zusätzlichen 43 Variablen bereitgestellt werden muss. Ein weiteres Problem ist die Berechnung selbst: Das als Referenz verwendete physikalische Modell hat etwa 800 Variablen, die sich auf Kennfelder und Konstanten verteilen, und bei jeder Iteration müssen durchschnittlich 80 Variablen im RAM gespeichert werden, damit der endgültige Parameter (z. B. eine Kühlmitteltemperatur) berechnet werden kann. Memory requirements are divided into two areas: RAM and Flash. The additional RAM requirement compared to current physical models results from the fact that larger inputs are typically required. In the case of the study, a matrix of 5x10 rather than a similar 1x7 input in the reference model, so memory needs to be provided for these additional 43 variables. Another problem is the calculation itself: the physical model used as a reference has about 800 variables divided into maps and constants, and at each iteration an average of 80 variables must be stored in RAM so that the final parameter (e.g. a coolant temperature) can be calculated.
Selbst wenn man berücksichtigt, dass jedes Kennfeld eine zweidimensionale lineare Interpolation für die Berechnung ihrer Ausgabe benötigt (sodass tatsächlich vier Speicherplätze für eine Ausgabe verwendet werden), ist die Gesamtmenge des Arbeitsspeichers immer noch viel kleiner als bei der 17 gleichzeitigen Verarbeitung der größeren Eingabe und aller 3236 Parameter des neuronalen Faltungsnetzes. Even taking into account that each map requires a two-dimensional linear interpolation to calculate its output (so that four memory locations are actually used for one output), the total amount of working memory is still much smaller than the 17 simultaneously processing the larger input and all 3236 parameters of the convolutional neural network.
Aus demselben Grund, aus dem der RAM-Bedarf während der Verarbeitung zunimmt, steigt auch die CPU-Belastung: Das (hybride) neuronale Faltungsnetz verfügt nur über Addition und Multiplikation und eine einfache ReLu-Aktivierung (die im Vergleich zu einem hyperbolischen Tangens sehr wenig von der CPU verlangt), doch die Menge der Parameter (etwa 40-mal höher) führt zu einer durchschnittlich 12-fachen CPU-Belastung bzw. zu einer 8-fachen Berechnungszeit bei gleichbleibender CPU-Leistung. Dieser Wert ist immer noch vernünftig und erfordert geringfügige Kompromisse bei den Funktionen im ECU. Der Speicherbedarf im Flash ist ebenfalls hoch. Grundsätzlich wird das direkte Verhältnis zwischen den Variablen für den Speicherbedarf angewandt, der gemäß einer Ausführungsform 3236 im (hybriden) neuronalen Faltungsnetz gegenüber 250 für das physikalische Referenzmodell beträgt, was einer Zunahme um das 13- fache im Flash entspricht. For the same reason that RAM requirements increase during processing, so does CPU load: the convolutional (hybrid) neural network has only addition and multiplication and a simple ReLu activation (which, compared to a hyperbolic tangent, requires very little required by the CPU), but the number of parameters (about 40 times higher) leads to an average 12-fold CPU load or 8-fold calculation time with the same CPU performance. This value is still reasonable and requires minor trade-offs in the functions in the ECU. The memory requirement in the flash is also high. Basically, the direct relationship between the variables is applied for the memory requirement, which according to one embodiment is 3236 in the (hybrid) convolutional neural network versus 250 for the physical reference model, which corresponds to a 13-fold increase in flash.
Der Einsatz von neuronalen Netzen anstelle der klassischen physikalisch mathematischen Modellierung kann nicht nur bei der Verwendung der Genauigkeit als Metrik erfolgen, sondern auch unter Berücksichtigung der Implementierung eines solchen Verfahrens in die derzeit verfügbare Flardware (ECU). Ein solcher Ansatz verkürzt nicht nur die Entwicklungs- und Kalibrierungszeit, sondern hat auch ein hohes Übertragbarkeitspotenzial. Auf diese Weise lassen sich Ressourcen (Zeit, Anzahl der Fahrzeuge für das Projekt, Teamgröße usw.) einsparen. The use of neural networks instead of classic physical-mathematical modeling can be done not only when using accuracy as a metric, but also considering the implementation of such a method in currently available flardware (ECU). Such an approach not only reduces development and calibration time, but also has high transferability potential. In this way, resources (time, number of vehicles for the project, team size, etc.) can be saved.
Insbesondere bei der Entwicklung neuer Flybridantriebstränge und komplett neuer Hardware (DC/DC-Wandler, Batterien, BSG) können die Kosteneinsparungen bei der Entwicklung durch die Verwendung eines (hybriden) neuronalen Faltungsnetzes für die Modellierung eines virtuellen Sensors zu einer wichtigen Quelle der Kostensenkung werden. 18 Especially when developing new flybrid powertrains and completely new hardware (DC/DC converters, batteries, BSG), the cost savings in development by using a (hybrid) convolutional neural network for modeling a virtual sensor can become an important source of cost reduction. 18
Gemäß einem weiteren Aspekt der vorliegenden Offenbarung wird eine Steuervorrichtung spezifiziert, wobei die Steuervorrichtung eine Steuereinheit umfasst, die dazu ausgelegt ist, ein oben beschriebenes computerimplementiertes Verfahren zum Steuern eines Antriebsstrangs eines Fahrzeugs auszuführen. Die Steuervorrichtung ist zum Beispiel die Steuervorrichtung, die speziell für die Steuerung des Fahrzeugmotors vorgesehen ist. Gemäß einer anderen Ausführungsform ist es auch denkbar, dass die Steuervorrichtung Teil einer anderen Steuervorrichtung ist, das andere Teile des Fahrzeugs steuert. According to a further aspect of the present disclosure, a control device is specified, the control device comprising a control unit configured to execute a computer-implemented method for controlling a powertrain of a vehicle as described above. The control device is, for example, the control device dedicated to the control of the vehicle engine. According to another embodiment, it is also conceivable that the control device is part of another control device that controls other parts of the vehicle.
Weitere vorteilhafte Ausführungsformen der vorliegenden Offenbarung gehen aus der detaillierten Beschreibung beispielhafter Ausführungsformen in Verbindung mit den Figuren hervor. Further advantageous embodiments of the present disclosure emerge from the detailed description of exemplary embodiments in connection with the figures.
In den Figuren zeigt: In the figures shows:
Fig. 1 einen beispielhaften Kaltstart bei -30 °C mit festsitzendem Kühlmitteltemperatursensor, 1 shows an example of a cold start at -30° C. with a stuck coolant temperature sensor,
Fig. 2 eine beispielhafte Darstellung eines Neurons aus einem neuronalen Netz, 2 shows an exemplary representation of a neuron from a neural network,
Fig. 3 eine schematische Darstellung eines neuronalen Faltungsnetzes (CNN), 3 shows a schematic representation of a convolutional neural network (CNN),
Fig. 4 einen beispielhaften Graphen einer ReLu-Aktivierungsfunktion, 4 shows an exemplary graph of a ReLu activation function,
Fig. 5 einen beispielhaften Graphen einer hyperbolischen Tangens- Aktivierungsfunktion (tanh), 5 shows an exemplary graph of a hyperbolic tangent activation function (tanh).
Fig. 6 eine beispielhafte Genauigkeit in einem Trainingsstamm, der bei 23 °C beginnt, gefolgt durch eine Stadtfahrt, 6 shows an exemplary accuracy in a training strain starting at 23° C. followed by a city drive.
Fig. 7 eine beispielhafte Genauigkeit in einem Trainingsstamm mit einem Kaltstart bei -13 °C, gefolgt durch Leerlauf und Parkmanöver, 19 7 shows an exemplary accuracy in a training strain with a cold start at -13° C., followed by idling and parking maneuvers. 19
Fig. 8 eine beispielhafte Prüfgenauigkeit in einem WLTC-Emissionsprüfzyklus, 8 shows an exemplary test accuracy in a WLTC emissions test cycle,
Fig. 9 eine beispielhafte Umgebung eines Riemenstartergenerators, der zusammen mit einem Ladeluftkühlwasserkühlsystem montiert ist, 9 shows an exemplary environment of a belt starter generator mounted together with a charge air cooling water cooling system.
Fig. 10 eine beispielhafte Trainingsgenauigkeit für ein Eintrittstemperaturmodell eines Riemenstartergenerators (Trainingsbeispiel Nummer 1), 10 shows an exemplary training accuracy for an inlet temperature model of a belt starter generator (training example number 1),
Fig. 11 eine beispielhafte Trainingsgenauigkeit für ein Eintrittstemperaturmodell eines Riemenstartergenerators (Trainingsbeispiel Nummer 3), 11 shows an exemplary training accuracy for an inlet temperature model of a belt starter generator (training example number 3),
Fig. 12 eine beispielhafte Prüfgenauigkeit für die Eintrittstemperatur eines Riemenstartergenerators. 12 shows an exemplary test accuracy for the inlet temperature of a belt starter generator.
Figur 1 zeigt ein Beispiel für einen festsitzenden Sensor nach einem Kaltstart bei einer Umgebungstemperatur von minus 32 °C. Wie zu Beginn der Messung zu erkennen ist, bleibt der Sensorwert stehen und bewegt sich nicht. Die modellierte Kühlmitteltemperatur steigt weiter an, wie bei der Kühlmitteltemperatur selbst physikalisch zu erwarten war. Sobald die Differenz zwischen diesen beiden Werten den kalibrierbaren Schwellenwert erreicht (in diesem Fall 20 °C, etwa bei der 80-Sekunden-Marke), wird die Diagnose gestellt: Das System schaltet auf das modellierte Kühlmitteltemperaturmodell um und verwendet dessen Werte wie für alle anderen Funktionen des ECU. Später, wie in Figur 1 zu sehen ist, beginnt der Sensor wieder zu arbeiten: Es ist die Heilungsphase. Sobald der Messwert in den erweiterten Bereich eintritt, wird der Sensor wieder als gültig angesehen, und die Systemtemperatur schaltet vom Ersatzmodell zurück auf den Sensorwert. FIG. 1 shows an example of a stuck sensor after a cold start at an ambient temperature of minus 32°C. As can be seen at the beginning of the measurement, the sensor value remains stationary and does not move. The modeled coolant temperature continues to increase, as could be physically expected from the coolant temperature itself. As soon as the difference between these two values reaches the calibratable threshold (in this case 20 °C, around the 80-second mark), the diagnosis is made: the system switches to the modeled coolant temperature model and uses its values as for all others Functions of the ECU. Later, as can be seen in figure 1, the sensor starts working again: it is the healing phase. Once the reading enters the extended range, the sensor is considered valid again and the system temperature switches back to the sensor reading from the surrogate model.
Figur 2 zeigt eine kurze Zusammenfassung der Funktionsweise des Basisneurons eines neuronalen Netzes. Das Neuron ist nicht mehr als eine Summe von linearen Kombinationen (z), die durch Multiplikation der Gewichtungen (W) mit den Eingaben des Neurons und Hinzufügen eines Vorschaltwertes (b) gebildet werden. Auf diese Kombination folgt dann eine nichtlineare Funktion (g). 20 FIG. 2 shows a brief summary of the functioning of the basic neuron of a neural network. The neuron is nothing more than a sum of linear combinations (z) formed by multiplying the weights (W) by the neuron's inputs and adding a preload value (b). This combination is then followed by a non-linear function (g). 20
Figur 3 zeigt die schematische Darstellung eines Faltungsnetzes mit einer globalen Maximal-Pooling-Zwischenschicht. Die Eingabe hat n Zeilen als Zeiteintrag mit k Spalten als Merkmale. In Figur 3 ist der Kernel eine 2x6-Matrix. Die Ausgabe nach der eindimensionalen Kernel-Faltungsfilterung ist immer ein Spaltenvektor. Mehrere Filter werden verwendet, um die Faltungsschicht zu bilden, die eine horizontale Verkettung der Ausgaben aus den Kernels darstellt. FIG. 3 shows the schematic representation of a convolutional network with a global maximum pooling intermediate layer. The input has n rows as a time entry with k columns as characteristics. In Figure 3, the kernel is a 2x6 matrix. The output after the one-dimensional kernel convolution filtering is always a column vector. Several filters are used to form the convolution layer, which is a horizontal concatenation of the outputs from the kernels.
Figur 4 zeigt einen beispielhaften Graphen einer rektifizierten linearen Einheits- (ReLu) Aktivierungsfunktion. Die ReLu-Aktivierungsfunktion liefert 0 für negative Einträge und übergibt die Eingabe als Ausgabe für positive Einträge. Figure 4 shows an exemplary graph of a rectified linear unit (ReLu) activation function. The ReLu activation function returns 0 for negative entries and passes the input as an output for positive entries.
Figur 5 zeigt eine beispielhafte Grafik einer hyperbolischen Tangens- Aktivierungsfunktion (tanh). Die hyperbolische Tangens-Aktivierungsfunktion „quetscht“ die Eingaben zu einer Ausgabe von -1 bis +1 gemäß der folgenden Gleichung zusammen:
Figure imgf000022_0001
folgt, wobei s(z) die Ausgabe ist und wobei z eine beliebige Zahl ist, die einen beliebigen Parameter repräsentiert.
Figure 5 shows an exemplary graph of a hyperbolic tangent activation function (tanh). The hyperbolic tangent activation function "squeezes" the inputs into an output from -1 to +1 according to the following equation:
Figure imgf000022_0001
follows, where s(z) is the output and where z is any number representing any parameter.
Die Figuren 6 bis 8 zeigen die Testergebnisse, wobei das neuronale Faltungsnetz zum Bestimmen der Kühlmitteltemperatur eines Verbrennungsmotors verwendet wurde. Das neuronale Faltungsnetz wird daher als virtueller Sensor verwendet. Die Standardmetrik, die in neuronalen Netzen bei der Verwendung der MSE- Verlustfunktion verwendet wird, ist die „Root Means Squared“(RMS)-Genauigkeit, d. h. die Quadratwurzel aus der Summe aller Abweichungen. Die Temperaturdifferenz zwischen dem Sensorwert und dem modellierten Temperaturwert wird als Flauptmetrik verwendet, um die Genauigkeit des (hybriden) Faltungsnetzes zu überprüfen. Wie in den Figuren 6 bis 8 zu sehen ist, wurde in 100% der Fälle (Training und Test) eine Abweichung innerhalb eines Bereichs von +-12 °C erreicht, wobei 85% der Fälle in einem Bereich von +-6 °C blieben. In den Figuren 6 bis 8 stellt der dunklere Verlauf die gemessene Kühlmitteltemperatur und der hellere Verlauf die durch das hybride Faltungsnetz 21 berechnete modellierte Kühlmitteltemperatur dar. Figur 6 zeigt eine beispielhafte Genauigkeit in einem Trainingsstamm, der bei 23 °C beginnt, gefolgt von einer Stadtfahrt. Figur 7 zeigt eine beispielhafte Genauigkeit in einem Trainingsstamm mit einem Kaltstart bei -13 °C, gefolgt von Leerlauf und Einparkmaneuver. Figur 8 zeigt eine beispielhafte Prüfgenauigkeit in einem WLTC-Emissionsprüfzyklus. Figures 6 to 8 show the test results where the convolutional neural network was used to determine the coolant temperature of an internal combustion engine. The convolutional neural network is therefore used as a virtual sensor. The standard metric used in neural networks when using the MSE loss function is the Root Means Squared (RMS) accuracy, ie the square root of the sum of all deviations. The temperature difference between the sensor value and the modeled temperature value is used as a default metric to check the accuracy of the (hybrid) convolutional network. As can be seen in Figures 6 to 8, in 100% of the cases (training and test) a deviation within a range of +-12°C was achieved, with 85% of the cases remaining within a range of +-6°C . In FIGS. 6 to 8, the darker curve represents the measured coolant temperature and the lighter curve represents that through the hybrid convolution network 21 computed modeled coolant temperature. Figure 6 shows exemplary accuracy in a training strain starting at 23°C followed by city driving. Figure 7 shows an exemplary accuracy in a training strain with a cold start at -13 °C, followed by idling and parking manoeuvres. FIG. 8 shows an exemplary test accuracy in a WLTC emissions test cycle.
Figur 9 zeigt eine beispielhafte Umgebung eines Riemenstartergenerators, der zusammen mit dem Ladeluftkühlwasserkühlsystem eines Antriebsstrangs eines Fahrzeugs montiert ist. Die Architektur des hybriden neuronalen Faltungsnetzes wurde auf ein Modell des Riemenstartergenerators angewendet. Ziel ist die Rekonstruktion eines virtuellen Sensors für die Temperatur am Eingang eines Elektromotors - Riemenstartgenerator (BSG), der durch das Wasser/Luft- Ladeluftkühlersystem gekühlt wurde. Dieses System zielt darauf ab, die Kosten für die Implementierung eines parallelen Hybridantriebsstrangs zu reduzieren, indem keine speziellen Kühler für die Kühlung des Elektromotors verwendet werden, sondern eine Steuerungslogik zur Anwendung kommt: mit einer Pumpe und einem Bypassventil, die es sowohl dem Ladeluftkühler als auch dem BSG ermöglichen, unter den gewünschten Bedingungen zu arbeiten. Eine solche Umgebung ist in Figur 9 dargestellt. Die Figuren 10, 11 und 12 zeigen die Prüfgenauigkeit des hybriden neuronalen Faltungsnetzes, das auf dieses System angewendet wurde.Figure 9 shows an exemplary environment of a belt starter generator mounted in conjunction with the charge air cooling water cooling system of a vehicle powertrain. The hybrid convolutional neural network architecture was applied to a belt starter generator model. The aim is to reconstruct a virtual sensor for the temperature at the input of an electric motor - belt starter generator (BSG) cooled by the water/air intercooler system. This system aims to reduce the cost of implementing a parallel hybrid powertrain by not using dedicated radiators to cool the electric motor, but using a control logic: with a pump and a bypass valve that allows both the intercooler and the enable the BSG to work under the desired conditions. Such an environment is shown in FIG. Figures 10, 11 and 12 show the verification accuracy of the hybrid convolution neural network applied to this system.
In den Figuren 10 bis 12 stellt der dunklere Verlauf die gemessene Kühlmitteltemperatur und der hellere Verlauf die modellierte Kühlmitteltemperatur durch das hybride Faltungsnetz dar. Figur 10 zeigt eine beispielhafte Trainingsgenauigkeit für ein BSG-Eintrittstemperaturmodell (Trainingsbeispiel Nummer 1 ). Figur 11 zeigt eine beispielhafte Trainingsgenauigkeit für ein BSG- Eintrittstemperaturmodell (Trainingsbeispiel Nummer 3). Figur 12 zeigt eine beispielhafte Prüfgenauigkeit für eine BSG-Eintrittstemperatur. In Figures 10 to 12, the darker curve represents the measured coolant temperature and the lighter curve represents the modeled coolant temperature through the hybrid convolution network. Figure 10 shows an exemplary training accuracy for a BSG inlet temperature model (training example number 1). FIG. 11 shows an exemplary training accuracy for a BSG inlet temperature model (training example number 3). FIG. 12 shows an exemplary test accuracy for a BSG inlet temperature.
Es sind eine Anzahl an Implementierungen beschrieben worden. Nichtsdestotrotz versteht sich, dass verschiedene Modifikationen vorgenommen werden können, ohne sich vom Wesen und Schutzbereich der Offenbarung zu entfernen. Dementsprechend liegen andere Implementierungen innerhalb des Schutzbereichs der folgenden Ansprüche. A number of implementations have been described. Nonetheless, it should be understood that various modifications can be made without departing from the spirit and scope of the disclosure. Accordingly, other implementations are within the scope of the following claims.

Claims

22 Patentansprüche 22 patent claims
1. Computerimplementiertes Verfahren zum Steuern eines Antriebsstrangs eines Fahrzeugs, das die folgenden Schritte umfasst: A computer-implemented method for controlling a powertrain of a vehicle, comprising the steps of:
Betreiben des Antriebsstrangs des Fahrzeugs; operating the powertrain of the vehicle;
Messen einer Vielzahl von Parametern des Antriebsstrangs unter Verwendung mindestens eines Sensors des Antriebsstrangs und/oder Bestimmen einer Vielzahl von Parametern des Antriebsstrangs unter Verwendung mindestens eines Antriebsstrangmodells; measuring a plurality of powertrain parameters using at least one powertrain sensor and/or determining a plurality of powertrain parameters using at least one powertrain model;
Bereitstellen eines trainierten neuronalen Netzes, wobei das neuronale Netz ein neuronales Faltungsnetz ist, das zum Modellieren eines Parameters eines virtuellen Sensors des Antriebsstrangs ausgelegt ist; providing a trained neural network, the neural network being a convolutional neural network configured to model a parameter of a virtual sensor of the powertrain;
Bereitstellen der gemessenen Parameter des Antriebsstrangs und/oder der ermittelten Parameter des Antriebsstrangs als Eingabedaten für das trainierte neuronale Faltungsnetz und mit dem neuronalen Faltungsnetz Berechnen der Parameter des virtuellen Sensors des Antriebsstrangs als Ausgabedaten des neuronalen Faltungsnetzes; providing the measured powertrain parameters and/or the determined powertrain parameters as input data to the trained convolutional neural network and using the convolutional neural network to calculate the parameters of the virtual powertrain sensor as output data of the convolutional neural network;
Steuern des Antriebsstrangs des Fahrzeugs anhand der berechneten Parameter des virtuellen Sensors. Controlling the vehicle's powertrain based on the calculated parameters of the virtual sensor.
2. Computerimplementiertes Verfahren gemäß Anspruch 1 , wobei das Steuern des Antriebsstrangs des Fahrzeugs umfasst, dass der berechnete Parameter des virtuellen Sensors für eine On-Board-Diagnose des Antriebsstrangs des Fahrzeugs verwendet wird, wobei der berechnete Parameter des virtuellen Sensors mit einem gemessenen Parameter eines entsprechenden Sensors des Antriebsstrangs verglichen wird und wobei der gemessene Parameter des entsprechenden Sensors als gültig eingestuft wird, wenn der Vergleich zwischen dem berechneten Parameter des virtuellen Sensors und dem gemessenen Parameter des entsprechenden Sensors innerhalb einer vordefinierten Schwelle liegt. 2. The computer-implemented method of claim 1, wherein controlling the vehicle's powertrain includes using the calculated virtual sensor parameter for on-board diagnostics of the vehicle's powertrain, wherein the calculated virtual sensor parameter is compared with a measured parameter of a corresponding sensor of the powertrain is compared and wherein the measured parameter of the corresponding sensor is classified as valid if the comparison between the calculated parameter of the virtual sensor and the measured parameter of the corresponding sensor is within a predefined threshold.
3. Computerimplementiertes Verfahren gemäß Anspruch 1 , wobei das Steuern des Antriebsstrangs des Fahrzeugs umfasst, dass der berechnete 23 3. The computer-implemented method of claim 1, wherein controlling the powertrain of the vehicle includes that the calculated 23
Parameter des virtuellen Sensors als Eingabeparameter für eine Steuerfunktion verwendet wird, die zum Steuern des Antriebsstrangs des Fahrzeugs eingesetzt wird. Virtual sensor parameters are used as input parameters for a control function used to control the vehicle's powertrain.
4. Computerimplementiertes Verfahren gemäß einem der vorhergehenden Ansprüche, wobei das neuronale Faltungsnetz ein hybrides neuronales Faltungsnetz ist, d. h. ein neuronales Faltungsnetz mit mindestens einer zusätzlichen Rückkopplungsschleife, die die Ausgabe auch als Eingabe verwendet. 4. A computer-implemented method according to any one of the preceding claims, wherein the convolutional neural network is a hybrid convolutional neural network, i. H. a convolutional neural network with at least one additional feedback loop that also uses the output as input.
5. Computerimplementiertes Verfahren gemäß Anspruch 4, wobei das hybride neuronale Faltungsnetz eine Eingabeschicht, mindestens zwei eindimensionale Faltungsschichten, eine Maximal-Pooling-Schicht, eine Flatten- Schicht und eine Ausgabeschicht umfasst. 5. The computer-implemented method of claim 4, wherein the hybrid convolutional neural network comprises an input layer, at least two one-dimensional convolutional layers, a maximum pooling layer, a flattening layer, and an output layer.
6. Computerimplementiertes Verfahren gemäß einem der vorhergehenden Ansprüche, wobei der Parameter des Antriebsstrangs, der mithilfe des neuronalen Faltungsnetzes berechnet wird, ein Temperaturparameter des Antriebsstrangs ist. 6. The computer-implemented method of claim 1, wherein the powertrain parameter calculated using the convolutional neural network is a powertrain temperature parameter.
7. Computerimplementiertes Verfahren gemäß Anspruch 6, wobei die gemessenen Parameter des Antriebsstrangs und/oder die ermittelten Parameter des Antriebsstrangs, die als Eingabeparameter für das neuronale Faltungsnetz verwendet werden, eine Fahrzeuggeschwindigkeit, ein Ansaugluftmassenstrom, ein boolescher Wert für die Kraftstoffabschaltung, eine Motorstillstandszeit, eine Motorlaufzeit, ein Pedalwert, ein boolescher Wert zur Anzeige, dass der Motor läuft, und/oder ein PWM-Signal des Kühlmittelgebläses sind. 7. The computer-implemented method according to claim 6, wherein the measured powertrain parameters and/or the determined powertrain parameters used as input parameters for the convolutional neural network are a vehicle speed, an intake air mass flow rate, a Boolean value for the fuel cut-off, an engine idle time, a engine run time, a pedal value, a Boolean value indicating that the engine is running, and/or a coolant fan PWM signal.
8. Computerimplementiertes Verfahren gemäß Anspruch 6 oder 7, wobei das neuronale Faltungsnetz mit einer gemessenen Umgebungstemperatur initialisiert wird. 24 8. A computer-implemented method according to claim 6 or 7, wherein the convolutional neural network is initialized with a measured ambient temperature. 24
9. Computerimplementiertes Verfahren gemäß einem der Ansprüche 1 bis 5, wobei der Parameter des Antriebsstrangs, der mithilfe des neuronalen Faltungsnetzes berechnet wird, eine Kühlmitteltemperatur an einem Kühlmittelflusseingang eines Riemenstartergenerators des Antriebsstrangs ist. 9. The computer-implemented method of claim 1, wherein the powertrain parameter calculated using the convolutional neural network is a coolant temperature at a coolant flow input of a belt starter generator of the powertrain.
10. Computerimplementiertes Verfahren gemäß Anspruch 9, wobei die gemessenen Parameter des Antriebsstrangs und/oder die ermittelten Parameter des Antriebsstrangs, die als Eingabeparameter verwendet werden, ein Riemenstartergeneratorstrom, eine Fahrzeuggeschwindigkeit, ein Ansaugluftmassenstrom, ein boolescher Wert einer Kraftstoffabschaltung, eine Umgebungstemperatur, eine Motordrehzahl, ein boolescher Wert für die Kühlerlüfteraktivierung, eine Motorkühlmitteltemperatur, eine Ansauglufttemperatur vor dem Ladeluftkühler, eine Ansauglufttemperatur nach dem Ladeluftkühler, eine Ansauglufttemperatur am Krümmer, ein Pumpenaktivierungssignal und/oder ein Bypassventilaktivierungssignal sind. 10. The computer-implemented method of claim 9, wherein the measured powertrain parameters and/or the determined powertrain parameters used as input parameters include a belt starter generator current, a vehicle speed, an intake air mass flow, a boolean value of a fuel cut, an ambient temperature, an engine speed, a boolean value for radiator fan activation, an engine coolant temperature, an intake air temperature before the charge air cooler, an intake air temperature after the charge air cooler, an intake air temperature at the manifold, a pump activation signal, and/or a bypass valve activation signal.
11. Computerimplementiertes Verfahren gemäß einem der vorhergehenden Ansprüche, wobei eine Aktivierungsfunktion des neuronalen Faltungsnetzes eine rektifizierte lineare Einheitsfunktion (ReLu), die bei negativen Eingaben 0 liefert und bei positiven Eingaben die Eingabe als Ausgabe übergibt, oder eine hyperbolische Tangens(tanh)-Funktion ist, die der Gleichung
Figure imgf000026_0001
folgt, wobei s(z) die Ausgabe ist und wobei z eine beliebige Zahl ist, die einen beliebigen Parameter repräsentiert.
11. Computer-implemented method according to any one of the preceding claims, wherein an activation function of the neural convolutional network is a rectified linear unit function (ReLu) which returns 0 for negative inputs and passes the input as an output for positive inputs, or a hyperbolic tangent (tanh) function , which the equation
Figure imgf000026_0001
follows, where s(z) is the output and where z is any number representing any parameter.
12. Steuervorrichtung, umfassend eine Steuereinheit, die zur Ausführung des computerimplementierten Verfahrens gemäß einem der Ansprüche 1 bis 11 ausgebildet ist. 12. Control device, comprising a control unit, which is designed to execute the computer-implemented method according to one of claims 1 to 11.
PCT/EP2022/060026 2021-05-10 2022-04-14 Computer-implemented method and control device for controlling a drive train of a vehicle by means of a convolutional neural network WO2022238082A1 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP21173046 2021-05-10
EP21173046.0 2021-05-10
DE102021206638.0A DE102021206638B4 (en) 2021-05-10 2021-06-25 Computer-implemented method and control apparatus for controlling a powertrain of a vehicle using a convolutional neural network.
DE102021206638.0 2021-06-25

Publications (1)

Publication Number Publication Date
WO2022238082A1 true WO2022238082A1 (en) 2022-11-17

Family

ID=81648225

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2022/060026 WO2022238082A1 (en) 2021-05-10 2022-04-14 Computer-implemented method and control device for controlling a drive train of a vehicle by means of a convolutional neural network

Country Status (1)

Country Link
WO (1) WO2022238082A1 (en)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19902923A1 (en) * 1999-01-26 2000-08-03 Daimler Chrysler Ag Internal combustion engine cooling system functional monitoring involves deriving anticipated temp. from neural network trained with input parameters representing engine states
US6236908B1 (en) * 1997-05-07 2001-05-22 Ford Global Technologies, Inc. Virtual vehicle sensors based on neural networks trained using data generated by simulation models
US20040230368A1 (en) * 2003-05-14 2004-11-18 Kropinski Michael A. Method and apparatus to diagnose intake airflow
EP2944786A1 (en) * 2014-05-17 2015-11-18 MAN Truck & Bus AG Control or regulation method for a motor vehicle
DE102020101721A1 (en) * 2019-03-19 2020-09-24 Toyota Jidosha Kabushiki Kaisha ANOMALY DETECTION SYSTEM FOR ENGINE COOLING WATER CIRCULATION SYSTEM
DE102019209644A1 (en) * 2019-07-02 2021-01-07 Robert Bosch Gmbh Method for training a neural network
US20210089901A1 (en) * 2019-09-20 2021-03-25 Robert Bosch Gmbh Method and apparatus for processing sensor data using a convolutional neural network
WO2021079179A1 (en) * 2019-10-25 2021-04-29 Volvo Truck Corporation System and method for a virtual turbocharger speed sensor using neural networks

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6236908B1 (en) * 1997-05-07 2001-05-22 Ford Global Technologies, Inc. Virtual vehicle sensors based on neural networks trained using data generated by simulation models
DE19902923A1 (en) * 1999-01-26 2000-08-03 Daimler Chrysler Ag Internal combustion engine cooling system functional monitoring involves deriving anticipated temp. from neural network trained with input parameters representing engine states
US20040230368A1 (en) * 2003-05-14 2004-11-18 Kropinski Michael A. Method and apparatus to diagnose intake airflow
EP2944786A1 (en) * 2014-05-17 2015-11-18 MAN Truck & Bus AG Control or regulation method for a motor vehicle
DE102020101721A1 (en) * 2019-03-19 2020-09-24 Toyota Jidosha Kabushiki Kaisha ANOMALY DETECTION SYSTEM FOR ENGINE COOLING WATER CIRCULATION SYSTEM
DE102019209644A1 (en) * 2019-07-02 2021-01-07 Robert Bosch Gmbh Method for training a neural network
US20210089901A1 (en) * 2019-09-20 2021-03-25 Robert Bosch Gmbh Method and apparatus for processing sensor data using a convolutional neural network
WO2021079179A1 (en) * 2019-10-25 2021-04-29 Volvo Truck Corporation System and method for a virtual turbocharger speed sensor using neural networks

Similar Documents

Publication Publication Date Title
DE102018001727B4 (en) Method for model-based control and regulation of an internal combustion engine
DE102019102835B4 (en) Internal combustion engine control device
DE112022000106T5 (en) Transmission fault diagnosis and signal acquisition method, apparatus and electronic device
DE112007001865T5 (en) Method and device for estimating the exhaust gas pressure of an internal combustion engine
AT510912A2 (en) Method for optimizing the emission of internal combustion engines
DE102011081346A1 (en) Method of creating a function for a controller
DE102007039691A1 (en) Modeling method and control unit for an internal combustion engine
DE102009024544A1 (en) Method for automated data input for controller of vehicle for improving moment prediction of vehicle drive, involves using data input to build characteristic for parameters concerning ignition angle
WO2014015974A2 (en) Improved performance of experiments
DE102019201016A1 (en) CONTROL AND CONTROL PROCEDURES FOR INTERNAL COMBUSTION ENGINE
DE102020110864A1 (en) Control device for high pressure fuel pump for fuel injection
DE102021206638B4 (en) Computer-implemented method and control apparatus for controlling a powertrain of a vehicle using a convolutional neural network.
DE102020109988A1 (en) Anomaly detection system of an exhaust gas recirculation system
DE102015225250A1 (en) Method and device for determining a gas mass flow in an internal combustion engine
EP2088486B1 (en) Method for measuring a non-linear dynamic real system using design of experiment
EP3499011B1 (en) Method and control device for determining a target inlet manifold pressure of a combustion engine
DE102009021781A1 (en) Engine-operating method for calculating an engine-operating map for a vehicle's control device creates a map with a specified number of nodes while measuring data points to calculate a map value
DE102019128655B4 (en) Method for providing a computer-aided control for a technical system
WO2021213998A1 (en) Method for operating a controller assembly, and corresponding controller assembly
WO2022238082A1 (en) Computer-implemented method and control device for controlling a drive train of a vehicle by means of a convolutional neural network
EP1273782A2 (en) Method for determining characteristic mapping data for controlling the characteristic map of an internal combustion engine, and a method for controlling an internal combustion engine
EP1878900A2 (en) Method for diagnosing erroneous operating states of an internal combustion engine
EP2513457B1 (en) Method for exhaust gas recirculation
DE102007008514A1 (en) Method and device for neuronal control and / or regulation
WO2020118330A1 (en) Method for calibrating a technical system

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22723061

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 22723061

Country of ref document: EP

Kind code of ref document: A1