JP2023170227A - Electronic control device - Google Patents
Electronic control device Download PDFInfo
- Publication number
- JP2023170227A JP2023170227A JP2022081801A JP2022081801A JP2023170227A JP 2023170227 A JP2023170227 A JP 2023170227A JP 2022081801 A JP2022081801 A JP 2022081801A JP 2022081801 A JP2022081801 A JP 2022081801A JP 2023170227 A JP2023170227 A JP 2023170227A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- feature quantity
- value
- candidate
- candidates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006870 function Effects 0.000 description 28
- 238000012360 testing method Methods 0.000 description 25
- 238000000034 method Methods 0.000 description 23
- 238000005457 optimization Methods 0.000 description 18
- 238000012549 training Methods 0.000 description 15
- 239000011159 matrix material Substances 0.000 description 13
- 239000013598 vector Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 5
- 239000001301 oxygen Substances 0.000 description 5
- 229910052760 oxygen Inorganic materials 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
Images
Landscapes
- Feedback Control In General (AREA)
Abstract
Description
本開示は、電子制御装置に関する。 The present disclosure relates to an electronic control device.
従来、特許文献1に記載されているように、教師ラベルとセンサ情報とに加えて、教師ラベルの判定に影響する要因を表す要因情報を用いて判定モデルの学習を行う学習方法がある。
Conventionally, as described in
ところで、機械学習のモデルの予測精度を向上するためには、既存の特徴量を用いて新たな特徴量を生成することが考えられる。しかしながら、モデルは、新たな特徴量を既存の特徴量に加えたとしても、必ずしも予測精度が向上するとは限らない。つまり、モデルは、目的変数への予測に寄与しない特徴量を加えることで、予測精度が低下する可能性がある。 By the way, in order to improve the prediction accuracy of a machine learning model, it is conceivable to generate new feature quantities using existing feature quantities. However, even if a new feature is added to an existing feature, the prediction accuracy of the model does not necessarily improve. In other words, the prediction accuracy of the model may decrease by adding features that do not contribute to the prediction of the target variable.
既存の特徴量を用いた新たな特徴量の生成は、人の経験などによる試行錯誤で行われていた。しかしながら、今後は、電子制御装置の制御などに、機械学習を用いたデータ活用を行う可能性がある。この場合、扱うデータの種類と数が膨大なものになることが予測される。よって、モデル生成方法では、予測精度を向上できる新たな特徴量を、人の経験などによって生成することが困難である。 Generating new features using existing features has been done through trial and error based on human experience. However, in the future, there is a possibility that data using machine learning will be used to control electronic control devices. In this case, it is predicted that the types and amount of data to be handled will be enormous. Therefore, with the model generation method, it is difficult to generate new feature quantities that can improve prediction accuracy based on human experience.
開示される一つの目的は、最適な特徴量を自動的に選択することができる電子装置を提供することである。 One disclosed objective is to provide an electronic device that can automatically select optimal features.
ここに開示された電子制御装置は、
複数の特徴量と各特徴量における複数の出力データを含む特徴量集合と、各出力データに対応する目的変数とによって機械学習された基礎モデルを用いて目的変数の予測を行う電子制御装置であって、
複数の特徴量の少なくとも一部である複数の特徴量候補と各特徴量候補における出力データとを含む候補特徴量集合を生成し、候補特徴量集合における特徴量候補の変更と、特徴量候補を変更した候補特徴量集合を用いた予測と、を繰り返し行い、予測の精度向上にかかわっている特徴量候補を選択する選択部(S10~S12)と、
目的変数と、選択部で選択された特徴量候補と各特徴量候補における複数の出力データを含む更新特徴量集合とをもとに、目的変数の予測に用いる基礎モデルを改良した改良モデルを生成するモデル生成部(S13)と、を備えていることを特徴とする。
The electronic control device disclosed herein is
It is an electronic control device that predicts an objective variable using a basic model that is machine-learned using a feature set that includes multiple feature quantities and multiple output data for each feature quantity, and an objective variable that corresponds to each output data. hand,
A candidate feature set including a plurality of feature candidates that are at least a part of the plurality of feature quantities and output data for each feature candidate is generated, and the feature quantity candidates in the candidate feature set are changed and the feature quantity candidates are changed. a selection unit (S10 to S12) that repeatedly performs prediction using the changed candidate feature set and selects feature candidates that are involved in improving prediction accuracy;
Generates an improved model that improves the basic model used to predict the objective variable based on the objective variable, the feature candidates selected by the selection unit, and an updated feature set that includes multiple output data for each feature candidate. The present invention is characterized by comprising a model generation unit (S13) that generates a model.
ここに開示された電子制御装置によると、選択した特徴量候補を含む更新特徴量集合をもとに、目的変数の予測に用いる基礎モデルを改良した改良モデルを生成する。また、電子制御装置は、特徴量候補を選択する際に、候補特徴量集合における特徴量候補の変更と、特徴量候補を変更した候補特徴量集合を用いた予測と、を繰り返し行い、予測の精度向上にかかわっている特徴量候補を選択する。このため、電子制御装置は、予測の精度向上にかかわっている最適な特徴量を自動的に選択することができる。 According to the electronic control device disclosed herein, an improved model that is an improved basic model used for predicting a target variable is generated based on an updated feature set including selected feature candidates. Furthermore, when selecting feature candidates, the electronic control unit repeatedly changes the feature candidates in the candidate feature set and performs prediction using the candidate feature set with the changed feature candidates. Select feature candidates that are involved in improving accuracy. Therefore, the electronic control device can automatically select the optimal feature amount that is involved in improving prediction accuracy.
この明細書において開示された複数の態様は、それぞれの目的を達成するために、互いに異なる技術的手段を採用する。請求の範囲およびこの項に記載した括弧内の符号は、後述する実施形態の部分との対応関係を例示的に示すものであって、技術的範囲を限定することを意図するものではない。この明細書に開示される目的、特徴、および効果は、後続の詳細な説明、および添付の図面を参照することによってより明確になる。 The multiple embodiments disclosed in this specification employ different technical means to achieve their respective objectives. The claims and the reference numerals in parentheses described in this section exemplarily indicate correspondence with parts of the embodiment described later, and are not intended to limit the technical scope. The objects, features, and advantages disclosed in this specification will become more apparent by reference to the subsequent detailed description and accompanying drawings.
以下において、図1~図4を参照しながら、本開示を実施するための形態を説明する。 Hereinafter, embodiments for implementing the present disclosure will be described with reference to FIGS. 1 to 4.
本実施形態では、一例として、電子制御装置を、車両に搭載された車載システム100に適用する。車載システム100は、三つのECU11~13と、三つのセンサ21~23を備えている。しかしながら、本開示は、ECU11~13の機能を一つのECUが備えていてもよい。第2ECU12、第3ECU13は、電子制御装置に相当する。また、本開示は、四つ以上のセンサを備えていてもよい。ECUは、Electronic Control Unitの略称である。
In this embodiment, as an example, an electronic control device is applied to an in-
各ECU11~13は、プロセッサと、メモリ装置と、周辺I/Oなどを備えている。プロセッサは、CPUなどの演算処理装置である。メモリ装置は、揮発性メモリと不揮発性メモリを備えている。周辺I/Oは、通信インタフェースやADコンバータなどを備えている。プロセッサは、メモリ装置に記憶されているプログラムを実行する。プロセッサは、プログラムを実行することでして演算処理を行う。このとき、プロセッサは、メモリ装置に記憶されたデータや周辺I/Oから得られたデータなどを用いつつ演算処理を行う。そして、プロセッサは、演算結果を周辺I/Oから出力する。 Each ECU 11 to 13 includes a processor, a memory device, peripheral I/O, and the like. A processor is an arithmetic processing device such as a CPU. Memory devices include volatile memory and nonvolatile memory. The peripheral I/O includes a communication interface, an AD converter, and the like. A processor executes a program stored in a memory device. A processor performs arithmetic processing by executing a program. At this time, the processor performs arithmetic processing using data stored in the memory device, data obtained from peripheral I/O, and the like. The processor then outputs the calculation result from the peripheral I/O.
第1ECU11は、第1センサ21、第2センサ22、第3センサ23が電気的に接続されている。第1ECU11は、各センサ21~23からセンサデータ(センサ値)が入力される。第1ECU11は、車両の各センサ21~23から出力されたセンサデータを統括する。
A
第1センサ21は、エンジン回転数に応じた電気信号であるセンサデータを出力する回転数センサである。第2センサ22は、エンジン温度に応じた電気信号であるセンサデータを出力する温度センサである。第3センサ23は、排ガス中の酸素濃度に応じた電気信号であるセンサデータを出力する酸素濃度センサである。
The
しかしながら、本開示は、これに限定されず、他の物理量に応じた電気信号を出力するセンサであっても採用できる。なお、エンジン回転数、エンジン温度、酸素濃度は、特徴量(ラベル)に相当する。各センサ21~23が出力するセンサデータは、出力データに相当する。
However, the present disclosure is not limited thereto, and sensors that output electrical signals according to other physical quantities can also be employed. Note that the engine speed, engine temperature, and oxygen concentration correspond to feature amounts (labels). The sensor data output by each
第2ECU12は、プロセッサがモデルを構築する。このモデルは、教師あり学習によって得られるものである。詳述すると、モデルは、複数の特徴量と各特徴量における複数の出力データを含む特徴量集合と、各出力データに対応する目的変数とによって機械学習されたものである。また、第2ECU12は、第3ECU13が予測に用いるモデルを構築するともいえる。さらに、第2ECU12は、第3ECU13が予測に用いるモデルである基礎モデルを改良して、改良モデルを生成する。特徴量集合と目的変数とは、例えば第2ECU12のメモリ装置に記憶されている。
In the second ECU 12, a processor constructs a model. This model is obtained through supervised learning. To be more specific, the model is machine learned using a feature set including a plurality of feature quantities and a plurality of output data for each feature quantity, and an objective variable corresponding to each output data. It can also be said that the
第2ECU12のプロセッサは、図2、図3、図4に示すフローチャートを実行することで、改良モデルを生成する。また、第2ECU12のプロセッサは、図6に示す数式1、数式2、数式3、数式4を計算する。第2ECU12の処理動作に関しては、後ほど詳しく説明する。
The processor of the
第3ECU13は、モデルがメモリ装置に記憶されている。第3ECU13は、プロセッサが入力されたセンサデータからモデルを用いて目的変数を予測(出力)する。この予測は、識別もしくは回帰である。本実施形態では、エンジン回転数、エンジン温度、酸素濃度のセンサデータから、エンジンの故障予測を行うモデルを採用する。
The model of the third ECU 13 is stored in the memory device. The
なお、本実施形態では、三つのECU11~13に機能を分散させた例を採用している。しかしながら、本開示は、各ECU11~13の機能を備えた一つのECUであっても採用できる。
Note that this embodiment employs an example in which functions are distributed among three
ここで、図2~図6を用いて、第2ECU12(プロセッサ)による処理動作に関して説明する。まず、以下で用いる記号に関して説明する。Xは、既存の特徴量集合であり、n行m列の行列である。nはデータ数、mは特徴量数である。つまり、Xの列要素は、特徴量である。一方、Xの行要素は、各特徴量のデータ(出力データ)である。既存の特徴量集合Xの特徴量は、既存の特徴量ともいえる。Yは、既知の目的変数集合であり、n行1列の列ベクトルである。1は目的変数の数である。nは、目的変数の各データであり、特徴量の各出力データと同数である。 Here, processing operations by the second ECU 12 (processor) will be explained using FIGS. 2 to 6. First, the symbols used below will be explained. X is an existing feature quantity set and is a matrix of n rows and m columns. n is the number of data, and m is the number of features. In other words, the column elements of X are feature amounts. On the other hand, the row elements of X are data (output data) of each feature amount. The features of the existing feature set X can also be said to be existing features. Y is a known target variable set and is a column vector with n rows and 1 column. 1 is the number of objective variables. n is each data of the objective variable, and is the same number as each output data of the feature amount.
xtrain,xtestは、既存の特徴量集合Xを訓練用集合とテスト用集合に分割したものである。訓練用集合xtrainは、t行m列の行列である。tは訓練データのデータ数、mは特徴量の数である。テスト用集合xtestは、(n-t)行m列の行列である。 x train and x test are obtained by dividing the existing feature set X into a training set and a test set. The training set x train is a matrix with t rows and m columns. t is the number of training data, and m is the number of features. The test set x test is a matrix with (nt) rows and m columns.
xallは、候補特徴量集合である。候補特徴量集合xallは、既存の特徴量集合xtrainの列要素を組み合わせることで得られる新規特徴量集合を、既存の特徴量集合xtrainに追加した特徴量集合である。ここでは、候補特徴量集合xallは、t行(m+l)列の行列であり、l(エル)は、既存の特徴量を用いて作成した新規特徴量の数である。ここでは、一例として、既存の特徴量集合として、訓練用集合xtrainを採用している。 x all is a candidate feature set. The candidate feature set x all is a feature set in which a new feature set obtained by combining column elements of the existing feature set x train is added to the existing feature set x train . Here, the candidate feature set x all is a matrix with t rows and (m+l) columns, and l is the number of new features created using existing features. Here, as an example, a training set x train is used as an existing feature set.
xotrは、図5の1段目に記載の記号で表現される。xotrは、候補特徴量集合xallの行列の中から目的変数の予測の精度向上に関わっている特徴量の列ベクトルのみを抽出した特徴量集合である。xotrは、訓練用集合の抽出特徴量集合である。xotrは、t行q列の行列である。qは、目的変数の予測の精度向上に関わっている特徴量の数(1<q<(m+l))である。 xotr is expressed by the symbol shown in the first row of FIG. xotr is a feature set in which only column vectors of features that are involved in improving the accuracy of prediction of the target variable are extracted from the matrix of the candidate feature set x all . xotr is an extracted feature set of the training set. xotr is a matrix with t rows and q columns. q is the number of feature amounts (1<q<(m+l)) that are involved in improving the accuracy of prediction of the objective variable.
xoteは、図5の2段目に記載の記号で表現される。xoteは、テスト用集合xtestを用いて候補特徴量集合xallのように、新規特徴量を追加した特徴量集合を作成し、その特徴量からxotrと同じ特徴量の列要素を抽出した特徴量集合である。xoteは、テスト用集合の抽出特徴量集合である。 xote is expressed by the symbol shown in the second row of FIG. xote uses the test set x test to create a feature set to which new features are added, such as the candidate feature set It is a quantity set. xote is an extracted feature set of the test set.
ytrain,ytestは、既存の目的変数集合Yを訓練用集合とテスト用集合に分割したものである。ytrainは、t行1列のベクトルである。ytestは、(n-t)行1列のベクトルである。 y train and y test are obtained by dividing the existing target variable set Y into a training set and a test set. y train is a t-by-1 vector. y test is a (nt)-by-1 vector.
方策パラメータθは、ステップS11に示すモデルフリーの最適化手法への入力ベクトルである。第2ECU12は、方策パラメータθをもとに、コスト関数(S23)で用いられる途中特徴量集合xtempに採用する列要素を決定する。途中特徴量集合xtempは、モデルフリーの最適化手法において、ロールアウトの途中の方策パラメータθの値に対するコスト値riの計算に使用される特徴量集合である。
The policy parameter θ is an input vector to the model-free optimization method shown in step S11. Based on the policy parameter θ, the
最適化パラメータθoptは、コスト関数(コスト値ri)を最小化するように最適化された方策パラメータθである。言い換えると、θoptは、候補特徴量集合xallの中からどの列要素を抽出するかをつかさどるパラメータである。θoptは、1行(m+l)列の行ベクトルである。第2ECU12は、θoptとxallをもとにxotrを求める。
The optimization parameter θ opt is a policy parameter θ optimized to minimize the cost function (cost value r i ). In other words, θ opt is a parameter that controls which column element is extracted from the candidate feature set x all . θ opt is a row vector with 1 row and (m+l) columns. The
なお、図5の3段面に示すように、数式2などにおけるθiの上付き(1)~(m+l)は、θi(k)と記載する。図5の4段面に示すように、数式3におけるΘiの上付き(1)~(m+l)は、Θi(k)と記載する。kは、1以上でm+lまでの自然数の連続値である。iは、iは、1以上でロールアウトするまでの自然数の連続値である。ロールアウトする値は、例えば、コスト値riが収束したとみなせる値など、任意に決めることができる。さらに、図5の5段面に示すように、数式4におけるθoptの上付き(j)は、θo(j)と記載する。jは、1≦j<m+lである。
Note that, as shown in the three-tiered plane of FIG. 5, the superscripts (1) to (m+l) of θ i in
図2のフローチャートは、第2ECU12による特徴量を自動的に選択するための処理動作ともいえる。また、図2のフローチャートは、第2ECU12による改良モデルの生成方法ともいえる。さらに、図2のフローチャートは、改良モデルを生成するためのアルゴリズムの概要ともいえる。第2ECU12は、ユーザなどからの指示に応じて図2のフローチャートを開始する。
The flowchart of FIG. 2 can also be said to be a processing operation for automatically selecting the feature quantity by the
なお、以下においては、基礎モデルおよび改良モデルとして、からエンジンの故障予測を行う予測モデルを構築する例を採用する。まず、各センサ21~23の出力データと、各出力データが出力された際のエンジンの状態(正常、異常)について、それぞれデータを10000個用意する。この場合、出力データ数nは10000である。特徴量は、エンジン回転数、エンジン温度、酸素濃度である。特徴量数mは3である。正常を示すデータと異常を示すデータは、目的変数のデータである。
In the following, an example of constructing a predictive model for predicting engine failure will be adopted as the basic model and the improved model. First, 10,000 pieces of data are prepared for the output data of each
よって、既存の特徴量集合Xは、センサ1~3のセンサ値を列要素に持つ10000行3列の行列となる。既知の目的変数集合Yは、エンジンの状態を列要素に持つ10000行1列の列ベクトルとなる。
Therefore, the existing feature quantity set X is a 10,000-by-3 matrix having the sensor values of
次に、第2ECU12は、特徴量集合Xを訓練用集合xtrainとテスト用集合xtestに9対1の割合で分割する。同様に、第2ECU12は、目的変数集合Yを訓電用集合ytrain,とテスト用集合ytestに9対1の割合で分割する。訓練用集合xtrainは、9000行3列の行列となる。訓電用集合ytrainは、9000行1列の行列となる。テスト用集合xtestは、1000行3列の行列となる。テスト用集合ytestは、1000行1列の行列となる。なお、ここで採用している訓練用集合のテスト用集合の割合(9対1)は、一例に過ぎない。本開示は、その他の割合であっても採用できる。
Next, the
次に、第2ECU12は、訓練用集合xtrainから候補特徴量集合xallを生成する(選択部)。本実施形態では、各センサ21~23における出力データをかけ合わせて新規特徴量を生成する。つまり、新規特徴量は、第1センサ21、第2センサ22、第3センサ23の列要素を組み合わせたものである。ここでの新規特徴量は、センサb×センサc(1≦b≦3,1≦c≦3)となる。新規特徴量の出力データは、各センサ21~23の組み合わせに対応して、出力データをかけ合わせたデータとなる。
Next, the
そして、第2ECU12は、訓練用集合xtrainの列要素に加えることで、候補特徴量集合xallを生成する。この場合、候補特徴量集合xallは、9000行12列の行列となる。このように、第2ECU12は、候補特徴量集合xallの列要素として、複数の特徴量と、複数の特徴量を組み合わせて得られる新規特徴量とを含む複数の特徴量候補を用いる。
Then, the
なお、候補特徴量集合xallを生成する方法は、これに限定されない。さらに、候補特徴量集合xallは、既存の特徴量集合Xにおける少なくとも一部である複数の特徴量候補と、各特徴量候補における出力データとを含む候補特徴量集合であれば採用できる。よって、候補特徴量集合xallは、既存の特徴量集合Xであっても採用できる。また、候補特徴量集合xallは、既存の特徴量におけるセンサデータの平均値や分散などを用いてもよい。 Note that the method for generating the candidate feature set x all is not limited to this. Further, the candidate feature set x all can be adopted as long as it includes a plurality of feature candidates that are at least part of the existing feature set X and output data for each feature candidate. Therefore, even an existing feature set X can be adopted as the candidate feature set x all . Furthermore, the candidate feature set x all may use the average value, variance, or the like of sensor data in existing feature quantities.
そして、第2ECU12は、ステップS10でθ=θintとする(選択部)。つまり、第2ECU12は、方策パラメータθに初期値θintを代入する。初期値θintは、最初の特徴量選択の際に、既存の特徴量のみを選択するように値が設定される。これは、改良モデルが、既存の特徴量集合Xに基づく基礎モデルよりも予測精度が低下しないようにするためである。例えば、初期値θint=[0.1,0.1,0.1,-0.2,-0.2,…,-0.2]とする。初期値θintは、1行12の行ベクトルである。ここでは、-0.2などの負の値とすることで、最初の特徴量選択の際に、既存の特徴量のみが選択されるようにしている。なお、負の値とする場合は、できるだけ正の値に近い値が好ましい。
Then, the
第2ECU12は、ステップS11でモデルフリーの最適化手法を実行する(選択部)。ステップS11に関しては、図3を用いて説明する。なお、以下におけるθiとΘiは、数式2、数式3の関係を有している。
The
まず、図3のステップS21では、第2ECU12は、入力の初期値θ1=θintを代入する。そして、第2ECU12は、ステップS22で第1ループ処理を行う。第2ECU12は、iの値が1からロールアウトする値までループ処理を行う。つまり、第2ECU12は、図4で定義されたコスト関数を最小化するような方策パラメータθである最適化パラメータθoptを繰り返し計算により求める。言い換えると、第2ECU12は、コスト関数の計算を行うことでコスト値riを求める。第2ECU12は、コスト値riが適切な値に近くなるように繰り返し計算を行うことで、最適化パラメータθoptを求める。また、第2ECU12は、最適化パラメータθoptを求めることで、コスト値riが適切な値に近くなる特徴量候補を選択するともいえる。xotrは、コスト値riが適切な値に近くなる特徴量候補を含んでいる。
First, in step S21 of FIG. 3, the
ここで、ステップS22の第1ループ処理に関して詳しく説明する。第2ECU12は、ステップS23でコスト関数を計算する。ステップS23に関しては、図4を用いて説明する。
Here, the first loop process of step S22 will be explained in detail. The
第2ECU12は、ステップS31で数式1を計算する。第2ECU12は、途中特徴量集合xtempを計算するために、θiを数式1のロジスティックシグモイド関数に代入して計算を行う。言い換えると、第2ECU12は、ステップS32の第2ループ処理で、候補特徴量集合xallから途中特徴量集合xtempを選択するためにステップS31を行っている。後ほどステップS24で説明するが、ステップS31で代入される方策パラメータθiは、コスト値riが小さくなるように計算された値である。方策パラメータθiは、連続値である。
The
なお、ロジスティックシグモイド関数は、予め決められた関数に相当する。ロジスティックシグモイド関数は、Θiの値が0から1に収まる性質をもっている。そして、Θiの値と比較する第1閾値は、0から1の間にある値を採用する。このように、ロジスティックシグモイド関数は、値の範囲が限定されている。このため、途中特徴量集合xtempを選択するための第1閾値の設定を容易にできる。しかしながら、本開示は、予め決められた関数として、ガウス関数であっても採用できる。 Note that the logistic sigmoid function corresponds to a predetermined function. The logistic sigmoid function has the property that the value of Θ i falls within the range of 0 to 1. A value between 0 and 1 is adopted as the first threshold value to be compared with the value of Θ i . Thus, the logistic sigmoid function has a limited range of values. Therefore, it is possible to easily set the first threshold value for selecting the intermediate feature quantity set x temp . However, the present disclosure can also employ a Gaussian function as the predetermined function.
第2ECU12は、ステップS32では、第2ループ処理を行う。第2ECU12は、ステップS33でΘi(k)>0.5(第1閾値)であるか否かを判定する。第2ECU12は、Θi(k)>0.5であると判定するとステップS34へ進み、でΘi(k)>0.5であると判定しないとステップS34をスキップする。第1閾値は、閾値に相当する。
The
第2ECU12は、ステップS34で、候補特徴量集合xallのk列の列要素を途中特徴量集合xtempに追加する。k列の列要素とは、候補特徴量集合xallの特徴量のうち、0.5より大きな値のΘi(k)に対応する特徴量である。
In step S34, the
このように、第2ECU12は、ロジスティックシグモイド関数から得られる値Θi(k)と第1閾値とを比較して、第1閾値より大きな値の値Θi(k)を選択する。よって、第2ECU12は、コスト値riが適切な値に近くなる特徴量候補を選択する際に、ロジスティックシグモイド関数から得られる値Θi(k)と第1閾値との比較によって、連続値を離散値に変換するといえる。
In this way, the
そして、第2ECU12は、Θi(k)に対応する特徴量候補を選択する。また、第2ECU12は、Θi(k)と第1閾値との比較により、候補特徴量集合xallから選択する特徴量の種類を決定し、選択された特徴量の種類のみを抜き出すともいえる。また、第2ECU12は、候補特徴量集合xallにおける特徴量候補を変更するともいえる。また、第2ECU12は、特徴量候補を変更した候補特徴量集合である途中特徴量集合xtempを用いた予測の結果であるコスト値riを算出し、特徴量候補を変更する際に、コスト値riが適切な値に近くなる特徴量候補を選択するといえる。
Then, the
モデルフリーの最適化手法は、本来、連続値の最適化に用いられるものである。しかしながら、本開示は、第2ECU12が第2ループ処理S32を行うことで、モデルフリーの最適化手法を特徴量選択の有無という離散値の最適化に適用可能となる。
Model-free optimization methods are originally used for continuous value optimization. However, in the present disclosure, the
第2ECU12は、ステップS35で、識別手法を用いてコスト値riを計算する。詳述すると、第2ECU12は、訓練用集合ytrain,途中特徴量集合xtempを目的変数とそれに対応する特徴量とし、使用する識別手法を用いてコスト値riを計算する。コスト値riは、損失関数の値に相当する。損失関数の計算は、交差検証を用いる。なお、コスト値riは、回帰や識別などの予測結果の正確さ、精度と言い換えることもできる。本実施形態では、識別手法を用いる例を採用している。しかしながら、本開示は、これに限定されず回帰手法を用いてもよい。
The
第2ECU12は、ステップS36で、コスト値riを戻り値として返す。つまり、第2ECU12は、モデルフリー最適化手法の戻り値とする。よって、コスト値riは、ステップS24で用いられる。
The
ここで、図3の説明に戻る。第2ECU12は、ステップS24で、コスト値riが小さくなるような方策パラメータθi+1を計算する。第2ECU12は、戻り値であるコスト値riと、前回の方策パラメータθiとから、方策パラメータθi+1を計算する。
Here, we return to the explanation of FIG. 3. In step S24, the
第2ECU12は、ステップS25で、最適化された最適化パラメータθoptを戻り値として返す。最適化パラメータθoptは、ステップS12で用いられる。
The
ここで、図2の説明に戻る。第2ECU12は、ステップS12で最適化パラメータθoptと候補特徴量集合xallをもとに、xotrを計算する(選択部)。このとき、第2ECU12は、候補特徴量集合xallのj列の特徴量を抽出するかどうかを判断するために数式4を計算する。そして、第2ECU12は、数式4の値と、第2閾値(0.5)とを比較する。
Here, we return to the explanation of FIG. 2. The
第2ECU12は、数式4の値が0.5よりも大きい場合、その時のjの値が示す、候補特徴量集合xallにおける列要素を抽出する。一方、第2ECU12は、数式4の値が0.5よりも大きくない場合、その時のjの値が示す、候補特徴量集合xallにおける列要素を抽出しない。
If the value of
抽出した列要素は、目的変数の予測精度の向上にかかわっている特徴量とみなす。一方、抽出していない列要素は、目的変数の予測精度の向上にかかわっていない特徴量とみなす。よって、第2ECU12は、抽出した列要素と、その出力データとの行列をxotrとする。このように、第2ECU12は、数式4の計算と比較を、jの値を1からm+lまで切り替えながら繰り返し行いxotrを求める。ここで抽出された列要素は、選択された特徴量候補に相当する。また、xotrは、更新特徴量集合に相当する。
The extracted column elements are regarded as features involved in improving the prediction accuracy of the target variable. On the other hand, column elements that are not extracted are regarded as features that are not involved in improving the prediction accuracy of the target variable. Therefore, the
以上のように、第2ECU12は、候補特徴量集合xallにおける特徴量候補の変更と、特徴量候補を変更した候補特徴量集合である途中特徴量集合xtempを用いた予測と、を繰り返し行い、予測の精度向上にかかわっている特徴量候補を選択する。そして、第2ECU12は、選択した特徴量候補を含むxotrを求める。
As described above, the
第2ECU12は、ステップS13で、ytrain,xotrで学習を行い、訓練済みモデルを求める(モデル生成部)。つまり、第2ECU12は、ytrain,xotrを目的変数と、それに対応する特徴量として学習を行い、訓練済みモデルを求める。言い換えると、第2ECU12は、ステップS12で算出したxotrと、ytrainにおける目的変数とをもとに、目的変数の予測に用いる基礎モデルを改良した改良モデルを生成する。
In step S13, the
なお、第2ECU12は、最適化パラメータθoptとテストデータxtestをもとに、xoteを求めてもよい。これは、改良モデルを評価するためである。xoteは、xotrと同様の方法で求めることができる。つまり、第2ECU12は、訓練用データxtrainではなく、テスト用データxtestを用いて候補特徴量集合をつくり、ステップS12と同様の処理を行う。そして、第2ECU12は、評価用集合にytest,xoteを用いる。
Note that the
そして、第2ECU12は、ytest,xoteを用いて、改良モデルの評価を行う。つまり、第2ECU12は、新規特徴量を追加した改良モデルが有効かどうかの判断を行う。言い換えると、第2ECU12は、基礎モデルよりも改良モデルの方が予測精度が向上しているか否かを判断する。第2ECU12は、有効と判断した改良モデルを正式に採用してもよい。この場合は、第3ECU13は、改良モデルを用いて、エンジンの故障予測を行う。
Then, the
<効果>
ここに開示された第2ECU12によると、選択した特徴量候補を含む更新特徴量集合xotrをもとに、基礎モデルを改良した改良モデルを生成する。また、第2ECU12は、特徴量候補を選択する際に、途中特徴量集合xtempにおける特徴量候補の変更と、特徴量候補を変更した途中特徴量集合xtempを用いた予測と、を繰り返し行い、予測の精度向上にかかわっている特徴量候補を選択する。そして、第2ECU12は、選択した特徴量候補を含むxotrを求める。このため、第2ECU12は、予測の精度向上にかかわっている最適な特徴量を自動的に選択することができる。
<Effect>
According to the
なお、第2ECU12は、モデルフリー最適化手法を用いて、識別や回帰などの予測に用いる特徴量の選択を自動化する機能を有しているといえる。第2ECU12は、モデルフリーの自作コスト関数を最小化する手法を実行するものである。この自作コスト関数は、選択する特徴量の種類を入力し、選択した特徴量を用いて識別や回帰などの予測を行った際のコスト関数の値を、自作コスト関数のリターン値として、特徴量を自動で選択するともいえる。
Note that the
以上、本開示の好ましい実施形態について説明した。しかしながら、本開示は、上記実施形態に何ら制限されることはなく、本開示の趣旨を逸脱しない範囲において、種々の変形が可能である。 The preferred embodiments of the present disclosure have been described above. However, the present disclosure is not limited to the above-described embodiments, and various modifications can be made without departing from the spirit of the present disclosure.
この明細書には、以下に列挙する複数の技術的思想と、それらの複数の組み合わせが開示されている。 This specification discloses a plurality of technical ideas listed below and a plurality of combinations thereof.
(技術的思想1)
複数の特徴量と各特徴量における複数の出力データを含む特徴量集合と、各出力データに対応する目的変数とによって機械学習された基礎モデルを用いて目的変数の予測を行う電子制御装置であって、
複数の特徴量の少なくとも一部である複数の特徴量候補と各特徴量候補における出力データとを含む候補特徴量集合を生成し、候補特徴量集合における特徴量候補の変更と、特徴量候補を変更した候補特徴量集合を用いた予測と、を繰り返し行い、予測の精度向上にかかわっている特徴量候補を選択する選択部(S10~S12)と、
目的変数と、選択部で選択された特徴量候補と各特徴量候補における複数の出力データを含む更新特徴量集合とをもとに、目的変数の予測に用いる基礎モデルを改良した改良モデルを生成するモデル生成部(S13)と、を備えている電子制御装置。
(Technical thought 1)
It is an electronic control device that predicts an objective variable using a basic model that is machine-learned using a feature set that includes multiple feature quantities and multiple output data for each feature quantity, and an objective variable that corresponds to each output data. hand,
A candidate feature set including a plurality of feature candidates that are at least a part of the plurality of feature quantities and output data for each feature candidate is generated, and the feature quantity candidates in the candidate feature set are changed and the feature quantity candidates are changed. a selection unit (S10 to S12) that repeatedly performs prediction using the changed candidate feature set and selects feature candidates that are involved in improving prediction accuracy;
Generates an improved model that improves the basic model used to predict the objective variable based on the objective variable, the feature candidates selected by the selection unit, and an updated feature set that includes multiple output data for each feature candidate. An electronic control device comprising: a model generation unit (S13) for generating a model;
(技術的思想2)
選択部は、特徴量候補を変更した候補特徴量集合を用いた予測の結果であるコスト値を算出し、特徴量候補を変更する際に、コスト値が適切な値に近くなる特徴量候補を選択する技術的思想1に記載の電子制御装置。
(Technical thought 2)
The selection unit calculates a cost value that is a result of prediction using a candidate feature set with changed feature candidates, and selects a feature candidate whose cost value is close to an appropriate value when changing the feature candidates. The electronic control device according to Selected
(技術的思想3)
選択部は、コスト値が適切な値に近くなる特徴量候補を選択する際に、連続値を予め決められた関数に代入して得られる値と閾値との比較によって、連続値を離散値に変換して、離散値に対応する特徴量候補を選択する技術的思想2に記載の電子制御装置。
(Technical thought 3)
When selecting feature quantity candidates whose cost values are close to appropriate values, the selection unit converts continuous values into discrete values by comparing the value obtained by substituting the continuous value into a predetermined function with a threshold value. The electronic control device according to
(技術的思想4)
選択部は、コスト値が適切な値に近くなる特徴量候補を選択する際に、連続値を予め決められた関数に代入して得られる値と閾値との比較によって、連続値を離散値に変換して、離散値に対応する特徴量候補を選択するものであり、
関数は、値が0から1に収まる性質を有しており、
閾値は、0から1の間にある技術的思想2に記載の電子制御装置。
(Technical thought 4)
When selecting feature quantity candidates whose cost values are close to appropriate values, the selection unit converts continuous values into discrete values by comparing the value obtained by substituting the continuous value into a predetermined function with a threshold value. It converts and selects feature quantity candidates corresponding to discrete values.
A function has the property that its value falls between 0 and 1,
The electronic control device according to
(技術的思想5)
選択部では、複数の特徴量と、複数の特徴量を組み合わせて得られる新規特徴量とを含む複数の特徴量候補を用いる技術的思想1~4のいずれか1項に記載の電子制御装置。
(Technical Thought 5)
The electronic control device according to any one of
本開示は、実施形態に準拠して記述されたが、本開示は当該実施形態や構造に限定されるものではないと理解される。本開示は、様々な変形例や均等範囲内の変形をも包含する。加えて、様々な組み合わせや形態が本開示に示されているが、それらに一要素のみ、それ以上、あるいはそれ以下、を含む他の組み合わせや形態をも、本開示の範畴や思想範囲に入るものである。 Although the present disclosure has been described in accordance with embodiments, it is understood that the present disclosure is not limited to such embodiments or structures. The present disclosure also includes various modifications and equivalent modifications. In addition, although various combinations and configurations are shown in this disclosure, other combinations and configurations involving only one element, more, or fewer elements are also within the scope and spirit of this disclosure. It is something that can be entered.
11…第1ECU、12…第2ECU、13…第3ECU、21…第1センサ、22…第2センサ、23…第3センサ、100…車載システム
DESCRIPTION OF
Claims (5)
複数の前記特徴量の少なくとも一部である複数の特徴量候補と各特徴量候補における前記出力データとを含む候補特徴量集合を生成し、前記候補特徴量集合における前記特徴量候補の変更と、前記特徴量候補を変更した前記候補特徴量集合を用いた前記予測と、を繰り返し行い、前記予測の精度向上にかかわっている前記特徴量候補を選択する選択部(S10~S12)と、
前記目的変数と、前記選択部で選択された前記特徴量候補と各特徴量候補における複数の前記出力データを含む更新特徴量集合とをもとに、前記目的変数の前記予測に用いる前記基礎モデルを改良した改良モデルを生成するモデル生成部(S13)と、を備えている電子制御装置。 An electronic control device that predicts the objective variable using a basic model machine-learned using a feature quantity set including a plurality of feature quantities and a plurality of output data for each feature quantity, and an objective variable corresponding to each output data. There it is,
generating a candidate feature set including a plurality of feature quantity candidates that are at least some of the plurality of feature quantities and the output data for each feature quantity candidate, and changing the feature quantity candidates in the candidate feature quantity set; a selection unit (S10 to S12) that repeatedly performs the prediction using the candidate feature set in which the feature quantity candidates are changed, and selects the feature quantity candidates that are involved in improving the accuracy of the prediction;
The basic model used for the prediction of the objective variable based on the objective variable, the feature quantity candidate selected by the selection unit, and an updated feature set including the plurality of output data for each feature quantity candidate. An electronic control device comprising: a model generation unit (S13) that generates an improved model that improves the .
前記関数は、前記値が0から1に収まる性質を有しており、
前記閾値は、0から1の間にある請求項2に記載の電子制御装置。 When selecting the feature quantity candidate whose cost value is close to an appropriate value, the selection unit selects the continuous value by comparing a value obtained by substituting the continuous value into a predetermined function with a threshold value. is converted into a discrete value, and the feature amount candidate corresponding to the discrete value is selected,
The function has a property that the value falls between 0 and 1,
3. The electronic control device according to claim 2, wherein the threshold value is between 0 and 1.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022081801A JP2023170227A (en) | 2022-05-18 | 2022-05-18 | Electronic control device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022081801A JP2023170227A (en) | 2022-05-18 | 2022-05-18 | Electronic control device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023170227A true JP2023170227A (en) | 2023-12-01 |
Family
ID=88928155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022081801A Pending JP2023170227A (en) | 2022-05-18 | 2022-05-18 | Electronic control device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023170227A (en) |
-
2022
- 2022-05-18 JP JP2022081801A patent/JP2023170227A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12066797B2 (en) | Fault prediction method and fault prediction system for predecting a fault of a machine | |
US8554707B2 (en) | Method for the computer-assisted control and/or regulation of a technical system where the dynamic behavior of the technical system is modeled using a recurrent neural network | |
US8160978B2 (en) | Method for computer-aided control or regulation of a technical system | |
CN110023850B (en) | Method and control device for controlling a technical system | |
US20130282635A1 (en) | Method For The Computer-Assisted Modeling Of A Technical System | |
JP2001236337A (en) | Predicting device using neural network | |
US20220147897A1 (en) | Machine learning for predictive optmization | |
CN113031983B (en) | Intelligent software upgrading method and device based on deep reinforcement learning | |
Spolaor et al. | Coupling mechanistic approaches and fuzzy logic to model and simulate complex systems | |
Senn et al. | Reducing the computational effort of optimal process controllers for continuous state spaces by using incremental learning and post-decision state formulations | |
Celikyilmaz et al. | Uncertainty modeling of improved fuzzy functions with evolutionary systems | |
CN113537614A (en) | Construction method, system, equipment and medium of power grid engineering cost prediction model | |
US8190536B2 (en) | Method of performing parallel search optimization | |
Aleksovski et al. | Ensembles of fuzzy linear model trees for the identification of multioutput systems | |
JP2023170227A (en) | Electronic control device | |
JP7196935B2 (en) | Arithmetic device, action determination method, and control program | |
Dube et al. | Machine Learning Approach to Predict Aerodynamic Performance of Underhood and Underbody Drag Enablers | |
JP2000339005A (en) | Method and device for controlling optimization of controlled target | |
KR20200051343A (en) | Method and apparatus for estimating a predicted time series data | |
JP4230890B2 (en) | Model identification device, model identification program, and method of operating model identification device | |
JP7362937B2 (en) | Production condition generation system using a generative adversarial network, its production condition generation method, and production condition generation program | |
JPH0454685A (en) | State learning device and state estimating device | |
KR102681777B1 (en) | System And Method For Estimation Of HVAC Capacity For Ship Using AI Algorithm | |
KR20140118195A (en) | Method and system for computing management criteria of warships using genetic algorithm | |
US20190179272A1 (en) | A method, system, computer program product and computer data-base for controlling an industrial process or machine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240909 |