JP2021067196A - 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 - Google Patents
車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 Download PDFInfo
- Publication number
- JP2021067196A JP2021067196A JP2019191098A JP2019191098A JP2021067196A JP 2021067196 A JP2021067196 A JP 2021067196A JP 2019191098 A JP2019191098 A JP 2019191098A JP 2019191098 A JP2019191098 A JP 2019191098A JP 2021067196 A JP2021067196 A JP 2021067196A
- Authority
- JP
- Japan
- Prior art keywords
- vehicle
- data
- value
- state
- cpu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 249
- 230000009471 action Effects 0.000 claims abstract description 135
- 230000001052 transient effect Effects 0.000 claims abstract description 45
- 230000008569 process Effects 0.000 claims description 208
- 238000002485 combustion reaction Methods 0.000 claims description 45
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000013507 mapping Methods 0.000 claims description 22
- 230000006399 behavior Effects 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 abstract description 64
- 230000002787 reinforcement Effects 0.000 abstract description 27
- 230000001133 acceleration Effects 0.000 abstract description 15
- 230000009467 reduction Effects 0.000 abstract description 4
- 238000012545 processing Methods 0.000 description 65
- 238000002347 injection Methods 0.000 description 36
- 239000007924 injection Substances 0.000 description 36
- 239000000446 fuel Substances 0.000 description 29
- 230000000875 corresponding effect Effects 0.000 description 24
- 238000005070 sampling Methods 0.000 description 22
- 230000008859 change Effects 0.000 description 18
- 230000005540 biological transmission Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 7
- 230000002093 peripheral effect Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 206010000269 abscess Diseases 0.000 description 5
- 230000004913 activation Effects 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 238000000342 Monte Carlo simulation Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 239000003054 catalyst Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000004043 responsiveness Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010017472 Fumbling Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007562 laser obscuration time method Methods 0.000 description 1
- TVMXDCGIABBOFY-UHFFFAOYSA-N octane Chemical compound CCCCCCCC TVMXDCGIABBOFY-UHFFFAOYSA-N 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
Images
Classifications
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D37/00—Non-electrical conjoint control of two or more functions of engines, not otherwise provided for
- F02D37/02—Non-electrical conjoint control of two or more functions of engines, not otherwise provided for one of the functions being ignition
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/02—Circuit arrangements for generating control signals
- F02D41/04—Introducing corrections for particular operating conditions
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F01—MACHINES OR ENGINES IN GENERAL; ENGINE PLANTS IN GENERAL; STEAM ENGINES
- F01N—GAS-FLOW SILENCERS OR EXHAUST APPARATUS FOR MACHINES OR ENGINES IN GENERAL; GAS-FLOW SILENCERS OR EXHAUST APPARATUS FOR INTERNAL COMBUSTION ENGINES
- F01N3/00—Exhaust or silencing apparatus having means for purifying, rendering innocuous, or otherwise treating exhaust
- F01N3/02—Exhaust or silencing apparatus having means for purifying, rendering innocuous, or otherwise treating exhaust for cooling, or for removing solid constituents of, exhaust
- F01N3/021—Exhaust or silencing apparatus having means for purifying, rendering innocuous, or otherwise treating exhaust for cooling, or for removing solid constituents of, exhaust by means of filters
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D11/00—Arrangements for, or adaptations to, non-automatic engine control initiation means, e.g. operator initiated
- F02D11/06—Arrangements for, or adaptations to, non-automatic engine control initiation means, e.g. operator initiated characterised by non-mechanical control linkages, e.g. fluid control linkages or by control linkages with power drive or assistance
- F02D11/10—Arrangements for, or adaptations to, non-automatic engine control initiation means, e.g. operator initiated characterised by non-mechanical control linkages, e.g. fluid control linkages or by control linkages with power drive or assistance of the electric type
- F02D11/105—Arrangements for, or adaptations to, non-automatic engine control initiation means, e.g. operator initiated characterised by non-mechanical control linkages, e.g. fluid control linkages or by control linkages with power drive or assistance of the electric type characterised by the function converting demand to actuation, e.g. a map indicating relations between an accelerator pedal position and throttle valve opening or target engine torque
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/0002—Controlling intake air
- F02D41/0007—Controlling intake air for control of turbo-charged or super-charged engines
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/24—Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means
- F02D41/2406—Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means using essentially read only memories
- F02D41/2409—Addressing techniques specially adapted therefor
- F02D41/2422—Selective use of one or more tables
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/24—Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means
- F02D41/2406—Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means using essentially read only memories
- F02D41/2425—Particular ways of programming the data
- F02D41/2429—Methods of calibrating or learning
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/24—Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means
- F02D41/2406—Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means using essentially read only memories
- F02D41/2425—Particular ways of programming the data
- F02D41/2429—Methods of calibrating or learning
- F02D41/2477—Methods of calibrating or learning characterised by the method used for learning
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02P—IGNITION, OTHER THAN COMPRESSION IGNITION, FOR INTERNAL-COMBUSTION ENGINES; TESTING OF IGNITION TIMING IN COMPRESSION-IGNITION ENGINES
- F02P5/00—Advancing or retarding ignition; Control therefor
- F02P5/04—Advancing or retarding ignition; Control therefor automatically, as a function of the working conditions of the engine or vehicle or of the atmospheric conditions
- F02P5/145—Advancing or retarding ignition; Control therefor automatically, as a function of the working conditions of the engine or vehicle or of the atmospheric conditions using electrical means
- F02P5/15—Digital data processing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M15/00—Testing of engines
- G01M15/04—Testing internal-combustion engines
- G01M15/05—Testing internal-combustion engines by combined monitoring of two or more different engine parameters
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M15/00—Testing of engines
- G01M15/04—Testing internal-combustion engines
- G01M15/10—Testing internal-combustion engines by monitoring exhaust gases or combustion flame
- G01M15/102—Testing internal-combustion engines by monitoring exhaust gases or combustion flame by monitoring exhaust gases
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/0002—Controlling intake air
- F02D2041/002—Controlling intake air by simultaneous control of throttle and variable valve actuation
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D2200/00—Input parameters for engine control
- F02D2200/02—Input parameters for engine control the parameters being related to the engine
- F02D2200/04—Engine intake system parameters
- F02D2200/0411—Volumetric efficiency
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/02—Circuit arrangements for generating control signals
- F02D41/04—Introducing corrections for particular operating conditions
- F02D41/045—Detection of accelerating or decelerating state
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/02—Circuit arrangements for generating control signals
- F02D41/14—Introducing closed-loop corrections
- F02D41/1401—Introducing closed-loop corrections characterised by the control or regulation method
- F02D41/1405—Neural network control
Landscapes
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Mechanical Engineering (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Combined Controls Of Internal Combustion Engines (AREA)
Abstract
Description
1.車両の状態が所定の条件を満たす場合における、前記車両の状態と前記車両内の電子機器の操作に関する行動を示す行動変数との関係を規定する第1データが記憶装置に記憶された状態で、前記車両の状態を検出するセンサの検出値を取得する取得処理と、前記電子機器を操作する操作処理と、前記所定の条件を満たす場合、前記取得処理によって取得された前記検出値に基づき、前記車両の特性が基準を満たす場合に満たさない場合よりも大きい報酬を与える報酬算出処理と、前記所定の条件を満たす場合、前記取得処理によって取得された前記検出値に基づく前記車両の状態、前記電子機器の操作に用いられた行動変数の値、および該操作に対応する前記報酬を予め定められた更新写像への入力とし、前記第1データを更新する更新処理と、を実行装置に実行させ、前記更新写像は、前記第1データに従って前記電子機器が操作される場合の前記報酬についての期待収益を増加させるように更新された前記第1データを出力するものであり、前記車両の状態が所定の条件を満たさない場合、前記報酬算出処理および前記更新処理によらずに前記車両の状態と前記行動変数との関係を適合して第2データとする車両用制御データの生成方法である。
過渡運転時には定常運転時と比較して、車両の状態と行動変数との関係を適合するうえで熟練者の工数が大きくなる傾向がある。そこで上記方法では、所定の条件を過渡運転時である旨の条件とすることにより、熟練者の工数が特に大きくなる条件における車両の状態と行動変数との関係の適合を、強化学習によって自動的に実行することにより、熟練者に要求される工数を効果的に削減できる。
なお、第2実行装置が車載装置とは別の装置であることは、第2実行装置が車載装置ではないことを意味する。
9.上記7記載の第2実行装置を備える車両用学習装置である。
<第1の実施形態>
図1に、本実施形態にかかる車両VC1の駆動系および制御装置の構成を示す。
図2に、本実施形態にかかる制御装置70が実行する処理の手順を示す。図2に示す処理は、ROM74に記憶された制御プログラム74aをCPU72がたとえば所定周期で繰り返し実行することにより実現される。なお、以下では、先頭に「S」が付与された数字によって各処理のステップ番号を示す。
これに対し、CPU72は、過渡フラグFが「1」であると判定する場合(S14:YES)、S16の処理において肯定判定されてから所定期間が経過したか否かを判定する(S20)。ここで、所定期間は、アクセル操作量PAの単位時間当たりの変化量ΔPAの絶対値が所定量ΔPAthよりも小さい規定量以下となる状態が所定時間継続するまでの期間とする。CPU72は、所定期間が経過したと判定する場合(S20:YES)、過渡フラグFに「0」を代入する(S22)。
図3に、上記定常マップデータDMsおよび過渡マップデータDMtを生成するシステムを示す。
なお、CPU112は、S60の処理が完了する場合、図4の処理を一旦終了する。
図6に示す一連の処理において、CPU112は、直近に終了されたエピソード中のトルク指令値Trq*、トルクTrqおよび加速度Gxの3つのサンプリング値の組からなる時系列データと、状態sおよび行動aの時系列データと、を取得する(S80)。図6には、カッコの中の数字が異なるものが、異なるサンプリングタイミングにおける変数の値であることを示す。たとえば、トルク指令値Trq*(1)とトルク指令値Trq*(2)とは、サンプリングタイミングが互いに異なるものである。また、直近のエピソードに属する行動aの時系列データを、行動集合Ajとし、同エピソードに属する状態sの時系列データを、状態集合Sjと定義する。
図5に戻り、CPU112は、S74の処理が完了すると、行動価値関数Qが収束したか否かを判定する(S76)。ここでは、独立変数のそれぞれの値に対して行動価値関数Qの更新量が所定値以下となる連続回数が所定回数に達する場合に収束したと判定すればよい。CPU112は、収束していないと判定する場合(S76:NO)、S30の処理に戻る。これに対し、CPU112は、収束したと判定する場合(S76:YES)、図5に示す一連の処理を終了する。
ここで、本実施形態の作用および効果について説明する。
(1)制御装置70が備える記憶装置76に、行動価値関数Q等ではなく、過渡マップデータDMtを記憶した。これにより、CPU72は、過渡マップデータDMtを用いたマップ演算に基づき、スロットル開口度指令値TA*や遅角量aopを設定することから、行動価値関数Qのうち最大値となるものを選択する処理を実行する場合と比較して、演算負荷を軽減できる。
以下、第2の実施形態について、第1の実施形態との相違点を中心に図面を参照しつつ説明する。
以下、第3の実施形態について、第2の実施形態との相違点を中心に図面を参照しつつ説明する。
図10に、本実施形態において、強化学習を実行する制御システムの構成を示す。なお、図10において、図1に示した部材に対応する部材については、便宜上、同一の符号を付している。
データ解析センター130は、複数の車両VC1,VC2,…から送信されるデータを解析する。データ解析センター130は、CPU132、ROM134、および電気的に書き換え可能な不揮発性メモリ(記憶装置136)、周辺回路138および通信機137を備えており、それらがローカルネットワーク139によって通信可能とされるものである。ROM134には、学習プログラム74bが記憶されており、記憶装置136には、関係規定データDRが記憶されている。
本実施形態では、方策πを、行動を定める各操作量の取りうる確率を定める多変量ガウス分布とする。ここで、多変量ガウス分布の平均値μ(1)は、スロットル開口度指令値TA*の平均値を示し、平均値μ(2)は、遅角量aopの平均値を示し、平均値μ(3)は、ベース噴射量Qbseの平均値を示す。また、本実施形態では、多変量ガウス分布の共分散行列を対角行列とし、各平均値μ(i)に対応する分散σ(i)が各別の値となりうるものとする。
図13に、本実施形態にかかる強化学習の処理手順を示す。図13(a)に示す処理は、図10に示すROM74に記憶された制御プログラム74aをCPU72が実行することにより実現される。また、図13(b)に示す処理は、ROM134に記憶されている学習プログラム74bを、S34aの処理が実行される場合にCPU132がS34aの処理の実行周期で繰り返し実行することにより実現される。以下では、強化学習の時系列に沿って、図13に示す処理を説明する。
pθ(ht)
=p(s0)・p(s1|s0,a0)・π(a0|s0)・p(s2|s1,a1)・π(a1|s1)…p(sT|sT-1,aT-1)・π(aT-1|sT-1)
となる。ただし、初期確率p(s0)は、状態s0となる確率であり、遷移確率p(st+1|st,at)は、状態st、行動atのときに状態stから状態st+1に遷移する確率である。
なお、S140〜S150の処理は、ROM134に記憶された学習プログラム74bのうち、状態s0,s1,…、行動a0,a1,…、および報酬rを入力とし、更新されたパラメータθを出力する更新写像の実行指令が実行されることによって実現される。
これに対し図13(a)に示すように、CPU72は、更新データがあるか否かを判定する(S124)。そしてCPU72は、更新データがあると判定する場合(S124:YES)、更新データを受信する(S126)。そしてCPU72は、S32bの処理において利用する関係規定データDRを構成する係数w(1)〜w(p),wTを、S126の処理によって受信したデータに書き換える(S128)。なお、CPU72は、S128の処理が完了する場合や、S124の処理において否定判定する場合には、図13(a)に示す一連の処理を一旦終了する。
以上説明した本実施形態によれば、さらに以下の作用効果が得られる。
(5)行動aにベース噴射量Qbseを含めた。過渡時においては開ループ操作量としてのベース噴射量Qbseを充填効率ηに比例した値としたのみでは、検出値Afuがリッチ側上限値AfRとリーン側上限値AfLとの間から外れるおそれがある。そして、どのようにベース噴射量Qbseを設定すればよいかを、熟練者による試行錯誤の繰り返しによって行う場合には、熟練者に要求される工数が多くなる。これに対し、本実施形態では、過渡時の開ループ制御の噴射量であるベース噴射量Qbseを強化学習によって学習することにより、熟練者に要求される工数を効果的に削減できる。
上記実施形態における事項と、上記「課題を解決するための手段」の欄に記載した事項との対応関係は、次の通りである。以下では、「課題を解決するための手段」の欄に記載した解決手段の番号毎に、対応関係を示している。
なお、本実施形態は、以下のように変更して実施することができる。本実施形態および以下の変更例は、技術的に矛盾しない範囲で互いに組み合わせて実施することができる。
上記実施形態では、行動変数としてのスロットルバルブの開口度に関する変数として、スロットル開口度指令値TA*を例示したが、これに限らない。たとえば、アクセル操作量PAに対するスロットル開口度指令値TA*の応答性を、無駄時間および2次遅れフィルタにて表現し、無駄時間と、2次遅れフィルタを規定する2つの変数との合計3つの変数を、スロットルバルブの開口度に関する変数としてもよい。ただし、その場合、状態変数は、アクセル操作量PAの時系列データに代えて、アクセル操作量PAの単位時間当たりの変化量とすることが望ましい。
また、たとえば、下記「車両について」の欄に記載したように車両としてハイブリッド車や、電気自動車、燃料電池車を採用する場合、回転電機のトルクや出力を行動変数としてもよい。
上記実施形態では、アクセル操作量PAの時系列データを、等間隔でサンプリングされた6個の値からなるデータとしたが、これに限らない。互いに異なるサンプリングタイミングにおける2個以上のサンプリング値からなるデータであればよく、この際、3個以上のサンプリング値からなるデータや、サンプリング間隔が等間隔であるデータであることがより望ましい。
上記実施形態では、行動価値関数Qを、テーブル形式の関数としたが、これに限らない。たとえば、関数近似器を用いてもよい。
テーブル形式のデータの次元削減手法としては、上記実施形態において例示したものに限らない。たとえばアクセル操作量PAが最大値となることはまれであることから、アクセル操作量PAが規定量以上となる状態については行動価値関数Qを定義せず、アクセル操作量PAが規定量以上となる場合のスロットル開口度指令値TA*等は、別途適合してもよい。またたとえば、行動のとりうる値からスロットル開口度指令値TA*が規定値以上となるものを除くなどして、次元削減をしてもよい。
強化学習の実行条件または強化学習によって学習された制御用データの利用条件としての所定の条件としては、アクセル操作量PAの変化量ΔPAの絶対値が所定値ΔPA以上となってからの所定期間に限らない。たとえば吸入空気量Gaの単位時間当たりの変化量の絶対値が所定量以上となってからの所定期間としてもよい。
S88〜S94の処理においては、εソフト方策オン型モンテカルロ法によるものを例示したが、これに限らない。たとえば、方策オフ型モンテカルロ法によるものであってもよい。もっとも、モンテカルロ法にも限らず、たとえば、方策オフ型TD法を用いたり、またたとえばSARSA法のように方策オン型TD法を用いたり、またたとえば、方策オン型の学習として適格度トレース法を用いたりしてもよい。
図6の処理では、条件(ア)および条件(イ)の論理積が真であるか否かに応じて報酬を与えたが、これに限らない。たとえば、条件(ア)を満たすか否かに応じて報酬を与える処理と、条件(イ)を満たすか否かに応じて報酬を与える処理とを実行してもよい。また、たとえば、条件(ア)を満たすか否かに応じて報酬を与える処理と、条件(イ)を満たすか否かに応じて報酬を与える処理との2つの処理に関しては、それらのうちのいずれか1つの処理のみを実行してもよい。
(b)変速装置の入力軸52の回転速度の変化速度の絶対値が入力側所定値以下である場合に入力側所定値を超える場合よりも大きい報酬を与える処理である。
また、たとえば「行動変数について」の欄に記載したように、回転電機のトルクや出力を行動変数とする場合、バッテリの充電率が所定範囲内にある場合にない場合よりも大きい報酬を与える処理や、バッテリの温度が所定範囲内にある場合にない場合よりも大きい報酬を与える処理を含めてもよい。
図5のS32aの処理では、行動価値関数Qに基づき行動を決定したが、これに限らず、とりうるすべての行動を等確率で選択してもよい。
たとえば「第1データについて」の欄に記載したように、行動価値関数Qを関数近似器とする場合、上記実施形態におけるテーブル型式の関数の独立変数となる行動についての離散的な値の組の全てについて、状態sとともに行動価値関数Qに入力することによって、行動価値関数Qを最大化する行動aを選択すればよい。
車両の状態と期待収益を最大化する行動変数の値とを1対1に対応付けることによって車両の状態を入力とし期待収益を最大化する行動変数の値を出力する制御用写像データとしては、マップデータに限らない。たとえば、関数近似器であってもよい。これは、たとえば、図13に例示する方策勾配法等を用いる場合において、学習後の平均値μを制御用写像データとすることによって実現できる。
図11に示した例では、方策πに基づく行動を決定する処理(S32bの処理)を、車両側で実行したが、これに限らない。たとえば、車両VC1からS30aの処理によって取得したデータを送信することとし、データ解析センター130にて送信されてデータを用いて行動aを決定し、決定した行動を車両VC1に送信してもよい。
実行装置としては、CPU72(112,132)とROM74(114,134)とを備えて、ソフトウェア処理を実行するものに限らない。たとえば、上記実施形態においてソフトウェア処理されたものの少なくとも一部を、ハードウェア処理する専用のハードウェア回路(たとえばASIC等)を備えてもよい。すなわち、実行装置は、以下の(a)〜(c)のいずれかの構成であればよい。(a)上記処理の全てを、プログラムに従って実行する処理装置と、プログラムを記憶するROM等のプログラム格納装置とを備える。(b)上記処理の一部をプログラムに従って実行する処理装置およびプログラム格納装置と、残りの処理を実行する専用のハードウェア回路とを備える。(c)上記処理の全てを実行する専用のハードウェア回路を備える。ここで、処理装置およびプログラム格納装置を備えたソフトウェア実行装置や、専用のハードウェア回路は複数であってもよい。
上記実施形態では、関係規定データDRが記憶される記憶装置と、学習プログラム74b,114aや制御プログラム74aが記憶される記憶装置(ROM74,114,134)とを別の記憶装置としたが、これに限らない。
内燃機関としては、燃料噴射弁として吸気通路12に燃料を噴射するポート噴射弁を備えるものに限らず、燃焼室24に燃料を直接噴射する筒内噴射弁を備えるものであってもよく、またたとえば、ポート噴射弁および筒内噴射弁の双方を備えるものであってもよい。
内燃機関としては、火花点火式内燃機関に限らず、たとえば燃料として軽油などを用いる圧縮着火式内燃機関等であってもよい。
車両としては、推力生成装置が内燃機関のみである車両に限らず、たとえば内燃機関と回転電機とを備えるいわゆるハイブリッド車両であってもよい。またたとえば、推力生成装置として、内燃機関を備えることなく、回転電機を備えるいわゆる電気自動車や燃料電池車あってもよい。
Claims (9)
- 車両の状態が所定の条件を満たす場合における、前記車両の状態と前記車両内の電子機器の操作に関する行動を示す行動変数との関係を規定する第1データが記憶装置に記憶された状態で、
前記車両の状態を検出するセンサの検出値を取得する取得処理と、
前記電子機器を操作する操作処理と、
前記所定の条件を満たす場合、前記取得処理によって取得された前記検出値に基づき、前記車両の特性が基準を満たす場合に満たさない場合よりも大きい報酬を与える報酬算出処理と、
前記所定の条件を満たす場合、前記取得処理によって取得された前記検出値に基づく前記車両の状態、前記電子機器の操作に用いられた行動変数の値、および該操作に対応する前記報酬を予め定められた更新写像への入力とし、前記第1データを更新する更新処理と、
を実行装置に実行させ、
前記更新写像は、前記第1データに従って前記電子機器が操作される場合の前記報酬についての期待収益を増加させるように更新された前記第1データを出力するものであり、
前記車両の状態が所定の条件を満たさない場合、前記報酬算出処理および前記更新処理によらずに前記車両の状態と前記行動変数との関係を適合して第2データとする車両用制御データの生成方法。 - 前記所定の条件は、過渡運転時である旨の条件である請求項1記載の車両用制御データの生成方法。
- 前記車両は、内燃機関を搭載しており、
前記電子機器は、前記内燃機関の操作部を含み、
前記第1データは、前記車両の状態と前記行動変数としての前記内燃機関の操作部の操作量との関係を規定する請求項1または2記載の車両用制御データの生成方法。 - 前記車両の状態と前記期待収益を最大化する前記行動変数の値とを1対1に対応付けることによって前記車両の状態を入力とし前記期待収益を最大化する前記行動変数の値を出力する制御用写像データを、前記更新処理によって更新された前記第1データに基づき生成する処理を前記実行装置に実行させる請求項1〜3のいずれか1項に記載の車両用制御データの生成方法。
- 請求項1〜3のいずれか1項に記載の前記記憶装置および前記実行装置を備え、
前記記憶装置には、前記第2データが記憶されており、
前記操作処理は、前記所定の条件が成立する場合、前記第1データに基づき前記取得処理によって取得された前記車両の状態に応じた行動変数の値に従って前記電子機器を操作する第1操作処理と、前記所定の条件が成立しない場合、前記第2データに基づき前記取得処理によって取得された前記車両の状態に応じた行動変数の値に従って前記電子機器を操作する第2操作処理と、を含む車両用制御装置。 - 実行装置および記憶装置を備え、
前記記憶装置には、車両の状態と前記車両内の電子機器の操作に関する変数である行動変数との関係を規定する、第1データおよび第2データが記憶されており、
前記実行装置は、
前記車両の状態を検出するセンサの検出値を取得する取得処理と、
前記電子機器を操作する操作処理と、
前記車両の状態が所定の条件を満たす場合、前記取得処理によって取得された前記検出値に基づき、前記車両の特性が基準を満たす場合に満たさない場合よりも大きい報酬を与える報酬算出処理と、
前記車両の状態が所定の条件を満たす場合、前記取得処理によって取得された前記検出値に基づく前記車両の状態、前記電子機器の操作に用いられた行動変数の値、および該操作に対応する前記報酬を予め定められた更新写像への入力とし、前記第1データを更新する更新処理と、
を実行し、
前記更新写像は、前記第1データに従って前記電子機器が操作される場合の前記報酬についての期待収益を増加させるように更新された前記第1データを出力するものであり、
前記操作処理は、前記所定の条件が成立する場合、前記第1データに基づき前記取得処理によって取得された前記車両の状態に応じた行動変数の値に従って前記電子機器を操作する第1操作処理と、前記所定の条件が成立しない場合、前記第2データに基づき前記取得処理によって取得された前記車両の状態に応じた行動変数の値に従って前記電子機器を操作する第2操作処理と、を含む車両用制御装置。 - 請求項5または6記載の前記実行装置および前記記憶装置を備え、
前記実行装置は、前記車両に搭載される第1実行装置と、車載装置とは別の第2実行装置と、を含み、
前記第1実行装置は、少なくとも前記取得処理、および前記操作処理を実行し、
前記第2実行装置は、少なくとも前記更新処理を実行する車両用制御システム。 - 請求項7記載の第1実行装置を備える車両用制御装置。
- 請求項7記載の第2実行装置を備える車両用学習装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019191098A JP6705545B1 (ja) | 2019-10-18 | 2019-10-18 | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 |
US17/024,071 US11530662B2 (en) | 2019-10-18 | 2020-09-17 | Method of generating vehicle control data, vehicle control device, and vehicle control system |
CN202011107493.0A CN112682200B (zh) | 2019-10-18 | 2020-10-16 | 车辆用控制数据的生成方法、车辆用控制装置和车辆用控制系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019191098A JP6705545B1 (ja) | 2019-10-18 | 2019-10-18 | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020060900A Division JP2021067256A (ja) | 2020-03-30 | 2020-03-30 | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6705545B1 JP6705545B1 (ja) | 2020-06-03 |
JP2021067196A true JP2021067196A (ja) | 2021-04-30 |
Family
ID=70858157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019191098A Active JP6705545B1 (ja) | 2019-10-18 | 2019-10-18 | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11530662B2 (ja) |
JP (1) | JP6705545B1 (ja) |
CN (1) | CN112682200B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210114596A1 (en) * | 2019-10-18 | 2021-04-22 | Toyota Jidosha Kabushiki Kaisha | Method of generating vehicle control data, vehicle control device, and vehicle control system |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11603111B2 (en) * | 2019-10-18 | 2023-03-14 | Toyota Jidosha Kabushiki Kaisha | Vehicle controller, vehicle control system, and learning device for vehicle |
JP7205503B2 (ja) | 2020-01-22 | 2023-01-17 | トヨタ自動車株式会社 | 内燃機関の制御装置 |
JP7222366B2 (ja) * | 2020-01-27 | 2023-02-15 | トヨタ自動車株式会社 | 内燃機関の制御装置 |
JP7359011B2 (ja) | 2020-02-05 | 2023-10-11 | トヨタ自動車株式会社 | 内燃機関の制御装置 |
JP7331789B2 (ja) * | 2020-06-25 | 2023-08-23 | トヨタ自動車株式会社 | 車両用制御装置、車両用制御システム、車両用学習装置、および車両用学習方法 |
JP7439680B2 (ja) | 2020-07-28 | 2024-02-28 | トヨタ自動車株式会社 | 変速制御データの生成方法、変速制御装置、変速制御システム、および車両用学習装置 |
CN112116156B (zh) * | 2020-09-18 | 2023-02-03 | 中南大学 | 基于深度强化学习的混动列车的能量管理方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000250604A (ja) * | 1999-03-02 | 2000-09-14 | Yamaha Motor Co Ltd | 特性最適化方法における最適化の協調方法 |
JP2012102629A (ja) * | 2010-11-08 | 2012-05-31 | Honda Motor Co Ltd | プラントの制御装置 |
JP6547991B1 (ja) * | 2019-02-20 | 2019-07-24 | トヨタ自動車株式会社 | 触媒温度推定装置、触媒温度推定システム、データ解析装置、および内燃機関の制御装置 |
JP6590097B1 (ja) * | 2019-02-20 | 2019-10-16 | トヨタ自動車株式会社 | Pm量推定装置、pm量推定システム、データ解析装置、内燃機関の制御装置、および受信装置 |
Family Cites Families (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4438497A (en) * | 1981-07-20 | 1984-03-20 | Ford Motor Company | Adaptive strategy to control internal combustion engine |
JP3056528B2 (ja) * | 1990-12-10 | 2000-06-26 | マツダ株式会社 | エンジンの空燃比制御装置 |
JP2974440B2 (ja) | 1991-03-22 | 1999-11-10 | 株式会社日立製作所 | 自動車総合制御装置 |
JP3071333B2 (ja) | 1993-02-26 | 2000-07-31 | トヨタ自動車株式会社 | 車両の駆動力制御装置 |
US5954617A (en) | 1997-01-31 | 1999-09-21 | Cummins Engine Company, Inc. | System for controlling internal combustion engine performance in accordance with driver behavior |
JPH10254505A (ja) | 1997-03-14 | 1998-09-25 | Toyota Motor Corp | 自動制御装置 |
US6549815B1 (en) | 1999-03-02 | 2003-04-15 | Yamaha Hatsudoki Kabushiki Kaisha | Method and apparatus for optimizing overall characteristics of device, using heuristic method |
EP1203874A4 (en) | 1999-07-28 | 2008-07-30 | Hitachi Ltd | METHOD AND DEVICE FOR A MOTOR-DRIVEN VALVE, VEHICLE, METHOD FOR MEASURING MOTOR TEMPERATURE FOR CONTROLLING THE THROTTLE VALVE AND METHOD FOR MEASURING MOTOR TEMPERATURE |
JP2002322934A (ja) | 2001-04-26 | 2002-11-08 | Toyota Motor Corp | 内燃機関の吸気制御装置 |
US6654677B2 (en) | 2001-09-18 | 2003-11-25 | Visteon Global Technologies, Inc. | Method and system for providing vehicle control to a driver |
JP4005483B2 (ja) | 2002-11-20 | 2007-11-07 | 日産自動車株式会社 | 車線逸脱防止装置 |
ES2286958B1 (es) | 2005-07-11 | 2008-09-01 | Honda Motor Co., Ltd | Sistema de control de vehiculo, sistema de control de transmision continuamente variable y metodo. |
JP2007278082A (ja) * | 2006-04-03 | 2007-10-25 | Nissan Motor Co Ltd | 車両の運動制御装置 |
JP2009019523A (ja) | 2007-07-10 | 2009-01-29 | Honda Motor Co Ltd | 内燃機関の制御装置 |
JP4930389B2 (ja) | 2008-01-18 | 2012-05-16 | 三菱自動車工業株式会社 | 空燃比制御装置及び空燃比制御方法 |
DE102008040633B4 (de) * | 2008-07-23 | 2020-01-02 | Robert Bosch Gmbh | Verfahren zum Betreiben einer Brennkraftmaschine |
US8352152B2 (en) | 2009-02-10 | 2013-01-08 | Honeywell International Inc. | System, method, apparatus and computer program product for providing improved engine control |
CN104812638A (zh) * | 2012-11-24 | 2015-07-29 | 丰田自动车株式会社 | 车辆状态判定装置、车辆状态判定方法及运转操作诊断装置 |
JP6312618B2 (ja) | 2015-03-13 | 2018-04-18 | 日立オートモティブシステムズ株式会社 | 内燃機関の制御装置及び異常燃焼検出方法 |
JP6026612B2 (ja) | 2015-09-22 | 2016-11-16 | 本田技研工業株式会社 | 車両用内燃機関の制御装置 |
JP6253000B1 (ja) | 2016-09-14 | 2017-12-27 | マツダ株式会社 | 車両の制御装置 |
JP6253001B1 (ja) | 2016-09-29 | 2017-12-27 | マツダ株式会社 | 車両の制御装置 |
JP6328201B2 (ja) * | 2016-10-05 | 2018-05-23 | 三菱電機株式会社 | 内燃機関の制御装置 |
US9989964B2 (en) | 2016-11-03 | 2018-06-05 | Mitsubishi Electric Research Laboratories, Inc. | System and method for controlling vehicle using neural network |
JP6695266B2 (ja) | 2016-12-09 | 2020-05-20 | 日立オートモティブシステムズ株式会社 | 内燃機関の異常燃焼検出装置 |
JP6524144B2 (ja) * | 2017-06-02 | 2019-06-05 | 本田技研工業株式会社 | 車両制御システム及び方法、並びに走行支援サーバ |
JP6919997B2 (ja) | 2018-02-06 | 2021-08-18 | 株式会社日立製作所 | 制御装置、制御方法、および制御プログラム |
JP2019144748A (ja) | 2018-02-19 | 2019-08-29 | 株式会社デンソー | 情報処理システム、車載制御装置、及び情報処理装置 |
US20190360421A1 (en) | 2018-05-24 | 2019-11-28 | GM Global Technology Operations LLC | Method to evaluate the instantaneous fuel to torque ice efficiency status |
JP6665961B1 (ja) | 2019-08-01 | 2020-03-13 | トヨタ自動車株式会社 | 内燃機関の状態検出システム、データ解析装置、及び車両 |
JP2021032114A (ja) * | 2019-08-22 | 2021-03-01 | トヨタ自動車株式会社 | 車両用学習制御システム、車両用制御装置、および車両用学習装置 |
JP6705544B1 (ja) | 2019-10-18 | 2020-06-03 | トヨタ自動車株式会社 | 車両用制御装置、車両用制御システム、および車両用学習装置 |
JP6744598B1 (ja) | 2019-10-18 | 2020-08-19 | トヨタ自動車株式会社 | 車両用制御システム、車両用制御装置、および車両用学習装置 |
JP6705546B1 (ja) * | 2019-10-18 | 2020-06-03 | トヨタ自動車株式会社 | 車両用制御装置、車両用制御システム、および車両用学習装置 |
JP6809587B1 (ja) | 2019-10-18 | 2021-01-06 | トヨタ自動車株式会社 | 車両用制御装置 |
JP6744597B1 (ja) | 2019-10-18 | 2020-08-19 | トヨタ自動車株式会社 | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 |
JP7302466B2 (ja) * | 2019-12-23 | 2023-07-04 | トヨタ自動車株式会社 | 車両用内燃機関の劣化判定装置 |
JP7211375B2 (ja) * | 2020-01-09 | 2023-01-24 | トヨタ自動車株式会社 | 車両用制御装置 |
-
2019
- 2019-10-18 JP JP2019191098A patent/JP6705545B1/ja active Active
-
2020
- 2020-09-17 US US17/024,071 patent/US11530662B2/en active Active
- 2020-10-16 CN CN202011107493.0A patent/CN112682200B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000250604A (ja) * | 1999-03-02 | 2000-09-14 | Yamaha Motor Co Ltd | 特性最適化方法における最適化の協調方法 |
JP2012102629A (ja) * | 2010-11-08 | 2012-05-31 | Honda Motor Co Ltd | プラントの制御装置 |
JP6547991B1 (ja) * | 2019-02-20 | 2019-07-24 | トヨタ自動車株式会社 | 触媒温度推定装置、触媒温度推定システム、データ解析装置、および内燃機関の制御装置 |
JP6590097B1 (ja) * | 2019-02-20 | 2019-10-16 | トヨタ自動車株式会社 | Pm量推定装置、pm量推定システム、データ解析装置、内燃機関の制御装置、および受信装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210114596A1 (en) * | 2019-10-18 | 2021-04-22 | Toyota Jidosha Kabushiki Kaisha | Method of generating vehicle control data, vehicle control device, and vehicle control system |
US11654915B2 (en) * | 2019-10-18 | 2023-05-23 | Toyota Jidosha Kabushiki Kaisha | Method of generating vehicle control data, vehicle control device, and vehicle control system |
Also Published As
Publication number | Publication date |
---|---|
US20210115866A1 (en) | 2021-04-22 |
US11530662B2 (en) | 2022-12-20 |
CN112682200B (zh) | 2022-12-16 |
CN112682200A (zh) | 2021-04-20 |
JP6705545B1 (ja) | 2020-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6705545B1 (ja) | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 | |
JP6809587B1 (ja) | 車両用制御装置 | |
JP7287287B2 (ja) | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 | |
JP7302466B2 (ja) | 車両用内燃機関の劣化判定装置 | |
JP7314831B2 (ja) | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 | |
TW202117179A (zh) | 產生車輛控制資料之方法,車輛控制裝置,及車輛控制系統 | |
JP2021067192A (ja) | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 | |
JP2021067201A (ja) | 車両用制御装置、車両用制御システム、および車両用学習装置 | |
JP7243642B2 (ja) | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 | |
JP2021066240A (ja) | 車両用制御装置、車両用制御システム、および車両用学習装置 | |
JP7207290B2 (ja) | 車両用制御装置、車両用制御システム、車両用学習装置、および車両用学習方法 | |
JP2021067197A (ja) | 車両用制御装置、車両用制御システム、および車両用学習装置 | |
JP7331704B2 (ja) | 車両用制御データの生成方法、車両用制御装置、および車両用制御システム | |
JP2021067194A (ja) | 車両用制御システム、車両用制御装置、および車両用学習装置 | |
CN112682196B (zh) | 车辆用控制装置、车辆用控制系统、以及车辆用学习装置 | |
JP2021127070A (ja) | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 | |
JP7314819B2 (ja) | 車両制御方法、車両用制御装置及びサーバ | |
JP2021067256A (ja) | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 | |
CN113266481A (zh) | 车辆控制方法、车辆用控制装置以及服务器 | |
JP2021067257A (ja) | 車両用制御装置、車両用制御システム、および車両用学習装置 | |
JP2021067258A (ja) | 車両用制御装置、車両用制御システム、および車両用学習装置 | |
JP7205456B2 (ja) | 車両用制御装置、車両用制御システム、および車両用学習装置 | |
JP7207289B2 (ja) | 車両用制御装置、車両用制御システム、車両用学習装置、および車両用学習方法 | |
JP7205460B2 (ja) | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 | |
JP2021067261A (ja) | 車両用制御装置、車両用制御システム、および車両用学習装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191120 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20191120 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20191219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200327 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200414 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200427 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6705545 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |