JP2020063699A - 内燃機関の制御装置及びその制御方法、並びに内燃機関を制御するための学習モデル及びその学習方法 - Google Patents

内燃機関の制御装置及びその制御方法、並びに内燃機関を制御するための学習モデル及びその学習方法 Download PDF

Info

Publication number
JP2020063699A
JP2020063699A JP2018196035A JP2018196035A JP2020063699A JP 2020063699 A JP2020063699 A JP 2020063699A JP 2018196035 A JP2018196035 A JP 2018196035A JP 2018196035 A JP2018196035 A JP 2018196035A JP 2020063699 A JP2020063699 A JP 2020063699A
Authority
JP
Japan
Prior art keywords
learning
parameter
value
output
internal combustion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018196035A
Other languages
English (en)
Other versions
JP6699702B2 (ja
Inventor
栄来 北川
Eiki Kitagawa
栄来 北川
小田 富久
Tomihisa Oda
富久 小田
大樹 横山
Daiki Yokoyama
大樹 横山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2018196035A priority Critical patent/JP6699702B2/ja
Priority to US16/566,019 priority patent/US10947909B2/en
Priority to DE102019124267.3A priority patent/DE102019124267A1/de
Publication of JP2020063699A publication Critical patent/JP2020063699A/ja
Application granted granted Critical
Publication of JP6699702B2 publication Critical patent/JP6699702B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D28/00Programme-control of engines
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/02Circuit arrangements for generating control signals
    • F02D41/14Introducing closed-loop corrections
    • F02D41/1401Introducing closed-loop corrections characterised by the control or regulation method
    • F02D41/1405Neural network control
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/02Circuit arrangements for generating control signals
    • F02D41/14Introducing closed-loop corrections
    • F02D41/1438Introducing closed-loop corrections using means for determining characteristics of the combustion gases; Sensors therefor
    • F02D41/1444Introducing closed-loop corrections using means for determining characteristics of the combustion gases; Sensors therefor characterised by the characteristics of the combustion gases
    • F02D41/146Introducing closed-loop corrections using means for determining characteristics of the combustion gases; Sensors therefor characterised by the characteristics of the combustion gases the characteristics being an NOx content or concentration
    • F02D41/1461Introducing closed-loop corrections using means for determining characteristics of the combustion gases; Sensors therefor characterised by the characteristics of the combustion gases the characteristics being an NOx content or concentration of the exhaust gases emitted by the engine
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/24Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means
    • F02D41/2406Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means using essentially read only memories
    • F02D41/2425Particular ways of programming the data
    • F02D41/2429Methods of calibrating or learning
    • F02D41/2451Methods of calibrating or learning characterised by what is learned or calibrated
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D2200/00Input parameters for engine control
    • F02D2200/02Input parameters for engine control the parameters being related to the engine
    • F02D2200/10Parameters related to the engine output, e.g. engine torque or engine speed
    • F02D2200/1002Output torque
    • F02D2200/1004Estimation of the output torque
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/02Circuit arrangements for generating control signals
    • F02D41/14Introducing closed-loop corrections
    • F02D41/1438Introducing closed-loop corrections using means for determining characteristics of the combustion gases; Sensors therefor
    • F02D41/1444Introducing closed-loop corrections using means for determining characteristics of the combustion gases; Sensors therefor characterised by the characteristics of the combustion gases
    • F02D41/1452Introducing closed-loop corrections using means for determining characteristics of the combustion gases; Sensors therefor characterised by the characteristics of the combustion gases the characteristics being a COx content or concentration
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/24Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means
    • F02D41/2406Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means using essentially read only memories
    • F02D41/2425Particular ways of programming the data
    • F02D41/2429Methods of calibrating or learning
    • F02D41/2477Methods of calibrating or learning characterised by the method used for learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Combustion & Propulsion (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Combined Controls Of Internal Combustion Engines (AREA)

Abstract

【課題】教師データにノイズが重畳された場合であっても、学習モデルの学習においてそのノイズが与える影響を抑制可能な内燃機関の制御装置を提供する。【解決手段】内燃機関の制御装置は、入力パラメータの実測値が入力されると、学習モデルを用いて出力パラメータの予測値を出力するパラメータ値出力部221と、出力パラメータの予測値に基づいて内燃機関を制御する機関制御部222と、入力パラメータ及び出力パラメータの実測値の組を教師データとして勾配法を用いて学習モデルの学習を行う学習部223と、入力パラメータ及び出力パラメータのうち少なくともいずれか1つのパラメータの実測値に重畳されたノイズの量が相対的に大きい場合には、そのパラメータの実測値に重畳されたノイズの量が相対的に小さい場合に比べて、小さい学習率で学習が行われるように学習率を調整する学習率調整部225と、を備える。【選択図】図1

Description

本開示は、内燃機関の制御装置及びその制御方法、並びに内燃機関を制御するための学習モデル及びその学習方法に関する。
従来から、機械学習によって学習された学習モデルを用いて、車両の内燃機関を制御する技術が公知である(例えば、特許文献1参照)。特に、特許文献1に記載の各モデルでは、内燃機関の運転に関する複数の入力パラメータが入力されると、ニューラルネットワークを用いて、吸気ガス、排気ガス及びEGRガスの流量がそれぞれ出力される。この機械学習では、学習モデルが出力した出力パラメータの予測値と出力パラメータの実際の値との誤差が小さくなるように、学習モデルを作成することが重要である。
特開2012−112277号公報
ところで、学習モデルを用いる内燃機関の制御装置において、運転中に取得した車両固有の教師データに基づいて学習モデルの学習を行う場合が想定される。これにより、車両固有の特性が学習後の学習モデルに反映される。そのため、学習モデルから出力された出力パラメータの予測値とその出力パラメータの実際の値との誤差(以下、「予測誤差」という)を低減することが可能となる。斯かる学習モデルによれば、内燃機関をより適切に制御することが可能となる。
しかしながら、運転中に取得した教師データには、例えば走行環境や走行条件などの様々な要因によりノイズが重畳される。教師データに重畳されたノイズの量が大きくなると、学習モデルの学習の際に学習結果にノイズが反映されやすくなる。その結果、学習の収束性が悪化し、学習モデルにおける予測誤差が増大する虞がある。
本開示は、上記課題に鑑みてなされたものであり、その目的は、教師データにノイズが重畳された場合であっても、学習モデルの学習においてそのノイズが与える影響を抑制可能な内燃機関の制御装置及びその制御方法、並びに内燃機関を制御するための学習モデル及びその学習方法を提供することにある。
本開示の要旨は、以下の通りである。
(1)車両の内燃機関の運転を制御する内燃機関の制御装置であって、入力パラメータの実測値が入力されると、学習モデルを用いて、出力パラメータの予測値を出力するパラメータ値出力部と、前記パラメータ値出力部から出力された前記出力パラメータの予測値に基づいて、前記内燃機関を制御する機関制御部と、前記学習モデルの入力パラメータの実測値と前記学習モデルの出力パラメータの実測値との組を教師データとして、勾配法を用いて前記学習モデルの学習を行う学習部と、前記入力パラメータ及び前記出力パラメータのうち少なくともいずれか1つのパラメータの実測値に重畳されたノイズの量が相対的に大きい場合には、そのパラメータの実測値に重畳された前記ノイズの量が相対的に小さい場合に比べて、小さい学習率で前記学習が行われるように前記学習率を調整する学習率調整部と、を備えた、内燃機関の制御装置。
(2)前記入力パラメータの実測値及び前記出力パラメータの実測値に重畳された前記ノイズの量を検出するノイズ量検出部をさらに備え、前記ノイズ量検出部は、機関運転状態が定常状態にあるときに検出された前記入力パラメータ及び前記出力パラメータの前記実測値に基づいて各パラメータについての標準偏差又はSN比の逆数を算出し、各パラメータについての前記標準偏差又は前記SN比の逆数を各パラメータについての前記ノイズの量として用いる、上記(1)に記載の内燃機関の制御装置。
(3)前記学習率調整部は、前記少なくともいずれか1つのパラメータの実測値に重畳された前記ノイズの量が大きいほど、学習率が小さくなるように前記学習率を調整する、上記(1)又は(2)に記載の内燃機関の制御装置。
(4)前記学習率調整部は、前記入力パラメータ及び前記出力パラメータの各々の実測値に重畳された前記ノイズの量がそのパラメータに対して設定された閾値以下である場合には、前記少なくともいずれか1つのパラメータの実測値に重畳された前記ノイズの量が前記閾値よりも大きい場合の学習率よりも大きい一定の学習率に維持されるように前記学習率を調整する、上記(1)乃至(3)のいずれか1つに記載の内燃機関の制御装置。
(5)前記内燃機関の制御装置は、前記車両に設けられた電子制御ユニットである、上記(1)乃至(4)のいずれか1つに記載の内燃機関の制御装置。
(6)前記内燃機関の制御装置は、前記車両に設けられた電子制御ユニットと、前記車両の外部に設置されて前記電子制御ユニットと通信可能に構成されたサーバと、を備え、前記電子制御ユニットは、前記パラメータ値出力部と、前記機関制御部と、を備え、前記サーバは、前記学習部と、前記学習率調整部と、を備え、前記電子制御ユニットは、前記教師データを前記サーバに送信し、前記学習率調整部は、前記教師データに含まれる前記入力パラメータの実測値及び前記出力パラメータの実測値に重畳する前記ノイズの量に基づいて前記学習率を調整し、前記学習部は、前記電子制御ユニットから受信した前記教師データを用いて前記学習モデルの学習を行い、前記学習後の学習モデルを前記電子制御ユニットに送信し、前記パラメータ値出力部は、前記学習部から前記電子制御ユニットに送信された前記学習後の学習モデルを用いる、上記(1)乃至(4)のいずれか1つに記載の内燃機関の制御装置。
(7)学習モデルを用いて、車両の内燃機関の運転を制御する内燃機関の制御方法であって、前記学習モデルの入力パラメータ及び前記学習モデルの出力パラメータのうち少なくともいずれか1つのパラメータの実測値に重畳されたノイズの量が相対的に大きい場合には、そのパラメータの実測値に重畳された前記ノイズの量が相対的に小さい場合に比べて、小さくなるように学習率を調整するステップと、前記入力パラメータの実測値と前記出力パラメータの実測値との組を教師データとして、前記調整された学習率を用いて勾配法により前記学習モデルの学習を行うステップと、前記入力パラメータの実測値が入力されると、前記学習モデルを用いて、前記出力パラメータの予測値を出力するステップと、前記出力された出力パラメータの予測値に基づいて、前記内燃機関を制御するステップと、をプロセッサに実行させる、内燃機関の制御方法。
(8)入力パラメータの実測値が入力されると、内燃機関の制御に用いられる出力パラメータの予測値を出力するよう、プロセッサを機能させる学習モデルであって、前記学習モデルは、前記入力パラメータの実測値と出力パラメータの実測値との組を教師データとして勾配法により学習され、前記学習では、前記入力パラメータ及び前記出力パラメータのうち少なくともいずれか1つのパラメータの実測値に重畳されたノイズの量が相対的に大きい場合には、そのパラメータの実測値に重畳された前記ノイズの量が相対的に小さい場合に比べて、小さい学習率となるように調整された学習率が用いられる、内燃機関を制御するための学習モデル。
(9)入力パラメータの実測値が入力されると、内燃機関の制御に用いられる出力パラメータの予測値を出力するよう、プロセッサを機能させる学習モデルの学習方法であって、前記学習モデルは、前記入力パラメータの実測値と出力パラメータの実測値との組を教師データとして勾配法により学習され、前記学習では、前記入力パラメータ及び前記出力パラメータのうち少なくともいずれか1つのパラメータの実測値に重畳されたノイズの量が相対的に大きい場合には、そのパラメータの実測値に重畳された前記ノイズの量が相対的に小さい場合に比べて、小さい学習率となるように調整された学習率が用いられる、内燃機関を制御するための学習モデルの学習方法。
本開示によれば、教師データにノイズが重畳された場合であっても、学習モデルの学習においてそのノイズが与える影響を抑制することができる。
図1は、本開示の第1の実施形態に係る内燃機関及び内燃機関を制御する電子制御ユニットの概略構成図である。 図2は、ニューラルネットワークの一例を示す図である。 図3は、任意の一つの重みと誤差関数E(w)との関係の一例を示す図である。 図4は、第1の実施形態に係る学習モデルにおけるニューラルネットワークの具体例を示す図である。 図5は、教師データにノイズが重畳された場合における、任意の一つの重みと誤差関数E(w)との関係の一例を示す図である。 図6は、第1の実施形態に係る学習モデルの学習処理の制御ルーチンを説明するためのフローチャートである。 図7は、ノイズ重畳の有無及び学習率の調整による学習結果の変化例について説明するための図である。 図8は、変形例に係る学習モデルの学習処理の制御ルーチンを説明するためのフローチャートである。 図9は、第2の実施形態に係る内燃機関の制御装置の概略構成図である。
以下、図面を参照して本開示の実施形態について詳細に説明する。なお、以下の説明では、同様な構成要素には同一の参照番号を付す。
<第1の実施形態>
≪内燃機関の構成≫
図1は、第1の実施形態に係る内燃機関及び内燃機関を制御する電子制御ユニット(ECU)の概略構成図である。図1には、機関本体1と、吸気マニホルド4と、排気マニホルド5とを備えた内燃機関100が示されている。図1に示されるように、機関本体1は、各気筒の燃焼室2内に燃料を供給する燃料噴射弁3を備える。吸気マニホルド4は吸気ダクト6を介して排気ターボチャージャ7のコンプレッサ7aの出口に連結され、コンプレッサ7aの入口はエアクリーナ9に連結される。吸気ダクト6内にはスロットルアクチュエータ10により開閉駆動されるスロットル弁11が配置され、吸気ダクト6周りには吸気ダクト6内を流れる吸入空気を冷却するためのインタクーラ12が配置される。
一方、排気マニホルド5は排気ターボチャージャ7の排気タービン7bの入口に連結され、排気タービン7bの出口は排気管13を介して排気浄化用触媒コンバータ14に連結される。図1に示される例では、この排気浄化用触媒コンバータ14内に、上流側から順に、酸化触媒15とパティキュレートフィルタ16とが収容されている。排気マニホルド5と吸気マニホルド4とは排気ガス再循環(以下、「EGR」という)通路17を介して互いに連結され、EGR通路17内にはEGR制御弁18が配置される。更に、EGR通路17内にはEGR通路17内を流れるEGRガスを冷却するためのEGRクーラ19が配置される。各燃料噴射弁3は燃料供給管20を介してコモンレール21に連結され、このコモンレール21は燃料ポンプ22を介して燃料タンク23に連結される。
図1に示されるように、吸気マニホルド4には、吸気マニホルド4内の吸気温を検出するための吸気温センサ24が配置され、排気マニホルド5には、排気マニホルド5内の排気温を検出するための排気温センサ25が配置されている。吸気管8には、吸気管8内を流れる空気の流量を検出するエアフローメータ8aが配置されている。また、機関本体1には、機関冷却水の温度(以下、単に「水温」という)を検出するための水温センサ26と、機関本体1の摩擦摺動部を潤滑する潤滑油の温度(以下、単に「油温」という)を検出する油温センサ27と、が配置されている。
スロットルアクチュエータ10には、スロットル弁11の開度(以下、「スロットル開度」という)を検出するためのスロットル開度センサ10aが配置されている。EGR制御弁18には、EGR制御弁18の開度(以下、「EGR弁開度」という)を検出するためのEGR弁開度センサ18aが配置されている。
排気管13内には、排気ガス中の気体濃度を検出するための気体濃度センサ28及び排気ガスの空燃比を検出するための空燃比センサ29がそれぞれ配置されている。気体濃度センサ28は、例えば、排気ガス中のNOx濃度を検出するNOxセンサとすることができる。気体濃度センサ28として、NOxセンサの他にも、学習モデル及び後述する学習モデルで用いられるパラメータに応じて、例えば、排気ガス中のHC濃度、CO濃度、CO2濃度をそれぞれ検出するHCセンサ、COセンサ、CO2センサ等、これらセンサを適宜用いることができる。
≪ECUの構成≫
電子制御ユニット(ECU)200は、双方性バス201によって互いに接続された記憶部210、制御部220、入力ポート230及び出力ポート240を備える。
記憶部210は、例えばROM(リードオンリメモリ)やRAM(ランダムアクセスメモリ)等を含むことができる。記憶部210は、制御部220による処理に用いられる各種のプログラムや学習モデル、各種のデータ(例えば、各種パラメータ、教師データ、及び各種閾値など)を記憶する。
制御部220は、例えばCPU及びその周辺回路等を有するプロセッサとすることができる。制御部220は、記憶部210に記憶された各種のプログラムを実行することにより車両の各種制御を実行することができる。
図1に示されるように、制御部220は、制御部220のプロセッサ上で実行されるプログラムにより実装される複数の機能モジュールを含む。具体的には、制御部220は、機能モジュールとして、パラメータ値出力部221と、機関制御部222と、学習部223と、ノイズ量検出部224と、学習率調整部225と、を含む。
入力ポート230には、エアフローメータ8a、スロットル開度センサ10a、EGR弁開度センサ18a、吸気温センサ24、排気温センサ25、水温センサ26、油温センサ27、気体濃度センサ28空燃比センサ29、内燃機関100の出力トルク(以下、「トルク」という)を検出するトルクセンサ51及びノッキングの有無を検出するノッキングセンサ52などの出力信号が、対応する各AD変換器231を介して入力される。また、入力ポート230には、機関負荷を検出するための信号として、アクセルペダル53の踏み込み量に比例した出力電圧を発生する負荷センサ53aの出力電圧が、対応するAD変換器231を介して入力される。また、入力ポート230には、機関回転速度などを算出するための信号として、クランクシャフトが例えば15°回転する毎に出力パルスを発生するクランク角センサ54の出力信号が入力される。このように、入力ポート230には、内燃機関100を制御するために必要な各種センサの出力信号が入力される。
出力ポート240は、対応する駆動回路241を介して、燃料噴射弁3、スロットルアクチュエータ10、EGR制御弁18及び燃料ポンプ22などの各制御部品に電気的に接続されている。
ECU200は、入力ポート230に入力された各種センサの出力信号に基づいて、各制御部品を制御するための制御信号を出力ポート240から出力して内燃機関100を制御する。したがって、本実施形態では、ECU200は、内燃機関100の制御装置として機能する。
≪ニューラルネットワークの概要≫
本実施形態では、学習モデルは、ニューラルネットワークを用いる。まず、図2を参照して、本実施形態に係る学習モデルにおいて用いられるニューラルネットワークについて説明する。図2は、ニューラルネットワークの一例を示す。図2における丸印は、人工ニューロンを表している。ニューラルネットワークにおいては、この人工ニューロンは、通常、ノード又はユニットと称される(以下、「ノード」という)。図2において、L=1は入力層、L=2およびL=3は隠れ層、L=4は出力層を各々示す。また、図2において、x1およびx2は入力層(L=1)のノード及びそのノードからの出力値を示し、yは出力層(L=4)の各ノード及びそのノードからの出力値を示す。同様に、隠れ層(L=2)のz1、z2およびz3は隠れ層(L=2)の各ノードからの出力値を示し、隠れ層(L=3)のz1およびz2は隠れ層(L=3)の各ノードからの出力値を示す。なお、隠れ層の層数は、1個又は任意の個数とすることができ、入力層のノードの数および隠れ層のノードの数も任意の個数とすることができる。なお、本実施形態では、出力層のノードの数は1個とされている。
入力層の各ノードでは、入力がそのまま出力される。一方、隠れ層(L=2)の各ノードには、入力層の各ノードの出力値x1およびx2が入力される。隠れ層(L=2)の各ノードでは、各々対応する重みwおよびバイアスbを用いて総入力値uが算出される。例えば、図2において隠れ層(L=2)のzk(k=1,2,3)で示されるノードにおいて算出される総入力値ukは、次式のようになる(Mは入力層のノードの数)。
次いで、この総入力値ukは、活性化関数fにより変換され、隠れ層(L=2)のzkで示されるノードから、出力値zk(=f(uk))として出力される。一方、隠れ層(L=3)の各ノードには、隠れ層(L=2)の各ノードの出力値z1、z2およびz3が入力される。隠れ層(L=3)の各ノードでは、各々対応する重みwおよびバイアスbを用いて総入力値u(Σz・w+b)が算出される。この総入力値uは、同様に活性化関数fにより変換され、隠れ層(L=3)の各ノードから、出力値z1、z2として出力される。なお、本実施形態では、この活性化関数としてシグモイド関数σが用いられている。
一方、出力層(L=4)のノードには、隠れ層(L=3)の各ノードの出力値z1およびz2が入力される。出力層のノードでは、各々対応する重みwおよびバイアスbを用いて総入力値u(Σz・w+b)が算出されるか、又は、各々対応する重みwのみを用いて総入力値u(Σz・w)が算出される。本実施形態では、出力層のノードでは活性化関数として恒等関数が用いられており、したがって、出力層のノードからは、出力層のノードにおいて算出された総入力値uが、そのまま出力値yとして出力される。
≪ニューラルネットワークにおける学習≫
本実施形態では、勾配法、特に勾配降下法を用いて、学習モデルのニューラルネットワークにおける重みやバイアスの学習が行われる。この勾配降下法は周知であり、したがって、勾配降下法についてはその概要を以下に簡単に説明する。なお、バイアスbは重みwの一種なので、以下の説明では、バイアスbは重みwの一つとしている。また、重みやバイアスの学習は学習部223において行われる。
勾配降下法では、ニューラルネットワークにおける重みwの値の学習は、誤差関数E(w)についての勾配∂E(w)/∂wを用いて、E(w)の値を減少させるように行われる。具体的には、勾配降下法では、T回目(Tは1以上の任意の整数)の更新後の重みw(T)が以下の(1)式により算出され、斯かる更新を繰り返すことによって重みの学習が行われる。
(T)=w(T-1)−η(∂E(w(T-1))/∂w(T-1)) (1)
(1)式のηは、学習率であり、学習における重みwの更新量を調整するためのものである。学習率ηは、学習に伴って繰り返し更新されることのないハイパーパラメータである。(1)式からわかるように、w(T-1)からw(T)への重みの更新量は、E(w(T-1))の勾配の絶対値及び学習率ηに比例する。学習率が小さいと、すなわち1回の更新における重みwの更新量が小さいと、学習が収束しやすくなるが、学習が収束するまでに要する重みの更新回数が多くなるため、学習に時間がかかってしまう。一方で、学習率が大きすぎると、学習が収束しにくくなり、さらには学習が発散してしまう虞がある。学習率ηを適切に設定することができれば、より少ない重みwの更新回数により、すなわちより短時間の学習により、E(w)が最小値を取るときの重みwの値を求めることが可能となる。
図3を用いて、勾配降下法について説明する。図3は、任意の一つの重みと誤差関数E(w)との関係の一例を示す図である。なお、図3では重みとE(w)との具体的な関係を便宜上示しているが、実際の学習では、斯かる具体的な関係は不明である。ただし、学習中には現在の重みwにおけるE(w)の値が得られる他、後述する誤差逆伝搬法等により勾配∂E(w)/∂wが得られる。勾配降下法では、勾配∂E(w)/∂wの情報を用いてE(w)が最小値を取るときの重みwが求められる。
図3には、学習によって重みwを繰り返し更新したときの重みwが変化していく様子を示している。図3に示した例では、重みの初期値がw(0)となっている。そして、図3に示されるように、1回目の更新では、勾配∂E(w(0))/∂w(0)の方向は正の方向であるため、重みは(1)式に基づいてw(0)からw(1)へと負の方向に更新される。図3に示されるように、2回目の更新では、勾配∂E(w(1))/∂w(1)の方向は負の方向であるため、重みは(1)式に基づいてw(1)からw(2)へと正の方向に更新される。その後、(1)式に基づいて、w(2)からw(3)、w(3)からw(4)、w(4)からw(5)へと斯かる重みの更新が繰り返される。図3に示される例では、更新を繰り返す毎に、E(w)の勾配の絶対値が小さくなっているため、重みwの更新量も小さくなる。その結果、重みwは、E(w)が最小値を取るときの重みwminに向けて収束する。T回目(予め設定された任意の回数)の重みw(T)の更新が行われると、学習が終了する。斯かる学習により、E(w)が小さくなるように重みwが更新される結果、学習モデルにおける予測誤差を小さくすることが可能となる。
次に、上記式(1)で用いられる勾配∂E(w)/∂wの算出方法について説明する。本実施形態では、勾配∂E(w)/∂wは、誤差逆伝播法を用いて算出される。この誤差逆伝播法も周知であり、したがって、誤差逆伝播法についてもその概要を以下に簡単に説明する。
さて、図2に示されるようなニューラルネットワークにおいて、L=2、L=3又はL=4の各層のノードへの入力値u(L)における重みをw(L)と表すと、誤差関数Eの重みw(L)による偏微分、即ち、勾配∂E/∂w(L)は、次の(2)式で示される。
ここで、z(L-1)・∂w(L)=∂u(L)であるので、(∂E/∂u(L))=δ(L)とすると、上記(2)式は、次の(3)式で表すことができる。
ここで、u(L)が変動すると、次の層の総入力値u(L+1)の変化を通じて誤差関数Eの変動を引き起こすので、δ(L)は、次の(4)式で表すことができる(KはL+1層におけるノードの数)。
ここで、z(L)=f(u(L))と表すと、上記(4)式の右辺に現れる入力値uk (L+1)は、次の(5)式で表すことができる。
ここで、上記(4)式の右辺第1項(∂E/∂u(L+1))はδ(L+1)である。上記(4)式の右辺第2項(∂uk (L+1)/∂u(L))は、上記(5)式より、次の(6)式で表すことができる。
したがって、δ(L)は、上記(4)乃至(6)式より、次の(7)式で表すことができる。
即ち、δ(L+1)が求まると、δ(L)を求めることができる。
さて、或る入力値x及びその入力値xに対する正解データtを含む教師データが求められており、この入力値xに対する出力層からの出力値がyであった場合、誤差関数として二乗誤差が用いられている場合には、二乗誤差Eは、E=(y−t)2/2で求められる。図2に示される出力層(L=4)のノードでは、出力値y=f(u(L))となるため、この場合には、出力層(L=4)のノードにおけるδ(L)の値は、次の(8)式で示される。
ところで、本実施形態では、前述したように、f(u(L))は恒等関数であるため、f’(u(Ll))=1となる。したがって、δ(L)=y−tとなり、δ(L)を求めることができる。
δ(L)が求まると、上記(7)式を用いて前層のδ(L-1)を求めることができる。このようにして順次、前層のδが求められ、これらδの値を用いて、上記(3)式から、各重みwについて誤差関数Eの偏微分、即ち、勾配∂E/∂w(L)を求めることができる。
≪学習モデルの概要≫
本実施形態における学習モデルの概要について説明する。まず、本実施形態における学習モデルで用いられる入力パラメータの一例を説明する。本実施形態における学習モデルの入力パラメータは、点火時期、燃料噴射量、燃料噴射時期、内燃機関の吸気弁の開閉タイミング及び排気弁の開閉タイミング、スロットル開度、EGR弁開度、吸気温、水温、油温並びに機関回転速度のうち、2つ以上を含むことができる。
次に、各入力パラメータの実測値の取得方法の一例を説明する。点火時期、燃焼噴射量、燃料噴射時期、並びに内燃機関の吸気弁の開閉タイミング及び排気弁の開閉タイミングは、それぞれ、ECU200の指令値から取得される。スロットル開度、EGR弁開度、水温、吸気温及び油温は、それぞれ、スロットル開度センサ10a、EGR弁開度センサ18a、吸気温センサ24、水温センサ26及び油温センサ27の出力値から取得される。機関回転速度は、クランク角センサ54の出力信号に基づくECU200の算出値から取得される。
次に、本実施形態における学習モデルで用いられる出力パラメータの一例を説明する。本実施形態における学習モデルの出力パラメータは、排気温、排気ガス中のNOx濃度、HC濃度、CO濃度及びCO2濃度、排気ガスの空燃比、内燃機関100の出力トルク並びにノッキング判定値のうち、少なくとも1つを含むことができる。
図4は、本実施形態に係る学習モデルにおけるニューラルネットワークの具体例を示す。図4に示される学習モデルにおけるニューラルネットワークは、点火時期、燃料噴射量、スロットル開度、機関回転速度を入力パラメータとし、トルクを出力パラメータとしている。本実施形態では、学習モデルのニューラルネットワークはP層(Pは3以上の任意の整数)で構成され、各隠れ層におけるノードの数は任意の個数とすることができる。また、図4に示される学習モデルにおけるニューラルネットワークにおいては、入力層(L=1)は、4つの入力パラメータに対応して4個のノードを有しているが、入力パラメータの数に応じて4以外の任意の個数のノードを有していてもよい。
≪学習モデルを用いた制御及び学習の概要≫
内燃機関の運転時には、パラメータ値出力部221に、入力パラメータの実測値、すなわち点火時期、燃料噴射量、スロットル開度、機関回転速度の実測値が入力される。パラメータ値出力部221は、これら入力パラメータの実測値が入力されると、図4に示される学習モデルを用いて、出力パラメータの予測値、すなわちトルクの予測値を出力する。ここで、トルクの予測値は将来の値となっており、トルクの予測値が出力されたときの現在のトルク(すなわち、トルクセンサ51によって検出されるトルク)とは異なる値となっている。
機関制御部222は、このようにしてパラメータ値出力部221から出力された出力トルクの予測値に基づいて、内燃機関100を制御する。具体的には、例えば、パラメータ値出力部221から出力されたトルクの予測値が、機関負荷等に基づいて設定された目標トルクとは異なる値になっていた場合に、トルクの予測値が目標トルクとなるように内燃機関100の制御パラメータ(例えば、スロットル開度、燃料噴射量、点火時期、等)の目標値が変更される。
一方、学習モデルの学習は、学習部223において行われる。学習部223は、学習モデルの入力パラメータの実測値と学習モデルの出力パラメータの実測値との組を教師データとして、上述したように勾配法を用いて学習モデルの学習を行う。入力パラメータの実測値は、パラメータ値出力部221に入力される場合と同様に取得される。また、出力パラメータとしてトルクを用いた場合、その実測値はトルクセンサ51の出力値から取得される。
≪教師データにノイズが重畳した場合の勾配降下法の問題点≫
ところで、学習モデルとして、メーカ等によって出荷前に代表的な車両に対して学習された標準的なモデルを用いた場合には、その学習モデルには各車両固有の特性が反映されていない。したがって、斯かる学習モデルを用いて出力パラメータの値を推定すると、斯かる学習モデルから出力された出力パラメータの予測値とその出力パラメータの実際の値との間には誤差が生じる可能性がある。
そこで、学習モデルにおける重みwに車両固有の特性を反映させて予測精度を向上させるべく、車両の運転中に取得した車両固有の教師データを用いて勾配降下法により重みwの学習を行うことが考えられる。ところが、この場合、この教師データにおける入力パラメータの実測値及び出力パラメータの実測値には、例えば走行環境や走行条件などの様々な要因によりノイズが重畳される。誤差関数Eは上述したように教師データを用いて算出されるため、教師データにノイズが重畳された場合、誤差関数Eはそのノイズの影響を受けることとなる。
図5は、教師データにノイズが重畳された場合における、任意の一つの重みと誤差関数E(w)の関係の一例を示す図である。図5に示す重みとE(w)との関係は、本来図3に示されたような関係を有するときに、教師データにノイズが重畳されたような場合の関係を示している。図5に示される例では、重みと誤差関数E(w)との関係は、教師データに重畳されたノイズの影響を受けた結果、図3に示される関係と比較して上下に波打つような形状を有している。
図5に示されるように、1回目の更新では、勾配∂E(w(0))/w(0)は正であるため、重みは(1)式に基づいてw(0)からw(1)へと負の方向に更新される。図5に示されるように、2回目の更新では、勾配∂E(w(1))/w(1)は正であるため、重みは(1)式に基づいてw(1)からw(2)へと負の方向に更新される。その後、(1)式に基づいて、w(2)からw(3)、w(3)からw(4)、w(4)からw(5)へと斯かる重みの更新が繰り返される。この場合、図5からわかるように、重みwは、E(w)が最小値を取るときの重みwminに収束せず、T回目の更新において重みw(T)はE(w)が最小値を取るときの重みwminから離れた値に収束している。
このように教師データにノイズが重畳された場合には、重みwは、E(w)が最小値を取るときの重みwminに収束しにくくなる。その結果、場合によっては、図5に示されるように、この学習により得らえた重みw(T)における誤差関数E(w(T))の値は、重みの初期値w(0)における誤差関数E(w(0))の値よりも大きくなる。このため、このようにして得られた重みw(T)を用いた場合、学習モデルにおける予測誤差が大きくなる可能性がある。特に、教師データにより大きなノイズが重畳された場合、そのノイズの影響が誤差関数E(w)に現れやすくなるため、このように学習の収束性が悪化する可能性及び予測誤差が増大する可能性がより高くなる。
一方で、教師データとしてバッチ又はミニバッチが用いられる場合には、教師データのバッチサイズを大きくすれば、データが平均化されて、学習モデルの学習においてそのノイズが与える影響が小さくなる。そのため、学習の収束性の悪化及び学習モデルの予測誤差の増大が抑制される。しかし、バッチサイズを大きくすることに伴い、メモリの容量を増大することが必要となるため、車両の製造コストが増大するという問題がある。
≪学習率の調整≫
そこで、本実施形態では、学習率調整部225は、学習モデルの入力パラメータ及び出力パラメータのうち少なくともいずれか1つのパラメータの実測値に重畳されたノイズの量が相対的に大きい場合には、そのパラメータの実測値に重畳されたノイズの量が相対的に小さい場合に比べて、小さい学習率で学習が行われるように学習率ηを調整する。これにより、教師データにノイズが重畳された場合に学習における重みwの更新量を小さくすることができるため、学習の収束性の悪化を抑制することが可能となる。そのため、学習後の学習モデルにおける予測誤差が増大することを抑制することが可能となる。このように、本実施形態によると、教師データにノイズが重畳された場合であっても、学習モデルの学習においてそのノイズが与える影響を抑制することができる。以下、本実施形態について詳細に説明する。
≪本実施形態に係る学習方法≫
次に、本実施形態に係る内燃機関の制御装置が実行する学習モデルの学習方法について説明する。図6は、第1の実施形態に係る内燃機関の制御装置における学習モデルの学習方法の制御ルーチンを説明するためのフローチャートである。本制御ルーチンのフローは、制御部220のプロセッサが、記憶部210に記憶されているプログラムを実行することにより実現される。本制御ルーチンは、内燃機関の運転中にニューラルネットワークにおける重みやバイアスを学習するのに必要な一連の教師データ(教師データのデータセット)が取得された後の所定のタイミングで実行される。
ステップS601では、ノイズ量検出部224が、学習部223で用いられる教師データにおける、入力パラメータの実測値及び出力パラメータの実測値に重畳されたノイズの量を検出する。ノイズ量検出部224は、入力パラメータ及び出力パラメータの全てについてその実測値に重畳されたノイズの量を検出してもよいし、そのうちの一部のパラメータについてその実測値に重畳されたノイズの量を検出するように構成されてもよい。本明細書では、「ノイズの量」は、各パラメータについて、真の値に対する車両に搭載されたセンサから出力された実測値の誤差に関連する量を表す。特に、ノイズの量は、真の値からセンサの実測値が乖離するほど大きくなる。
例えば、パラメータとして、機関回転速度を例にとって考える。車両が悪路を走行中に車両が大きく揺れると、クランク角センサ54の搭載位置が変化し、その結果、クランク角センサ54とクランクシャフトとの距離が変化する。このように距離が変化しているときにクランク角センサ54から出力されたクランク角の実測値は、そのクランク角センサ54の位置が変化していない場合におけるクランク角の実測値(真の値)とは乖離する。その結果、このときにクランク角センサ54の出力に基づいて算出された機関回転速度の実測値は真の値に対して誤差をもった値となる。このようにして両者の間に誤差が生じている状態は、ノイズの量が大きくなっている状態を意味する。
具体的には、「ノイズの量」として公知の様々な指標を用いることができる。例えば、機関運転状態が定常状態にあるときに検出された各パラメータの多数の実測値の標準偏差を各パラメータについてのノイズの量として用いることができる。また、機関運転状態が定常状態にあるときに検出された各パラメータの実測値に基づいて各パラメータについてのSN比の逆数を算出し各パラメータについてのSN比の逆数を各パラメータについてのノイズの量として用いることができる。
以下では、ノイズの量として、SN比の逆数を用いた場合を例にとって説明する。なお、SN比は、例えば、各パラメータの多数の実測値の平均値と標準偏差とに基づいて算出される。ステップS601においてノイズ量検出部224がノイズの量を検出した後、制御ルーチンは、ステップS602へと進む。
ステップS602では、学習率調整部225が、学習部223で学習が行われる際の学習率ηを調整する。学習率ηは、ノイズ量検出部224において検出されたノイズの量のうち少なくともいずれか1つのパラメータの実測値に重畳されたノイズの量が相対的に大きい場合には、そのパラメータの実測値に重畳されたノイズの量が相対的に小さい場合に比べて、小さい学習率で学習が行われるように調整される。
学習率調整部225は、例えば、ノイズ量検出部224において検出されたノイズの量のうち少なくともいずれか1つのパラメータの実測値に重畳されたノイズの量が大きいほど、学習率が小さくなるように学習率ηを調整する。上述したようにノイズの量としてSN比の逆数が用いられている場合、学習率調整部225は、ノイズ量検出部224において検出された機関回転速度及びトルクの各々のSN比が小さいほど、学習率が小さくなるように学習率ηを調整する。具体的には、本実施形態では、学習率調整部225は、以下の(9)式を用いて、学習率ηを調整することができる。
ここで、ηAは学習率の基準値である。ηBは学習率調整部225によって調整された後の学習率である。Jは学習モデルにおける入力パラメータ及び出力パラメータのうち学習率の調整に用いられるパラメータの総数である。上記(9)式では、例えば、そのパラメータにおける出力パラメータの予測値に対する影響が比較的大きいJ個のパラメータが適宜用いられる。SNj.Aは上記(9)式において用いられるJ個のパラメータのうちj番目のパラメータについて予め設定されたSN比の基準値である。SNj,Bは上記j番目のパラメータの実測値のSN比である。rjは、上記j番目のパラメータについて、ノイズの量の大きさを学習率の反映させる程度を表す予め設定された反映率である。
SN比の基準値SNj.Aは、一定値であってもよいし、機関運転状態毎に事前に設定されてもよい。機関運転状態毎に事前に設定される場合には、記憶部210には、機関運転状態とSN比の基準値SNj.Aとの相関マップが記憶される。学習率調整部225は、現在の機関運転状態(例えば、アイドリング状態である等)を取得すると共に、取得された機関運転状態に基づいて相関マップを用いてSN比の基準値SNj.Aを算出する。反映率rjは、例えば、出力パラメータの予測値に対して影響が比較的大きいパラメータは比較的小さい値に設定される等、そのパラメータにおける出力パラメータの予測値に対する影響を考慮して設定される。
ステップS602において学習率調整部225により学習率ηが調整された後、制御ルーチンは、ステップS603へと進む。
ステップS603では、学習部223が、入力パラメータの実測値と出力パラメータの実測値との組を教師データとして、学習率調整部225により調整された学習率ηを用いて、上述した勾配降下法により学習モデルの学習を行う。具体的には、学習部223は、ニューラルネットワークの各重みの更新を行う。その後、所定の学習終了条件が成立すると、学習部223は学習モデルの学習を終了する。ここで、所定の学習終了条件としては、例えば、最後の重みの更新前後での重みwの変化量が所定の値以下であることや、重みwの更新回数が所定の回数に達したこと等、が挙げられる。
以上により、本制御ルーチンは終了する。
≪学習結果の変化例の説明≫
図7を用いて、ノイズ重畳の有無及び学習率の調整による学習結果の変化例について説明する。図7(a)は、車両の内燃機関の回転速度を例示するタイムチャートである。図7(a)には、ノイズが重畳された場合(ノイズあり)の機関回転速度と、ノイズが重畳されていない場合(ノイズなし)の機関回転速度とが示されている。以下で説明する図7(b)及び図7(c)に示されるヒストグラムは、図7(a)に示されたように機関回転速度が推移した場合の予測誤差の分布を示している。
図7(b)及び図7(c)は、学習モデルにおける予測誤差の分布を示すヒストグラムである。図7(b)及び図7(c)には、図7(a)に示されるノイズありの機関回転速度を入力パラメータとして含む教師データを用いた場合のヒストグラム(ノイズあり)と、図7(a)に示されるノイズなしの機関回転速度を入力パラメータとして含む教師データを用いた場合のヒストグラム(ノイズなし)と、が示されている。図7(b)及び図7(c)のヒストグラムを作成する際には、図4に示される入力パラメータ及び出力パラメータ、すなわち入力パラメータとして点火時期、燃料噴射量、スロットル開度、機関回転速度を用い、出力パラメータとしてトルクを用いた。また、図7(b)及び図7(c)では、勾配降下法を用いた重みの学習を複数回行い、各学習が終了する毎に、出力パラメータであるトルクの予測誤差を算出することにより、各ヒストグラムが作成されている。なお、図7(b)のヒストグラムにおいて最も色が濃い部分は、ノイズありのヒストグラムとノイズなしのヒストグラムの重複部分を示している。
図7(b)は、学習率ηが0.1に設定されている場合のヒストグラムを示す。図7(b)に示されるように、ノイズありのヒストグラムの中央値は、ノイズなしのヒストグラムの中央値よりも、予測誤差が大きい側に分布している。したがって、学習率ηが0.1に設定されている場合、ノイズが重畳している教師データを用いて学習された学習モデルは、ノイズが重畳していない教師データを用いて学習された学習モデルよりも、予測精度が悪い。
一方、図7(c)は、学習率ηが0.08に設定されている場合のヒストグラムを示す。図7(c)に示されるノイズありのヒストグラムの中央値は、ノイズなしのヒストグラムの中央値とほぼ同様の位置に分布している。また、図7(c)に示されるノイズありのヒストグラムの中央値は、図7(b)に示されるノイズありのヒストグラムの中央値よりも、予測誤差が小さい側に分布している。以上より、ノイズの量が大きいときに学習率ηを小さくすることにより、予測誤差の悪化が抑制されていることがわかり、よって学習結果に対する教師データに重畳したノイズの影響が抑制されていることがわかる。
このように、本実施形態によると、教師データにノイズが重畳された場合であっても、学習モデルの学習においてそのノイズが与える影響を抑制することができる。
≪変形例≫
次に、図8を用いて、第1の実施形態の変形例に係る内燃機関の制御装置について説明する。図8は、本変形例に係る内燃機関の制御装置における学習モデルの学習方法の制御ルーチンを説明するためのフローチャートである。本制御ルーチンのフローは、制御部220のプロセッサが、記憶部210に記憶されているプログラムを実行することにより実現される。なお、ステップS801及びS805はそれぞれ図6のステップS601及びS603と同様であるため、説明を省略する。
ステップS802では、学習率調整部225は、ノイズ量検出部224において検出されたノイズの量がそのパラメータに対して設定された閾値以下であるか否かを判定する。この閾値は、予め設定された一定値であってもよいし、機関運転状態毎に事前に設定されてもよい。機関運転状態毎に事前に設定される場合には、記憶部210には、機関運転状態と閾値との相関マップが記憶されている。学習率調整部225は、現在の機関運転状態を取得すると共に、取得された機関運転状態に基づいて相関マップを用いて閾値を算出する。
ステップS802においてノイズの量の各々が閾値以下であると判定された場合、制御ルーチンはステップS803へと進む。ステップS803では、学習率調整部225は、ノイズの量のうち少なくともいずれか1つが上記閾値よりも大きい場合の学習率ηLよりも大きい一定の学習率ηHに維持されるように学習率ηを調整する。
ステップS802においてノイズの量のうち少なくともいずれか1つのパラメータの実測値に重畳されたノイズの量がその閾値より大きいと判定された場合、制御ルーチンはステップS804へと進む。ステップS804では、学習率調整部225は、ノイズの量の各々が閾値以下である場合の学習率ηHよりも小さい一定の学習率ηLに維持されるように学習率ηを調整する。
なお、本変形例では、ステップS804において、学習率調整部225は、学習率を一定の値に維持するように調整したが、これに限定されず、学習率調整部225は、ノイズの量に応じて学習率を変化させてもよい。この場合、学習率調整部225は、例えば、ノイズの量が上記閾値より大きいパラメータのみを用いて、上記(9)式に基づいて、学習率ηを調整する。
いずれにせよ、本変形例では、入力パラメータ及び出力パラメータのうち少なくともいずれか1つのパラメータに重畳されたノイズの量が所定の閾値よりも大きい場合には、そのパラメータに重畳されたノイズの量がこの閾値よりも小さい場合に比べて、学習率が小さく設定される。
また、本変形例では、ステップS801においてノイズの量を検出している。しかしながら、ノイズの量の大きい状態やノイズの量の小さい状態は、上述したような「ノイズの量」を求めることなく推定することができる。例えば、上述したように、車両が悪路を走行しているときには機関回転速度の実測値に重畳されるノイズの量は大きくなり、車両が舗装道路を走行しているときには機関回転速度の実測値に重畳されるノイズの量は小さくなる。したがって、車両が悪路を走行しているか否かに基づいて、機関回転速度の実測値に大きなノイズが重畳されているか否かを判定することができる。
したがって、この場合、ノイズの量が大きい状態であるとき(例えば、悪路を走行していることが検知されているとき)には、ノイズの量が小さい状態であるとき(例えば、舗装道路を走行していることが検知されているとき)に比べて、学習率が小さく設定されてもよい。
以上をまとめると、本実施形態及びその変形例では、入力パラメータ及び出力パラメータのうち少なくともいずれか1つのパラメータの実測値に重畳されたノイズの量が相対的に大きい場合には、そのパラメータの実測値に重畳されたノイズの量が相対的に小さい場合に比べて、学習率が小さくなるように学習率が調整されているといえる。
<第2の実施形態>
図9は、第2の実施形態に係る内燃機関の制御装置の概略構成図である。図9には、車両310と、車両310の外部に設置されたサーバ320と、が示されている。図9に示されるように、車両310は、通信部311と、ECU312と、を備える。ECU312は、学習部223及び学習率調整部225を含まない点を除いて、第1の実施形態に係るECU200と同様の構成を有する。本実施形態では、車両310のECU200及びサーバ320は、内燃機関100の制御装置として機能する。以下では、第1の実施形態に係る内燃機関の制御装置の構成と異なる部分を中心に説明する。
本実施形態では、車両310のECU312は、学習モデルの入力パラメータの実測値と学習モデルの出力パラメータの実測値との組を教師データとして取得する。ECU312のノイズ量検出部224は、ECU312で取得された教師データにおいて、入力パラメータの実測値及び出力パラメータの実測値に重畳されたノイズの量を検出する。車両310のECU312は、教師データ及びそのノイズの量を通信部311を介してサーバ320に送信する。
また、図9に示されるように、サーバ320は、通信部321と、パラメータ値取得部322と、学習率調整部323と、学習部324と、を備える。サーバ320の通信部321は、車両310の通信部311と通信可能に構成されている。
サーバ320のパラメータ値取得部322は、車両310の通信部311から送信された教師データ及びそのノイズの量を通信部321を介して受信する。サーバ320の学習率調整部323は、ノイズ量検出部224において検出されたノイズの量のうち少なくともいずれか1つのパラメータの実測値に重畳されたノイズの量が相対的に大きい場合には、そのパラメータの実測値に重畳されたノイズの量が相対的に小さい場合に比べて、小さい学習率で学習部324による学習が行われるように学習率ηを調整する。学習部324は、教師データに基づいて、学習率調整部323によって調整された学習率ηを用いて、勾配降下法により学習モデルにおけるニューラルネットワークの重みの学習を行う。次いで、学習部324は、その学習後の学習モデルを通信部321を介して車両310に送信する。
車両310のECU312は、通信部311を介してサーバ320から送信された学習後の学習モデルを受信する。車両310のECU312は、ECU312の記憶部210に記憶された学習モデルをその受信した学習後の学習モデルで書き換えることにより、学習モデルにおけるニューラルネットワークの重みを更新する。車両310のECU312のパラメータ値出力部221は、入力パラメータの実測値が入力されると、更新後の学習モデルを用いて、出力パラメータの予測値を出力する。車両310のECU312の機関制御部222は、更新後の学習モデルから出力された出力パラメータの予測値に基づいて、内燃機関100を制御する。
なお、本実施形態では、ノイズ量検出部224は、ECU312に設けられているが、これに限定されず、サーバ320に設けられてもよい。この場合、サーバ320のノイズ量検出部224は、車両310のECU312から送信された教師データに基づいて、入力パラメータ及び出力パラメータの実測値に重畳されたノイズの量を検出することができる。
本実施形態によると、サーバ320において学習モデルのニューラルネットワークの重みやバイアスが学習される。そのため、車両310のECU312に、学習モデルにおけるニューラルネットワークの重みの学習を行うための高性能な演算処理装置を設ける必要がなくなる。その結果、車両の製造コストを低減させることができる。
なお、上記実施形態では、勾配法として勾配降下法を用いたが、これに限定されず、勾配上昇法を用いて、誤差関数Eの符号を反転させた関数E’=−Eの最大値を求めるように学習モデルの学習を行ってもよい。また、上記実施形態では、学習モデルとしてニューラルネットワークを用いたものを例に説明したが、勾配法を用いるものであれば他の機械学習モデルを用いてもよい。さらに、上述した各パラメータの実測値の取得方法はあくまで一例であり、各パラメータの実測値は他の方法によっても取得することもできる。
1 機関本体
10a スロットル開度センサ
18a EGR弁開度センサ
24 吸気温センサ
25 排気温センサ
26 水温センサ
27 油温センサ
28 気体濃度センサ
29 空燃比センサ
100 内燃機関

Claims (9)

  1. 車両の内燃機関の運転を制御する内燃機関の制御装置であって、
    入力パラメータの実測値が入力されると、学習モデルを用いて、出力パラメータの予測値を出力するパラメータ値出力部と、
    前記パラメータ値出力部から出力された前記出力パラメータの予測値に基づいて、前記内燃機関を制御する機関制御部と、
    前記学習モデルの入力パラメータの実測値と前記学習モデルの出力パラメータの実測値との組を教師データとして、勾配法を用いて前記学習モデルの学習を行う学習部と、
    前記入力パラメータ及び前記出力パラメータのうち少なくともいずれか1つのパラメータの実測値に重畳されたノイズの量が相対的に大きい場合には、そのパラメータの実測値に重畳された前記ノイズの量が相対的に小さい場合に比べて、小さい学習率で前記学習が行われるように前記学習率を調整する学習率調整部と、
    を備えた、内燃機関の制御装置。
  2. 前記入力パラメータの実測値及び前記出力パラメータの実測値に重畳された前記ノイズの量を検出するノイズ量検出部をさらに備え、
    前記ノイズ量検出部は、機関運転状態が定常状態にあるときに検出された前記入力パラメータ及び前記出力パラメータの前記実測値に基づいて各パラメータについての標準偏差又はSN比の逆数を算出し、各パラメータについての前記標準偏差又は前記SN比の逆数を各パラメータについての前記ノイズの量として用いる、請求項1に記載の内燃機関の制御装置。
  3. 前記学習率調整部は、前記少なくともいずれか1つのパラメータの実測値に重畳された前記ノイズの量が大きいほど、学習率が小さくなるように前記学習率を調整する、請求項1又は2に記載の内燃機関の制御装置。
  4. 前記学習率調整部は、前記入力パラメータ及び前記出力パラメータの各々の実測値に重畳された前記ノイズの量がそのパラメータに対して設定された閾値以下である場合には、前記少なくともいずれか1つのパラメータの実測値に重畳された前記ノイズの量が前記閾値よりも大きい場合の学習率よりも大きい一定の学習率に維持されるように前記学習率を調整する、請求項1乃至3のいずれか一項に記載の内燃機関の制御装置。
  5. 前記内燃機関の制御装置は、前記車両に設けられた電子制御ユニットである、請求項1乃至4のいずれか一項に記載の内燃機関の制御装置。
  6. 前記内燃機関の制御装置は、前記車両に設けられた電子制御ユニットと、前記車両の外部に設置されて前記電子制御ユニットと通信可能に構成されたサーバと、を備え、
    前記電子制御ユニットは、前記パラメータ値出力部と、前記機関制御部と、を備え、
    前記サーバは、前記学習部と、前記学習率調整部と、を備え、
    前記電子制御ユニットは、前記教師データを前記サーバに送信し、
    前記学習率調整部は、前記教師データに含まれる前記入力パラメータの実測値及び前記出力パラメータの実測値に重畳する前記ノイズの量に基づいて前記学習率を調整し、
    前記学習部は、前記電子制御ユニットから受信した前記教師データを用いて前記学習モデルの学習を行い、前記学習後の学習モデルを前記電子制御ユニットに送信し、
    前記パラメータ値出力部は、前記学習部から前記電子制御ユニットに送信された前記学習後の学習モデルを用いる、請求項1乃至4のいずれか一項に記載の内燃機関の制御装置。
  7. 学習モデルを用いて、車両の内燃機関の運転を制御する内燃機関の制御方法であって、
    前記学習モデルの入力パラメータ及び前記学習モデルの出力パラメータのうち少なくともいずれか1つのパラメータの実測値に重畳されたノイズの量が相対的に大きい場合には、そのパラメータの実測値に重畳された前記ノイズの量が相対的に小さい場合に比べて、小さくなるように学習率を調整するステップと、
    前記入力パラメータの実測値と前記出力パラメータの実測値との組を教師データとして、前記調整された学習率を用いて勾配法により前記学習モデルの学習を行うステップと、
    前記入力パラメータの実測値が入力されると、前記学習モデルを用いて、前記出力パラメータの予測値を出力するステップと、
    前記出力された出力パラメータの予測値に基づいて、前記内燃機関を制御するステップと、
    をプロセッサに実行させる、内燃機関の制御方法。
  8. 入力パラメータの実測値が入力されると、内燃機関の制御に用いられる出力パラメータの予測値を出力するよう、プロセッサを機能させる学習モデルであって、
    前記学習モデルは、前記入力パラメータの実測値と出力パラメータの実測値との組を教師データとして勾配法により学習され、
    前記学習では、前記入力パラメータ及び前記出力パラメータのうち少なくともいずれか1つのパラメータの実測値に重畳されたノイズの量が相対的に大きい場合には、そのパラメータの実測値に重畳された前記ノイズの量が相対的に小さい場合に比べて、小さい学習率となるように調整された学習率が用いられる、内燃機関を制御するための学習モデル。
  9. 入力パラメータの実測値が入力されると、内燃機関の制御に用いられる出力パラメータの予測値を出力するよう、プロセッサを機能させる学習モデルの学習方法であって、
    前記学習モデルは、前記入力パラメータの実測値と出力パラメータの実測値との組を教師データとして勾配法により学習され、
    前記学習では、前記入力パラメータ及び前記出力パラメータのうち少なくともいずれか1つのパラメータの実測値に重畳されたノイズの量が相対的に大きい場合には、そのパラメータの実測値に重畳された前記ノイズの量が相対的に小さい場合に比べて、小さい学習率となるように調整された学習率が用いられる、内燃機関を制御するための学習モデルの学習方法。
JP2018196035A 2018-10-17 2018-10-17 内燃機関の制御装置及びその制御方法、並びに内燃機関を制御するための学習モデル及びその学習方法 Expired - Fee Related JP6699702B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018196035A JP6699702B2 (ja) 2018-10-17 2018-10-17 内燃機関の制御装置及びその制御方法、並びに内燃機関を制御するための学習モデル及びその学習方法
US16/566,019 US10947909B2 (en) 2018-10-17 2019-09-10 Control device of internal combustion engine and control method of same and learning model for controlling internal combustion engine and learning method of same
DE102019124267.3A DE102019124267A1 (de) 2018-10-17 2019-09-10 Steuerungsvorrichtung einer Brennkraftmaschine und Steuerungsverfahren derselben sowie Lernmodell zur Steuerung einer Brennkraftmaschine und Lernverfahren desselben

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018196035A JP6699702B2 (ja) 2018-10-17 2018-10-17 内燃機関の制御装置及びその制御方法、並びに内燃機関を制御するための学習モデル及びその学習方法

Publications (2)

Publication Number Publication Date
JP2020063699A true JP2020063699A (ja) 2020-04-23
JP6699702B2 JP6699702B2 (ja) 2020-05-27

Family

ID=70279440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018196035A Expired - Fee Related JP6699702B2 (ja) 2018-10-17 2018-10-17 内燃機関の制御装置及びその制御方法、並びに内燃機関を制御するための学習モデル及びその学習方法

Country Status (3)

Country Link
US (1) US10947909B2 (ja)
JP (1) JP6699702B2 (ja)
DE (1) DE102019124267A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022063084A (ja) * 2020-10-09 2022-04-21 トヨタ自動車株式会社 モデル学習システム、車両の制御装置及びモデル学習方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6690757B1 (ja) * 2019-04-16 2020-04-28 トヨタ自動車株式会社 燃料蒸気排出防止システムの異常検出装置
CN112532330A (zh) * 2019-09-18 2021-03-19 中兴通讯股份有限公司 干扰模拟系统、方法及装置、干扰测试系统、方法及装置
CN116822325B (zh) * 2023-04-29 2023-12-26 中国人民解放军63963部队 一种总体构型约束下的柴油机性能优化设计方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014005803A (ja) * 2012-06-26 2014-01-16 Toyota Motor Corp 内燃機関の制御装置
WO2017183587A1 (ja) * 2016-04-18 2017-10-26 日本電信電話株式会社 学習装置、学習方法および学習プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7458348B2 (en) * 2005-03-28 2008-12-02 Hitachi, Ltd. Method and apparatus for controlling variable valve actuation device in internal combustion engine
CN101285431B (zh) * 2007-04-09 2010-04-14 山东申普汽车控制技术有限公司 组合脉谱对发动机控制的方法
US20110264353A1 (en) * 2010-04-22 2011-10-27 Atkinson Christopher M Model-based optimized engine control
JP5426520B2 (ja) 2010-11-24 2014-02-26 本田技研工業株式会社 内燃機関の制御装置
US9358685B2 (en) * 2014-02-03 2016-06-07 Brain Corporation Apparatus and methods for control of robot actions based on corrective user inputs
US10030602B2 (en) * 2014-07-22 2018-07-24 The Regents Of The University Of Michigan Adaptive machine learning method to predict and control engine combustion
DE112017007025T5 (de) * 2017-02-09 2019-10-24 Mitsubishi Electric Corporation Positionssteuerungseinrichtung und positionssteuerungsverfahren
US11397887B2 (en) * 2017-09-26 2022-07-26 Amazon Technologies, Inc. Dynamic tuning of training parameters for machine learning algorithms
CN107844338B (zh) * 2017-10-31 2019-09-13 Oppo广东移动通信有限公司 应用程序管控方法、装置、介质及电子设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014005803A (ja) * 2012-06-26 2014-01-16 Toyota Motor Corp 内燃機関の制御装置
WO2017183587A1 (ja) * 2016-04-18 2017-10-26 日本電信電話株式会社 学習装置、学習方法および学習プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022063084A (ja) * 2020-10-09 2022-04-21 トヨタ自動車株式会社 モデル学習システム、車両の制御装置及びモデル学習方法
JP7276298B2 (ja) 2020-10-09 2023-05-18 トヨタ自動車株式会社 モデル学習システム、車両の制御装置及びモデル学習方法

Also Published As

Publication number Publication date
US20200123990A1 (en) 2020-04-23
JP6699702B2 (ja) 2020-05-27
DE102019124267A1 (de) 2020-04-23
US10947909B2 (en) 2021-03-16

Similar Documents

Publication Publication Date Title
JP6477951B1 (ja) 車載電子制御ユニット
JP6699702B2 (ja) 内燃機関の制御装置及びその制御方法、並びに内燃機関を制御するための学習モデル及びその学習方法
JP6702380B2 (ja) 内燃機関の制御装置
JP6501018B1 (ja) 未燃燃料量の機械学習装置
JP4975158B2 (ja) プラントの制御装置
US6236908B1 (en) Virtual vehicle sensors based on neural networks trained using data generated by simulation models
JP6702390B2 (ja) 車両用駆動装置の制御装置、車載電子制御ユニット、学習済みモデル、機械学習システム、車両用駆動装置の制御方法、電子制御ユニットの製造方法及び出力パラメータ算出装置
US20200263618A1 (en) Pm amount estimation device, pm amount estimation system, pm amount estimating method, data analysis device, control device for internal combustion engine, and receiver
US10969304B2 (en) State detection system for internal combustion engine, data analysis device, and vehicle
CN110118130B (zh) 内燃机的控制装置
JP6741057B2 (ja) 内燃機関の制御システム、電子制御ユニット、サーバ及び内燃機関の制御方法
JP2007533911A (ja) 圧力関係の値用の個々の推量器を備える仮想シリンダ圧力センサ
CN111022206B (zh) 车辆用驱动装置的控制装置及方法、车载电子控制单元
JP6773099B2 (ja) 制御装置
FR3065990A1 (fr) Procede de reactualisation d’une dynamique d’adaptation d’une valeur de richesse a une consigne dans un moteur
Wang et al. A review of spark-ignition engine air charge estimation methods
JPH11343916A (ja) エンジン制御におけるデータ推定方法
JP6750708B1 (ja) 排気ガス再循環システムの異常検出装置
JP2020056378A (ja) 内燃機関の制御装置
CN116234978A (zh) 电子控制装置及发动机控制系统
US11035301B1 (en) Method for preventing engine air flow calculation error and engine system thereof
JP2020045821A (ja) 内燃機関の制御装置
JP2019148243A (ja) 内燃機関の制御装置
US11840974B2 (en) Intelligent mass air flow (MAF) prediction system with neural network
JP2019143477A (ja) 内燃機関の制御装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200131

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200131

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200217

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200331

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200413

R151 Written notification of patent or utility model registration

Ref document number: 6699702

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees