JP2021085335A - 内燃機関の制御装置 - Google Patents

内燃機関の制御装置 Download PDF

Info

Publication number
JP2021085335A
JP2021085335A JP2019212629A JP2019212629A JP2021085335A JP 2021085335 A JP2021085335 A JP 2021085335A JP 2019212629 A JP2019212629 A JP 2019212629A JP 2019212629 A JP2019212629 A JP 2019212629A JP 2021085335 A JP2021085335 A JP 2021085335A
Authority
JP
Japan
Prior art keywords
value
input
output
parameter
input parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019212629A
Other languages
English (en)
Inventor
真吾 前田
Shingo Maeda
真吾 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2019212629A priority Critical patent/JP2021085335A/ja
Publication of JP2021085335A publication Critical patent/JP2021085335A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Combined Controls Of Internal Combustion Engines (AREA)
  • Feedback Control In General (AREA)

Abstract

【課題】モデルの精度を向上することができる。【解決手段】内燃機関の制御装置において、入力パラメータと出力パラメータとの相関の高いほど選択されやすい重み付けがなされた報酬と、入力パラメータ間の相関が高いほど選択されにくい重み付けがなされた報酬と、入力パラメータの値の変化に対する出力パラメータの値の変化の応答遅れが大きいほど選択されにくい重み付けがなされた報酬とに基づいて、各入力パラメータの報酬が演算され、演算された報酬が選択基準を満たしている入力パラメータを学習用入力パラメータとして選定する。【選択図】図8

Description

本発明は内燃機関の制御装置に関する。
内燃機関において、機関回転数、燃料噴射量等の機関の運転状態を示す複数の入力パラメータの値に基づいてニューラルネットワークの重みを学習するようにした場合、これら入力パラメータの中に相関の度合の高い入力パラメータが存在すると、これら相関の度合の高い入力パラメータが、ニューラルネットワークの重みの学習時と異なる動きをしたとき、出力パラメータの推定値に誤差を生ずる。そこで、入力パラメータを選択するに当たり、入力パラメータと出力パラメータとの相関の高いほど選択されやすい重み付けがなされた報酬と、入力パラメータ間の相関が高いほど選択されにくい重み付けがなされた報酬とに基づいて、各入力パラメータの報酬が演算され、演算された報酬が選択基準を満たしている入力パラメータを学習用入力パラメータとして選定するようにした内燃機関の制御装置が公知である(例えば特許文献1を参照)。
特開2019−143477号公報
ところがこの場合、これら入力パラメータの中に、入力パラメータの値の変化に対する出力パラメータの値の変化の応答遅れが大きい入力パラメータが存在すると、これら入力パラメータに基づき、学習済みのニューラルネットワークを用いて、出力パラメータの値を推定したときに、出力パラメータの推定値に誤差を生ずるという問題がある。
上記問題を解決するために、本発明によれば、電子制御ユニットを具備しており、電子制御ユニットが、機関の運転状態を示す入力パラメータの値を取得するパラメータ値取得部と、入力層、隠れ層および出力層からなるニューラルネットワークを用いて演算を行う演算部と、記憶部とを具備しており、入力パラメータの値が入力層に入力され、出力パラメータの値を示す出力値が出力層から出力される内燃機関の制御装置において、入力パラメータと出力パラメータとの相関の高いほど選択されやすい重み付けがなされた報酬と、入力パラメータ間の相関が高いほど選択されにくい重み付けがなされた報酬と、入力パラメータの値の変化に対する出力パラメータの値の変化の応答遅れが大きいほど選択されにくい重み付けがなされた報酬とに基づいて、各入力パラメータの報酬が演算され、演算された報酬が選択基準を満たしている入力パラメータを学習用入力パラメータとして選定する。
入力パラメータの報酬の一つとして、入力パラメータの値の変化に対する出力パラメータの値の変化の応答遅れが大きいほど選択されにくい重み付けがなされた報酬を用いることによって、出力パラメータの推定値に誤差を生ずるのを抑制することができる。
図1は内燃機関の全体図である。 図2はニューラルネットワークの一例を示す図である。 図3は出力パラメータの推定値の誤差の発生を説明するための図である。 図4は出力パラメータの推定値の誤差の発生を説明するための図である。 図5はデータの取得ルーチンを示すフローチャートである。 図6は学習ルーチンを示すフローチャートである。 図7は学習ルーチンを示すフローチャートである。 図8Aおよび図8Bは報酬Qを示す図である。 図9は検証ルーチンを示すフローチャートである。 図10Aおよび図10Bは夫々、検証方法を説明するための図である。 図11Aおよび図11Bは本発明による誤差の抑制効果を示す図である。
<内燃機関の全体構成>
図1に内燃機関の全体図を示す。図1を参照すると、1は機関本体、2は各気筒の燃焼室、3は各気筒の燃焼室2内に配置された点火栓、4は各気筒に燃料、例えば、ガソリンを供給するための燃料噴射弁、5はサージタンク、6は吸気枝管、7は排気マニホルドを夫々示す。サージタンク5は吸気ダクト8を介して排気ターボチャージャ9のコンプレッサ9aの出口に連結され、コンプレッサ9aの入口は吸入空気量検出器10を介してエアクリーナ11に連結される。吸気ダクト8内にはアクチュエータ13により駆動されるスロットル弁12が配置され、吸気ダクト8周りには吸気ダクト8内を流れる吸入空気を冷却するためのインタクーラ14が配置される。
一方、排気マニホルド7は排気ターボチャージャ9の排気タービン9bの入口に連結され、排気タービン9bの出口は排気管15を介して排気浄化用触媒コンバータ16に連結される。排気マニホルド7とサージタンク5とは排気ガス再循環(以下、EGRと称す)通路17を介して互いに連結され、EGR通路17内には、EGR通路17内を流れるEGRガスを冷却するためのEGRクーラ18と、EGR制御弁19とが配置される。更に、EGR通路17には、クーラ18を迂回するEGRバイパス通路20が併設されており、EGR通路17内には、EGRガス流路をEGRバイパス通路20に切換えるための流路切換弁21が配置される。各燃料噴射弁4は燃料分配管22に連結され、この燃料分配管22は燃料ポンプ23を介して燃料タンク24に連結される。
図1に示されるように、吸気ダクト8内には過給圧を検出するための過給圧センサ25が配置されており、サージタンク5内にはサージタンク5内の吸気温を検出するための吸気温センサ26が配置されている。また、燃料分配管22内には燃料分配管22内の燃料圧を検出するための燃料圧センサ27が配置されており、排気管15内には排気ガス中のNOX濃度を検出するためのNOXセンサ28が配置されている。
電子制御ユニット30はデジタルコンピュータからなり、双方向性バス31によって互いに接続されたROM(リードオンリメモリ)32、RAM(ランダムアクセスメモリ)33、CPU(マイクロプロセッサ)34、入力ポート35および出力ポート36を具備する。入力ポート35には、吸入空気量検出器10、過給圧センサ25、吸気温センサ26、燃料圧センサ27およびNOXセンサ28の出力信号が、対応するAD変換器37を介して入力される。アクセルペダル40にはアクセルペダル40の踏込み量に比例した出力電圧を発生する負荷センサ41が接続され、負荷センサ41の出力電圧は対応するAD変換器37を介して入力ポート35に入力される。更に入力ポート35にはクランクシャフトが例えば30°回転する毎に出力パルスを発生するクランク角センサ42が接続される。CPU34内ではクランク角センサ42の出力信号に基づいて機関回転数が算出される。一方、出力ポート36は対応する駆動回路38を介して点火栓3、燃料噴射弁4、スロットル弁駆動用アクチュエータ13、EGR制御弁19、流路切換弁21および燃料ポンプ23に接続される。
<ニューラルネットワークの概要>
本発明による実施例では、ニューラルネットワークを用いて内燃機関の運転状態を示す値を推定するようにしている。図2はこのニューラルネットワークの一例を示している。図2における丸印は人工ニューロンを表しており、ニューラルネットワークにおいては、この人工ニューロンは、通常、ノード又はユニットと称される(本願では、ノードと称す)。図2においてL=1は入力層、L=2および L=3は隠れ層、L=4は出力層を夫々示している。また、図2において、xおよびx は入力層 ( L=1) の各ノードからの出力値を示しており、y は出力層 ( L=4) のノードからの出力値を示しており、z1、 およびz は隠れ層 ( L=2) の各ノードからの出力値を示しており、zおよびz は隠れ層 ( L=3) の各ノードからの出力値を示している。なお、隠れ層の層数は、1個又は任意の個数とすることができ、入力層のノードの数および隠れ層のノードの数も任意の個数とすることができる。なお、本発明による実施例では、出力層のノードの数は1個とされている。
入力層の各ノードに入力値xおよびxが入力され、入力層の各ノードからはそのまま出力される。一方、隠れ層 ( L=2) の各ノードには、入力層の各ノードの出力値xおよびx が入力され、隠れ層 ( L=2) の各ノードでは、夫々対応する重みwおよびバイアスbを用いて総入力値uが算出される。例えば、図2において隠れ層 ( L=2) のz(k=1,2,3)で示されるノードにおいて算出される総入力値uは、次式のようになる。
Figure 2021085335
次いで、この総入力値uは活性化関数fにより変換され、隠れ層 ( L=2) のzで示されるノードから、出力値z(= f (u)) として出力される。隠れ層 ( L=2) の他のノードについても同様である。一方、隠れ層 ( L=3) の各ノードには、隠れ層 ( L=2) の各ノードの出力値z1、 およびz が入力され、隠れ層 ( L=3 ) の各ノードでは、夫々対応する重みwおよびバイアスbを用いて総入力値u(Σz・w+b)が算出される。この総入力値uは同様に活性化関数により変換され、隠れ層 ( L=3 ) の各ノードから、出力値z 、z として出力される、なお、本発明による実施例では、この活性化関数としてシグモイド関数σが用いられている。
一方、出力層 ( L=4) のノードには、隠れ層 ( L=3) の各ノードの出力値z およびz が入力され、出力層 のノードでは、夫々対応する重みwおよびバイアスbを用いて総入力値u(Σz・w+b)が算出されるか、又は、夫々対応する重みwのみを用いて総入力値u(Σz・w)が算出される。本発明による実施例では、出力層のノードでは恒等関数が用いられており、従って、出力層のノードからは、出力層のノードにおいて算出された総入力値uが、そのまま出力値yとして出力される。
<ニューラルネットワークにおける学習>
一方、本発明による実施例では、誤差逆伝播法を用いて、ニューラルネットワーク内における各重みwの値およびバイアスbの値が学習される。この誤差逆伝播法は周知であり、従って、誤差逆伝播法についてはその概要を以下に簡単に説明する。なお、バイアスbは重みwの一種なので、以下の説明では、バイアスbは重みwの一つとされている。さて、図2に示すようなニューラルネットワークにおいて、L=2,L=3又は L=4の各層のノードへの入力値u(L)における重みをw(L)で表すと、誤差関数Eの重みw(L)による微分、即ち、勾配∂E/∂w(L)は、書き換えると、次式で示されるようになる。
Figure 2021085335
ここで、z(L−1)・∂w(L)= ∂u(L)であるので、(∂E/∂u(L))=δ(L)とすると、上記(1)式は、次式でもって表すことができる。
Figure 2021085335
ここで、u(L)が変動すると、次の層の総入力値u(L+1)の変化を通じて誤差関数Eの変動を引き起こすので、δ(L)は、次式で表すことができる。
Figure 2021085335
ここで、z(L)=f(u(L)) と表すと、上記(3)式の右辺に現れる入力値uk (L+1)は、次式で表すことができる。
Figure 2021085335
ここで、上記(3)式の右辺第1項(∂E/∂u(L+1))はδ(L+1)であり、上記(3)式の右辺第2項(∂u (L+1) /∂u(L))は、次式で表すことができる。
Figure 2021085335
従って、δ(L)は、次式で示される。
Figure 2021085335
即ち、δ(L+1)が求まると、δ(L)を求めることができることになる。
さて、或る入力値に対して教師データyが求められており、この入力値に対する出力層からの出力値がyであった場合、誤差関数として二乗誤差が用いられている場合には、二乗誤差Eは、E=1/2(y−y)で求められる。この場合、図2の出力層(L=4)のノードでは、出力値y= f(u(L)) となり、従って、この場合には、出力層(L=4)のノードにおけるδ(L)の値は、次式で示されるようになる。
Figure 2021085335
ところで、本発明による実施例では、前述したように、f(u(L)) は恒等関数であり、f’(u(Ll)) = 1となる。従って、δ(L)=y−y となり、δ(L)が求まる。
δ(L)が求まると、上式(6)を用いて前層のδ(L−1)が求まる。このようにして順次、前層のδが求められ、これらδの値を用いて、上式(2)から、各重みwについて誤差関数Eの微分、即ち、勾配∂E/∂w(L)か求められる。勾配∂E/∂w(L)か求められると、この勾配∂E/∂w(L)を用いて、誤差関数Eの値が減少するように、重みwの値が更新される。
<本発明による実施例>
本発明による実施例では、複数の入力パラメータの値に基づいてニューラルネットワークの重みを学習し、学習済のニューラルネットワークを用いて内燃機関の運転状態を示す値を推定するようにしている。この場合、本発明による実施例では、入力パラメータとして、機関回転数、燃料噴射弁4からの燃料噴射量、燃料噴射弁4からの燃料噴射時期、燃料分配管22内の燃料圧、EGR率、過給圧およびサージタンク5内の吸気温が採用されており、出力パラメータとして、推定すべき内燃機関の運転状態を示す値、即ち、排気ガス中のNOX濃度や機関の出力トルクが採用されている。
さて、前述したように、複数の入力パラメータの値に基づいてニューラルネットワークの重みを学習するようにした場合、これら入力パラメータの中に相関の度合の高い入力パラメータが存在すると、これら相関の度合の高い入力パラメータが、ニューラルネットワークの重みの学習時と異なる動きをしたとき、出力パラメータの推定値に誤差を生ずる。例えば、二つの入力パラメータの値が夫々x1およびx2であり、出力パラメータの値がyである場合において、一方の入力パラメータの値x1がΔx1だけ変化したときに出力パラメータの値yがΔyだけ変化したとすると(Δy=a・Δx1)、学習モデルは、入力パラメータの値x1が変化したときに出力パラメータの値yは、Δx1の変化に対して、感度aで変化することを学習する。
ところが、この場合、二つの入力パラメータ間に相関関係があったとすると、一方の入力パラメータの値x1が変化したときに他方の入力パラメータの値x2も変化する。この場合、一方の入力パラメータの値x1がΔx1だけ変化したときに他方の入力パラメータの値x2がΔx2だけ変化したとすると(Δx2=b・Δx1)、Δy=a・Δx1=(a/b)・Δx2であるので、学習モデルは、他方の入力パラメータの値x2が変化したときに出力パラメータの値yは、Δx2の変化に対して、感度a/bで変化すると学習してしまう。この感度a/bは、一方の入力パラメータの値x1が変化したときの感度であり、他方の入力パラメータの値x2が単独で変化したときの感度ではない。しかしながら、学習モデルは、この感度a/bは、他方の入力パラメータの値x2が単独で変化したときの感度である誤学習をしてしまう。このような誤学習を生じると、出力パラメータの推定値に誤差を生ずることになる。
次に、一つの検証例について説明する。例えば、図1に示される内燃機関において、EGRガスがサージタンク5内に再循環せしめられると、EGRガスの影響を受けてサージタンク5内の吸気温が変化する。従って、EGR率とサージタンク5内の吸気温は相関の度合いが高いと言える。そこで、上述の一方の入力パラメータの値x1をEGR率とし、上述の他方の入力パラメータの値x2をサージタンク5内の吸気温とし、出力パラメータの値yをNOX濃度として、ニューラルネットワークの重みの学習を行い、そのときの検証結果が図3に示されている。なお、図3は、EGRガスの再循環が開始された後、破線で示される時刻において、流路切換弁21により、EGR流路が、EGRクーラ18内を通るEGR通路17からEGRバイパス通路20に切換えられたときの、EGR率、サージタンク5内の吸気温、実NOX濃度および推定NOX濃度の変化を示している。
さて、図3において、破線で示される時刻以前においては、即ち、EGR流路が、EGRクーラ18内を通るEGR通路17からEGRバイパス通路20に切換えられる以前では、EGR率が徐々に上昇すると共にサージタンク5内の吸気温が少しずつ下降している。即ち、入力パラメータの値x1と、入力パラメータの値x2が共に変化している。このときには、図3に示されるように、時間の経過とともに推定NOX濃度が次第に実NOX濃度に近づき、このとき、推定NOX濃度が実NOX濃度に近づくように、ニューラルネットワークの重みが学習される。
これに対し、図3において、破線で示される時刻を過ぎると、即ち、EGR流路が、EGRクーラ18内を通るEGR通路17からEGRバイパス通路20に切換えられると、EGR率の上昇作用が停止され、サージタンク5内の吸気温が徐々に増大する。このときには、入力パラメータの値x2のみが単独で変化している。このように入力パラメータの値x2のみが単独で変化しているときには、図3に示される如く、サージタンク5内の吸気温が増大するにつれて、実NOX濃度がほとんど変化しないにも拘わらず推定NOX濃度が徐々に低下し、推定NOX濃度が実NOX濃度から次第に離れていく。即ち、推定NOX濃度に誤差が生ずることになる。このように、二つの入力パラメータの相関の度合の高いと、これら入力パラメータが、ニューラルネットワークの重みの学習時と異なる動きをしたとき、出力パラメータの推定値に誤差を生ずることになる。
一方、入力パラメータの値の変化に対する出力パラメータの値の変化の応答遅れが大きいときにも、出力パラメータの推定値に誤差を生ずる。次にこのことについて、図4を参照しつつ説明する。図4を参照すると、Aには、入力パラメータの操作指令C3と、操作指令C3に応じた入力パラメータの値x3の時間的変化と、出力パラメータの値yの時間的変化とが示されており、Bには、入力パラメータの操作指令C4と、操作指令C4に応じた入力パラメータの値x4の時間的変化と、出力パラメータの値yの時間的変化とが示されている。なお、図4に示される例では、図4のAにおける操作指令C3は燃料噴射弁4からの燃料噴射量の増量指令を示しており、入力パラメータの値x3は燃料噴射量の変化を示しており、出力パラメータの値yは機関出力トルクの変化を示している。また、図4のBにおける操作指令C4は過給圧の上昇指令を示しており、入力パラメータの値x4は過給圧の変化を示しており、出力パラメータの値yは機関出力トルクの変化を示している。
図4のAに示されるように、燃料噴射量の増量指令C3が発せられると、燃料噴射量x3はただちに増量される。燃料噴射量x3が増量されると機関の出力トルクyはただちに増大し始め、暫くすると燃料噴射量x3に応じた出力トルクに到達する。一方、図4のBに示されるように、過給圧の上昇指令C4が発せられると、例えば、排気タービンへの排気ガスの流入速度が増大するように可変ノズルベーンの開度が小さくされ、それにより過給圧が上昇せしめられる。この場合、可変ノズルベーンの開度が小さくされても排気タービンの回転数が上昇して過給圧が上昇するまでに時間を要するため、図4のBに示されるように、過給圧が徐々に上昇する。一方、過給圧が上昇すると、機関の出力トルクyが増大するが、過給圧が上昇しても燃焼圧が上昇するまでには時間を要するため、図4のBに示されるように、機関の出力トルクyは過給圧が上昇した後、時間遅れΔDをもって上昇することになる。
ところで、ニューラルネットワークの重みの学習を行うためには、入力パラメータの値と出力パラメータの値との関係を示すデータを事前に求める必要があり、このときの入力パラメータの値および出力パラメータの値としては、入力パラメータの値の変化後、出力パラメータの値が安定したときの入力パラメータの値および出力パラメータの値、即ち、図4のAでは時刻taにおける値、図4のBでは時刻tbにおける値が用いられる。これらの値が求められると、これらの値に基づいてニューラルネットワークの重みの学習が行われる。ところがこのようにして求められ学習済みのニューラルネットワークを用いて、出力パラメータの値を推定するようにした場合、入力パラメータとして、図4のBに示されるように、入力パラメータの値x4の変化に対する出力パラメータの値yの変化の応答遅れΔDの大きい入力パラメータが含まれていると、出力パラメータの値y、推定値yに誤差を生ずる。
次に、このことについて、学習済みのニューラルネットワークにおいて行われている演算過程を概念的に表した図4のCを参照しつつ説明する。上述した例を用いて説明すると、図4のCにおける実線は、燃料噴射量の増量指令C3および過給圧の上昇指令C4が発せられたときの実際の機関の出力トルクyの変化を示している。一方、ニューラルネットワークの重みの学習によって得られた燃料噴射量x3に対する重み係数をaとし、過給圧x3に対する重み係数をbとした場合、学習済みニューラルネットワークにより求められる機関出力トルクの推定値yeは、概念的に言うと,破線で示されるように、燃料噴射量x3に学習重み係数aを乗算したax3と過給圧x4に学習重み係数bを乗算したbx4の和の形(ax3+bx4)で表現することができる。
即ち、図4において、燃料噴射量の増量指令C3および過給圧の上昇指令C4が発せられると、実際の機関の出力トルクyの変化は、図4のCにおいて実線で示されるように、
図4のAにおいて実線で示される実際の機関の出力トルクyの変化と図4のBにおいて実線で示される実際の機関の出力トルクyの変化との和の形となる。一方、このとき,図4のCにおいて破線で示されるように、機関出力トルクの推定値ye(=ax3+bx4)は、図4のAに示される燃料噴射量x3に学習重み係数aを乗算したax3と図4のBに示される過給圧x4に学習重み係数bを乗算したbx4の和の形となる。従って、図4のBに示されるように、過給圧x4の変化に対して機関の出力トルクyの変化に応答遅れΔDを生ずると、図4のCに示されるように、機関出力トルクの推定値ye(=ax3+bx4)は実際の機関の出力トルクyよりも大きくなり、機関出力トルクの推定値ye に誤差を生ずることになる。
そこで、本発明による第1の実施例では、入力パラメータの値の変化に対する出力パラメータの値の変化の応答遅れを報酬の減点要素として各入力パラメータの報酬の演算を行い、報酬が閾値を越えた入力パラメータを学習用入力パラメータとして選定するようにしている。この場合、この第1の実施例では、入力パラメータと出力パラメータとの相関の度合いおよび入力パラメータ間の相関の度合いも考慮に入れて学習用入力パラメータが選定される。即ち、この第1の実施例では、電子制御ユニットを具備しており、電子制御ユニットが、機関の運転状態を示す入力パラメータの値を取得するパラメータ値取得部と、入力層、隠れ層および出力層からなるニューラルネットワークを用いて演算を行う演算部と、記憶部とを具備しており、入力パラメータの値が入力層に入力され、出力パラメータの値を示す出力値が出力層から出力される内燃機関の制御装置において、入力パラメータと出力パラメータとの相関の高いことを報酬の加点要素とし、入力パラメータ間の相関の低いことを報酬の加点要素とし、入力パラメータの値の変化に対する出力パラメータの値の変化の応答遅れを報酬の減点要素として各入力パラメータの報酬の加点又は減点を行い、報酬が閾値を越えた入力パラメータを学習用入力パラメータとして選定するようにしている。
一方、この場合、報酬に対する加点作用および減点作用を、上述とは全く逆にした第2の実施例を採用することもできる。この場合、この第2の実施例では、電子制御ユニットを具備しており、電子制御ユニットが、機関の運転状態を示す入力パラメータの値を取得するパラメータ値取得部と、入力層、隠れ層および出力層からなるニューラルネットワークを用いて演算を行う演算部と、記憶部とを具備しており、入力パラメータの値が入力層に入力され、出力パラメータの値を示す出力値が出力層から出力される内燃機関の制御装置において、入力パラメータと出力パラメータとの相関の高いことを報酬の減点要素とし、入力パラメータ間の相関の低いことを報酬の減点要素とし、入力パラメータの値の変化に対する出力パラメータの値の変化の応答遅れを報酬の加点要素として各入力パラメータの報酬の加点又は減点を行い、報酬が閾値よりも低い入力パラメータが学習用入力パラメータとして選定される。
本発明は、これら第1の実施例と第2の実施例を包含したものである。即ち、本発明によれば、電子制御ユニットを具備しており、電子制御ユニットが、機関の運転状態を示す入力パラメータの値を取得するパラメータ値取得部と、入力層、隠れ層および出力層からなるニューラルネットワークを用いて演算を行う演算部と、記憶部とを具備しており、入力パラメータの値が入力層に入力され、出力パラメータの値を示す出力値が出力層から出力される内燃機関の制御装置において、入力パラメータと出力パラメータとの相関の高いほど選択されやすい重み付けがなされた報酬と、入力パラメータ間の相関が高いほど選択されにくい重み付けがなされた報酬と、入力パラメータの値の変化に対する出力パラメータの値の変化の応答遅れが大きいほど選択されにくい重み付けがなされた報酬とに基づいて、各入力パラメータの報酬が演算され、演算された報酬が選択基準を満たしている入力パラメータを学習用入力パラメータとして選定するようにしている。
このように本発明では、入力パラメータと出力パラメータとの相関の高いほど選択されやすい重み付けがなされた報酬と、入力パラメータ間の相関が高いほど選択されにくい重み付けがなされた報酬と、入力パラメータの値の変化に対する出力パラメータの値の変化の応答遅れが大きいほど選択されにくい重み付けがなされた報酬とに基づいて、各入力パラメータの報酬が演算され、演算された報酬が選択基準を満たしている入力パラメータを学習用入力パラメータとして選定している。なお、以下、本発明による具体的な一例について説明を行うが、この説明では、発明を理解しやすくするために、上述の第1の実施例を用いた場合を例にとって説明を行う。
さて、前述したように、本発明による実施例では、入力パラメータとして、機関回転数、燃料噴射弁4からの燃料噴射量、燃料噴射弁4からの燃料噴射時期、燃料分配管22内の燃料圧、EGR率、過給圧およびサージタンク5内の吸気温が採用されている。これら入力パラメータの中で、入力パラメータの値の変化に対する出力パラメータの値の変化の応答遅れが大きくなる入力パラメータの一つが、過給圧である。また、サージタンク5内の吸気温も、入力パラメータの値の変化に対する出力パラメータの値の変化の応答遅れが大きくなる入力パラメータの一つである。その他の入力パラメータ、即ち、機関回転数、燃料噴射弁4からの燃料噴射量、燃料噴射弁4からの燃料噴射時期、燃料分配管22内の燃料圧およびEGR率は、入力パラメータの値の変化に対する出力パラメータの値の変化の応答遅れが小さく、これらの入力パラメータの値の変化に対して出力パラメータの値は、図4のAに示されるように変化する。
また、図4のA,BおよびCにおける出力パラメータyは、機関の出力トルクを示している。この場合、出力パラメータyが排出NOX量である場合でも、出力パラメータyが機関の出力トルクである場合と同様に、図4のA,BおよびCに示される如く変化する。従って、以下、入力パラメータ候補として、機関回転数、燃料噴射弁4からの燃料噴射量、燃料噴射弁4からの燃料噴射時期、燃料分配管22内の燃料圧、EGR率、過給圧およびサージタンク5内の吸気温を用い、出力パラメータとして、排出NOX濃度を採用し、これら入力パラメータから、ニューラルネットワークを用いて排出NOX量を推定するための排出NOX量モデルを作成する場合を例にとって、本発明による具体的な一例について説明する。なお、以下、入力パラメータ候補、即ち、機関回転数、燃料噴射弁4からの燃料噴射量、燃料噴射弁4からの燃料噴射時期、燃料分配管22内の燃料圧、EGR率、過給圧およびサージタンク5内の吸気温は、夫々、x1、・・・・xN で示される。
この排出NOX量モデルを作成する際には、最初に、車両が予め定められた走行パターンでもって走行せしめられたときの入力パラメータと出力パラメータとの関係を示すデータの取得作業が行われる。図5は、このデータを取得するためのデータの取得ルーチンを示している。図5を参照すると、まず初めに、ステップ50において、最初に設定されている機関回転数x、燃料噴射弁4からの燃料噴射量x、燃料噴射弁4からの燃料噴射時期x、燃料分配管22内の燃料圧x、EGR率xおよび過給圧xでもって機関の運転が行われる。次いで、ステップ51では、各入力パラメータ候補x(N=1,2 ・・・N)の指令値又は実測値と、出力パラメータyの実測値とが取得され、記憶装置内に記憶される。
この場合、例えば、燃料噴射弁4からの燃料噴射量x、燃料噴射弁4からの燃料噴射時期xおよびEGR率xについては指令値が取得されて記憶され、機関回転数xについては実測値が取得されて記憶され、燃料分配管22内の燃料圧x、過給圧x6,サージタンク5内の吸気温xN7および排出NOX量については,夫々、燃料圧センサ27、過給圧センサ25、吸気温センサ26およびNOXセンサ28により検出された実測値が取得されて記憶される。なお、この場合、図4のAおよびBを参照しつつ既に説明したように、出力パラメータyの値、即ち、排出NOX量が安定した後に、機関回転数x、燃料噴射弁4からの燃料噴射量x、燃料噴射弁4からの燃料噴射時期x、燃料分配管22内の燃料圧x、EGR率x、過給圧x、サージタンク5内の吸気温xおよび出力パラメータyの実測値が取得されて記憶される。次いで、ステップ52では、各入力パラメータ候補x(N=1,2 ・・・N)の夫々について、入力パラメータxNの値の変化に対する出力パラメータyの値の変化の応答遅れΔDが取得され、記憶装置内に記憶される。
次いで、ステップ53では、予め定められた車両の走行パターンに基づき設定される全ての機関運転状態におけるデータ、即ち、各入力パラメータ候補x(N=1,2 ・・・N)の指令値又は実測値と、出力パラメータyの実測値との関係を示すデータ、および各入力パラメータ候補x(N=1,2 ・・・N)の値の変化に対する出力パラメータyの値の変化の応答遅れΔDを示すデータが取得されたか否かが判別される。車両の走行パターンに基づき設定される全ての機関運転状態におけるデータが取得されていないときには、ステップ54に進んで、機関の運転状態が変更される。このとき、機関回転数x、燃料噴射弁4からの燃料噴射量x、燃料噴射弁4からの燃料噴射時期x、燃料分配管22内の燃料圧x、EGR率xおよび過給圧xのうちの一つの機関運転状態、例えば、燃料噴射弁4からの燃料噴射量xが、図4のAにおいてx3で示されるように、ステップ状に変更される。次いで、ステップ50に進み、変更された新たな機関運転状態の下で、機関の運転が行われる。次いで、車両の走行パターンに基づき設定される全ての機関運転状態におけるデータが取得されるまで、ステップ51およびステップ52において、車両の走行パターンに基づき設定される各機関運転状態におけるデータが取得され、記憶される。
このようにして記憶装置内には、車両の走行パターンに基づき設定される全ての機関運転状態について、各入力パラメータ候補x(N=1,2 ・・・N)の指令値又は実測値と、出力パラメータyの実測値との関係を示すデータ、および各入力パラメータ候補x(N=1,2 ・・・N)の値の変化に対する出力パラメータyの値の変化の応答遅れΔDを示すデータが記憶される。これらのデータに基づいて、ニューラルネットワークの重みの学習が行われる。図6および図7には、これらのデータを用いてニューラルネットワークの重みの学習を行うための学習ルーチンが示されており、図9には、図6および図7の学習ルーチンにおいて行われた学習を検証するための検証ルーチンが示されている。
図6を参照すると、まず初めに、ステップ100において、記憶装置内に記憶されている各入力パラメータ候補x(N=1,2 ・・・N)の指令値又は実測値、即ち、機関回転数x、燃料噴射弁4からの燃料噴射量x、燃料噴射弁4からの燃料噴射時期x、燃料分配管22内の燃料圧x、EGR率x5、過給圧xおよびサージタンク5内の吸気温xの指令値又は実測値と、出力パラメータy、即ち、排出NOX量の実測値との関係を示すデータ、および各入力パラメータ候補x(N=1,2 ・・・N)の値の変化に対する出力パラメータyの値の変化の応答遅れΔDを示すデータが読み込まれる。なお、図6および図7に示される学習ルーチンでは、入力パラメータ候補x1、・・・・xN 中の任意の候補が、x、x で示されている。また、図6および図7に示される学習ルーチンでは、これらn、mの初期値は1とされており、これらn、mは夫々、1からNまでの値(n、m=1,2・・・N)をとる。
次いで、ステップ101では、XとYとの相関を示す相関係数の数式として周知の次式を用いて、各入力パラメータ候補xと出力パラメータyとの相関係数R(x、y)が算出される。
Figure 2021085335
なお、本発明による実施例では、相関係数として上式に示される相関係数Rの二乗Rが用いられている。
次いで、ステップ102では、nが1だけインクリメントされる(n=n+1)。次いで、ステップ103では、n=N+1になったか否かが判別される。n=N+1でないときにはステップ102に戻り、相関係数R(x、y)が算出される。一方、ステップ103において、n=N+1になったと判別されたときには、ステップ104に進む。即ち、ステップ101において、xからxまでの全ての入力パラメータ候補xについての相関係数R(x、y)が算出されると、ステップ104に進む。ステップ104では、nの初期化が行われる。即ち、n=1とされる。次いで、ステップ105に進む。
ステップ105では、nとmが等しいが否かが判別される。nとmが等しくないとき(n≠m)にはステップ106に進んで、各入力パラメータ候補x同士の相関係数R(x、x)が算出される。次いで、ステップ107に進む。一方、ステップ105においてnとmが等しいと判別されたときには、ステップ107にジャンプする。即ち、相関係数R(x、y)は、n≠mであるときのみ算出される。ステップ107では、mが1だけインクリメントされる(m=m+1)。次いで、ステップ108では、m=N+1になったか否かが判別される。m=N+1でないときにはステップ105に戻り、n≠mである場合には、ステップ106に進んで、相関係数R(x、x)が算出される。
一方、ステップ108において、m=N+1になったと判別されたときには、ステップ109に進み、ΣR(x、x)にR(x、x)を加算することによって相関係数R(x、x)の積算値ΣR(x、x)が算出される。次いで、ステップ110に進んで、nが1だけインクリメントされる(n=n+1)。次いで、ステップ111では、n=N+1になったか否かが判別される。n=N+1でないときにはステップ105に戻り、n≠mである場合には、ステップ106に進んで、相関係数R(x、x)が算出される。一方、ステップ111において、n=N+1になったと判別されたときには、ステップ112に進む。即ち、ステップ109において、n=mを除く、xからxまでの残りの全ての各入力パラメータ候補x同士の相関係数R(x、x)の総和ΣR(x、x)が算出されると、ステップ112に進む。ステップ112では、nの初期化が行われる。即ち、n=1とされる。次いで、ステップ113に進む。
ステップ113では, 各入力パラメータ候補x(N=1,2 ・・・N)の夫々について求められている、入力パラメータxNの値の変化に対する出力パラメータyの値の変化の応答遅れΔDを積算することにより、各入力パラメータ候補x(N=1,2 ・・・N)の夫々に対する応答遅れdτ(x、y)が算出される。即ち、最初にステップ113に進んだときには、入力パラメータxの値の変化に対する出力パラメータyの値の変化の応答遅れを積算することにより、入力パラメータ候補xに対する応答遅れdτ(x、y)が算出される。次いで、ステップ114に進んで、nが1だけインクリメントされる(n=n+1)。次いで、ステップ115では、n=N+1になったか否かが判別される。n=N+1でないときにはステップ113に戻り、入力パラメータxの値の変化に対する出力パラメータyの値の変化の応答遅れdτ(x、y)が算出される。このようにして全ての入力パラメータ候補x(N=1,2 ・・・N)について応答遅れdτ(x、y)の算出が完了すると、ステップ115では、n=N+1になったと判別され、ステップ116に進む。
ステップ116では、nの初期化が行われる。即ち、n=1とされる。次いで、ステップ117では、各入力パラメータ候補xに対し、既に算出されている相関係数R(x、y)と、相関係数R(x、x)の総和と、応答遅れdτ(x、y)を用いて次式に基づき算出された報酬Q(x)が付与される。
Figure 2021085335
上式において、a、bおよびcは定数である。即ち、この報酬Q(x)は、図8Aに示されるように、入力パラメータ候補xと出力パラメータyとの相関係数R(x、y)・aから、入力パラメータ候補xとその他の入力パラメータ候補xとの相関係数の総和ΣR(x、x)・bを減算すると共に入力パラメータ候補xに対する応答遅れdτ(x、y)を減算した減算結果を示している。即ち、前述したように、入力パラメータと出力パラメータとの相関の高いことを報酬の加点要素とし、入力パラメータ間の相関の低いことを報酬の加点要素とし、入力パラメータの値の変化に対する出力パラメータの値の変化の応答遅れを報酬の減点要素として各入力パラメータの報酬の加点又は減点が行なわれる。なお、図8Aから、入力パラメータ候補xと出力パラメータyとの相関の度合いが高いほど報酬Q(x)が高くなり、入力パラメータ候補xとその他の入力パラメータ候補xとの相関の度合いが低いほど報酬Q(x)が高くなり、入力パラメータ候補xに対する応答遅れdτ(x、y)が短いほど報酬Q(x)が高くなることがわかる。この場合、報酬Q(x)が高いほど誤学習を抑制することができる。
ステップ117において報酬Q(x)が付与されると、ステップ118に進み、報酬Q(x)が、暫定的に定められている閾値Tよりも大きいか否かが判別される。報酬Q(x)が閾値Tよりも大きいと判別されたときにはステップ119に進んで、x が入力パラメータとして選定される。次いで、ステップ120に進む。これに対し、ステップ118において、報酬Q(x)が閾値Tよりも大きくないと判別されたときにはステップ120にジャンプする。従って、このときには、x が入力パラメータとして選定されない。ステップ120では、nが1だけインクリメントされる(n=n+1)。次いで、ステップ121では、n=N+1になったか否かが判別される。n=N+1でないときにはステップ117に戻り、報酬Q(x)が算出される。一方、ステップ121において、n=N+1になったと判別されたときには、ステップ122に進む。
即ち、ステップ117において、xからxまでの全ての入力パラメータ候補xについての報酬Q(x)が算出され、ステップ118および119において、全ての入力パラメータ候補xについて、入力パラメータとして選定するか否かの選定作業が完了したときにはステップ122に進む。ステップ122では、入力パラメータとして選定された入力パラメータ候補xと、出力パラメータyを用いて、ニューラルネットワークの重みの学習が行われる。
図8Bには、報酬Q(x)と、閾値Tと、各入力パラメータ候補xと、選定された入力パラメータxとが示されている。図8Bに示される例では、入力パラメータ候補x〜x の内で、入力パラメータ候補x1、3、N−2, x についての報酬Q(x)だけが閾値Tよりも大きく、従って、これら入力パラメータ候補x1、3、N−2, x のみが、入力パラメータxとして選定される。図7のステップ122では、これら入力パラメータとして選定された入力パラメータ候補xと、出力パラメータyを用いて、ニューラルネットワークの重みの学習が行われる。
次に、図9を参照しつつ、検証ルーチンについて説明する。図9を参照すると、まず初めに、ステップ200において、図7のステップ119において選定された選定入力パラメータxについて、予め定められた走行パターンで車両が走行されたときの各機関運転状態におけるデータ、即ち、入力パラメータxと排気ガス中のNOX濃度の実測値との関係を示すデータが取得される。次いで、ステップ201では、図7のステップ122において重みの学習が行われたニューラルネットワークを用いて、ステップ200において取得されたデータから、各機関運転状態における出力パラメータの推定値ye が算出される。次いで、ステップ202では、各機関運転状態における排気ガス中のNOX濃度の実測値、即ち、出力パラメータの実測値yと出力パラメータの推定値yeとの関係を示す相関係数R(y、ye)が算出される。
次いで、ステップ203では、相関係数R(y、ye)が要求精度Sよりも大きいか否かが判別される。相関係数R(y、ye)が要求精度Sよりも大きいと判別されたときには処理サイクルを完了する。このときには、図7のステップ119において選定された選定入力パラメータxが最終的な選定入力パラメータxとされる。これに対し、ステップ203において、相関係数R(y、ye)が要求精度Sよりも大きくないと判別されたときには、ステップ204に進んで、閾値Tを増減させることにより、選定入力パラメータxの再選定が行われる。図10Aおよび図10Bは、この選定入力パラメータxの再選定の様子を示している。
即ち、まず初めに、ステップ204では、閾値Tに修正値ΔTが加算される。このときの閾値Tが、図10AにおいてT2で示されている。次いで、ステップ205では、選定入力パラメータxについて既に付与されている報酬Q(x)と新たな閾値Tとが比較され、新たな閾値Tよりも報酬Q(x)の大きい選定入力パラメータxが、新たな選定入力パラメータxとして選定される。次いで、ステップ206では、各機関運転状態における新たな選定入力パラメータ候補xと出力パラメータyを用いて、ニューラルネットワークの重みの学習が行われる。次いで、ステップ207では、ステップ206において重みの学習が行われたニューラルネットワークを用いて、新たな選定入力パラメータxに基づき、各機関運転状態における出力パラメータの推定値ye が算出される。
次いで、ステップ208では、各機関運転状態における排気ガス中のNOX濃度の実測値、即ち、出力パラメータの実測値yと出力パラメータの推定値yeとの 相関係数R(y、ye)が算出される。次いで、ステップ209では、相関係数R(y、ye)が増加したか否かが判別される。相関係数R(y、ye)が増加したと判別されたときにはステップ203に戻り、再び、相関係数R(y、ye)が要求精度Sよりも大きいか否かが判別される。相関係数R(y、ye)が要求精度Sよりも大きいと判別されたときには処理サイクルを完了し、新たな選定入力パラメータxが最終的な選定入力パラメータxとされる。
一方、ステップ209において、相関係数R(y、ye)が増加しないと判別されたときには、ステップ210に進んで、閾値Tに対する修正値ΔTが、―ΔTとされる。次いで、ステップ203に進む。このときには、ステップ203からステップ204に進み、今度は、閾値Tから修正値ΔTが減算される。なお、最初にステップ210に進んだときだけ、閾値Tに対する修正値ΔTを―2ΔTとすることができ、このときの閾値Tが、図10AにおいてT1で示されている。次いで、ステップ205に進み、以下、上述した処理と同様の処理が行われる。このように、閾値Tを増減させることによって、図10Bからわかるように、相関係数R(y、ye)が要求精度Sよりも大きくなる最終的な選定入力パラメータxを探索することができる。
図11Aおよび図11Bに、入力パラメータの値の変化に対する出力パラメータの値の変化の応答遅れが大きい場合には出力パラメータの推定値に誤差を生ずることを確認するために、機関の出力トルクを出力パラメータとして実験を行ったときの実験結果を示す。図11Aは、入力パラメータの値の変化に対する機関の出力トルクの変化の応答遅れを考慮しなかった場合の、即ち、報酬Q(x)の算出式において応答遅れdτ(x、y)の項を設けなかった場合の実トルクと推定トルクとを示しており、図11Bは、入力パラメータの値の変化に対する機関の出力トルクの変化の応答遅れを考慮した場合の、即ち、報酬Q(x)の算出式において応答遅れdτ(x、y)の項を設けた場合の実トルクと推定トルクとを示している。これらのグラフから、入力パラメータの値の変化に対する機関の出力トルクの変化の応答遅れを考慮すると、即ち、報酬Q(x)の算出式において応答遅れdτ(x、y)の項を設けると、実トルクに対する推定トルクの誤差が抑制されることがわかる。因みに、図11Aは、入力パラメータとして、機関回転数、燃料噴射弁4からの燃料噴射量、燃料噴射弁4からの燃料噴射時期、燃料分配管22内の燃料圧、EGR率およびサージタンク5内の吸気温が用いられている場合を示しており、図11Bは、これらの入力パラメータから、サージタンク5内の吸気温が除外された場合を示している。
1 内燃機関
2 燃焼室
3 点火栓
4 燃料噴射弁
12 スロットル弁
25 過給圧センサ
26 吸気温センサ
27 燃料圧センサ
28 NOXセンサ
30 電子制御ユニット

Claims (1)

  1. 電子制御ユニットを具備しており、該電子制御ユニットが、機関の運転状態を示す入力パラメータの値を取得するパラメータ値取得部と、入力層、隠れ層および出力層からなるニューラルネットワークを用いて演算を行う演算部と、記憶部とを具備しており、入力パラメータの値が入力層に入力され、出力パラメータの値を示す出力値が出力層から出力される内燃機関の制御装置において、入力パラメータと出力パラメータとの相関の高いほど選択されやすい重み付けがなされた報酬と、入力パラメータ間の相関が高いほど選択されにくい重み付けがなされた報酬と、入力パラメータの値の変化に対する出力パラメータの値の変化の応答遅れが大きいほど選択されにくい重み付けがなされた報酬とに基づいて、各入力パラメータの報酬が演算され、演算された報酬が選択基準を満たしている入力パラメータを学習用入力パラメータとして選定する内燃機関の制御装置。
JP2019212629A 2019-11-25 2019-11-25 内燃機関の制御装置 Pending JP2021085335A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019212629A JP2021085335A (ja) 2019-11-25 2019-11-25 内燃機関の制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019212629A JP2021085335A (ja) 2019-11-25 2019-11-25 内燃機関の制御装置

Publications (1)

Publication Number Publication Date
JP2021085335A true JP2021085335A (ja) 2021-06-03

Family

ID=76087063

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019212629A Pending JP2021085335A (ja) 2019-11-25 2019-11-25 内燃機関の制御装置

Country Status (1)

Country Link
JP (1) JP2021085335A (ja)

Similar Documents

Publication Publication Date Title
JP6477951B1 (ja) 車載電子制御ユニット
US11326534B2 (en) Machine learning for misfire detection in a dynamic firing level modulation controlled engine of a vehicle
EP1705353B1 (en) Method and device for estimating the inlet air flow in a combustion chamber of a cylinder of an internal combustion engine
JP6501018B1 (ja) 未燃燃料量の機械学習装置
CN111016920B (zh) 车辆用驱动装置的控制装置及控制方法、车载电子控制单元、已学习模型和机器学习系统
JP6725087B1 (ja) 内燃機関のブローバイガス送出路異常検出装置
CN110352297B (zh) 机器学习装置
CN110118130B (zh) 内燃机的控制装置
JP6702380B2 (ja) 内燃機関の制御装置
US11635350B2 (en) Diagnostic system and method for detecting internal combustion engine faults using exhaust pressure readings
CN111022206B (zh) 车辆用驱动装置的控制装置及方法、车载电子控制单元
JP2003328841A (ja) ターボチャージドエンジンの診断システム
JP4775097B2 (ja) 遠心式圧縮機を備える内燃機関の制御装置
JP6699702B2 (ja) 内燃機関の制御装置及びその制御方法、並びに内燃機関を制御するための学習モデル及びその学習方法
CN112031962B (zh) 废气再循环系统的异常检测装置
CN110005537B (zh) 内燃机的控制装置
JP2009150345A (ja) 内燃機関の制御装置
US11035301B1 (en) Method for preventing engine air flow calculation error and engine system thereof
JP2021085335A (ja) 内燃機関の制御装置
JP7388343B2 (ja) ターボチャージャのオイルコーキング堆積量の推定装置
JP2019143477A (ja) 内燃機関の制御装置
JP2020197216A (ja) 排気ガス再循環システムの異常検出装置
WO2019151536A1 (ja) 機械学習装置
JP2020045821A (ja) 内燃機関の制御装置
JP2010096021A (ja) 内燃機関の燃焼状態診断装置