JP4975158B2 - プラントの制御装置 - Google Patents
プラントの制御装置 Download PDFInfo
- Publication number
- JP4975158B2 JP4975158B2 JP2010249756A JP2010249756A JP4975158B2 JP 4975158 B2 JP4975158 B2 JP 4975158B2 JP 2010249756 A JP2010249756 A JP 2010249756A JP 2010249756 A JP2010249756 A JP 2010249756A JP 4975158 B2 JP4975158 B2 JP 4975158B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- value
- target
- cmd
- control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D13/00—Controlling the engine output power by varying inlet or exhaust valve operating characteristics, e.g. timing
- F02D13/02—Controlling the engine output power by varying inlet or exhaust valve operating characteristics, e.g. timing during engine operation
- F02D13/0223—Variable control of the intake valves only
- F02D13/0226—Variable control of the intake valves only changing valve lift or valve lift and timing
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D28/00—Programme-control of engines
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/02—Circuit arrangements for generating control signals
- F02D41/14—Introducing closed-loop corrections
- F02D41/1401—Introducing closed-loop corrections characterised by the control or regulation method
- F02D41/1405—Neural network control
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02M—SUPPLYING COMBUSTION ENGINES IN GENERAL WITH COMBUSTIBLE MIXTURES OR CONSTITUENTS THEREOF
- F02M26/00—Engine-pertinent apparatus for adding exhaust gases to combustion-air, main fuel or fuel-air mixture, e.g. by exhaust gas recirculation [EGR] systems
- F02M26/02—EGR systems specially adapted for supercharged engines
- F02M26/04—EGR systems specially adapted for supercharged engines with a single turbocharger
- F02M26/05—High pressure loops, i.e. wherein recirculated exhaust gas is taken out from the exhaust system upstream of the turbine and reintroduced into the intake system downstream of the compressor
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02M—SUPPLYING COMBUSTION ENGINES IN GENERAL WITH COMBUSTIBLE MIXTURES OR CONSTITUENTS THEREOF
- F02M26/00—Engine-pertinent apparatus for adding exhaust gases to combustion-air, main fuel or fuel-air mixture, e.g. by exhaust gas recirculation [EGR] systems
- F02M26/02—EGR systems specially adapted for supercharged engines
- F02M26/04—EGR systems specially adapted for supercharged engines with a single turbocharger
- F02M26/06—Low pressure loops, i.e. wherein recirculated exhaust gas is taken out from the exhaust downstream of the turbocharger turbine and reintroduced into the intake system upstream of the compressor
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
- G05B13/027—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/0002—Controlling intake air
- F02D2041/0017—Controlling intake air by simultaneous control of throttle and exhaust gas recirculation
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/0002—Controlling intake air
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02D—CONTROLLING COMBUSTION ENGINES
- F02D41/00—Electrical control of supply of combustible mixture or its constituents
- F02D41/0025—Controlling engines characterised by use of non-liquid fuels, pluralities of fuels, or non-fuel substances added to the combustible mixtures
- F02D41/0047—Controlling exhaust gas recirculation [EGR]
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02M—SUPPLYING COMBUSTION ENGINES IN GENERAL WITH COMBUSTIBLE MIXTURES OR CONSTITUENTS THEREOF
- F02M26/00—Engine-pertinent apparatus for adding exhaust gases to combustion-air, main fuel or fuel-air mixture, e.g. by exhaust gas recirculation [EGR] systems
- F02M26/02—EGR systems specially adapted for supercharged engines
- F02M26/09—Constructional details, e.g. structural combinations of EGR systems and supercharger systems; Arrangement of the EGR and supercharger systems with respect to the engine
- F02M26/10—Constructional details, e.g. structural combinations of EGR systems and supercharger systems; Arrangement of the EGR and supercharger systems with respect to the engine having means to increase the pressure difference between the exhaust and intake system, e.g. venturis, variable geometry turbines, check valves using pressure pulsations or throttles in the air intake or exhaust system
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02M—SUPPLYING COMBUSTION ENGINES IN GENERAL WITH COMBUSTIBLE MIXTURES OR CONSTITUENTS THEREOF
- F02M26/00—Engine-pertinent apparatus for adding exhaust gases to combustion-air, main fuel or fuel-air mixture, e.g. by exhaust gas recirculation [EGR] systems
- F02M26/13—Arrangement or layout of EGR passages, e.g. in relation to specific engine parts or for incorporation of accessories
- F02M26/14—Arrangement or layout of EGR passages, e.g. in relation to specific engine parts or for incorporation of accessories in relation to the exhaust system
- F02M26/15—Arrangement or layout of EGR passages, e.g. in relation to specific engine parts or for incorporation of accessories in relation to the exhaust system in relation to engine exhaust purifying apparatus
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02M—SUPPLYING COMBUSTION ENGINES IN GENERAL WITH COMBUSTIBLE MIXTURES OR CONSTITUENTS THEREOF
- F02M26/00—Engine-pertinent apparatus for adding exhaust gases to combustion-air, main fuel or fuel-air mixture, e.g. by exhaust gas recirculation [EGR] systems
- F02M26/13—Arrangement or layout of EGR passages, e.g. in relation to specific engine parts or for incorporation of accessories
- F02M26/22—Arrangement or layout of EGR passages, e.g. in relation to specific engine parts or for incorporation of accessories with coolers in the recirculation passage
- F02M26/23—Layout, e.g. schematics
- F02M26/24—Layout, e.g. schematics with two or more coolers
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F02—COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
- F02M—SUPPLYING COMBUSTION ENGINES IN GENERAL WITH COMBUSTIBLE MIXTURES OR CONSTITUENTS THEREOF
- F02M26/00—Engine-pertinent apparatus for adding exhaust gases to combustion-air, main fuel or fuel-air mixture, e.g. by exhaust gas recirculation [EGR] systems
- F02M26/45—Sensors specially adapted for EGR systems
- F02M26/48—EGR valve position sensors
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/12—Improving ICE efficiencies
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Combustion & Propulsion (AREA)
- Mechanical Engineering (AREA)
- Chemical & Material Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Automation & Control Theory (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Combined Controls Of Internal Combustion Engines (AREA)
- Electrical Control Of Air Or Fuel Supplied To Internal-Combustion Engine (AREA)
- Output Control And Ontrol Of Special Type Engine (AREA)
- Feedback Control In General (AREA)
Description
本発明は、複数の制御入力によって複数の制御量をそれぞれ制御するとともに、複数の制御入力および複数の制御量の間に相互干渉が存在するプラントの制御装置に関する。
従来、この種の制御装置として、例えば特許文献1に開示されたものが知られている。この制御装置が適用された内燃機関は、吸気弁のリフトを変更可能に構成されている。また、従来の制御装置では、吸気通路に設けられたスロットル弁の開度をその目標開度に制御することによって、吸気通路内の圧力(以下「吸気圧」という)が制御されるとともに、吸気弁のリフトをその目標リフトに制御することによって、内燃機関に吸入される吸入空気量が制御される。この場合、スロットル弁の開度の制御によって、吸気圧だけでなく、吸入空気量も変化し、また、吸気弁のリフトの制御によって、吸入空気量だけでなく、吸気圧も変化する。このことから明らかなように、制御入力としての目標開度および目標リフト、ならびに、制御量としての吸気圧および吸入空気量の間には、相互干渉が存在する。
このため、従来の制御装置は、上記のような相互干渉を抑制するための非干渉化コントローラを有しており、また、従来の制御装置では、非干渉化制御則(クロスコントローラ)に基づいて、非干渉化コントローラと内燃機関を組み合わせた系が、相互干渉のない線形な仮想プラントとしてモデル化される。さらに、それにより得られたモデル式に基づいて、スロットル弁の目標開度および吸気弁の目標リフトが、相互干渉を抑制可能な非干渉化入力として算出される。
上述したように、従来の制御装置では、非干渉化コントローラと内燃機関を組み合わせた系が、非干渉化制御則に基づいて、相互干渉のない線形な仮想プラントとしてモデル化される。しかし、内燃機関は非線形系であるので、そのような手法でモデル化するのは困難である。また、この従来の制御装置を、内燃機関よりもさらに非線形性が強いプラントに適用した場合には、モデル化を行うことができず、その結果、相互干渉を抑制できないおそれがある。さらに、制御入力および制御量が異なれば、相互干渉の態様や度合も異なるので、モデル式もまた異なる。したがって、そのように相互干渉の態様などが互いに異なる複数の制御入力および複数の制御量ごとに、モデル式を非干渉化制御則に基づいて始めから設定しなければならず、装置の設計が非常に煩雑になってしまう。以上の点において、従来の制御装置には改善の余地がある。
本発明は、以上のような課題を解決するためになされたものであり、プラントが非線形系であっても、複数の制御入力および複数の制御量の間に存在する相互干渉を適切に抑制でき、それにより複数の制御量を適切に制御することができるとともに、容易に設計することができるプラントの制御装置を提供することを目的とする。
上記の目的を達成するために、請求項1に係る発明は、複数の制御入力(実施形態における(以下、本項において同じ)目標スロットル弁開度TH_cmd、目標バルブリフトLift_cmd、目標低圧用スロットル弁開度LPTH_cmd、目標高圧用スロットル弁開度HPTH_cmd)によって複数の制御量(吸気圧PBa、吸入空気量Gcyla、低圧EGRガス流量LPEGR、高圧EGRガス流量HPEGR)をそれぞれ制御するとともに、複数の制御入力および複数の制御量の間に相互干渉が存在するプラント51、111の制御装置1、71であって、複数の制御入力をそれぞれ算出する制御入力算出手段(ECU2、72、第1コントローラ43、103および第2コントローラ44、104)と、相互干渉を抑制するように複数の制御入力をそれぞれ補正するための複数の干渉抑制パラメータ(第1干渉抑制値Lift_dc_cmd、HPTH_dc_cmd、第2干渉抑制値TH_dc_cmd、LPTH_dc_cmd)を算出し、複数の干渉抑制パラメータの各々の算出を、複数の制御入力のうちの、算出される干渉抑制パラメータで補正される制御入力以外の制御入力を入力とし、当該干渉抑制パラメータを出力として構築されたニューラルネットワークを用いて行う干渉抑制パラメータ算出手段(ECU2、72、第1干渉抑制値算出部45、105および第2干渉抑制値算出部46、106)と、制御入力算出手段により算出された制御入力を、算出された干渉抑制パラメータに基づいて補正する補正手段(ECU2、72、第1加算器47、107、第2加算器48、108)と、複数の制御量のそれぞれの目標となる複数の目標値(目標吸気圧PB_cmd、目標吸気量Gcyl_cmd、目標低圧EGRガス流量LPEGR_cmd、目標高圧EGRガス流量HPEGR_cmd)を設定する目標値設定手段(ECU2、72、目標値算出部41、101)と、を備え、制御入力算出手段は、複数の制御量が設定された複数の目標値にそれぞれなるように、複数の制御入力を算出し、複数の制御量をそれぞれ検出する制御量検出手段(エアフローセンサ24、吸気圧センサ25、吸気温センサ26、排気マニホルド圧センサ28、排気マニホルド温センサ29、吸気チャンバ圧センサ31、排気圧センサ34、排気温センサ35、LPEGR開度センサ36、HPEGR開度センサ37、ECU2、72)と、干渉抑制パラメータで補正された制御入力により制御された複数の制御量の各々が対応する目標値になるように、検出された当該制御量と当該目標値との比較結果に基づく報酬(報酬値Rw_gcyl、報酬値Rw_pb、報酬値Rw_hp、報酬値Rw_lp)を用いた強化学習によって、ニューラルネットワークに用いられるパラメータであるニューロンパラメータ(重み係数ωa、ωb、ωcおよびωd)を学習する学習手段(ECU2、72、学習部61、121)と、をさらに備え、学習手段は、ニューロンパラメータの学習をニューラルネットワークごとに行い、当該ニューロンパラメータを学習する前に、制御入力算出手段は、複数の制御入力のうちの、当該ニューロンパラメータが学習されるニューラルネットワークに対応する干渉抑制パラメータで補正される制御入力である学習対象用制御入力を、検出された、対応する制御量が目標値になるように、所定のフィードバック制御アルゴリズムによって算出する(図10のステップ7、8、図13のステップ47、48、図24のステップ87、88、図27のステップ127、128)とともに、複数の制御入力のうちの学習対象用制御入力以外の制御入力である非学習対象用制御入力を、一定の第1所定値THREF1、LiftREF1、LPTHREF1、HPTHREF1に保持し(図10のステップ6、図13のステップ46、図24のステップ86、図27のステップ126)、補正手段は、複数の制御入力の補正を停止し(図10のステップ6、8、図13のステップ46、48、図24のステップ86、88、図27のステップ126、128)、当該ニューロンパラメータの学習中、制御入力算出手段は、学習対象用制御入力を、当該ニューロンパラメータの学習の開始直前に算出された値(学習用目標リフトLift_cmdG、学習用目標開度TH_cmdG、学習用目標HPTH開度HPTH_cmdG、学習用目標LPTH開度LPTH_cmdG)に保持する(図10のステップ9、図11のステップ25、図13のステップ49、図14のステップ65、図24のステップ89、図25のステップ105、図27のステップ129、図28のステップ145)とともに、非学習対象用制御入力を第1所定値THREF1、LiftREF1、LPTHREF1、HPTHREF1とは異なる一定の第2所定値THREF2、LiftREF2、LPTHREF2、HPTHREF2に保持し(図11のステップ15、16、図14のステップ55、56、図25のステップ95、96、図28のステップ135、136)、補正手段は、学習対象用制御入力を、当該ニューロンパラメータが学習されるニューラルネットワークに対応する干渉抑制パラメータに基づいて補正する(図11のステップ26、27、図14のステップ66、67、図25のステップ106、107、図28のステップ146、147)とともに、当該ニューラルネットワーク以外のニューラルネットワークに対応する干渉抑制パラメータに基づく補正を停止し(図11のステップ16、図14のステップ56、図25のステップ96、図28のステップ136)、学習手段は、強化学習を、補正された学習対象用制御入力により制御された制御量が当該ニューロンパラメータの学習の開始直前に設定された目標値(学習用目標吸気量Tgt_gcyl、学習用目標吸気圧Tgt_pb、学習用目標高圧EGRガス流量Tgt_hpegr、学習用目標低圧EGRガス流量Tgt_lpegr)になるように、検出された当該制御量と当該目標値との比較結果に基づく報酬を用いて行う(図11のステップ19、22〜24、28A、図14のステップ59、62〜64、68A、図25のステップ99、102〜104、108A、図28のステップ139、142〜144、148A)ことを特徴とする。
この構成によれば、複数の制御入力および複数の制御量の間で相互干渉が存在し、これらの複数の制御入力が、制御入力算出手段によって算出される。また、相互干渉を抑制するように複数の制御入力をそれぞれ補正するための複数の干渉抑制パラメータが、干渉抑制パラメータ算出手段によって算出されるとともに、算出された干渉抑制パラメータに基づき、制御入力が、補正手段によって補正される。
さらに、これらの複数の干渉抑制パラメータの各々の算出は、複数の制御入力のうちの、算出される干渉抑制パラメータで補正される制御入力以外の制御入力(以下「干渉対象制御入力」という)を入力とし、当該干渉抑制パラメータを出力として構築されたニューラルネットワークを用いて行われる。これにより、複数の制御入力のうちの干渉対象制御入力に応じて、すなわち、干渉抑制パラメータで補正される制御入力と干渉する制御入力のすべてに応じて、干渉抑制パラメータが算出されるので、制御入力を、相互干渉を抑制するように適切に補正することができる。
また、ニューラルネットワークは、非線形系を適切かつ容易にモデル化できるという特性を有するので、プラントが強い非線形性を有する系であっても、干渉対象制御入力を入力とし干渉抑制パラメータを出力とするニューラルネットワークを、適切かつ容易に構築することができる。以上により、本発明によれば、プラントが非線形系であっても、複数の制御入力および複数の制御量の間に存在する相互干渉を適切に抑制でき、それにより複数の制御量を適切に制御することができるとともに、制御装置を容易に設計することができる。
さらに、前述した構成によれば、複数の制御量のそれぞれの目標となる複数の目標値が、目標値設定手段によって設定されるとともに、複数の制御量が設定された複数の目標値にそれぞれなるように、複数の制御入力が算出される。これにより、複数の制御量が、複数の目標値にそれぞれなるように制御される。
また、干渉抑制パラメータで補正された制御入力により制御された複数の制御量の各々が対応する目標値になるように、ニューラルネットワークに用いられるパラメータであるニューロンパラメータが、学習手段によって、検出された制御量と目標値との比較結果に基づく報酬を用いた強化学習により学習される。このように学習されたニューラルネットワークを用いて算出された干渉抑制パラメータに基づいて制御入力を補正するので、相互干渉をより適切に抑制することができる。
さらに、ニューロンパラメータを学習する学習手法として、強化学習が用いられる。強化学習は、報酬を与えておけば、ニューロンパラメータを最適な値に自動的に学習するという特性を有しており、誤差逆伝播法(バックプロパゲーション)と異なり、教師信号を設定する必要がない。したがって、制御装置をより容易に設計することができる。同じ理由により、相互干渉の態様が互いに異なる複数の制御入力および複数の制御量ごとにニューラルネットワークを構築する場合でも、前述した従来の場合と異なり、モデル式を始めから設定する必要がなく、この構築を容易に行うことができる。したがって、この場合にも、制御装置を容易に設計することができる。
なお、特許請求の範囲および本明細書における「検出」には、センサなどによる直接的な検出に加え、演算による算出や推定を含むものとする。
また、前述した構成によれば、ニューロンパラメータの学習が、ニューラルネットワークごとに行われる。さらに、ニューロンパラメータを学習する前に、複数の制御入力のうちの、ニューロンパラメータが学習されるニューラルネットワーク(以下「学習対象ニューラルネットワーク」という)に対応する干渉抑制パラメータで補正される制御入力である学習対象用制御入力が、検出された、対応する制御量(以下「学習対象用制御量」という)がその目標値になるように、所定のフィードバック制御アルゴリズムによって算出される。さらに、複数の制御入力のうちの学習対象用制御入力以外の制御入力である非学習対象用制御入力が、一定の第1所定値に保持されるとともに、干渉抑制パラメータに基づく複数の制御入力の補正が停止される。これにより、非学習対象用制御入力に対応する制御量(以下「非学習対象用制御量」という)が、第1所定値に対応した一定値に保持される。また、学習対象用制御量は、上記のように算出された学習対象用制御入力により制御されることによって、目標値に収束した状態に保持される。
そして、ニューロンパラメータの学習が開始されると、この学習中、非学習対象用制御入力が、第1所定値とは異なる一定の第2所定値に保持されるとともに、学習対象用ニューラルネットワーク以外のニューラルネットワークに対応する干渉抑制パラメータに基づく補正が停止される。それに加え、学習対象用制御入力が、上記のフィードバック制御アルゴリズムによって算出されずに、学習の開始直前に算出された値に保持される。以上により、学習の開始時、学習の開始直前に設定された目標値に収束した状態に保持されていた学習対象用制御量は、この目標値からずれるようになる。また、以上の動作から明らかなように、学習の開始時における学習対象用制御量と目標値との比較結果は、非学習対象用制御入力が干渉することによる学習対象用制御量の変動分を良好に表す。
さらに、ニューロンパラメータの学習中、学習対象用制御入力が、対応する干渉抑制パラメータに基づいて補正されるとともに、補正された学習対象用制御入力により制御された学習対象用制御量が学習の開始直前に設定された目標値になるように、この目標値と、検出された学習対象用制御量との比較結果に基づく報酬を用いて、ニューロンパラメータの強化学習が行われる。上述したように、学習の開始時における学習対象用制御量と目標値との比較結果は、非学習対象用制御入力が干渉することによる学習対象用制御量の変動分を良好に表すので、学習の開始時における目標値とそのときの学習対象用制御量との比較結果に基づく報酬を用いて上記のように学習を行うことにより、ニューロンパラメータを適切に学習することができる。
請求項2に係る発明は、請求項1に記載のプラント51の制御装置1において、プラント51は、スロットル弁15の開度(スロットル弁開度TH)を変更するためのスロットル弁機構(THアクチュエータ15a)と、吸気弁5のリフト(バルブリフトLift)を変更するための可変バルブリフト機構14とを備える内燃機関3を含み、複数の制御入力は、スロットル弁15の開度を制御するための開度制御パラメータ(目標スロットル弁開度TH_cmd)および吸気弁5のリフトを制御するためのリフト制御パラメータ(目標バルブリフトLift_cmd)であり、複数の制御量は、内燃機関3の吸気通路4内の圧力(吸気圧PBa)および吸入空気量Gcylaであることを特徴とする。
この構成によれば、プラントは、非線形系である内燃機関を含み、複数の制御入力は、スロットル弁の開度を制御するための開度制御パラメータおよび吸気弁のリフトを制御するためのリフト制御パラメータであり、複数の制御量は、内燃機関の吸気通路内の圧力および吸入空気量である。前述した従来の制御装置の説明から明らかなように、開度制御パラメータおよびリフト制御パラメータ、ならびに、吸気通路内の圧力および吸入空気量の間には、相互干渉が存在する。これに対して、本発明によれば、請求項1の説明から明らかなように、非線形系である内燃機関を含むプラントにおいて、上記の相互干渉を適切に抑制でき、それにより、吸気通路内の圧力および吸入空気量を適切に制御することができる。
請求項3に係る発明は、請求項1に記載のプラント111の制御装置71において、プラント111は、既燃ガスの一部を第1EGRガスとして吸気通路83に還流させる第1EGR装置(低圧用スロットル弁84、LPTHアクチュエータ84a、低圧EGR装置90)と、既燃ガスの一部を第2EGRガスとして、吸気通路83の第1EGR装置よりも気筒81a側の位置に還流させる第2EGR装置(高圧用スロットル弁87、HPTHアクチュエータ87a、高圧EGR装置91)とを備える内燃機関81を含み、複数の制御入力は、第1EGR装置を制御するための第1EGR制御パラメータ(目標低圧用スロットル弁開度LPTH_cmd)および第2EGR装置を制御するための第2EGR制御パラメータ(目標高圧用スロットル弁開度HPTH_cmd)であり、複数の制御量は、第1EGRガスの流量(低圧EGRガス流量LPEGR)および第2EGRガスの流量(高圧EGRガス流量HPEGR)であることを特徴とする。
この構成によれば、プラントは、非線形系である内燃機関を含み、複数の制御入力は、第1EGR装置を制御するための第1EGR制御パラメータおよび第2EGR装置を制御するための第2EGR制御パラメータであり、複数の制御量は、第1EGRガスの流量および第2EGRガスの流量である。第1および第2EGRガスは、同じ吸気通路に還流することから、第1EGR装置の制御によって、第1EGRガスの流量だけでなく、第2EGRガスの流量も変化し、また、第2EGR装置の制御によって、第2EGRガスの流量だけでなく、第1EGRガスの流量も変化する。このことから明らかなように、制御入力としての第1および第2EGR制御パラメータ、ならびに、制御量としての第1および第2EGRガスの流量の間には、相互干渉が存在する。
これに対して、本発明によれば、請求項1の説明から明らかなように、非線形系である内燃機関を含むプラントにおいて、上記の相互干渉を適切に抑制でき、それにより、第1および第2EGRガスの流量を適切に制御することができる。
以下、図面を参照しながら、まず、本発明の第1実施形態による制御装置について詳細に説明する。図1および図2に示す内燃機関(以下「エンジン」という)3は、車両(図示せず)に動力源として搭載された、ガソリンエンジンである。エンジン3は、4つの気筒3a(1つのみ図示)と、これらの気筒3aに吸気を導入するための吸気通路4と、気筒3aごとに設けられた吸気弁5(1つのみ図示)と、吸気弁5を駆動するための吸気動弁機構11を備えている。エンジン3には、気筒3aごとに、気筒3a内におけるピストン3bとシリンダヘッド3cの間に、燃焼室3dが形成されている(いずれも1つのみ図示)。
上記の吸気通路4は、その下流側の吸気マニホルドにおいて4つの分岐部に分岐しており、これら4つの分岐部は、シリンダヘッド3cに接続されるとともに、4つの気筒3aにそれぞれ連通している。また、吸気動弁機構11は、吸気カムシャフト12、吸気カム13、可変バルブリフト機構14を有している。この吸気カムシャフト12は、タイミングベルト(図示せず)を介して、エンジン3のクランクシャフト3eに連結されている。これにより、吸気カムシャフト12は、クランクシャフト3eが2回転するごとに1回転する。吸気カム13は、気筒3aごとに、吸気カムシャフト12に一体に設けられている。
上記の可変バルブリフト機構14は、吸気カム13の回転に伴って吸気弁5を開閉するとともに、吸気弁5のリフト(以下「バルブリフト」という)を変更することによって、エンジン3に吸入される吸入空気量を変更可能に構成されている。なお、本実施形態では、バルブリフトは、吸気弁5の最大揚程を表すものとする。また、可変バルブリフト機構14は、気筒3aごとに設けられた四節リンク式のロッカアーム機構14aと、これらのロッカアーム機構14aを同時に駆動するリフトアクチュエータ14b(図3参照)を有している。可変バルブリフト機構14は、本出願人によって提案された特許第4300239号公報に開示されたものと同様に構成されているので、その構成についての説明を省略するとともに、以下、バルブリフトを変更する際の動作について、簡単に説明する。
可変バルブリフト機構14では、リフトアクチュエータ14bは、ロッカアーム機構14aに連結された短アーム(図示せず)を有しており、この短アームが回動することにより、ロッカアーム機構14aが駆動されることによって、バルブリフトが無段階に変更される。この場合、制御装置1の後述するECU2からのリフト制御入力Uliftをリフトアクチュエータ14bに入力することにより、短アームの回動角を変更することによって、バルブリフトが変更され、それにより、吸入空気量が制御される。
また、エンジン3には、回動角センサ21が設けられており(図3参照)、この回動角センサ21は、リフトアクチュエータ14bの短アームの回動角θliftを検出し、その検出信号をECU2に出力する。上述したように、短アームの回動角θliftに応じて、バルブリフトが変化することから、ECU2は、この回動角θliftに基づいて、バルブリフトLiftを算出する。
さらに、エンジン3には、クランク角センサ22が設けられている。このクランク角センサ22は、マグネットロータおよびMREピックアップで構成されており、クランクシャフト3eの回転に伴い、パルス信号であるCRKa信号をECU2に出力する。CRKa信号は、所定のクランク角ごとに出力され、ECU2は、このCRKa信号に基づき、エンジン3の回転数(以下「エンジン回転数」という)NEaを算出する。
また、前述した吸気通路4には、スロットル弁15が設けられている。このスロットル弁15は、バタフライ弁で構成されており、電動機で構成されたTHアクチュエータ15aに連結されている。スロットル弁15の開度(以下「スロットル弁開度」という)は、ECU2からの後述するスロットル制御入力UthがTHアクチュエータ15aに入力されることによって、変更され、それにより、スロットル弁15よりも下流側の吸気通路4内の圧力(以下「吸気圧」という)が制御される。さらに、スロットル弁開度THは、例えばポテンショメータで構成されたスロットル弁開度センサ23によって検出され、その検出信号はECU2に出力される。
また、吸気通路4のスロットル弁15よりも上流側には、エアフローセンサ24が設けられている。このエアフローセンサ24は、例えば熱線式エアフローメータで構成されており、吸気通路4内を流れる空気の流量(以下「空気流量」という)Qinaを検出し、その検出信号をECU2に出力する。
さらに、吸気通路4のスロットル弁15よりも下流側には、吸気圧センサ25、吸気温センサ26および燃料噴射弁16が設けられている。燃料噴射弁16は、気筒3aごとに設けられており、ECU2による制御によって燃料を吸気通路4内に噴射する。この場合、燃料噴射弁16による燃料噴射量、すなわち燃料噴射弁16の開弁時間は、ECU2により算出された燃料噴射量TOUTaに基づいて制御される。
上記の吸気圧センサ25は、例えば半導体圧力センサで構成されており、吸気圧PBaを絶対圧として検出し、その検出信号をECU2に出力する。また、吸気温センサ26は、例えばサーミスタで構成されており、吸気通路4内を流れる空気の温度(以下「吸気温」という)TAを検出し、その検出信号をECU2に出力する。ECU2は、算出されたエンジン回転数NEa、検出された空気流量Qina、吸気圧PBaおよび吸気温TAに応じて、エンジン3に実際に吸入される吸入空気量Gcylaを算出する。この算出手法は、本出願人によって提案された特開2006−132429号公報に開示された手法と同様であるので、その詳細な説明については省略する。
また、エンジン3のシリンダヘッド3cには、点火プラグ17(図3参照)が取り付けられている。この点火プラグ17は、ECU2による制御によって放電し、それにより、燃焼室3d内の混合気を燃焼させる。
さらに、エンジン3には、EGR通路18aおよびEGR制御弁18bを有するEGR装置18が設けられている。EGR通路18aは、吸気通路4におけるスロットル弁15の下流側と、排気通路6に接続されている。このEGR通路18aを介して、エンジン3の排ガスの一部がEGRガスとして吸気通路4に還流することにより、エンジン3の燃焼室3d内の燃焼温度が低下し、排ガス中のNOxが低減される。
また、EGR制御弁18bは、リニア電磁弁であり、そのバルブリフト量がECU2により制御されることによって、EGR通路18aを開閉し、それにより、吸気通路4に還流するEGRガスの流量(以下「EGRガス流量」という)が制御される。さらに、EGR制御弁18bの実際のバルブリフト量(以下「EGRリフト量」という)EGRLIFTは、EGRリフトセンサ27によって検出され、その検出信号はECU2に出力される。
また、排気通路6は、その下流側の排気マニホルドにおいて4つの分岐部に分岐しており、これら4つの分岐部は、シリンダヘッド3cに接続されるとともに、4つの気筒3aにそれぞれ連通している。さらに、排気通路6には、これらの分岐部の集合部付近に、排気マニホルド圧センサ28および排気マニホルド温センサ29が設けられている。この排気マニホルド圧センサ28は、当該集合部を流れる排ガスの圧力(以下「排気マニホルド圧」という)Pemaを検出し、その検出信号をECU2に出力する。また、排気マニホルド温センサ29は、集合部を流れる排ガスの温度(以下「排気マニホルド温」という)Temaを検出し、その検出信号をECU2に出力する。
ECU2にはさらに、アクセル開度センサ30から、車両のアクセルペダル(図示せず)の操作量(以下「アクセル開度」という)APaを表す検出信号が、出力される。
ECU2は、CPU、RAM、ROMおよびI/Oインターフェース(いずれも図示せず)などからなるマイクロコンピュータで構成されている。また、ECU2は、上述した各種のセンサ21〜30からの検出信号に応じ、ROMに記憶された制御プログラムに従って、エンジン3を制御する。
具体的には、ECU2は、図4に示す目標値算出部41、偏差算出部42、第1コントローラ43、第2コントローラ44、第1干渉抑制値算出部45、第2干渉抑制値算出部46、第1加算器47、および第2加算器48から成るプラント制御部を有している。このプラント制御部は、エンジン3を含むプラント51を制御するためのものである。
図5に示すように、このプラント51は、目標スロットル弁開度TH_cmdおよび目標バルブリフトLift_cmdを制御入力とし、吸気圧PBaおよび吸入空気量Gcylaを制御量とする系として定義され、具体的には、THコントローラ52、リフトコントローラ53およびエンジン3などで構成されている。これらのコントローラ52および53は、ECU2によって構成されている。上記の目標スロットル弁開度TH_cmdおよび目標バルブリフトLift_cmdはそれぞれ、スロットル弁開度THおよびバルブリフトLiftの目標値であり、後述するように算出される。
また、THコントローラ52には、検出されたスロットル弁開度THと目標スロットル弁開度TH_cmdが入力される。THコントローラ52は、入力されたスロットル弁開度THおよび目標スロットル弁開度TH_cmdに応じ、所定のフィードバック制御アルゴリズムによって、例えば目標値フィルタ型の2自由度応答指定型制御アルゴリズムによって、前述したスロットル制御入力Uthを算出するとともに、THアクチュエータ15aに出力する。これにより、スロットル弁開度THが、目標スロットル弁開度TH_cmdに収束するように制御される。この目標値フィルタ型の2自由度応答指定型制御アルゴリズムは、本出願人によって提案された特開2006−132429号公報に開示されたものと同様であるので、その詳細な説明については省略する。
また、リフトコントローラ53には、算出されたバルブリフトLiftと目標バルブリフトLift_cmdが入力される。リフトコントローラ53は、入力されたバルブリフトLiftおよび目標バルブリフトLift_cmdに応じ、所定のフィードバック制御アルゴリズムによって、例えば上記の目標値フィルタ型の2自由度応答指定型制御アルゴリズムによって、前述したリフト制御入力Uliftを算出するとともに、リフトアクチュエータ14bに出力する。これにより、バルブリフトLiftが、目標バルブリフトLift_cmdに収束するように制御される。
以上のようなプラント51では、スロットル弁開度THが目標スロットル弁開度TH_cmdに収束するように制御されると、それに伴って、吸気圧PBaが変化するとともに、吸入空気量Gcylaも変化する。また、バルブリフトLiftが目標バルブリフトLift_cmdに収束するように制御されると、それに伴って、吸入空気量Gcylaが変化するとともに、吸気圧PBaも変化する。以上のように、このプラント51は、制御入力としての目標スロットル弁開度TH_cmdおよび目標バルブリフトLift_cmd、ならびに、制御量としての吸気圧PBaおよび吸入空気量Gcylaの間に、相互干渉が存在する干渉系となっている。
このため、前述した図4に示すプラント制御部では、上記の相互干渉を抑制しながら、吸気圧PBaおよび吸入空気量Gcylaを適切に制御できるような制御入力として、目標スロットル弁開度TH_cmdおよび目標バルブリフトLift_cmdがそれぞれ算出される。以下、プラント制御部を構成する前述した目標値算出部41などについて、詳細に説明する。
この目標値算出部41は、算出されたエンジン回転数NEaと、要求トルクTREQaに応じ、所定の第1マップおよび第2マップ(いずれも図示せず)を検索することによって、目標吸気圧PB_cmdおよび目標吸気量Gcyl_cmdをそれぞれ算出するとともに、偏差算出部42に出力する。これらの目標吸気圧PB_cmdおよび目標吸気量Gcyl_cmdはそれぞれ、吸気圧PBaおよび吸入空気量Gcylaの目標値である。また、この要求トルクTREQaは、エンジン3に要求されるトルクであり、エンジン回転数NEaと、検出されたアクセル開度APaに応じ、所定のマップ(図示せず)を検索することによって算出される。
偏差算出部42には、上記の目標吸気圧PB_cmdおよび目標吸気量Gcyl_cmdに加え、吸気圧PBaと、算出された吸入空気量Gcylaが入力される。偏差算出部42は、目標吸気圧PB_cmdと吸気圧PBaとの偏差を、吸気圧偏差Dpbとして算出するとともに、目標吸気量Gcyl_cmdと吸入空気量Gcylaとの偏差を、吸気量偏差Dgcylとして算出する。また、算出された吸気圧偏差Dpbは、第1コントローラ43および第2干渉抑制値算出部46に出力され、吸気量偏差Dgcylは、第2コントローラ44および第1干渉抑制値算出部45に出力される。
第1コントローラ43は、入力された吸気圧偏差Dpbに応じ、所定のフィードバック制御アルゴリズムによって、例えば応答指定型制御アルゴリズムによって、目標スロットル弁開度の暫定値TH_smc_cmdを算出する。これにより、暫定値TH_smc_cmdは、吸気圧PBaが目標吸気圧PB_cmdに収束するような値に算出される。また、算出された暫定値TH_smc_cmdは、第1干渉抑制値算出部45および第1加算器47に出力される。この応答指定型制御アルゴリズムは、本出願人によって提案された特開2006−132429号公報に開示されたものと同様であるので、その詳細な説明については省略する。
第2コントローラ44は、入力された吸気量偏差Dgcylに応じ、所定のフィードバック制御アルゴリズムによって、例えば上記の応答指定型制御アルゴリズムによって、目標バルブリフトの暫定値Lift_smc_cmdを算出する。これにより、暫定値Lift_smc_cmdは、吸入空気量Gcylaが目標吸気量Gcyl_cmdに収束するような値に算出される。また、算出された暫定値Lift_smc_cmdは、第2干渉抑制値算出部46および第2加算器48に出力される。
第1および第2干渉抑制値算出部45,46は、ニューラルネットワークを用いて、第1干渉抑制値Lift_dc_cmdおよび第2干渉抑制値TH_dc_cmdをそれぞれ算出するものである。この第1干渉抑制値Lift_dc_cmdは、目標スロットル弁開度TH_cmdによる吸入空気量Gcylaへの干渉を抑制するために、目標バルブリフトLift_cmdを補正するためのパラメータである。また、第2干渉抑制値TH_dc_cmdは、目標バルブリフトLift_cmdによる吸気圧PBaへの干渉を抑制するために、目標スロットル弁開度TH_cmdを補正するためのパラメータである。
これらの第1および第2干渉抑制値算出部45,46で用いられるニューラルネットワークは、図6に示す3階層型のニューラルネットワークNNであり、入力層はm(mは2以上の整数)個のニューロン(3つのみ図示)を、中間層はm×(n−1)[nは2以上の整数]個のニューロン(6つのみ図示)を、出力層はm+1個のニューロンをそれぞれ備えている。
このニューラルネットワークNNでは、入力Uが次式(1)に示すように定義される。また、入力層では、入力Uに基づき、値V1jが、j=1〜mとして、次式(2)〜(4)により算出されるとともに、中間層に出力される。
上記式(3)において、fは、シグモイド関数であり、上記式(4)で定義される。また、式(4)において、βはシグモイド関数の傾きゲインを、εはシグモイド関数のオフセット値を、それぞれ表している。また、上記式(1)〜(3)や後述する式における記号(k)付きの各離散データは、所定の制御周期ΔT(例えば10msec)で繰り返しサンプリングまたは算出されたデータであることを示しており、記号k(kは正の整数)は、各離散データのサンプリングまたは算出サイクルの順番を表している。この場合、(k)付きのデータは、当該データの今回値であり、(k−1)付きのデータは、前回値である。なお、以下の説明において、今回値であることを表す記号(k)の表記を適宜、省略する。
上記式(8)において、gは、シグモイド関数であり、上記式(9)で定義される。また、式(9)において、αはシグモイド関数の出力ゲインを、γはシグモイド関数の傾きゲインを、δはシグモイド関数のオフセット値を、それぞれ表している。
より具体的には、図7に示すように、第1干渉抑制値算出部45には、前述した吸気量偏差Dgcylおよび暫定値TH_smc_cmdに加え、エンジン3の運転状態を表す運転状態パラメータなどが、入力される。この運転状態パラメータには、エンジン回転数NEa、要求トルクTREQa、推定EGR率EGR_esta、燃料噴射量TOUTa、吸気圧PBa、検出された排気マニホルド圧Pema、および吸入空気量Gcylaなどが含まれる。第1干渉抑制値算出部45にはさらに、目標スロットル弁開度の前回値TH_cmd(k−1)、目標バルブリフトの前回値Lift_cmd(k−1)、第1干渉抑制値の前回値Lift_dc_cmd(k−1)、および目標バルブリフトの暫定値Lift_smc_cmdが入力される。
また、上記の推定EGR率EGR_estaは、エンジン3に吸入される吸入空気量Gcyla(新気+EGRガス)に対するEGRガスの量の比率の推定値である。具体的には、推定EGR率EGR_estaは、次のようにして算出される。すなわち、EGR制御弁18bをノズルとみなしたノズルの式に基づく物理式に従い、吸気圧PBa、検出された排気マニホルド圧Pema、EGRリフト量EGRLIFT、排気マニホルド温Temaに応じて、エンジン3に実際に吸入されるEGRガス流量を算出する。次いで、算出されたEGRガス流量を吸入空気量Gcylaで除算することによって、推定EGR率EGR_estaが算出される。この物理式は、本出願人によって提案された特願2010−137132号に開示されたものと同様であるので、その詳細な説明については省略する。
第1干渉抑制値算出部45は、入力された上記の複数のパラメータに応じ、上述した図6と同様の3階層型のニューラルネットワークを用いて、第1干渉抑制値Lift_dc_cmdを次のようにして算出する。まず、入力層では、上記のエンジン回転数NEaなどの複数のパラメータを入力Uaとして、値Va1jを、次式(10)〜(13)により算出するとともに、中間層に出力する。
上記式(12)において、faは、上記式(13)で定義されるシグモイド関数である。また、この式(13)において、βaはシグモイド関数の傾きゲインを、εaはシグモイド関数のオフセット値を、それぞれ表している。これらの値βaおよびεaは、実験などにより所定値に設定されている。
また、中間層では、入力された値Va1jに基づき、値Vaijを、i=2〜nとして、次式(14)および(15)により算出するとともに、出力層に出力する。この式(14)において、ωaは、重み係数であり、後述する学習部61によって学習され、設定される。
上記式(17)において、gaは、上記式(18)で定義されるシグモイド関数である。また、この式(18)において、αaはシグモイド関数の出力ゲインを、γaはシグモイド関数の傾きゲインを、δaはシグモイド関数のオフセット値を、それぞれ表している。これらの値αa,γa,δaは、実験などにより所定値に設定されている。
また、算出された出力Yaは、第1干渉抑制値Lift_dc_cmdとして設定されるとともに、第2加算器48に出力される。
さらに、図7に示すように、第2干渉抑制値算出部46には、前述した吸気圧偏差Dpbおよび暫定値Lift_smc_cmdに加え、エンジン3の運転状態パラメータなどが、入力される。この運転状態パラメータには、第1干渉抑制値算出部45の場合と同様、エンジン回転数NEa、要求トルクTREQa、推定EGR率EGR_esta、燃料噴射量TOUTa、吸気圧PBa、検出された排気マニホルド圧Pema、および吸入空気量Gcylaなどが含まれる。第2干渉抑制値算出部46にはさらに、目標バルブリフトの前回値Lift_cmd(k−1)、目標スロットル弁開度の前回値TH_cmd(k−1)、第2干渉抑制値の前回値TH_dc_cmd(k−1)、および目標スロットル弁開度の暫定値TH_smc_cmdが入力される。
第2干渉抑制値算出部46は、入力された上記の複数のパラメータに応じ、図6と同様の3階層型のニューラルネットワークを用いて、第2干渉抑制値TH_dc_cmdを次のようにして算出する。まず、入力層では、上記のエンジン回転数NEaなどの複数のパラメータを入力Ubとして、値Vb1jを、次式(19)〜(22)によって算出するとともに、中間層に出力する。
上記式(21)において、fbは、上記式(22)で定義されるシグモイド関数である。また、この式(22)において、βbはシグモイド関数の傾きゲインを、εbはシグモイド関数のオフセット値を、それぞれ表しており、これらの値βbおよびεbは、実験などにより所定値に設定されている。
また、中間層では、入力された値Vb1jに基づき、値Vbijを、i=2〜nとして、次式(23)および(24)により算出するとともに、出力層に出力する。この式(23)において、ωbは、重み係数であり、学習部61によって学習され、設定される。
上記式(26)において、gbは、上記式(27)で定義されるシグモイド関数である。また、この式(27)において、αbはシグモイド関数の出力ゲインを、γbはシグモイド関数の傾きゲインを、δbはシグモイド関数のオフセット値を、それぞれ表している。これらの値αb,γb,δbは、実験などにより所定値に設定されている。
また、算出された出力Ybは、第2干渉抑制値TH_dc_cmdとして設定されるとともに、第1加算器47に出力される。
第1加算器47は、入力された暫定値TH_smc_cmdに、第2干渉抑制値TH_dc_cmdを加算することによって、目標スロットル弁開度TH_cmdを算出する。これにより、目標スロットル弁開度TH_cmdは、第2干渉抑制値TH_dc_cmdに基づいて、前述した相互干渉を抑制するように補正される。また、算出された目標スロットル弁開度TH_cmdは、前述したTHコントローラ52に出力される。
第2加算器48は、入力された暫定値Lift_smc_cmdに、第1干渉抑制値Lift_dc_cmdを加算することによって、目標バルブリフトLift_cmdを算出する。これにより、目標バルブリフトLift_cmdは、第1干渉抑制値Lift_dc_cmdに基づいて、前述した相互干渉を抑制するように補正される。また、算出された目標バルブリフトLift_cmdは、前述したリフトコントローラ53に出力される。
次に、図8〜図15を参照しながら、学習部61によって行われる前述した重み係数ωaおよびωbの学習について説明する。この学習は、車両の出荷前または出荷後の点検時にサービス工場において、エンジン3を運転した状態で行われる。
図8および図9に示すように、学習部61には、吸気量偏差Dgcylおよび吸気圧偏差Dpbが入力される。学習部61は、入力された吸気量偏差Dgcylおよび吸気圧偏差Dpbに応じ、強化学習によって、重み係数ωaおよびωbの学習をそれぞれ別個に行う。また、学習部61は、当該学習により算出された重み係数の学習値ωaGを、第1干渉抑制値算出部45に出力するとともに、重み係数の学習値ωbGを、第2干渉抑制値算出部46に出力する。これにより、重み係数ωaおよびωbが、学習され、更新される。図10および図11は、重み係数ωaを学習するための第1学習処理を示している。本処理は、図5および図8に示す各種の要素によって、前述した制御周期ΔTで繰り返し実行される。
まず、図10のステップ1(「S1」と図示。以下同じ)では、第1学習完了フラグF_LEDONEaが「1」であるか否かを判別する。この第1学習完了フラグF_LEDONEaは、重み係数ωaの学習が完了したときに、「1」にセットされるものであり、車両の点検の開始時に、「0」にリセットされる。
上記ステップ1の答がNOで、学習が完了していないときには、第1学習準備動作完了フラグF_LEARNaが「1」であるか否かを判別する(ステップ2)。この第1学習準備動作完了フラグF_LEARNaは、重み係数ωaの学習のための準備動作(以下「第1学習準備動作」という)が完了していることを、「1」で表すものであり、車両の点検の開始時に、「0」にリセットされる。
この答がNOで、第1学習準備動作が完了していないときには、目標吸気量Gcyl_cmdを、前述したようにエンジン回転数NEaおよび要求トルクTREQaに応じたマップ検索によって算出する(ステップ3)。次いで、算出された目標吸気量Gcyl_cmdと吸入空気量Gcylaとの偏差として、吸気量偏差Dgcylを算出する(ステップ4)。
次に、上記ステップ4で算出された吸気量偏差Dgcylがほぼ値0であるか否かを判別する(ステップ5)。この答がNOのときには、目標スロットル弁開度TH_cmdを一定の第1所定値THREF1に設定する(ステップ6)。このステップ6の実行に伴い、前述したTHコントローラ52によって、スロットル弁開度THが、目標スロットル弁開度TH_cmdに収束するように制御される。また、第2干渉抑制値TH_dc_cmdに基づく目標スロットル弁開度TH_cmdの補正が行われず、当該補正は停止される。
ステップ6に続くステップ7では、目標バルブリフトの暫定値Lift_smc_cmdを、吸気量偏差Dgcylに応じ、前述した応答指定型制御アルゴリズムによって算出する。次いで、算出された暫定値Lift_smc_cmdを、目標バルブリフトLift_cmdとして設定し(ステップ8)、本処理を終了する。このステップ8の実行に伴い、前述したリフトコントローラ53によって、バルブリフトLiftが、目標バルブリフトLift_cmdに収束するように制御される。また、第1干渉抑制値Lift_dc_cmdに基づく目標バルブリフトLift_cmdの補正が行われず、当該補正は停止される。
一方、上記ステップ5の答がYESで、吸気量偏差Dgcylがほぼ値0になったときには、そのときに得られている目標バルブリフトLift_cmdを、学習用目標リフトLift_cmdGとして設定する(ステップ9)。次いで、目標吸気量Gcyl_cmdを、学習用目標吸気量Tgt_gcylとして設定する(ステップ10)。
次に、ステップ11および12においてそれぞれ、値0までダウンカウントされる待機タイマのタイマ値tMDELaおよび学習タイマのタイマ値tLEAaを、所定の待機時間TMDELaおよび学習時間TLEAaに設定する。この待機時間TMDELaは、スロットル弁開度THの変化が吸入空気量Gcylaに反映されるまでのむだ時間に設定されており、例えば0.2secに設定されている。また、学習時間TLEAaは、重み係数ωaの学習を十分に行えるような時間に設定されており、例えば1.0secに設定されている。
上記ステップ12に続くステップ13では、第1学習準備動作が完了したとして、そのことを表すために、第1学習準備動作完了フラグF_LEARNaを「1」に設定し、図11のステップ14に進む。また、このステップ13を実行した後には、前記ステップ2の答がYESになり、その場合には、前記ステップ3〜13をスキップし、ステップ14に進む。
以上のように、本処理が開始されると、まず、第1学習準備動作が行われる。この第1学習準備動作の実行中、第2干渉抑制値TH_dc_cmdによる補正が停止されるとともに、スロットル弁開度THが、一定の第1所定値THREF1に保持される(ステップ6)。また、第1干渉抑制値Lift_dc_cmdによる補正が停止されるとともに、目標バルブリフトLift_cmdが、吸気量偏差Dgcylに基づき、フィードバック制御アルゴリズムである応答指定型制御アルゴリズムによって、算出される(ステップ7、8)。これにより、バルブリフトLiftが制御されることによって、吸入空気量Gcylaが、目標吸気量Gcyl_cmdに収束するように制御される。
そして、吸入空気量Gcylaが目標吸気量Gcyl_cmdに収束し、吸気量偏差Dgcylがほぼ値0になる(ステップ5:YES)と、そのときに得られている目標バルブリフトLift_cmd、すなわち、吸気量偏差Dgcylがほぼ値0になったときに算出された目標バルブリフトLift_cmdが、学習用目標リフトLift_cmdGとして設定される(ステップ9)。また、そのときの目標吸気量Gcyl_cmdが、学習用目標吸気量Tgt_gcylとして設定される(ステップ10)とともに、第1学習準備動作が完了したと判定される(ステップ13)。
以上から明らかなように、学習用目標吸気量Tgt_gcylは、スロットル弁開度THが一定の第1所定値THREF1に保持された状態で吸入空気量Gcylaが目標吸気量Gcyl_cmdに収束しているときの目標吸気量Gcyl_cmdに、設定される。また、学習用目標リフトLift_cmdGは、スロットル弁開度THが第1所定値THREF1に保持された状態で吸入空気量Gcylaが目標吸気量Gcyl_cmdすなわち学習用目標吸気量Tgt_gcylに収束するような値に、設定される。
図11のステップ14では、前記ステップ12で設定された学習タイマのタイマ値tLEAaが値0であるか否かを判別する。この答がNOのときには、ステップ15および16においてそれぞれ、目標スロットル弁開度の暫定値TH_smc_cmdおよび目標スロットル弁開度TH_cmdを、一定の第2所定値THREF2に設定する。この第2所定値THREF2は、前述した第1所定値THREF1よりも大きな値に設定されている。
このステップ16の実行に伴い、THコントローラ52によって、スロットル弁開度THが、目標スロットル弁開度TH_cmdに収束するように制御される。また、第2干渉抑制値TH_dc_cmdに基づく目標スロットル弁開度TH_cmdの補正は行われず、当該補正は停止される。
上記ステップ16に続くステップ17では、前記ステップ11で設定された待機タイマのタイマ値tMDELaが値0であるか否かを判別する。この答がNOのときには、目標バルブリフトLift_cmdを前記ステップ9で設定された学習用目標リフトLift_cmdGに設定し(ステップ18)、本処理を終了する。このステップ18の実行に伴い、リフトコントローラ53によって、バルブリフトLiftが、目標バルブリフトLift_cmdすなわち学習用目標リフトLift_cmdGに収束するように制御される。また、第1干渉抑制値Lift_dc_cmdに基づく目標バルブリフトLift_cmdの補正は行われず、当該補正は停止される。
一方、上記ステップ17の答がYES(tMDELa=0)のとき、すなわち、第1学習準備動作が完了してから、待機時間TMDELaがすでに経過しているときには、前記ステップ10で設定された学習用目標吸気量Tgt_gcylと吸入空気量Gcylaとの偏差として、吸気量偏差Dgcylを算出する(ステップ19)。次いで、算出された吸気量偏差Dgcylが、第1所定値stgcylLおよび第2所定値stgcylHで規定される所定の範囲内にあるか否かを判別する(ステップ20)。
この答がNOのときには、値0までダウンカウントされる安定タイマのタイマ値tSTBaを、所定の安定時間TSTBa(例えば2.0sec)に設定する(ステップ21)とともに、吸気量偏差の絶対値|Dgcyl|を所定の最大偏差Dgcyl_maxで除算することによって、正規化吸気量偏差Fdgcylを算出する(ステップ22)。この最大偏差Dgcyl_maxは、吸気量偏差の絶対値|Dgcyl|がとりうる最大の値に設定されている。
次いで、算出された正規化吸気量偏差Fdgcylと要求トルクTREQaに基づき、図12に示す所定のマップを検索することによって、報酬値Rw_gcylを算出する(ステップ23)。同図において、TREQa1、TREQa2およびTREQa3はそれぞれ、要求トルクTREQaの第1所定値、第2所定値および第3所定値(TREQa1<TREQa2<TREQa3)である。なお、要求トルクTREQaが第1〜第3所定値TREQa1〜TREQa3以外のときには、報酬値Rw_gcylは、補間演算によって求められる。
上記のマップでは、報酬値Rw_gcylは、基本的には、正規化吸気量偏差Fdgcylが小さいほど、より大きな値にリニアに設定されており、また、正規化吸気量偏差Fdgcylが値0のときにその最大値に設定されている。また、報酬値Rw_gcylは、要求トルクTREQaに応じて次のように設定されている。すなわち、要求トルクTREQaが最も小さい第1所定値TREQa1のときには、報酬値Rw_gcylは、正規化吸気量偏差Fdgcylの全体(値0≦Fdgcyl≦値1.0)に対して、Fdgcyl値が小さいほど、より大きな値にリニアに設定されている。
また、要求トルクTREQaが中間の第2所定値TREQa2(>TREQa1)のときには、正規化吸気量偏差Fdgcylに対する報酬値Rw_gcylの傾きは、値0≦Fdgcyl≦第1所定値Fdgcyl1の範囲では、より大きな値に設定されており、Fdgcyl>第1所定値Fdgcyl1の範囲では、より小さな値に設定されている。さらに、要求トルクTREQaが最も大きい第3所定値TREQa3(>TREQa2)のときには、正規化吸気量偏差Fdgcylに対する報酬値Rw_gcylの傾きは、値0≦Fdgcyl≦第2所定値Fdgcyl2の範囲では、より大きな値に設定されており、Fdgcyl>Fdgcyl2の範囲では、より小さな値に設定されている。また、これらの第1および第2所定値Fdgcyl1,Fdgcyl2は、値0<Fdgcyl2<Fdgcyl1<値1.0の関係を満たすように設定されている。
上記の説明から明らかなように、図12のマップでは、正規化吸気量偏差Fdgcylに対する報酬値Rw_gcylの傾きが比較的大きい範囲が、要求トルクTREQaが小さいほど、より大きく設定されている。これは、要求トルクTREQaが小さいほど、すなわちエンジン3の負荷が低いほど、目標バルブリフトLift_cmdに対する吸入空気量Gcylaの感度が高いことから、正規化吸気量偏差Fdgcylのより大きな範囲に対して、報酬値Rw_gcylをきめ細かく設定するためである。
上記ステップ23に続くステップ24では、ステップ23で算出された報酬値Rw_gcylに基づき、重み係数ωaを強化学習によって学習する。この学習は次のようにして行われる。すなわち、まず、そのときに設定されている重み係数ωa(前回値)を、その学習値ωaGとして、算出された報酬値Rw_gcylと対応させて、複数のバッファの1つに順次、記憶する。次いで、重み係数ωa(今回値)を、実験により予め設定された互いに異なる複数の所定値の1つにランダムに設定する。なお、今回が学習開始後の1回目のループであるときには、前記ステップ18から明らかなように、重み係数ωaがまだ設定されていないので、学習値ωaGは、値0に設定されるとともに、報酬値Rw_gcylと対応させて記憶される。
上記ステップ24に続くステップ25では、目標バルブリフトの暫定値Lift_smc_cmdを、前記ステップ9で設定された学習用目標リフトLift_cmdGに設定する。次いで、ステップ26において、第1干渉抑制値算出部45の説明で述べたようにして、第1干渉抑制値Lift_dc_cmdを算出する。すなわち、エンジン回転数NEaなどの運転状態パラメータや、前記ステップ19で算出された吸気量偏差Dgcyl、前記ステップ15で設定された目標スロットル弁開度の暫定値TH_smc_cmdなどを入力とし、ニューラルネットワークを用いて、第1干渉抑制値Lift_dc_cmdを算出する。
次に、上記ステップ25で設定された暫定値Lift_smc_cmdに、ステップ26で算出された第1干渉抑制値Lift_dc_cmdを加算することによって、目標バルブリフトLift_cmdを算出し(ステップ27)、本処理を終了する。このステップ27の実行に伴い、リフトコントローラ53によって、バルブリフトLiftが、目標バルブリフトLift_cmdに収束するように制御される。
以上のように、第1学習準備動作が完了する(ステップ2:YES)と、第2干渉抑制値TH_dc_cmdによる補正が、第1学習準備動作の実行中と同様に停止されるとともに、スロットル弁開度THが、第1所定値THREF1から一定の第2所定値THREF2にステップ状に変化するように制御され、第2所定値THREF2に保持される(ステップ16)。また、目標バルブリフトLift_cmdが、学習用目標リフトLift_cmdGに保持される(ステップ18)。前述したように、この学習用目標リフトLift_cmdGは、スロットル弁開度THが第1所定値THREF1に保持されている状態で吸入空気量Gcylaが学習用目標吸気量Tgt_gcylに収束するような値に、設定されている。以上から明らかなように、ステップ16および18の実行によって、吸入空気量Gcylaは、学習用目標吸気量Tgt_gcylからずれるように変化する。また、この場合における学習用目標吸気量Tgt_gcylに対する吸入空気量Gcylaのずれ分は、目標スロットル弁開度TH_cmdが干渉することによる吸入空気量Gcylaの変動分を良好に表す。
そして、第1学習準備動作が完了してから待機時間TMDELaが経過する(ステップ17:YES)と、重み係数ωaの学習が開始される(ステップ19および22〜24)。このように、第1学習準備動作が完了してから待機時間TMDELaが経過するのを待って学習を開始するのは、ステップ16および18の実行によって吸入空気量Gcylaが学習用目標吸気量Tgt_gcylから確実にずれた状態で、すなわち、目標スロットル弁開度TH_cmdによる干渉の影響が吸入空気量Gcylaに確実に反映された状態で、学習を行うためである。
また、この学習中、吸気量偏差の絶対値|Dgcyl|に比例する正規化吸気量偏差Fdgcylが小さいほど、報酬値Rw_gcylがより大きな値に算出される(ステップ23)。さらに、そのときに得られている重み係数ωaすなわちその前回値が、学習値ωaGとして、今回の報酬値Rw_gcylと対応させて、複数のバッファの1つに順次、記憶されるとともに、重み係数ωaの今回値が、複数の所定値の1つにランダムに設定される(ステップ24)。
そして、上記のように設定された重み係数ωaを適用したニューラルネットワークを用いて、第1干渉抑制値Lift_dc_cmdが算出される(ステップ26)。また、算出された第1干渉抑制値Lift_dc_cmdを、学習用目標リフトLift_cmdGに設定された暫定値Lift_smc_cmdに加算することによって、目標バルブリフトLift_cmdが算出される(ステップ27)。すなわち、目標バルブリフトLift_cmdが第1干渉抑制値Lift_dc_cmdに基づいて補正される。
一方、前記ステップ20の答がYESで、吸気量偏差Dgcylが前述した第1および第2所定値stgcylL,stgcylHで規定される所定の範囲内にあるときには、前記ステップ21で設定された安定タイマのタイマ値tSTBaが値0であるか否かを判別する(ステップ28)。この答がNOのときには、前記ステップ22以降を実行する。
一方、上記ステップ28の答がYES(tSTBa=0)になったとき、すなわち、吸気量偏差Dgcylが第1および第2所定値stgcylL,stgcylHで規定される所定の範囲内にある状態が、安定時間TSTBaにわたって継続したときには、吸入空気量Gcylaが学習用目標吸気量Tgt_gcylにほぼ収束した状態で安定しているとして、重み係数ωaの学習が完了したと判定する。そして、前記ステップ24で記憶された複数の学習値ωaGのうちの、最も大きな報酬値Rw_gcylに対応するものを読み出し、重み係数ωaとして設定し、重み係数ωaを更新する(ステップ28A)とともに、学習が完了したことを表すために、第1学習完了フラグF_LEDONEaを「1」にセットし(ステップ29)、本処理を終了する。また、このステップ29を実行した後には、図10の前記ステップ1の答がYESになり、その場合には、そのまま本処理を終了する。
一方、前記ステップ14の答がYES(tLEAa=0)になったとき、すなわち、第1学習準備動作が完了してから、学習時間TLEAaが経過したときには、前記ステップ24などによる重み係数ωaの学習が十分に行われているため、当該学習が完了したと判定する。そして、上記ステップ28Aを実行することによって、記憶された複数の学習値ωaGのうちの、最も大きな報酬値Rw_gcylに対応するものを重み係数ωaとして設定し、重み係数ωaを更新するとともに、学習が完了したことを表すために、上記ステップ29を実行し、本処理を終了する。
以上のように、吸気量偏差Dgcylが所定の範囲内にある状態が安定時間TSTBaにわたって継続したという条件、および、第1学習準備動作が完了してから学習時間TLEAaが経過したという条件の一方が成立すると、その時点で学習が完了したと判定される。
次に、図13および図14を参照しながら、前述した第2干渉抑制値算出部46で用いられる重み係数ωbを学習するための第2学習処理について説明する。本処理も、上述した第1学習処理と同様、図5および図8に示す各種の要素によって、制御周期ΔTで繰り返し実行される。また、第2学習処理では、重み係数ωbの学習が第1学習処理の場合と同様にして行われる。
まず、図13のステップ41では、第2学習完了フラグF_LEDONEbが「1」であるか否かを判別する。この第2学習完了フラグF_LEDONEbは、重み係数ωbの学習が完了したときに、「1」にセットされるものであり、車両の点検の開始時に、「0」にリセットされる。
上記ステップ41の答がNOで、学習が完了していないときには、第2学習準備動作完了フラグF_LEARNbが「1」であるか否かを判別する(ステップ42)。この第2学習準備動作完了フラグF_LEARNbは、重み係数ωbの学習のための準備動作(以下「第2学習準備動作」という)が完了していることを、「1」で表すものであり、車両の点検の開始時に、「0」にリセットされる。
この答がNOで、第2学習準備動作が完了していないときには、目標吸気圧PB_cmdを、前述したようにエンジン回転数NEaおよび要求トルクTREQaに応じたマップ検索によって算出する(ステップ43)。次いで、算出された目標吸気圧PB_cmdと吸気圧PBaとの偏差として、吸気圧偏差Dpbを算出する(ステップ44)。
次に、上記ステップ44で算出された吸気圧偏差Dpbがほぼ値0であるか否かを判別する(ステップ45)。この答がNOのときには、目標バルブリフトLift_cmdを一定の第1所定値LiftREF1に設定する(ステップ46)。このステップ46の実行に伴い、リフトコントローラ53によって、バルブリフトLiftが、目標バルブリフトLift_cmdに収束するように制御される。また、第1干渉抑制値Lift_dc_cmdに基づく目標バルブリフトLift_cmdの補正が行われず、当該補正は停止される。
ステップ46に続くステップ47では、目標スロットル弁開度の暫定値TH_smc_cmdを、吸気圧偏差Dpbに応じ、前述した応答指定型制御アルゴリズムによって算出する。次いで、算出された暫定値TH_smc_cmdを、目標スロットル弁開度TH_cmdとして設定し(ステップ48)、本処理を終了する。このステップ48の実行に伴い、THコントローラ52によって、スロットル弁開度THが、目標スロットル弁開度TH_cmdに収束するように制御される。また、第2干渉抑制値TH_dc_cmdに基づく目標スロットル弁開度TH_cmdの補正が行われず、当該補正は停止される。
一方、上記ステップ45の答がYESで、吸気圧偏差Dpbがほぼ値0になったときには、そのときに得られている目標スロットル弁開度TH_cmdを、学習用目標開度TH_cmdGとして設定する(ステップ49)。次いで、目標吸気圧PB_cmdを、学習用目標吸気圧Tgt_pbとして設定する(ステップ50)。
次に、ステップ51および52においてそれぞれ、値0までダウンカウントされる待機タイマのタイマ値tMDELbおよび学習タイマのタイマ値tLEAbを、所定の待機時間TMDELbおよび学習時間TLEAbに設定する。この待機時間TMDELbは、バルブリフトLiftの変化が吸気圧PBaに反映されるまでのむだ時間に設定されており、例えば0.1secに設定されている。また、学習時間TLEAbは、重み係数ωbの学習を十分に行えるような時間に設定されており、例えば0.5secに設定されている。
上記ステップ52に続くステップ53では、第2学習準備動作が完了したとして、そのことを表すために、第2学習準備動作完了フラグF_LEARNbを「1」に設定し、図14のステップ54に進む。また、このステップ53を実行した後には、前記ステップ42の答がYESになり、その場合には、前記ステップ43〜53をスキップし、ステップ54に進む。
以上のように、本処理が開始されると、まず、第2学習準備動作が行われる。この第2学習準備動作の実行中、第1干渉抑制値Lift_dc_cmdによる補正が停止されるとともに、バルブリフトLiftが、一定の第1所定値LiftREF1に保持される(ステップ46)。また、第2干渉抑制値TH_dc_cmdによる補正が停止されるとともに、目標スロットル弁開度TH_cmdが、吸気圧偏差Dpbに基づき、フィードバック制御アルゴリズムである応答指定型制御アルゴリズムによって、算出される(ステップ47、48)。これにより、スロットル弁開度THが制御されることによって、吸気圧PBaが、目標吸気圧PB_cmdに収束するように制御される。
そして、吸気圧PBaが目標吸気圧PB_cmdに収束し、吸気圧偏差Dpbがほぼ値0になる(ステップ45:YES)と、そのときに得られている目標スロットル弁開度TH_cmd、すなわち、吸気圧偏差Dpbがほぼ値0になったときに算出された目標スロットル弁開度TH_cmdが、学習用目標開度TH_cmdGとして設定される(ステップ49)。また、そのときの目標吸気圧PB_cmdが、学習用目標吸気圧Tgt_pbとして設定される(ステップ50)とともに、第2学習準備動作が完了したと判定される(ステップ53)。
以上から明らかなように、学習用目標吸気圧Tgt_pbは、バルブリフトLiftが一定の第1所定値LiftREF1に保持された状態で吸気圧PBaが目標吸気圧PB_cmdに収束しているときの目標吸気圧PB_cmdに、設定される。また、学習用目標開度TH_cmdGは、バルブリフトLiftが第1所定値LiftREF1に保持された状態で吸気圧PBaが目標吸気圧PB_cmdすなわち学習用目標吸気圧Tgt_pbに収束するような値に、設定される。
図14のステップ54では、前記ステップ52で設定された学習タイマのタイマ値tLEAbが値0であるか否かを判別する。この答がNOのときには、ステップ55および56においてそれぞれ、目標バルブリフトの暫定値Lift_smc_cmdおよび目標バルブリフトLift_cmdを、一定の第2所定値LiftREF2に設定する。この第2所定値LiftREF2は、前述した第1所定値LiftREF1よりも大きな値に設定されている。
このステップ56の実行に伴い、リフトコントローラ53によって、バルブリフトLiftが、目標バルブリフトLift_cmdに収束するように制御される。また、第1干渉抑制値Lift_dc_cmdに基づく目標バルブリフトLift_cmdの補正が行われず、当該補正は停止される。
上記ステップ56に続くステップ57では、前記ステップ51で設定された待機タイマのタイマ値tMDELbが値0であるか否かを判別する。この答がNOのときには、目標スロットル弁開度TH_cmdを前記ステップ49で設定された学習用目標開度TH_cmdGに設定し(ステップ58)、本処理を終了する。このステップ58の実行に伴い、THコントローラ52によって、スロットル弁開度THが、目標スロットル弁開度TH_cmdすなわち学習用目標開度TH_cmdGに収束するように制御される。また、第2干渉抑制値TH_dc_cmdに基づく目標スロットル弁開度TH_cmdの補正が行われず、当該補正は停止される。
一方、上記ステップ57の答がYES(tMDELb=0)のとき、すなわち、第2学習準備動作が完了してから、待機時間TMDELbがすでに経過しているときには、前記ステップ50で設定された学習用目標吸気圧Tgt_pbと吸気圧PBaとの偏差として、吸気圧偏差Dpbを算出する(ステップ59)。次いで、算出された吸気圧偏差Dpbが、第1所定値stpbLおよび第2所定値stpbHで規定される所定の範囲内にあるか否かを判別する(ステップ60)。
この答がNOのときには、値0までダウンカウントされる安定タイマのタイマ値tSTBbを、所定の安定時間TSTBb(例えば1.0sec)に設定する(ステップ61)とともに、吸気圧偏差の絶対値|Dpb|を所定の最大偏差Dpb_maxで除算することによって、正規化吸気圧偏差Fdpbを算出する(ステップ62)。この最大偏差Dpb_maxは、吸気圧偏差の絶対値|Dpb|がとりうる最大の値に設定されている。
次いで、算出された正規化吸気圧偏差Fdpbと要求トルクTREQaに基づき、図15に示す所定のマップを検索することによって、報酬値Rw_pbを算出する(ステップ63)。この場合、要求トルクTREQaが前述した第1〜第3所定値TREQa1〜TREQa3以外のときには、報酬値Rw_pbは、補間演算によって求められる。
上記のマップでは、報酬値Rw_pbは、基本的には、正規化吸気圧偏差Fdpbが小さいほど、より大きな値にリニアに設定されており、また、正規化吸気圧偏差Fdpbが値0のときにその最大値に設定されている。また、報酬値Rw_pbは、要求トルクTREQaに応じて次のように設定されている。すなわち、要求トルクTREQaが最も小さい第1所定値TREQa1のときには、報酬値Rw_pbは、正規化吸気圧偏差Fdpbの全体(値0≦Fdpb≦値1.0)に対して、Fdpb値が小さいほど、より大きな値にリニアに設定されている。
また、要求トルクTREQaが中間の第2所定値TREQa2のときには、正規化吸気圧偏差Fdpbに対する報酬値Rw_pbの傾きは、値0≦Fdpb≦第1所定値Fdpb1の範囲では、より大きな値に設定されており、Fdpb>第1所定値Fdpb1の範囲では、より小さな値に設定されている。さらに、要求トルクTREQaが最も大きい第3所定値TREQa3のときには、正規化吸気圧偏差Fdpbに対する報酬値Rw_pbの傾きは、値0≦Fdpb≦第2所定値Fdpb2の範囲では、より大きな値に設定されており、Fdpb>Fdpb2の範囲では、より小さな値に設定されている。また、これらの第1および第2所定値Fdpb1,Fdpb2は、値0<Fdpb2<Fdpb1<値1.0の関係を満たすように設定されている。
上記の説明から明らかなように、図15のマップでは、正規化吸気圧偏差Fdpbに対する報酬値Rw_pbの傾きが比較的大きい範囲が、要求トルクTREQaが小さいほど、より大きく設定されている。これは、要求トルクTREQaが小さいほど、すなわちエンジン3の負荷が低いほど、目標スロットル弁開度TH_cmdに対する吸気圧PBaの感度が高いことから、正規化吸気圧偏差Fdpbのより大きな範囲に対して、報酬値Rw_pbをきめ細かく設定するためである。
上記ステップ63に続くステップ64では、ステップ63で算出された報酬値Rw_pbに基づいて、重み係数ωbを強化学習によって学習する。この学習は次のようにして行われる。すなわち、まず、そのときに設定されている重み係数ωb(前回値)を、その学習値ωbGとして、算出された報酬値Rw_pbと対応させて、複数のバッファの1つに順次、記憶する。次いで、重み係数ωb(今回値)を、実験により予め設定された互いに異なる複数の所定値の1つにランダムに設定する。なお、今回が学習開始後の1回目のループであるときには、前記ステップ58から明らかなように、重み係数ωbがまだ設定されていないので、学習値ωbGは、値0に設定されるとともに、報酬値Rw_pbと対応させて記憶される。
上記ステップ64に続くステップ65では、目標スロットル弁開度の暫定値TH_smc_cmdを、前記ステップ49で設定された学習用目標開度TH_cmdGに設定する。次いで、ステップ66において、第2干渉抑制値算出部46の説明で述べたようにして、第2干渉抑制値TH_dc_cmdを算出する。すなわち、エンジン回転数NEaなどの運転状態パラメータや、前記ステップ59で算出された吸気圧偏差Dpb、前記ステップ55で設定された目標バルブリフトの暫定値Lift_smc_cmdなどを入力とし、ニューラルネットワークを用いて、第2干渉抑制値TH_dc_cmdを算出する。
次に、上記ステップ65で設定された暫定値TH_smc_cmdに、ステップ66で算出された第2干渉抑制値TH_dc_cmdを加算することによって、目標スロットル弁開度TH_cmdを算出し(ステップ67)、本処理を終了する。このステップ67の実行に伴い、THコントローラ52によって、スロットル弁開度THが、目標スロットル弁開度TH_cmdに収束するように制御される。
以上のように、第2学習準備動作が完了する(ステップ42:YES)と、第1干渉抑制値Lift_dc_cmdによる補正が、第2学習準備動作の実行中と同様に停止されるとともに、バルブリフトLiftが、第1所定値LiftREF1から一定の第2所定値LiftREF2にステップ状に変化するように制御され、第2所定値LiftREF2に保持される(ステップ56)。また、目標スロットル弁開度TH_cmdが、学習用目標開度TH_cmdGに保持される(ステップ58)。前述したように、この学習用目標開度TH_cmdGは、バルブリフトLiftが第1所定値LiftREF1に保持されている状態で吸気圧PBaが学習用目標吸気圧Tgt_pbに収束するような値に、設定されている。以上から明らかなように、ステップ56および58の実行によって、吸気圧PBaは、学習用目標吸気圧Tgt_pbからずれるように変化する。また、この場合における学習用目標吸気圧Tgt_pbに対する吸気圧PBaのずれ分は、目標バルブリフトLift_cmdが干渉することによる吸気圧PBaの変動分を良好に表す。
そして、第2学習準備動作が完了してから待機時間TMDELbが経過する(ステップ57:YES)と、重み係数ωbの学習が開始される(ステップ59および62〜64)。このように、第2学習準備動作が完了してから待機時間TMDELbが経過するのを待って学習を開始するのは、ステップ56および58の実行によって吸気圧PBaが学習用目標吸気圧Tgt_pbから確実にずれた状態で、すなわち、目標バルブリフトLift_cmdによる干渉の影響が吸気圧PBaに確実に反映された状態で、学習を行うためである。
また、この学習中、吸気圧偏差の絶対値|Dpb|に比例する正規化吸気圧偏差Fdpbが小さいほど、報酬値Rw_pbがより大きな値に算出される(ステップ63)。さらに、そのときに得られている重み係数ωbすなわちその前回値が、学習値ωbGとして、今回の報酬値Rw_pbと対応させて、複数のバッファの1つに順次、記憶されるとともに、重み係数ωbの今回値が、複数の所定値の1つにランダムに設定される(ステップ64)。
そして、上記のように設定された重み係数ωbを適用したニューラルネットワークを用いて、第2干渉抑制値TH_dc_cmdが算出される(ステップ66)。また、算出された第2干渉抑制値TH_dc_cmdを、学習用目標開度TH_cmdGに設定された暫定値TH_smc_cmdに加算することによって、目標スロットル弁開度TH_cmdが算出される(ステップ67)。すなわち、目標スロットル弁開度TH_cmdが第2干渉抑制値TH_dc_cmdに基づいて補正される。
一方、前記ステップ60の答がYESで、吸気圧偏差Dpbが前述した第1および第2所定値stpbL,stpbHで規定される所定の範囲内にあるときには、前記ステップ61で設定された安定タイマのタイマ値tSTBbが値0であるか否かを判別する(ステップ68)。この答がNOのときには、前記ステップ62以降を実行する。
一方、上記ステップ68の答がYES(tSTBb=0)になったとき、すなわち、吸気圧偏差Dpbが第1および第2所定値stpbL,stpbHで規定される所定の範囲内にある状態が、安定時間TSTBbにわたって継続したときには、吸気圧PBaが学習用目標吸気圧Tgt_pbにほぼ収束した状態で安定しているとして、重み係数ωbの学習が完了したと判定する。そして、前記ステップ64で記憶された複数の学習値ωbGのうちの、最も大きな報酬値Rw_pbに対応するものを読み出し、重み係数ωbとして設定し、重み係数ωbを更新する(ステップ68A)とともに、学習が完了したことを表すために、第2学習完了フラグF_LEDONEbを「1」にセットし(ステップ69)、本処理を終了する。また、このステップ69を実行した後には、図13の前記ステップ41の答がYESになり、その場合には、そのまま本処理を終了する。
一方、前記ステップ54の答がYES(tLEAb=0)になったとき、すなわち、第2学習準備動作が完了してから、学習時間TLEAbが経過したときには、前記ステップ64などによる重み係数ωbの学習が十分に行われているため、当該学習が完了したと判定する。そして、上記ステップ68Aを実行することによって、記憶された複数の学習値ωbGのうちの、最も大きな報酬値Rw_pbに対応するものを重み係数ωbとして設定し、重み係数ωbを更新するとともに、学習が完了したことを表すために、上記ステップ69を実行し、本処理を終了する。
以上のように、吸気圧偏差Dpbが所定の範囲内にある状態が安定時間TSTBbにわたって継続したという条件、および、第2学習準備動作が完了してから学習時間TLEAbが経過したという条件の一方が成立すると、その時点で学習が完了したと判定される。
また、以上の第1実施形態は、特許請求の範囲に記載された請求項1および2に係る発明(以下、総称して「第1発明」という)に対応しており、第1実施形態における各種の要素と、第1発明における各種の要素との対応関係は次のとおりである。すなわち、第1実施形態におけるECU2、第1および第2コントローラ43,44が、第1発明における制御入力算出手段に相当し、第1実施形態におけるECU2、第1および第2干渉抑制値算出部45,46が、第1発明における干渉抑制パラメータ算出手段に相当するとともに、第1実施形態におけるECU2、第1および第2加算器47,48が、第1発明における補正手段に相当する。
また、第1実施形態におけるECU2および目標値算出部41が、第1発明における目標値設定手段に相当し、第1実施形態におけるエアフローセンサ24、吸気圧センサ25、吸気温センサ26およびECU2が、第1発明における制御量検出手段に相当するとともに、第1実施形態におけるECU2および学習部61が、第1発明における学習手段に相当する。さらに、第1実施形態におけるTHアクチュエータ15aが、第1発明におけるスロットル弁機構に相当する。
また、第1実施形態における目標スロットル弁開度TH_cmdおよび目標バルブリフトLift_cmdが、第1発明における制御入力に相当するとともに、第1実施形態における吸気圧PBaおよび吸入空気量Gcylaが、第1発明における制御量に相当する。さらに、第1実施形態における第1および第2干渉抑制パラメータLift_dc_cmd,TH_dc_cmdが、第1発明における干渉抑制パラメータに相当するとともに、第1実施形態における目標吸気圧PB_cmdおよび目標吸気量Gcyl_cmdが、第1発明における目標値に相当する。
また、第1実施形態における報酬値Rw_gcylおよびRw_pbが、第1発明における報酬に相当するとともに、第1実施形態における重み係数ωaおよびωbが、第1発明におけるニューロンパラメータに相当する。さらに、第1実施形態における学習用目標リフトLift_cmdGおよび学習用目標開度TH_cmdGが、第1発明におけるニューロンパラメータの学習の開始直前に算出された値に相当するとともに、第1実施形態における学習用目標吸気量Tgt_gcylおよび学習用目標吸気圧Tgt_pbが、第1発明におけるニューロンパラメータの学習の開始直前に設定された目標値に相当する。また、第1実施形態における目標スロットル弁開度TH_cmdが、第1発明における開度制御パラメータに相当するとともに、第1実施形態における目標バルブリフトLift_cmdが、第1発明におけるリフト制御パラメータに相当する。
以上のように、第1実施形態によれば、エンジン3を含むプラント51において、制御入力としての目標スロットル弁開度TH_cmdおよび目標バルブリフトLift_cmd、ならびに、制御量としての吸気圧PBaおよび吸入空気量Gcylaの間に、相互干渉が存在している。また、第1干渉抑制値Lift_dc_cmdの算出が、目標スロットル弁開度の暫定値TH_smc_cmdを入力とし、第1干渉抑制値Lift_dc_cmdを出力として構築されたニューラルネットワークを用いて行われる。さらに、算出された第1干渉抑制値Lift_dc_cmdに基づいて、目標バルブリフトLift_cmdが補正される。また、第2干渉抑制値TH_dc_cmdの算出が、目標バルブリフトの暫定値Lift_smc_cmdを入力とし、第2干渉抑制値TH_dc_cmdを出力として構築されたニューラルネットワークを用いて行われる。さらに、算出された第2干渉抑制値TH_dc_cmdに基づいて、目標スロットル弁開度TH_cmdが補正される。
以上により、目標スロットル弁開度TH_cmdおよび目標バルブリフトLift_cmdを、相互干渉を抑制するように適切に補正することができる。この場合、プラント51には、非線形系であるエンジン3が含まれるものの、ニューラルネットワークは、非線形系を適切かつ容易にモデル化できるという特性を有するので、第1および第2干渉抑制値Lift_dc_cmd,TH_dc_cmdを算出するためのニューラルネットワークを、適切かつ容易に構築することができる。以上から、非線形系であるプラント51において、目標スロットル弁開度TH_cmdおよび目標バルブリフトLift_cmd、ならびに、吸気圧PBaおよび吸入空気量Gcylaの間に存在する相互干渉を適切に抑制でき、それにより吸気圧PBaおよび吸入空気量Gcylaを適切に制御することができるとともに、制御装置1を容易に設計することができる。
また、ニューラルネットワークに用いられる重み係数ωaおよびωbが、それぞれ別個に、すなわちニューラルネットワークごとに学習される。さらに、重み係数ωaを学習する前に、検出された吸入空気量Gcylaが目標吸気量Gcyl_cmdになるように、目標バルブリフトLift_cmdが、フィードバック制御アルゴリズムである応答指定型制御アルゴリズムによって算出される。さらに、目標スロットル弁開度TH_cmdが、一定の第1所定値THREF1に保持されるとともに、第1および第2干渉抑制値Lift_dc_cmd,TH_dc_cmdにそれぞれ基づく目標バルブリフトLift_cmdおよび目標スロットル弁開度TH_cmdの補正が停止される。以上により、吸入空気量Gcylaは、目標吸気量Gcyl_cmdに収束した状態に保持される。
そして、重み係数ωaの学習が開始されると、目標スロットル弁開度TH_cmdが、第2所定値THREF2に保持されるとともに、第2干渉抑制値TH_dc_cmdに基づく補正が停止される。また、目標バルブリフトの暫定値Lift_smc_cmdが、応答指定型制御アルゴリズムによって算出されず、学習の開始直前に算出された学習用目標リフトLift_cmdGに設定され、保持される。以上により、学習の開始時、学習の開始直前に設定された目標吸気量Gcyl_cmdである学習用目標吸気量Tgt_gcylに収束した状態に保持されていた吸入空気量Gcylaは、この学習用目標吸気量Tgt_gcylからずれるようになる。また、重み係数ωaの学習中、吸気量偏差Dgcylが、学習用目標吸気量Tgt_gcylと吸入空気量Gcylaとの偏差として算出される。前述したように、学習の開始時における吸気量偏差Dgcylは、目標スロットル弁開度TH_cmdが干渉することによる吸入空気量Gcylaの変動分を良好に表す。
さらに、重み係数ωaの学習中、重み係数ωaが複数の所定値の1つに設定され、設定された重み係数ωaを適用したニューラルネットワークを用いて、第1干渉抑制値Lift_dc_cmdが算出されるとともに、算出された第1干渉抑制値Lift_dc_cmdで補正された目標バルブリフトLift_cmdを用いて、吸入空気量Gcylaが制御される。また、この吸入空気量Gcylaの制御によって得られた正規化吸気量偏差Fdgcylが小さいほど、すなわち、吸気量偏差の絶対値|Dgcyl|が小さいほど、報酬値Rw_gcylがより大きな値に算出されるとともに、この報酬値Rw_gcylと対応させて、重み係数ωaが学習値ωaGとして順次、記憶される。さらに、記憶された複数の学習値ωaGのうちの、最も大きな報酬値Rw_gcylに対応する学習値ωaGに、すなわち、学習用目標吸気量Tgt_gcylと吸入空気量Gcylaとの偏差である吸気量偏差の絶対値|Dgcyl|が最も小さくなる学習値ωaGに、重み係数ωaが更新され、学習が完了する。
以上のように、第1干渉抑制値Lift_dc_cmdに応じた目標バルブリフトLift_cmdを用いて制御された吸入空気量Gcylaが、学習用目標吸気量Tgt_gcylになるように、吸気量偏差Dgcylに基づく報酬値Rw_gcylを用いて、重み係数ωaの強化学習が行われる。したがって、重み係数ωaを適切に学習することができる。
また、重み係数ωbの学習も、重み係数ωaの場合と同様にして行われる。すなわち、重み係数ωbを学習する前に、検出された吸気圧PBaが目標吸気圧PB_cmdになるように、目標スロットル弁開度TH_cmdが、応答指定型制御アルゴリズムによって算出される。さらに、目標バルブリフトLift_cmdが、一定の第1所定値LiftREF1に保持されるとともに、第2および第1干渉抑制値TH_dc_cmd,Lift_dc_cmdにそれぞれ基づく目標スロットル弁開度TH_cmdおよび目標バルブリフトLift_cmdの補正が停止される。以上により、吸気圧PBaは、目標吸気圧PB_cmdに収束した状態に保持される。
そして、重み係数ωbの学習が開始されると、目標バルブリフトLift_cmdが、第2所定値LiftREF2に保持されるとともに、第1干渉抑制値Lift_dc_cmdに基づく補正が停止される。また、目標スロットル弁開度の暫定値TH_smc_cmdが、応答指定型制御アルゴリズムによって算出されず、学習の開始直前に算出された学習用目標開度TH_cmdGに設定され、保持される。以上により、学習の開始時、学習の開始直前に設定された目標吸気圧PB_cmdである学習用目標吸気圧Tgt_pbに収束した状態に保持されていた吸気圧PBaは、この学習用目標吸気圧Tgt_pbからずれるようになる。また、重み係数ωbの学習中、吸気圧偏差Dpbが、学習用目標吸気圧Tgt_pbと吸気圧PBaとの偏差として算出される。前述したように、学習の開始時における吸気圧偏差Dpbは、目標バルブリフトLift_cmdが干渉することによる吸気圧PBaの変動分を良好に表す。
さらに、重み係数ωbの学習中、重み係数ωbが複数の所定値の1つに設定され、設定された重み係数ωbを適用したニューラルネットワークを用いて、第2干渉抑制値TH_dc_cmdが算出されるとともに、算出された第2干渉抑制値TH_dc_cmdで補正された目標スロットル弁開度TH_cmdを用いて、吸気圧PBaが制御される。また、この吸気圧PBaの制御によって得られた正規化吸気圧偏差Fdpbが小さいほど、すなわち、吸気圧偏差の絶対値|Dpb|が小さいほど、報酬値Rw_pbがより大きな値に算出されるとともに、この報酬値Rw_pbと対応させて、重み係数ωbが学習値ωbGとして順次、記憶される。さらに、記憶された複数の学習値ωbGのうちの、最も大きな報酬値Rw_pbに対応する学習値ωbGに、すなわち、学習用目標吸気圧Tgt_pbと吸気圧PBaとの偏差である吸気圧偏差の絶対値|Dpb|が最も小さくなる学習値ωbGに、重み係数ωbが更新され、学習が完了する。
以上のように、第2干渉抑制値TH_dc_cmdに応じた目標スロットル弁開度TH_cmdを用いて制御された吸気圧PBaが、学習用目標吸気圧Tgt_pbになるように、吸気圧偏差Dpbに基づく報酬値Rw_pbを用いて、重み係数ωbの強化学習が行われる。したがって、重み係数ωbを適切に学習することができる。
第1実施形態によれば、以上のように学習されたニューラルネットワークを用いて算出された第1および第2干渉抑制値Lift_dc_cmd,TH_dc_cmdに基づいて、目標バルブリフトLift_cmdおよび目標スロットル弁開度TH_cmdをそれぞれ補正するので、相互干渉をより適切に抑制することができる。
さらに、重み係数ωaおよびωbを学習する学習手法として、強化学習が用いられる。強化学習は、報酬を与えておけば、重み係数ωaおよびωbを最適な値に自動的に学習するという特性を有しており、誤差逆伝播法(バックプロパゲーション)と異なり、教師信号を設定する必要がない。したがって、制御装置1をより容易に設計することができる。同じ理由により、相互干渉の態様などが互いに異なる複数の制御入力および複数の制御量ごとにニューラルネットワークを構築する場合でも、前述した従来の場合と異なり、モデル式を始めから設定する必要がなく、この構築を容易に行うことができる。したがって、この場合にも、制御装置を容易に設計することができる。
また、第1および第2干渉抑制値LIft_dc_cmd,TH_dc_cmdの算出を、前述した運転状態パラメータ(エンジン回転数NEaや、要求トルクTREQaなど)に応じて行うので、両者LIft_dc_cmd,TH_dc_cmdを、エンジン3の運転状態を反映させながら、適切に算出することができる。
なお、第1実施形態では、制御入力としての目標スロットル弁開度の暫定値TH_smc_cmdおよび目標バルブリフトの暫定値Lift_smc_cmdを算出するフィードバック制御アルゴリズムとして、応答指定型制御アルゴリズムを用いているが、他の適当なフィードバック制御アルゴリズム、例えば、PID制御アルゴリズムなどを用いてもよい。
また、第1実施形態では、検出された制御量としての吸気圧PBaおよび吸入空気量Gcylaが目標吸気圧PB_cmdおよび目標吸気量Gcyl_cmdにそれぞれなるように、フィードバック制御アルゴリズムによって、暫定値TH_smc_cmdおよびLift_smc_cmdをそれぞれ算出しているが、目標吸気圧PB_cmdおよび目標吸気量Gcyl_cmdに応じたマップ検索によって、暫定値TH_smc_cmdおよびLift_smc_cmdをそれぞれ算出してもよい。この場合、重み係数ωaおよびωbの学習中における吸気量偏差Dgcylおよび吸気圧偏差Dpbの算出に、学習用目標吸気量Tgt_gcylおよび学習用目標吸気圧Tgt_pbに代えて、そのときどきに算出された目標吸気量Gcyl_cmdおよび目標吸気圧PB_cmdが、それぞれ用いられる。
さらに、第1実施形態では、吸入空気量Gcylaを、演算により算出しているが、センサを用いて直接的に検出してもよい。また、第1実施形態では、吸気圧PBaを、吸気圧センサ25により検出しているが、演算により算出してもよい。さらに、第1実施形態では、報酬値Rw_gcylおよびRw_pbを、正規化吸気量偏差Fdgcylおよび正規化吸気圧偏差Fdpbにそれぞれ基づいて、リニア(線形)に設定しているが、非線形に設定してもよい。
また、第1実施形態では、報酬値Rw_gcylを算出するためのパラメータとして、正規化吸気量偏差Fdgcylを用いているが、吸気量偏差Dgcylまたはその絶対値|Dgcyl|を用いてもよい。あるいは、報酬値Rw_gcylを算出するためのパラメータとして、学習用目標吸気量Tgt_gcylと吸入空気量Gcylaとの比較結果を表す他の適当なパラメータ、例えば、学習用目標吸気量Tgt_gcylおよび吸入空気量Gcylaの一方に対する他方の比などを用いてもよい。
このことは、報酬値Rw_pbについても同様に当てはまる。すなわち、報酬値Rw_pbを算出するためのパラメータとして、吸気圧偏差Dpbまたはその絶対値|Dpb|を用いてもよく、あるいは、学習用目標吸気圧Tgt_pbと吸気圧PBaとの比較結果を表す他の適当なパラメータ、例えば、学習用目標吸気圧Tgt_pbおよび吸気圧PBaの一方に対する他方の比などを用いてもよい。
さらに、第1干渉抑制値Lift_dc_cmdを算出するためにニューラルネットワークに入力されるパラメータとして、前述した各種のパラメータに加え、スロットル弁開度THが一定の状態から変化し始めた時点からの経過時間を用いてもよい。吸入空気量Gcylaは、スロットル弁開度THの変化に対し、応答遅れをもって変化することから、そのような応答遅れを良好に反映させながら、第1干渉抑制値Lift_dc_cmdを適切に算出することができる。同様に、第2干渉抑制値TH_dc_cmdを算出するためにニューラルネットワークに入力されるパラメータとして、バルブリフトLiftが一定の状態から変化し始めた時点からの経過時間を用いてもよい。吸気圧PBaは、バルブリフトLiftの変化に対し、応答遅れをもって変化することから、そのような応答遅れを良好に反映させながら、第2干渉抑制値TH_dc_cmdを適切に算出することができる。
また、第1実施形態では、吸気量偏差Dgcylが所定の範囲内にある状態が安定時間TSTBaにわたって継続したという条件、および、第1学習準備動作が完了してから学習時間TLEAaが経過したという条件の一方が成立したときに、それまでに記憶された複数の学習値ωaGのうちの、最も大きな報酬値Rw_gcylに対応するものに重み係数ωaを更新することにより、学習を行っているが、次のようにして行ってもよい。すなわち、上記の2つの条件の一方が成立したときにも、報酬値Rw_gcylを算出するとともに、そのときに設定されている重み係数ωaを学習値ωaGとして、算出された報酬値Rw_gcylと対応させて記憶する。そして、記憶された今回の学習値ωaGを含む複数の学習値ωaGのうちの、最も大きな報酬値Rw_gcylに対応するものに重み係数ωaを更新することにより、学習を行ってもよい。
このことは、重み係数ωbについても同様に当てはまる。すなわち、吸気圧偏差Dpbが所定の範囲内にある状態が安定時間TSTBbにわたって継続したという条件、および、第2学習準備動作が完了してから学習時間TLEAbが経過したという条件の一方が成立したときにも、報酬値Rw_pbを算出するとともに、そのときに設定されている重み係数ωbを学習値ωbGとして、算出された報酬値Rw_pbと対応させて記憶する。そして、記憶された今回の学習値ωbGを含む複数の学習値ωbGのうちの、最も大きな報酬値Rw_pbに対応するものに重み係数ωbを更新することにより、学習を行ってもよい。
さらに、第1実施形態では、報酬値Rw_gcylが算出されるごとに、学習値ωaGを記憶するとともに、記憶された複数の学習値ωaGのうちの、最も大きな報酬値Rw_gcylに対応するものに重み係数ωaを更新しているが、今回算出された報酬値Rw_gcylが、それまでに算出された報酬値Rw_gcylよりも大きいときに限って、そのときに設定されている重み係数ωaを学習値ωaGとして記憶し、学習値ωaGを随時、更新するとともに、記憶された学習値ωaGに重み係数ωaを更新してもよい。これにより、上記と同様の作用を得ることができる。
このことは、学習値ωbGについても同様に当てはまる。すなわち、今回算出された報酬値Rw_pbが、それまでに算出された報酬値Rw_pbよりも大きいときに限って、そのときに設定されている重み係数ωbを学習値ωbGとして記憶し、学習値ωbGを随時、更新するとともに、記憶された学習値ωbGに重み係数ωbを更新してもよい。
また、第1実施形態では、学習のための重み係数ωaの設定および学習値ωaGの記憶(ステップ24)を、第1学習処理を実行するごと(制御周期ΔTごと)に行っているが、吸入空気量GcylaがバルブリフトLiftの変化に対して応答遅れをもって変化するので、この応答遅れに応じた所定時間ごとに行ってもよい。同様に、学習のための重み係数ωbの設定および学習値ωbGの記憶(ステップ64)を、第2学習処理を実行するごと(制御周期ΔTごと)に行っているが、吸気圧PBaがスロットル弁開度THの変化に対して応答遅れをもって変化するので、この応答遅れに応じた所定時間ごとに行ってもよい。
次に、本発明の第2実施形態による制御装置71について説明する。図16は、この制御装置71を適用した内燃機関81を概略的に示しており、図17は、制御装置71のECU72などを示している。同図および後述する他の図面において、第1実施形態と同じ構成要素については、同じ符号を用いて示している。以下、第1実施形態と異なる点を中心に説明する。
この内燃機関(以下「エンジン」という)81は、第1実施形態と異なり、ガソリンエンジンではなく、ディーゼルエンジンであり、車両(図示せず)に動力源として搭載されている。また、エンジン81は、4つの気筒81aと、気筒81aごとに設けられた燃料噴射弁82(図17に1つのみ図示)を備えている。これらの燃料噴射弁82の開弁時間すなわち燃料噴射量は、第1実施形態の場合と同様、ECU72により算出された燃料噴射量TOUTbに基づいて制御される。
また、エンジン81には、第1実施形態で述べたクランク角センサ22が設けられており、クランク角センサ22は、エンジン81のクランクシャフトの回転に伴い、パルス信号であるCRKb信号をECU72に出力する。ECU72は、クランク角センサ22からのCRKb信号に基づいて、エンジン81の回転数(以下「エンジン回転数」という)NEbを算出する。
さらに、4つの気筒81aには、吸気マニホルド83aを介して吸気通路83が連通するとともに、排気マニホルド88aを介して排気通路88が連通している。この吸気通路83には、上流側から順に、第1実施形態で述べたエアフローセンサ24、低圧用スロットル弁84、第1実施形態で述べた吸気圧センサ25、ターボ過給機85、インタークーラ86、高圧用スロットル弁87、および吸気チャンバ圧センサ31が設けられている。
低圧用スロットル弁84は、バタフライ弁で構成されており、後述する低圧EGR通路90aなどとともに低圧EGR装置90を構成するものである。低圧用スロットル弁84には、電動機で構成されたLPTHアクチュエータ84aが連結されている。低圧用スロットル弁84の開度(以下「低圧用スロットル弁開度」という)は、ECU72からの後述するLPTH制御入力UlpthがLPTHアクチュエータ84aに入力されることによって、変更される。これにより、低圧用スロットル弁84よりも下流側の吸気通路83内の圧力(以下「吸気圧」という)が、制御される。また、低圧用スロットル弁開度LPTHは、LPTH開度センサ32によって検出され、その検出信号はECU72に出力される。
また、エアフローセンサ24は、低圧用スロットル弁84を通過する空気の流量(以下「空気流量」という)Qinbを検出し、その検出信号をECU72に出力する。吸気圧センサ25は、吸気圧PBbを絶対圧として検出し、その検出信号をECU72に出力する。ECU72は、算出されたエンジン回転数NEbと、検出された吸気圧PBbに応じ、所定のマップ(図示せず)を検索することによって、エンジン81に実際に吸入される吸入空気量Gcylbを算出する。
さらに、ターボ過給機85は、吸気通路83の吸気圧センサ25よりも下流側に設けられたコンプレッサブレード85aと、排気通路88に設けられ、コンプレッサブレード85aと一体に回転するタービンブレード85bと、複数の可変ベーン85c(2つのみ図示)と、可変ベーン85cを駆動するベーンアクチュエータ85dなどで構成されている。
このターボ過給機85では、排気通路88を流れる排ガスによってタービンブレード85bが回転駆動されると、これと一体のコンプレッサブレード85aも同時に回転することにより、吸気通路83内の空気が加圧される。すなわち、過給動作が実行される。
また、可変ベーン85cは、ターボ過給機85が発生する過給圧を変化させるためのものであり、タービンブレード85bを収容するハウジングに回動自在に取り付けられている。可変ベーン85cは、ECU72に接続されたベーンアクチュエータ85dに連結されている。ECU72は、ベーンアクチュエータ85dを介して可変ベーン85cの開度を変化させ、タービンブレード85bに吹き付けられる排ガス量を変化させることによって、タービンブレード85bの回転数すなわちコンプレッサブレード85aの回転数を変化させ、それにより、過給圧を制御する。
また、インタークーラ86は、水冷式のものであり、その内部を吸気が通過する際、ターボ過給機85の過給動作によって昇温された吸気を冷却する。
さらに、高圧用スロットル弁87は、前述した低圧用スロットル弁84と同様、バタフライ弁で構成されており、後述する高圧EGR通路91aなどとともに高圧EGR装置91を構成するものである。高圧用スロットル弁87には、電動機で構成されたHPTHアクチュエータ87aが連結されている。この高圧用スロットル弁87の開度(以下「高圧用スロットル弁開度」という)は、ECU72からの後述するHPTH制御入力UhpthがHPTHアクチュエータ87aに入力されることによって、変更される。これにより、吸気マニホルド83aの吸気チャンバ83b内の圧力(以下「吸気チャンバ圧」という)が、制御される。また、高圧用スロットル弁開度HPTHは、HPTH開度センサ33によって検出され、その検出信号はECU72に出力される。
また、吸気チャンバ圧センサ31は、例えば半導体圧力センサなどで構成されており、上記の吸気チャンバ圧Pchを絶対圧として検出し、その検出信号をECU72に出力する。
さらに、排気通路88には、上流側から順に、第1実施形態で述べた排気マニホルド圧センサ28、排気マニホルド温センサ29、前記タービンブレード85b、触媒装置89、排気圧センサ34および排気温センサ35が設けられている。
排気マニホルド圧センサ28は、排気マニホルド88a内の圧力(以下「排気マニホルド圧」という)Pembを絶対圧として検出し、その検出信号をECU72に出力する。
触媒装置89は、排気通路88を流れる排ガスを浄化するものであり、酸化触媒やフィルタの組み合わせで構成されている。また、排気圧センサ34は、触媒装置89を通過した排ガスの圧力(以下「排気圧」という)Pexを絶対圧として検出し、その検出信号をECU72に出力する。排気温センサ35は、触媒装置89を通過した排ガスの温度(以下「排気温」という)Texを検出し、その検出信号をECU72に出力する。
エンジン81にはさらに、低圧EGR装置90および高圧EGR装置91が設けられている。この低圧EGR装置90は、排気通路88を流れる排ガスの一部を吸気通路83に還流させるものであり、吸気通路83と排気通路88に接続された低圧EGR通路90aと、低圧EGR通路90aを流れる還流ガス(以下「低圧EGRガス」という)を冷却する低圧EGRクーラ90bと、この低圧EGR通路90aを開閉する低圧EGR制御弁90cなどで構成されている。低圧EGR通路90aの一端は、排気通路88の触媒装置89よりも下流側に接続され、他端は、吸気通路83の低圧用スロットル弁84とコンプレッサブレード85aの間に接続されている。
低圧EGR制御弁90cは、その開度が最大値と最小値との間でリニアに変化するリニア電磁弁で構成されており、低圧EGR制御弁90cの開度(以下「低圧EGR制御弁開度」という)は、ECU72によって変更される。前述した低圧用スロットル弁開度LPTHの変更による吸気圧の制御によって、低圧EGR制御弁90cよりも上流側と下流側の間の差圧が制御されることと、この低圧EGR制御弁開度が変更されることとの協働によって、低圧EGRガスの還流量(以下「低圧EGRガス流量」という)が制御される。
また、低圧EGR制御弁開度LPVTは、LPEGR開度センサ36によって検出され、その検出信号はECU72に出力される。ECU72は、低圧EGRガス流量の目標値である目標低圧EGRガス流量LPEGR_cmdを後述するようにして算出するとともに、算出された目標低圧EGRガス流量LPEGR_cmdに基づき、所定のマップ(図示せず)を検索することによって、低圧EGR制御弁開度LPVTの目標値を算出し、低圧EGR制御弁開度LPVTを算出された目標値になるように制御する。
以上の構成により、この低圧EGR装置90では、低圧EGRガスは、排気通路88の触媒装置89の下流側の部分から低圧EGR通路90aに流入し、図16に矢印X1で示す向きに流れ、低圧EGRクーラ90bおよび低圧EGR制御弁90cを通過した後、吸気通路83に流入する。そして、低圧EGRガスは、新気とともに、コンプレッサブレード85aおよびインタークーラ86を通過した後、吸気マニホルド83aを介して、各気筒81aに流入する。
また、高圧EGR装置91も、低圧EGR装置90と同様に、排気通路88を流れる排ガスの一部を吸気通路83に還流させるものであり、吸気通路83と排気通路88に接続された高圧EGR通路91aと、高圧EGR通路91a内を流れる還流ガス(以下「高圧EGRガス」という)を冷却する高圧EGRクーラ91bと、この高圧EGR通路91aを開閉する高圧EGR制御弁91cなどで構成されている。高圧EGR通路91aの一端は、排気通路88の排気マニホルド88aに接続され、他端は、吸気通路83の吸気マニホルド83aに接続されている。
高圧EGR制御弁91cは、その開度が最大値と最小値との間でリニアに変化するリニア電磁弁で構成されており、高圧EGR制御弁91cの開度(以下「高圧EGR制御弁開度」という)は、ECU72によって変更される。前述した高圧用スロットル弁開度HPTHの変更による吸気チャンバ圧Pchの制御によって、高圧EGR制御弁91cよりも上流側と下流側の間の差圧が制御されることと、この高圧EGR制御弁開度が変更されることとの協働によって、高圧EGRガスの還流量(以下「高圧EGRガス流量」という)が制御される。
また、高圧EGR制御弁開度HPVTは、HPEGR開度センサ37によって検出され、その検出信号はECU72に出力される。ECU72は、高圧EGRガス流量の目標値である目標高圧EGRガス流量HPEGR_cmdを後述するようにして算出するとともに、算出された目標高圧EGRガス流量HPEGR_cmdに基づき、所定のマップ(図示せず)を検索することによって、高圧EGR制御弁開度HPVTの目標値を算出し、高圧EGR制御弁開度HPVTを算出された目標値になるように制御する。
以上の構成により、この高圧EGR装置91では、高圧EGRガスは、排気マニホルド88aから高圧EGR通路91aに流入し、図16に矢印X2で示す向きに流れ、高圧EGRクーラ91bおよび高圧EGR制御弁91cを通過した後、吸気マニホルド83aに流入する。そして、高圧EGRガスは、低圧EGRガスおよび新気とともに、吸気マニホルド83aを介して、各気筒81aに流入する。
ECU72にはさらに、前記アクセル開度センサ30から、アクセル開度APbを表す検出信号が、出力される。
また、ECU72は、第1実施形態と同様、CPU、RAM、ROMおよびI/Oインターフェース(いずれも図示せず)などからなるマイクロコンピュータで構成されている。さらに、ECU72は、前述した各種のセンサ22、24、25、28〜37からの検出信号に応じ、ROMに記憶された制御プログラムに従って、エンジン81を制御する。
具体的には、ECU72は、図18に示す目標値算出部101、偏差算出部102、第1コントローラ103、第2コントローラ104、第1干渉抑制値算出部105、第2干渉抑制値算出部106、第1加算器107、および第2加算器108から成るプラント制御部を有している。このプラント制御部は、エンジン81を含むプラント111を制御するためのものである。
図19に示すように、このプラント111は、目標低圧用スロットル弁開度LPTH_cmdおよび目標高圧用スロットル弁開度HPTH_cmdを制御入力とし、低圧EGRガス流量LPEGRおよび高圧EGRガス流量HPEGRを制御量とする系として定義され、具体的には、LPTHコントローラ112、HPTHコントローラ113およびエンジン81などで構成されている。これらのコントローラ112および113は、ECU72によって構成されている。上記の目標低圧用スロットル弁開度LPTH_cmdおよび目標高圧用スロットル弁開度HPTH_cmdはそれぞれ、低圧用スロットル弁開度LPTHおよび高圧用スロットル弁開度HPTHの目標値であり、後述するように算出される。
また、低圧EGRガス流量LPEGRおよび高圧EGRガス流量HPEGRは、ECU72により次のようにして算出される。すなわち、低圧EGR制御弁90cをノズルとみなしたノズルの式に基づく物理式に従い、吸気圧PBb、検出された排気圧Pex、低圧EGR制御弁開度LPVT、排気温Texに応じて、低圧EGRガス流量LPEGRを算出する。また、高圧EGR制御弁91cをノズルとみなしたノズルの式に基づく物理式に従い、吸気チャンバ圧Pch、検出された排気マニホルド圧Pemb、高圧EGR制御弁開度HPVT、排気マニホルド温Tembに応じて、高圧EGRガス流量HPEGRを算出する。これらの物理式は、本出願人によって提案された特願2010−137132号に開示されたものと同様であるので、その詳細な説明については省略する。
なお、低圧および高圧EGRガス流量LPEGR,HPEGRの算出を、上記の物理式に代えて、ニューラルネットワークを用いて行ってもよい。また、吸気圧PBb、排気圧Pex、吸気チャンバ圧Pchおよび排気マニホルド圧Pembを、センサで検出せずに、演算により算出してもよい。この場合、これらの圧力PBb、Pex、PchおよびPembの算出は、物理式を用いて、または、ニューラルネットワークを用いて行われる。
また、LPTHコントローラ112には、検出された低圧用スロットル弁開度LPTHと目標低圧用スロットル弁開度LPTH_cmdが入力される。LPTHコントローラ112は、入力された低圧用スロットル弁開度LPTHおよび目標低圧用スロットル弁開度LPTH_cmdに応じ、所定のフィードバック制御アルゴリズムによって、例えば前述した目標値フィルタ型の2自由度応答指定型制御アルゴリズムによって、前述したLPTH制御入力Ulpthを算出するとともに、LPTHアクチュエータ84aに出力する。これにより、低圧用スロットル弁開度LPTHが、目標低圧用スロットル弁開度LPTH_cmdに収束するように制御される。
また、HPTHコントローラ113には、検出された高圧用スロットル弁開度HPTHと目標高圧用スロットル弁開度HPTH_cmdが入力される。HPTHコントローラ113は、入力された高圧用スロットル弁開度HPTHおよび目標高圧用スロットル弁開度HPTH_cmdに応じ、所定のフィードバック制御アルゴリズムによって、例えば目標値フィルタ型の2自由度応答指定型制御アルゴリズムによって、前述したHPTH制御入力Uhpthを算出するとともに、HPTHアクチュエータ87aに出力する。これにより、高圧用スロットル弁開度HPTHが、目標高圧用スロットル弁開度HPTH_cmdに収束するように制御される。
以上のようなプラント111では、低圧用スロットル弁開度LPTHが目標低圧用スロットル弁開度LPTH_cmdに収束するように制御されると、それに伴って、低圧EGR制御弁90cの上下流間の差圧が変化することにより低圧EGRガス流量LPEGRが変化するとともに、高圧EGR制御弁91cの上下流間の差圧が変化することにより高圧EGRガス流量HPEGRも変化する。また、高圧用スロットル弁開度HPTHが目標高圧用スロットル弁開度HPTH_cmdに収束するように制御されると、それに伴って、高圧EGR制御弁91cの上下流間の差圧が変化することにより高圧EGRガス流量HPEGRが変化するとともに、低圧EGR制御弁90cの上下流間の差圧が変化することにより低圧EGRガス流量LPEGRも変化する。
以上のように、このプラント111は、制御入力としての目標低圧用スロットル弁開度LPTH_cmdおよび目標高圧用スロットル弁開度HPTH_cmd、ならびに、制御量としての低圧EGRガス流量LPEGRおよび高圧EGRガス流量HPEGRの間に、相互干渉が存在する干渉系となっている。
このため、前述した図18に示すプラント制御部では、上記の相互干渉を抑制しながら、低圧EGRガス流量LPEGRおよび高圧EGRガス流量HPEGRを適切に制御できるような制御入力として、目標低圧用スロットル弁開度LPTH_cmdおよび目標高圧用スロットル弁開度HPTH_cmdがそれぞれ算出される。以下、プラント制御部を構成する前述した目標値算出部101などについて、詳細に説明する。
この目標値算出部101は、エンジン回転数NEbと、要求トルクTREQbに応じ、所定の第1マップおよび第2マップ(いずれも図示せず)を検索することによって、目標低圧EGRガス流量LPEGR_cmdおよび目標高圧EGRガス流量HPEGR_cmdをそれぞれ算出するとともに、偏差算出部102に出力する。前述したように、これらの目標低圧EGRガス流量LPEGR_cmdおよび目標高圧EGRガス流量HPEGR_cmdはそれぞれ、低圧EGRガス流量LPEGRおよび高圧EGRガス流量HPEGRの目標値である。また、この要求トルクTREQbは、エンジン81に要求されるトルクであり、エンジン回転数NEbおよびアクセル開度APbに応じ、所定のマップ(図示せず)を検索することによって算出される。
偏差算出部102には、上記の目標低圧EGRガス流量LPEGR_cmdおよび目標高圧EGRガス流量HPEGR_cmdに加え、算出された低圧EGRガス流量LPEGRおよび高圧EGRガス流量HPEGRが入力される。偏差算出部102は、目標低圧EGRガス流量LPEGR_cmdと低圧EGRガス流量LPEGRとの偏差を、低圧EGRガス流量偏差Dlpとして算出するとともに、目標高圧EGRガス流量HPEGR_cmdと高圧EGRガス流量HPEGRとの偏差を、高圧EGRガス流量偏差Dhpとして算出する。また、算出された低圧EGRガス流量偏差Dlpは、第1コントローラ103および第2干渉抑制値算出部106に出力され、高圧EGRガス流量偏差Dhpは、第2コントローラ104および第1干渉抑制値算出部105に出力される。
第1コントローラ103は、入力された低圧EGRガス流量偏差Dlpに応じ、所定のフィードバック制御アルゴリズムによって、例えば前述した応答指定型制御アルゴリズムによって、目標低圧用スロットル弁開度の暫定値LPTH_smc_cmdを算出する。これにより、暫定値LPTH_smc_cmdは、低圧EGRガス流量LPEGRが目標低圧EGRガス流量LPEGR_cmdに収束するような値に算出される。また、算出された暫定値LPTH_smc_cmdは、第1干渉抑制値算出部105および第1加算器107に出力される。
第2コントローラ104は、入力された高圧EGRガス流量偏差Dhpに応じ、所定のフィードバック制御アルゴリズムによって、例えば応答指定型制御アルゴリズムによって、目標高圧用スロットル弁開度の暫定値HPTH_smc_cmdを算出する。これにより、暫定値HPTH_smc_cmdは、高圧EGRガス流量HPEGRが目標高圧EGRガス流量HPEGR_cmdに収束するような値に算出される。また、算出された暫定値HPTH_smc_cmdは、第2干渉抑制値算出部106および第2加算器108に出力される。
第1および第2干渉抑制値算出部105,106は、ニューラルネットワークを用いて、第1干渉抑制値HPTH_dc_cmdおよび第2干渉抑制値LPTH_dc_cmdをそれぞれ算出するものである。各算出部で用いられるニューラルネットワークは、第1実施形態の場合と同様、図6に示す3階層型のニューラルネットワークNNである。また、この第1干渉抑制値HPTH_dc_cmdは、目標低圧用スロットル弁開度LPTH_cmdによる高圧EGRガス流量HPEGRへの干渉を抑制するために、目標高圧用スロットル弁開度HPTH_cmdを補正するためのパラメータである。また、第2干渉抑制値LPTH_dc_cmdは、目標高圧用スロットル弁開度HPTH_cmdによる低圧EGRガス流量LPEGRへの干渉を抑制するために、目標低圧用スロットル弁開度LPTH_cmdを補正するためのパラメータである。
より具体的には、図20に示すように、第1干渉抑制値算出部105には、前述した高圧EGRガス流量偏差Dhpおよび暫定値LPTH_smc_cmdに加え、エンジン81の運転状態を表す運転状態パラメータなどが、入力される。この運転状態パラメータには、エンジン回転数NEb、要求トルクTREQb、推定EGR率EGR_estb、燃料噴射量TOUTb、吸入空気量Gcylb、排気圧Pex、吸気圧PBb、排気マニホルド圧Pemb、吸気チャンバ圧Pch、低圧EGRガス流量LPEGR、および高圧EGRガス流量HPEGRなどが含まれる。第1干渉抑制値算出部105にはさらに、目標低圧用スロットル弁開度の前回値LPTH_cmd(k−1)、目標高圧用スロットル弁開度の前回値HPTH_cmd(k−1)、第1干渉抑制値の前回値HPTH_dc_cmd(k−1)、および目標高圧用スロットル弁開度の暫定値HPTH_smc_cmdが入力される。
また、上記の推定EGR率EGR_estbは、エンジン81に吸入される吸入空気量Gcylb(新気+EGRガス)に対する、低圧および高圧EGRガス流量LPEGR,HPEGRの和の比である。
第1干渉抑制値算出部105は、入力された上記の複数のパラメータに応じ、3階層型のニューラルネットワークを用いて、第1干渉抑制値HPTH_dc_cmdを次のようにして算出する。まず、入力層では、上記のエンジン回転数NEbなどの複数のパラメータを入力Ucとして、値Vc1jを、次式(28)〜(31)により算出するとともに、中間層に出力する。
上記式(30)において、fcは、上記式(31)で定義されるシグモイド関数である。また、この式(31)において、βcはシグモイド関数の傾きゲインを、εcはシグモイド関数のオフセット値を、それぞれ表している。これらの値βcおよびεcは、実験などにより所定値に設定されている。
また、中間層では、入力された値Vc1jに基づき、値Vcijを、i=2〜nとして、次式(32)および(33)により算出するとともに、出力層に出力する。この式(32)において、ωcは、重み係数であり、後述する学習部121によって学習され、設定される。
上記式(35)において、gcは、上記式(36)で定義されるシグモイド関数である。また、この式(36)において、αcはシグモイド関数の出力ゲインを、γcはシグモイド関数の傾きゲインを、δcはシグモイド関数のオフセット値を、それぞれ表している。これらの値αc,γc,δcは、実験などにより所定値に設定されている。
また、算出された出力Ycは、第1干渉抑制値HPTH_dc_cmdとして設定されるとともに、第2加算器108に出力される。
さらに、図21に示すように、第2干渉抑制値算出部106には、前述した低圧EGRガス流量偏差Dlpおよび暫定値HPTH_smc_cmdに加え、エンジン81の運転状態を表す運転状態パラメータなどが、入力される。この運転状態パラメータには、第1干渉抑制値算出部105の場合と同様、エンジン回転数NEb、要求トルクTREQb、推定EGR率EGR_estb、燃料噴射量TOUTb、吸入空気量Gcylb、排気圧Pex、吸気圧PBb、排気マニホルド圧Pemb、吸気チャンバ圧Pch、低圧EGRガス流量LPEGR、および高圧EGRガス流量HPEGRなどが含まれる。第2干渉抑制値算出部106にはさらに、目標高圧用スロットル弁開度の前回値HPTH_cmd(k−1)、目標低圧用スロットル弁開度の前回値LPTH_cmd(k−1)、第2干渉抑制値の前回値LPTH_dc_cmd(k−1)、および目標低圧用スロットル弁開度の暫定値LPTH_smc_cmdが入力される。
第2干渉抑制値算出部106は、入力された上記の複数のパラメータに応じ、3階層型のニューラルネットワークを用いて、第2干渉抑制値LPTH_dc_cmdを次のようにして算出する。まず、入力層では、上記のエンジン回転数NEbなどの複数のパラメータを入力Udとして、値Vd1jを、次式(37)〜(40)によって算出するとともに、中間層に出力する。
上記式(39)において、fdは、上記式(40)で定義されるシグモイド関数である。また、この式(40)において、βdはシグモイド関数の傾きゲインを、εdはシグモイド関数のオフセット値を、それぞれ表しており、これらの値βdおよびεdは、実験などにより所定値に設定されている。
また、中間層では、入力された値Vd1jに基づき、値Vdijを、i=2〜nとして、次式(41)および(42)により算出するとともに、出力層に出力する。この式(41)において、ωdは、重み係数であり、学習部121によって学習され、設定される。
上記式(44)において、gdは、上記式(45)で定義されるシグモイド関数である。また、この式(45)において、αdはシグモイド関数の出力ゲインを、γdはシグモイド関数の傾きゲインを、δdはシグモイド関数のオフセット値を、それぞれ表している。これらの値αd,γd,δdは、実験などにより所定値に設定されている。
また、算出された出力Ydは、第2干渉抑制値LPTH_dc_cmdとして設定されるとともに、第1加算器107に出力される。
第1加算器107は、入力された暫定値LPTH_smc_cmdに、第2干渉抑制値LPTH_dc_cmdを加算することによって、目標低圧用スロットル弁開度LPTH_cmdを算出する。これにより、目標低圧用スロットル弁開度LPTH_cmdは、第2干渉抑制値LPTH_dc_cmdに基づいて、前述した相互干渉を抑制するように補正される。また、算出された目標低圧用スロットル弁開度LPTH_cmdは、前述したLPTHコントローラ112に出力される。
第2加算器108は、入力された暫定値HPTH_smc_cmdに、第1干渉抑制値HPTH_dc_cmdを加算することによって、目標高圧用スロットル弁開度HPTH_cmdを算出する。これにより、目標高圧用スロットル弁開度HPTH_cmdは、第1干渉抑制値HPTH_dc_cmdに基づいて、前述した相互干渉を抑制するように補正される。また、算出された目標高圧用スロットル弁開度HPTH_cmdは、前述したHPTHコントローラ113に出力される。
次に、図22〜図29を参照しながら、学習部121によって行われる前述した重み係数ωcおよびωdの学習について説明する。この学習は、第1実施形態の場合と同様、車両の出荷前または出荷後の点検時にサービス工場において、エンジン81を運転した状態で行われる。
図22および図23に示すように、学習部121には、高圧EGRガス流量偏差Dhpおよび低圧EGRガス流量偏差Dlpが入力される。学習部121は、入力された高圧EGRガス流量偏差Dhpおよび低圧EGRガス流量偏差Dlpに応じ、強化学習によって、重み係数ωcおよびωdの学習をそれぞれ別個に行う。また、学習部121は、当該学習により算出された重み係数の学習値ωcGを、第1干渉抑制値算出部105に出力するとともに、重み係数の学習値ωdGを、第2干渉抑制値算出部106に出力する。これにより、重み係数ωcおよびωdが、学習され、更新される。図24および図25は、重み係数ωcを学習するための第1学習処理を示している。本処理は、図19および図22に示す各種の要素によって、前述した制御周期ΔTで繰り返し実行される。
まず、図24のステップ81では、第1学習完了フラグF_LEDONEcが「1」であるか否かを判別する。この第1学習完了フラグF_LEDONEcは、重み係数ωcの学習が完了したときに、「1」にセットされるものであり、車両の点検の開始時に、「0」にリセットされる。
上記ステップ81の答がNOで、学習が完了していないときには、第1学習準備動作完了フラグF_LEARNcが「1」であるか否かを判別する(ステップ82)。この第1学習準備動作完了フラグF_LEARNcは、重み係数ωcの学習のための準備動作(以下「第1学習準備動作」という)が完了していることを、「1」で表すものであり、車両の点検の開始時に、「0」にリセットされる。
この答がNOで、第1学習準備動作が完了していないときには、目標高圧EGRガス流量HPEGR_cmdを、前述したようにエンジン回転数NEbおよび要求トルクTREQbに応じたマップ検索によって算出する(ステップ83)。次いで、算出された目標高圧EGRガス流量HPEGR_cmdと高圧EGRガス流量HPEGRとの偏差として、高圧EGRガス流量偏差Dhpを算出する(ステップ84)。
次に、上記ステップ84で算出された高圧EGRガス流量偏差Dhpがほぼ値0であるか否かを判別する(ステップ85)。この答がNOのときには、目標低圧用スロットル弁開度LPTH_cmdを一定の第1所定値LPTHREF1に設定する(ステップ86)。このステップ86の実行に伴い、前述したLPTHコントローラ112によって、低圧用スロットル弁開度LPTHが、目標低圧用スロットル弁開度LPTH_cmdに収束するように制御される。また、第2干渉抑制値LPTH_dc_cmdに基づく目標低圧用スロットル弁開度LPTH_cmdの補正が行われず、当該補正は停止される。
ステップ86に続くステップ87では、目標高圧用スロットル弁開度の暫定値HPTH_smc_cmdを、高圧EGRガス流量偏差Dhpに応じ、前述した応答指定型制御アルゴリズムによって算出する。次いで、算出された暫定値HPTH_smc_cmdを、目標高圧用スロットル弁開度HPTH_cmdとして設定し(ステップ88)、本処理を終了する。このステップ88の実行に伴い、前述したHPTHコントローラ113によって、高圧用スロットル弁開度HPTHが、目標高圧用スロットル弁開度HPTH_cmdに収束するように制御される。また、第1干渉抑制値HPTH_dc_cmdに基づく目標高圧用スロットル弁開度HPTH_cmdの補正が行われず、当該補正は停止される。
一方、上記ステップ85の答がYESで、高圧EGRガス流量偏差Dhpがほぼ値0になったときには、そのときに得られている目標高圧用スロットル弁開度HPTH_cmdを、学習用目標HPTH開度HPTH_cmdGとして設定する(ステップ89)。次いで、目標高圧EGRガス流量HPEGR_cmdを、学習用目標高圧EGRガス流量Tgt_hpegrとして設定する(ステップ90)。
次に、ステップ91および92においてそれぞれ、値0までダウンカウントされる待機タイマのタイマ値tMDELcおよび学習タイマのタイマ値tLEAcを、所定の待機時間TMDELcおよび学習時間TLEAcに設定する。この待機時間TMDELcは、低圧用スロットル弁開度LPTHの変化が高圧EGRガス流量HPEGRに反映されるまでのむだ時間に設定されており、例えば0.5secに設定されている。また、学習時間TLEAcは、重み係数ωcの学習を十分に行えるような時間に設定されており、例えば1.0secに設定されている。
上記ステップ92に続くステップ93では、第1学習準備動作が完了したとして、そのことを表すために、第1学習準備動作完了フラグF_LEARNcを「1」に設定し、図25のステップ94に進む。また、このステップ93を実行した後には、前記ステップ82の答がYESになり、その場合には、前記ステップ83〜93をスキップし、ステップ94に進む。
以上のように、本処理が開始されると、まず、第1学習準備動作が行われる。この第1学習準備動作の実行中、第2干渉抑制値LPTH_dc_cmdによる補正が停止されるとともに、低圧用スロットル弁開度LPTHが、一定の第1所定値LPTHREF1に保持される(ステップ86)。また、第1干渉抑制値HPTH_dc_cmdによる補正が停止されるとともに、目標高圧用スロットル弁開度HPTH_cmdが、高圧EGRガス流量偏差Dhpに基づき、フィードバック制御アルゴリズムである応答指定型制御アルゴリズムによって、算出される(ステップ87、88)。これにより、高圧用スロットル弁開度HPTHが制御されることによって、高圧EGRガス流量HPEGRが、目標高圧EGRガス流量HPEGR_cmdに収束するように制御される。
そして、高圧EGRガス流量HPEGRが目標高圧EGRガス流量HPEGR_cmdに収束し、高圧EGRガス流量偏差Dhpがほぼ値0になる(ステップ85:YES)と、そのときに得られている目標高圧用スロットル弁開度HPTH_cmd、すなわち、高圧EGRガス流量偏差Dhpがほぼ値0になったときに算出された目標高圧用スロットル弁開度HPTH_cmdが、学習用目標HPTH開度HPTH_cmdGとして設定される(ステップ89)。また、そのときの目標高圧EGRガス流量HPEGR_cmdが、学習用目標高圧EGRガス流量Tgt_hpegrとして設定される(ステップ90)とともに、第1学習準備動作が完了したと判定される(ステップ93)。
以上から明らかなように、学習用目標高圧EGRガス流量Tgt_hpegrは、低圧用スロットル弁開度LPTHが一定の第1所定値LPTHREF1に保持された状態で高圧EGRガス流量HPEGRが目標高圧EGRガス流量HPEGR_cmdに収束しているときの目標高圧EGRガス流量HPEGR_cmdに、設定される。また、学習用目標HPTH開度HPTH_cmdGは、低圧用スロットル弁開度LPTHが第1所定値LPTHREF1に保持された状態で高圧EGRガス流量HPEGRが目標高圧EGRガス流量HPEGR_cmdすなわち学習用目標高圧EGRガス流量Tgt_hpegrに収束するような値に、設定される。
図25のステップ94では、前記ステップ92で設定された学習タイマのタイマ値tLEAcが値0であるか否かを判別する。この答がNOのときには、ステップ95および96においてそれぞれ、目標低圧用スロットル弁開度の暫定値LPTH_smc_cmdおよび目標低圧用スロットル弁開度LPTH_cmdを、一定の第2所定値LPTHREF2に設定する。この第2所定値LPTHREF2は、前述した第1所定値LPTHREF1よりも大きな値に設定されている。
このステップ96の実行に伴い、LPTHコントローラ112によって、低圧用スロットル弁開度LPTHが、目標低圧用スロットル弁開度LPTH_cmdに収束するように制御される。また、第2干渉抑制値LPTH_dc_cmdに基づく目標低圧用スロットル弁開度LPTH_cmdの補正は行われず、当該補正は停止される。
上記ステップ96に続くステップ97では、前記ステップ91で設定された待機タイマのタイマ値tMDELcが値0であるか否かを判別する。この答がNOのときには、目標高圧用スロットル弁開度HPTH_cmdを前記ステップ89で設定された学習用目標HPTH開度HPTH_cmdGに設定し(ステップ98)、本処理を終了する。
このステップ98の実行に伴い、HPTHコントローラ113によって、高圧用スロットル弁開度HPTHが、目標高圧用スロットル弁開度HPTH_cmdすなわち学習用目標HPTH開度HPTH_cmdGに収束するように制御される。また、第1干渉抑制値HPTH_dc_cmdに基づく目標高圧用スロットル弁開度HPTH_cmdの補正が行われず、当該補正は停止される。さらに、高圧EGR制御弁開度HPVTは、学習用目標HPTH開度HPTH_cmdGの設定が行われたときに算出されたその目標値に保持される。
一方、上記ステップ97の答がYES(tMDELc=0)のとき、すなわち、第1学習準備動作が完了してから、待機時間TMDELcがすでに経過しているときには、前記ステップ90で設定された学習用目標高圧EGRガス流量Tgt_hpegrから高圧EGRガス流量HPEGRを減算することによって、高圧EGRガス流量偏差Dhpを算出する(ステップ99)。次いで、算出された高圧EGRガス流量偏差Dhpが、第1所定値sthpLおよび第2所定値sthpHで規定される所定の範囲内にあるか否かを判別する(ステップ100)。
この答がNOのときには、値0までダウンカウントされる安定タイマのタイマ値tSTBcを、所定の安定時間TSTBc(例えば2.0sec)に設定する(ステップ101)とともに、高圧EGRガス流量偏差の絶対値|Dhp|を所定の最大偏差Dhp_maxで除算することによって、正規化高圧EGR偏差Fdhpを算出する(ステップ102)。この最大偏差Dhp_maxは、高圧EGRガス流量偏差の絶対値|Dhp|がとりうる最大の値に設定されている。
次いで、算出された正規化高圧EGR偏差Fdhpと要求トルクTREQbに基づき、図26に示す所定のマップを検索することによって、報酬値Rw_hpを算出する(ステップ103)。同図において、TREQb1、TREQb2およびTREQb3はそれぞれ、要求トルクTREQbの第1所定値、第2所定値および第3所定値(TREQb1<TREQb2<TREQb3)である。なお、要求トルクTREQbが第1〜第3所定値TREQb1〜TREQb3以外のときには、報酬値Rw_hpは、補間演算によって求められる。
上記のマップでは、報酬値Rw_hpは、基本的には、正規化高圧EGR偏差Fdhpが小さいほど、より大きな値にリニアに設定されており、また、正規化高圧EGR偏差Fdhpが値0のときにその最大値に設定されている。また、報酬値Rw_hpは、要求トルクTREQbに応じて次のように設定されている。すなわち、要求トルクTREQbが最も小さい第1所定値TREQb1のときには、報酬値Rw_hpは、正規化高圧EGR偏差Fdhpの全体(値0≦Fdhp≦値1.0)に対して、Fdhp値が小さいほど、より大きな値にリニアに設定されている。
また、要求トルクTREQbが中間の第2所定値TREQb2のときには、正規化高圧EGR偏差Fdhpに対する報酬値Rw_hpの傾きは、値0≦Fdhp≦第1所定値Fdhp1の範囲では、より大きな値に設定されており、Fdhp>第1所定値Fdhp1の範囲では、より小さな値に設定されている。さらに、要求トルクTREQbが最も大きい第3所定値TREQb3のときには、正規化高圧EGR偏差Fdhpに対する報酬値Rw_hpの傾きは、値0≦Fdhp≦第2所定値Fdhp2の範囲では、より大きな値に設定されており、Fdhp>Fdhp2の範囲では、より小さな値に設定されている。また、これらの第1および第2所定値Fdhp1,Fdhp2は、値0<Fdhp2<Fdhp1<値1.0の関係を満たすように設定されている。
上記の説明から明らかなように、図26のマップでは、正規化高圧EGR偏差Fdhpに対する報酬値Rw_hpの傾きが比較的大きい範囲が、要求トルクTREQbが小さいほど、より大きく設定されている。これは、要求トルクTREQbが小さいほど、すなわちエンジン81の負荷が低いほど、目標高圧用スロットル弁開度HPTH_cmdに対する高圧EGRガス流量HPEGRの感度が高いことから、正規化高圧EGR偏差Fdhpのより大きな範囲に対して、報酬値Rw_hpをきめ細かく設定するためである。
上記ステップ103に続くステップ104では、ステップ103で算出された報酬値Rw_hpに基づき、重み係数ωcを強化学習によって学習する。この学習は次のようにして行われる。すなわち、まず、そのときに設定されている重み係数ωc(前回値)を、その学習値ωcGとして、算出された報酬値Rw_hpと対応させて、複数のバッファの1つに順次、記憶する。次いで、重み係数ωc(今回値)を、実験により予め設定された互いに異なる複数の所定値の1つにランダムに設定する。なお、今回が学習開始後の1回目のループであるときには、前記ステップ98から明らかなように、重み係数ωcがまだ設定されていないので、学習値ωcGは、値0に設定されるとともに、報酬値Rw_hpと対応させて記憶される。
上記ステップ104に続くステップ105では、目標高圧用スロットル弁開度の暫定値HPTH_smc_cmdを、前記ステップ89で設定された学習用目標HPTH開度HPTH_cmdGに設定する。次いで、ステップ106において、第1干渉抑制値算出部105の説明で述べたようにして、第1干渉抑制値HPTH_dc_cmdを算出する。すなわち、エンジン回転数NEbなどの運転状態パラメータや、前記ステップ99で算出された高圧EGRガス流量偏差Dhp、前記ステップ95で設定された目標低圧用スロットル弁開度の暫定値LPTH_smc_cmdなどを入力とし、ニューラルネットワークを用いて、第1干渉抑制値HPTH_dc_cmdを算出する。
次に、上記ステップ105で設定された暫定値HPTH_smc_cmdに、ステップ106で算出された第1干渉抑制値HPTH_dc_cmdを加算することによって、目標高圧用スロットル弁開度HPTH_cmdを算出し(ステップ107)、本処理を終了する。このステップ107の実行に伴い、HPTHコントローラ113によって、高圧用スロットル弁開度HPTHが、目標高圧用スロットル弁開度HPTH_cmdに収束するように制御される。また、高圧EGR制御弁開度HPVTは、学習用目標HPTH開度HPTH_cmdGの設定が行われたときに算出されたその目標値に保持される。
以上のように、第1学習準備動作が完了する(ステップ82:YES)と、第2干渉抑制値LPTH_dc_cmdによる補正が、第1学習準備動作の実行中と同様に停止されるとともに、低圧用スロットル弁開度LPTHが、第1所定値LPTHREF1から一定の第2所定値LPTHREF2にステップ状に変化するように制御され、第2所定値LPTHREF2に保持される(ステップ96)。また、目標高圧用スロットル弁開度HPTH_cmdが、学習用目標HPTH開度HPTH_cmdGに保持される(ステップ98)。前述したように、この学習用目標HPTH開度HPTH_cmdGは、低圧用スロットル弁開度LPTHが第1所定値LPTHREF1に保持されている状態で高圧EGRガス流量HPEGRが学習用目標高圧EGRガス流量Tgt_hpegrに収束するような値に、設定されている。以上から明らかなように、ステップ96および98の実行によって、高圧EGRガス流量HPEGRは、学習用目標高圧EGRガス流量Tgt_hpegrからずれるように変化する。また、この場合における学習用目標高圧EGRガス流量Tgt_hpegrに対する高圧EGRガス流量HPEGRのずれ分は、目標低圧用スロットル弁開度LPTH_cmdが干渉することによる高圧EGRガス流量HPEGRの変動分を良好に表す。
そして、第1学習準備動作が完了してから待機時間TMDELcが経過する(ステップ97:YES)と、重み係数ωcの学習が開始される(ステップ99および102〜104)。このように、第1学習準備動作が完了してから待機時間TMDELcが経過するのを待って学習を開始するのは、ステップ96および98の実行によって高圧EGRガス流量HPEGRが学習用目標高圧EGRガス流量Tgt_hpegrから確実にずれた状態で、すなわち、目標低圧用スロットル弁開度LPTH_cmdによる干渉の影響が高圧EGRガス流量HPEGRに確実に反映された状態で、学習を行うためである。
また、この学習中、高圧EGRガス流量偏差の絶対値|Dhp|に比例する正規化高圧EGR偏差Fdhpが小さいほど、報酬値Rw_hpがより大きな値に算出される(ステップ103)。さらに、そのときに得られている重み係数ωcすなわちその前回値が、学習値ωcGとして、今回の報酬値Rw_hpと対応させて、複数のバッファの1つに順次、記憶されるとともに、重み係数ωcの今回値が、複数の所定値の1つにランダムに設定される(ステップ104)。
そして、上記のように設定された重み係数ωcを適用したニューラルネットワークを用いて、第1干渉抑制値HPTH_dc_cmdが算出される(ステップ106)。また、算出された第1干渉抑制値HPTH_dc_cmdを、学習用目標HPTH開度HPTH_cmdGに設定された暫定値HPTH_smc_cmdに加算することによって、目標高圧用スロットル弁開度HPTH_cmdが算出される(ステップ107)。すなわち、目標高圧用スロットル弁開度HPTH_cmdが第1干渉抑制値HPTH_dc_cmdに基づいて補正される。
一方、前記ステップ100の答がYESで、高圧EGRガス流量偏差Dhpが前述した第1および第2所定値sthpL,sthpHで規定される所定の範囲内にあるときには、前記ステップ101で設定された安定タイマのタイマ値tSTBcが値0であるか否かを判別する(ステップ108)。この答がNOのときには、前記ステップ102以降を実行する。
一方、上記ステップ108の答がYES(tSTBc=0)になったとき、すなわち、高圧EGRガス流量偏差Dhpが第1および第2所定値sthpL,sthpHで規定される所定の範囲内にある状態が、安定時間TSTBcにわたって継続したときには、高圧EGRガス流量HPEGRが学習用目標高圧EGRガス流量Tgt_hpegrにほぼ収束した状態で安定しているとして、重み係数ωcの学習が完了したと判定する。そして、前記ステップ104で記憶された複数の学習値ωcGのうちの、最も大きな報酬値Rw_hpに対応するものを読み出し、重み係数ωcとして設定し、重み係数ωcを更新する(ステップ108A)とともに、学習が完了したことを表すために、第1学習完了フラグF_LEDONEcを「1」にセットし(ステップ109)、本処理を終了する。また、このステップ109を実行した後には、図24の前記ステップ81の答がYESになり、その場合には、そのまま本処理を終了する。
一方、前記ステップ94の答がYES(tLEAc=0)になったとき、すなわち、第1学習準備動作が完了してから、学習時間TLEAcが経過したときには、前記ステップ104などによる重み係数ωcの学習が十分に行われているため、当該学習が完了したと判定する。そして、上記ステップ108Aを実行することによって、記憶された複数の学習値ωcGのうちの、最も大きな報酬値Rw_hpに対応するものを重み係数ωcとして設定し、重み係数ωcを更新するとともに、学習が完了したことを表すために、上記ステップ109を実行し、本処理を終了する。
以上のように、高圧EGRガス流量偏差Dhpが所定の範囲内にある状態が安定時間TSTBcにわたって継続したという条件、および、第1学習準備動作が完了してから学習時間TLEAcが経過したという条件の一方が成立すると、その時点で学習が完了したと判定される。
次に、図27および図28を参照しながら、前述した第2干渉抑制値算出部106で用いられる重み係数ωdを学習するための第2学習処理について説明する。本処理も、上述した第1学習処理と同様、図19および図22に示す各種の要素によって、制御周期ΔTで繰り返し実行される。また、第2学習処理では、重み係数ωdの学習が第1学習処理の場合と同様にして行われる。
まず、図27のステップ121では、第2学習完了フラグF_LEDONEdが「1」であるか否かを判別する。この第2学習完了フラグF_LEDONEdは、重み係数ωdの学習が完了したときに、「1」にセットされるものであり、車両の点検の開始時に、「0」にリセットされる。
上記ステップ121の答がNOで、学習が完了していないときには、第2学習準備動作完了フラグF_LEARNdが「1」であるか否かを判別する(ステップ122)。この第2学習準備動作完了フラグF_LEARNdは、重み係数ωdの学習のための準備動作(以下「第2学習準備動作」という)が完了していることを、「1」で表すものであり、車両の点検の開始時に、「0」にリセットされる。
この答がNOで、第2学習準備動作が完了していないときには、目標低圧EGRガス流量LPEGR_cmdを、前述したようにエンジン回転数NEbおよび要求トルクTREQbに応じたマップ検索によって算出する(ステップ123)。次いで、算出された目標低圧EGRガス流量LPEGR_cmdと低圧EGRガス流量LPEGRとの偏差として、低圧EGRガス流量偏差Dlpを算出する(ステップ124)。
次に、上記ステップ124で算出された低圧EGRガス流量偏差Dlpがほぼ値0であるか否かを判別する(ステップ125)。この答がNOのときには、目標高圧用スロットル弁開度HPTH_cmdを一定の第1所定値HPTHREF1に設定する(ステップ126)。このステップ126の実行に伴い、HPTHコントローラ113によって、高圧用スロットル弁開度HPTHが、目標高圧用スロットル弁開度HPTH_cmdに収束するように制御される。また、第1干渉抑制値HPTH_dc_cmdに基づく目標高圧用スロットル弁開度HPTH_cmdの補正が行われず、当該補正は停止される。
ステップ126に続くステップ127では、目標低圧用スロットル弁開度の暫定値LPTH_smc_cmdを、低圧EGRガス流量偏差Dlpに応じ、前述した応答指定型制御アルゴリズムによって算出する。次いで、算出された暫定値LPTH_smc_cmdを、目標低圧用スロットル弁開度LPTH_cmdとして設定し(ステップ128)、本処理を終了する。このステップ128の実行に伴い、LPTHコントローラ112によって、低圧用スロットル弁開度LPTHが、目標低圧用スロットル弁開度LPTH_cmdに収束するように制御される。また、第2干渉抑制値LPTH_dc_cmdに基づく目標低圧用スロットル弁開度LPTH_cmdの補正が行われず、当該補正は停止される。
一方、上記ステップ125の答がYESで、低圧EGRガス流量偏差Dlpがほぼ値0になったときには、そのときに得られている目標低圧用スロットル弁開度LPTH_cmdを、学習用目標LPTH開度LPTH_cmdGとして設定する(ステップ129)。次いで、目標低圧EGRガス流量LPEGR_cmdを、学習用目標低圧EGRガス流量Tgt_lpegrとして設定する(ステップ130)。
次に、ステップ131および132においてそれぞれ、値0までダウンカウントされる待機タイマのタイマ値tMDELdおよび学習タイマのタイマ値tLEAdを、所定の待機時間TMDELdおよび学習時間TLEAdに設定する。この待機時間TMDELdは、高圧用スロットル弁開度HPTHの変化が、低圧EGRガス流量LPEGRに反映されるまでのむだ時間に設定されており、例えば0.5secに設定されている。また、学習時間TLEAdは、重み係数ωdの学習を十分に行えるような時間に設定されており、例えば1.0secに設定されている。
上記ステップ132に続くステップ133では、第2学習準備動作が完了したとして、そのことを表すために、第2学習準備動作完了フラグF_LEARNdを「1」に設定し、図28のステップ134に進む。また、このステップ133を実行した後には、前記ステップ122の答がYESになり、その場合には、前記ステップ123〜133をスキップし、ステップ134に進む。
以上のように、本処理が開始されると、まず、第2学習準備動作が行われる。この第2学習準備動作の実行中、第1干渉抑制値HPTH_dc_cmdによる補正が停止されるとともに、高圧用スロットル弁開度HPTHが、一定の第1所定値HPTHREF1に保持される(ステップ126)。また、第2干渉抑制値LPTH_dc_cmdによる補正が停止されるとともに、目標低圧用スロットル弁開度LPTH_cmdが、低圧EGRガス流量偏差Dlpに基づき、フィードバック制御アルゴリズムである応答指定型制御アルゴリズムによって、算出される(ステップ127、128)。これにより、低圧用スロットル弁開度LPTHが制御されることによって、低圧EGRガス流量LPEGRが、目標低圧EGRガス流量LPEGR_cmdに収束するように制御される。
そして、低圧EGRガス流量LPEGRが目標低圧EGRガス流量LPEGR_cmdに収束し、低圧EGRガス流量偏差Dlpがほぼ値0になる(ステップ125:YES)と、そのときに得られている目標低圧用スロットル弁開度LPTH_cmd、すなわち、低圧EGRガス流量偏差Dlpがほぼ値0になったときに算出された目標低圧用スロットル弁開度LPTH_cmdが、学習用目標LPTH開度LPTH_cmdGとして設定される(ステップ129)。また、そのときの目標低圧EGRガス流量LPEGR_cmdが、学習用目標低圧EGRガス流量Tgt_lpegrとして設定される(ステップ130)とともに、第2学習準備動作が完了したと判定される(ステップ133)。
以上から明らかなように、学習用目標低圧EGRガス流量Tgt_lpegrは、高圧用スロットル弁開度HPTHが一定の第1所定値HPTHREF1に保持された状態で低圧EGRガス流量LPEGRが目標低圧EGRガス流量LPEGR_cmdに収束しているときの目標低圧EGRガス流量LPEGR_cmdに、設定される。また、学習用目標LPTH開度LPTH_cmdGは、高圧用スロットル弁開度HPTHが第1所定値HPTHREF1に保持された状態で低圧用EGRガス量LPEGRが目標低圧用EGRガス流量LPEGR_cmdすなわち学習用目標低圧EGRガス流量Tgt_lpegrに収束するような値に、設定される。
図28のステップ134では、前記ステップ132で設定された学習タイマのタイマ値tLEAdが値0であるか否かを判別する。この答がNOのときには、ステップ135および136においてそれぞれ、目標高圧用スロットル弁開度の暫定値HPTH_smc_cmdおよび目標高圧用スロットル弁開度HPTH_cmdを、一定の第2所定値HPTHREF2に設定する。この第2所定値HPTHREF2は、前述した第1所定値HPTHREF1よりも大きな値に設定されている。
このステップ136の実行に伴い、HPTHコントローラ113によって、高圧用スロットル弁開度HPTHが、目標高圧用スロットル弁開度HPTH_cmdに収束するように制御される。また、第1干渉抑制値HPTH_dc_cmdに基づく目標高圧用スロットル弁開度HPTH_cmdの補正は行われず、当該補正は停止される。
上記ステップ136に続くステップ137では、前記ステップ131で設定された待機タイマのタイマ値tMDELdが値0であるか否かを判別する。この答がNOのときには、目標低圧用スロットル弁開度LPTH_cmdを前記ステップ129で設定された学習用目標LPTH開度LPTH_cmdGに設定し(ステップ138)、本処理を終了する。
このステップ138の実行に伴い、LPTHコントローラ112によって、低圧用スロットル弁開度LPTHが、目標低圧用スロットル弁開度LPTH_cmdすなわち学習用目標LPTH開度TH_cmdGに収束するように制御される。また、第2干渉抑制値LPTH_dc_cmdに基づく目標低圧用スロットル弁開度LPTH_cmdの補正は行われず、当該補正は停止される。さらに、低圧EGR制御弁開度LPVTは、学習用目標LPTH開度LPTH_cmdGの設定が行われたときに算出されたその目標値に保持される。
一方、上記ステップ137の答がYES(tMDELd=0)のとき、すなわち、第2学習準備動作が完了してから、待機時間TMDELdがすでに経過しているときには、前記ステップ130で設定された学習用目標低圧EGRガス流量Tgt_lpegrと低圧EGRガス流量LPEGRとの偏差として、低圧EGRガス流量偏差Dlpを算出する(ステップ139)。次いで、算出された低圧EGRガス流量偏差Dlpが、第1所定値stlpLおよび第2所定値stlpHで規定される所定の範囲内にあるか否かを判別する(ステップ140)。
この答がNOのときには、値0までダウンカウントされる安定タイマのタイマ値tSTBdを、所定の安定時間TSTBd(例えば2.0sec)に設定する(ステップ141)とともに、低圧EGRガス流量偏差の絶対値|Dlp|を所定の最大偏差Dlp_maxで除算することによって、正規化低圧EGR偏差Fdlpを算出する(ステップ142)。この最大偏差Dlp_maxは、低圧EGRガス流量偏差の絶対値|Dlp|がとりうる最大の値に設定されている。
次いで、算出された正規化低圧EGR偏差Fdlpと要求トルクTREQbに基づき、図29に示す所定のマップを検索することによって、報酬値Rw_lpを算出する(ステップ143)。この場合、要求トルクTREQbが前述した第1〜第3の所定値TREQb1,TREQb2,TREQb3以外のときには、報酬値Rw_lpは、補間演算によって求められる。
上記のマップでは、報酬値Rw_lpは、基本的には、正規化低圧EGR偏差Fdlpが小さいほど、より大きな値にリニアに設定されており、また、正規化低圧EGR偏差Fdlpが値0のときにその最大値に設定されている。また、報酬値Rw_lpは、要求トルクTREQbに応じて次のように設定されている。すなわち、要求トルクTREQbが最も小さい第1所定値TREQb1のときには、報酬値Rw_lpは、正規化低圧EGR偏差Fdlpの全体(値0≦Fdlp≦値1.0)に対して、Fdlp値が小さいほど、より大きな値にリニアに設定されている。
また、要求トルクTREQbが中間の第2所定値TREQb2のときには、正規化低圧EGR偏差Fdlpに対する報酬値Rw_lpの傾きは、値0≦Fdlp≦第1所定値Fdlp1の範囲では、より大きな値に設定されており、Fdlp>第1所定値Fdlp1の範囲では、より小さな値に設定されている。さらに、要求トルクTREQbが最も大きい第3所定値TREQb3のときには、正規化低圧EGR偏差Fdlpに対する報酬値Rw_lpの傾きは、値0≦Fdlp≦第2所定値Fdlp2の範囲では、より大きな値に設定されており、Fdlp>Fdlp2の範囲では、より小さな値に設定されている。また、これらの第1および第2所定値Fdlp1,Fdlp2は、値0<Fdlp2<Fdlp1<値1.0の関係を満たすように設定されている。
上記の説明から明らかなように、図29のマップでは、正規化低圧EGR偏差Fdlpに対する報酬値Rw_lpの傾きが比較的大きい範囲が、要求トルクTREQbが小さいほど、より大きく設定されている。これは、要求トルクTREQbが小さいほど、すなわちエンジン81の負荷が低いほど、目標低圧用スロットル弁開度LPTH_cmdに対する低圧EGRガス流量LPEGRの感度が高いことから、正規化低圧EGR偏差Fdlpのより大きな範囲に対して、報酬値Rw_lpをきめ細かく設定するためである。
上記ステップ143に続くステップ144では、ステップ143で算出された報酬値Rw_lpに基づき、重み係数ωdを強化学習によって学習する。この学習は次のようにして行われる。すなわち、まず、そのときに設定されている重み係数ωd(前回値)を、その学習値ωdGとして、算出された報酬値Rw_lpと対応させて、複数のバッファの1つに順次、記憶する。次いで、重み係数ωd(今回値)を、実験により予め設定された互いに異なる複数の所定値の1つにランダムに設定する。なお、今回が学習開始後の1回目のループであるときには、前記ステップ138から明らかなように、重み係数ωdがまだ設定されていないので、学習値ωdGは、値0に設定されるとともに、報酬値Rw_lpと対応させて記憶される。
上記ステップ144に続くステップ145では、目標低圧用スロットル弁開度の暫定値LPTH_smc_cmdを、前記ステップ129で設定された学習用目標LPTH開度LPTH_cmdGに設定する。次いで、ステップ146において、第2干渉抑制値算出部106の説明で述べたようにして、第2干渉抑制値LPTH_dc_cmdを算出する。すなわち、エンジン回転数NEbなどの運転状態パラメータや、前記ステップ139で算出された低圧EGRガス流量偏差Dlp、前記ステップ135で設定された目標高圧用スロットル弁開度の暫定値HPTH_smc_cmdなどを入力とし、ニューラルネットワークを用いて、第2干渉抑制値LPTH_dc_cmdを算出する。
次に、上記ステップ145で設定された暫定値LPTH_smc_cmdに、ステップ146で算出された第2干渉抑制値LPTH_dc_cmdを加算することによって、目標低圧用スロットル弁開度LPTH_cmdを算出し(ステップ147)、本処理を終了する。このステップ147の実行に伴い、LPTHコントローラ112によって、低圧用スロットル弁開度LPTHが、目標低圧用スロットル弁開度LPTH_cmdに収束するように制御される。また、低圧EGR制御弁開度LPVTは、学習用目標LPTH開度LPTH_cmdGの設定が行われたときに算出されたその目標値に保持される。
以上のように、第2学習準備動作が完了する(ステップ122:YES)と、第1干渉抑制値HPTH_dc_cmdによる補正が、第2学習準備動作の実行中と同様に停止されるとともに、高圧用スロットル弁開度HPTHが、第1所定値HPTHREF1から一定の第2所定値HPTHREF2にステップ状に変化するように制御され、第2所定値HPTHREF2に保持される(ステップ136)。また、目標低圧用スロットル弁開度LPTH_cmdが、学習用目標LPTH開度LPTH_cmdGに保持される(ステップ138)。前述したように、この学習用目標LPTH開度LPTH_cmdGは、高圧用スロットル弁開度HPTHが第1所定値HPTHREF1に保持されている状態で、低圧EGRガス流量LPEGRが学習用目標低圧EGRガス流量Tgt_lpegrに収束するような値に、設定されている。以上から明らかなように、ステップ136および138の実行によって、低圧EGRガス流量LPEGRは、学習用目標低圧EGRガス流量Tgt_lpegrからずれるように変化する。また、この場合における学習用目標低圧EGRガス流量Tgt_lpegrに対する低圧EGRガス流量LPEGRのずれ分は、目標高圧用スロットル弁開度HPTH_cmdが干渉することによる低圧EGRガス流量LPEGRの変動分を良好に表す。
そして、第2学習準備動作が完了してから待機時間TMDELdが経過する(ステップ137:YES)と、重み係数ωdの学習が開始される(ステップ139および142〜144)。このように、第2学習準備動作が完了してから待機時間TMDELdが経過するのを待って学習を開始するのは、ステップ136および138の実行によって低圧EGRガス流量LPEGRが学習用目標低圧EGRガス流量Tgt_lpegrから確実にずれた状態で、すなわち、目標高圧用スロットル弁開度HPTH_cmdによる干渉の影響が低圧EGRガス流量LPEGRに確実に反映された状態で、学習を行うためである。
また、この学習中、低圧EGRガス流量偏差の絶対値|Dlp|に比例する正規化低圧EGR偏差Fdlpが小さいほど、報酬値Rw_lpがより大きな値に算出される(ステップ143)。さらに、そのときに得られている重み係数ωdすなわちその前回値が、学習値ωdGとして、今回の報酬値Rw_lpと対応させて、複数のバッファの1つに順次、記憶されるとともに、重み係数ωdの今回値が、複数の所定値の1つにランダムに設定される(ステップ144)。
そして、上記のように設定された重み係数ωdを適用したニューラルネットワークを用いて、第2干渉抑制値LPTH_dc_cmdが算出される(ステップ146)。また、算出された第2干渉抑制値LPTH_dc_cmdを、学習用目標LPTH開度LPTH_cmdGに設定された暫定値LPTH_smc_cmdに加算することによって、目標低圧用スロットル弁開度LPTH_cmdが算出される(ステップ147)。すなわち、目標低圧用スロットル弁開度LPTH_cmdが第2干渉抑制値LPTH_dc_cmdに基づいて補正される。
一方、前記ステップ140の答がYESで、低圧EGRガス流量偏差Dlpが前述した第1および第2所定値stlpL,stlpHで規定される所定の範囲内にあるときには、前記ステップ141で設定された安定タイマのタイマ値tSTBdが値0であるか否かを判別する(ステップ148)。この答がNOのときには、前記ステップ142以降を実行する。
一方、上記ステップ148の答がYES(tSTBd=0)になったとき、すなわち、低圧EGRガス流量偏差Dlpが第1および第2所定値stlpL,stlpHで規定される所定の範囲内にある状態が、安定時間TSTBdにわたって継続したときには、低圧EGRガス流量LPEGRが学習用目標低圧EGRガス流量Tgt_lpegrにほぼ収束した状態で安定しているとして、重み係数ωdの学習が完了したと判定する。そして、前記ステップ144で記憶された複数の学習値ωdGのうちの、最も大きな報酬値Rw_lpに対応するものを読み出し、重み係数ωdとして設定し、重み係数ωdを更新する(ステップ148A)とともに、学習が完了したことを表すために、第2学習完了フラグF_LEDONEdを「1」にセットし(ステップ149)、本処理を終了する。また、このステップ149を実行した後には、図27の前記ステップ121の答がYESになり、その場合には、そのまま本処理を終了する。
一方、前記ステップ134の答がYES(tLEAd=0)になったとき、すなわち、第2学習準備動作が完了してから、学習時間TLEAdが経過したときには、前記ステップ144などによる重み係数ωdの学習が十分に行われているため、当該学習が完了したと判定する。そして、上記ステップ148Aを実行することによって、記憶された複数の学習値ωdGのうちの、最も大きな報酬値Rw_lpに対応するものを重み係数ωdとして設定し、重み係数ωdを更新するとともに、学習が完了したことを表すために、上記ステップ149を実行し、本処理を終了する。
以上のように、低圧EGRガス流量偏差Dlpが所定の範囲内にある状態が安定時間TSTBdにわたって継続したという条件、および、第2学習準備動作が完了してから学習時間TLEAdが経過したという条件の一方が成立すると、その時点で学習が完了したと判定される。
また、以上の第2実施形態は、特許請求の範囲に記載された請求項1および3に係る発明(以下、総称して「第2発明」という)に対応しており、第2実施形態における各種の要素と、第2発明における各種の要素との対応関係は次のとおりである。すなわち、第2実施形態におけるECU72、第1および第2コントローラ103,104が、第2発明における制御入力算出手段に相当し、第2実施形態におけるECU72、第1および第2干渉抑制値算出部105,106が、第2発明における干渉抑制パラメータ算出手段に相当するとともに、第2実施形態におけるECU72、第1および第2加算器107,108が、第2発明における補正手段に相当する。
また、第2実施形態におけるECU72および目標値算出部101が、第2発明における目標値設定手段に相当するとともに、第2実施形態における吸気圧センサ25、排気圧センサ34、LPEGR開度センサ36、排気温センサ35、吸気チャンバ圧センサ31、排気マニホルド圧センサ28、HPEGR開度センサ37、排気マニホルド温センサ29、およびECU72が、第2発明における制御量検出手段に相当する。さらに、第2実施形態におけるECU72および学習部121が、第2発明における学習手段に相当し、第2実施形態における低圧EGR装置90、低圧用スロットル弁84およびLPTHアクチュエータ84aが、第2発明における第1EGR装置に相当するとともに、第2実施形態における高圧EGR装置91、高圧用スロットル弁87およびHPTHアクチュエータ87aが、第2発明における第2EGR装置に相当する。
また、第2実施形態における目標低圧用スロットル弁開度LPTH_cmdおよび目標高圧用スロットル弁開度HPTH_cmdが、第2発明における制御入力に相当するとともに、第2実施形態における低圧EGRガス流量LPEGRおよび高圧EGRガス流量HPEGRが、第2発明における制御量に相当する。さらに、第2実施形態における第1および第2干渉抑制パラメータHPTH_dc_cmd,LPTH_dc_cmdが、第2発明における干渉抑制パラメータに相当するとともに、第2実施形態における目標低圧EGRガス流量LPEGR_cmdおよび目標高圧EGRガス流量HPEGR_cmdが、第2発明における目標値に相当する。
また、第2実施形態における報酬値Rw_hpおよびRw_lpが、第2発明における報酬に相当するとともに、第2実施形態における重み係数ωcおよびωdが、第2発明におけるニューロンパラメータに相当する。さらに、第2実施形態における学習用目標HPTH開度HPTH_cmdGおよび学習用目標LPTH開度LPTH_cmdGが、第2発明におけるニューロンパラメータの学習の開始直前に算出された値に相当するとともに、第2実施形態における学習用目標高圧EGRガス流量Tgt_hpegrおよび学習用目標低圧EGRガス流量Tgt_lpegrが、ニューロンパラメータの学習の開始直前に設定された目標値に相当する。また、第2実施形態における目標低圧用スロットル弁開度LPTH_cmdが、第2発明における第1EGR制御パラメータに相当するとともに、第2実施形態における目標高圧用スロットル弁開度HPTH_cmdが、第2発明における第2EGR制御パラメータに相当する。さらに、第2実施形態における低圧EGRガス流量LPEGRおよび高圧EGRガス流量HPEGRが、第2発明における第1EGRガスの流量および第2EGRガスの流量にそれぞれ相当する。
以上のように、第2実施形態によれば、エンジン81を含むプラント111において、制御入力としての目標低圧用スロットル弁開度LPTH_cmdおよび目標高圧用スロットル弁開度HPTH_cmd、ならびに、制御量としての低圧EGRガス流量LPEGRおよび高圧EGRガス流量HPEGRの間に、相互干渉が存在している。また、第1干渉抑制値HPTH_dc_cmdの算出が、目標低圧用スロットル弁開度の暫定値LPTH_smc_cmdを入力とし、第1干渉抑制値HPTH_dc_cmdを出力として構築されたニューラルネットワークを用いて行われる。さらに、算出された第1干渉抑制値HPTH_dc_cmdに基づいて、目標高圧用スロットル弁開度HPTH_cmdが補正される。また、第2干渉抑制値LPTH_dc_cmdの算出が、目標高圧用スロットル弁開度の暫定値HPTH_smc_cmdを入力とし、第2干渉抑制値LPTH_dc_cmdを出力として構築されたニューラルネットワークを用いて行われる。さらに、算出された第2干渉抑制値LPTH_dc_cmdに基づいて、目標低圧用スロットル弁開度LPTH_cmdが補正される。
以上により、目標低圧用スロットル弁開度LPTH_cmdおよび目標高圧用スロットル弁開度HPTH_cmdを、相互干渉を抑制するように適切に補正することができる。この場合、プラント111には、非線形系であるエンジン81が含まれるものの、ニューラルネットワークは、非線形系を適切かつ容易にモデル化できるという特性を有するので、第1および第2干渉抑制値HPTH_dc_cmd,LPTH_dc_cmdを算出するためのニューラルネットワークを、適切かつ容易に構築することができる。以上から、非線形系であるプラント111において、目標低圧用スロットル弁開度LPTH_cmdおよび目標高圧用スロットル弁開度HPTH_cmd、ならびに、低圧EGRガス流量LPEGRおよび高圧EGRガス流量HPEGRの間に存在する相互干渉を適切に抑制でき、それにより低圧EGRガス流量LPEGRおよび高圧EGRガス流量HPEGRを適切に制御することができるとともに、制御装置71を容易に設計することができる。
また、ニューラルネットワークに用いられる重み係数ωcおよびωdが、それぞれ別個に、すなわちニューラルネットワークごとに学習される。さらに、重み係数ωcを学習する前に、算出された高圧EGRガス流量HPEGRが目標高圧EGRガス流量HPEGR_cmdになるように、目標高圧用スロットル弁開度HPTH_cmdが、フィードバック制御アルゴリズムである応答指定型制御アルゴリズムによって算出される。さらに、目標低圧用スロットル弁開度LPTH_cmdが、一定の第1所定値LPTHREF1に保持されるとともに、第1および第2干渉抑制値HPTH_dc_cmd,LPTH_dc_cmdにそれぞれ基づく目標高圧用スロットル弁開度HPTH_cmdおよび目標低圧用スロットル弁開度LPTH_cmdの補正が停止される。以上により、高圧EGRガス流量HPEGRは、目標高圧EGRガス流量HPEGR_cmdに収束した状態に保持される。
そして、重み係数ωcの学習が開始されると、目標低圧用スロットル弁開度LPTH_cmdが、第2所定値LPTHREF2に保持されるとともに、第2干渉抑制値LPTH_dc_cmdに基づく補正が停止される。また、目標高圧用スロットル弁開度の暫定値HPTH_smc_cmdが、応答指定型制御アルゴリズムによって算出されず、学習の開始直前に算出された学習用目標HPTH開度HPTH_cmdGに設定され、保持される。以上により、学習の開始時、学習の開始直前に設定された目標高圧EGRガス流量HPEGR_cmdである学習用目標高圧EGRガス流量Tgt_hpegrに収束した状態に保持されていた高圧EGRガス流量HPEGRは、この学習用目標高圧EGRガス流量Tgt_hpegrからずれるようになる。また、重み係数ωcの学習中、高圧EGRガス流量偏差Dhpが、学習用目標高圧EGRガス流量Tgt_hpegrと高圧EGRガス流量HPEGRとの偏差として算出される。前述したように、学習の開始時における高圧EGRガス流量偏差Dhpは、目標低圧用スロットル弁開度LPTH_cmdが干渉することによる高圧EGRガス流量HPEGRの変動分を良好に表す。
さらに、重み係数ωcの学習中、重み係数ωcが複数の所定値の1つに設定され、設定された重み係数ωcを適用したニューラルネットワークを用いて、第1干渉抑制値HPTH_dc_cmdが算出されるとともに、算出された第1干渉抑制値HPTH_dc_cmdで補正された目標高圧用スロットル弁開度HPTH_cmdを用いて、高圧EGRガス流量HPEGRが制御される。また、この高圧EGRガス流量HPEGRの制御によって得られた正規化高圧EGR偏差Fdhpが小さいほど、すなわち、高圧EGRガス流量偏差の絶対値|Dhp|が小さいほど、報酬値Rw_hpがより大きな値に算出されるとともに、この報酬値Rw_hpと対応させて、重み係数ωcが学習値ωcGとして順次、記憶される。さらに、記憶された複数の学習値ωcGのうちの、最も大きな報酬値Rw_hpに対応する学習値ωcGに、すなわち、学習用目標高圧EGRガス流量Tgt_hpegrと高圧EGRガス流量HPEGRとの偏差である高圧EGRガス流量偏差の絶対値|Dhp|が最も小さくなる学習値ωcGに、重み係数ωcが更新され、学習が完了する。
以上のように、第1干渉抑制値HPTH_dc_cmdに応じた目標高圧用スロットル弁開度HPTH_cmdを用いて制御された高圧EGRガス流量HPEGRが、学習用目標高圧EGRガス流量Tgt_hpegrになるように、高圧EGRガス流量偏差Dhpに基づく報酬値Rw_hpを用いて、重み係数ωcの強化学習が行われる。したがって、重み係数ωcを適切に学習することができる。
また、重み係数ωdの学習も、重み係数ωcの場合と同様にして行われる。すなわち、重み係数ωdを学習する前に、算出された低圧EGRガス流量LPEGRが目標低圧EGRガス流量LPEGR_cmdになるように、目標低圧用スロットル弁開度LPTH_cmdが、応答指定型制御アルゴリズムによって算出される。さらに、目標高圧用スロットル弁開度HPTH_cmdが、一定の第1所定値HPTHREF1に保持されるとともに、第2および第1干渉抑制値LPTH_dc_cmd,HPTH_dc_cmdにそれぞれ基づく目標低圧用スロットル弁開度LPTH_cmdおよび目標高圧用スロットル弁開度HPTH_cmdの補正が停止される。以上により、低圧EGRガス流量LPEGRは、目標低圧EGRガス流量LPEGR_cmdに収束した状態に保持される。
そして、重み係数ωdの学習が開始されると、目標高圧用スロットル弁開度HPTH_cmdが、第2所定値HPTHREF2に保持されるとともに、第1干渉抑制値HPTH_dc_cmdに基づく補正が停止される。また、目標低圧用スロットル弁開度の暫定値LPTH_smc_cmdが、応答指定型制御アルゴリズムによって算出されず、学習の開始直前に算出された学習用目標LPTH開度LPTH_cmdGに設定され、保持される。以上により、学習の開始時、学習の開始直前に設定された目標低圧EGRガス流量LPEGR_cmdである学習用目標低圧EGRガス流量Tgt_lpegrに収束した状態に保持されていた低圧EGRガス流量LPEGRは、この学習用目標低圧EGRガス流量Tgt_lpegrからずれるようになる。また、重み係数ωdの学習中、低圧EGRガス流量偏差Dlpが、学習用目標低圧EGRガス流量Tgt_lpegrと低圧EGRガス流量LPEGRとの偏差として算出される。前述したように、学習の開始時における低圧EGRガス流量偏差Dlpは、目標高圧用スロットル弁開度HPTH_cmdが干渉することによる低圧EGRガス流量LPEGRの変動分を良好に表す。
さらに、重み係数ωdの学習中、重み係数ωdが複数の所定値の1つに設定され、設定された重み係数ωdを適用したニューラルネットワークを用いて、第2干渉抑制値LPTH_dc_cmdが算出されるとともに、算出された第2干渉抑制値LPTH_dc_cmdで補正された目標低圧用スロットル弁開度LPTH_cmdを用いて、低圧EGRガス流量LPEGRが制御される。また、この低圧EGRガス流量LPEGRの制御によって得られた正規化低圧EGR偏差Fdlpが小さいほど、すなわち、低圧EGRガス流量偏差の絶対値|Dlp|が小さいほど、報酬値Rw_lpがより大きな値に算出されるとともに、この報酬値Rw_lpと対応させて、重み係数ωdが学習値ωdGとして順次、記憶される。さらに、記憶された複数の学習値ωdGのうちの、最も大きな報酬値Rw_lpに対応する学習値ωdGに、すなわち、学習用目標低圧EGRガス流量Tgt_lpegrと低圧EGRガス流量LPEGRとの偏差である低圧EGRガス流量偏差の絶対値|Dlp|が最も小さくなる学習値ωdGに、重み係数ωdが更新され、学習が完了する。
以上のように、第2干渉抑制値LPTH_dc_cmdに応じた目標低圧用スロットル弁開度LPTH_cmdを用いて制御された低圧EGRガス流量LPEGRが、学習用目標低圧EGRガス流量Tgt_lpegrになるように、低圧EGRガス流量偏差Dlpに基づく報酬値Rw_lpを用いて、重み係数ωdの強化学習が行われる。したがって、重み係数ωdを適切に学習することができる。
第2実施形態によれば、以上のように学習されたニューラルネットワークを用いて算出された第1および第2干渉抑制値HPTH_dc_cmd,LPTH_dc_cmdに基づいて、目標高圧用スロットル弁開度HPTH_cmdおよび目標低圧用スロットル弁開度LPTH_cmdをそれぞれ補正するので、相互干渉をより適切に抑制することができる。
さらに、重み係数ωcおよびωdを学習する学習手法として、強化学習が用いられるので、第1実施形態と同様、制御装置71をより容易に設計することができる。同じ理由により、相互干渉の態様などが互いに異なる複数の制御入力および複数の制御量ごとにニューラルネットワークを構築する場合でも、前述した従来の場合と異なり、モデル式を始めから設定する必要がなく、この構築を容易に行うことができる。したがって、この場合にも、制御装置を容易に設計することができる。
また、第1および第2干渉抑制値HPTH_dc_cmd,LPTH_dc_cmdの算出を、前述した運転状態パラメータ(エンジン回転数NEbや、要求トルクTREQbなど)に応じて行うので、両者HPTH_dc_cmd,LPTH_dc_cmdを、エンジン81の運転状態を反映させながら、適切に算出することができる。
なお、第2実施形態では、制御入力としての目標低圧用スロットル弁開度の暫定値LPTH_smc_cmdおよび目標高圧用スロットル弁開度の暫定値HPTH_smc_cmdを算出するフィードバック制御アルゴリズムとして、応答指定型制御アルゴリズムを用いているが、他の適当なフィードバック制御アルゴリズム、例えば、PID制御アルゴリズムなどを用いてもよい。
また、第2実施形態では、算出された制御量としての低圧EGRガス流量LPEGRおよび高圧EGRガス流量HPEGRが、目標低圧EGRガス流量LPEGR_cmdおよび目標高圧EGRガス流量HPEGR_cmdにそれぞれなるように、フィードバック制御アルゴリズムによって、暫定値LPTH_smc_cmdおよびHPTH_smc_cmdをそれぞれ算出しているが、目標低圧EGRガス流量LPEGR_cmdおよび目標高圧EGRガス流量HPEGR_cmdに応じたマップ検索によって、暫定値LPTH_smc_cmdおよびHPTH_smc_cmdをそれぞれ算出してもよい。この場合、重み係数ωcおよびωdの学習中における高圧EGRガス流量偏差Dhpおよび低圧EGRガス流量偏差Dlpの算出に、学習用目標高圧EGRガス流量Tgt_hpegrおよび学習用目標低圧EGRガス流量Tgt_lpegrに代えて、そのときどきに算出された目標高圧EGRガス流量HPEGR_cmdおよび目標低圧EGRガス流量LPEGR_cmdが、それぞれ用いられる。
さらに、第2実施形態では、低圧EGRガス流量LPEGRおよび高圧EGRガス流量HPEGRを、演算により算出しているが、センサを用いて直接的に検出してもよい。この場合、センサとして、例えば熱線式、ベーン式、またはカルマン渦式のものが用いられる。また、第2実施形態では、報酬値Rw_hpおよびRw_lpを、正規化高圧EGR偏差Fdhpおよび正規化低圧EGR偏差Fdlpにそれぞれ基づいて、リニア(線形)に設定しているが、非線形に設定してもよい。
さらに、第2実施形態では、報酬値Rw_hpを算出するためのパラメータとして、正規化高圧EGR偏差Fdhpを用いているが、高圧EGRガス流量偏差Dhpまたはその絶対値|Dhp|を用いてもよい。あるいは、報酬値Rw_hpを算出するためのパラメータとして、学習用目標高圧EGRガス流量Tgt_hpegrと高圧EGRガス流量HPEGRとの比較結果を表す他の適当なパラメータ、例えば、学習用目標高圧EGRガス流量Tgt_hpegrおよび高圧EGRガス流量HPEGRの一方に対する他方の比などを用いてもよい。
このことは、報酬値Rw_lpについても同様に当てはまる。すなわち、報酬値Rw_lpを算出するためのパラメータとして、低圧EGRガス流量偏差Dlpまたはその絶対値|Dlp|を用いてもよい。あるいは、報酬値Rw_lpを算出するためのパラメータとして、学習用目標低圧EGRガス流量Tgt_lpegrと低圧EGRガス流量LPEGRとの比較結果を表す他の適当なパラメータ、例えば、学習用目標低圧EGRガス流量Tgt_lpegrおよび低圧EGRガス流量LPEGRの一方に対する他方の比などを用いてもよい。
さらに、第1干渉抑制値HPTH_dc_cmdを算出するためにニューラルネットワークに入力されるパラメータとして、前述した各種のパラメータに加え、低圧用スロットル弁開度LPTHが一定の状態から変化し始めた時点からの経過時間を用いてもよい。高圧EGRガス流量HPEGRは、低圧用スロットル弁開度LPTHの変化に対し、応答遅れをもって変化することから、そのような応答遅れを良好に反映させながら、第1干渉抑制値HPTH_dc_cmdを適切に算出することができる。同様に、第2干渉抑制値LPTH_dc_cmdを算出するためにニューラルネットワークに入力されるパラメータとして、高圧用スロットル弁開度HPTHが一定の状態から変化し始めた時点からの経過時間を用いてもよい。低圧EGRガス流量LPEGRは、高圧用スロットル弁開度HPTHの変化に対し、応答遅れをもって変化することから、そのような応答遅れを良好に反映させながら、第2干渉抑制値LPTH_dc_cmdを適切に算出することができる。
また、第2実施形態では、高圧EGRガス流量偏差Dhpが所定の範囲内にある状態が安定時間TSTBcにわたって継続したという条件、および、第1学習準備動作が完了してから学習時間TLEAcが経過したという条件の一方が成立したときに、それまでに記憶された複数の学習値ωcGのうちの、最も大きな報酬値Rw_hpに対応するものに重み係数ωcを更新することにより、学習を行っているが、次のようにして行ってもよい。すなわち、上記の2つの条件の一方が成立したときにも、報酬値Rw_hpを算出するとともに、そのときに設定されている重み係数ωcを学習値ωcGとして、算出された報酬値Rw_hpと対応させて記憶する。そして、記憶された今回の学習値ωcGを含む複数の学習値ωcGのうちの、最も大きな報酬値Rw_hpに対応するものに重み係数ωcを更新することにより、学習を行ってもよい。
このことは、重み係数ωdについても同様に当てはまる。すなわち、低圧EGRガス流量偏差Dlpが所定の範囲内にある状態が安定時間TSTBdにわたって継続したという条件、および、第2学習準備動作が完了してから学習時間TLEAdが経過したという条件の一方が成立したときにも、報酬値Rw_lpを算出するとともに、そのときに設定されている重み係数ωdを学習値ωdGとして、算出された報酬値Rw_lpと対応させて記憶する。そして、記憶された今回の学習値ωdGを含む複数の学習値ωdGのうちの、最も大きな報酬値Rw_lpに対応するものに重み係数ωdを更新することにより、学習を行ってもよい。
さらに、第2実施形態では、報酬値Rw_hpが算出されるごとに、学習値ωcGを記憶するとともに、記憶された複数の学習値ωcGのうちの、最も大きな報酬値Rw_hpに対応するものに重み係数ωcを更新しているが、今回算出された報酬値Rw_hpが、それまでに算出された報酬値Rw_hpよりも大きいときに限って、そのときに設定されている重み係数ωcを学習値ωcGとして記憶し、学習値ωcGを随時、更新するとともに、記憶された学習値ωcGに重み係数ωcを更新してもよい。これにより、上記と同様の効果を得ることができる。
このことは、学習値ωdGについても同様に当てはまる。すなわち、今回算出された報酬値Rw_lpが、それまでに算出された報酬値Rw_lpよりも大きいときに限って、そのときに設定されている重み係数ωdを学習値ωdGとして記憶し、学習値ωdGを随時、更新するとともに、記憶された学習値ωdGに重み係数ωdを更新してもよい。
また、第2実施形態では、学習のための重み係数ωcの設定および学習値ωcGの記憶(ステップ104)を、第1学習処理を実行するごと(制御周期ΔTごと)に行っているが、高圧EGRガス流量HPEGRが高圧用スロットル弁開度HPTHの変化に対して応答遅れをもって変化するので、この応答遅れに応じた所定時間ごとに行ってもよい。同様に、学習のための重み係数ωdの設定および学習値ωdGの記憶(ステップ144)を、第2学習処理を実行するごと(制御周期ΔTごと)に行っているが、低圧EGRガス流量LPEGRが低圧用スロットル弁開度LPTHの変化に対して応答遅れをもって変化するので、この応答遅れに応じた所定時間ごとに行ってもよい。
なお、本発明は、説明した第1および第2実施形態(以下、総称して「実施形態」という)に限定されることなく、種々の態様で実施することができる。例えば、実施形態では、階層型のニューラルネットワークNNを用いているが、他の適当なニューラルネットワーク、例えば、相互結合型のニューラルネットワークを用いてもよい。また、実施形態では、重み係数ωa,ωb,ωc,ωdを学習する学習手法として、強化学習を用いているが、他の適当な学習手法、例えば、誤差逆伝播法(バックプロパゲーション)を用いてもよい。
さらに、実施形態では、学習を、エンジン3、81を用いて行っているが、エンジン3、81を用いずに、エンジンシミュレータを用いて行ってもよい。また、実施形態では、重み係数ωa,ωb,ωc,ωdのみを学習しているが、これに代えて、またはこれとともに、傾きゲインβa,βb,βc,βd,オフセット値εa,εb,εc,εd、出力ゲインαa,αb,αc,αd、傾きゲインγa,γb,γc,γd、およびオフセット値δa,δb,δc,δdの少なくとも1つを、学習してもよい。
さらに、実施形態では、制御入力および制御量の数は、いずれも2つであるが、複数であり且つ相互干渉が存在する限り、任意であり、この場合、制御入力および制御量の数は、必ずしも1:1でなくてもよい。例えば、2つの制御量の各々を2つ以上の制御入力によって制御されるプラントにも、本発明を適用可能である。また、実施形態は、エンジン3,81を含むプラントに、本発明を適用した例であるが、本発明は、これに限らず、他の産業機器などの干渉系のプラントに適用可能である。その他、本発明の趣旨の範囲内で、細部の構成を適宜、変更することが可能である。
1 制御装置
2 ECU(制御入力算出手段、干渉抑制パラメータ算出手段、補正手段、目標値設 定手段、制御量検出手段、学習手段)
3 エンジン
5 吸気弁
14 可変バルブリフト機構
15a THアクチュエータ(スロットル弁機構)
24 エアフローセンサ(制御量検出手段)
25 吸気圧センサ(制御量検出手段)
26 吸気温センサ(制御量検出手段)
28 排気マニホルド圧センサ(制御量検出手段)
29 排気マニホルド温センサ(制御量検出手段)
31 吸気チャンバ圧センサ(制御量検出手段)
34 排気圧センサ(制御量検出手段)
35 排気温センサ(制御量検出手段)
36 LPEGR開度センサ(制御量検出手段)
37 HPEGR開度センサ(制御量検出手段)
41 目標値算出部(目標値設定手段)
43 第1コントローラ(制御入力算出手段)
44 第2コントローラ(制御入力算出手段)
45 第1干渉抑制値算出部(干渉抑制パラメータ算出手段)
46 第2干渉抑制値算出部(干渉抑制パラメータ算出手段)
47 第1加算器(補正手段)
48 第2加算器(補正手段)
51 プラント
61 学習部(学習手段)
71 制御装置
72 ECU(制御入力算出手段、干渉抑制パラメータ算出手段、補正手段、目標値設 定手段、制御量検出手段)
81 エンジン
81a 気筒
83 吸気通路
84 低圧用スロットル弁(第1EGR装置)
84a LPTHアクチュエータ(第1EGR装置)
87 高圧用スロットル弁(第2EGR装置)
87a HPTHアクチュエータ(第2EGR装置)
90 低圧EGR装置(第1EGR装置)
91 高圧EGR装置(第2EGR装置)
101 目標値算出部(目標値設定手段)
103 第1コントローラ(制御入力算出手段)
104 第2コントローラ(制御入力算出手段)
105 第1干渉抑制値算出部(干渉抑制パラメータ算出手段)
106 第2干渉抑制値算出部(干渉抑制パラメータ算出手段)
107 第1加算器(補正手段)
108 第2加算器(補正手段)
111 プラント
121 学習部(学習手段)
TH_cmd 目標スロットル弁開度(制御入力、開度制御パラメータ)
Lift_cmd 目標バルブリフト(制御入力、リフト制御パラメータ)
PBa 吸気圧(制御量、吸気通路内の圧力)
Gcyla 吸入空気量(制御量)
Lift_dc_cmd 第1干渉抑制値(干渉抑制パラメータ)
TH_dc_cmd 第2干渉抑制値(干渉抑制パラメータ)
PB_cmd 目標吸気圧(目標値)
Gcyl_cmd 目標吸気量(目標値)
Rw_gcyl 報酬値(報酬)
Rw_pb 報酬値(報酬)
ωa 重み係数(ニューロンパラメータ)
ωb 重み係数(ニューロンパラメータ)
THREF1 第1所定値
LiftREF1 第1所定値
Lift_cmdG 学習用目標リフト(ニューロンパラメータの学習の開始直前に 算出された値)
TH_cmdG 学習用目標開度(ニューロンパラメータの学習の開始直前に算 出された値)
THREF2 第2所定値
LiftREF2 第2所定値
Tgt_gcyl 学習用目標吸気量(ニューロンパラメータの学習の開始直前に 設定された目標値)
Tgt_pb 学習用目標吸気圧(ニューロンパラメータの学習の開始直前に 設定された目標値)
TH スロットル弁開度(スロットル弁の開度)
Lift バルブリフト(吸気弁のリフト)
LPTH_cmd 目標低圧用スロットル弁開度(制御入力、第1EGR制御パラ メータ)
HPTH_cmd 目標高圧用スロットル弁開度(制御入力、第2EGR制御パラ メータ)
LPEGR 低圧EGRガス流量(制御量、第1EGRガスの流量)
HPEGR 高圧EGRガス流量(制御量、第2EGRガスの流量)
HPTH_dc_cmd 第1干渉抑制値(干渉抑制パラメータ)
LPTH_dc_cmd 第2干渉抑制値(干渉抑制パラメータ)
LPEGR_cmd 目標低圧EGRガス流量(目標値)
HPEGR_cmd 目標高圧EGRガス流量(目標値)
Rw_hp 報酬値(報酬)
Rw_lp 報酬値(報酬)
ωc 重み係数(ニューロンパラメータ)
ωd 重み係数(ニューロンパラメータ)
LPTHREF1 第1所定値
HPTHREF1 第1所定値
HPTH_cmdG 学習用目標HPTH開度(ニューロンパラメータの学習の開始 直前に算出された値)
LPTH_cmdG 学習用目標LPTH開度(ニューロンパラメータの学習の開始 直前に算出された値)
LPTHREF2 第2所定値
HPTHREF2 第2所定値
Tgt_hpegr 学習用目標高圧EGRガス流量(ニューロンパラメータの学習 の開始直前に設定された目標値)
Tgt_lpegr 学習用目標低圧EGRガス流量(ニューロンパラメータの学習 の開始直前に設定された目標値)
2 ECU(制御入力算出手段、干渉抑制パラメータ算出手段、補正手段、目標値設 定手段、制御量検出手段、学習手段)
3 エンジン
5 吸気弁
14 可変バルブリフト機構
15a THアクチュエータ(スロットル弁機構)
24 エアフローセンサ(制御量検出手段)
25 吸気圧センサ(制御量検出手段)
26 吸気温センサ(制御量検出手段)
28 排気マニホルド圧センサ(制御量検出手段)
29 排気マニホルド温センサ(制御量検出手段)
31 吸気チャンバ圧センサ(制御量検出手段)
34 排気圧センサ(制御量検出手段)
35 排気温センサ(制御量検出手段)
36 LPEGR開度センサ(制御量検出手段)
37 HPEGR開度センサ(制御量検出手段)
41 目標値算出部(目標値設定手段)
43 第1コントローラ(制御入力算出手段)
44 第2コントローラ(制御入力算出手段)
45 第1干渉抑制値算出部(干渉抑制パラメータ算出手段)
46 第2干渉抑制値算出部(干渉抑制パラメータ算出手段)
47 第1加算器(補正手段)
48 第2加算器(補正手段)
51 プラント
61 学習部(学習手段)
71 制御装置
72 ECU(制御入力算出手段、干渉抑制パラメータ算出手段、補正手段、目標値設 定手段、制御量検出手段)
81 エンジン
81a 気筒
83 吸気通路
84 低圧用スロットル弁(第1EGR装置)
84a LPTHアクチュエータ(第1EGR装置)
87 高圧用スロットル弁(第2EGR装置)
87a HPTHアクチュエータ(第2EGR装置)
90 低圧EGR装置(第1EGR装置)
91 高圧EGR装置(第2EGR装置)
101 目標値算出部(目標値設定手段)
103 第1コントローラ(制御入力算出手段)
104 第2コントローラ(制御入力算出手段)
105 第1干渉抑制値算出部(干渉抑制パラメータ算出手段)
106 第2干渉抑制値算出部(干渉抑制パラメータ算出手段)
107 第1加算器(補正手段)
108 第2加算器(補正手段)
111 プラント
121 学習部(学習手段)
TH_cmd 目標スロットル弁開度(制御入力、開度制御パラメータ)
Lift_cmd 目標バルブリフト(制御入力、リフト制御パラメータ)
PBa 吸気圧(制御量、吸気通路内の圧力)
Gcyla 吸入空気量(制御量)
Lift_dc_cmd 第1干渉抑制値(干渉抑制パラメータ)
TH_dc_cmd 第2干渉抑制値(干渉抑制パラメータ)
PB_cmd 目標吸気圧(目標値)
Gcyl_cmd 目標吸気量(目標値)
Rw_gcyl 報酬値(報酬)
Rw_pb 報酬値(報酬)
ωa 重み係数(ニューロンパラメータ)
ωb 重み係数(ニューロンパラメータ)
THREF1 第1所定値
LiftREF1 第1所定値
Lift_cmdG 学習用目標リフト(ニューロンパラメータの学習の開始直前に 算出された値)
TH_cmdG 学習用目標開度(ニューロンパラメータの学習の開始直前に算 出された値)
THREF2 第2所定値
LiftREF2 第2所定値
Tgt_gcyl 学習用目標吸気量(ニューロンパラメータの学習の開始直前に 設定された目標値)
Tgt_pb 学習用目標吸気圧(ニューロンパラメータの学習の開始直前に 設定された目標値)
TH スロットル弁開度(スロットル弁の開度)
Lift バルブリフト(吸気弁のリフト)
LPTH_cmd 目標低圧用スロットル弁開度(制御入力、第1EGR制御パラ メータ)
HPTH_cmd 目標高圧用スロットル弁開度(制御入力、第2EGR制御パラ メータ)
LPEGR 低圧EGRガス流量(制御量、第1EGRガスの流量)
HPEGR 高圧EGRガス流量(制御量、第2EGRガスの流量)
HPTH_dc_cmd 第1干渉抑制値(干渉抑制パラメータ)
LPTH_dc_cmd 第2干渉抑制値(干渉抑制パラメータ)
LPEGR_cmd 目標低圧EGRガス流量(目標値)
HPEGR_cmd 目標高圧EGRガス流量(目標値)
Rw_hp 報酬値(報酬)
Rw_lp 報酬値(報酬)
ωc 重み係数(ニューロンパラメータ)
ωd 重み係数(ニューロンパラメータ)
LPTHREF1 第1所定値
HPTHREF1 第1所定値
HPTH_cmdG 学習用目標HPTH開度(ニューロンパラメータの学習の開始 直前に算出された値)
LPTH_cmdG 学習用目標LPTH開度(ニューロンパラメータの学習の開始 直前に算出された値)
LPTHREF2 第2所定値
HPTHREF2 第2所定値
Tgt_hpegr 学習用目標高圧EGRガス流量(ニューロンパラメータの学習 の開始直前に設定された目標値)
Tgt_lpegr 学習用目標低圧EGRガス流量(ニューロンパラメータの学習 の開始直前に設定された目標値)
Claims (3)
- 複数の制御入力によって複数の制御量をそれぞれ制御するとともに、前記複数の制御入力および前記複数の制御量の間に相互干渉が存在するプラントの制御装置であって、
前記複数の制御入力をそれぞれ算出する制御入力算出手段と、
前記相互干渉を抑制するように前記複数の制御入力をそれぞれ補正するための複数の干渉抑制パラメータを算出し、当該複数の干渉抑制パラメータの各々の算出を、前記複数の制御入力のうちの、当該算出される干渉抑制パラメータで補正される制御入力以外の制御入力を入力とし、当該干渉抑制パラメータを出力として構築されたニューラルネットワークを用いて行う干渉抑制パラメータ算出手段と、
前記制御入力算出手段により算出された制御入力を、前記算出された干渉抑制パラメータに基づいて補正する補正手段と、
前記複数の制御量のそれぞれの目標となる複数の目標値を設定する目標値設定手段と、を備え、
前記制御入力算出手段は、前記複数の制御量が前記設定された複数の目標値にそれぞれなるように、前記複数の制御入力を算出し、
前記複数の制御量をそれぞれ検出する制御量検出手段と、
前記干渉抑制パラメータで補正された制御入力により制御された前記複数の制御量の各々が対応する目標値になるように、前記検出された当該制御量と当該目標値との比較結果に基づく報酬を用いた強化学習によって、前記ニューラルネットワークに用いられるパラメータであるニューロンパラメータを学習する学習手段と、をさらに備え、
当該学習手段は、前記ニューロンパラメータの学習を前記ニューラルネットワークごとに行い、
当該ニューロンパラメータを学習する前に、前記制御入力算出手段は、前記複数の制御入力のうちの、当該ニューロンパラメータが学習されるニューラルネットワークに対応する干渉抑制パラメータで補正される制御入力である学習対象用制御入力を、前記検出された、対応する制御量が前記目標値になるように、所定のフィードバック制御アルゴリズムによって算出するとともに、前記複数の制御入力のうちの前記学習対象用制御入力以外の制御入力である非学習対象用制御入力を、一定の第1所定値に保持し、前記補正手段は、前記複数の制御入力の補正を停止し、
当該ニューロンパラメータの学習中、前記制御入力算出手段は、前記学習対象用制御入力を、当該ニューロンパラメータの学習の開始直前に算出された値に保持するとともに、前記非学習対象用制御入力を前記第1所定値とは異なる一定の第2所定値に保持し、前記補正手段は、前記学習対象用制御入力を、当該ニューロンパラメータが学習される前記ニューラルネットワークに対応する前記干渉抑制パラメータに基づいて補正するとともに、当該ニューラルネットワーク以外のニューラルネットワークに対応する前記干渉抑制パラメータに基づく補正を停止し、前記学習手段は、前記強化学習を、前記補正された前記学習対象用制御入力により制御された制御量が当該ニューロンパラメータの学習の開始直前に設定された前記目標値になるように、検出された当該制御量と当該目標値との比較結果に基づく報酬を用いて行うことを特徴とするプラントの制御装置。 - 前記プラントは、スロットル弁の開度を変更するためのスロットル弁機構と、吸気弁のリフトを変更するための可変バルブリフト機構とを備える内燃機関を含み、
前記複数の制御入力は、前記スロットル弁の開度を制御するための開度制御パラメータおよび前記吸気弁のリフトを制御するためのリフト制御パラメータであり、
前記複数の制御量は、前記内燃機関の吸気通路内の圧力および吸入空気量であることを特徴とする、請求項1に記載のプラントの制御装置。 - 前記プラントは、既燃ガスの一部を第1EGRガスとして吸気通路に還流させる第1EGR装置と、既燃ガスの一部を第2EGRガスとして、前記吸気通路の前記第1EGR装置よりも気筒側の位置に還流させる第2EGR装置とを備える内燃機関を含み、
前記複数の制御入力は、前記第1EGR装置を制御するための第1EGR制御パラメータおよび前記第2EGR装置を制御するための第2EGR制御パラメータであり、
前記複数の制御量は、前記第1EGRガスの流量および前記第2EGRガスの流量であることを特徴とする、請求項1に記載のプラントの制御装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010249756A JP4975158B2 (ja) | 2010-11-08 | 2010-11-08 | プラントの制御装置 |
US13/282,086 US8762307B2 (en) | 2010-11-08 | 2011-10-26 | Control system for plant |
DE102011085898A DE102011085898A1 (de) | 2010-11-08 | 2011-11-08 | Steuer/Regelsystem für eine Anlage |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010249756A JP4975158B2 (ja) | 2010-11-08 | 2010-11-08 | プラントの制御装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012102629A JP2012102629A (ja) | 2012-05-31 |
JP4975158B2 true JP4975158B2 (ja) | 2012-07-11 |
Family
ID=45971333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010249756A Expired - Fee Related JP4975158B2 (ja) | 2010-11-08 | 2010-11-08 | プラントの制御装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8762307B2 (ja) |
JP (1) | JP4975158B2 (ja) |
DE (1) | DE102011085898A1 (ja) |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8775341B1 (en) | 2010-10-26 | 2014-07-08 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
US9015093B1 (en) | 2010-10-26 | 2015-04-21 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
KR101209742B1 (ko) * | 2010-11-04 | 2012-12-07 | 기아자동차주식회사 | 연속 가변 밸브 리프트(cvvl)기구 탑재 엔진간 밸브리프트 편차 보상방법 |
FR2981408B1 (fr) * | 2011-10-12 | 2013-10-18 | IFP Energies Nouvelles | Procede de commande d'une vanne integree dans un circuit de recirculation des gaz d'echappement d'un moteur |
DE102013205936B4 (de) * | 2013-04-04 | 2016-07-14 | TRUMPF Hüttinger GmbH + Co. KG | Verfahren zur Regelung einer Regelstrecke mit normierter Auswahlgröße |
DE102015103789B4 (de) * | 2014-03-26 | 2024-03-14 | GM Global Technology Operations LLC (n. d. Ges. d. Staates Delaware) | Verfahren zum Verbessern der Ansprechzeit einer Kraftmaschine unter Verwendung einer Modellvorhersagesteuerung |
EP3139026B1 (en) * | 2014-04-25 | 2020-12-09 | Nissan Motor Co., Ltd | Exhaust gas recirculation control device and exhaust gas recirculation control method |
JP5905066B1 (ja) * | 2014-11-20 | 2016-04-20 | 三菱電機株式会社 | 内燃機関の制御装置および制御方法 |
US9574509B2 (en) * | 2014-12-17 | 2017-02-21 | Ford Global Technologies, Llc | System and method for exhaust gas recirculation estimation with two intake oxygen sensors |
US9765705B2 (en) * | 2015-11-24 | 2017-09-19 | Fca Us Llc | Two-step valvetrain preposition control strategy |
EP3434888A4 (en) * | 2016-03-25 | 2019-04-03 | Honda Motor Co., Ltd. | EGR CONTROL DEVICE AND EGR CONTROL METHOD FOR INTERNAL COMBUSTION ENGINE |
GB2563393B (en) * | 2017-06-12 | 2020-08-05 | Jaguar Land Rover Ltd | Controlling an air charge provided to an engine |
JP7105556B2 (ja) | 2017-11-14 | 2022-07-25 | 千代田化工建設株式会社 | プラント管理システム及び管理装置 |
JP7160574B2 (ja) * | 2018-06-21 | 2022-10-25 | 株式会社日立製作所 | 処理装置、方法、およびプログラム |
JP6593560B1 (ja) * | 2019-02-15 | 2019-10-23 | トヨタ自動車株式会社 | 内燃機関の失火検出装置、内燃機関の失火検出システム、データ解析装置、および内燃機関の制御装置 |
DE102019125960B3 (de) * | 2019-09-26 | 2021-02-11 | Dr. Ing. H.C. F. Porsche Aktiengesellschaft | System und Verfahren zur Kalibrierung der Zylinderluftfüllung in zumindest einem Zylinder bei einem Verbrennungsmotor |
DE102019126069B4 (de) * | 2019-09-27 | 2022-01-20 | Dr. Ing. H.C. F. Porsche Aktiengesellschaft | System und Verfahren zur Kalibrierung einer Steuer- und Regelvorrichtung zur Einspritzdruckregelung bei einem Verbrennungsmotor |
JP6705545B1 (ja) * | 2019-10-18 | 2020-06-03 | トヨタ自動車株式会社 | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 |
JP6705546B1 (ja) * | 2019-10-18 | 2020-06-03 | トヨタ自動車株式会社 | 車両用制御装置、車両用制御システム、および車両用学習装置 |
JP6705544B1 (ja) * | 2019-10-18 | 2020-06-03 | トヨタ自動車株式会社 | 車両用制御装置、車両用制御システム、および車両用学習装置 |
JP6970156B2 (ja) * | 2019-10-18 | 2021-11-24 | トヨタ自動車株式会社 | 車両の制御に用いるデータの生成方法、車両用制御装置、車両用制御システム、車載装置および車両用学習装置 |
JP6744597B1 (ja) | 2019-10-18 | 2020-08-19 | トヨタ自動車株式会社 | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 |
JP6705547B1 (ja) * | 2019-10-18 | 2020-06-03 | トヨタ自動車株式会社 | 車両用制御装置、車両用制御システム、および車両用学習装置 |
CN114930514A (zh) | 2019-11-01 | 2022-08-19 | 玛特森技术公司 | 用于热处理系统的自适应控制的控制系统 |
JP7243642B2 (ja) | 2020-01-09 | 2023-03-22 | トヨタ自動車株式会社 | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 |
JP7331704B2 (ja) | 2020-01-09 | 2023-08-23 | トヨタ自動車株式会社 | 車両用制御データの生成方法、車両用制御装置、および車両用制御システム |
JP7287287B2 (ja) | 2020-01-09 | 2023-06-06 | トヨタ自動車株式会社 | 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置 |
JP7205503B2 (ja) | 2020-01-22 | 2023-01-17 | トヨタ自動車株式会社 | 内燃機関の制御装置 |
JP7222366B2 (ja) * | 2020-01-27 | 2023-02-15 | トヨタ自動車株式会社 | 内燃機関の制御装置 |
JP7359011B2 (ja) | 2020-02-05 | 2023-10-11 | トヨタ自動車株式会社 | 内燃機関の制御装置 |
FR3112168B1 (fr) * | 2020-07-06 | 2022-11-04 | Renault Sas | Procédé de gestion d’un moteur à combustion interne pour un véhicule automobile |
EP4196854A1 (en) * | 2020-08-17 | 2023-06-21 | 5G3I Ltd | Systems and methods for enhanced control of electronic circuits |
DE102020212457A1 (de) | 2020-10-01 | 2022-04-07 | Volkswagen Aktiengesellschaft | Verfahren zur Optimierung eines Betriebsparameters eines Verbrennungsmotors, Motorsteuergerät und ein Fahrzeug |
DE102020129873B3 (de) | 2020-11-12 | 2022-03-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung eingetragener Verein | Lernfähiges Steuergerät mit selbständiger Exploration eines Betriebsparameterraums |
US11459964B2 (en) * | 2020-12-07 | 2022-10-04 | Ford Global Technologies, Llc | Methods and systems for an exhaust gas recirculation system |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0711256B2 (ja) * | 1989-09-06 | 1995-02-08 | 本田技研工業株式会社 | 内燃エンジンの制御装置 |
JP2500206B2 (ja) | 1991-03-26 | 1996-05-29 | 日本碍子株式会社 | セラミックス製品の焼成方法 |
DE69635429T2 (de) * | 1995-01-27 | 2006-08-03 | Matsushita Electric Industrial Co., Ltd., Kadoma | Luft/Kraftstoff-Verhältnis-Steuersystem |
JP3510021B2 (ja) * | 1995-09-29 | 2004-03-22 | 松下電器産業株式会社 | 内燃機関の空燃比制御装置 |
DE69729981T2 (de) * | 1996-05-28 | 2004-12-16 | Honda Giken Kogyo K.K. | Gerät zur Steuerung des Luft/Kraftstoffverhältnisses, das ein neuronales Netzwerk benutzt |
US6678640B2 (en) * | 1998-06-10 | 2004-01-13 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for parameter estimation, parameter estimation control and learning control |
JP4430270B2 (ja) * | 2001-08-06 | 2010-03-10 | 本田技研工業株式会社 | プラントの制御装置及び内燃機関の空燃比制御装置 |
JP3783589B2 (ja) * | 2001-08-29 | 2006-06-07 | 日産自動車株式会社 | 内燃機関の可変動弁装置 |
JP4387286B2 (ja) | 2004-11-05 | 2009-12-16 | 本田技研工業株式会社 | 内燃機関の制御装置 |
JP2007011866A (ja) * | 2005-07-01 | 2007-01-18 | Yokogawa Electric Corp | プロセス制御装置における非干渉制御方法、およびプロセス制御装置 |
JP2007233760A (ja) * | 2006-03-01 | 2007-09-13 | Nec Corp | 構成管理装置、構成変更進捗取得方法およびプログラム |
JP4673787B2 (ja) * | 2006-05-10 | 2011-04-20 | 本田技研工業株式会社 | 内燃機関の空燃比制御装置 |
JP2008057439A (ja) * | 2006-08-31 | 2008-03-13 | Honda Motor Co Ltd | 内燃機関の筒内圧検出装置 |
JP4209435B2 (ja) * | 2006-10-19 | 2009-01-14 | 本田技研工業株式会社 | 制御装置 |
JP4300239B2 (ja) | 2007-01-17 | 2009-07-22 | 本田技研工業株式会社 | 内燃機関の制御装置 |
JP5187845B2 (ja) | 2008-12-10 | 2013-04-24 | 独立行政法人物質・材料研究機構 | メタノール分解触媒 |
-
2010
- 2010-11-08 JP JP2010249756A patent/JP4975158B2/ja not_active Expired - Fee Related
-
2011
- 2011-10-26 US US13/282,086 patent/US8762307B2/en not_active Expired - Fee Related
- 2011-11-08 DE DE102011085898A patent/DE102011085898A1/de not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
DE102011085898A1 (de) | 2012-05-10 |
US20120117011A1 (en) | 2012-05-10 |
JP2012102629A (ja) | 2012-05-31 |
US8762307B2 (en) | 2014-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4975158B2 (ja) | プラントの制御装置 | |
JP5028509B2 (ja) | 内燃機関のegr制御装置 | |
JP5075229B2 (ja) | 内燃機関のegr制御装置 | |
US5954783A (en) | Engine control system using combination of forward model and inverse model | |
JP4615573B2 (ja) | 内燃機関の制御装置 | |
US7031824B2 (en) | Multivariable actuator control for an internal combustion engine | |
CN102797571B (zh) | 用于估计废气再循环量的装置 | |
JP5426520B2 (ja) | 内燃機関の制御装置 | |
US8108123B2 (en) | Sliding mode control system for internal combustion engine | |
JP2009180217A (ja) | 内燃機関の制御装置 | |
JP4192759B2 (ja) | ディーゼル機関の噴射量制御装置 | |
US10876500B2 (en) | Control device of internal combustion engine | |
US10883430B2 (en) | EGR control apparatus and EGR control method for internal combustion engine | |
Yoon et al. | An adaptive sliding mode controller for air-fuel ratio control of spark ignition engines | |
JP4228953B2 (ja) | 内燃機関の制御装置 | |
EP2397677B1 (en) | Egr control apparatus for internal combustion engine | |
JP4483278B2 (ja) | 複数過給機を備える内燃機関 | |
EP3807511B1 (en) | Adaptive engine control | |
JPH11353006A (ja) | オンライン学習方法 | |
Le Solliec et al. | Downsized SI engine control: A torque-based design from simulation to vehicle | |
JP2014070525A (ja) | 内燃機関の制御装置 | |
WO2011033661A1 (ja) | 内燃機関の制御装置 | |
Samokhin | Adaptive control of conventional and hybrid marine diesel engines subject to uncertain or time-varying dynamics | |
Le Solliec et al. | Experimental airpath control of a turbocharged SI engine with valve timing actuators | |
JP2023080500A (ja) | エンジン制御装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120313 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120410 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150420 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |