JP2021116781A - 車両制御方法、車両用制御装置及びサーバ - Google Patents

車両制御方法、車両用制御装置及びサーバ Download PDF

Info

Publication number
JP2021116781A
JP2021116781A JP2020012546A JP2020012546A JP2021116781A JP 2021116781 A JP2021116781 A JP 2021116781A JP 2020012546 A JP2020012546 A JP 2020012546A JP 2020012546 A JP2020012546 A JP 2020012546A JP 2021116781 A JP2021116781 A JP 2021116781A
Authority
JP
Japan
Prior art keywords
vehicle
data
environment
server
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020012546A
Other languages
English (en)
Inventor
洋介 橋本
Yosuke Hashimoto
洋介 橋本
章弘 片山
Akihiro Katayama
章弘 片山
裕太 大城
Yuta Oshiro
裕太 大城
和紀 杉江
Kazuki Sugie
和紀 杉江
尚哉 岡
Naoya Oka
尚哉 岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2020012546A priority Critical patent/JP2021116781A/ja
Priority to US17/128,505 priority patent/US20210229688A1/en
Priority to CN202110105324.1A priority patent/CN113266481A/zh
Publication of JP2021116781A publication Critical patent/JP2021116781A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/06Improving the dynamic response of the control system, e.g. improving the speed of regulation or avoiding hunting or overshoot
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/0002Controlling intake air
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/24Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means
    • F02D41/2406Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means using essentially read only memories
    • F02D41/2425Particular ways of programming the data
    • F02D41/2429Methods of calibrating or learning
    • F02D41/2441Methods of calibrating or learning characterised by the learning conditions
    • F02D41/2445Methods of calibrating or learning characterised by the learning conditions characterised by a plurality of learning conditions or ranges
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/24Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means
    • F02D41/2406Electrical control of supply of combustible mixture or its constituents characterised by the use of digital means using essentially read only memories
    • F02D41/2425Particular ways of programming the data
    • F02D41/2429Methods of calibrating or learning
    • F02D41/2451Methods of calibrating or learning characterised by what is learned or calibrated
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0062Adapting control system settings
    • B60W2050/0075Automatic parameter input, automatic initialising or calibrating means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2555/00Input parameters relating to exterior conditions, not covered by groups B60W2552/00, B60W2554/00
    • B60W2555/20Ambient conditions, e.g. wind or rain
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2556/00Input parameters relating to data
    • B60W2556/45External transmission of data to or from the vehicle

Abstract

【課題】走行環境に応じた車両制御を提供できるようにすること。【解決手段】車両VC1の制御装置70に、車両VC1の状態を取得する状態取得処理と、状態取得処理で取得された車両VC1の状態と、記憶装置76に記憶されているマップデータDMと、に基づいて車両VC1の電子機器を操作する操作処理と、車両が走行している環境に関する情報である環境情報を取得する環境情報取得処理と、環境情報取得処理で取得された環境情報が示す環境が変わったか否かを判定する環境判定処理とを実行させる。また、制御装置70とサーバ130との協働により、環境判定処理で環境情報が示す環境が変わったと判定されたときに、環境情報に応じたマップデータDMを、サーバ130から制御装置70に取得させ、当該マップデータDMを記憶装置76に記憶させるデータ変更処理を実行させる。【選択図】図2

Description

本発明は、車両制御方法、車両用制御装置及びサーバに関する。
特許文献1には、アクセルペダルの操作量をフィルタ処理した値に基づき、車両に搭載される内燃機関の操作部としてのスロットルバルブを操作する制御装置の一例が記載されている。
特開2016−6327号公報
ところで、上記フィルタは、アクセルペダルの操作量に応じて車両に搭載される内燃機関のスロットルバルブの操作量を適切な操作量に設定するものである必要があることから、その適合には熟練者が多くの工数をかける必要が生じる。このように、従来は、車両の状態に応じた車両内の電子機器の操作量などの適合には、熟練者が多くの工数をかけていた。
以下、上記課題を解決するための手段及びその作用効果について記載する。
1.車両に設けられている車両用制御装置と、前記車両用制御装置と通信するサーバと、を備えるとともに、前記車両の電子機器を操作する際に用いられる操作用データが記憶される第1記憶装置が前記車両用制御装置に設けられているシステムに適用され、前記車両に設けられているセンサの検出値に基づく前記車両の状態を取得する状態取得処理と、前記状態取得処理で取得された前記車両の状態と、前記第1記憶装置に記憶されている前記操作用データと、に基づいて前記電子機器を操作する操作処理と、前記車両が走行している環境である走行環境に関する情報である環境情報を取得する環境情報取得処理と、前記環境情報取得処理で取得された前記環境情報が示す前記走行環境が変わったか否かを判定する環境判定処理と、前記環境判定処理で前記走行環境が変わったと判定されたときに、前記環境情報に応じた前記操作用データを、前記サーバから前記車両用制御装置に取得させ、当該操作用データを前記第1記憶装置に記憶させるデータ変更処理と、を実行装置に実行させる車両制御方法である。
上記構成によれば、車両の環境情報が示す走行環境が変わったと判定されると、車両用制御装置では、当該環境情報に応じた操作用データがサーバから取得され、当該操作用データが第1記憶装置に記憶される。その後においては、新たに第1記憶装置に記憶された操作用データに基づいて車両の電子機器が操作される。すなわち、上記構成によれば、そのときの車両の走行環境に応じた操作用データを車両に提供することにより、当該走行環境に応じた車両制御を実行させることができる。
2.前記環境情報は、前記車両が走行しているエリアに関する情報を含み、前記環境判定処理は、前記環境情報が示す前記車両が走行しているエリアが変わったときに、前記走行環境が変わったと判定する処理である上記1に記載の車両制御方法である。
上記構成によれば、車両が走行しているエリアが変わったと判定されると、車両が走行している新たなエリアに応じた操作用データが、サーバから車両用制御装置に提供される。その結果、そのときの走行エリアに応じた操作用データに応じた車両制御を実行させることができる。
3.前記環境情報は、現在の季節に関する情報を含み、前記環境判定処理は、前記環境情報が示す季節が変わったときに、前記走行環境が変わったと判定する処理である上記1又は2に記載の車両制御方法である。
上記構成によれば、季節が変わったと判定されると、新たな季節に応じた操作用データが、サーバから車両用制御装置に提供される。その結果、そのときの季節に応じた操作用データに応じた車両制御を実行させることができる。
4.前記操作用データは、前記車両の状態と前記電子機器の操作に関する変数である行動変数との関係を規定する関係規定データであり、前記関係規定データとは、前記車両の状態と前記関係規定データとによって定まる前記行動変数の値に基づいて前記電子機器が操作された際における前記車両の状態を基に、前記車両の特性が所定の基準を満たす場合には前記車両の特性が前記所定の基準を満たさない場合よりも大きい報酬を与える処理と、前記電子機器が操作された際における前記車両の状態、前記電子機器の操作に用いられた前記行動変数の値、及び当該操作に対応する前記報酬を予め定められた更新写像への入力とし、前記関係規定データを更新する処理と、を実行することによって得られるデータであり、前記更新写像は、前記関係規定データに従って前記電子機器が操作される場合の前記報酬についての期待収益を増加させるように更新された前記関係規定データを出力するものである上記1〜3のうち何れか一項に記載の車両制御方法である。
上記構成では、電子機器の操作に伴う報酬を算出することにより、当該操作によってどのような報酬が得られるかを把握できる。そして、得られた報酬に基づき、強化学習に従った更新写像によって関係規定データを更新することにより、車両の状態と行動変数との関係を車両の走行において適切な関係に設定できる。そのため、車両の状態と行動変数との関係を車両の走行において適正化することが可能となる。すなわち、関係規定データを更新させることにより、車両制御の適正化を図ることができる。
5.前記操作用データは、前記車両の状態と前記電子機器の操作に関する変数である行動変数との関係を規定する関係規定データを基に作成される制御用写像データであり、前記関係規定データとは、前記車両の状態と前記関係規定データとによって定まる前記行動変数の値に基づいて前記電子機器が操作された際における前記車両の状態を基に、前記車両の特性が所定の基準を満たす場合には前記車両の特性が前記所定の基準を満たさない場合よりも大きい報酬を与える処理と、前記電子機器が操作された際における前記車両の状態、前記電子機器の操作に用いられた前記行動変数の値、及び当該操作に対応する前記報酬を予め定められた更新写像への入力とし、前記関係規定データを更新する処理と、を実行することによって得られるデータであり、前記更新写像は、前記関係規定データに従って前記電子機器が操作される場合の前記報酬についての期待収益を増加させるように更新された前記関係規定データを出力するものである上記1〜3のうち何れか一項に記載の車両制御方法である。
上記構成によれば、そのときの環境情報に応じた制御用写像データが、サーバから車両用制御装置に提供される。すると、当該制御用写像データが第1記憶装置に記憶され、当該制御用写像データに基づいて車両の電子機器が操作される。これにより、そのときの走行環境に応じた適切な車両制御を車両で実行させることが可能となる。
6.前記サーバは、想定する複数の前記環境情報の各々に対応する複数の前記操作用データを記憶する第2記憶装置を備えるものであり、前記データ変更処理は、前記第2記憶装置に記憶されている複数の前記操作用データの中から、前記環境情報取得処理で取得された前記環境情報に応じたデータを選択するデータ選択処理と、前記データ選択処理で選択された前記操作用データを前記車両用制御装置に送信する送信処理と、前記送信処理で前記サーバから送信された前記操作用データを前記第1記憶装置に記憶させるデータ記憶処理と、を含む上記1〜5のうち何れか一項に記載の車両制御方法である。
上記構成によれば、サーバの第2記憶装置に記憶されている複数の操作用データの中から、環境情報に応じたデータが選択され、当該操作用データが、サーバから車両用制御装置に送信される。
7.前記データ変更処理は、前記サーバと通信可能な複数の前記車両のうちの第1車両の前記環境情報が示す前記走行環境が変わったときに、変更後における前記第1車両の前記走行環境と同じ前記走行環境で走行している第2車両を探索する車両探索処理と、前記車両探索処理で探索された前記第2車両から当該第2車両の前記関係規定データを、前記サーバに取得させる変更用データ取得処理と、前記変更用データ取得処理で前記サーバに取得させた前記第2車両の前記関係規定データを、前記第1車両に送信する送信処理と、前記送信処理で前記サーバから前記第1車両に送信された前記第2車両の前記操作用データを、前記第1車両の前記第1記憶装置に記憶させるデータ記憶処理と、を含む上記4に記載の車両制御方法である。
上記構成によれば、第1車両の走行環境が変わったと判定されると、第1車両と同じ走行環境で走行している第2車両が探索される。そして、探索した第2車両の操作用データがサーバを介して第1車両に提供される。これにより、そのときの走行環境に応じた車両制御を第1車両で実行させることができる。
8.前記実行装置は、前記車両に設けられている第1実行装置と、前記サーバに設けられている第2実行装置と、を備えるものであり、前記状態取得処理及び前記操作処理を、前記第1実行装置に実行させ、前記環境情報取得処理を、前記第1実行装置又は前記第2実行装置に実行させ、前記データ変更処理を、前記第1実行装置及び前記第2実行装置の協働によって実行させる上記1〜7のうち何れか一項に記載の車両制御方法である。
9.上記8に記載の前記第1実行装置及び前記第1記憶装置を備える車両用制御装置である。
10.上記8に記載の前記第2実行装置を備えるサーバである。
第1実施形態にかかる制御装置及び駆動系を示す図。 同制御装置の構成と、車両と通信するサーバの構成とを模式的に示すブロック図。 第1実施形態にかかるマップデータを生成するシステムを示す図。 第1実施形態にかかるシステムが実行する処理の手順を示す流れ図。 第1実施形態にかかる学習処理の詳細を示す流れ図。 車両の電子機器を操作する際に制御装置が実行する処理の手順を示す流れ図。 制御装置の記憶装置に記憶されるマップデータを書き換える際に制御装置が実行する処理の手順を示す流れ図。 車両の走行環境に応じたマップデータを車両に提供する際にサーバが実行する処理の手順を示す流れ図。 第2実施形態にかかる制御装置の構成と、サーバの構成とを模式的に示すブロック図。 車両の電子機器を操作する際に制御装置が実行する処理の手順を示す流れ図。 第3実施形態にかかる制御装置の構成と、サーバの構成とを模式的に示すブロック図。 車両の走行環境に応じたマップデータを車両に提供する際にサーバが実行する処理の手順を示す流れ図。
(第1実施形態)
以下、車両制御方法、車両用制御装置及びサーバの第1実施形態について、図面を参照しつつ説明する。
図1には、車両用制御装置である制御装置70と、制御装置70を備える車両VC1の駆動系の構成が図示されている。
図1に示すように、車両VC1は、車両VC1の推力生成装置として内燃機関10を備えている。内燃機関10の吸気通路12には、上流側から順にスロットルバルブ14及び燃料噴射弁16が設けられており、吸気通路12に吸入された空気及び燃料噴射弁16から噴射された燃料は、吸気バルブ18の開弁に伴って、シリンダ20及びピストン22によって区画される燃焼室24に流入する。燃焼室24内において、燃料と空気との混合気は、点火装置26の火花放電に伴って燃焼に供され、燃焼によって生じたエネルギは、ピストン22を介してクランク軸28の回転エネルギに変換される。燃焼に供された混合気は、排気バルブ30の開弁に伴って、排気として排気通路32に排出される。排気通路32には、排気を浄化する後処理装置としての触媒34が設けられている。
クランク軸28には、ロックアップクラッチ42を備えたトルクコンバータ40を介して、変速装置50の入力軸52が機械的に連結可能とされている。変速装置50は、入力軸52の回転速度と出力軸54の回転速度との比である変速比を可変とする装置である。出力軸54には、駆動輪60が機械的に連結されている。
制御装置70は、内燃機関10を制御対象とし、その制御量であるトルクや排気成分比率などを制御すべく、スロットルバルブ14、燃料噴射弁16及び点火装置26などの内燃機関10の操作部を操作する。また、制御装置70は、トルクコンバータ40を制御対象とし、ロックアップクラッチ42の係合状態を制御すべくロックアップクラッチ42を操作する。また、制御装置70は、変速装置50を制御対象とし、その制御量としての変速比を制御すべく変速装置50を操作する。なお、図1には、スロットルバルブ14、燃料噴射弁16、点火装置26、ロックアップクラッチ42、及び変速装置50のそれぞれの操作信号MS1〜MS5を記載している。このように制御装置70からの操作信号MS1〜MS5が入力される操作部の各々が、「電子機器」の一例である。
制御装置70は、制御量の制御のために、エアフローメータ80によって検出される吸入空気量Ga、スロットルセンサ82によって検出されるスロットルバルブ14の開口度であるスロットル開口度TA、及び、クランク角センサ84の出力信号Scrを参照する。また、制御装置70は、アクセルセンサ88によって検出されるアクセルペダル86の踏み込み量であるアクセル操作量PA、及び、加速度センサ90によって検出される車両VC1の前後方向の加速度Gxを参照する。また、制御装置70は、全地球測位システム(GPS92)による位置データPgps、シフトポジションセンサ94によって検出される変速比GR、及び、車速センサ96によって検出される車速Vを参照する。
制御装置70は、CPU72、ROM74、電気的に書き換え可能な不揮発性メモリである記憶装置76、通信機77及び周辺回路78を備え、それらがローカルネットワーク79を介して通信可能とされている。ここで、周辺回路78は、内部の動作を規定するクロック信号を生成する回路、電源回路及びリセット回路などを含む。
ROM74には、制御プログラム74aが記憶されている。一方、記憶装置76には、スロットル開口度TAの指令値であるスロットル開口度指令値TA*、及び、変速比GRの指令値である変速比指令値GR*を出力変数とするマップデータDMと、地図データDGとが記憶されている。マップデータDMは、現在の変速比GR、車速V及びアクセル操作量PAの時系列データを入力変数とし、スロットル開口度指令値TA*及び変速比指令値GR*を出力変数とするためのマップである。
図2に示すように、通信機77は、車両VC1の外部のネットワーク120を介し、車外に設けられているサーバ130と通信するための機器である。
サーバ130は、複数の車両VC1,VC2,…から送信されるデータを解析する。サーバ130は、CPU132、ROM134、電気的に書き換え可能な不揮発性メモリである記憶装置136、周辺回路138及び通信機137を備えており、それらがローカルネットワーク139によって通信可能とされるものである。ROM134には、制御プログラム134aが記憶されており、記憶装置136には、マップデータDMが記憶されている。本実施形態では、記憶装置136には、マップデータDMとして、マップデータDM11,DM12,DM21,…が記憶されている。
すなわち、マップデータDMとして、複数のエリアの各々に対応する複数のマップデータが用意されている。例えば、マップデータDM11,DM12は、第1エリアAR1で車両が走行することを想定した強化学習によって得られたマップデータである。マップデータDM21は、第1エリアAR1とは異なる第2エリアAR2で車両が走行することを想定した強化学習によって得られたマップデータである。図示は省略するが、エリアAR1,AR2とは異なる第3エリアで車両が走行することを想定した強化学習によって得られたマップデータも用意されている。
例えば、第1エリアAR1で給油施設から車両に供給される燃料の性状を第1性状とした場合、第2エリアAR2とは、第1性状とは異なる第2性状の燃料を車両に供給するエリアである。すなわち、本実施形態におけるエリアとは、給油施設から車両に供給される燃料の性状の相違によって区分けされたエリアである。
また、本実施形態では、季節毎のマップデータが用意されている。例えば、第1エリアAR1用のマップデータDM11,DM12のうち、マップデータDM11は、冬以外の季節に車両が第1エリアAR1を走行することを想定した強化学習によって得られたマップデータである。一方、マップデータDM12は、冬に車両が第1エリアAR1を走行することを想定した強化学習によって得られたマップデータである。第2エリアAR2用の複数のマップデータのうち、マップデータDM12は、冬以外の季節に車両が第2エリアAR2を走行することを想定した強化学習によって得られたマップデータである。また、図示は省略するが、第2エリアAR2用のマップデータとして、冬に車両が第2エリアAR2を走行することを想定した強化学習によって得られたマップデータも用意されている。
各エリアAR1,AR2では、給油施設から車両に供給する燃料の性状が季節によって変更される。例えば、冬のように気温が低い場合と、冬以外の季節のように気温があまり低くならない場合とでは、給油施設から車両に供給される燃料の揮発性が相違する。
図3に、上記マップデータDMを生成するシステムを示す。
図3に示すシステムでは、内燃機関10のクランク軸28にトルクコンバータ40及び変速装置50を介してダイナモメータ100が機械的に連結される。そして、内燃機関10を稼働させた際の様々な状態変数がセンサ群102によって検出され、検出結果が、マップデータDMを生成するコンピュータである生成装置110に入力される。なお、センサ群102には、図1に示した車両VC1に搭載されるセンサなどが含まれる。
生成装置110は、CPU112、ROM114、電気的に書き換え可能な不揮発性メモリである記憶装置116、及び周辺回路118を備えており、それらがローカルネットワーク119によって通信可能とされたものである。記憶装置116には、マップデータDMが記憶されている。本実施形態では、記憶装置116には、マップデータDMとして、複数のマップデータDM11,DM12,DM21,…が記憶されている。ROM114には、強化学習によって、後述する関係規定データDRを学習する学習プログラム114aが記憶されている。
図4に、生成装置110が実行する処理の手順を示す。図4に示す一連の処理は、ROM114に記憶された学習プログラム114aを、CPU112が実行することにより実現される。なお、以下では、先頭に「S」が付与された数字によって、各処理のステップ番号を表現する。
図4に示す一連の処理において、CPU112は、環境係数VAの値を設定する(S10)。環境係数VAは、後述する各関係規定データDR11,DR12,DR21,…の何れの関係規定データの学習を行うかを決めるための係数である。すなわち、環境係数VAを変えることにより、学習の行われる関係規定データDRを変更できる。例えば、環境係数VAが「11」であるときには、第1エリアAR1用のマップデータのうち、冬以外の季節用のマップデータDM11の作成に用いられる関係規定データDR11が学習される。また例えば、環境係数VAが「12」であるときには、第1エリアAR1用のマップデータのうち、冬用のマップデータDM12の作成に用いられる関係規定データDR12が学習される。また例えば、環境係数VAが「21」であるときには、第2エリアAR2用のマップデータのうち、冬以外の季節用のマップデータDM21の作成に用いられる関係規定データDR21が学習される。また例えば、環境係数VAが「22」であるときには、第2エリアAR2用のマップデータのうち、冬用のマップデータの作成に用いられる関係規定データが学習される。また例えば、環境係数VAが「31」であるときには、第3エリア用のマップデータのうち、冬以外の季節用のマップデータの作成に用いられる関係規定データが学習される。
ここで、関係規定データDRとは、状態変数としての、アクセル操作量PAの時系列データ、車速V及び変速比GRと、行動変数としてのスロットル開口度指令値TA*及び変速比指令値GR*との関係を規定するデータである。関係規定データDRは、強化学習によって導出されるデータである。関係規定データDRのうち、関係規定データDR11は、冬以外の季節に第1エリアAR1を走行することを想定した強化学習を行うことによって導出された関係規定データである。また、関係規定データDR12は、冬に第1エリアAR1を走行することを想定した強化学習を行うことによって導出された関係規定データである。また、関係規定データDR21は、冬以外の季節に第2エリアAR2を走行することを想定した強化学習を行うことによって導出された関係規定データである。
本実施形態では、内燃機関10を実際に稼働させることによって状態sを取得し、取得した状態sを基に関係規定データDRの更新が行われる。このように内燃機関10を稼働させる場合、更新される関係規定データDRに対応する燃料が内燃機関10に供給される。例えば、環境係数VAが「11」である場合、第1エリアAR1において冬以外の季節に給油施設から車両に供給される燃料の性状と同じ性状の燃料を用いて内燃機関10が稼働される。また例えば、環境係数VAが「11」から「12」に変更された場合、内燃機関10に供給される燃料を変更した上で、すなわち第1エリアAR1において冬に給油施設から車両に供給される燃料の性状と同じ性状の燃料を内燃機関10に供給するようにした上で、内燃機関10が稼働される。
CPU112は、内燃機関10を稼働させた状態において、状態sとして、アクセル操作量PAの6個のサンプリング値「PA(1),PA(2),…PA(6)」からなる時系列データと、現在の変速比GRと、車速Vとを取得する(S12)。ここで、時系列データを構成する各サンプリング値は、互いに異なるタイミングにおいてサンプリングされたものである。本実施形態では、一定のサンプリング周期でサンプリングされる場合の、互いに時系列的に隣り合う6個のサンプリング値によって時系列データを構成する。ただし、図3に示すシステムにおいては、アクセルペダル86は存在しない。そのため、アクセル操作量PAを、生成装置110が車両VC1の状態を模擬することによって疑似的に生成されたものとし、疑似的に生成されたアクセル操作量PAを、センサの検出値に基づく車両の状態とみなす。また、車速Vは、実際に車両が存在すると仮定した場合の車両の走行速度としてCPU112によって算出されるものであり、本実施形態では、この車速Vを、センサの検出値に基づく車両の状態とみなす。詳しくは、CPU112は、クランク角センサ84の出力信号Scrに基づきクランク軸28の回転速度NEを算出し、回転速度NEと変速比GRとに基づき車速Vを算出する。
次にCPU112は、上記各関係規定データDR11,DR12,DR21,…のうちのS10の処理によって設定された環境係数VAの値に対応するデータが定める方策πに従い、S12の処理によって取得した状態sに応じたスロットル開口度指令値TA*及び変速比指令値GR*からなる行動aを設定する(S14)。
本実施形態において、関係規定データDRは、行動価値関数Q及び方策πを定めるデータである。本実施形態において、行動価値関数Qは、状態s及び行動aの10次元の独立変数に応じた期待収益の値を示すテーブル型式の関数である。また、方策πは、状態sが与えられたときに、独立変数が与えられた状態sとなる行動価値関数Qのうち最大となる行動a(グリーディ行動)を優先的に選択しつつも、所定の確率で、それ以外の行動aを選択する規則を定める。
詳しくは、本実施形態にかかる行動価値関数Qの独立変数がとりうる値の数は、状態s及び行動aのとりうる値の全組み合わせの一部が、人の知見などによって削減されたものである。すなわち、例えばアクセル操作量PAの時系列データのうち隣接する2つのサンプリング値の1つがアクセル操作量PAの最小値となりもう1つが最大値となるようなことは、人によるアクセルペダル86の操作からは生じえないとして、行動価値関数Qが定義されていない。また、変速比GRが2速から4速へと急激に変化することを回避すべく、例えば現在の変速比GRが2速の場合、とりうる行動aとしての変速比指令値GR*を1速と2速と3速とに制限している。すなわち、状態sとしての変速比GRが2速の場合には4速以上の行動aについては定義されていない。本実施形態では、人の知見などに基づく次元削減によって、行動価値関数Qを定義する独立変数の取りうる値を、10の5乗個以下、より望ましくは10の4乗個以下に制限する。
次にCPU112は、設定されたスロットル開口度指令値TA*及び変速比指令値GR*に基づき、スロットルバルブ14に操作信号MS1を出力してスロットル開口度TAを操作するとともに、変速装置50に操作信号MS5を出力して変速比を操作する(S16)。次にCPU112は、回転速度NE、変速比GR、内燃機関10のトルクTrq、内燃機関10に対するトルク指令値Trq*及び加速度Gxを取得する(S18)。ここで、CPU112は、トルクTrqを、ダイナモメータ100が生成する負荷トルクと変速装置50の変速比とに基づき算出する。また、トルク指令値Trq*は、アクセル操作量PA及び変速比GRに応じて設定される。なお、ここでは、変速比指令値GR*が強化学習の行動変数であることから、変速比指令値GR*がトルク指令値Trq*を内燃機関10で実現できる最大トルク以下とするものとなっているとは限らない。そのため、トルク指令値Trq*は、内燃機関10で実現できる最大トルク以下の値とは限らない。また、CPU112は、加速度Gxを、ダイナモメータ100の負荷トルクなどに基づき、仮に内燃機関10などが車両に搭載されていた場合に車両に生じると想定される値として算出する。すなわち、本実施形態においては、加速度Gxについても仮想的なものであるが、この加速度Gxについても、センサの検出値に基づく車両の状態とみなす。
次にCPU72は、S10の処理がなされたタイミング及び後述のS22の処理がなされたタイミングのうちの何れか遅い方から所定期間が経過したか否かを判定する(S20)。そして、CPU112は、所定期間が経過したと判定する場合(S20:YES)、強化学習によって関係規定データDRを更新する(S22)。
図5に、S22の処理の詳細を示す。
図5に示す一連の処理において、CPU112は、所定期間内における回転速度NE、トルク指令値Trq*、トルクTrq及び加速度Gxの4つのサンプリング値の組からなる時系列データと、状態s及び行動aの時系列データとを取得する(S30)。図5には、カッコの中の数字が異なるものが、異なるサンプリングタイミングにおける変数の値であることを示す。例えば、トルク指令値Trq*(1)とトルク指令値Trq*(2)とは、サンプリングタイミングが互いに異なるものである。また、所定期間内の行動aの時系列データを、行動集合Ajとし、所定期間内の状態sの時系列データを、状態集合Sjと定義する。
次にCPU112は、所定期間内の任意のトルクTrqとトルク指令値Trq*との差の絶対値が規定量ΔTrq以下である旨の条件(ア)と、加速度Gxが下限値GxL以上であって上限値GxH以下である旨の条件(イ)との論理積が真であるか否かを判定する(S36)。
ここで、CPU112は、規定量ΔTrqを、エピソードの開始時におけるアクセル操作量PAの単位時間当たりの変化量ΔPAと環境係数VAの値とによって可変設定する。すなわち、CPU112は、変化量ΔPAの絶対値が大きい場合には過渡時に関するエピソードであるとして、定常時である場合と比較して、規定量ΔTrqを大きい値に設定する。
また、CPU112は、下限値GxLを、エピソードの開始時におけるアクセル操作量PAの変化量ΔPAによって可変設定する。すなわち、CPU112は、過渡時に関するエピソードであって且つ変化量ΔPAが正である場合には、定常時に関するエピソードの場合と比較して、下限値GxLを大きい値に設定する。また、CPU112は、過渡時に関するエピソードであって且つ変化量ΔPAが負である場合には、定常時に関するエピソードの場合と比較して、下限値GxLを小さい値に設定する。
また、CPU72は、上限値GxHを、エピソードの開始時におけるアクセル操作量PAの単位時間当たりの変化量ΔPAによって可変設定する。すなわち、CPU72は、過渡時に関するエピソードであって且つ変化量ΔPAが正である場合には、定常時に関するエピソードの場合と比較して、上限値GxHを大きい値に設定する。また、CPU72は、過渡時に関するエピソードであって且つ変化量ΔPAが負である場合には、定常時に関するエピソードの場合と比較して、上限値GxHを小さい値に設定する。
また、CPU112は、下限値GxL及び上限値GxHを、環境係数VAの値に応じて可変設定する。例えば、第1エリアAR1が、第2エリアAR2よりも高燃費が求められているエリアであるとする。車両の燃費は、加速度Gxの急変が生じにくいほど高くなりやすい。そこで、例えば、CPU112は、第1エリアAR1用の関係規定データDR11,DR12の更新時には、第2エリアAR2用の関係規定データDR21の更新時よりも下限値GxLと上限値GxHとの差分が小さくなるように、下限値GxL及び上限値GxHを設定する。
CPU72は、論理積が真であると判定する場合(S36:YES)、報酬rとして正の値αを設定する一方(S38)、偽であると判定する場合(S36:NO)、報酬rとして負の値βを設定する(S40)。S36〜S40の処理は、所定の基準を満たす場合に満たさない場合よりも大きい報酬を与える処理である。また、本実施形態では、環境係数VAの値に応じて所定の基準が変更されている。
CPU112は、S38,S40の処理が完了する場合、関係規定データDRを更新する。本実施形態では、εソフト方策オン型モンテカルロ法を用いる。
すなわち、CPU112は、上記S30の処理によって読み出した各状態と対応する行動との組によって定まる収益R(Sj,Aj)に、それぞれ、報酬rを加算する(S46)。ここで、「R(Sj,Aj)」は、状態集合Sjの要素の1つを状態とし行動集合Ajの要素の1つを行動とする収益Rを総括した記載である。次にCPU112は、上記S30の処理によって読み出した各状態と対応する行動との組によって定まる収益R(Sj,Aj)のそれぞれについて、平均化して対応する行動価値関数Q(Sj,Aj)に代入する(S48)。ここで、平均化は、S48の処理がなされた回数によって、S48の処理によって算出された収益Rを除算する処理とすればよい。なお、収益Rの初期値は、ゼロとすればよい。
次にCPU112は、上記S30の処理によって読み出した状態について、それぞれ、対応する行動価値関数Q(Sj,A)のうち、最大値となるときのスロットル開口度指令値TA*及び変速比指令値GR*の組である行動を、行動Aj*に代入する(S50)。ここで、「A」は、とりうる任意の行動を示す。なお、行動Aj*は、上記S30の処理によって読み出した状態の種類に応じて各別の値となるものであるが、ここでは、表記を簡素化して、同一の記号にて記載している。
次にCPU112は、上記S30の処理によって読み出した状態のそれぞれについて、対応する方策π(Aj|Sj)を更新する(S52)。すなわち、行動の総数を、「|A|」とすると、S52によって選択された行動Aj*の選択確率を、「(1−ε)+ε/|A|」とする。また、行動Aj*以外の「|A|−1」個の行動の選択確率を、それぞれ「ε/|A|」とする。S52の処理は、S48の処理によって更新された行動価値関数Qに基づく処理であることから、これにより、状態sと行動aとの関係を規定する関係規定データDRが、収益Rを増加させるように更新されることとなる。
なお、CPU112は、S52の処理が完了する場合、図5に示す一連の処理を一旦終了する。
図4に戻り、CPU112は、S22の処理が完了すると、行動価値関数Qが収束したか否かを判定する(S24)。ここでは、S22の処理による行動価値関数Qの更新量が所定値以下となる連続回数が所定回数に達する場合に収束したと判定すればよい。CPU112は、収束していないと判定する場合(S24:NO)や、S20の処理において否定判定する場合には、S12の処理に戻る。これに対し、CPU112は、収束したと判定する場合(S24:YES)、終了条件が成立したか否かを判定する(S26)。本実施形態では、終了条件は、全ての関係規定データDRに関してS24の処理において肯定判定することを含んでいる。
CPU112は、終了条件が成立していない場合(S26:NO)、S10の処理に戻って、環境係数VAを変更する。例えば環境係数VAが「11」であって関係規定データDR11の更新が完了した場合、CPU112は、環境係数VAを「11」から「12」に変更する。一方、終了条件が成立している場合(S26:YES)、CPU112は、関係規定データDRに基づいてマップデータDMを作成する。すなわち、CPU112は、状態sと上記期待収益を最大化する行動変数の値とを対応付けることによって状態sを入力とし期待収益を最大化する行動変数の値を出力するデータとしてマップデータDMを作成する。このとき、CPU112は、マップデータDM11を関係規定データDR11に基づいて作成し、マップデータDM12を関係規定データDR12に基づいて作成する。CPU112は、マップデータDM21を関係規定データDR21に基づいて作成する。そして、CPU112は、作成した各マップデータDMを記憶装置116に記憶させる。マップデータDMの記憶が完了すると、CPU112は、図4に示す一連の処理を終了する。
本実施形態では、図4に示した一連の処理の実行を通じた強化学習によって作成されたマップデータDM、すなわち各マップデータDM11,DM12,DM21,…が、サーバ130の記憶装置136に記憶される。すなわち、サーバ130は、当該サーバ130と通信可能な車両VC1,VC2,…に対し、生成装置110で生成したマップデータDMを提供できる。
図6に、車両VC1を制御するために制御装置70が実行する処理の手順を示す。図6に示す一連の処理は、ROM74に記憶されている制御プログラム74aをCPU72が例えば所定周期で繰り返し実行することにより実現される。
図6に示す一連の処理において、CPU72は、図4のS12の処理と同様に、アクセル操作量PAの6個のサンプリング値「PA(1),PA(2),…PA(6)」からなる時系列データと、現在の変速比GRと、車速Vとを取得する(S60)。そして、CPU72は、記憶装置76に記憶されているマップデータDMを用いて、スロットル開口度指令値TA*及び変速比指令値GR*をマップ演算する(S62)。例えば、マップデータDM11がマップデータDMとして記憶装置76に記憶されている場合、CPU72は、マップデータDM11を用いてマップ演算する。また、マップデータDM21がマップデータDMとして記憶装置76に記憶されている場合、CPU72は、マップデータDM21を用いてマップ演算する。ここで、マップ演算は、例えば、入力変数の値がマップデータDMの入力変数の値の何れかに一致する場合、対応するマップデータDMの出力変数の値を演算結果とするのに対し、一致しない場合、マップデータDMに含まれる複数の出力変数の値の補間によって得られる値を演算結果とする処理とすればよい。
そして、CPU72は、スロットルバルブ14に操作信号MS1を出力してスロットル開口度TAを操作するとともに、変速装置50に操作信号MS5を出力して変速比を操作する(S64)。ここで、本実施形態では、スロットル開口度TAをスロットル開口度指令値TA*にフィードバック制御することを例示することから、スロットル開口度指令値TA*が同一の値であっても、操作信号MS1が互いに異なる信号となりうるものである。そして、CPU72は、S64の処理が完了する場合、図6に示す一連の処理を一旦終了する。
本実施形態では、車両VC1の走行環境が変わったか否かの判定が行われる。走行環境が変わったと判定された場合、そのときの車両VC1の走行環境に関する情報である環境情報がサーバ130に送信される。そして、そのときの走行環境に応じたマップデータDMを車両VC1が受信すると、受信したマップデータDMが、車両VC1の制御装置70の記憶装置76に記憶される。図7には、こうした処理を実現するために制御装置70が実行する処理の手順を示す。図7に示す一連の処理は、ROM74に記憶されている制御プログラム74aをCPU72が実行することにより実現される。例えば、図7に示す一連の処理は、車両VC1の座席へのユーザの着座を検知したことを契機に実行される。
図7に示す一連の処理において、CPU72は、車両VC1の環境情報を取得する(S70)。車両VC1の走行環境は、車両VC1のそのときの位置情報、すなわちそのときの車両VC1の走行エリア、及び、そのときの季節の双方を含んでいる。つまり、そのときの車両VC1の位置情報、及び、季節に関する情報が、車両VC1の環境情報である。例えば、CPU72は、位置データPgpsを取得し、且つ位置データPgpsによって地図データDGが示す地図上の位置を車両VC1の位置情報として取得する。また例えば、CPU72は、現在の季節又は現在の日付を特定する情報を、季節に関する情報として取得する。
次にCPU72は、車両VC1の走行環境が変わったか否かを判定する(S72)。図7に示す一連の処理の前回の実行時に取得された環境情報で示す位置情報及び季節と、今回に取得された環境情報で示す位置情報及び季節とを比較することにより、環境情報が変わったか否かを判定できる。前回の環境情報で示す位置情報を前回位置情報とし、季節を前回季節とする。また、今回の環境情報で示す位置情報を今回位置情報とし、季節を今回季節とする。そして、CPU72は、今回位置情報で示されるエリアが前回位置情報で示されるエリアと相違している旨の条件(ウ)と、今回季節が前回季節と相違している旨の条件(エ)との少なくとも一方が成立しているか否かを判定する。
条件(ウ)及び(エ)の何れもが成立していない場合(S72:NO)、環境情報が変わっていないと判定できるため、CPU72は、図7に示す一連の処理を終了する。一方、条件(ウ)及び(エ)の少なくとも一方が成立している場合(S72:YES)、環境情報が変わったと判定できるため、CPU72は、取得した環境情報をサーバ130に送信する(S74)。そして、CPU72は、送信に対する回答として、マップデータDMを受信したか否かを判定する(S76)。受信が完了していない場合(S76:NO)、CPU72は、受信が完了するまでS76の処理を繰り返す。一方、受信が完了した場合(S76:YES)、CPU72は、受信したマップデータDMを、記憶装置76に記憶させる(S78)。記憶装置76のマップデータDMの置換が完了すると、CPU72は、図7に示す一連の処理を終了する。
図8に、サーバ130が実行する一連の処理の流れを示す。図8に示す一連の処理は、ROM134に記憶されている制御プログラム134aをCPU132が実行することにより実現される。この一連の処理はサーバ130が稼働しているときに繰り返し実行される。
図8に示す一連の処理において、CPU132は、サーバ130と通信可能な車両VC1から環境情報を受信したか否かを判定する(S80)。受信していない場合(S80:NO)、CPU132は、図8に示す一連の処理を一旦終了する。一方、受信した場合(S80:YES)、CPU132は、受信した環境情報に応じたマップデータDMを、記憶装置136に記憶されている複数のマップデータDM11,DM12,DM21,…の中から選択する(S82)。例えば、車両VC1の走行エリアが第1エリアAR1であり、季節が冬である旨の環境情報を受信した場合、CPU132は、マップデータDM12を選択する。そして、CPU132は、選択したマップデータDMを、環境情報を送信してきた車両VC1に送信する(S84)。マップデータDMの送信が完了すると、CPU132は、図8に示す一連の処理を一旦終了する。
本実施形態の作用及び効果について説明する。
車両VC1の走行環境が変わったと判定されると、そのときの走行環境に応じたマップデータDMがサーバ130から制御装置70に提供される。すると、制御装置70では、サーバ130から受信したマップデータDMを記憶装置76に記憶させ、当該マップデータDMを用いて車両VC1の電子機器が操作されるようになる。すなわち、本実施形態では、そのときの車両VC1の走行環境に応じたマップデータDMを車両VC1に提供することにより、当該走行環境に応じた車両制御を制御装置70に実行させることができる。
本実施形態では、以下に示す効果をさらに得ることができる。
(1)本実施形態では、車両VC1の走行エリアが変わったと判定されると、変わった後のエリアに応じたマップデータDMが、サーバ130から制御装置70に提供される。その結果、そのときの走行エリアに応じた車両制御を制御装置70に実行させることができる。
(2)また、走行エリアが変わっていなくても季節が変わったと判定されると、そのときの季節に応じたマップデータDMが、サーバ130から制御装置70に提供される。その結果、そのときの季節に応じた車両制御を制御装置70に実行させることができる。なお、本実施形態では、走行エリア及び季節の双方が変わったと判定された場合でも、そのときの走行エリア及び季節に応じたマップデータDMが、サーバ130から制御装置70に提供される。
(3)制御装置70の記憶装置76には、行動価値関数Qなどではなく、マップデータDMを記憶するようにした。これにより、CPU72は、マップデータDMを用いたマップ演算に基づき、スロットル開口度指令値TA*及び変速比指令値GR*を設定するようになる。その結果、行動価値関数Qのうち最大値となるものを選択する処理をCPU72に実行させる場合と比較して、CPU72の演算負荷を軽減できる。
(4)本実施形態では、複数のマップデータDM11,DM12,DM21,…がサーバ130の記憶装置136に記憶されている。これにより、複数のマップデータDM11,DM12,DM21,…を車両VC1の制御装置70に記憶させておく場合と比較し、制御装置70の記憶容量の増大を抑制できる。
(第2実施形態)
以下、第2実施形態について、第1実施形態との相違点を中心に図面を参照しつつ説明する。
図9に示すように、本実施形態では、車両VC1の制御装置70の記憶装置76には、マップデータDMの代わりに、関係規定データDR及びトルク出力写像データDTが記憶されている。また、ROM74には、制御プログラム74aに加え、学習プログラム74bも記憶されている。学習プログラム74bは、強化学習によって、関係規定データDRを学習するためのものである。
また、トルク出力写像データDTによって規定されるトルク出力写像は、回転速度NE、充填効率η及び点火時期を入力とし、トルクTrqを出力するニューラルネットワークなどの学習済みモデルに関するデータである。トルク出力写像データDTは、例えば図4の処理を実行する際、S18の処理によって取得されるトルクTrqを教師データとして学習されたものとすればよい。なお、充填効率ηは、CPU72により、回転速度NE及び吸入空気量Gaに基づき算出すればよい。
また、サーバ130の記憶装置136には、関係規定データDRとして、関係規定データDR11,DR12,DR21,…が記憶されている。記憶装置136に記憶されている各関係規定データDR11,DR12,DR21,…は、図4及び図5に示した一連の処理で導出された関係規定データである。
図10に、車両VC1の電子機器を操作しつつ、記憶装置76に記憶されている関係規定データDRを更新する際に車両VC1の制御装置70が実行する処理の手順を示す。図10に示す一連の処理は、ROM74に記憶された制御プログラム74a及び学習プログラム74bをCPU72が実行することにより実現される。この一連の処理は内燃機関10が稼働しているときに繰り返し実行される。
図10に示す一連の処理において、CPU72は、状態sとして、アクセル操作量PAの時系列データと、現在の変速比GRと、車速Vとを取得する(S100)。そして、CPU72は、図4のS14と同様に、S100の処理によって取得した状態sに応じたスロットル開口度指令値TA*及び変速比指令値GR*からなる行動aを設定する(S102)。次にCPU112は、設定されたスロットル開口度指令値TA*及び変速比指令値GR*に基づき、スロットルバルブ14に操作信号MS1を出力してスロットル開口度TAを操作するとともに、変速装置50に操作信号MS5を出力して変速比を操作する(S104)。そして、CPU112は、回転速度NE、変速比GR、内燃機関10のトルクTrq、内燃機関10に対するトルク指令値Trq*及び加速度Gxを取得する(S106)。ここで、CPU72は、トルクTrqを、回転速度NE、充填効率η及び点火時期をトルク出力写像に入力することによって算出する。また、CPU72は、トルク指令値Trq*を、アクセル操作量PAに応じて設定する。
次にCPU112は、図4のS20と同様に、後述のS110の処理がなされたタイミングから所定期間が経過したか否かを判定する(S108)。そして、CPU112は、所定期間が経過したと判定する場合(S108:YES)、強化学習によって関係規定データDRを更新する(S110)。一方、所定期間が経過したと判定していない場合(S108:NO)、CPU72は、図10に示す一連の処理を一旦終了する。
なお、図10のS110の処理は、図5に示した一連の処理と同等の内容である。そのため、ここでは、図10のS110の処理の具体的な説明は割愛する。
本実施形態では、図10に示す一連の処理の実行によって車両VC1が走行する場合、図7のS72の処理で肯定判定になった場合のように車両VC1の走行環境が変わったと判定されると、図7のS74の処理と同様に、そのときの環境情報がサーバ130に送信される。図8のS80の処理で肯定判定になった場合のように車両VC1から環境情報をサーバ130が受信すると、サーバ130では、図8のS82の処理と同様に、記憶装置136に記憶されている複数のデータの中からデータが選択されるが、本実施形態では記憶装置136に記憶されている各関係規定データDRの中から、そのときの車両VC1の走行環境に応じた関係規定データDRが選択される。そして、サーバ130では、図8のS84の処理と同様に、選択したデータが車両VC1に送信されるが、本実施形態では、関係規定データDRが車両VC1に送信される。車両VC1では、図7のS78の処理と同様に、サーバ130から受信したデータが記憶装置76に記憶されるが、本実施形態ではサーバ130から受信した関係規定データDRが、記憶装置76に記憶される。
本実施形態では、車両VC1の制御装置70に関係規定データDR及び学習プログラム74bが実装されている。そのため、そのときの走行環境に応じた関係規定データDRをサーバ130から車両VC1が受信した後では、当該関係規定データDRの更新が車両VC1で継続される。その結果、車両制御を、そのときの走行環境に応じた制御により近づけることができる。
(第3実施形態)
以下、第3実施形態について、第2実施形態との相違点を中心に図面を参照しつつ説明する。
図11に示すように、本実施形態では、第2実施形態の場合とは異なり、サーバ130では複数の関係規定データDRが記憶されていない。
そして、サーバ130では、車両VC1の走行環境が変わったために車両VC1の環境情報を受信すると、車両VC1と同じ走行環境で走行している他の車両が探索される。そして、探索された他の車両を探索車両とした場合、探索車両で用いられている関係規定データDRが、サーバ130を通じて車両VC1に提供される。図12は、この際にサーバ130で実行される処理の手順を示す。図12に示す一連の処理は、ROM134に記憶された制御プログラム134aを、CPU132が実行することにより実現される。この一連の処理はサーバ130が稼働しているときに繰り返し実行される。
図12に示す一連の処理において、CPU132は、サーバ130と通信可能な車両VC1から環境情報を受信したか否かを判定する(S120)。受信していない場合(S120:NO)、CPU132は、図12に示す一連の処理を一旦終了する。一方、受信した場合(S120:YES)、CPU132は、車両VC1から受信した環境情報が示す走行環境と同じ走行環境で走行している他の車両、すなわち探索車両を、サーバ130と通信可能な複数の車両の中から探索する(S122)。S122の処理で探索された車両、すなわち車両VC1と同じ走行環境で走行していると判断できる車両が、複数存在することもある。このような場合、CPU132は、条件を満たす複数の車両の中から1つの車両を探索車両として選択する。例えば、車両VC1の現在の走行環境を所定の走行環境とした場合、CPU132は、所定の走行環境で走行する時間の最も長い車両を探索車両として選択する。これは、走行時間が長いほど、関係規定データDRの更新が進んでいると推測できるためである。
次にCPU132は、探索車両で用いられている関係規定データDRの送信を探索車両の制御装置70に要求する(S124)。そして、CPU132は、探索車両の関係規定データDRを探索車両から受信したか否かを判定する(S126)。受信が未だ完了していない場合(S126:NO)、CPU132は、受信が完了するまでS126の処理を繰り返す。一方、受信が完了した場合(S126:YES)、CPU132は、探索車両の関係規定データDRを、環境情報を送信してきた車両VC1に送信する(S128)。関係規定データDRの送信が完了すると、CPU132は、図12に示す一連の処理を一旦終了する。
すなわち、本実施形態では、図7のS72の処理で肯定判定になった場合のように車両VC1の走行環境が変わったと判定されると、サーバ130では、車両VC1と同じ走行環境で走行している車両、すなわち探索車両の関係規定データDRが探索車両から受信する(図12のS122〜S126)。そして、探索車両の関係規定データDRが車両VC1に送信される(図12のS128)。車両VC1では、図7のS76の処理と同様に、サーバ130からデータを受信するが、本実施形態では、そのときの車両VC1の走行環境と同じ環境で走行している他の車両(探索車両)の関係規定データDRが受信される。すると、車両VC1では、図7のS78の処理と同様に、サーバ130から受信したデータが記憶装置76に記憶されるが、本実施形態ではサーバ130から受信した探索車両の関係規定データDRが、記憶装置76に記憶される。その後においては、新たに記憶装置76に記憶された関係規定データDRに基づいて車両VC1の電子機器が操作されるようになる。
探索車両は、変更後の車両VC1の走行環境で走行している。すなわち、探索車両の制御装置70では、その走行環境で強化学習が進められている。そのため、探索車両の関係規定データDRを、車両VC1の電子機器の操作に用いることにより、そのときの走行環境に適した車両制御を車両VC1で行うことができる。
また、この場合、サーバ130に複数の関係規定データDRを記憶させておく必要がなくなるため、サーバ130の記憶容量の増大を抑制できる。
(対応関係)
上記実施形態における事項と、上記「課題を解決するための手段」の欄に記載した事項との対応関係は、次の通りである。以下では、「課題を解決するための手段」の欄に記載した解決手段の番号毎に、対応関係を示している。[1]〜[3]車両用制御装置は、図2において制御装置70に対応し、サーバは、図2においてサーバ130に対応する。第1記憶装置は、図2及び図9において記憶装置76に対応する。実行装置は、図2及び図9においてはCPU72及びROM74と、CPU132及びROM134とによって構成される。状態取得処理は、図6のS60、及び、図10のS100,S106に対応し、操作処理は、図6のS64や図10のS104に対応し、環境判定処理は、図7のS72に対応する。データ変更処理は、図7のS76,S78と、図8のS82,S84とによって構成される。第1記憶装置に記憶される操作用データとは、図2において記憶装置76に記憶されるマップデータDMに対応し、図9において記憶装置76に記憶される関係規定データDRに対応する。[4]関係規定データは、図9において記憶装置76に記憶される関係規定データDRに対応する。[4]及び[5]更新写像は、学習プログラム114a,74bのうち図5のS46〜S52の処理を実行する指令によって規定された写像に対応する。[5]制御用写像データは、図2において記憶装置76に記憶されるマップデータDMに対応する。[6]第2記憶装置は、図2及び図9において記憶装置136に対応する。第2記憶装置に記憶されている各操作用データは、図2においては記憶装置136に記憶されている各マップデータDM11,DM12,DM21,…が対応し、図9においては記憶装置136に記憶されている各関係規定データDR11,DR12,DR21,…が対応する。データ選択処理は、図8のS82に対応し、送信処理は、図8のS84に対応する。データ記憶処理は、図7のS76,S78に対応する。[7]車両探索処理は、図12のS122に対応し、変更用データ取得処理は、図12のS124,S126に対応する。データ記憶処理は、図12のS128、及び、図7のS76,S78によって構成される。第1車両は、車両VC1に対応し、第2車両は、探索車両に対応する。[8]及び[9]第1実行装置は図2及び図9においてCPU72及びROM74に対応する。[8]及び[10]第2実行装置は図2及び図9においてCPU132及びROM134に対応する。
(変更例)
本実施形態は、以下のように変更して実施することができる。本実施形態及び以下の変更例は、技術的に矛盾しない範囲で互いに組み合わせて実施することができる。
「車両の走行環境について」
・上記各実施形態では、車両の現在の走行エリアと、現在の季節とを、環境情報として取得しているが、これに限らない。例えば、車両の現在の走行エリアと、現在の季節との何れか一方のみに関する情報を、環境情報として取得してもよい。
「走行エリアについて」
・上記各実施形態では、給油施設から車両に供給される燃料の性状の相違によってエリアを区切っているが、これに限らない。例えば、走行エリアを、国毎に区切ってもよい。これは、国毎に法規(例えば、排気に関する法規)が異なることがあるためである。
また、1つの国の中でも地域によって区切り、区切られた地域の各々を走行エリアとしてもよい。
また、車両の走行している道路毎に、走行エリアとして区切ってもよい。例えば、高速道路のように比較的高速で走行する道路と、一般道とで走行エリアを区切ってもよい。これは、一般道と高速道路とでは、車両の走らせ方が異なりうるためである。高速道路では、比較的高速で車両を定速走行させることが多いのに対し、一般道では、車両を加速させたり減速させたりするような走行を車両に行わせることが多いためである。
「テーブル形式のデータの次元削減について」
・テーブル形式のデータの次元削減手法としては、上記各実施形態において例示したものに限らない。例えばアクセル操作量PAが最大値となることはまれであることから、アクセル操作量PAが規定量以上となる状態については行動価値関数Qを定義せず、アクセル操作量PAが規定量以上となる場合のスロットル開口度指令値TA*などは、別途適合してもよい。また例えば、行動のとりうる値からスロットル開口度指令値TA*が規定値以上となるものを除くなどして、次元削減をしてもよい。
「関係規定データについて」
・上記各実施形態では、行動価値関数Qを、テーブル形式の関数としたが、これに限らない。例えば、関数近似器を用いてもよい。
・例えば、行動価値関数Qを用いる代わりに、方策πを、状態s及び行動aを独立変数とし、行動aをとる確率を従属変数とする関数近似器にて表現し、関数近似器を定めるパラメータを、報酬rに応じて更新してもよい。なお、その場合、環境係数VAの値に応じた各別の関数近似器を備えてもよく、また例えば、単一の関数近似器の独立変数である状態sに環境係数VAを含めてもよい。
「操作用データについて」
・操作用データは、車両VC1の電子機器の操作指令値を導出する際に用いられるデータであれば、関係規定データDRや制御用写像データとは異なるデータであってもよい。例えば、強化学習とは異なる学習処理を通じて更新されるデータを、操作用データとしてもよい。
・上記第1実施形態及び第2実施形態において、第2記憶装置に記憶される操作用データの数は、2つ以上であれば任意数であってもよい。
「操作処理について」
・例えば「関係規定データについて」の欄に記載したように、行動価値関数を関数近似器とする場合、上記各実施形態におけるテーブル型式の関数の独立変数となる行動についての離散的な値の組の全てについて、状態sとともに行動価値関数Qに入力することによって、行動価値関数Qを最大化する行動aを特定すればよい。その場合、例えば、主として特定された行動aを操作に採用しつつも、所定の確率でそれ以外の行動を選択すればよい。
・例えば「関係規定データについて」の欄に記載したように、方策πを、状態sおよび行動aを独立変数とし、行動aをとる確率を従属変数とする関数近似器とする場合、方策πによって示される確率に基づき行動aを選択すればよい。
「データ変更処理について」
・上記第1実施形態のように環境情報に応じたマップデータDMを車両に提供する実施例において、例えば「車両の走行環境について」の欄に記載したように、車両の走行エリアに関する情報のみを環境情報として取得する場合を考える。この場合、例えば第1エリアAR1では、第1エリアAR1用のマップデータを記憶装置76に予め記憶された車両である第1車両を販売し、第2エリアAR2では、第2エリアAR2用のマップデータを記憶装置76に予め記憶された車両である第2車両を販売してもよい。そして、第1車両の走行するエリアが第1エリアAR1から第2エリアAR2に変わった場合、サーバ130は、第2エリアAR2用のマップデータを第2車両から受信し、第2車両から受信した第2エリアAR2用のマップデータを第1車両に提供するようにしてもよい。この場合、サーバ130の記憶装置136に多数のマップデータを記憶させておかなくてもよくなる。
「更新写像について」
・S46〜S52の処理においては、εソフト方策オン型モンテカルロ法によるものを例示したが、これに限らない。例えば、方策オフ型モンテカルロ法によるものであってもよい。もっとも、モンテカルロ法にも限らず、例えば、方策オフ型TD法を用いたり、また例えばSARSA法のように方策オン型TD法を用いたり、また例えば、方策オン型の学習として適格度トレース法を用いたりしてもよい。
・例えば「関係規定データについて」の欄に記載したように、方策πを関数近似器を用いて表現し、これを報酬rに基づき直接更新する場合には、方策勾配法などを用いて更新写像を構成すればよい。
・行動価値関数Qと方策πとのうちのいずれか一方のみを、報酬rによる直接の更新対象とするものに限らない。例えば、アクター・クリティック法のように、行動価値関数Q及び方策πをそれぞれ更新してもよい。また、アクター・クリティック法においては、これに限らず、例えば行動価値関数Qに代えて価値関数を更新対象としてもよい。
「行動変数について」
・上記各実施形態では、行動変数としてのスロットルバルブの開口度に関する変数として、スロットル開口度指令値TA*を例示したが、これに限らない。例えば、アクセル操作量PAに対するスロットル開口度指令値TA*の応答性を、無駄時間及び2次遅れフィルタにて表現し、無駄時間と、2次遅れフィルタを規定する2つの変数との合計3つの変数を、スロットルバルブの開口度に関する変数としてもよい。ただし、その場合、状態変数は、アクセル操作量PAの時系列データに代えて、アクセル操作量PAの単位時間当たりの変化量とすることが望ましい。
・上記各実施形態では、行動変数として、スロットルバルブの開口度に関する変数及び変速比に関する変数を例示したが、これに限らない。例えば、スロットルバルブの開口度に関する変数及び変速比に関する変数に加えて、点火時期に関する変数や空燃比制御に関する変数を用いてもよい。
・下記「内燃機関について」の欄に記載したように、圧縮着火式の内燃機関の場合、スロットルバルブの開口度に関する変数に代えて噴射量に関する変数を用いればよい。またこれに加えて、例えば、噴射時期に関する変数や、1燃焼サイクルにおける噴射回数に関する変数、1燃焼サイクルにおける1つの気筒のための時系列的に隣接した2つの燃料噴射のうちの一方の終了タイミングと他方の開始タイミングとの間の時間間隔に関する変数を用いてもよい。
・例えば変速装置50が有段変速装置の場合、クラッチの係合状態を油圧によって調整するためのソレノイドバルブの電流値などを行動変数としてもよい。
・下記「電子機器について」の欄に記載したように、行動変数に応じた操作の対象に回転電機が含まれる場合、行動変数に回転電機のトルクや電流を含めればよい。すなわち、推力生成装置の負荷に関する変数である負荷変数としては、スロットルバルブの開口度に関する変数や噴射量に限らず、回転電機のトルクや電流であってもよい。
・下記「電子機器について」の欄に記載したように、行動変数に応じた操作の対象に、ロックアップクラッチ42を含める場合、行動変数にロックアップクラッチ42の係合状態を示す変数を含めればよい。ここで、ロックアップクラッチ42の係合状態を行動変数に含める場合、エネルギ利用効率を高くする旨の要求事項の優先度の大小によって、行動変数の値を変えることが特に有効となる。
「車両用制御データの生成方法について」
・図4のS14の処理では、行動価値関数Qに基づき行動を決定したが、これに限らず、とりうるすべての行動を等確率で選択してもよい。
「制御用写像データについて」
・車両の状態と期待収益を最大化する行動変数の値とを1対1に対応付けることによって車両の状態を入力とし期待収益を最大化する行動変数の値を出力する制御用写像データとしては、マップデータに限らない。例えば、関数近似器であってもよい。これは、例えば、上記「更新写像について」の欄に記載したように、方策勾配法などを用いる場合において、方策πを行動変数の値をとりうる確率を示すガウス分布にて表現し、その平均値を関数近似器にて表現しておき、平均値を表現する関数近似器のパラメータを更新することとし、学習後の平均値を制御用写像データとすることによって実現できる。すなわち、ここでは、関数近似器が出力する平均値を、期待収益を最大化する行動変数の値とみなす。この際、環境係数VAの値毎に各別の関数近似器を設けてもよいが、単一の関数近似器の独立変数のうちの状態sに、環境係数VAを含めてもよい。
「状態について」
・上記各実施形態では、アクセル操作量PAの時系列データを、等間隔でサンプリングされた6個の値からなるデータとしたが、これに限らない。互いに異なるサンプリングタイミングにおける2個以上のサンプリング値からなるデータであればよく、この際、3個以上のサンプリング値からなるデータや、サンプリング間隔が等間隔であるデータであることがより望ましい。
・アクセル操作量に関する状態変数としては、アクセル操作量PAの時系列データに限らず、例えば「行動変数について」の欄に記載したように、アクセル操作量PAの単位時間当たりの変化量などであってもよい。
・例えば「行動変数について」の欄に記載したように、ソレノイドバルブの電流値を行動変数とする場合、状態に、変速装置の入力軸52の回転速度や出力軸54の回転速度、ソレノイドバルブによって調整される油圧を含めればよい。また例えば「行動変数について」の欄に記載したように、回転電機のトルクや出力を行動変数とする場合、状態に、バッテリの充電率や温度を含めればよい。また例えば「行動変数について」の欄に記載したように、コンプレッサの負荷トルクや空調装置の消費電力を行動に含める場合、状態に、車室内の温度を含めればよい。
「電子機器について」
・行動変数に応じた操作の対象となる内燃機関の操作部としては、スロットルバルブ14に限らない。例えば、点火装置26や燃料噴射弁16であってもよい。
・行動変数に応じた操作の対象となる電子機器のうち、推力生成装置と駆動輪との間の駆動系装置としては、変速装置50に限らず、例えばロックアップクラッチ42であってもよい。
・下記「推力生成装置について」の欄に記載したように、推力生成装置として回転電機を備える場合、行動変数に応じた操作の対象となる電子機器を、回転電機に接続されるインバータ等の電力変換回路としてもよい。もっとも、車載駆動系の電子機器に限らず、例えば車載空調装置などであってもよい。この場合であっても、例えば車載空調装置が推力生成装置の回転動力によって駆動される場合、推力生成装置の動力のうち駆動輪60に供給される動力が車載空調装置の負荷トルクに依存することから、車載空調装置の負荷トルクを行動変数に含めることなどが有効である。また例えば車載空調装置が推力生成装置の回転動力を利用しないものであったとしても、エネルギ利用効率に影響することから、行動変数に車載空調装置の消費電力を加えることは有効である。
「実行装置について」
・実行装置としては、CPUとROMとを備えて、ソフトウェア処理を実行するものに限らない。たとえば、上記各実施形態においてソフトウェア処理されたものの少なくとも一部を、ハードウェア処理する例えばASICなどの専用のハードウェア回路を備えてもよい。すなわち、実行装置は、以下の(a)〜(c)のいずれかの構成であればよい。(a)上記処理の全てを、プログラムに従って実行する処理装置と、プログラムを記憶するROMなどのプログラム格納装置とを備える。(b)上記処理の一部をプログラムに従って実行する処理装置及びプログラム格納装置と、残りの処理を実行する専用のハードウェア回路とを備える。(c)上記処理の全てを実行する専用のハードウェア回路を備える。ここで、処理装置およびプログラム格納装置を備えたソフトウェア実行装置や、専用のハードウェア回路は複数であってもよい。
「内燃機関について」
・内燃機関としては、燃料噴射弁として吸気通路12に燃料を噴射するポート噴射弁を備えるものに限らず、燃焼室24に燃料を直接噴射する筒内噴射弁を備えるものであってもよく、また例えば、ポート噴射弁及び筒内噴射弁の双方を備えるものであってもよい。
・内燃機関としては、火花点火式内燃機関に限らず、例えば燃料として軽油などを用いる圧縮着火式内燃機関などであってもよい。
「車両について」
・車両は、車両の推力生成装置として内燃機関のみを備えたものではなく、例えば内燃機関及び回転電気の双方を備えるハイブリッド車両であってもよい。また例えば、車両は、電気自動車や燃料電池車のように、推力生成装置が回転電機のみの車両であってもよい。
10…内燃機関
14…スロットルバルブ
16…燃料噴射弁
18…吸気バルブ
26…点火装置
50…変速装置
70…制御装置
72…CPU
74…ROM
76…記憶装置
88…アクセルセンサ
90…加速度センサ
94…シフトポジションセンサ
96…車速センサ
130…サーバ
132…CPU
134…ROM
136…記憶装置
VC1,VC2…車両

Claims (10)

  1. 車両に設けられている車両用制御装置と、前記車両用制御装置と通信するサーバと、を備えるとともに、前記車両の電子機器を操作する際に用いられる操作用データが記憶される第1記憶装置が前記車両用制御装置に設けられているシステムに適用され、
    前記車両に設けられているセンサの検出値に基づく前記車両の状態を取得する状態取得処理と、
    前記状態取得処理で取得された前記車両の状態と、前記第1記憶装置に記憶されている前記操作用データと、に基づいて前記電子機器を操作する操作処理と、
    前記車両が走行している環境である走行環境に関する情報である環境情報を取得する環境情報取得処理と、
    前記環境情報取得処理で取得された前記環境情報が示す前記走行環境が変わったか否かを判定する環境判定処理と、
    前記環境判定処理で前記走行環境が変わったと判定されたときに、前記環境情報に応じた前記操作用データを、前記サーバから前記車両用制御装置に取得させ、当該操作用データを前記第1記憶装置に記憶させるデータ変更処理と、を実行装置に実行させる
    車両制御方法。
  2. 前記環境情報は、前記車両が走行しているエリアに関する情報を含み、
    前記環境判定処理は、前記環境情報が示す前記車両が走行しているエリアが変わったときに、前記走行環境が変わったと判定する処理である
    請求項1に記載の車両制御方法。
  3. 前記環境情報は、現在の季節に関する情報を含み、
    前記環境判定処理は、前記環境情報が示す季節が変わったときに、前記走行環境が変わったと判定する処理である
    請求項1又は請求項2に記載の車両制御方法。
  4. 前記操作用データは、前記車両の状態と前記電子機器の操作に関する変数である行動変数との関係を規定する関係規定データであり、
    前記関係規定データとは、
    前記車両の状態と前記関係規定データとによって定まる前記行動変数の値に基づいて前記電子機器が操作された際における前記車両の状態を基に、前記車両の特性が所定の基準を満たす場合には前記車両の特性が前記所定の基準を満たさない場合よりも大きい報酬を与える処理と、
    前記電子機器が操作された際における前記車両の状態、前記電子機器の操作に用いられた前記行動変数の値、及び当該操作に対応する前記報酬を予め定められた更新写像への入力とし、前記関係規定データを更新する処理と、を実行することによって得られるデータであり、
    前記更新写像は、前記関係規定データに従って前記電子機器が操作される場合の前記報酬についての期待収益を増加させるように更新された前記関係規定データを出力するものである
    請求項1〜請求項3のうち何れか一項に記載の車両制御方法。
  5. 前記操作用データは、前記車両の状態と前記電子機器の操作に関する変数である行動変数との関係を規定する関係規定データを基に作成される制御用写像データであり、
    前記関係規定データとは、
    前記車両の状態と前記関係規定データとによって定まる前記行動変数の値に基づいて前記電子機器が操作された際における前記車両の状態を基に、前記車両の特性が所定の基準を満たす場合には前記車両の特性が前記所定の基準を満たさない場合よりも大きい報酬を与える処理と、
    前記電子機器が操作された際における前記車両の状態、前記電子機器の操作に用いられた前記行動変数の値、及び当該操作に対応する前記報酬を予め定められた更新写像への入力とし、前記関係規定データを更新する処理と、を実行することによって得られるデータであり、
    前記更新写像は、前記関係規定データに従って前記電子機器が操作される場合の前記報酬についての期待収益を増加させるように更新された前記関係規定データを出力するものである
    請求項1〜請求項3のうち何れか一項に記載の車両制御方法。
  6. 前記サーバは、想定する複数の前記環境情報の各々に対応する複数の前記操作用データを記憶する第2記憶装置を備えるものであり、
    前記データ変更処理は、
    前記第2記憶装置に記憶されている複数の前記操作用データの中から、前記環境情報取得処理で取得された前記環境情報に応じたデータを選択するデータ選択処理と、
    前記データ選択処理で選択された前記操作用データを前記車両用制御装置に送信する送信処理と、
    前記送信処理で前記サーバから送信された前記操作用データを前記第1記憶装置に記憶させるデータ記憶処理と、を含む
    請求項1〜請求項5のうち何れか一項に記載の車両制御方法。
  7. 前記データ変更処理は、
    前記サーバと通信可能な複数の前記車両のうちの第1車両の前記環境情報が示す前記走行環境が変わったときに、変更後における前記第1車両の前記走行環境と同じ前記走行環境で走行している第2車両を探索する車両探索処理と、
    前記車両探索処理で探索された前記第2車両から当該第2車両の前記関係規定データを、前記サーバに取得させる変更用データ取得処理と、
    前記変更用データ取得処理で前記サーバに取得させた前記第2車両の前記関係規定データを、前記第1車両に送信する送信処理と、
    前記送信処理で前記サーバから前記第1車両に送信された前記第2車両の前記操作用データを、前記第1車両の前記第1記憶装置に記憶させるデータ記憶処理と、を含む
    請求項4に記載の車両制御方法。
  8. 前記実行装置は、前記車両に設けられている第1実行装置と、前記サーバに設けられている第2実行装置と、を備えるものであり、
    前記状態取得処理及び前記操作処理を、前記第1実行装置に実行させ、
    前記環境情報取得処理を、前記第1実行装置又は前記第2実行装置に実行させ、
    前記データ変更処理を、前記第1実行装置及び前記第2実行装置の協働によって実行させる
    請求項1〜請求項7のうち何れか一項に記載の車両制御方法。
  9. 請求項8に記載の前記第1実行装置及び前記第1記憶装置を備える
    車両用制御装置。
  10. 請求項8に記載の前記第2実行装置を備える
    サーバ。
JP2020012546A 2020-01-29 2020-01-29 車両制御方法、車両用制御装置及びサーバ Pending JP2021116781A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020012546A JP2021116781A (ja) 2020-01-29 2020-01-29 車両制御方法、車両用制御装置及びサーバ
US17/128,505 US20210229688A1 (en) 2020-01-29 2020-12-21 Vehicle control method, vehicle controller, and server
CN202110105324.1A CN113266481A (zh) 2020-01-29 2021-01-26 车辆控制方法、车辆用控制装置以及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020012546A JP2021116781A (ja) 2020-01-29 2020-01-29 車両制御方法、車両用制御装置及びサーバ

Publications (1)

Publication Number Publication Date
JP2021116781A true JP2021116781A (ja) 2021-08-10

Family

ID=76970988

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020012546A Pending JP2021116781A (ja) 2020-01-29 2020-01-29 車両制御方法、車両用制御装置及びサーバ

Country Status (3)

Country Link
US (1) US20210229688A1 (ja)
JP (1) JP2021116781A (ja)
CN (1) CN113266481A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7359011B2 (ja) 2020-02-05 2023-10-11 トヨタ自動車株式会社 内燃機関の制御装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6744597B1 (ja) * 2019-10-18 2020-08-19 トヨタ自動車株式会社 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0914021A (ja) * 1995-06-30 1997-01-14 Unisia Jecs Corp 車両用スロットル制御装置
JPH10208194A (ja) * 1997-01-21 1998-08-07 Toyota Motor Corp 車両の仕様変更装置
JPH10254505A (ja) * 1997-03-14 1998-09-25 Toyota Motor Corp 自動制御装置
JP2003050605A (ja) * 2001-08-07 2003-02-21 Mazda Motor Corp 自動車の制御ゲイン変更用サーバ、自動車の制御ゲイン変更方法、及び、自動車の制御ゲイン変更用プログラム
JP2010033165A (ja) * 2008-07-25 2010-02-12 Toyota Motor Corp 車両情報データ記録システム、車両情報記録装置、車両情報記録サーバ、車両情報記録方法
JP2014084817A (ja) * 2012-10-25 2014-05-12 Mitsubishi Electric Corp 内燃機関のシリンダ吸入空気量推定装置
JP2017191567A (ja) * 2016-04-15 2017-10-19 ファナック株式会社 生産計画を実施する生産システム
JP2019173576A (ja) * 2018-03-27 2019-10-10 株式会社デンソー 車両の制御システム
JP2019199805A (ja) * 2018-05-14 2019-11-21 株式会社デンソー 制御装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4918818B2 (ja) * 2006-07-06 2012-04-18 トヨタ自動車株式会社 車両用走行支援装置
JP5440101B2 (ja) * 2009-11-04 2014-03-12 アイシン・エィ・ダブリュ株式会社 案内制御装置、案内制御方法、及び案内制御プログラム
JP2016210243A (ja) * 2015-04-30 2016-12-15 トヨタ自動車株式会社 車両の自動運転システム
KR20170015115A (ko) * 2015-07-30 2017-02-08 삼성전자주식회사 자율 주행 차량 및 자율 주행 차량 제어 방법
JP6798779B2 (ja) * 2015-11-04 2020-12-09 トヨタ自動車株式会社 地図更新判定システム
KR102003940B1 (ko) * 2016-11-11 2019-10-01 엘지전자 주식회사 자율 주행 차량 및 그 제어방법
CN110462544A (zh) * 2017-03-20 2019-11-15 御眼视觉技术有限公司 自主车辆的轨迹选择
JP6704876B2 (ja) * 2017-06-02 2020-06-03 本田技研工業株式会社 自動走行制御システム
JP7193202B2 (ja) * 2018-03-06 2022-12-20 日産自動車株式会社 動作予測方法及び動作予測装置
JP7135702B2 (ja) * 2018-10-16 2022-09-13 トヨタ自動車株式会社 交通情報決定装置、交通情報システム及び交通情報を決定する方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0914021A (ja) * 1995-06-30 1997-01-14 Unisia Jecs Corp 車両用スロットル制御装置
JPH10208194A (ja) * 1997-01-21 1998-08-07 Toyota Motor Corp 車両の仕様変更装置
JPH10254505A (ja) * 1997-03-14 1998-09-25 Toyota Motor Corp 自動制御装置
JP2003050605A (ja) * 2001-08-07 2003-02-21 Mazda Motor Corp 自動車の制御ゲイン変更用サーバ、自動車の制御ゲイン変更方法、及び、自動車の制御ゲイン変更用プログラム
JP2010033165A (ja) * 2008-07-25 2010-02-12 Toyota Motor Corp 車両情報データ記録システム、車両情報記録装置、車両情報記録サーバ、車両情報記録方法
JP2014084817A (ja) * 2012-10-25 2014-05-12 Mitsubishi Electric Corp 内燃機関のシリンダ吸入空気量推定装置
JP2017191567A (ja) * 2016-04-15 2017-10-19 ファナック株式会社 生産計画を実施する生産システム
JP2019173576A (ja) * 2018-03-27 2019-10-10 株式会社デンソー 車両の制御システム
JP2019199805A (ja) * 2018-05-14 2019-11-21 株式会社デンソー 制御装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7359011B2 (ja) 2020-02-05 2023-10-11 トヨタ自動車株式会社 内燃機関の制御装置

Also Published As

Publication number Publication date
US20210229688A1 (en) 2021-07-29
CN113266481A (zh) 2021-08-17

Similar Documents

Publication Publication Date Title
TWI745120B (zh) 車輛控制系統、車輛控制裝置及用於車輛之控制方法
JP6705547B1 (ja) 車両用制御装置、車両用制御システム、および車両用学習装置
CN112682197B (zh) 车辆用控制数据的生成方法、车辆用控制装置和控制系统
JP6705546B1 (ja) 車両用制御装置、車両用制御システム、および車両用学習装置
JP7287287B2 (ja) 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置
CN113006951B (zh) 车辆用控制数据的生成方法、车辆用控制装置、车辆用控制系统以及车辆用学习装置
JP6809587B1 (ja) 車両用制御装置
JP2021116783A (ja) 車両用制御装置および車両用制御システム
JP7331704B2 (ja) 車両用制御データの生成方法、車両用制御装置、および車両用制御システム
JP7314831B2 (ja) 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置
JP2021099112A (ja) 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置
JP2021116781A (ja) 車両制御方法、車両用制御装置及びサーバ
CN113217204B (zh) 车辆控制方法、车辆用控制装置以及服务器
JP7327198B2 (ja) 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置
JP2021067257A (ja) 車両用制御装置、車両用制御システム、および車両用学習装置
JP7205460B2 (ja) 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置
JP7314813B2 (ja) 車両制御方法、車両用制御装置及びサーバ
JP2021067262A (ja) 車両用制御データの生成方法、車両用制御装置、車両用制御システム、および車両用学習装置
JP2021066417A (ja) 車両用制御装置、車両用制御システム、および車両用学習装置
JP2021067259A (ja) 車両用制御システム、車両用制御装置、および車両用学習装置
JP2021099059A (ja) 車両用制御装置、車両用制御システム、車両用学習装置、および車両用学習方法
JP2021067195A (ja) 車両用制御システム、車両用制御装置、および車両用学習装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230801