JP2022148734A - 機械学習装置 - Google Patents

機械学習装置 Download PDF

Info

Publication number
JP2022148734A
JP2022148734A JP2021050534A JP2021050534A JP2022148734A JP 2022148734 A JP2022148734 A JP 2022148734A JP 2021050534 A JP2021050534 A JP 2021050534A JP 2021050534 A JP2021050534 A JP 2021050534A JP 2022148734 A JP2022148734 A JP 2022148734A
Authority
JP
Japan
Prior art keywords
data
engagement
vehicle
clutch
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021050534A
Other languages
English (en)
Inventor
陽一郎 勇
Yoichiro Yu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2021050534A priority Critical patent/JP2022148734A/ja
Publication of JP2022148734A publication Critical patent/JP2022148734A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hydraulic Clutches, Magnetic Clutches, Fluid Clutches, And Fluid Joints (AREA)

Abstract

【課題】適切な学習データを取得して誤学習を抑制する。【解決手段】機械学習装置は、アクチュエータへの最適係合指示タイミングを、クラッチの係合に関係する1又は複数の車両運転パラメータに応じて設定する。機械学習装置は、クラッチの係合が行われる場合に、データ取得期間における1又は複数の車両運転パラメータの第1データ及び係合評価値の第2データを係合指示タイミングとともに学習データとして取得するデータ取得部と、機械学習モデルを用いて、クラッチの係合が要求された際の1又は複数の車両運転パラメータの下で係合評価値を改善する最適係合指示タイミングを学習データに基づいて学習する学習部とを備える。データ取得部は、クラッチの係合以外の影響に起因する外乱が含まれる第2データを判別するデータ判別処理と、外乱が含まれると判別された第2データを学習部による学習の対象から除外する第1データ除外処理と、を実行する。【選択図】図1

Description

この発明は、車両の動力伝達経路に配置されたクラッチの最適な係合指示タイミングを設定する機械学習装置に関する。
特許文献1には、内燃機関、第1モータ、及び第2モータを駆動力源として備えるハイブリッド車両が開示されている。このハイブリッド車両の動力伝達経路には、駆動装置の動作モードを複数のモードの間で切り替えるためのクラッチが配置されている。
特開2018-154327号公報
車両の動力伝達経路に配置されたクラッチを作動させるアクチュエータへの係合指示タイミングが適切でないと、クラッチの係合に伴って車両に生じるショックが大きくなる。ここで、当該ショックを抑制するうえで最適な係合指示タイミングは、1又は複数の車両運転パラメータ(例えば、潤滑油温度及び補機電圧)に応じて変化する。そして、そのような車両運転パラメータと最適係合指示タイミングとの関係を一意に定めることは難しい。そこで、クラッチの係合が要求された際の車両運転パラメータに応じた最適係合指示タイミングを取得するために、機械学習を利用することが考えられる。
そのうえで、機械学習を利用して車両運転パラメータに応じた最適係合指示タイミングを設定するためには、適切な学習データを取得して誤学習を抑制することが求められる。
本発明は、上述のような課題に鑑みてなされたものであり、車両運転パラメータに応じた最適係合指示タイミングを設定するために利用される機械学習において、適切な学習データを取得して誤学習を抑制できるようにすることを目的とする。
本発明に係る機械学習装置は、車両の動力伝達経路に配置されたクラッチを作動させるアクチュエータへの最適係合指示タイミングを、クラッチの係合に関係する1又は複数の車両運転パラメータに応じて設定する。機械学習装置は、データ取得部と学習部とを備える。
データ取得部は、クラッチの係合に伴って車両に生じるショックの大きさと相関する値を係合評価値と称したとき、クラッチの係合が行われる場合に、係合要求時点から係合完了時点までの期間と係合完了時点からの所定期間とを含むデータ取得期間における1又は複数の車両運転パラメータの第1データと、データ取得期間における係合評価値の第2データとを、アクチュエータへの係合指示タイミングとともに学習データとして取得する。
学習部は、第1データ及び係合指示タイミングを入力とし第2データを出力とする機械学習モデルを用いて、クラッチの係合が要求された際の1又は複数の車両運転パラメータの下で係合評価値を改善する係合指示タイミングである最適係合指示タイミングを学習データに基づいて学習する。
データ取得部は、クラッチの係合以外の影響に起因する外乱が含まれる第2データを判別するデータ判別処理と、データ判別処理によって外乱が含まれると判別された第2データを学習部による学習の対象から除外する第1データ除外処理と、を実行する。
データ判別処理において、データ取得部は、車両が不整路を走行する時に取得される第2データには外乱が含まれると判別してもよい。
データ判別処理において、データ取得部は、車両が雪道を走行する時に取得される第2データには外乱が含まれると判別してもよい。
車両は、サスペンションのストロークを検出するストロークセンサを含んでもよい。そして、データ判別処理において、データ取得部は、サスペンションのストロークが閾値より大きい場合に取得される第2データには外乱が含まれると判別してもよい。
車両は、車両の周囲を撮像する撮像センサを含んでもよい。そして、データ判別処理において、データ取得部は、撮像センサによって取得される画像に基づいて、外乱が含まれる第2データを判別してもよい。
車両は、車両の位置情報を取得するGNSS受信機を含んでもよい。そして、データ判別処理において、データ取得部は、位置情報に基づいて、外乱が含まれる第2データを判別してもよい。
データ判別処理において、データ取得部は、取得した第2データの時間波形を正解データの時間波形と比較し、正解データの時間波形に対する乖離の度合いが閾値より高い時間波形を有する第2データには、外乱が含まれると判別してもよい。
車両は、アクセルペダルの踏み込み量を検出するアクセルポジションセンサを含んでもよい。そして、データ取得部は、踏み込み量の変化速度が閾値未満の場合に取得される第2データを学習部による学習の対象から除外する第2データ除外処理を実行してもよい。
データ取得部は、クラッチの係合に要する時間が閾値よりも長い係合動作が行われてから第2データの取得回数が所定回数に達した後に取得される第2データを学習部による学習の対象から除外する第3データ除外処理を実行してもよい。
係合評価値は、車両の前後方向の車両加速度であってもよい。
車両は、前後方向の車両加速度を検出する車両加速度センサを含んでもよい。そして、データ取得部は、車両の要求駆動力から推定される前後方向の車両加速度を、車両加速度センサによって計測された前後方向の車両加速度から差し引いて得られるデータを、学習部による学習のための第2データとして用いてもよい。
本発明に係る機械学習装置によれば、データ取得部は、学習データの取得に際し、データ判別処理と第1データ除外処理とを実行する。その結果、データ判別処理によって外乱が含まれると判別された第2データは、第1データ除外処理によって学習部による学習の対象から除外される。これにより、クラッチの係合以外の要因による第2データの乱れを排除できる。すなわち、適切な学習データを取得できるようになる。このため、誤学習を抑制できる。
実施の形態1に係る機械学習装置が適用される車両のシステム構成の一例を示す図である。 図1に示すクラッチアクチュエータの構成の一例を模式的に示す図である。 図1に示すクラッチの係合制御の概要を説明するためのタイムチャートである。 第2データ(車両前後Gのデータ)への外乱の影響を説明するためのタイムチャートである。 実施の形態1に係る機械学習装置における学習データの取得に関する処理の流れを示すフローチャートである。 実施の形態2に係る機械学習装置における学習データの取得に関する処理の流れを示すフローチャートである。 実施の形態3に係る機械学習装置における学習データの取得に関する処理の流れを示すフローチャートである。 実施の形態4に係る第2データの取得手法を説明するための図である。
以下に示す実施の形態において各要素の個数、数量、量、範囲等の数に言及した場合、特に明示した場合や原理的に明らかにその数に特定される場合を除いて、その言及した数に、この発明が限定されるものではない。また、以下に示す実施の形態において説明する構造やステップ等は、特に明示した場合や明らかに原理的にそれに特定される場合を除いて、この発明に必ずしも必須のものではない。
1.実施の形態1
1-1.車両のシステム構成例
図1は、実施の形態1に係る機械学習装置が適用される車両100のシステム構成の一例を示す図である。車両100は、車輪102を駆動する駆動ユニット10を備えている。駆動ユニット10は、第1モータジェネレータ(MG)1、第2モータジェネレータ(MG)2、及び内燃機関3を駆動力源として備えている。MG1は主に発電機として用いられ、MG2は主に車輪102を駆動する電動機として用いられる。また、駆動ユニット10は、動力分割機構12を備えている。
動力分割機構12は、第1プラネタリギヤユニット14、第2プラネタリギヤユニット16、低速用クラッチ(Loクラッチ)18、高速用クラッチ(Hiクラッチ)20、及び減速機構22を含む。第1プラネタリギヤユニット14は、第1サンギヤ14aと第1キャリア14bと第1リングギヤ14cとを含む。第2プラネタリギヤユニット16は、第2サンギヤ16aと第2キャリア16bと第2リングギヤ16cとを含む。第1サンギヤ14aはMG1に連結され、第1キャリア14bは内燃機関3に連結されている。第1リングギヤ14cは、第2サンギヤ16aに連結されている。
Loクラッチ18は、第2サンギヤ16aと第2キャリア16bとを連結可能に構成されている。Hiクラッチ20は、第2キャリア16bと第2リングギヤ16cとを連結可能に構成されている。これらのクラッチ18及び20は、一例としてドグクラッチであるが、例えば、摩擦式多板クラッチであってもよい。クラッチ18及び20は、後述の図2に示すクラッチアクチュエータ24によって作動する。第2リングギヤ16cは、ディファレンシャルギア22aを含む減速機構22に連結されている。また、MG2も、減速機構22に連結されている。第2リングギヤ16cからのトルク(内燃機関3からのトルク)とMG2のトルクは、減速機構22及びドライブシャフト26を介して車輪102に伝達される。
上述した駆動ユニット10によれば、クラッチ18及び20の係合/解放を制御することにより変速を行うことができる。具体的には、Hiクラッチ20が係合すると、第2キャリア16bと第2リングギヤ16cとが連結される。その結果、第2プラネタリギヤユニット16は直結状態(変速比1)となる。一方、Loクラッチ18が係合すると、第1キャリア14bと第2キャリア16bとが連結される。その結果、第1及び第2プラネタリギヤユニット14、16の双方が差動動作を行う。駆動ユニット10の駆動モードは、車両100の高速時に適した高速モードと、低速時に適した低速モードとを含む。動力分割機構12によれば、Loクラッチ18を解放しつつHiクラッチ20を係合することによって高速モードを選択でき、Hiクラッチ20を解放しつつLoクラッチ18を係合することによって低速モードを選択できる。
上述のように、車両100は、一例として動力分割方式のハイブリッド車両である。ただし、本開示に係る機械学習装置が適用される車両は、Loクラッチ18及びHiクラッチ20のように車両の動力伝達経路に配置された1又は複数のクラッチを有するものであれば、ハイブリッド車両に限られない。すなわち、車両は、例えば、駆動力源として電動モータのみを備える車両(例えば、バッテリ電気自動車又は燃料電池自動車)であってもよく、又は駆動力源として内燃機関のみを備える車両であってもよい。
また、車両100は、電子制御ユニット(ECU)30を備えている。ECU30は、車両100に関する各種処理を実行するコンピュータである。具体的には、ECU30によって実行される処理は、MG1、MG2及び内燃機関3の制御に関する処理、並びに、クラッチ18及び20の制御に関する処理を含む。また、ECU30は、本実施形態に係る「機械学習装置」としても機能する。このため、ECU30は、機械学習装置に関する処理も実行する。ECU30は、プロセッサ及びメモリを備えている。プロセッサは、メモリに格納されているプログラムを読み出して実行する。これにより、プロセッサによる上述の各種処理が実現される。なお、ECU30は複数であってもよい。ECU30は、例えば、駆動ユニット10を統括的に制御するECUと、図示省略する電力制御ユニット(PCU)を介してMG1及びMG2を制御するECUと、内燃機関3を制御するECUと、クラッチ18及び20を制御するECUとを含むように構成されていてもよい。
ECU30は、上述の各種処理に用いられるセンサ類32からセンサ信号を取り込む。ここでいうセンサ類32は、例えば、車両加速度センサ、車輪速センサ、アクセルポジションセンサ、MG1回転数センサ、MG2回転数センサ、クランク角センサ、潤滑油温度センサ、クラッチストロークセンサ、ドラム回転角センサ、サスペンション(図示省略)のストロークセンサ(ハイトセンサ)、補機電圧センサ、大気圧センサ、大気温度センサ(吸気温度センサ)、及び撮像センサを含む。付け加えると、ここでいう潤滑油温度は、クラッチ18及び20を含む動力分割機構12の各部を潤滑する潤滑油の温度(ATF温度)のことである。クラッチストロークセンサは、Loクラッチ18及びHiクラッチ20のそれぞれに設置されている。ドラム回転角センサは、後述のシフトドラム40の回転角を検出する。補機電圧は、車両の補機類に電力を供給する補機バッテリの電圧である。撮像センサは、例えば、カメラ又はライダであり、車両100の周囲を撮像する。また、車両100は、GNSS(Global Navigation Satellite System)受信機34を備えている。ECU30は、GNSS受信機34を介して車両100の位置情報を取得できる。
図2は、図1に示すクラッチアクチュエータ24の構成の一例を模式的に示す図である。Loクラッチ18は、互いに噛み合うドグ歯がそれぞれ形成された一対のクラッチ部材18a及び18bによって構成されている。Hiクラッチ20も、同様の一対のクラッチ部材20a及び20bによって構成されている。クラッチアクチュエータ24は、シフトドラム40と、変位部材42と、待ちばね44と、電動モータ46とを備えている。変位部材42及び待ちばね44は、クラッチ18及び20のそれぞれに対して設けられている。
まず、Loクラッチ18について説明する。シフトドラム40は円筒状に形成されている。シフトドラム40の外周面には、Loクラッチ18の作動のために用いられるカム溝48が形成されている。カム溝48は、Loクラッチ18用の変位部材42に設けられたピン52と係合している。変位部材42は、Loクラッチ18の回転軸方向にストローク自在に配置されている。クラッチ部材18bは、待ちばね44を介して変位部材42と連動してストロークする。カム溝48は、Loクラッチ18を解放状態とする変位部材42の位置に対応する軸方向位置に形成された溝部48aと、Loクラッチ18を係合状態とする変位部材42の位置に対応する軸方向位置に形成された溝部48bとを有する。シフトドラム40は、電動モータ46によって回転駆動される。以上の構成によれば、電動モータ46の回転位置を制御することで、変位部材42を溝部48aの位置と溝部48bの位置との間で移動させることができる。その結果として、Loクラッチ18の係合/解放を制御できる。
Hiクラッチ20の作動のために、シフトドラム40は、カム溝48と同様に、溝部50aと溝部50bとを有するカム溝50を備えている。このため、Loクラッチ18と同様に、Hiクラッチ20の係合/解放を電動モータ46の回転位置に応じて制御できる。また、カム溝48とカム溝50とは、図2に示すように、位相を異ならせて形成されている。このため、電動モータ46の回転位置を制御することで、Hiクラッチ20の解放中にLoクラッチ18を係合でき、逆に、Loクラッチ18の解放中にHiクラッチ20を係合できる。
1-2.クラッチ係合制御
図3は、図1に示すクラッチ18及び20の係合制御の概要を説明するためのタイムチャートである。以下の説明は、クラッチ18及び20の双方に共通するものである。説明の簡略化のために、クラッチ18及び20の両者に当てはまる説明を以下に行うときは、クラッチ18及び20を総称して「クラッチC」と称する。
図3の縦軸は、クラッチCの入力軸の回転数に対する出力軸の回転数の差回転数ΔNである。当該入力軸の回転数は、MG1回転数センサを用いて検出されるMG1の回転軸の回転数から算出でき、又は、クランク角センサを用いて検出されるエンジン回転数から算出できる。また、当該出力軸の回転数は、MG2回転数センサを用いて検出されるMG2の回転軸の回転数から算出できる。したがって、それらの算出値から、差回転数ΔNを算出できる。
クラッチCを円滑に係合させるために、ECU30は、所定の目標値(狙い値)となるように差回転数ΔNを制御する差回転制御を行っている。図3に示す一例では、この目標値は-20rpmである。より具体的には、差回転制御は、クラッチCの係合が要求された場合に開始される。差回転制御によれば、例えば、差回転数ΔNが上記目標値に近づくようにMG2の回転数(すなわち、クラッチCの出力軸側の回転数)がフィードバック制御される。
クラッチCの係合要求は、例えば、アクセルペダルの踏み込み量(アクセル開度)の変化、及びそれに伴う車速の変化に伴って発せられる。図3は、クラッチCの係合要求を受けて差回転制御を開始した後の差回転数ΔNの波形を示している。本クラッチ係合制御は、係合要求を受けた後に次のように実行される。なお、係合要求が出された時に、係合要求フラグ(例えば、後述の図4参照)がONとされる。
すなわち、ECU30は、差回転制御を開始した後、差回転数ΔNが第1範囲R1(例えば、-90~5rpm)内に収まったか否かを判定する。そして、差回転数ΔNが第1範囲R1に収まった時点t1が到来すると、ECU30は時間T1のカウントを開始する。
その後、時点t1から時間T1が経過した時点t2において、ECU30は、差回転数ΔNが第1範囲R1よりも狭い第2範囲R2(例えば、-40~5rpm)内に収まったか否かを判定する。その結果、差回転数ΔNが第2範囲R2内に収まっていれば、ECU30は、この時点t2において、クラッチアクチュエータ24に対し、クラッチCの係合を指示する。より詳細には、クラッチCが係合状態となるようにシフトドラム40を回転させることを指示する。
図3中に実線で示す波形は、係合指示時点t2でのクラッチCの実際の係合動作の開始後の時点t3において、差回転数ΔNがゼロとなっている。すなわち、係合が首尾よく完了している。係合完了時点t3は、例えば、上述のクラッチストロークセンサを用いて検出されるクラッチCのストローク(一対のクラッチ部材間の距離)に基づいて検出できる。
クラッチCの係合が完了すると、それに伴って車両100にショックが生じる。このショックは、典型的には、図3に示すように車両100の前後方向の加速度(以下、「車両前後G」とも称する)の変化によって把握できる。クラッチCの係合に伴う上記ショックを良好に軽減するためには、このような車両前後Gの変動を小さく抑えることが求められる。
ここで、ATF温度、補機電圧、及びクラッチCの係合指示タイミング(例えば、図3の時点t2)における差回転数ΔN等の各種の車両運転パラメータに応じて、クラッチCの係合指示時点t2から係合完了時点t3までの係合時間T2中の差回転数ΔNの変化の仕方が変化する。そして、係合完了後の車両前後Gの変動は、この差回転数ΔNの変化の仕方に応じて変化する。
したがって、上記ショックを良好に軽減するためには、係合指示タイミングを適切なものとすることが求められる。しかしながら、上述のように、ショックを軽減するための最適係合指示タイミングは、ATF温度及び補機電圧等の車両運転パラメータに応じて変化する。そして、そのような車両運転パラメータと最適係合指示タイミングとの関係を一意に定めることは難しい。そこで、クラッチCの係合が要求された際の車両運転パラメータに対応した最適係合指示タイミングを取得するために、機械学習を利用することが考えられる。
1-3.機械学習装置
1-3-1.機械学習装置の基本構成
本開示に係る「機械学習装置」の一例として機能するECU30は、データ取得部30aと、学習部30bとを備えている。これらのデータ取得部30a及び学習部30bは、メモリに記憶されたプログラムがプロセッサによって実行されたときにソフトウェア的に実現される。
また、ECU30には、例えばディープニューラルネットワークを用いて、機械学習モデルが構築されている。この機械学習モデルの入力は、後述の「第1データ」及びクラッチCの係合指示タイミング(クラッチアクチュエータ24への係合指示タイミング)であり、その出力は、後述の「第2データ」である。
データ取得部30aは、データ取得期間における第1データ及び第2データを、係合指示タイミングとともに学習データとして取得する。このデータ取得期間は、クラッチCの係合が要求された係合要求時点(係合要求フラグONの時点)から係合完了時点(図3の時点t3)までの期間と、当該係合完了時点からの所定期間と、を含む。当該所定期間を含む理由は、図3を参照して説明したように、クラッチCの係合に伴う車両前後Gの変化は当該所定期間において生じるからである。取得された第1及び第2データは、当該データ取得期間中に用いられた係合指示タイミングとともに、ECU30のメモリに記憶(蓄積)される。
第1データは、上記データ取得期間における車両運転パラメータのデータである。ここでいう車両運転パラメータは、例えば、上述のATF温度及び補機電圧とともに、差回転数ΔN、差回転数ΔNの時間微分値である差回転数変化速度、大気圧、及び大気温度である。なお、取得される第1データは、1つの車両運転パラメータのデータであってもよいが、基本的には、複数の車両運転パラメータのデータである。
第2データは、上記データ取得期間における「係合評価値」のデータである。ここでいう係合評価値は、クラッチCの係合に伴って車両100に生じるショックの大きさと相関する値であり、その典型例は車両前後Gである。車両前後Gは、例えば、車両加速度センサを用いて取得される。あるいは、係合評価値は、車両前後Gに代え、例えば、車両前後Gの時間微分値である車両前後ジャークであってもよい。より具体的には、車両前後Gの例(前後ジャークも同様)では、「係合評価値を改善する」とは、係合に伴って生じる車両前後Gの変化を小さくすることを意味する。
学習部30bは、上記機械学習モデルを用いて、クラッチCの係合が要求された際の車両運転パラメータの下で「係合評価値」を改善する係合指示タイミングである最適係合指示タイミングを上記学習データに基づいて学習する。
具体的には、車両前後Gの例では、最適係合指示タイミングは、クラッチCの係合が要求された際の車両運転パラメータの下で車両前後Gの変化を最小とする係合指示タイミングに相当する。学習部30bによる学習における参考データ(教師データ)としては、例えば、メモリに蓄積された第2データが用いられる。この参考データは、係合に伴う車両前後Gの変化が小さいほど(より詳細には、車両前後Gの変動成分の振幅が小さいほど)高評価となる。
ECU30は、上述の学習部30bによる学習結果を利用することで、クラッチCの係合が要求された際の車両運転パラメータの下での最適係合指示タイミングをクラッチアクチュエータ24に指示できるようになる。より詳細には、図3を参照して説明したクラッチ係合制御の例では、係合指示タイミングは、差回転数ΔNが第2範囲R2内に収まっていることを条件として、差回転数ΔNが第1範囲R1に入ってからカウントされる時間T1が経過した時点に相当する。つまり、係合指示タイミングは、第1範囲R1、第2範囲R2、及び時間T1によって特定される。このため、本クラッチ係合制御の例では、クラッチCの係合が要求された際の車両運転パラメータに応じた第1範囲R1、第2範囲R2、及び時間T1のそれぞれの最適値が機械学習を利用してECU30によって設定されることで、最適係合指示タイミングが特定(設定)される。なお、設定される最適値は、第1範囲R1、第2範囲R2、及び時間T1の最適値の何れか1つ又は2つでもよく、第1範囲R1、第2範囲R2、及び時間T1のうちで最適値が出力されない残りは、事前に決定されたベース値であってもよい。
1-3-2.本機械学習の課題
以上説明したように、本機械学習装置(ECU30)によれば、クラッチCの係合が行われる場合に、クラッチCの係合に関係する車両運転パラメータに応じた最適係合指示タイミングを設定できる。そのうえで、このように機械学習を利用して車両運転パラメータに応じた最適係合指示タイミングを設定するためには、適切な学習データを取得して誤学習を抑制することが求められる。
1-3-3.学習データの取得に関する特徴部分
上記の課題に鑑み、ECU30(データ取得部30a)は、学習データの取得に関連して、次のような「データ判別処理」と「第1データ除外処理」とを実行する。データ判別処理では、クラッチCの係合以外の影響に起因する外乱が含まれる第2データ(車両前後Gのデータ)が判別される。そして、第1データ除外処理では、データ判別処理によって外乱が含まれると判別された第2データが、機械学習モデルによる学習の対象から除外される。
補足すると、上記機械学習モデルの出力である車両前後Gは、クラッチCの係合に伴うショック以外にも様々な要因(上記外乱)によって変動する。このため、当該外乱を含むような第2データの使用は、クラッチCの係合と明確な因果関係にない外乱による車両前後Gの変動を当該係合に起因するものと判断し、誤学習につながる恐れがある。図4は、第2データ(車両前後Gのデータ)への外乱の影響を説明するためのタイムチャートである。図4(A)は、路面からの外乱の影響が小さい平坦路にて取得された車両前後Gのデータを示している。このように、平坦路では、クラッチCの係合に起因する車両前後Gのピークを明確に確認できる。一方、図4(B)は、路面からの外乱の影響が大きい不整路にて取得された車両前後Gのデータを示している。このように、不整路では、クラッチCの係合に起因する車両前後Gのピークが外乱に起因する変動の影響によって確認しにくくなっている。
図5は、実施の形態1に係る機械学習装置における学習データの取得に関する処理の流れを示すフローチャートである。ECU30による第1データ(各種車両運転パラメータのデータ)及び第2データ(車両前後Gのデータ)の取得(計測)自体は、基本的には、車両100のトリップ中に所定の周期で常時行われている。そのうえで、このフローチャートの処理は、車両100の運転中にクラッチCの係合が行われる度に実行される。
図5では、ECU30(データ取得部30a)は、まずステップS100において、今回のクラッチCの係合の際に取得された第2データが、クラッチCの係合以外の影響に起因する外乱を含むものであるか否かを判別する(データ判別処理)。本ステップS100のデータ判別処理の具体例1~6については後述される。
ステップS100において今回取得の第2データが外乱を含まないと判別された場合には、処理はステップS102に進む。ステップS102では、ECU30は、今回取得の第2データを学習データとして用いる(すなわち、本学習の対象とする)。なお、第2データとともに、今回取得の第1データ及び係合指示タイミングも学習データとして用いられる。
一方、ステップS100において今回取得の第2データが外乱を含むと判別された場合には、処理はステップS104に進む。ステップS104では、ECU30は、今回取得の第2データを学習データとして用いない(第1データ除外処理)。なお、第2データとともに、今回取得の第1データ及び係合指示タイミングも学習データとして用いられない。
ステップS100のデータ判別処理の具体例1では、ECU30は、車両100が不整路を走行する時に取得される第2データには外乱が含まれると判別する。車両100が不整路を走行しているか否かは、例えば、車輪速センサによって検出される車輪102の回転変動が閾値より大きいか否かに基づいて判定できる。具体例1によれば、不整路を走行する際の車両前後Gの乱れの影響による誤学習を抑制できる。
具体例2では、ECU30は、車両100が雪道を走行する時に取得される第2データには外乱が含まれると判別する。車両100が雪道を走行しているか否かについても、例えば、具体例1と同様に車輪速センサを利用して判定できる。具体例2によれば、雪道を走行する際の車両前後Gの乱れの影響による誤学習を抑制できる。
具体例3では、ECU30は、車両100のサスペンションのストロークが閾値より大きい場合に取得される第2データには外乱が含まれると判別する。これにより、サスペンションに大きな変動が生じていることを利用して、車両前後Gに対して外乱の影響が含まれる状況であることを確実に判定でき、誤学習を抑制できる。
具体例4では、ECU30は、撮像センサ(例えば、カメラ)によって取得される車両100の周囲の画像に基づいて、外乱が含まれる第2データを判別する。具体的には、ECU30は、画像認識機能を有し、例えば、カメラの画像から不整路又は雪道等の悪路を走行中であるか否かを判定する。具体例4によれば、車両100の周辺状況をより直接的に判断して、誤学習を招く恐れのある第2データを排除できる。
具体例5では、ECU30は、GNSS受信機34を用いて取得される車両100の位置情報に基づいて、外乱が含まれる第2データを判別する。具体的には、ECU30は、例えば、メモリに格納された地図情報を利用して、車両100が地図情報上の道路から外れた場所を走行しているか否かを判定する。車両100がそのような場所を走行している場合には、第2データに外乱が含まれることが懸念される。具体例5によれば、車両100の位置情報を利用して、誤学習を招く恐れのある第2データを排除できる。
具体例6によれば、ECU30は、今回取得した第2データ(時系列データ)を波形表示し、正解データの時間波形と比較する。このような比較は、例えば、相互相関関数を利用して行える。そして、ECU30は、正解データの時間波形に対する乖離の度合いが閾値より高い時間波形を有する第2データには、外乱が含まれると判別する。具体例6によれば、第2データに外乱が含まれるか否かを第2データの波形から直接的に判断し、誤学習を招く恐れのある第2データを排除できる。
なお、ECU30は、データ判別処理として上述した具体例1~6のすべてを実行してもよいし、あるいは、具体例1~6のうちの何れか1つ、又は全部ではない複数を実行してもよい。
1-4.効果
以上説明したように、ECU30(データ取得部30a)は、学習データの取得に際し、上述のデータ判別処理と第1データ除外処理とを実行する。その結果、データ判別処理によって外乱が含まれると判別された第2データは、第1データ除外処理によって学習部30bによる学習の対象から除外される。これにより、クラッチCの係合以外の要因による第2データの乱れを排除できる。すなわち、信頼性の低い第2データを除外し、適切な学習データを取得できるようになる。このため、誤学習を抑制できる。
2.実施の形態2
実施の形態2に係る機械学習装置は、学習データの取得に関して以下に説明される第2データ除外処理が追加的に実行される点を除き、実施の形態1に係る機械学習装置と同じである。
本実施形態では、ECU30(データ取得部30a)は、学習部30bによる学習のための適切な学習データの取得のために、第2データ除外処理を次のように実行する。すなわち、第2データ除外処理では、ECU30は、アクセルペダルの踏み込み量の変化速度ΔPapが閾値未満の場合に取得される第2データを学習部30bによる学習の対象から除外する。なお、この場合には、第2データとともに、第1データ及び係合指示タイミングについても、学習データとして用いられない。
図6は、実施の形態2に係る機械学習装置における学習データの取得に関する処理の流れを示すフローチャートである。このフローチャートの処理は、上述の図4に示すフローチャートと同様に、車両100の運転中にクラッチCの係合が行われる度に実行される。
図6では、ECU30(データ取得部30a)は、まずステップS200において、アクセルポジションセンサを用いて算出される変化速度ΔPapが所定の閾値未満であるか否かを判定する。
ステップS200において変化速度ΔPapが閾値以上である場合には、処理はステップS102に進み、今回取得の第2データが学習データとして用いられる(すなわち、本学習の対象とされる)。なお、第2データとともに、今回取得の第1データ及び係合指示タイミングも用いられる。
一方、ステップS200において変化速度ΔPapが閾値未満である場合には、処理はステップS104に進み、今回取得の第2データが学習データとして用いられない(第2データ除外処理)。なお、第2データとともに、今回取得の第1データ及び係合指示タイミングも学習データとして用いられない。
以上説明した実施の形態2に係る第2データ除外処理によれば、アクセルペダルの踏み込み量の変化速度ΔPapが閾値以上である場合(急加速時又は急減速時)に取得される第2データは、学習データとして用いられる。一方、変化速度ΔPapが閾値未満の場合に取得される第2データは、学習データとして用いられない。これにより、学習データの取得が、学習部30bによる学習が集中的に必要な条件に限定される。このため、ECU30の計算負荷を下げつつ、学習データの取得を行えるようになる。
3.実施の形態3
実施の形態3に係る機械学習装置は、学習データの取得に関して以下に説明される第3データ除外処理が追加的に実行される点を除き、実施の形態1に係る機械学習装置と同じである。また、実施の形態3は、実施の形態2と組み合わせて実行されてもよい。
本実施形態では、ECU30(データ取得部30a)は、学習部30bによる学習のための適切な学習データの取得のために、次のような第3データ除外処理を実行する。すなわち、第3データ除外処理では、ECU30は、クラッチCの係合に要する時間(係合時間T2(図3参照))が閾値よりも長い係合動作が行われてから第2データの取得回数が所定回数に達した後に取得される第2データを学習部30bによる学習の対象から除外する。なお、この場合には、第2データとともに、第1データ及び係合指示タイミングについても、学習データとして用いられない。
図7は、実施の形態3に係る機械学習装置における学習データの取得に関する処理の流れを示すフローチャートである。このフローチャートの処理は、上述の図4に示すフローチャートと同様に、車両100の運転中にクラッチCの係合が行われる度に実行される。
図7では、ECU30(データ取得部30a)は、まずステップS300において、クラッチCの係合時間T2が閾値よりも長い係合動作が行われてから第2データの取得回数が所定回数に達したか否かを判定する。上述のように、第2データの取得は、係合動作が行われる度に実行される。このため、ここでいう第2データの取得回数は、係合動作の実行回数と同じである。
ステップS300の判定結果が否定的である場合には、処理はステップS102に進み、今回取得の第2データが学習データとして用いられる(すなわち、本学習の対象とされる)。なお、第2データとともに、今回取得の第1データ及び係合指示タイミングも用いられる。
一方、ステップS300の判定結果が肯定的である場合には、処理はステップS104に進み、今回取得の第2データが学習データとして用いられない(第3データ除外処理)。なお、第2データとともに、今回取得の第1データ及び係合指示タイミングも学習データとして用いられない。
以上説明した実施の形態3に係る第3データ除外処理によれば、学習データとしての第2データの取得は、クラッチCの係合時間T2が閾値よりも長い係合動作と、当該係合動作が行われてから第2データの取得回数が所定回数に達するまでに行われる係合動作とを対象として実行される。そして、第2データの取得回数が上記所定回数に達した後に取得される第2データは、学習データとして用いられない。これにより、学習データの取得が、学習部30bによる学習が集中的に必要な条件に限定される。このため、ECU30の計算負荷を下げつつ、学習データの取得を行えるようになる。
付け加えると、典型的には、係合時間T2は、車両の1回の走行(1トリップ)中において内燃機関3等の駆動ユニット10の構成要素の暖機が未完了の状態において長くなり易い。より詳細には、クラッチCの係合に関係する車両取得パラメータ(例えば、ATF温度)は、暖機が完了すると安定する。その結果、第2データへの外乱が減少していく。したがって、第3データ除外処理によれば、学習部30bによる学習が集中的に必要な条件を対象として、学習データの取得を行えるようになる。
4.実施の形態4
実施の形態4に係る機械学習装置は、学習データとしての第2データの取得手法が異なる点を除き、実施の形態1に係る機械学習装置と同じである。また、実施の形態4は、実施の形態2及び3の少なくとも1つと組み合わせて実行されてもよい。
図8は、実施の形態4に係る第2データの取得手法を説明するための図である。図8には、車両100の加速時の車両前後Gの時間波形が表されている。具体的には、車両100の要求駆動力に基づく車両前後Gの推定値の波形と、車両加速度センサによる車両前後Gの計測値の波形とが表されている。当該推定値は、公知の手法を用いて取得できる。
本実施形態では、ECU30(データ取得部30a)は、車両前後Gの上記推定値を上記計測値から差し引いて得られる車両前後Gのデータを、学習部30bによる学習のための第2データ(学習データ)として用いる。なお、図8は、一例として、車両前後Gが正の方向に増加する車両加速時を示しているが、車両減速時についても同様である。
以上説明した実施の形態4の第2データの取得手法によれば、車両前後Gの変動成分のみを抽出し、学習データとして用いることができる。これにより、車両100の加減速に起因する車両前後Gの変化が学習に反映されないようにすることができ、誤学習を抑制できる。
1 第1モータジェネレータ(MG)
2 第2モータジェネレータ(MG)
3 内燃機関
10 駆動ユニット
12 動力分割機構
18 低速用クラッチ(Loクラッチ)
20 高速用クラッチ(Hiクラッチ)
24 クラッチアクチュエータ
30 電子制御ユニット(ECU)
30a データ取得部
30b 学習部
32 センサ類
34 GNSS受信機
100 車両

Claims (11)

  1. 車両の動力伝達経路に配置されたクラッチを作動させるアクチュエータへの最適係合指示タイミングを、前記クラッチの係合に関係する1又は複数の車両運転パラメータに応じて設定する機械学習装置であって、
    前記クラッチの係合に伴って前記車両に生じるショックの大きさと相関する値を係合評価値と称したとき、前記クラッチの係合が行われる場合に、係合要求時点から係合完了時点までの期間と前記係合完了時点からの所定期間とを含むデータ取得期間における前記1又は複数の車両運転パラメータの第1データと、前記データ取得期間における前記係合評価値の第2データとを、前記アクチュエータへの係合指示タイミングとともに学習データとして取得するデータ取得部と、
    前記第1データ及び前記係合指示タイミングを入力とし前記第2データを出力とする機械学習モデルを用いて、前記クラッチの係合が要求された際の前記1又は複数の車両運転パラメータの下で前記係合評価値を改善する係合指示タイミングである前記最適係合指示タイミングを前記学習データに基づいて学習する学習部と、
    を備え、
    前記データ取得部は、
    前記クラッチの係合以外の影響に起因する外乱が含まれる前記第2データを判別するデータ判別処理と、
    前記データ判別処理によって前記外乱が含まれると判別された前記第2データを前記学習部による学習の対象から除外する第1データ除外処理と、
    を実行する
    ことを特徴とする機械学習装置。
  2. 前記データ判別処理において、前記データ取得部は、前記車両が不整路を走行する時に取得される前記第2データには前記外乱が含まれると判別する
    ことを特徴とする請求項1に記載の機械学習装置。
  3. 前記データ判別処理において、前記データ取得部は、前記車両が雪道を走行する時に取得される前記第2データには前記外乱が含まれると判別する
    ことを特徴とする請求項1又は2に記載の機械学習装置。
  4. 前記車両は、サスペンションのストロークを検出するストロークセンサを含み、
    前記データ判別処理において、前記データ取得部は、前記サスペンションのストロークが閾値より大きい場合に取得される前記第2データには前記外乱が含まれると判別する
    ことを特徴とする請求項1~3の何れか1つに記載の機械学習装置。
  5. 前記車両は、前記車両の周囲を撮像する撮像センサを含み、
    前記データ判別処理において、前記データ取得部は、前記撮像センサによって取得される画像に基づいて、前記外乱が含まれる前記第2データを判別する
    ことを特徴とする請求項1~4の何れか1つに記載の機械学習装置。
  6. 前記車両は、前記車両の位置情報を取得するGNSS受信機を含み、
    前記データ判別処理において、前記データ取得部は、前記位置情報に基づいて、前記外乱が含まれる前記第2データを判別する
    ことを特徴とする請求項1~5の何れか1つに記載の機械学習装置。
  7. 前記データ判別処理において、前記データ取得部は、取得した前記第2データの時間波形を正解データの時間波形と比較し、前記正解データの前記時間波形に対する乖離の度合いが閾値より高い時間波形を有する前記第2データには、前記外乱が含まれると判別する
    ことを特徴とする請求項1~6の何れか1つに記載の機械学習装置。
  8. 前記車両は、アクセルペダルの踏み込み量を検出するアクセルポジションセンサを含み、
    前記データ取得部は、前記踏み込み量の変化速度が閾値未満の場合に取得される前記第2データを前記学習部による学習の対象から除外する第2データ除外処理を実行する
    ことを特徴とする請求項1~7の何れか1つに記載の機械学習装置。
  9. 前記データ取得部は、前記クラッチの係合に要する時間が閾値よりも長い係合動作が行われてから前記第2データの取得回数が所定回数に達した後に取得される前記第2データを前記学習部による学習の対象から除外する第3データ除外処理を実行する
    ことを特徴とする請求項1~8の何れか1つに記載の機械学習装置。
  10. 前記係合評価値は、前記車両の前後方向の車両加速度である
    ことを特徴とする請求項1~9の何れか1つに記載の機械学習装置。
  11. 前記車両は、前記前後方向の車両加速度を検出する車両加速度センサを含み、
    前記データ取得部は、前記車両の要求駆動力から推定される前記前後方向の車両加速度を、前記車両加速度センサによって計測された前記前後方向の車両加速度から差し引いて得られるデータを、前記学習部による学習のための前記第2データとして用いる
    ことを特徴とする請求項10に記載の機械学習装置。
JP2021050534A 2021-03-24 2021-03-24 機械学習装置 Pending JP2022148734A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021050534A JP2022148734A (ja) 2021-03-24 2021-03-24 機械学習装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021050534A JP2022148734A (ja) 2021-03-24 2021-03-24 機械学習装置

Publications (1)

Publication Number Publication Date
JP2022148734A true JP2022148734A (ja) 2022-10-06

Family

ID=83462364

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021050534A Pending JP2022148734A (ja) 2021-03-24 2021-03-24 機械学習装置

Country Status (1)

Country Link
JP (1) JP2022148734A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117574133A (zh) * 2024-01-11 2024-02-20 湖南工商大学 一种不安全生产行为识别方法及相关设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117574133A (zh) * 2024-01-11 2024-02-20 湖南工商大学 一种不安全生产行为识别方法及相关设备
CN117574133B (zh) * 2024-01-11 2024-04-02 湖南工商大学 一种不安全生产行为识别方法及相关设备

Similar Documents

Publication Publication Date Title
US20200247384A1 (en) System and method for controlling hybrid electric vehicle using driving tendency of driver
JP6128103B2 (ja) 車両制御装置
CN109720334B (zh) 混合动力车辆
CN107914699B (zh) 混合动力电动车辆的控制方法
US8768547B2 (en) Control of a hybrid vehicle with a manual transmission
US11273839B2 (en) Vehicle control device
US10589733B2 (en) Method and apparatus for controlling MHSG of mild hybrid electric vehicle
US10501071B2 (en) Control device of hybrid vehicle
US20190092313A1 (en) Method for controlling gear shifting of hybrid electric vehicle
CA2993424A1 (en) Engine control method and vehicle traveling control device
JP2017114337A (ja) 車両用駆動装置の制御装置
JP2022148734A (ja) 機械学習装置
CN112477840A (zh) 用于为具有自动变速器的车辆提供车辆漂移的方法和系统
JP2010121625A (ja) 内燃機関の回転数制御のための電子制御アセンブリ
JP2016210213A (ja) 車両制御装置
JP2016144977A (ja) 車両制御装置
JP7010296B2 (ja) 車両の制御方法及び制御装置
US10370002B2 (en) Engine control method for preventing engine stall for vehicle on sloped road
JP2022135718A (ja) 車両の駆動力制御装置
JP5556548B2 (ja) 車両の総重量推定装置
JP5928579B2 (ja) 車両の変速制御装置
JP5196040B2 (ja) エンジン制御装置
US10408338B2 (en) Control apparatus and control method for automatic transmission
JP2022103563A (ja) 乗物制御プログラム及び乗物制御装置
US8019524B2 (en) Control apparatus for driving source