JP2022148734A

JP2022148734A - 機械学習装置

Info

Publication number: JP2022148734A
Application number: JP2021050534A
Authority: JP
Inventors: 陽一郎勇; Yoichiro Yu
Original assignee: Toyota Motor Corp
Current assignee: Toyota Motor Corp
Priority date: 2021-03-24
Filing date: 2021-03-24
Publication date: 2022-10-06

Abstract

【課題】適切な学習データを取得して誤学習を抑制する。【解決手段】機械学習装置は、アクチュエータへの最適係合指示タイミングを、クラッチの係合に関係する１又は複数の車両運転パラメータに応じて設定する。機械学習装置は、クラッチの係合が行われる場合に、データ取得期間における１又は複数の車両運転パラメータの第１データ及び係合評価値の第２データを係合指示タイミングとともに学習データとして取得するデータ取得部と、機械学習モデルを用いて、クラッチの係合が要求された際の１又は複数の車両運転パラメータの下で係合評価値を改善する最適係合指示タイミングを学習データに基づいて学習する学習部とを備える。データ取得部は、クラッチの係合以外の影響に起因する外乱が含まれる第２データを判別するデータ判別処理と、外乱が含まれると判別された第２データを学習部による学習の対象から除外する第１データ除外処理と、を実行する。【選択図】図１

Description

この発明は、車両の動力伝達経路に配置されたクラッチの最適な係合指示タイミングを設定する機械学習装置に関する。

特許文献１には、内燃機関、第１モータ、及び第２モータを駆動力源として備えるハイブリッド車両が開示されている。このハイブリッド車両の動力伝達経路には、駆動装置の動作モードを複数のモードの間で切り替えるためのクラッチが配置されている。

特開２０１８－１５４３２７号公報

車両の動力伝達経路に配置されたクラッチを作動させるアクチュエータへの係合指示タイミングが適切でないと、クラッチの係合に伴って車両に生じるショックが大きくなる。ここで、当該ショックを抑制するうえで最適な係合指示タイミングは、１又は複数の車両運転パラメータ（例えば、潤滑油温度及び補機電圧）に応じて変化する。そして、そのような車両運転パラメータと最適係合指示タイミングとの関係を一意に定めることは難しい。そこで、クラッチの係合が要求された際の車両運転パラメータに応じた最適係合指示タイミングを取得するために、機械学習を利用することが考えられる。

そのうえで、機械学習を利用して車両運転パラメータに応じた最適係合指示タイミングを設定するためには、適切な学習データを取得して誤学習を抑制することが求められる。

本発明は、上述のような課題に鑑みてなされたものであり、車両運転パラメータに応じた最適係合指示タイミングを設定するために利用される機械学習において、適切な学習データを取得して誤学習を抑制できるようにすることを目的とする。

本発明に係る機械学習装置は、車両の動力伝達経路に配置されたクラッチを作動させるアクチュエータへの最適係合指示タイミングを、クラッチの係合に関係する１又は複数の車両運転パラメータに応じて設定する。機械学習装置は、データ取得部と学習部とを備える。
データ取得部は、クラッチの係合に伴って車両に生じるショックの大きさと相関する値を係合評価値と称したとき、クラッチの係合が行われる場合に、係合要求時点から係合完了時点までの期間と係合完了時点からの所定期間とを含むデータ取得期間における１又は複数の車両運転パラメータの第１データと、データ取得期間における係合評価値の第２データとを、アクチュエータへの係合指示タイミングとともに学習データとして取得する。
学習部は、第１データ及び係合指示タイミングを入力とし第２データを出力とする機械学習モデルを用いて、クラッチの係合が要求された際の１又は複数の車両運転パラメータの下で係合評価値を改善する係合指示タイミングである最適係合指示タイミングを学習データに基づいて学習する。
データ取得部は、クラッチの係合以外の影響に起因する外乱が含まれる第２データを判別するデータ判別処理と、データ判別処理によって外乱が含まれると判別された第２データを学習部による学習の対象から除外する第１データ除外処理と、を実行する。

データ判別処理において、データ取得部は、車両が不整路を走行する時に取得される第２データには外乱が含まれると判別してもよい。

データ判別処理において、データ取得部は、車両が雪道を走行する時に取得される第２データには外乱が含まれると判別してもよい。

車両は、サスペンションのストロークを検出するストロークセンサを含んでもよい。そして、データ判別処理において、データ取得部は、サスペンションのストロークが閾値より大きい場合に取得される第２データには外乱が含まれると判別してもよい。

車両は、車両の周囲を撮像する撮像センサを含んでもよい。そして、データ判別処理において、データ取得部は、撮像センサによって取得される画像に基づいて、外乱が含まれる第２データを判別してもよい。

車両は、車両の位置情報を取得するＧＮＳＳ受信機を含んでもよい。そして、データ判別処理において、データ取得部は、位置情報に基づいて、外乱が含まれる第２データを判別してもよい。

データ判別処理において、データ取得部は、取得した第２データの時間波形を正解データの時間波形と比較し、正解データの時間波形に対する乖離の度合いが閾値より高い時間波形を有する第２データには、外乱が含まれると判別してもよい。

車両は、アクセルペダルの踏み込み量を検出するアクセルポジションセンサを含んでもよい。そして、データ取得部は、踏み込み量の変化速度が閾値未満の場合に取得される第２データを学習部による学習の対象から除外する第２データ除外処理を実行してもよい。

データ取得部は、クラッチの係合に要する時間が閾値よりも長い係合動作が行われてから第２データの取得回数が所定回数に達した後に取得される第２データを学習部による学習の対象から除外する第３データ除外処理を実行してもよい。

係合評価値は、車両の前後方向の車両加速度であってもよい。

車両は、前後方向の車両加速度を検出する車両加速度センサを含んでもよい。そして、データ取得部は、車両の要求駆動力から推定される前後方向の車両加速度を、車両加速度センサによって計測された前後方向の車両加速度から差し引いて得られるデータを、学習部による学習のための第２データとして用いてもよい。

本発明に係る機械学習装置によれば、データ取得部は、学習データの取得に際し、データ判別処理と第１データ除外処理とを実行する。その結果、データ判別処理によって外乱が含まれると判別された第２データは、第１データ除外処理によって学習部による学習の対象から除外される。これにより、クラッチの係合以外の要因による第２データの乱れを排除できる。すなわち、適切な学習データを取得できるようになる。このため、誤学習を抑制できる。

実施の形態１に係る機械学習装置が適用される車両のシステム構成の一例を示す図である。図１に示すクラッチアクチュエータの構成の一例を模式的に示す図である。図１に示すクラッチの係合制御の概要を説明するためのタイムチャートである。第２データ（車両前後Ｇのデータ）への外乱の影響を説明するためのタイムチャートである。実施の形態１に係る機械学習装置における学習データの取得に関する処理の流れを示すフローチャートである。実施の形態２に係る機械学習装置における学習データの取得に関する処理の流れを示すフローチャートである。実施の形態３に係る機械学習装置における学習データの取得に関する処理の流れを示すフローチャートである。実施の形態４に係る第２データの取得手法を説明するための図である。

以下に示す実施の形態において各要素の個数、数量、量、範囲等の数に言及した場合、特に明示した場合や原理的に明らかにその数に特定される場合を除いて、その言及した数に、この発明が限定されるものではない。また、以下に示す実施の形態において説明する構造やステップ等は、特に明示した場合や明らかに原理的にそれに特定される場合を除いて、この発明に必ずしも必須のものではない。

１．実施の形態１
１－１．車両のシステム構成例
図１は、実施の形態１に係る機械学習装置が適用される車両１００のシステム構成の一例を示す図である。車両１００は、車輪１０２を駆動する駆動ユニット１０を備えている。駆動ユニット１０は、第１モータジェネレータ（ＭＧ）１、第２モータジェネレータ（ＭＧ）２、及び内燃機関３を駆動力源として備えている。ＭＧ１は主に発電機として用いられ、ＭＧ２は主に車輪１０２を駆動する電動機として用いられる。また、駆動ユニット１０は、動力分割機構１２を備えている。

動力分割機構１２は、第１プラネタリギヤユニット１４、第２プラネタリギヤユニット１６、低速用クラッチ（Ｌｏクラッチ）１８、高速用クラッチ（Ｈｉクラッチ）２０、及び減速機構２２を含む。第１プラネタリギヤユニット１４は、第１サンギヤ１４ａと第１キャリア１４ｂと第１リングギヤ１４ｃとを含む。第２プラネタリギヤユニット１６は、第２サンギヤ１６ａと第２キャリア１６ｂと第２リングギヤ１６ｃとを含む。第１サンギヤ１４ａはＭＧ１に連結され、第１キャリア１４ｂは内燃機関３に連結されている。第１リングギヤ１４ｃは、第２サンギヤ１６ａに連結されている。

Ｌｏクラッチ１８は、第２サンギヤ１６ａと第２キャリア１６ｂとを連結可能に構成されている。Ｈｉクラッチ２０は、第２キャリア１６ｂと第２リングギヤ１６ｃとを連結可能に構成されている。これらのクラッチ１８及び２０は、一例としてドグクラッチであるが、例えば、摩擦式多板クラッチであってもよい。クラッチ１８及び２０は、後述の図２に示すクラッチアクチュエータ２４によって作動する。第２リングギヤ１６ｃは、ディファレンシャルギア２２ａを含む減速機構２２に連結されている。また、ＭＧ２も、減速機構２２に連結されている。第２リングギヤ１６ｃからのトルク（内燃機関３からのトルク）とＭＧ２のトルクは、減速機構２２及びドライブシャフト２６を介して車輪１０２に伝達される。

上述した駆動ユニット１０によれば、クラッチ１８及び２０の係合／解放を制御することにより変速を行うことができる。具体的には、Ｈｉクラッチ２０が係合すると、第２キャリア１６ｂと第２リングギヤ１６ｃとが連結される。その結果、第２プラネタリギヤユニット１６は直結状態（変速比１）となる。一方、Ｌｏクラッチ１８が係合すると、第１キャリア１４ｂと第２キャリア１６ｂとが連結される。その結果、第１及び第２プラネタリギヤユニット１４、１６の双方が差動動作を行う。駆動ユニット１０の駆動モードは、車両１００の高速時に適した高速モードと、低速時に適した低速モードとを含む。動力分割機構１２によれば、Ｌｏクラッチ１８を解放しつつＨｉクラッチ２０を係合することによって高速モードを選択でき、Ｈｉクラッチ２０を解放しつつＬｏクラッチ１８を係合することによって低速モードを選択できる。

上述のように、車両１００は、一例として動力分割方式のハイブリッド車両である。ただし、本開示に係る機械学習装置が適用される車両は、Ｌｏクラッチ１８及びＨｉクラッチ２０のように車両の動力伝達経路に配置された１又は複数のクラッチを有するものであれば、ハイブリッド車両に限られない。すなわち、車両は、例えば、駆動力源として電動モータのみを備える車両（例えば、バッテリ電気自動車又は燃料電池自動車）であってもよく、又は駆動力源として内燃機関のみを備える車両であってもよい。

また、車両１００は、電子制御ユニット（ＥＣＵ）３０を備えている。ＥＣＵ３０は、車両１００に関する各種処理を実行するコンピュータである。具体的には、ＥＣＵ３０によって実行される処理は、ＭＧ１、ＭＧ２及び内燃機関３の制御に関する処理、並びに、クラッチ１８及び２０の制御に関する処理を含む。また、ＥＣＵ３０は、本実施形態に係る「機械学習装置」としても機能する。このため、ＥＣＵ３０は、機械学習装置に関する処理も実行する。ＥＣＵ３０は、プロセッサ及びメモリを備えている。プロセッサは、メモリに格納されているプログラムを読み出して実行する。これにより、プロセッサによる上述の各種処理が実現される。なお、ＥＣＵ３０は複数であってもよい。ＥＣＵ３０は、例えば、駆動ユニット１０を統括的に制御するＥＣＵと、図示省略する電力制御ユニット（ＰＣＵ）を介してＭＧ１及びＭＧ２を制御するＥＣＵと、内燃機関３を制御するＥＣＵと、クラッチ１８及び２０を制御するＥＣＵとを含むように構成されていてもよい。

ＥＣＵ３０は、上述の各種処理に用いられるセンサ類３２からセンサ信号を取り込む。ここでいうセンサ類３２は、例えば、車両加速度センサ、車輪速センサ、アクセルポジションセンサ、ＭＧ１回転数センサ、ＭＧ２回転数センサ、クランク角センサ、潤滑油温度センサ、クラッチストロークセンサ、ドラム回転角センサ、サスペンション（図示省略）のストロークセンサ（ハイトセンサ）、補機電圧センサ、大気圧センサ、大気温度センサ（吸気温度センサ）、及び撮像センサを含む。付け加えると、ここでいう潤滑油温度は、クラッチ１８及び２０を含む動力分割機構１２の各部を潤滑する潤滑油の温度（ＡＴＦ温度）のことである。クラッチストロークセンサは、Ｌｏクラッチ１８及びＨｉクラッチ２０のそれぞれに設置されている。ドラム回転角センサは、後述のシフトドラム４０の回転角を検出する。補機電圧は、車両の補機類に電力を供給する補機バッテリの電圧である。撮像センサは、例えば、カメラ又はライダであり、車両１００の周囲を撮像する。また、車両１００は、ＧＮＳＳ（Global Navigation Satellite System）受信機３４を備えている。ＥＣＵ３０は、ＧＮＳＳ受信機３４を介して車両１００の位置情報を取得できる。

図２は、図１に示すクラッチアクチュエータ２４の構成の一例を模式的に示す図である。Ｌｏクラッチ１８は、互いに噛み合うドグ歯がそれぞれ形成された一対のクラッチ部材１８ａ及び１８ｂによって構成されている。Ｈｉクラッチ２０も、同様の一対のクラッチ部材２０ａ及び２０ｂによって構成されている。クラッチアクチュエータ２４は、シフトドラム４０と、変位部材４２と、待ちばね４４と、電動モータ４６とを備えている。変位部材４２及び待ちばね４４は、クラッチ１８及び２０のそれぞれに対して設けられている。

まず、Ｌｏクラッチ１８について説明する。シフトドラム４０は円筒状に形成されている。シフトドラム４０の外周面には、Ｌｏクラッチ１８の作動のために用いられるカム溝４８が形成されている。カム溝４８は、Ｌｏクラッチ１８用の変位部材４２に設けられたピン５２と係合している。変位部材４２は、Ｌｏクラッチ１８の回転軸方向にストローク自在に配置されている。クラッチ部材１８ｂは、待ちばね４４を介して変位部材４２と連動してストロークする。カム溝４８は、Ｌｏクラッチ１８を解放状態とする変位部材４２の位置に対応する軸方向位置に形成された溝部４８ａと、Ｌｏクラッチ１８を係合状態とする変位部材４２の位置に対応する軸方向位置に形成された溝部４８ｂとを有する。シフトドラム４０は、電動モータ４６によって回転駆動される。以上の構成によれば、電動モータ４６の回転位置を制御することで、変位部材４２を溝部４８ａの位置と溝部４８ｂの位置との間で移動させることができる。その結果として、Ｌｏクラッチ１８の係合／解放を制御できる。

Ｈｉクラッチ２０の作動のために、シフトドラム４０は、カム溝４８と同様に、溝部５０ａと溝部５０ｂとを有するカム溝５０を備えている。このため、Ｌｏクラッチ１８と同様に、Ｈｉクラッチ２０の係合／解放を電動モータ４６の回転位置に応じて制御できる。また、カム溝４８とカム溝５０とは、図２に示すように、位相を異ならせて形成されている。このため、電動モータ４６の回転位置を制御することで、Ｈｉクラッチ２０の解放中にＬｏクラッチ１８を係合でき、逆に、Ｌｏクラッチ１８の解放中にＨｉクラッチ２０を係合できる。

１－２．クラッチ係合制御
図３は、図１に示すクラッチ１８及び２０の係合制御の概要を説明するためのタイムチャートである。以下の説明は、クラッチ１８及び２０の双方に共通するものである。説明の簡略化のために、クラッチ１８及び２０の両者に当てはまる説明を以下に行うときは、クラッチ１８及び２０を総称して「クラッチＣ」と称する。

図３の縦軸は、クラッチＣの入力軸の回転数に対する出力軸の回転数の差回転数ΔＮである。当該入力軸の回転数は、ＭＧ１回転数センサを用いて検出されるＭＧ１の回転軸の回転数から算出でき、又は、クランク角センサを用いて検出されるエンジン回転数から算出できる。また、当該出力軸の回転数は、ＭＧ２回転数センサを用いて検出されるＭＧ２の回転軸の回転数から算出できる。したがって、それらの算出値から、差回転数ΔＮを算出できる。

クラッチＣを円滑に係合させるために、ＥＣＵ３０は、所定の目標値（狙い値）となるように差回転数ΔＮを制御する差回転制御を行っている。図３に示す一例では、この目標値は－２０ｒｐｍである。より具体的には、差回転制御は、クラッチＣの係合が要求された場合に開始される。差回転制御によれば、例えば、差回転数ΔＮが上記目標値に近づくようにＭＧ２の回転数（すなわち、クラッチＣの出力軸側の回転数）がフィードバック制御される。

クラッチＣの係合要求は、例えば、アクセルペダルの踏み込み量（アクセル開度）の変化、及びそれに伴う車速の変化に伴って発せられる。図３は、クラッチＣの係合要求を受けて差回転制御を開始した後の差回転数ΔＮの波形を示している。本クラッチ係合制御は、係合要求を受けた後に次のように実行される。なお、係合要求が出された時に、係合要求フラグ（例えば、後述の図４参照）がＯＮとされる。

すなわち、ＥＣＵ３０は、差回転制御を開始した後、差回転数ΔＮが第１範囲Ｒ１（例えば、－９０～５ｒｐｍ）内に収まったか否かを判定する。そして、差回転数ΔＮが第１範囲Ｒ１に収まった時点ｔ１が到来すると、ＥＣＵ３０は時間Ｔ１のカウントを開始する。

その後、時点ｔ１から時間Ｔ１が経過した時点ｔ２において、ＥＣＵ３０は、差回転数ΔＮが第１範囲Ｒ１よりも狭い第２範囲Ｒ２（例えば、－４０～５ｒｐｍ）内に収まったか否かを判定する。その結果、差回転数ΔＮが第２範囲Ｒ２内に収まっていれば、ＥＣＵ３０は、この時点ｔ２において、クラッチアクチュエータ２４に対し、クラッチＣの係合を指示する。より詳細には、クラッチＣが係合状態となるようにシフトドラム４０を回転させることを指示する。

図３中に実線で示す波形は、係合指示時点ｔ２でのクラッチＣの実際の係合動作の開始後の時点ｔ３において、差回転数ΔＮがゼロとなっている。すなわち、係合が首尾よく完了している。係合完了時点ｔ３は、例えば、上述のクラッチストロークセンサを用いて検出されるクラッチＣのストローク（一対のクラッチ部材間の距離）に基づいて検出できる。

クラッチＣの係合が完了すると、それに伴って車両１００にショックが生じる。このショックは、典型的には、図３に示すように車両１００の前後方向の加速度（以下、「車両前後Ｇ」とも称する）の変化によって把握できる。クラッチＣの係合に伴う上記ショックを良好に軽減するためには、このような車両前後Ｇの変動を小さく抑えることが求められる。

ここで、ＡＴＦ温度、補機電圧、及びクラッチＣの係合指示タイミング（例えば、図３の時点ｔ２）における差回転数ΔＮ等の各種の車両運転パラメータに応じて、クラッチＣの係合指示時点ｔ２から係合完了時点ｔ３までの係合時間Ｔ２中の差回転数ΔＮの変化の仕方が変化する。そして、係合完了後の車両前後Ｇの変動は、この差回転数ΔＮの変化の仕方に応じて変化する。

したがって、上記ショックを良好に軽減するためには、係合指示タイミングを適切なものとすることが求められる。しかしながら、上述のように、ショックを軽減するための最適係合指示タイミングは、ＡＴＦ温度及び補機電圧等の車両運転パラメータに応じて変化する。そして、そのような車両運転パラメータと最適係合指示タイミングとの関係を一意に定めることは難しい。そこで、クラッチＣの係合が要求された際の車両運転パラメータに対応した最適係合指示タイミングを取得するために、機械学習を利用することが考えられる。

１－３．機械学習装置
１－３－１．機械学習装置の基本構成
本開示に係る「機械学習装置」の一例として機能するＥＣＵ３０は、データ取得部３０ａと、学習部３０ｂとを備えている。これらのデータ取得部３０ａ及び学習部３０ｂは、メモリに記憶されたプログラムがプロセッサによって実行されたときにソフトウェア的に実現される。

また、ＥＣＵ３０には、例えばディープニューラルネットワークを用いて、機械学習モデルが構築されている。この機械学習モデルの入力は、後述の「第１データ」及びクラッチＣの係合指示タイミング（クラッチアクチュエータ２４への係合指示タイミング）であり、その出力は、後述の「第２データ」である。

データ取得部３０ａは、データ取得期間における第１データ及び第２データを、係合指示タイミングとともに学習データとして取得する。このデータ取得期間は、クラッチＣの係合が要求された係合要求時点（係合要求フラグＯＮの時点）から係合完了時点（図３の時点ｔ３）までの期間と、当該係合完了時点からの所定期間と、を含む。当該所定期間を含む理由は、図３を参照して説明したように、クラッチＣの係合に伴う車両前後Ｇの変化は当該所定期間において生じるからである。取得された第１及び第２データは、当該データ取得期間中に用いられた係合指示タイミングとともに、ＥＣＵ３０のメモリに記憶（蓄積）される。

第１データは、上記データ取得期間における車両運転パラメータのデータである。ここでいう車両運転パラメータは、例えば、上述のＡＴＦ温度及び補機電圧とともに、差回転数ΔＮ、差回転数ΔＮの時間微分値である差回転数変化速度、大気圧、及び大気温度である。なお、取得される第１データは、１つの車両運転パラメータのデータであってもよいが、基本的には、複数の車両運転パラメータのデータである。

第２データは、上記データ取得期間における「係合評価値」のデータである。ここでいう係合評価値は、クラッチＣの係合に伴って車両１００に生じるショックの大きさと相関する値であり、その典型例は車両前後Ｇである。車両前後Ｇは、例えば、車両加速度センサを用いて取得される。あるいは、係合評価値は、車両前後Ｇに代え、例えば、車両前後Ｇの時間微分値である車両前後ジャークであってもよい。より具体的には、車両前後Ｇの例（前後ジャークも同様）では、「係合評価値を改善する」とは、係合に伴って生じる車両前後Ｇの変化を小さくすることを意味する。

学習部３０ｂは、上記機械学習モデルを用いて、クラッチＣの係合が要求された際の車両運転パラメータの下で「係合評価値」を改善する係合指示タイミングである最適係合指示タイミングを上記学習データに基づいて学習する。

具体的には、車両前後Ｇの例では、最適係合指示タイミングは、クラッチＣの係合が要求された際の車両運転パラメータの下で車両前後Ｇの変化を最小とする係合指示タイミングに相当する。学習部３０ｂによる学習における参考データ（教師データ）としては、例えば、メモリに蓄積された第２データが用いられる。この参考データは、係合に伴う車両前後Ｇの変化が小さいほど（より詳細には、車両前後Ｇの変動成分の振幅が小さいほど）高評価となる。

ＥＣＵ３０は、上述の学習部３０ｂによる学習結果を利用することで、クラッチＣの係合が要求された際の車両運転パラメータの下での最適係合指示タイミングをクラッチアクチュエータ２４に指示できるようになる。より詳細には、図３を参照して説明したクラッチ係合制御の例では、係合指示タイミングは、差回転数ΔＮが第２範囲Ｒ２内に収まっていることを条件として、差回転数ΔＮが第１範囲Ｒ１に入ってからカウントされる時間Ｔ１が経過した時点に相当する。つまり、係合指示タイミングは、第１範囲Ｒ１、第２範囲Ｒ２、及び時間Ｔ１によって特定される。このため、本クラッチ係合制御の例では、クラッチＣの係合が要求された際の車両運転パラメータに応じた第１範囲Ｒ１、第２範囲Ｒ２、及び時間Ｔ１のそれぞれの最適値が機械学習を利用してＥＣＵ３０によって設定されることで、最適係合指示タイミングが特定（設定）される。なお、設定される最適値は、第１範囲Ｒ１、第２範囲Ｒ２、及び時間Ｔ１の最適値の何れか１つ又は２つでもよく、第１範囲Ｒ１、第２範囲Ｒ２、及び時間Ｔ１のうちで最適値が出力されない残りは、事前に決定されたベース値であってもよい。

１－３－２．本機械学習の課題
以上説明したように、本機械学習装置（ＥＣＵ３０）によれば、クラッチＣの係合が行われる場合に、クラッチＣの係合に関係する車両運転パラメータに応じた最適係合指示タイミングを設定できる。そのうえで、このように機械学習を利用して車両運転パラメータに応じた最適係合指示タイミングを設定するためには、適切な学習データを取得して誤学習を抑制することが求められる。

１－３－３．学習データの取得に関する特徴部分
上記の課題に鑑み、ＥＣＵ３０（データ取得部３０ａ）は、学習データの取得に関連して、次のような「データ判別処理」と「第１データ除外処理」とを実行する。データ判別処理では、クラッチＣの係合以外の影響に起因する外乱が含まれる第２データ（車両前後Ｇのデータ）が判別される。そして、第１データ除外処理では、データ判別処理によって外乱が含まれると判別された第２データが、機械学習モデルによる学習の対象から除外される。

補足すると、上記機械学習モデルの出力である車両前後Ｇは、クラッチＣの係合に伴うショック以外にも様々な要因（上記外乱）によって変動する。このため、当該外乱を含むような第２データの使用は、クラッチＣの係合と明確な因果関係にない外乱による車両前後Ｇの変動を当該係合に起因するものと判断し、誤学習につながる恐れがある。図４は、第２データ（車両前後Ｇのデータ）への外乱の影響を説明するためのタイムチャートである。図４（Ａ）は、路面からの外乱の影響が小さい平坦路にて取得された車両前後Ｇのデータを示している。このように、平坦路では、クラッチＣの係合に起因する車両前後Ｇのピークを明確に確認できる。一方、図４（Ｂ）は、路面からの外乱の影響が大きい不整路にて取得された車両前後Ｇのデータを示している。このように、不整路では、クラッチＣの係合に起因する車両前後Ｇのピークが外乱に起因する変動の影響によって確認しにくくなっている。

図５は、実施の形態１に係る機械学習装置における学習データの取得に関する処理の流れを示すフローチャートである。ＥＣＵ３０による第１データ（各種車両運転パラメータのデータ）及び第２データ（車両前後Ｇのデータ）の取得（計測）自体は、基本的には、車両１００のトリップ中に所定の周期で常時行われている。そのうえで、このフローチャートの処理は、車両１００の運転中にクラッチＣの係合が行われる度に実行される。

図５では、ＥＣＵ３０（データ取得部３０ａ）は、まずステップＳ１００において、今回のクラッチＣの係合の際に取得された第２データが、クラッチＣの係合以外の影響に起因する外乱を含むものであるか否かを判別する（データ判別処理）。本ステップＳ１００のデータ判別処理の具体例１～６については後述される。

ステップＳ１００において今回取得の第２データが外乱を含まないと判別された場合には、処理はステップＳ１０２に進む。ステップＳ１０２では、ＥＣＵ３０は、今回取得の第２データを学習データとして用いる（すなわち、本学習の対象とする）。なお、第２データとともに、今回取得の第１データ及び係合指示タイミングも学習データとして用いられる。

一方、ステップＳ１００において今回取得の第２データが外乱を含むと判別された場合には、処理はステップＳ１０４に進む。ステップＳ１０４では、ＥＣＵ３０は、今回取得の第２データを学習データとして用いない（第１データ除外処理）。なお、第２データとともに、今回取得の第１データ及び係合指示タイミングも学習データとして用いられない。

ステップＳ１００のデータ判別処理の具体例１では、ＥＣＵ３０は、車両１００が不整路を走行する時に取得される第２データには外乱が含まれると判別する。車両１００が不整路を走行しているか否かは、例えば、車輪速センサによって検出される車輪１０２の回転変動が閾値より大きいか否かに基づいて判定できる。具体例１によれば、不整路を走行する際の車両前後Ｇの乱れの影響による誤学習を抑制できる。

具体例２では、ＥＣＵ３０は、車両１００が雪道を走行する時に取得される第２データには外乱が含まれると判別する。車両１００が雪道を走行しているか否かについても、例えば、具体例１と同様に車輪速センサを利用して判定できる。具体例２によれば、雪道を走行する際の車両前後Ｇの乱れの影響による誤学習を抑制できる。

具体例３では、ＥＣＵ３０は、車両１００のサスペンションのストロークが閾値より大きい場合に取得される第２データには外乱が含まれると判別する。これにより、サスペンションに大きな変動が生じていることを利用して、車両前後Ｇに対して外乱の影響が含まれる状況であることを確実に判定でき、誤学習を抑制できる。

具体例４では、ＥＣＵ３０は、撮像センサ（例えば、カメラ）によって取得される車両１００の周囲の画像に基づいて、外乱が含まれる第２データを判別する。具体的には、ＥＣＵ３０は、画像認識機能を有し、例えば、カメラの画像から不整路又は雪道等の悪路を走行中であるか否かを判定する。具体例４によれば、車両１００の周辺状況をより直接的に判断して、誤学習を招く恐れのある第２データを排除できる。

具体例５では、ＥＣＵ３０は、ＧＮＳＳ受信機３４を用いて取得される車両１００の位置情報に基づいて、外乱が含まれる第２データを判別する。具体的には、ＥＣＵ３０は、例えば、メモリに格納された地図情報を利用して、車両１００が地図情報上の道路から外れた場所を走行しているか否かを判定する。車両１００がそのような場所を走行している場合には、第２データに外乱が含まれることが懸念される。具体例５によれば、車両１００の位置情報を利用して、誤学習を招く恐れのある第２データを排除できる。

具体例６によれば、ＥＣＵ３０は、今回取得した第２データ（時系列データ）を波形表示し、正解データの時間波形と比較する。このような比較は、例えば、相互相関関数を利用して行える。そして、ＥＣＵ３０は、正解データの時間波形に対する乖離の度合いが閾値より高い時間波形を有する第２データには、外乱が含まれると判別する。具体例６によれば、第２データに外乱が含まれるか否かを第２データの波形から直接的に判断し、誤学習を招く恐れのある第２データを排除できる。

なお、ＥＣＵ３０は、データ判別処理として上述した具体例１～６のすべてを実行してもよいし、あるいは、具体例１～６のうちの何れか１つ、又は全部ではない複数を実行してもよい。

１－４．効果
以上説明したように、ＥＣＵ３０（データ取得部３０ａ）は、学習データの取得に際し、上述のデータ判別処理と第１データ除外処理とを実行する。その結果、データ判別処理によって外乱が含まれると判別された第２データは、第１データ除外処理によって学習部３０ｂによる学習の対象から除外される。これにより、クラッチＣの係合以外の要因による第２データの乱れを排除できる。すなわち、信頼性の低い第２データを除外し、適切な学習データを取得できるようになる。このため、誤学習を抑制できる。

２．実施の形態２
実施の形態２に係る機械学習装置は、学習データの取得に関して以下に説明される第２データ除外処理が追加的に実行される点を除き、実施の形態１に係る機械学習装置と同じである。

本実施形態では、ＥＣＵ３０（データ取得部３０ａ）は、学習部３０ｂによる学習のための適切な学習データの取得のために、第２データ除外処理を次のように実行する。すなわち、第２データ除外処理では、ＥＣＵ３０は、アクセルペダルの踏み込み量の変化速度ΔＰａｐが閾値未満の場合に取得される第２データを学習部３０ｂによる学習の対象から除外する。なお、この場合には、第２データとともに、第１データ及び係合指示タイミングについても、学習データとして用いられない。

図６は、実施の形態２に係る機械学習装置における学習データの取得に関する処理の流れを示すフローチャートである。このフローチャートの処理は、上述の図４に示すフローチャートと同様に、車両１００の運転中にクラッチＣの係合が行われる度に実行される。

図６では、ＥＣＵ３０（データ取得部３０ａ）は、まずステップＳ２００において、アクセルポジションセンサを用いて算出される変化速度ΔＰａｐが所定の閾値未満であるか否かを判定する。

ステップＳ２００において変化速度ΔＰａｐが閾値以上である場合には、処理はステップＳ１０２に進み、今回取得の第２データが学習データとして用いられる（すなわち、本学習の対象とされる）。なお、第２データとともに、今回取得の第１データ及び係合指示タイミングも用いられる。

一方、ステップＳ２００において変化速度ΔＰａｐが閾値未満である場合には、処理はステップＳ１０４に進み、今回取得の第２データが学習データとして用いられない（第２データ除外処理）。なお、第２データとともに、今回取得の第１データ及び係合指示タイミングも学習データとして用いられない。

以上説明した実施の形態２に係る第２データ除外処理によれば、アクセルペダルの踏み込み量の変化速度ΔＰａｐが閾値以上である場合（急加速時又は急減速時）に取得される第２データは、学習データとして用いられる。一方、変化速度ΔＰａｐが閾値未満の場合に取得される第２データは、学習データとして用いられない。これにより、学習データの取得が、学習部３０ｂによる学習が集中的に必要な条件に限定される。このため、ＥＣＵ３０の計算負荷を下げつつ、学習データの取得を行えるようになる。

３．実施の形態３
実施の形態３に係る機械学習装置は、学習データの取得に関して以下に説明される第３データ除外処理が追加的に実行される点を除き、実施の形態１に係る機械学習装置と同じである。また、実施の形態３は、実施の形態２と組み合わせて実行されてもよい。

本実施形態では、ＥＣＵ３０（データ取得部３０ａ）は、学習部３０ｂによる学習のための適切な学習データの取得のために、次のような第３データ除外処理を実行する。すなわち、第３データ除外処理では、ＥＣＵ３０は、クラッチＣの係合に要する時間（係合時間Ｔ２（図３参照））が閾値よりも長い係合動作が行われてから第２データの取得回数が所定回数に達した後に取得される第２データを学習部３０ｂによる学習の対象から除外する。なお、この場合には、第２データとともに、第１データ及び係合指示タイミングについても、学習データとして用いられない。

図７は、実施の形態３に係る機械学習装置における学習データの取得に関する処理の流れを示すフローチャートである。このフローチャートの処理は、上述の図４に示すフローチャートと同様に、車両１００の運転中にクラッチＣの係合が行われる度に実行される。

図７では、ＥＣＵ３０（データ取得部３０ａ）は、まずステップＳ３００において、クラッチＣの係合時間Ｔ２が閾値よりも長い係合動作が行われてから第２データの取得回数が所定回数に達したか否かを判定する。上述のように、第２データの取得は、係合動作が行われる度に実行される。このため、ここでいう第２データの取得回数は、係合動作の実行回数と同じである。

ステップＳ３００の判定結果が否定的である場合には、処理はステップＳ１０２に進み、今回取得の第２データが学習データとして用いられる（すなわち、本学習の対象とされる）。なお、第２データとともに、今回取得の第１データ及び係合指示タイミングも用いられる。

一方、ステップＳ３００の判定結果が肯定的である場合には、処理はステップＳ１０４に進み、今回取得の第２データが学習データとして用いられない（第３データ除外処理）。なお、第２データとともに、今回取得の第１データ及び係合指示タイミングも学習データとして用いられない。

以上説明した実施の形態３に係る第３データ除外処理によれば、学習データとしての第２データの取得は、クラッチＣの係合時間Ｔ２が閾値よりも長い係合動作と、当該係合動作が行われてから第２データの取得回数が所定回数に達するまでに行われる係合動作とを対象として実行される。そして、第２データの取得回数が上記所定回数に達した後に取得される第２データは、学習データとして用いられない。これにより、学習データの取得が、学習部３０ｂによる学習が集中的に必要な条件に限定される。このため、ＥＣＵ３０の計算負荷を下げつつ、学習データの取得を行えるようになる。

付け加えると、典型的には、係合時間Ｔ２は、車両の１回の走行（１トリップ）中において内燃機関３等の駆動ユニット１０の構成要素の暖機が未完了の状態において長くなり易い。より詳細には、クラッチＣの係合に関係する車両取得パラメータ（例えば、ＡＴＦ温度）は、暖機が完了すると安定する。その結果、第２データへの外乱が減少していく。したがって、第３データ除外処理によれば、学習部３０ｂによる学習が集中的に必要な条件を対象として、学習データの取得を行えるようになる。

４．実施の形態４
実施の形態４に係る機械学習装置は、学習データとしての第２データの取得手法が異なる点を除き、実施の形態１に係る機械学習装置と同じである。また、実施の形態４は、実施の形態２及び３の少なくとも１つと組み合わせて実行されてもよい。

図８は、実施の形態４に係る第２データの取得手法を説明するための図である。図８には、車両１００の加速時の車両前後Ｇの時間波形が表されている。具体的には、車両１００の要求駆動力に基づく車両前後Ｇの推定値の波形と、車両加速度センサによる車両前後Ｇの計測値の波形とが表されている。当該推定値は、公知の手法を用いて取得できる。

本実施形態では、ＥＣＵ３０（データ取得部３０ａ）は、車両前後Ｇの上記推定値を上記計測値から差し引いて得られる車両前後Ｇのデータを、学習部３０ｂによる学習のための第２データ（学習データ）として用いる。なお、図８は、一例として、車両前後Ｇが正の方向に増加する車両加速時を示しているが、車両減速時についても同様である。

以上説明した実施の形態４の第２データの取得手法によれば、車両前後Ｇの変動成分のみを抽出し、学習データとして用いることができる。これにより、車両１００の加減速に起因する車両前後Ｇの変化が学習に反映されないようにすることができ、誤学習を抑制できる。

１第１モータジェネレータ（ＭＧ）
２第２モータジェネレータ（ＭＧ）
３内燃機関
１０駆動ユニット
１２動力分割機構
１８低速用クラッチ（Ｌｏクラッチ）
２０高速用クラッチ（Ｈｉクラッチ）
２４クラッチアクチュエータ
３０電子制御ユニット（ＥＣＵ）
３０ａデータ取得部
３０ｂ学習部
３２センサ類
３４ＧＮＳＳ受信機
１００車両

Claims

車両の動力伝達経路に配置されたクラッチを作動させるアクチュエータへの最適係合指示タイミングを、前記クラッチの係合に関係する１又は複数の車両運転パラメータに応じて設定する機械学習装置であって、
前記クラッチの係合に伴って前記車両に生じるショックの大きさと相関する値を係合評価値と称したとき、前記クラッチの係合が行われる場合に、係合要求時点から係合完了時点までの期間と前記係合完了時点からの所定期間とを含むデータ取得期間における前記１又は複数の車両運転パラメータの第１データと、前記データ取得期間における前記係合評価値の第２データとを、前記アクチュエータへの係合指示タイミングとともに学習データとして取得するデータ取得部と、
前記第１データ及び前記係合指示タイミングを入力とし前記第２データを出力とする機械学習モデルを用いて、前記クラッチの係合が要求された際の前記１又は複数の車両運転パラメータの下で前記係合評価値を改善する係合指示タイミングである前記最適係合指示タイミングを前記学習データに基づいて学習する学習部と、
を備え、
前記データ取得部は、
前記クラッチの係合以外の影響に起因する外乱が含まれる前記第２データを判別するデータ判別処理と、
前記データ判別処理によって前記外乱が含まれると判別された前記第２データを前記学習部による学習の対象から除外する第１データ除外処理と、
を実行する
ことを特徴とする機械学習装置。
前記データ判別処理において、前記データ取得部は、前記車両が不整路を走行する時に取得される前記第２データには前記外乱が含まれると判別する
ことを特徴とする請求項１に記載の機械学習装置。
前記データ判別処理において、前記データ取得部は、前記車両が雪道を走行する時に取得される前記第２データには前記外乱が含まれると判別する
ことを特徴とする請求項１又は２に記載の機械学習装置。
前記車両は、サスペンションのストロークを検出するストロークセンサを含み、
前記データ判別処理において、前記データ取得部は、前記サスペンションのストロークが閾値より大きい場合に取得される前記第２データには前記外乱が含まれると判別する
ことを特徴とする請求項１～３の何れか１つに記載の機械学習装置。
前記車両は、前記車両の周囲を撮像する撮像センサを含み、
前記データ判別処理において、前記データ取得部は、前記撮像センサによって取得される画像に基づいて、前記外乱が含まれる前記第２データを判別する
ことを特徴とする請求項１～４の何れか１つに記載の機械学習装置。
前記車両は、前記車両の位置情報を取得するＧＮＳＳ受信機を含み、
前記データ判別処理において、前記データ取得部は、前記位置情報に基づいて、前記外乱が含まれる前記第２データを判別する
ことを特徴とする請求項１～５の何れか１つに記載の機械学習装置。
前記データ判別処理において、前記データ取得部は、取得した前記第２データの時間波形を正解データの時間波形と比較し、前記正解データの前記時間波形に対する乖離の度合いが閾値より高い時間波形を有する前記第２データには、前記外乱が含まれると判別する
ことを特徴とする請求項１～６の何れか１つに記載の機械学習装置。
前記車両は、アクセルペダルの踏み込み量を検出するアクセルポジションセンサを含み、
前記データ取得部は、前記踏み込み量の変化速度が閾値未満の場合に取得される前記第２データを前記学習部による学習の対象から除外する第２データ除外処理を実行する
ことを特徴とする請求項１～７の何れか１つに記載の機械学習装置。
前記データ取得部は、前記クラッチの係合に要する時間が閾値よりも長い係合動作が行われてから前記第２データの取得回数が所定回数に達した後に取得される前記第２データを前記学習部による学習の対象から除外する第３データ除外処理を実行する
ことを特徴とする請求項１～８の何れか１つに記載の機械学習装置。
前記係合評価値は、前記車両の前後方向の車両加速度である
ことを特徴とする請求項１～９の何れか１つに記載の機械学習装置。
前記車両は、前記前後方向の車両加速度を検出する車両加速度センサを含み、
前記データ取得部は、前記車両の要求駆動力から推定される前記前後方向の車両加速度を、前記車両加速度センサによって計測された前記前後方向の車両加速度から差し引いて得られるデータを、前記学習部による学習のための前記第２データとして用いる
ことを特徴とする請求項１０に記載の機械学習装置。