JP2022173803A - 学習モデルのパラメータの値の授受装置及び授受システム - Google Patents

学習モデルのパラメータの値の授受装置及び授受システム Download PDF

Info

Publication number
JP2022173803A
JP2022173803A JP2021079731A JP2021079731A JP2022173803A JP 2022173803 A JP2022173803 A JP 2022173803A JP 2021079731 A JP2021079731 A JP 2021079731A JP 2021079731 A JP2021079731 A JP 2021079731A JP 2022173803 A JP2022173803 A JP 2022173803A
Authority
JP
Japan
Prior art keywords
vehicle
learning
model
degree
transmitting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021079731A
Other languages
English (en)
Inventor
大樹 横山
Daiki Yokoyama
智洋 金子
Tomohiro Kaneko
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2021079731A priority Critical patent/JP2022173803A/ja
Publication of JP2022173803A publication Critical patent/JP2022173803A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Control Of Vehicle Engines Or Engines For Specific Uses (AREA)

Abstract

【課題】乗り継ぎ後の車両で精度の高い学習モデルを使用することができるようにする。【解決手段】授受装置は、車両2を制御するのに用いられ且つ機械学習による学習が行われる学習モデルを有する車両間で、学習モデルを構成するモデルパラメータの値を授受する。授受装置は、モデルパラメータの値を送信する送信車両2aとモデルパラメータの値を受信する受信車両2bとを特定する車両特定部331と、送信車両の作動に伴って変化する送信車両の作動情報に基づいて学習モデルの学習度を算出する学習度算出部333と、送信条件を満たしたときに送信車両のモデルパラメータの値を受信車両へ送信する送信部337と、を備える。送信条件は、算出された学習度が所定の基準学習度以上であることを含む。【選択図】図7

Description

本発明は、機械学習による学習モデルのパラメータの値の授受装置及び斯かる授受装置を備える授受システムに関する。
或る車両で機械学習された学習モデルのパラメータの値を、他の車両の学習モデルにおいて用いることが知られている(例えば、特許文献1)。特に、特許文献1では、或る車両で機械学習された学習モデルのパラメータの値を、車両の使用環境や使用状況の類似する、学習機能を有さない他の車両に送信し、この他車両にて送信されたパラメータの値を用いて学習モデルを使用することが提案されている。
特開2020-070774号公報
ところで、機械学習可能な第1の車両のユーザが機械学習可能な第2の車両へ乗り継ぐ場合、第2の車両の学習モデルのパラメータの値を、工場出荷時の値等、第1の車両のユーザの使用履歴とは無関係な値に設定する手法と、第1の車両の学習モデルのパラメータの値を使用する手法とが考えられる。第1の車両の学習モデルは、機械学習が進めば第1の車両のユーザに特有のモデルとして最適化されることになることから、第2の車両においても第1の車両の学習モデルのパラメータの値を使用することが好ましい。
ここで、学習モデルの機械学習では、一般に、訓練データを順次替えて学習に関する演算を或る程度繰り返し行うことによって、学習モデルの精度が高くなる。したがって、訓練データの数や学習に関する演算の実行回数が不十分で学習モデルの学習が十分に行われていないと、学習モデルの精度は高くない。このため、第1の車両において学習が十分に行われていない学習モデルのパラメータの値を用いて第2の車両の学習モデルを使用すると、第2の車両においてもこの学習モデルの精度は高くない。したがって、このような場合には、第1の車両によって学習された学習モデルのパラメータの値を用いて、第2の車両にて学習モデルを使用すると、パラメータの値を工場出荷時等の値にしたときよりも学習モデルの精度が低い可能性がある。
本発明は、このような問題点に着目してなされたものであり、車両を乗り継ぐ場合等において、乗り継ぎ後の車両で精度の高い学習モデルを使用することができるようにすることを目的とする。
本発明は、上述した課題を解決するためなされたものであり、その要旨は以下の通りである。
(1)車両を制御するのに用いられ且つ機械学習による学習が行われる学習モデルを有する車両間で、前記学習モデルを構成するモデルパラメータの値を授受する授受装置であって、
前記モデルパラメータの値を送信する送信車両と、前記モデルパラメータの値を受信する受信車両とを特定する車両特定部と、
前記送信車両の作動に伴って変化する前記送信車両の作動情報に基づいて、学習モデルの学習度を算出する学習度算出部と、
送信条件を満たしたときに、前記送信車両の前記モデルパラメータの値を前記受信車両へ送信する又は送信させる送信部と、を備え、
前記送信条件は、算出された前記学習度が所定の基準学習度以上であることを含む、授受装置。
(2)前記送信車両の作動に伴って変化しない前記送信車両の車両情報と、前記受信車両の作動に伴って変化しない前記受信車両の車両情報とに基づいて、前記送信車両と前記受信車両との類似度を算出する類似度算出部を更に備え、
前記送信条件は、算出された前記類似度が所定の基準類似度以上であることを含む、上記(1)に記載の授受装置。
(3)前記送信車両に搭載され且つ前記車両の制御に関連する機器の劣化情報に基づいて、前記機器の劣化度を算出する劣化度算出部を更に備え、
前記送信条件は、算出された前記劣化度が所定の基準劣化度以下であることを含む、上記(1)又は(2)に記載の授受装置。
(4)前記送信部は、前記送信条件を満たさないときは前記モデルパラメータの値を前記受信車両へ送信すること又は送信させることを禁止する、上記(1)乃至(3)のいずれか1つに記載の授受装置。
(5)当該授受装置はサーバである上記(1)乃至(4)のいずれか1つに記載の授受装置。
(6)上記(1)乃至(5)のいずれか1つに記載の授受装置と、該授受装置から送信される前記モデルパラメータの値を受信する受信車両とを備える授受システムであって、
前記受信車両は受信した前記モデルパラメータの値を使用した学習モデルを用いて車両を制御する制御部を備える、授受システム。
本発明によれば、車両を乗り継ぐ場合等において、乗り継ぎ後の車両で精度の高い学習モデルを使用することができるようになる。
図1は、第一実施形態に係る授受システムの概略的な構成図である。 図2は、車両のハードウェア構成を概略的に示す図である。 図3は、車両のプロセッサの機能ブロック図である。 図4は、サーバのハードウェア構成を概略的に示す図である。 図5は、サーバのプロセッサの機能ブロック図である。 図6は、単純な構成を有するNNモデルの一例を示す。 図7は、授受システムによって行われる授受処理の動作シーケンス図である。 図8は、車両同士が直接通信可能である場合に、授受システムによって行われる授受処理の動作シーケンス図である。 図9は、第二実施形態に係る車両のプロセッサ23の機能ブロック図である。 図10は、第二実施形態に係るサーバ3のプロセッサの機能ブロック図である。 図11は、送信車両の学習モデルの学習をサーバの学習部で行う場合の学習処理の動作シーケンス図である。 図12は、第二実施形態に係る授受システムによって行われる授受処理の動作シーケンス図である。
以下、図面を参照して実施形態について詳細に説明する。なお、以下の説明では、同様な構成要素には同一の参照番号を付す。
<第一実施形態>
≪授受装置の構成≫
まず、図1~図7を参照して、第一実施形態に係る学習モデルのモデルパラメータの値の授受システム1について説明する。図1は、第一実施形態に係る授受システム1の概略的な構成図である。授受システム1は、機械学習による学習が行われる学習モデルを有する車両間で、学習モデルを構成するモデルパラメータの値を送受信させる。
図1に示したように、授受システム1は、通信可能な複数の車両2と、サーバ3と、操作端末4とを備える。複数の車両2のそれぞれとサーバ3とは、光通信回線などで構成される通信ネットワーク5と、通信ネットワーク5にゲートウェイ(図示せず)を介して接続される無線基地局6とを介して、相互に通信可能に構成される。車両2と無線基地局6との通信は、任意の通信規格に準拠した通信である。また、操作端末4とサーバ3とは、通信ネットワーク5を介して有線で又は無線により相互に通信可能に構成される。以下の説明では、車両2のうち、授受システム1によりモデルパラメータの値を送信する1つの車両を送信車両2aと称し、送信されたモデルパラメータの値を受信する車両を受信車両2bと称する。なお、送信車両2a及び受信車両2bとサーバ3とは、データの授受を行うときに、サーバ3と有線で接続されてもよい。
図2は、車両2のハードウェア構成を概略的に示す図である。図2に示したように、車両2は、車外通信モジュール11と、複数の制御機器12と、複数のセンサ13と、電子制御ユニット(ECU)20とを備える。車外通信モジュール11、制御機器12及びセンサ13は、CAN(Controller Area Network)等の規格に準拠した車内ネットワーク15を介してECU20に接続される。
車外通信モジュール11は、車外の機器と通信を行う通信部の一例である。車外通信モジュール11は、例えば、データ通信モジュール(DCM(Data communication module))を含む。データ通信モジュールは無線基地局6及び通信ネットワーク5を介してサーバ3と通信する。
制御機器12は、車両2に関する様々な制御を行う機器である。具体的には、制御機器12は、例えば、内燃機関の吸気通路に設けられたスロットル弁の開度を調整するスロットル弁の駆動アクチュエータ、内燃機関の燃焼室に燃料を供給するインジェクタ、内燃機関のEGR率を制御するEGR弁の駆動アクチュエータなどを含む。これら制御機器12は、車内ネットワーク15を介してECUに接続され、ECU20からの駆動信号に応じて作動せしめられる。
センサ13は、車両2に関する様々な状態パラメータの値(状態量)を検出する検出器の一例である。センサ13は、例えば、車両2の周りの空気の温度(外気温度)を検出する外気温度センサ、内燃機関に供給される吸入空気量を検出する空気量センサ、内燃機関のインジェクタからの燃料噴射圧を検出する噴射圧センサ、吸気ガス中に戻される排気ガスの割合であるEGR率を検出するEGRセンサ、排気ガスの温度を検出する排気温度センサなどを含む。これらセンサ13は、車内ネットワーク15を介してECU20に接続され、ECU20へ出力信号を送信する。
ECU20は、センサ13から送信された出力信号に基づいて制御機器12を制御する。ECU20は、車内通信インターフェース21と、メモリ22と、プロセッサ23とを有する。車内通信インターフェース21及びメモリ22は信号線を介してプロセッサ23に接続されている。なお、本実施形態では、車両2には、一つのECU20が設けられているが、機能毎に分かれた複数のECUが設けられていてもよい。
車内通信インターフェース21は、車内ネットワーク15にECU20を接続するためのインターフェース回路を有する。ECU20は車内通信インターフェース21を介して他の車載機器と通信する。
メモリ22は、データを記憶する記憶部の一例である。メモリ22は、例えば、揮発性の半導体メモリ(例えば、RAM)及び不揮発性の半導体メモリ(例えば、ROM)を有する。メモリ22は、プロセッサ23において各種処理を実行するためのコンピュータプログラムや、プロセッサ23によって各種処理が実行されるときに使用される各種データ等を記憶する。したがって、メモリ22は、学習モデルを記憶する。
プロセッサ23は、一つ又は複数のCPU(Central Processing Unit)及びその周辺回路を有す。プロセッサ23は、更にGPU(Graphics Processing Unit)、又は論理演算ユニット若しくは数値演算ユニットのような演算回路を有していてもよい。プロセッサ23は、メモリ22に記憶されたコンピュータプログラムに基づいて、各種処理を実行する。したがって、プロセッサ23は、学習モデルの入力パラメータの値が入力されると、学習モデルに従った演算処理を行って、出力パラメータの値を出力する。
図3は、車両2のプロセッサ23の機能ブロック図である。図3に示したように、プロセッサ23は学習モデルを用いて車両2の制御機器12を制御する制御部231と、学習モデルの学習を行う学習部232と、学習モデルのモデルパラメータの値を含むデータをサーバ3に送信するデータ送信部233と、学習モデルのモデルパラメータの値を含むデータをサーバ3から受信するデータ受信部234と、制御部231において用いられる学習モデルを更新するモデル更新部235と、を備える。また、送信車両2aは、データ受信部234を有していなくともよい。また、受信車両2bはデータ送信部233を有していなくともよい。プロセッサ23が有するこれら機能ブロックは、例えば、プロセッサ23上で動作するコンピュータプログラムにより実現される機能モジュールである。或いは、プロセッサ23が有するこれら機能ブロックは、プロセッサ23に設けられる専用の演算回路であってもよい。車両2のプロセッサ23の各機能ブロックの詳細については後述する。
サーバ3は、車両2の外部に設けられ、通信ネットワーク5及び無線基地局6を介して、特定の地域内の車両2及び操作端末4と通信を行う。或いは、サーバ3は、有線により、車両2と通信を行ってもよい。
図4は、サーバ3のハードウェア構成を概略的に示す図である。サーバ3は、図4に示したように、外部通信モジュール31と、ストレージ装置32と、プロセッサ33とを備える。
外部通信モジュール31は、サーバ3外の機器と通信を行う通信部の一例である。外部通信モジュール31は、サーバ3を通信ネットワーク5に接続するためのインターフェース回路を備える。外部通信モジュール31は、通信ネットワーク5及び無線基地局6を介して、複数の車両2それぞれと通信可能に構成される。或いは、外部通信モジュール31は、有線接続により、車両2と通信可能に構成されてもよい。
ストレージ装置32は、データを記憶する記憶部の一例である。ストレージ装置32は、例えば、ハードディスクドライブ(HDD)、ソリッドステートドライブ(SSD)又は光記録媒体を備える。ストレージ装置32は、プロセッサ33によって各種処理を実行するためのコンピュータプログラムや、プロセッサ33によって各種処理が実行されるときに使用される各種データを記憶する。
プロセッサ33は、一つ又は複数のCPU及びその周辺回路を有する。プロセッサ33は、更にGPU、又は論理演算ユニット若しくは数値演算ユニットのような演算回路を有していてもよい。プロセッサ33は、ストレージ装置32に記憶されたコンピュータプログラムに基づいて、各種処理を実行する。本実施形態では、サーバ3のプロセッサ33が、学習モデルのモデルパラメータの値を授受する装置として機能する。
図5は、サーバ3のプロセッサ33の機能ブロック図である。図5に示したように、プロセッサ33は、学習モデルのモデルパラメータの値を送信する送信車両2aと学習モデルのモデルパラメータの値を受信する受信車両2bとを特定する車両特定部331と、送信車両2a又は受信車両2bからデータを受信するデータ受信部332と、学習モデルの学習度を算出する学習度算出部333と、車両2に搭載され且つ車両2の制御に関連する機器(例えば、排気ガスの目標温度に関連する排気浄化触媒)の劣化度を算出する劣化度算出部334と、送信車両2aのモデルパラメータの値の受信車両2bへの送信条件を満たしているか否かを判定する判定部335と、送信車両2aと受信車両2bとの類似度を算出する類似度算出部336と、送信車両2a又は受信車両2bにデータを送信するデータ送信部337と、を備える。プロセッサ33が有するこれら機能ブロックは、例えば、プロセッサ33上で動作するコンピュータプログラムにより実現される機能モジュールである。或いは、プロセッサ33が有するこれら機能ブロックは、プロセッサ33に設けられる専用の演算回路であってもよい。サーバ3のプロセッサ33の各機能ブロックの詳細については後述する。
操作端末4は、情報を入力するのに用いられる端末である。操作端末4は、通信ネットワーク5を介してサーバ3と通信を行う。操作端末4は、キーボード及びマウスといった入力装置、及び、ディスプレイといった出力装置を有する。
≪学習モデル≫
本実施形態では、車両2aの制御部231において、車両2aに搭載された制御機器12を制御するにあたり、機械学習された学習モデルが用いられる。本実施形態では、学習モデルとして、ニューラルネットワークモデル(以下、「NNモデル」という)が用いられる。以下、図6を参照して、NNモデルの概要について説明する。図6は、単純な構成を有するNNモデルの一例を示す。
図6における丸印は人工ニューロンを表す。人工ニューロンは、通常、ノード又はユニットと称される(本明細書では、「ノード」と称す)。図6において、L=1は入力層を示し、L=2及びL=3は隠れ層(又は中間層)を示し、L=4は出力層を示している。
図6において、x1及びx2は入力層(L=1)の各ノード及びそのノードからの出力値を示しており、yは出力層(L=4)のノード及びその出力値を示している。同様に、z1 (L=2)、z2 (L=2)及びz3 (L=2)は隠れ層(L=2)の各ノード及びそのノードからの出力値を示しており、z1 (L=3)及びz2 (L=3)は隠れ層(L=3)の各ノード及びそのノードからの出力値を示している。
入力層の各ノードでは入力がそのまま出力される。一方、隠れ層(L=2)の各ノードには、入力層の各ノードの出力値x1及びx2が入力され、隠れ層(L=2)の各ノードでは、それぞれ対応する重みw及びバイアスbを用いて総入力値uが算出される。例えば、図6において隠れ層(L=2)のzk (L=2)(k=1、2、3)で示される各ノードにおいて算出される総入力値uk (L=2)は、次式のようになる(Mは入力層のノードの数)。
Figure 2022173803000002
次いで、この総入力値uk (L=2)は活性化関数fにより変換され、隠れ層(L=2)のzk (L=2)で示されるノードから、出力値zk (L=2)(=f(uk (L=2)))として出力される。一方、隠れ層(L=3)の各ノードには、隠れ層(L=2)の各ノードの出力値z1 (L=2)、z2 (L=2)及びz3 (L=2)が入力され、隠れ層(L=3)の各ノードでは、それぞれ対応する重みw及びバイアスbを用いて総入力値u(=Σz・w+b)が算出される。この総入力値uは同様に活性化関数により変換され、隠れ層(L=3)の各ノードから、出力値z1 (L=3)、z2 (L=3)として出力される。活性化関数は例えばReLU関数σである。
また、出力層(L=4)のノードには、隠れ層(L=3)の各ノードの出力値z1 (L=3)及びz2 (L=3)が入力され、出力層のノードでは、それぞれ対応する重みw及びバイアスbを用いて総入力値u(Σz・w+b)が算出され、又はそれぞれ対応する重みwのみを用いて総入力値u(Σz・w)が算出される。例えば、出力層のノードでは活性化関数として恒等関数が用いられる。この場合、出力層のノードにおいて算出された総入力値uが、そのまま出力値yとして出力層のノードから出力される。
このようにNNモデルは、入力層と、隠れ層と、出力層とを備え、一又は複数の入力パラメータが入力層から入力されると、入力パラメータに対応する一又は複数の出力パラメータを出力層から出力する。
本実施形態では、このような学習モデルとして、例えば外気温度、吸入空気量、燃料噴射量、燃料噴射時期、燃料噴射圧、EGR率を、入力パラメータの値として入力すると、排気ガスの温度を出力パラメータの値として出力するモデルが用いられる。車両2の制御部231では、センサ13によって検出された各入力パラメータの値を斯かる学習モデルに入力することによって排気ガスの温度が出力される。制御部231は、出力された排気ガスの温度に基づいて、内燃機関に関する制御機器12を制御する。ここで、排気ガスの温度を検出する排気温度センサには応答遅れがあるため、排気温度センサの出力に基づいて内燃機関の制御を行うと内燃機関を必ずしも適切に制御することができなかった。これに対して、学習モデルを用いた排気ガスの温度の算出には遅れが生じないため、学習モデルによって算出された排気ガスの温度を用いて内燃機関を制御することにより、内燃機関をより適切に制御することができる。
≪学習モデルの基本的な学習≫
次に、上述したような学習モデル(NNモデル)の機械学習について説明する。斯かるNNモデルの精度を向上させるためには、NNモデルの機械学習を行う必要がある。そこで、本実施形態では、車両2の学習部232がNNモデルの機械学習を行う。まず、学習部232において行われる、NNモデルの学習手法を簡単に説明する。
NNモデルの機械学習では、車両2に設けられたセンサ13によって検出された状態パラメータの値を含む訓練データセットが用いられる。訓練データセットは、複数の入力パラメータの複数の実測値と、これら実測値に対応する少なくとも一つの出力パラメータの複数の実測値(正解データ)との組合せから成る。本実施形態では、入力パラメータの実測値及び出力パラメータの実測値は、車両2のセンサ13によって検出された値又はECU20から制御機器12への制御指令値である。
車両2の学習部232は、作成された訓練データセットに前処理(正規化、標準化等)を行った上で、NNモデルの機械学習を行う。NNモデルの機械学習にあたっては、学習部232は、例えば、NNモデルの出力値と訓練データセットに含まれる出力パラメータの実測値との差が小さくなるように、公知の誤差逆伝搬法によってNNモデルにおける重みw及びバイアスbを繰り返し更新する。この結果、NNモデルが学習され、学習済みのNNモデルが生成される。学習済みNNモデルのモデルパラメータ(重みw、バイアスb等)の値は、車両2のメモリ22に記憶され、制御部231における制御はメモリ22に記憶された学習済のNNモデルによって行われる。
≪モデルパラメータの値の授受手法≫
ところで、上述したように学習モデルは、その車両2のユーザの使用状況に応じて変化する。例えば、上述したような排気ガスの温度を算出する学習モデルは、車両2が使用される環境(高度、気温、湿度、など)や、ユーザによる車両2の使用態様(加減速の強さ、一回当たりの走行距離、など)に応じて変化する。したがって、各車両2に用いられる学習モデルのモデルパラメータの値は、その車両2のユーザの使用状況に最適化された値になる。
一方、車両2の出荷時には、学習モデルのモデルパラメータの値は、多くのユーザにとって或る程度適した値になってはいるが、各ユーザに最適化された値にはなっていない。また、車両2が或るユーザによって使用されていた場合にも、学習モデルのモデルパラメータの値はこの或るユーザにとって最適化された値にはなっているものの、他のユーザにとって最適化された値にはなっていない。このため、例えば、ユーザがこれまで使用していた第1の車両から、第2の車両(新車、中古車のいずれをも含む)へ乗り継ぐ場合には、そのユーザにとって最適化されている第1の車両の学習モデルのモデルパラメータの値を第2の車両の学習モデルでも用いることが考えられる。これにより、第2の車両は、乗り継ぎ直後から、ユーザに適したモデルパラメータの値を有する学習モデルを用いた制御を行うことができるようになる。そこで、本実施形態に係る授受システム1は、送信車両2a(第1の車両)の学習モデルのモデルパラメータの値を、受信車両2b(第2の車両)に送信する。
図7は、授受システム1によって行われる授受処理の動作シーケンス図である。図7に示した授受処理は、送信車両2aにおいて学習された学習モデルのモデルパラメータの値を、受信車両2bに送信して、受信車両2bで利用させるのに用いられる。
図7に示したように、まず、サーバ3の車両特定部331は、送信車両2aおよび受信車両2bを特定する(ステップS11)。具体的には、操作端末4にてユーザにより送信車両2aの車両特定情報(例えば、車両毎に割り当てられたID)及び受信車両2bの車両特定情報が入力されると、操作端末4はこれら車両特定情報を通信ネットワーク5経由でサーバ3に送信する。車両特定部331は、このようにして受信した車両特定情報に基づいて、送信車両2aと受信車両2bとを特定する。
送信車両2a及び受信車両2bが特定されると、サーバ3のデータ送信部337は、送信車両2aの作動情報及び車両情報並びに学習モデルのモデルパラメータの値を要求する要求信号を、通信ネットワーク5を介して送信車両2aへ送信する(ステップS12)。車両2の作動情報とは、車両2の作動に伴って変化する情報であり、例えば、センサ13によって検出される状態パラメータの値の履歴、制御機器12への制御指令値の履歴、車両2の走行距離、学習モデルの学習に用いられたデータ量、学習モデルの学習回数、送信車両2aに搭載された機器の劣化情報などが含まれる。一方、車両2の車両情報は、車両2の作動に伴って変化しない情報であり、例えば、車種、内燃機関の型式、学習モデルの構成(例えば、出荷後には変更されないハイパーパラメータなど)、搭載している制御機器12及びセンサ13の種類などが含まれる。
送信車両2aのデータ受信部234が要求信号を受信すると、送信車両2aのデータ送信部233は、要求された情報を、通信ネットワーク5を介してサーバ3へ送信する(ステップS13)。送信車両2aのメモリ22には、過去の一定期間の状態パラメータの値の履歴や制御指令値の履歴などが記憶されており、データ送信部233はこれらデータを送信車両2aの作動情報としてサーバ3に送信する。また、送信車両2aの車種、内燃機関の型式、学習モデルの構成、並びに制御機器12及びセンサ13の種類などは出荷時にメモリ22に記憶されており、データ送信部233はこれらデータを送信車両2aの車両情報としてサーバ3に送信する。加えて、データ送信部233は、制御部231において用いられている学習モデルのモデルパラメータの値を送信する。
サーバ3のデータ受信部332が送信車両2aから情報を受信すると、サーバ3の学習度算出部333は送信車両2aにおける学習モデルの学習度を算出すると共に、サーバ3の劣化度算出部334は送信車両2aに搭載されて車両制御に関連する機器の劣化度を算出する(ステップS14)。
学習度算出部333は、ステップS13において送信車両2aから送信された送信車両2aの作動情報に基づいて学習モデルの学習度を算出する。学習度算出部333は、例えば、過去の或る期間において学習モデルから出力された出力パラメータの値(例えば、排気ガス温度の推定値)と、この期間にセンサ13によって検出されたこの出力パラメータに相当するパラメータとの値(例えば、排気ガス温度の検出値)との差に基づいて学習度を算出する。この場合、学習度算出部333は、差の平均値が大きいほど学習度が低いものとして学習度を算出する。
または、学習度算出部333は、送信車両2aの走行距離に基づいて学習度を算出してもよい。一般に、送信車両2aの走行距離が長くなれば、それに伴っての学習モデルの学習に用いられる学習データが増えると共に、学習モデルの学習回数も増える。したがって、学習度算出部333は、送信車両2aの走行距離が長くなるほど学習度が高くなるものとして学習度を算出する。
或いは、学習度算出部333は、学習モデルの学習に用いた学習データのデータ量、又は学習モデルの学習回数に基づいて学習度を算出してもよい。この場合、学習度算出部333は、学習に用いた学習データのデータ量が増えるほど、また、学習モデルの学習回数が増えるほど、学習度が高くなるものとして学習度を算出する。
また、劣化度算出部334は、送信車両2aの機器の劣化情報に基づいて、機器の劣化度を算出する。機器の劣化情報は、例えば、送信車両2aの走行距離や使用期間を含み、劣化度算出部334は、送信車両2aの走行距離が長いほど機器の劣化度が高いものとして機器の劣化度を算出し、送信車両2aの使用期間が長いほど機器の劣化度が高いものとして機器の劣化度を算出する。また、例えば、機器が内燃機関の排気通路に設けられる排気浄化触媒である場合には、劣化度算出部334はセンサ13によって検出された排気浄化触媒の温度の履歴に基づいて触媒の劣化度を算出する。
学習度及び劣化度が算出されると、判定部335は、ステップS14で算出された学習モデルの学習度が基準学習度以上であるか否か、及びステップS14で算出された機器の劣化度が基準劣化度以下であるか否かを判定する(ステップS15)。基準学習度は、これよりも学習度が低くなると、受信車両2bの出荷時の学習モデルよりも学習精度が低くなるような学習度であり、予め定められている。また、基準劣化度は、これによりも機器の劣化度が高いと、送信車両2aと受信車両2bとの間で劣化度の差が大きすぎて送信車両2aの学習モデルのモデルパラメータを受信車両2bで用いると、受信車両2bの出荷時の学習モデルよりも学習精度が低くなるような劣化度であり、予め定められている。ステップS15において、学習モデルの学習度が基準学習度よりも低いと判定された場合、又は機器の劣化度が基準劣化度よりも高いと判定された場合には、受信車両2bへのモデルパラメータの値の送信は禁止され、以下のステップS16以降の処理は行われない。
ステップS15において学習モデルの学習度が基準学習度以上であり且つ機器の劣化度が基準劣化度以下であると判定された場合には、サーバ3のデータ送信部337は、受信車両2bの車両情報を要求する要求信号を、通信ネットワーク5を介して受信車両2bへ送信する(ステップS16)。受信車両2bのデータ受信部234が要求信号を受信すると、受信車両2bのデータ送信部233は、要求された車両情報を、通信ネットワーク5を介してサーバ3へ送信する(ステップS17)。
サーバ3のデータ受信部332が受信車両2bから車両情報を受信すると、サーバ3の類似度算出部336が、送信車両2aの車両情報と受信車両2bの車両情報とに基づいて、送信車両2aと受信車両2bとの類似度を算出する(ステップS18)。類似度算出部336は、例えば、送信車両2aの車種と受信車両2bの車種とが同一である場合には類似度を高いものとして算出し、送信車両2aの内燃機関の型式と受信車両2bの内燃機関の型式とが同一である場合には類似度を高いものとして算出する。また、類似度算出部336は、例えば、送信車両2aの学習モデルの構成と受信車両2bの学習モデルの構成とが同一である場合には類似度を高いものとして算出し、送信車両2aの制御機器12及びセンサ13の種類と受信車両2bの制御機器12及びセンサ13の種類とが同一である場合には類似度を高いものとして算出する。
類似度が算出されると、判定部335は、ステップS18で算出された類似度が基準類似度以上であるか否かを判定する(ステップS19)。基準類似度は、これによりも車両間の類似度が低いと、送信車両2aと受信車両2bとの間で構成が違い過ぎて送信車両2aの学習モデルのモデルパラメータを受信車両2bで用いると、受信車両2bの出荷時の学習モデルよりも学習精度が低くなるような類似度であり、予め定められている。ステップS19において、類似度が基準類似度よりも低いと判定された場合には、受信車両2bへのモデルパラメータの値の送信は禁止され、以下のステップS20以降の処理は行われない。
ステップS19において類似度が基準類似度以上であると判定された場合には、サーバ3のデータ送信部337は、ステップS13において送信車両2aから受信した学習モデルのモデルパラメータの値を受信車両2bへ送信する(ステップS20)。
受信車両2bのデータ受信部234がモデルパラメータの値を受信すると、受信車両2bのモデル更新部235は、受信車両2bの学習モデルのモデルパラメータの値を、受信した値に更新する(ステップS21)。モデル更新部235は、送信車両2aの学習モデルの構成と受信車両2bの学習モデルの構成とが一致している場合には、受信車両2bの学習モデルの全てのモデルパラメータの値を、受信した値に置き換えてもよいし、一部を除いて(例えば、出力層又は出力層に近い隠れ層を除いて)受信車両2bの学習モデルのモデルパラメータの値を、受信した値に置き換えてもよい。また、モデル更新部235は、送信車両2aの学習モデルの構成と受信車両2bの学習モデルの構成とが一致していない場合であっても、同様な構成を有する部分については受信車両2bの学習モデルのモデルパラメータの値を、受信した値に置き換える。具体的には、例えば、受信車両2bの学習モデルが送信車両2aの学習モデルに比べて最終隠れ層を一層多く有する場合には、受信車両2bの学習モデルの最終隠れ層を除いた全ての層についてモデルパラメータの値が受信した値に置き換えられる。この結果、受信車両2bの制御部231は、受信したモデルパラメータの値を使用した学習モデルを用いて受信車両2bを制御することになる。
以上より、本実施形態では、サーバ3のデータ送信部337は、送信条件を満たしたときに送信車両2aのモデルパラメータの値を受信車両2bへ送信する。本実施形態では、送信条件は、学習度算出部333によって算出された学習度が所定の基準学習度以上であること、類似度算出部336によって算出された類似度が所定の基準類似度以上であること、及び劣化度算出部334によって算出された劣化度が所定の基準劣化度以下であることを含む。なお、送信条件は、学習度が所定の基準学習度以上であることを含んでいれば、他の条件の一部又は全てを含んでいなくてもよい。一方、データ送信部337は、送信条件を満たさないときにはモデルパラメータの値を受信車両へ送信することを禁止する。
本実施形態によれば、学習度が基準学習度以上である場合にのみ、受信車両2bは送信車両2aの学習モデルのモデルパラメータの値を利用することになる。この結果、受信車両2bの制御部231は、高い精度の学習モデルを用いて受信車両2bを制御することができるようになる。さらに、本実施形態によれば、類似度が基準類似度以上である場合、及び劣化度が基準劣化度以下である場合に、受信車両2bは送信車両2aの学習モデルのモデルパラメータの値を利用することになる。このことによっても、受信車両2bの制御部231は、高い精度の学習モデルを用いて受信車両2bを制御することができるようになる。
≪変形例≫
なお、上記実施形態は、送信車両2aと受信車両2bとが直接通信せずに、サーバ3を介して通信する場合を示している。しかしながら、送信車両2aは、通信ネットワーク5を介して又は有線により、サーバ3を介さずに受信車両2bと直接通信可能であってもよい。
図8は、車両同士が直接通信可能である場合に、授受システム1によって行われる授受処理の動作シーケンス図である。以下では、図7に示した授受処理とは異なる部分について説明する。
図8に示した授受処理でも、図7に示した授受処理と同様に、ステップS12において、サーバ3のデータ送信部337は、送信車両2aへ要求信号を送信する。このとき、要求信号は、送信車両2aの作動情報及び車両情報を要求するものであり、送信車両2aの学習モデルのモデルパラメータの値は要求するものではない。したがって、送信車両2aのデータ送信部233は、ステップS13において、送信車両2aの作動情報及び車両情報をサーバ3へ送信する。
また、図8に示した授受処理では、ステップS19において類似度が基準類似度以上であると判断された場合には、サーバ3のデータ送信部337は、送信車両2aの学習モデルのモデルパラメータの値を受信車両2bへ送信させる送信指令を、送信車両2aへ送信する(ステップS22)。送信指令を受信した送信車両2aは、送信車両2aの学習モデルのモデルパラメータの値を、通信ネットワーク5又は相互の有線接続を介して、受信車両2bへ送信する(ステップS23)。そして、受信車両2bのモデル更新部235は、受信車両2bの学習モデルのモデルパラメータの値を、受信した値に更新する(ステップS21)。
以上より、本変形例では、サーバ3のデータ送信部337は、送信条件を満たしたときに送信車両2aのモデルパラメータの値を送信車両2aから受信車両2bへ送信させる。また、データ送信部337は、送信条件を満たさないときにはモデルパラメータの値を送信車両2aから受信車両2bへ送信させることを禁止する。
<第二実施形態>
次に、図9~図12を参照して、第二実施形態に係る授受システム1について説明する。以下では、第一実施形態に係る授受システムとは異なる部分を中心に説明する。
図9は、第二実施形態に係る車両2のプロセッサ23の機能ブロック図である。また、図10は、第二実施形態に係るサーバ3のプロセッサ33の機能ブロック図である。本実施形態では、車両2における学習モデルの学習が、車両2ではなく、サーバ3で行われる。したがって、図9に示したように、車両2のプロセッサ23は、学習部を有さないと共に、サーバ3のプロセッサ33が学習部338を有する。
図11は、送信車両2aの学習モデルの学習をサーバ3の学習部338で行う場合の学習処理の動作シーケンス図である。図11に示したように、送信車両2aのプロセッサ23は、学習モデルの学習に用いられる学習用データを一定期間に亘ってメモリ22に記憶させる(ステップS31)。学習モデルの学習に用いられるデータは、センサ13によって検出される状態パラメータの値の履歴、制御機器12への制御指令値の履歴などが含まれる。また、その他にも、プロセッサ23は、送信車両2aの、学習用データに含まれない作動情報をメモリ22に記憶させる。
送信車両2aのデータ送信部233は、一定量の学習用データ及びその他の作動情報がメモリ22に記憶されると、メモリ22に記憶されている学習用データ及び作動情報を、通信ネットワーク5を介して、サーバ3へ送信する(ステップS32)。
サーバ3の学習部338では、過去に送信車両2aの学習モデルの学習が行われている。したがって、サーバ3のストレージ装置32には、過去に行われた学習後の学習モデルのモデルパラメータの値、すなわち送信車両2aの学習モデルの現在のモデルパラメータの値が記憶されている。サーバ3の学習部338は、ストレージ装置32に記憶されている現在のモデルパラメータの値と、ステップS32において送信車両2aから送信された学習用データとに基づいて、第一実施形態に係る車両2の学習部232と同様に、送信車両2aの学習モデルの学習を行う。
学習部338での学習が完了すると、サーバ3のデータ送信部337は、ステップS33において学習された学習モデルのモデルパラメータの値を、通信ネットワーク5を介して、送信車両2aに送信する(ステップS34)。送信車両2aのデータ受信部234がモデルパラメータの値を受信すると、送信車両2aのモデル更新部235は、送信車両2aの学習モデルのモデルパラメータの値を受信した値に更新する(ステップS35)。
このように、本実施形態では、送信車両2aは、学習用データを含む作動情報を定期的にサーバ3に送信しているため、サーバ3のストレージ装置32には送信車両2aの作動情報が記憶されている。また、送信車両2aの学習モデルの学習がサーバ3で行われるため、サーバ3のストレージ装置32にはこの学習モデルの現在のモデルパラメータの値が記憶されている。加えて、本実施形態では、サーバ3の学習部338で学習モデルの学習が行われる車両2については、サーバ3のストレージ装置32にその車両2の車両情報が記憶されている。したがって、サーバ3は、受信車両2bに学習モデルのモデルパラメータの値を送信するときに、送信車両2aから作動情報、車両情報及びモデルパラメータの値を受信する必要がない。
図12は、第二実施形態に係る授受システム1によって行われる授受処理の動作シーケンス図である。以下では、図7に示した第一実施形態に係る授受システム1によって行われる授受処理と異なる点について説明する。
図12からわかるように、第二実施形態に係る授受処理では、サーバ3から送信車両2aの要求信号の送信(ステップS12)が行われず、また、送信車両2aからサーバ3への要求された情報の送信(ステップS13)が行われない。したがって、ステップS11において送信車両2a及び受信車両2bが特定されると、サーバ3の学習度算出部333及び劣化度算出部334は、ストレージ装置32に記憶されている送信車両2aの動作情報に基づいて、送信車両2aの学習モデルの学習度及び送信車両2aの機器の劣化度を算出する(ステップS14)。
その後、ステップS15において学習モデルの学習度が基準学習度以上であり且つ機器の劣化度が基準劣化度以下であると判定された場合には、サーバ3のデータ送信部337は、受信車両2bの車両情報を要求する要求信号を受信車両2bへ送信し(ステップS16)、要求信号を受信した受信車両2bのデータ送信部233は、要求された車両情報をサーバ3へ送信する(ステップS17)。なお、サーバ3のストレージ装置32に受信車両2bの車両情報も記憶されている場合には、ステップS16及びS17は行われなくてもよい。
その後、ステップS19において類似度が基準類似度以上であると判定された場合には、サーバ3のデータ送信部337は、ストレージ装置32に記憶されていた送信車両2aの学習モデルのモデルパラメータの値を受信車両2bへ送信する(ステップS20)。
以上、本発明に係る好適な実施形態を説明したが、本発明はこれら実施形態に限定されるものではなく、特許請求の範囲の記載内で様々な修正及び変更を施すことができる。
1 授受システム
2 車両
3 サーバ
20 ECU
22 メモリ
23 プロセッサ
32 ストレージ装置
33 プロセッサ

Claims (6)

  1. 車両を制御するのに用いられ且つ機械学習による学習が行われる学習モデルを有する車両間で、前記学習モデルを構成するモデルパラメータの値を授受する授受装置であって、
    前記モデルパラメータの値を送信する送信車両と、前記モデルパラメータの値を受信する受信車両とを特定する車両特定部と、
    前記送信車両の作動に伴って変化する前記送信車両の作動情報に基づいて、学習モデルの学習度を算出する学習度算出部と、
    送信条件を満たしたときに、前記送信車両の前記モデルパラメータの値を前記受信車両へ送信する又は送信させる送信部と、を備え、
    前記送信条件は、算出された前記学習度が所定の基準学習度以上であることを含む、授受装置。
  2. 前記送信車両の作動に伴って変化しない前記送信車両の車両情報と、前記受信車両の作動に伴って変化しない前記受信車両の車両情報とに基づいて、前記送信車両と前記受信車両との類似度を算出する類似度算出部を更に備え、
    前記送信条件は、算出された前記類似度が所定の基準類似度以上であることを含む、請求項1に記載の授受装置。
  3. 前記送信車両に搭載され且つ前記車両の制御に関連する機器の劣化情報に基づいて、前記機器の劣化度を算出する劣化度算出部を更に備え、
    前記送信条件は、算出された前記劣化度が所定の基準劣化度以下であることを含む、請求項1又は2に記載の授受装置。
  4. 前記送信部は、前記送信条件を満たさないときは前記モデルパラメータの値を前記受信車両へ送信すること又は送信させることを禁止する、請求項1乃至3のいずれか1項に記載の授受装置。
  5. 当該授受装置はサーバである、請求項1乃至4のいずれか1項に記載の授受装置。
  6. 請求項1乃至5のいずれか1項に記載の授受装置と、該授受装置から送信される前記モデルパラメータの値を受信する受信車両とを備える授受システムであって、
    前記受信車両は受信した前記モデルパラメータの値を使用した学習モデルを用いて車両を制御する制御部を備える、授受システム。
JP2021079731A 2021-05-10 2021-05-10 学習モデルのパラメータの値の授受装置及び授受システム Pending JP2022173803A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021079731A JP2022173803A (ja) 2021-05-10 2021-05-10 学習モデルのパラメータの値の授受装置及び授受システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021079731A JP2022173803A (ja) 2021-05-10 2021-05-10 学習モデルのパラメータの値の授受装置及び授受システム

Publications (1)

Publication Number Publication Date
JP2022173803A true JP2022173803A (ja) 2022-11-22

Family

ID=84144101

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021079731A Pending JP2022173803A (ja) 2021-05-10 2021-05-10 学習モデルのパラメータの値の授受装置及び授受システム

Country Status (1)

Country Link
JP (1) JP2022173803A (ja)

Similar Documents

Publication Publication Date Title
CN113830097B (zh) 车辆、模型学习系统以及服务器
JP7279445B2 (ja) 予測方法、予測プログラムおよび情報処理装置
US20220194394A1 (en) Machine learning device and machine learning system
US11820398B2 (en) Learning apparatus and model learning system
US11675999B2 (en) Machine learning device
JP7040589B1 (ja) 機械学習方法及び機械学習システム
JP6939963B1 (ja) モデル学習システム及びサーバ
WO2020054345A1 (ja) 電子制御装置、ニューラルネットワーク更新システム
JP6791347B1 (ja) モデル診断装置及びモデル診断システム
Zhao et al. Adaptive swarm intelligent offloading based on digital twin-assisted prediction in VEC
JP2022173803A (ja) 学習モデルのパラメータの値の授受装置及び授受システム
CN115496177A (zh) 分布式系统的校准
JP6962435B1 (ja) 機械学習装置
JP2022035222A (ja) 機械学習装置
JP2022076257A (ja) 機械学習システム、車両及びサーバ
US20220292350A1 (en) Model updating apparatus, model updating method, and model updating program
JP7276298B2 (ja) モデル学習システム、車両の制御装置及びモデル学習方法
JP2022079938A (ja) 機械学習システム
US20230408997A1 (en) Lifted predictive modeling and control for digital twin system optimization