JP2022036586A

JP2022036586A - モデル学習システム及びサーバ

Info

Publication number: JP2022036586A
Application number: JP2020140878A
Authority: JP
Inventors: 大樹横山; Daiki Yokoyama; 亮中林; Akira Nakabayashi
Original assignee: Toyota Motor Corp
Current assignee: Toyota Motor Corp
Priority date: 2020-08-24
Filing date: 2020-08-24
Publication date: 2022-03-08
Anticipated expiration: 2040-08-24
Also published as: CN114091681A; US20220058522A1; DE102021118606A1; JP6939963B1

Abstract

【課題】車両で使用される学習モデルの再学習を、車両の使用地域の特性の変化にあわせた適切なタイミングで行わせる。【解決手段】デル学習システムは、サーバと、複数の車両と、を備える。サーバは、複数の車両のうちの一の車両において使用される学習モデルであって所定領域内で取得された訓練データセットに基づいて学習が行われる学習モデルの学習前後の相違度合いを表すモデル間差分値が所定値以上であったときは、所定領域内に存在する複数の車両のうちの他の車両に対して、他の車両において使用される学習モデルの再学習を指示する。【選択図】図１

Description

本発明はモデル学習システム及びサーバに関する。

特許文献１には、サーバや車両で学習を行った学習モデルを用いて、内燃機関の排気浄化触媒の温度を推定するものが開示されている。

特開２０１９－１８３６９８号公報

通常、各車両が使用される地域は或る程度限定され、例えば自家用車であれば、基本的に各自家用車の所有者の生活圏内において使用され、タクシーやバスなどの商用車であれば、基本的に各商用車を所有する事業者のサービス提供地域内において使用される。したがって、各車両で使用される学習モデルを学習させる際には、各車両が使用される使用地域の特性（例えば地形や交通状況等）にあわせた訓練データセットを用いて学習を行うことで、各車両の使用地域の特性にあわせた精度の高い学習モデルを生成することができる。

しかしながら、使用地域の特性は、例えば地形の変化や道路の増設、街の再開発等によって時間の経過と共に変化することが考えられる。そのため、各車両で使用される学習モデルの精度を維持するためには、使用地域の特性の変化にあわせた適切なタイミングで学習モデルの再学習を行うことが必要になる。

しかしながら、従来においては、使用地域の特性の変化にあわせた適切なタイミングで学習モデルの再学習を行わせることできていなかった。

本発明はこのような問題点に着目してなされたものであり、車両で使用される学習モデルの再学習を、使用地域の特性の変化にあわせた適切なタイミングで行わせることを目的とする。

上記課題を解決するために、本発明のある態様によるモデル学習システムは、サーバと、当該サーバと通信可能に構成された複数の車両と、を備える。サーバは、複数の車両のうちの一の車両において使用される学習モデルであって所定領域内で取得された訓練データセットに基づいて学習が行われる学習モデルの学習前後の相違度合いを表すモデル間差分値が所定値以上であったときは、所定領域内に存在する複数の車両のうちの他の車両に対して、他の車両において使用される学習モデルの再学習を指示するように構成される。

また、本発明のある態様によるサーバは、複数の車両と通信可能に構成されると共に、複数の車両のうちの一の車両において使用される学習モデルであって所定領域内で取得された訓練データセットに基づいて学習が行われる学習モデルの学習前後の相違度合いを表すモデル間差分値が所定値以上であったときは、所定領域内に存在する複数の車両のうちの他の車両に対して、他の車両において使用される学習モデルの再学習を指示するように構成される。

本発明のこれらの態様によれば、各車両で使用される学習モデルの再学習を、使用地域の特性の変化にあわせた適切なタイミングで行わせることができる。

図１は、本発明の一実施形態によるモデル学習システムの概略構成図である。図２は、本発明の一実施形態による車両のハードウェア構成を示す概略図である。図３は、ニューラルネットワークモデルの一例を示す図である。図４は、本発明の一実施形態によるモデル学習システムにおいて、サーバと、複数の車両のうちの一の車両と、の間で実行される処理の一例を示すフローチャートである。図５は、本発明の一実施形態によるモデル学習システムにおいて、サーバと、複数の車両のうちの他の車両と、の間で実行される処理の一例を示すフローチャートである。

以下、図面を参照して本発明の一実施形態について詳細に説明する。なお、以下の説明では、同様な構成要素には同一の参照番号を付す。

図１は、本発明の一実施形態によるモデル学習システム１００の概略構成図である。

図１に示すように、モデル学習システム１００は、サーバ１と、複数の車両２と、を備える。

サーバ１は、サーバ通信部１１と、サーバ記憶部１２と、サーバ処理部１３と、を備える。

サーバ通信部１１は、サーバ１を例えばゲートウェイ等を介してネットワーク３と接続するための通信インターフェース回路を有し、各車両２との間で相互に通信することができるように構成される。

サーバ記憶部１２は、ＨＤＤ（Hard Disk Drive）や光記録媒体、半導体メモリ等の記憶媒体を有し、サーバ処理部１３での処理に用いられる各種のコンピュータプログラムやデータ等を記憶する。

サーバ処理部１３は、一又は複数個のプロセッサ及びその周辺回路を有する。サーバ処理部１３は、サーバ記憶部１２に格納された各種のコンピュータプログラムを実行し、サーバ１の全体的な動作を統括的に制御するものであり、例えばＣＰＵ（Central Processing Unit）である。

図２は、車両２のハードウェア構成を示す概略図である。

車両２は、電子制御ユニット２０と、車外通信装置２４と、例えば内燃機関や電動機、アクチュエータ等の各種の制御部品２５と、各種の制御部品２５を制御するために必要な各種のセンサ類２６と、を備える。電子制御ユニット２０、車外通信装置２４、及び各種の制御部品２５やセンサ類２６は、ＣＡＮ（Controller Area Network）等の規格に準拠した車内ネットワーク２７を介して互いに接続される。

電子制御ユニット２０は、車内通信インターフェース２１、車両記憶部２２及び車両処理部２３、を備える。車内通信インターフェース２１、車両記憶部２２及び車両処理部２３、信号線を介して互いに接続されている。

車内通信インターフェース２１は、ＣＡＮ（Controller Area Network）等の規格に準拠した車内ネットワーク２７に電子制御ユニット２０を接続するための通信インターフェース回路である。

車両記憶部２２は、ＨＤＤ（Hard Disk Drive）や光記録媒体、半導体メモリ等の記憶媒体を有し、車両処理部２３での処理に用いられる各種のコンピュータプログラムやデータ等を記憶する。

車両処理部２３は、一又は複数個のプロセッサ及びその周辺回路を有する。車両処理部２３は、車両記憶部２２に格納された各種のコンピュータプログラムを実行し、車両２に搭載された各種の制御部品を統括的に制御するものであり、例えばＣＰＵである。

車外通信装置２４は、無線通信機能を有する車載の端末である。車外通信装置２４は、ネットワーク３（図１参照）と不図示のゲートウェイ等を介して接続される無線基地局４（図１参照）にアクセスすることで、無線基地局４を介してネットワーク３と接続される。これにより、サーバ１との間で相互に通信が行われる。

各車両２では、各車両２に搭載された各種の制御部品２５を制御するにあたり、例えば機械学習などの学習を実施した学習モデル（人工知能モデル）が必要に応じて使用されている。本実施形態では、学習モデルとして、ディープニューラルネットワーク（ＤＮＮ；Deep Neural Network）や畳み込みニューラルネットワーク（ＣＮＮ；Convolutional Neural Network）などを用いたニューラルネットワークモデル（以下「ＮＮモデル」という。）を使用し、当該ＮＮモデルに対して深層学習を実施している。したがって、本実施形態による学習モデルは、深層学習を実施した学習済みのＮＮモデルということもできる。深層学習は、人工知能（ＡＩ；Artificial Intelligence）を代表する機械学習手法の一つである。

図３は、ＮＮモデルの一例を示す図である。

図３における丸印は人工ニューロンを表す。人工ニューロンは、通常、ノード又はユニットと称される（本明細書では、「ノード」と称す）。図３において、Ｌ＝１は入力層を示し、Ｌ＝２及びＬ＝３は隠れ層を示し、Ｌ＝４は出力層を示している。隠れ層は、中間層とも称される。なお、図３には、隠れ層が２層のＮＮモデルを例示しているが、隠れ層の層数は特に限られるものではなく、また、入力層、隠れ層及び出力層の各層のノードの数も特に限られるものではない。

図３において、ｘ_１及びｘ_２は入力層（Ｌ＝１）の各ノード及びそのノードからの出力値を示しており、ｙは出力層（Ｌ＝４）のノード及びその出力値を示している。同様に、ｚ_１ ^{（Ｌ＝２）} _、ｚ_２ ^{（Ｌ＝２）}及びｚ_３ ^{（Ｌ＝２）}は隠れ層（Ｌ＝２）の各ノード及びそのノードからの出力値を示しており、ｚ_１ ^{（Ｌ＝３）}及びｚ_２ ^{（Ｌ＝３）}は隠れ層（Ｌ＝３）の各ノード及びそのノードからの出力値を示している。

入力層の各ノードでは入力がそのまま出力される。一方、隠れ層（Ｌ＝２）の各ノードには、入力層の各ノードの出力値ｘ_１及びｘ_２が入力され、隠れ層（Ｌ＝２）の各ノードでは、それぞれ対応する重みｗ及びバイアスｂを用いて総入力値ｕが算出される。例えば、図３において隠れ層（Ｌ＝２）のｚ_ｋ ^{（Ｌ＝２）}（ｋ＝１、２、３）で示される各ノードにおいて算出される総入力値ｕ_ｋ ^{（Ｌ＝２）}は、次式のようになる（Ｍは入力層のノードの数）。

次いで、この総入力値ｕ_ｋ ^{（Ｌ＝２）}は活性化関数ｆにより変換され、隠れ層（Ｌ＝２）のｚ_ｋ ^{（Ｌ＝２）}で示されるノードから、出力値ｚ_ｋ ^{（Ｌ＝２）}（＝ｆ（ｕ_ｋ ^{（Ｌ＝２）}））として出力される。一方、隠れ層（Ｌ＝３）の各ノードには、隠れ層（Ｌ＝２）の各ノードの出力値ｚ_１ ^{（Ｌ＝２）} _、ｚ_２ ^{（Ｌ＝２）}及びｚ_３ ^{（Ｌ＝２）}が入力され、隠れ層（Ｌ＝３）の各ノードでは、それぞれ対応する重みｗ及びバイアスｂを用いて総入力値ｕ（＝Σｚ・ｗ＋ｂ）が算出される。この総入力値ｕは同様に活性化関数により変換され、隠れ層（Ｌ＝３）の各ノードから、出力値ｚ_１ ^{（Ｌ＝３）}、ｚ_２ ^{（Ｌ＝３）}として出力される。活性化関数は例えばシグモイド関数σである。

また、出力層（Ｌ＝４）のノードには、隠れ層（Ｌ＝３）の各ノードの出力値ｚ_１ ^{（Ｌ＝３）}及びｚ_２ ^{（Ｌ＝３）}が入力され、出力層のノードでは、それぞれ対応する重みｗ及びバイアスｂを用いて総入力値ｕ（Σｚ・ｗ＋ｂ）が算出されるか、又は、それぞれ対応する重みｗのみを用いて総入力値ｕ（Σｚ・ｗ）が算出される。例えば、出力層のノードでは活性化関数として恒等関数が用いられる。この場合、出力層のノードにおいて算出された総入力値ｕが、そのまま出力値ｙとして出力層のノードから出力される。

このようにＮＮモデルは、入力層と、隠れ層と、出力層と、を備え、一又は複数の入力パラメータが入力層から入力されると、入力パラメータに対応する一又は複数の出力パラメータを出力層から出力する。

入力パラメータの例としては、例えばＮＮモデルを用いて車両２に搭載された内燃機関を制御する場合であれば、機関回転速度や機関冷却水温度、燃料噴射量、燃料噴射時期、燃圧、吸入空気量、吸気温度、ＥＧＲ率、過給圧といった、内燃機関の運転状態を示す各種パラメータの現在値が挙げられる。そして、このような入力パラメータに対応する出力パラメータの例としては、排気中のＮＯｘ濃度やその他の物質の濃度、機関出力トルクといった内燃機関の性能を表す各種パラメータの推定値が挙げられる。これにより、ＮＮモデルに内燃機関の運転状態を示す各種パラメータの現在値を入力パラメータとして入力することで、内燃機関の性能を表す各種パラメータの推定値（現在の推定値又は将来の推定値）を出力パラメータとして取得することができるので、例えば出力パラメータに基づいて、内燃機関の性能が所望の性能に近づくように内燃機関を制御することができる。また、出力パラメータを実測するためのセンサ等を備える場合には、実測値と推定値との差に応じて、センサ等の故障を判断したりすることもできる。

ＮＮモデルの精度を向上させるためには、ＮＮモデルを学習させる必要がある。ＮＮモデルの学習には、入力パラメータの実測値と、この入力パラメータの実測値に対応した出力パラメータの実測値（正解データ）と、を含む多数の訓練データセットが用いられる。多数の訓練データセットを用いて、公知の誤差逆伝搬法によってニューラルネットワーク内の重みｗ及びバイアスｂの値を繰り返し更新することで、重みｗ及びバイアスｂの値が学習され、学習モデル（学習済みのＮＮモデル）が生成される。

ここで、通常、各車両が使用される地域は或る程度限定され、例えば自家用車であれば、基本的に各自家用車の所有者の生活圏内において使用され、タクシーやバスなどの商用車であれば、基本的に各商用車を所有する事業者のサービス提供地域内において使用される。したがって、各車両で使用されるＮＮモデルを学習（再学習）させる際には、各車両が使用される使用地域の特性（例えば地形や交通状況等）にあわせた訓練データセットを用いて学習を行うことで、各車両の使用地域の特性にあわせた精度の高い学習モデルを生成することができる。

しかしながら、使用地域の特性は、例えば地形の変化や道路の増設、街の再開発等によって時間の経過と共に変化することが考えられる。そのため、各車両２で使用される学習モデルの精度を維持するためには、使用地域の特性の変化にあわせて適切なタイミングで学習モデルの再学習を行うことが必要になる。

しかしながら、従来においては、使用地域の特性の変化にあわせた適切なタイミングで学習モデルの再学習を行わせることできておらず、その結果、使用地域の特性が変化する前の学習モデルを使用し続けてしまい、精度の低くなった学習モデルを用いて車両２に搭載された各種の制御部品２５の制御が行われるおそれがあった。

そこで本実施形態では、複数の車両２のうちの一の車両２において、所定領域内で取得された訓練データセットが所定期間内に所定量以上になったときは、当該訓練データセットを用いて一の車両２で使用されるＮＮモデルの再学習を実施すると共に、再学習前のＮＮモデルと再学習後のＮＮモデルとを比較して、両者の相違点を「モデル間差分値」として数値化することとした。モデル間差分値は、再学習前のＮＮモデルと、再学習後のＮＮモデルと、の相違点が大きくなるほど大きくなるパラメータであって、例えば、予め設定された差分検出用入力パラメータを再学習前後の各ＮＮモデルに入力し、その際に各ＮＮモデルから得られる出力パラメータの差分値とすることができる。

そして、モデル間差分値が所定値以上であった場合には、訓練データセットが取得された所定領域（すなわち一の車両２の使用地域）内の特性が変化していると判断し、所定領域内で主に使用されている、複数の車両２のうちの他の各車両２に対して、ＮＮモデルの再学習を指示することとした。

これにより、複数の車両２のうちの一の車両２においてＮＮモデルの再学習が実施されたときの学習前後のモデル間差分値が所定値以上であったことをトリガーとして、一の車両２の使用地域と同じ地域で使用される他の車両２に対してＮＮモデルの再学習の指示を行うことができる。そのため、各車両２で使用される学習モデルの再学習を、使用地域の特性の変化にあわせた適切なタイミングで行わせることができる。

図４は、本実施形態によるモデル学習システムにおいて、サーバ１と、複数の車両２のうちの一の車両２と、の間で実行される処理の一例を示すフローチャートである。

ステップＳ１において、車両２の電子制御ユニット２０は、自車両のＮＮモデルの再学習条件が成立したか否かを判定する。本実施形態では電子制御ユニット２０は、所定期間内に所定領域内で取得された訓練データセットが所定量以上になったか否かを判定する。電子制御ユニット２０は、所定期間内に所定領域内で取得された訓練データセットが所定量以上になっていれば、ステップＳ２の処理に進む。一方で電子制御ユニット２０は、所定期間内に所定領域内で取得された訓練データセットが所定量以上になっていなければ、今回の処理を終了する。

なお所定期間は、地形の変化や道路の増設、街の再開発等によって所定領域の特性が変化するには基本的に一定の期間が必要になるため、そのような期間よりも短い期間、すなわち所定領域の特性が大きく変化することがないと想定される期間とされ、例えば直近の数週間や数か月間とすることができる

また所定領域は、例えば車両２が自家用車であれば、過去の走行履歴から判断した当該自家用車の所有者の生活圏内とすることもできるし、例えば車両２が商用車であれば、当該商用車を所有する事業者のサービス提供地域とすることもできる。また所定領域は、車両の種別にかかわらず、予め定められた一定の領域（例えば国内全域を数キロ四方の区画に分けた場合の一区間）とすることもできる。

また本実施形態では、車両２の電子制御ユニット２０は、車両走行中に、訓練データセット（ＮＮモデルの入力パラメータの実測値と出力パラメータの実測値）を随時取得し、取得した訓練データセットを、取得時期及び取得場所と関連付けて車両記憶部２２に記憶している。また本実施形態では、車両２の電子制御ユニット２０は、記憶した訓練データセットのデータ量が一定量を超えると、古いものから順に訓練データセットを自動的に破棄している。

ステップＳ２において、車両２の電子制御ユニット２０は、所定期間内に所定領域内で取得された訓練データセットを用いて、自車両で使用しているＮＮモデルの再学習を実施する。

ステップＳ３において、車両２の電子制御ユニット２０は、再学習前のＮＮモデルと、再学習後のＮＮモデルと、を比較して、モデル間差分値を算出する。

本実施形態では電子制御ユニット２０は、前述したように、予め設定された差分検出用入力パラメータを再学習前後の各ＮＮモデルに入力し、その際に各ＮＮモデルから得られる出力パラメータの差分値を「モデル間差分値」として算出している。しかしながら、このような方法に限らず、例えば、複数の差分検出用入力パラメータを再学習前後の各ＮＮモデルに入力し、その際に得られる複数の出力パラメータの差分値の平均値をモデル間差分値にするなど、複数の出力パラメータの差分値に基づいてモデル間差分値を算出するようにしてもよい。また、再学習前後の各ＮＮモデルの各ノードの重みｗ又はバイアスｂの差分値をモデル間差分値としてもよいし、各ノードの重みｗ又はバイアスｂの差分値の平均値など、各ノードの重みｗ又はバイアスｂの差分値に基づいてモデル間差分値を算出するようにしてもよい。

ステップＳ４において、車両２の電子制御ユニット２０は、モデル間差分値が所定値以上か否かを判定する。電子制御ユニット２０は、モデル間差分値が所定値以上であれば、ステップＳ５の処理に進む。一方で電子制御ユニット２０は、モデル間差分値が所定値未満であれば、今回の処理を終了する。

ステップＳ５において、車両２の電子制御ユニット２０は、再学習前後の各ＮＮモデルのモデル間差分値が所定値以上となった所定領域（再学習に用いた訓練データセットが取得された領域）を「再学習推奨領域」に設定し、再学習推奨領域を特定するための位置情報などを含む再学習推奨領域情報をサーバ１に送信する。

ステップＳ６において、再学習推奨領域情報を受信したサーバ１は、再学習推奨領域をサーバ記憶部１２のデータベースに記憶する。

図５は、本実施形態によるモデル学習システムにおいて、サーバ１と、複数の車両２のうちの他の車両２と、の間で実行される処理の一例を示すフローチャートである。

ステップＳ１１において、車両２の電子制御ユニット２０は、車両２の現在位置情報（例えば車両２の経度及び緯度）及び識別情報（例えば車両２の登録番号）を含む車両情報をサーバ１に定期的に送信する。

ステップＳ１２において、サーバ１は、車両情報を受信したか否かを判定する。サーバ１は、車両情報を受信していれば、ステップＳ１３の処理に進む。一方でサーバ１は、車両情報を受信していなければ、今回の処理を終了する。

ステップＳ１３において、サーバ１は、再学習推奨領域を記憶させたデータベースを参照し、車両情報に含まれる現在位置情報に基づいて、当該車両情報を送信した他の車両（以下「送信元車両」という。）２が、再学習推奨領域を走行しているか否かを判定する。サーバ１は、送信元車両２が再学習推奨領域を走行していれば、ステップＳ１４の処理に進む。一方でサーバ１は、送信元車両２が再学習推奨領域を走行していなければ、ステップＳ１５の処理に進む。

ステップＳ１４において、サーバ１は、再学習推奨領域情報及び再学習指示を含む返信データを作成する。

ステップＳ１５において、サーバ１は、再学習指示を含まない返信データを作成する。

ステップＳ１６において、サーバ１は、返信データを送信元車両２に送信する。このようにサーバ１は、複数の車両２のうちの一の車両２において使用される学習モデルであって所定領域内で取得された訓練データセットに基づいて学習が行われる学習モデルの学習前後の相違度合いを表すモデル間差分値が所定値以上であったときは、当該所定領域内に存在する複数の車両２のうちの他の車両２に対して再学習推奨領域情報及び再学習指示を含む返信データを送信し、学習モデルの再学習を指示する。

ステップＳ１７において、送信元車両２の電子制御ユニット２０は、受信した返信データに再学習指示が含まれているか否かを判定する。電子制御ユニット２０は、返信データに再学習指示が含まれていればステップＳ１８の処理に進む。一方で電子制御ユニット２０は、受信した返信データに再学習指示が含まれていなければ今回の処理を終了する。

ステップＳ１８において、送信元車両２の電子制御ユニット２０は、返信データに含まれていた再学習推奨領域情報に基づいて、自車両の主な使用地域が再学習推奨領域であるか否かを判定する。自車両の主な使用地域は、例えば、自車両の過去の走行履歴から判断してもよいし、所有者等が予め設定しておいてもよい。電子制御ユニット２０は、自車両の主な使用地域が再学習推奨領域であれば、ステップＳ１９の処理に進む。一方で電子制御ユニット２０は、自車両の主な使用地域が再学習推奨領域でなければ、今回の処理を終了する。

ステップＳ１９において、送信元車両２の電子制御ユニット２０は、再学習指示に基づいて、自車両のＮＮモデルの再学習を、車両記憶部２２に記憶されている、車両走行中に使用地域（再学習推奨領域）で取得された直近の所定量分の訓練データセットを用いて行う。なお、送信元車両（他の車両）のＮＮモデルの再学習にあたっては、必要な訓練データセットをサーバ１から受け取るようにしてもよい。

以上説明した本実施形態によるモデル学習システム１００は、サーバ１と、当該サーバ１と通信可能に構成された複数の車両２と、を備える。そしてサーバ１は、複数の車両２のうちの一の車両２において使用される学習モデルであって所定領域内で取得された訓練データセットに基づいて学習が行われる学習モデルの学習前後の相違度合いを表すモデル間差分値が所定値以上であったときは、所定領域内に存在する複数の車両２のうちの他の車両２に対して、他の車両２において使用される学習モデルの再学習を指示するように構成される。

これにより、複数の車両２のうちの一の車両２において使用される学習モデルの学習前後のモデル間差分値が所定値以上であったことをトリガーとして、所定領域内（例えば、一の車両２の使用地域内）に存在する他の車両２に対して学習モデルの再学習指示を行うことができる。モデル間差分値は、所定領域内の特性が変化するほど（所定領域内で取得される訓練データセットの特性が変化するほど）、ＮＮモデルの中身が大きく変化して、大きくなることが想定される。そのため、各車両２で使用される学習モデルの再学習を、所定領域の特性の変化にあわせた適切なタイミングで行わせることができる。

なおモデル間差分値は、例えば、学習前後の各学習モデルに所定の入力パラメータを入力したときに各学習モデルから出力される各出力パラメータの差分値、又は各出力パラメータ差分値に基づいて算出される値（例えば平均値など）とすることができる。またこれに限らず、学習前後の各学習モデルの各ノードの重み又はバイアスの差分値、又は各ノードの重み又はバイアスの差分値に基づいて算出される値（例えば平均値など）とすることもできる。

また本実施形態において、複数の車両２のうちの一の車両２は、所定期間内に所定領域内で取得された訓練データセットが所定量以上になったときに学習モデルの学習を実施してモデル間差分値を算出し、その算出結果に応じた情報（再学習推奨領域情報）をサーバ１に送信するように構成される。

これにより、複数の車両２のうちの一の車両２において、定期的に学習モデルの再学習を実施させてモデル間差分値を算出することができるので、所定領域内の特性の変化を定期的に判断することができると共に、他の車両２に対して学習モデルの再学習指示を行うか否かを定期的に判断することができる。なお、この一の車両２は、複数の車両２の中の特定の１台の車両としてもよいし、特定の複数台の車両としてもよいし、全ての車両としてもよい。

また本実施形態において、複数の車両２のうちの他の車両２は、サーバ１から学習モデルの再学習を指示されたときは、他の車両２の使用地域が所定領域内であれば、他の車両２において使用される学習モデルの再学習を行うように構成される。

これにより、他の車両２の使用地域が所定領域とは関係ない地域であったとき、他の車両２において使用される学習モデルを不要に再学習させてしまうことを抑制できる。

以上、本発明の実施形態について説明したが、上記実施形態は本発明の適用例の一部を示したに過ぎず、本発明の技術的範囲を上記実施形態の具体的構成に限定する趣旨ではない。

例えば上記の実施形態では、ＮＮモデルの再学習やモデル間差分値の算出を各車両２で実施していたが、再学習やモデル間差分値の算出に必要なデータを適宜サーバ１に送信してサーバ１でＮＮモデルの再学習やモデル間差分値の算出を実施するようにしてもよい。

１サーバ
２車両（一の車両、他の車両）
１００モデル学習システム

Claims

サーバと、前記サーバと通信可能に構成された複数の車両と、を備えるモデル学習システムであって、
前記サーバは、
前記複数の車両のうちの一の車両において使用される学習モデルであって所定領域内で取得された訓練データセットに基づいて学習が行われる学習モデルの学習前後の相違度合いを表すモデル間差分値が所定値以上であったときは、前記所定領域内に存在する前記複数の車両のうちの他の車両に対して、前記他の車両において使用される学習モデルの再学習を指示する、
モデル学習システム。
前記モデル間差分値は、学習前後の各学習モデルに所定の入力パラメータを入力したときに各学習モデルから出力される各出力パラメータの差分値、又は前記差分値に基づいて算出される値である、
請求項１に記載のモデル学習システム。
前記モデル間差分値は、学習前後の各学習モデルの各ノードの重み又はバイアスの差分値、又は前記差分値に基づいて算出される値である、
請求項１に記載のモデル学習システム。
前記一の車両は、
所定期間内に前記所定領域内で取得された訓練データセットが所定量以上になったときに、学習モデルの学習を実施して前記モデル間差分値を算出し、その算出結果に応じた情報を前記サーバに送信する、
請求項１から請求項３までのいずれか１項に記載のモデル学習システム。
前記他の車両は、
前記サーバから学習モデルの再学習を指示されたときは、前記他の車両の使用地域が前記所定領域内であれば、前記他の車両において使用される学習モデルの再学習を行う、
請求項１から請求項４までのいずれか１項に記載のモデル学習システム。
前記所定領域は、前記一の車両の使用地域である、
請求項１から請求項５までのいずれか１項に記載のモデル学習システム。
複数の車両と通信可能に構成されたサーバであって、
前記複数の車両のうちの一の車両において使用される学習モデルであって所定領域内で取得された訓練データセットに基づいて学習が行われる学習モデルの学習前後の相違度合いを表すモデル間差分値が所定値以上であったときは、前記所定領域内に存在する前記複数の車両のうちの他の車両に対して、前記他の車両において使用される学習モデルの再学習を指示する、
サーバ。