JP7040589B1

JP7040589B1 - 機械学習方法及び機械学習システム

Info

Publication number: JP7040589B1
Application number: JP2020199654A
Authority: JP
Inventors: 寛也千葉; 陽平晴山; 大樹横山
Original assignee: Toyota Motor Corp
Current assignee: Toyota Motor Corp
Priority date: 2020-12-01
Filing date: 2020-12-01
Publication date: 2022-03-23
Anticipated expiration: 2040-12-01
Also published as: JP2022087620A; CN114578687A; US11623652B2; US20220169268A1; DE102021129697A1

Abstract

【課題】サーバの処理負荷が過剰に高くなってしまうことを抑制する。【解決手段】機械学習モデルを有する車両２と、車両と通信可能なサーバ３とを備える機械学習システム１において行われる、モデルパラメータの値を機械学習する、機械学習方法は、サーバがーバの現在の処理負荷を検出することと、サーバが処理負荷に基づいてサーバ及び車両それぞれで行う機械学習の処理量を決定することと、サーバが、決定されたサーバにおける機械学習の処理量に応じてモデルパラメータの値を機械学習することと、車両が、決定された車両における機械学習の処理量に応じてモデルパラメータの値を機械学習すること、とを含む。サーバは、処理負荷が相対的に高いときには相対的に低いときに比べてサーバにおける機械学習の処理量を少なくする。【選択図】図７

Description

本開示は、機械学習方法及び機械学習システムに関する。

従来から、搭載された機器を制御するのに用いられる機械学習モデルを有する車両と、車両と通信可能なサーバとを備えるシステムが知られている（例えば、特許文献１）。例えば、特許文献１に記載のシステムでは、サーバは、車両から取得したデータを学習用のデータセットとして蓄積すると共に蓄積されたデータセットに基づいて機械学習モデルのパラメータの値の学習を行い、学習結果を各車両に通知する。そして、車両は、サーバから通知された学習結果が反映された機械学習モデルにより画像認識処理を行う。

特に、特許文献１に記載のシステムでは、車両において認識しにくいデータが車両からサーバに送信されると、サーバでは斯かるデータに加えて斯かるデータが取得された状況と同様な状況にて他の車両で取得されたデータに基づいてその車両用の機械学習モデルのモデルパラメータの値が更新される。

特開２０１９－０２１２０１号公報

ところで、特許文献１に記載のシステムでは、サーバにて、サーバと通信する複数の車両の機械学習モデルの学習が行われることになる。このため、サーバにて多数の車両の機械学習モデルの機械学習を同時に行わなければならなくなる場合がある。このような場合、サーバにおける機械学習処理の演算負荷（以下、「処理負荷」ともいう）が高くなり、サーバでの機械学習の処理能力の著しい低下や、機械学習処理の停止を招いてしまう可能性がある。

そこで、上記課題に鑑みて、本開示の目的は、車両の機械学習モデルに関する機械学習処理に伴ってサーバの処理負荷が過剰に高くなってしまうことを抑制することにある。

本開示の要旨は以下のとおりである。

［１］搭載された機器を制御するのに用いられる機械学習モデルを有する車両と、該車両と通信可能なサーバとを備える機械学習システムにおいて行われる、前記機械学習モデルを構成するモデルパラメータの値を機械学習する、機械学習方法であって、
前記車両が前記サーバへ前記モデルパラメータの値の機械学習を依頼する依頼信号を送信することと、
前記サーバが該サーバの現在の処理負荷を検出することと、
前記車両から前記依頼信号を受信したときに、前記サーバが、前記処理負荷に基づいて、前記サーバ及び前記車両それぞれで行う前記機械学習の処理量又は処理比率を決定することと、
前記サーバが、前記決定された該サーバにおける前記機械学習の処理量又は処理比率に応じて、前記モデルパラメータの値を機械学習するための訓練データセットに基づいて前記モデルパラメータの値を機械学習することと、
前記車両が、前記決定された該車両における前記機械学習の処理量又は処理比率に応じて、前記訓練データセットに基づいて前記モデルパラメータの値を機械学習すること、とを含み、
前記サーバは、前記処理負荷が相対的に高いときには相対的に低いときに比べて前記サーバにおける前記機械学習の処理量又は処理比率を少なくする、機械学習方法。
［２］前記サーバは、前記処理負荷が所定の基準処理負荷よりも高いときには前記機械学習の全ての処理を前記車両にて行わせることを決定し、且つ、前記処理負荷が前記基準処理負荷以下であるときには前記機械学習の全ての処理を前記サーバにて行わせることを決定する、上記［１］に記載の機械学習方法。
［３］前記基準処理負荷は、前記機械学習モデルの種類に応じて変更される、上記［２］に記載の機械学習方法。
［４］前記基準処理負荷は、前記機械学習モデルが前記車両の安全性に関連するモデルである場合には、前記機械学習モデルが前記車両の安全性に関連しないモデルである場合に比べて、高い、上記［３］に記載の機械学習方法。
［５］前記車両で前記訓練データセットに基づいて前記機械学習を行った場合の予想学習時間と前記訓練データセット及び前記モデルパラメータの前記車両と前記サーバとの間の送受信に必要な予想通信時間とを算出することを更に含み、
前記基準処理負荷は、前記サーバにおいて前記モデルパラメータの値を機械学習するのに前記予想学習時間から前記予想通信時間を減算した時間が必要になるような負荷又はそれよりも低い負荷である、上記［２］～［４］のいずれか１項に記載の機械学習方法。
［６］搭載された機器を制御するのに用いられる機械学習モデルを有する車両と、該車両と通信可能なサーバとを備え、前記機械学習モデルを構成するモデルパラメータの値を機械学習する、機械学習システムであって、
前記車両は、
前記サーバへ前記モデルパラメータの値の機械学習を依頼する依頼信号を送信する学習依頼送信部と、
前記モデルパラメータの値を機械学習するための訓練データセットに基づいて前記モデルパラメータの値を機械学習する車両側学習部と、を備え、
前記サーバは、
前記サーバの現在の処理負荷を検出する処理負荷検出部と、
前記車両から前記依頼信号を受信したときに、前記処理負荷に基づいて、前記サーバ及び前記車両それぞれで行う前記機械学習の処理量又は処理比率を決定する処理量決定部と、
前記訓練データセットに基づいて前記モデルパラメータの値を機械学習するサーバ側学習部と、を備え、
前記サーバ側学習部及び前記車両側学習部は、それぞれ、前記決定された前記機械学習の処理量又は処理比率に応じて、前記モデルパラメータの値を機械学習する学習部を備え、
前記処理量決定部は、前記処理負荷が相対的に高いときには相対的に低いときに比べて前記サーバ側学習部における前記機械学習の処理量又は処理比率を少なくする、機械学習システム。

本開示によれば、車両の機械学習モデルに関する機械学習処理に伴ってサーバの処理負荷が過剰に高くなってしまうことが抑制される。

図１は、第一実施形態に係る機械学習システムの概略的な構成図である。図２は、車両のハードウェア構成を概略的に示す図である。図３は、車両のプロセッサの機能ブロック図である。図４は、サーバのハードウェア構成を概略的に示す図である。図５は、サーバのプロセッサの機能ブロック図である。図６は、単純な構成を有するＮＮモデルの一例を示す。図７は、機械学習モデルの機械学習がサーバによって行われる場合の学習処理の動作シーケンス図である。図８は、機械学習モデルの機械学習が車両によって行われる場合の学習処理の動作シーケンス図である。図９は、第二実施形態に係るサーバのプロセッサの機能ブロック図である。図１０は、本実施形態に係る機械学習モデルの機械学習がサーバによって行われる場合の学習処理の、図７と同様な動作シーケンス図である。図１１は、第三実施形態に係る学習処理の、図７と同様な動作シーケンス図である。

以下、図面を参照して実施形態について詳細に説明する。なお、以下の説明では、同様な構成要素には同一の参照番号を付す。

＜第一実施形態＞
≪機械学習システムの構成≫
まず、図１～図５を参照して、第一実施形態に係る機械学習システム１及び機械学習システム１において行われる機械学習方法について説明する。図１は、第一実施形態に係る機械学習システム１の概略的な構成図である。機械学習システム１は、各車両に特有の機械学習モデルを、各車両の状態を表す複数の状態パラメータの値を含む訓練データセットを用いて機械学習させる。機械学習モデルは、車両に搭載された機器を制御するのに用いられる。

図１に示したように、機械学習システム１は、通信可能な複数の車両２と、サーバ３とを備える。複数の車両２のそれぞれとサーバ３とは、光通信回線などで構成される通信ネットワーク４と、通信ネットワーク４にゲートウェイ（図示せず）を介して接続される無線基地局５とを介して、相互に通信可能に構成される。車両２と無線基地局５との通信は、任意の通信規格に準拠した通信である。

図２は、車両２のハードウェア構成を概略的に示す図である。図２に示したように、車両２は、電子制御ユニット（ＥＣＵ）１１を備える。ＥＣＵ１１は、車内通信インターフェース１２と、記憶装置１３と、プロセッサ１４とを有する。車内通信インターフェース１２及び記憶装置１３は信号線を介してプロセッサ１４に接続されている。なお、本実施形態では、車両２には、一つのＥＣＵ１１が設けられているが、機能毎に分かれた複数のＥＣＵが設けられてもよい。

車内通信インターフェース１２は、ＣＡＮ（Controller Area Network）等の規格に準拠した車内ネットワーク１５にＥＣＵ１１を接続するためのインターフェース回路を有する。ＥＣＵ１１は車内通信インターフェース１２を介して他の車載機器と通信する。

記憶装置１３は、データを記憶する記憶部の一例である。記憶装置１３は、例えば、揮発性の半導体メモリ（例えば、ＲＡＭ）、不揮発性の半導体メモリ（例えば、ＲＯＭ）、ハードディスクドライブ（ＨＤＤ）、ソリッドステートドライブ（ＳＳＤ）又は光記録媒体を備える。記憶装置１３は、プロセッサ１４において各種処理を実行するためのコンピュータプログラムや、プロセッサ１４によって各種処理が実行されるときに使用される各種データ等を記憶する。したがって、記憶装置１３は、各車両特有の機械学習モデルを記憶する。

プロセッサ１４は、一つ又は複数のＣＰＵ(Central Processing Unit)及びその周辺回路を有する。プロセッサ１４は、更にＧＰＵ（Graphics Processing Unit）、又は論理演算ユニット若しくは数値演算ユニットのような演算回路を有していてもよい。プロセッサ１４は、ＥＣＵ１１の記憶装置１３に記憶されたコンピュータプログラムに基づいて、各種の演算処理を実行する。したがって、プロセッサ１４は、機械学習モデルの入力パラメータの値が入力されると、機械学習モデルに従った演算処理を行って、出力パラメータの値を出力する。

図３は、車両２のプロセッサ１４の機能ブロック図である。図３に示したように、プロセッサ１４は、機械学習モデルを用いて車両２の制御機器２２を制御する制御部１４１と、機械学習モデルの学習実行条件が成立しているか否かを判定する学習条件成否判定部１４２と、学習用データセットを生成するデータセット生成部１４３と、サーバ３への機械学習の依頼を送信する学習依頼送信部１４４と、機械学習モデルを構成するモデルパラメータの値を機械学習する車両側学習部１４５と、制御部１４１において用いられる機械学習モデルを更新するモデル更新部１４６と、サーバ３へ様々なデータを送信する車両側送信部１４７と、サーバ３から様々なデータを受信する車両側受信部１４８とを備える。プロセッサ１４が有するこれら機能ブロックは、例えば、プロセッサ１４上で動作するコンピュータプログラムにより実現される機能モジュールである。或いは、プロセッサ１４が有するこれら機能ブロックは、プロセッサ１４に設けられる専用の演算回路であってもよい。車両２のプロセッサ１４の各機能ブロックの詳細については後述する。

また、図２に示したように、車両２は、更に、車外通信モジュール２１、複数の制御機器２２及び複数のセンサ２３を備える。車外通信モジュール２１、制御機器２２及びセンサ２３は、車内ネットワーク１５を介してＥＣＵ１１に接続される。

車外通信モジュール２１は、車外の機器と通信を行う通信部の一例である。車外通信モジュール２１は、例えば、サーバ３と通信を行うための機器である。車外通信モジュール２１は、例えば、データ通信モジュール（ＤＣＭ：Data communication module）を含む。データ通信モジュールは無線基地局５及び通信ネットワーク４を介してサーバ３と通信する。

制御機器２２は、車両２に関する様々な制御を行う機器である。具体的には、制御機器２２は、例えば、内燃機関の吸気通路に設けられたスロットル弁の開度を調整するスロットル弁の駆動アクチュエータ、内燃機関の燃焼室に燃料を供給するインジェクタ、燃焼室内の燃料に点火する点火プラグ、内燃機関のＥＧＲ率を制御するＥＧＲ弁の駆動アクチュエータ、空調装置のブロワ、空調装置の空気の流れを制御するエアミックスドアの駆動アクチュエータなどを含む。これら制御機器２２は、車内ネットワーク１５を介してＥＣＵ１１に接続され、ＥＣＵ１１からの駆動信号に応じて作動せしめられる。

センサ２３は、車両２に関する様々な状態パラメータの値（状態量）を検出する検出器の一例である。センサ２３は、例えば、内燃機関に供給される吸入空気量を検出する空気量センサ、内燃機関のインジェクタからの燃料噴射圧を検出する噴射圧センサ、排気ガスの温度を検出する排気温度センサ、タッチパネルなどにおけるドライバの入力を検出する入力検出センサ、車両２の自己位置を検出する自己位置センサ（例えば、ＧＰＳ）などを含む。さらに、センサ２３は、例えば、車両２の周りの空気の温度（外気温度）を検出する外気温度センサ、車両２の周りの空気の湿度（外気湿度）を検出する外気湿度センサ、車両２の周りの大気圧を検出する大気圧センサ、車両２の室内の温度（車内温度）を検出する車内温度センサ、車両２の室内の湿度（車内湿度）を検出する車内湿度センサ、及び日射量を検出する日射センサなどを含む。これらセンサ２３は、車内ネットワーク１５を介してＥＣＵ１１に接続され、ＥＣＵ１１へ出力信号を送信する。

サーバ３は、車両２の外部に設けられ、通信ネットワーク４及び無線基地局５を介して、走行中の車両２と通信を行う。サーバ３は、走行中の車両２から各種情報を受信する。

図４は、サーバ３のハードウェア構成を概略的に示す図である。サーバ３は、図４に示したように、外部通信モジュール３１と、記憶装置３２と、プロセッサ３３とを備える。また、サーバ３は、キーボード及びマウスといった入力装置、及び、ディスプレイといった出力装置を有していてもよい。

外部通信モジュール３１は、サーバ３外の機器と通信を行う通信部の一例である。外部通信モジュール３１は、サーバ３を通信ネットワーク４に接続するためのインターフェース回路を備える。外部通信モジュール３１は、通信ネットワーク４及び無線基地局５を介して、複数の車両２それぞれと通信可能に構成される。

記憶装置３２は、データを記憶する記憶部の一例である。サーバ３の記憶装置３２も、揮発性の半導体メモリ（例えば、ＲＡＭ）、不揮発性の半導体メモリ（例えば、ＲＯＭ）、ハードディスクドライブ（ＨＤＤ）、ソリッドステートドライブ（ＳＳＤ）又は光記録媒体を備える。記憶装置３２は、プロセッサ３３によって各種処理を実行するためのコンピュータプログラムや、プロセッサ３３によって各種処理が実行されるときに使用される各種データを記憶する。

プロセッサ３３は、一つ又は複数のＣＰＵ及びその周辺回路を有する。プロセッサ３３は、更にＧＰＵ、又は論理演算ユニット若しくは数値演算ユニットのような演算回路を有していてもよい。プロセッサ３３は、サーバ３の記憶装置３２に記憶されたコンピュータプログラムに基づいて、各種の演算処理を実行する。本実施形態では、サーバ３のプロセッサ３３が、機械学習モデルを機械学習させる機械学習装置として機能する。

図５は、サーバ３のプロセッサ３３の機能ブロック図である。図５に示したように、プロセッサ３３は、サーバ３の現在の処理負荷を検出する処理負荷検出部３３１と、サーバ３及び車両２それぞれで行う機械学習の処理量を決定する処理量決定部３３２と、機械学習モデルを構成するモデルパラメータの値を機械学習するサーバ側学習部３３３と、車両２へ様々なデータを送信するサーバ側送信部３３４と、車両２から様々なデータを受信するサーバ側受信部３３５とを備える。プロセッサ３３が有するこれら機能ブロックは、例えば、プロセッサ３３上で動作するコンピュータプログラムにより実現される機能モジュールである。或いは、プロセッサ３３が有するこれら機能ブロックは、プロセッサ３３に設けられる専用の演算回路であってもよい。サーバ３のプロセッサ３３の各機能ブロックの詳細については後述する。

≪機械学習モデル≫
本実施形態では、車両２の制御部１４１において、車両２に搭載された制御機器２２を制御するにあたり、機械学習された機械学習モデルが用いられる。本実施形態では、機械学習モデルとして、ニューラルネットワークモデル（以下、「ＮＮモデル」という）が用いられる。以下、図６を参照して、ＮＮモデルの概要について説明する。図６は、単純な構成を有するＮＮモデルの一例を示す。

図６における丸印は人工ニューロンを表す。人工ニューロンは、通常、ノード又はユニットと称される（本明細書では、「ノード」と称す）。図６において、Ｌ＝１は入力層を示し、Ｌ＝２及びＬ＝３は隠れ層（又は中間層）を示し、Ｌ＝４は出力層を示している。本実施形態では、隠れ層（Ｌ＝２及びＬ＝３）のノードの数は入力層（Ｌ＝１）のノードの数よりも少なく、下位の隠れ層のノード数は上位の隠れ層のノード数よりも少ない（例えば、隠れ層（Ｌ＝３）のノード数は隠れ層（Ｌ＝２）のノード数よりも少ない）。

図６において、ｘ_m（ｍ＝１、２、・・・、Ｍ。図６に示した例ではＭ＝４）は入力層（Ｌ＝１）の各ノード及びそのノードからの出力値を示しており、ｙは出力層（Ｌ＝４）のノード及びその出力値を示している。同様に、Ｌ＝２の隠れ層におけるｚ_k ^(L=2)（ｋ＝１、２、・・・、Ｋ^(L=2)。図６に示した例ではＫ^(L=2)＝３）は隠れ層（Ｌ＝２）の各ノード及びそのノードからの出力値を示しており、Ｌ＝３の隠れ層におけるｚ_k ^(L=3)（ｋ＝１、２、・・・、Ｋ^(L=3)。図６に示した例ではＫ^(L=3)＝２）は隠れ層（Ｌ＝３）の各ノード及びそのノードからの出力値を示している。

入力層の各ノードでは入力がそのまま出力される。一方、隠れ層（Ｌ＝２）の各ノードには、入力層の各ノードの出力値ｘ_m（ｍ＝１、２、３、４）が入力され、隠れ層（Ｌ＝２）の各ノードでは、それぞれ対応する重みｗ及びバイアスｂを用いて総入力値ｕが算出される。例えば、図６において隠れ層（Ｌ＝２）のｚ_k ^(L=2)（ｋ＝１、２、３）で示される各ノードにおいて算出される総入力値ｕ_k ^(L=2)は、次式（１）のようになる。

次いで、この総入力値ｕ_k ^(L=2)は活性化関数ｆにより変換され、隠れ層（Ｌ＝２）のｚ_k ^(L=2)で示されるノードから、出力値ｚ_k ^(L=2)（＝ｆ（ｕ_k ^(L=2)））として出力される。一方、隠れ層（Ｌ＝３）の各ノードには、隠れ層（Ｌ＝２）の各ノードの出力値ｚ_k ^(L=2) （ｋ＝１、２、３）が入力され、隠れ層（Ｌ＝３）の各ノードでは、それぞれ対応する重みｗ及びバイアスｂを用いて総入力値ｕ（＝Σｚ・ｗ＋ｂ）が算出される。この総入力値ｕは同様に活性化関数により変換され、隠れ層（Ｌ＝３）の各ノードから、出力値ｚ_k ^(L=3)（ｋ＝１、２）として出力される。活性化関数は例えばＲｅＬＵ関数σである。

また、出力層（Ｌ＝４）のノードには、隠れ層（Ｌ＝３）の各ノードの出力値ｚ_k ^(L=3)（ｋ＝１、２）が入力され、出力層のノードでは、それぞれ対応する重みｗ及びバイアスｂを用いて総入力値ｕ（Σｚ・ｗ＋ｂ）が算出され、又はそれぞれ対応する重みｗのみを用いて総入力値ｕ（Σｚ・ｗ）が算出される。例えば、出力層のノードでは活性化関数として恒等関数が用いられる。この場合、出力層のノードにおいて算出された総入力値ｕが、そのまま出力値ｙとして出力層のノードから出力される。

このようにＮＮモデルは、入力層と、隠れ層と、出力層とを備え、複数の入力パラメータの値が入力層から入力されると、入力パラメータに対応する一又は複数の出力パラメータの値を出力層から出力する。

本実施形態では、このような機械学習モデルとして、例えば外気温度、吸入空気量、燃料噴射量、燃料噴射時期、燃料噴射圧、ＥＧＲ率を、入力パラメータの値として入力すると、排気ガスの温度を出力パラメータの値として出力するモデルが用いられる。車両２の制御部１４１では、センサ２３によって検出された状態パラメータの値やＥＣＵ１１から制御機器２２への制御指令値を入力パラメータの値として斯かる機械学習モデルに入力することによって、出力パラメータである排気ガスの温度が出力される。制御部１４１は、出力された排気ガスの温度に基づいて、内燃機関に関する制御機器２２（例えば、スロットル弁の駆動アクチュエータ、インジェクタ、点火プラグなど）を制御する。ここで、排気ガスの温度を検出する排気温度センサには応答遅れがあるため、排気温度センサの出力に基づいて内燃機関の制御を行うと内燃機関を必ずしも適切に制御することができなかった。これに対して、機械学習モデルを用いた排気ガスの温度の算出には遅れが生じないため、機械学習モデルによって算出された排気ガスの温度を用いて内燃機関に関する制御機器２２を制御することにより、内燃機関をより適切に制御することができる。

或いは、このような機械学習モデルとして、例えば、外気温度、外気湿度、車内温度、車内湿度、日射量を入力パラメータの値として入力すると、空調装置の目標温度を出力パラメータの値として出力するモデルが用いられてもよい。この場合、車両２の制御部１４１では、センサ２３によって検出された状態パラメータの値やＥＣＵ１１から制御機器２２への制御指令値を入力パラメータの値として斯かる機械学習モデルに入力することによって、出力パラメータである空調装置の目標温度が出力される。ＥＣＵ１１は、車内温度が、機械学習モデルから出力された目標温度になるように、空調装置に関する制御機器２２（例えば、空調機器のブロワ、エアミックスドアの駆動アクチュエータなど）を制御する。

なお、機械学習モデルとしては様々なモデルを用いることができる。したがって、入力パラメータとして、外気温度、外気湿度、大気圧、車内温度、車内湿度、日照量、吸入空気量、吸気温度、燃料噴射圧、燃料噴射時期、燃料噴射量、空燃比、点火時期、機関冷却水温度、過給圧といった、車両の状態を表す様々な状態パラメータが用いられる。また、出力パラメータとして、排気浄化触媒の温度、排気ガス中のＮＯｘの濃度、機関出力トルク、車内湿度といった、車両の状態を表す様々な状態パラメータが用いられる。

≪械学習モデルの機械学習≫
次に、上述したような機械学習モデル（ＮＮモデル）の機械学習について説明する。斯かる機械学習モデルの精度を向上させるためには、機械学習モデルを構成するモデルパラメータの値の機械学習（以下、単に「機械学習モデルの機械学習」ともいう）を行う必要がある。そこで、本実施形態では、車両２の車両側学習部１４５又はサーバ３のサーバ側学習部３３３が機械学習モデルの機械学習を行う。具体的には、車両側学習部１４５又はサーバ側学習部３３３の機械学習では、機械学習モデルに入力パラメータの値が入力されるとこれら入力パラメータの値に対応する適切な出力パラメータの値が機械学習モデルから出力されるように、機械学習モデルの全てのモデルパラメータ（ＮＮモデルであれば、重みｗ、バイアスｂ等）の値が算出される。以下、車両側学習部１４５又はサーバ側学習部３３３において行われる、機械学習モデルの機械学習の学習手法を簡単に説明する。

機械学習モデルの機械学習では、状態パラメータの実測値を含む訓練データセットが用いられる。訓練データセットは、複数の入力パラメータの複数の実測値と、これら実測値に対応する少なくとも一つの出力パラメータの複数の実測値（正解データ）との組合せから成る。本実施形態では、入力パラメータの実測値及び出力パラメータの実測値は、車両２のセンサ２３によって検出された値又はＥＣＵ１１から制御機器２２への制御指令値である。また、本実施形態では、サーバ３にて機械学習モデルの機械学習を行うにあたって、車両２からサーバ３へ訓練データセットが送信される。なお、訓練データセットは、入力パラメータの実測値及び出力パラメータの実測値に前処理（正規化、標準化等）を行ったものでもよい。

車両側学習部１４５又はサーバ側学習部３３３は、訓練データセットを用いて、機械学習モデルのモデルパラメータの値の機械学習を行う。機械学習モデルの機械学習にあたっては、車両側学習部１４５又はサーバ側学習部３３３は、例えば、機械学習モデルの出力値と訓練データセットに含まれる出力パラメータの実測値との差が小さくなるように、公知の誤差逆伝播法によって機械学習モデルにおけるモデルパラメータ（重みｗ及びバイアスｂ）の値を繰り返し更新する。この結果、機械学習モデルが学習され、学習済みの機械学習モデルが生成される。学習済み機械学習モデルを構成するモデルパラメータ（重みｗ、バイアスｂ等）の値は、車両２の記憶装置１３又はサーバ３の記憶装置３２に記憶される。

≪機械学習モデルの学習処理≫
次に、図７及び図８を参照して、車両２又はサーバ３における機械学習モデルの学習処理の流れについて説明する。本実施形態では、サーバ３における処理負荷に応じて、機械学習モデルの機械学習を行う主体が変更される。特に、本実施形態では、サーバ３における処理負荷が高い場合には、車両２によって機械学習が行われ、サーバ３における処理負荷が低い場合には、サーバ３によって機械学習が行われる。したがって、本実施形態では、機械学習モデルの機械学習が車両２によって行われる場合とサーバ３で行われる場合とが存在する。したがって、以下では、機械学習が車両２及びサーバ３のそれぞれで行われる場合における学習処理の流れについて説明する。

図７は、機械学習モデルの機械学習がサーバ３によって行われる場合の学習処理の動作シーケンス図である。したがって、図７は、サーバ３における処理負荷が低い場合の学習処理の流れを示している。

車両２の学習条件成否判定部１４２は、定期的に、車両２の機械学習モデルの学習実行条件が成立しているか否かを判定する（ステップＳ１１）。機械学習モデルの機械学習は、例えば、一定期間毎、一定走行距離毎又は一定走行時間毎に行われる。したがって、学習条件成否判定部１４２は、前回の機械学習から例えば一定期間が経過すると、機械学習の学習実行条件が成立したと判定する。ここで、機械学習モデルの最適なモデルパラメータの値は制御機器２２の経年劣化やユーザの趣向の変化などによって変化する。このように定期的に機械学習モデルのモデルパラメータの値の機械学習を行うことによって、モデルパラメータの値を適切な値に保つことができる。

なお、機械学習モデルの機械学習は、上述したタイミングとは異なるタイミングで行われてもよい。したがって、機械学習モデルの機械学習は、例えば、機械学習モデルの入力パラメータとして指令値が用いられる制御機器２２や、機械学習モデルの入力パラメータの値を検出するセンサ２３に何らかの異常が生じているような場合に行われてもよい。したがって、この場合、学習条件成否判定部１４２は、制御機器２２やセンサ２３に異常が生じている場合に、機械学習の学習実行条件が成立したと判定する。具体的には、例えば、自己診断機能（On-board diagnosis）により斯かる制御機器２２やセンサ２３に異常が生じていると判定された場合や、機械学習モデルによって出力された予測値がその後センサ２３によって検出された実測値と基準値以上異なるような場合に、機械学習の学習実行条件が成立する。

学習実行条件が成立すると、車両２のデータセット生成部１４３は、訓練データセットを作成する（ステップＳ１２）。データセット生成部１４３は、任意の期間中に車両２のセンサ２３によって検出された検出値及び同期間中にＥＣＵ１１から制御機器２２へ送信された制御指令値に基づいて、訓練データセットを生成する。データセット生成部１４３は、機械学習の学習実行条件が成立した後に取得された検出値及び制御指令値に基づいて訓練データセットを生成する。或いは、データセット生成部１４３は、機械学習の学習実行条件が成立する前から検出値及び制御指令値を記憶装置１３に格納しておいて、機械学習の学習実行条件が成立した後に格納されていた検出値及び制御指令値に基づいて訓練データセットを生成してもよい。また、データセット生成部１４３は、検出値及び制御指令値に前処理（正規化、標準化等）を行って訓練データセットを生成してもよい。生成された訓練データセットは、ＥＣＵ１１の記憶装置１３に記憶される。

訓練データセットが生成されると、車両２の学習依頼送信部１４４は、機械学習モデルのモデルパラメータの値の機械学習を依頼する依頼信号を、車外通信モジュール２１を介してサーバ３へ送信する（ステップＳ１３）。このとき、学習依頼送信部１４４は、依頼信号と共に、機械学習を行うことに伴うサーバ３での処理負荷を算出するのに必要な情報を送信してもよい。具体的には、学習依頼送信部１４４は、例えば、データセット生成部１４３によって作成された訓練データセットの大きさ、機械学習モデルの構成（層の数や各層のノードの数など）又は機械学習モデルの種類（例えば、車両２の安全性に寄与するモデル、環境に寄与するモデル、などの区別）を送信する。ただし、車両２に対応する機械学習モデルの構成などの情報が予めサーバ３の記憶装置３２に格納されている場合には、学習依頼送信部１４４は斯かる情報については送信しない。

一方、サーバ３の処理負荷検出部３３１は、常時又は定期的に、サーバ３の現在の処理負荷を検出する（ステップＳ１４）。サーバ３の処理負荷は、サーバ３の演算処理に関する負荷であり、例えばサーバ３のプロセッサ３３の使用率（ＣＰＵやＧＰＵの使用率）及びサーバ３の記憶装置３２に半導体メモリにおける空き容量に応じて変化する。サーバ３の処理負荷は、プロセッサ３３の使用率が大きいほど高いものとして検出され、半導体メモリにおける空き容量が小さいほど高いものとして検出される。

サーバ３の処理負荷は、サーバ３において行われている演算処理の量に応じて変化する。したがって、サーバ３が他の多数の車両の機械学習モデルの学習を行っている場合や、学習以外の様々な演算処理を行っている場合には、サーバ３の処理負荷は高いものとして検出されることになる。一方、サーバ３によって他の車両の機械学習モデルの学習や学習以外の演算処理が行われていない場合には、サーバ３の処理負荷は低いものとして検出されることになる。

なお、処理負荷検出部３３１は、サーバ３の現在の処理負荷のみならず、サーバ３の将来の処理負荷を検出してもよい。将来の処理負荷は、例えば、サーバ３のプロセッサ３３での処理が予定されているタスクに基づいて検出される。また、処理負荷検出部３３１は、常時又は定期的に処理負荷を検出するのではなく、サーバ側受信部３３５が外部通信モジュール３１を介して依頼信号を受信したときに負荷処理を検出するように構成されてもよい。

サーバ側受信部３３５が外部通信モジュール３１を介して依頼信号を受信すると、処理量決定部３３２が、処理負荷検出部３３１によって検出されたサーバ３の現在の処理負荷に基づいて、サーバ３及び車両２のうち機械学習モデルのモデルパラメータの値を機械学習する主体を決定する（ステップＳ１５）。特に、本実施形態では、処理量決定部３３２は、サーバ３の現在の処理負荷が所定の基準処理負荷よりも高いか否かを判定する。処理量決定部３３２は、サーバ３の現在の処理負荷が所定の基準処理負荷よりも高いと判定されたときには、機械学習モデルの機械学習における全ての処理を車両２のプロセッサ１４で行わせること、すなわちサーバ３のプロセッサ３３での機械学習の処理量をゼロにすることを決定する。一方、処理量決定部３３２は、サーバ３の現在の処理負荷が上記基準処理負荷以下であると判定されたときには、機械学習モデルの機械学習における全ての処理をサーバ３のプロセッサ３３で行わせること、すなわち車両２のプロセッサ１４での機械学習の処理量をゼロにすることを決定する。本実施形態では、基準処理負荷は、予め定められた一定値（例えば、サーバ３の処理負荷の最大値を１００％とすると、８０％）である。

なお、基準処理負荷は、予め定められた一定値でなく、変動する値であってもよい。例えば、基準処理負荷は、学習依頼送信部１４４によってサーバ３へ送信された機械学習モデルの種類に基づいて変更されてもよい。具体的には、基準処理負荷は、機械学習モデルが車両２の安全性に関連するモデルである場合、機械学習モデルが車両２に起因する環境負荷に関連するモデルである場合、機械学習モデルが車両２内の乗員の快適性に関連するモデルである場合の順に低くなる。したがって、基準処理負荷は、機械学習モデルが車両２の安全性に関連するモデルである場合には、機械学習モデルが車両２の安全性に関連しないモデルである場合に比べて、高く設定される。

車両２の安全性に関連するモデルとしては、例えば、車両２に搭載された車両の運転に関する制御機器２２（例えば、内燃機関や電動モータ、制動装置、操舵装置など）や、安全性に関するセンサ２３（例えば、外部カメラ、ドライバモニタカメラ、レーダなど）の故障を検出するのに使われるモデルが考えられる。斯かるモデルとしては、具体的には、例えば、様々なセンサ２３によって検出された状態パラメータの値やＥＣＵ１１から制御機器２２への制御指令値を入力パラメータとし、各機器の故障の有無を出力パラメータとするモデルが考えられる。また、車両２に起因する環境負荷に関連するモデルとしては、例えば、上述した排気ガスの温度を推定するモデルが考えられる。加えて、車両２内の乗員の快適性に関連するモデルとしては、例えば、上述した空調装置の目標温度を推定するモデルが考えられる。

ここで、基準処理負荷は、サーバ３で機械学習が行われる優先度を表している。基準処理負荷が低い場合にはサーバ３において機械学習が行われにくく、よって機械学習にかかる時間が長い車両２での機械学習が行われ易い。したがって、基準処理負荷が低いことは、サーバ３で機械学習が行われる優先度が低いことを意味しており、逆に、基準処理負荷が高いことは、サーバ３で機械学習が行われる優先度が高いことを意味している。したがって、上述したように機械学習モデルの種類に応じて基準処理負荷を変更することにより、車両２の安全性に関連するモデルのサーバ３での機械学習の優先度を高くすることができ、また、乗員の快適性に関連するモデルのサーバ３での機械学習の優先度を低くすることができる。

処理量決定部３３２により機械学習モデルの機械学習をサーバ３で行うことが決定されると、サーバ側送信部３３４は、外部通信モジュール３１を介して、車両２へサーバ３で機械学習を行う旨の通知を送信する（ステップＳ１６）。

車両側受信部１４８がサーバ３で機械学習を行う旨の通知を受信すると、車両側送信部１４７は、車両２の機械学習モデルの機械学習をするために必要な情報を、車外通信モジュール２１を介して送信する（ステップＳ１７）。機械学習するために必要な情報は、例えば、データセット生成部１４３によって生成された訓練データセット及び機械学習モデルの現在のモデルパラメータの値を含む。

サーバ側受信部３３５が外部通信モジュール３１を介して機械学習するために必要な情報を受信すると、サーバ側学習部３３３は、機械学習モデルのモデルパラメータの値を機械学習する（ステップＳ１８）。サーバ側学習部３３３は、車両２から送信された現在のモデルパラメータの値を初期値として、訓練データセットを用いて、上述したような誤差逆伝播法などの公知の手法によってモデルパラメータの値を更新する。この結果、サーバ側学習部３３３により学習済みの機械学習モデル（より詳細には、新たな訓練データセットに基づく再学習済みの機械学習モデル）が生成される。学習済みの機械学習モデルを構成するモデルパラメータ（重みｗ及びバイアスｂ）の値は、サーバ３の記憶装置３２に記憶される。

サーバ側学習部３３３における機械学習モデルの機械学習が完了すると、サーバ側送信部３３４は、外部通信モジュール３１を介して、サーバ側学習部３３３による機械学習によって得られたモデルパラメータの値を車両２に送信する（ステップＳ１９）。

車両２の車両側受信部１４８がサーバ３から車外通信モジュール２１を介してモデルパラメータの値を受信すると、車両２のモデル更新部１４６は制御部１４１で用いられる機械学習モデルを構成するモデルパラメータの値を、サーバ３から受信した値に更新する（ステップＳ２０）。その後、制御部１４１は、更新されたモデルパラメータの値を用いた機械学習モデルに基づいて制御機器２２の制御を行う。

以上説明したように、本実施形態に係る図７に示した例ではサーバ３の現在の処理負荷が基準処理負荷以下であると判定されており、この場合には、車両２での機械学習の処理量がゼロと決定され、サーバ３での機械学習の処理量が、訓練データセットに基づく機械学習の全処理量に決定されることがわかる。換言すると、この場合には、車両２での機械学習とサーバ３での機械学習との処理比率が０：１に決定されることがわかる。

図８は、機械学習モデルの機械学習が車両２によって行われる場合の学習処理の動作シーケンス図である。したがって、図８は、サーバ３における処理負荷が高い場合の学習処理の流れを示している。

図８からわかるように、機械学習モデルの機械学習が車両２によって行われる場合も、機械学習モデルの機械学習を行う主体を決定するまで（ステップＳ１１～Ｓ１４は、機械学習モデルの機械学習が車両２によって行われる場合と同様な処理が行われる。

図８に示した例でも、処理量決定部３３２は、サーバ３の現在の処理負荷に基づいて、サーバ３及び車両２のうち機械学習モデルの機械学習を行う主体を決定する（ステップＳ１５）。そして、ステップＳ１５において処理量決定部３３２により機械学習モデルの機械学習を車両２で行うことが決定されると、サーバ側送信部３３４は、外部通信モジュール３１を介して、車両２へサーバ３で機械学習を行う旨の通知を送信する（ステップＳ２１）。

車両側受信部１４８が車両２で機械学習を行う旨の通知を受信すると、サーバ３へ訓練データセット及び現在のモデルパラメータの値が送信されることなく、車両側学習部１４５が機械学習モデルのモデルパラメータの値を機械学習する（ステップＳ２２）。車両側学習部１４５での機械学習は、サーバ側学習部３３３での機械学習と同様に行われ、車両側学習部１４５は学習済みの機械学習モデルを生成する。学習済みの機械学習モデルを構成するモデルパラメータの値は、車両２の記憶装置３２に記憶される。

車両側学習部１４５における機械学習モデルの機械学習が完了すると、車両２のモデル更新部１４６は制御部１４１で用いられる機械学習モデルを構成するモデルパラメータの値を、車両側学習部１４５における学習によって得られた値に更新する（ステップＳ２３）。その後、制御部１４１は、更新されたモデルパラメータの値を用いた機械学習モデルに基づいて制御機器２２の制御を行う。

以上説明したように、本実施形態に係る図８に示した例ではサーバ３の現在の処理負荷が基準処理負荷よりも高いと判定されており、この場合には、サーバ３での機械学習の処理量がゼロと決定され、車両２での機械学習の処理量が、訓練データセットに基づく機械学習の全処理量に決定されることがわかる。換言すると、この場合には、車両２での機械学習とサーバ３での機械学習との処理比率が１：０に決定されることがわかる。

≪効果≫
上記実施形態に係る機械学習システム１及び機械学習システム１において実行される機械学習方法によれば、サーバ３における処理負荷が低いときにはサーバ３にて車両２の機械学習モデルの機械学習が行われ、サーバ３における処理負荷が高いときには車両２にて車両２の機械学習モデルの機械学習が行われる。この結果、できる限り処理速度の速いサーバ３にて機械学習モデルの機械学習を行いつつ、多数の車両からサーバ３に機械学習の依頼があるような場合においてもサーバ３の処理負荷が過剰に高くなってしまうことが抑制される。

＜第二実施形態＞
次に、図９及び図１０を参照して、第二実施形態に係る機械学習システム１及び機械学習システム１において行われる機械学習方法について説明する。第二実施形態に係る機械学習システム１の構成及び処理は基本的に第一実施形態に係る機械学習システム１の構成及び処理と同様である。以下では、第一実施形態に係る機械学習システム１と異なる点を中心に説明する。

第一実施形態に係る機械学習システム１では、サーバ３及び車両２のうち機械学習モデルの機械学習を行う主体を決定するにあたって用いられる基準処理負荷は、一定値又は機械学習モデルの種類に応じて変化する値とされている。これに対して本実施形態では、基準処理負荷は、サーバ３で機械学習を行った場合に車両２において学習済みのモデルパラメータの値が得られるまでに必要な時間（以下、「サーバ処理必要時間」ともいう）と、車両２で機械学習を行った場合に車両２において学習済みのモデルパラメータの値が得られるまでに必要な時間（以下、「車両処理必要時間」ともいう）とを考慮して設定される。

より詳細には、本実施形態では、サーバ処理必要時間が車両処理必要時間よりも長い場合には、サーバ３にて処理を行う必要性が低いことから車両２にて機械学習が行われ、サーバ処理必要時間が車両処理必要時間以下である場合には、サーバ３又は車両２にて機械学習が行われるように、基準処理負荷が設定される。以下では、基準処理負荷の具体的な設定手法について説明する。

図９は、本実施形態に係るサーバ３のプロセッサ３３の機能ブロック図である。図９に示したように、本実施形態では、プロセッサ３３は、第一実施形態に係るプロセッサ３３の機能ブロックに加えて、基準処理量を算出する基準処理量算出部３３６を備える。

図１０は、本実施形態に係る機械学習モデルの機械学習がサーバ３によって行われる場合の学習処理の、図７と同様な動作シーケンス図である。図１０に示したように、本実施形態では、サーバ側受信部３３５が外部通信モジュール３１を介して依頼信号を受信すると、基準処理量算出部３３６が基準処理量を算出する。

基準処理量算出部３３６は、基準処理量を算出するにあたって、データセット生成部１４３によって生成された訓練データセットに基づいて機械学習モデルの機械学習を車両側学習部１４５において行ったと仮定した場合にかかる予想車両学習時間を算出する。予想車両学習時間は、例えば、車両２のプロセッサ１４による演算能力及び半導体メモリの容量に基づく処理能力と、訓練データセットのサイズ及び機械学習モデルの構成とに基づいて算出される。予想車両学習時間は、車両２の処理能力が高くなるほど短なるように算出され、訓練データセットのサイズが大きくなるほど及び機械学習モデルの構成が複雑になるほど長くなるように算出される。

加えて、基準処理量算出部３３６は、基準処理量を算出するにあたって、訓練データセット及びモデルパラメータの値の車両２とサーバ３との間での送受信に必要な予想通信時間を算出する。この予想通信時間は、サーバ３によって機械学習が行われるときに必要となる時間である。予想通信時間は、例えば、訓練データセットのサイズ及び機械学習モデルのモデルパラメータの数と、車両２とサーバ３との間の無線通信の通信強度とに基づいて算出される。予想通信時間は、訓練データセットのサイズが大きくなるほど及びモデルパラメータの数が多くなるほど長くなるように算出され、無線通信の通信強度が高いほど短くなるように算出される。無線通信の通信強度は、現在の通信強度のみならず、将来の予想通信強度を含んでもよい。将来の予想通信強度は、例えば、車両２の将来の走行予定経路から推定される。したがって、例えば、車両２が通信強度の低い山道を走行することが予定されている場合には、将来の予想通信強度は低い値に設定される。

その後、基準処理量算出部３３６は、車両２での予想車両学習時間から予想通信時間を減算した差分時間を算出する。サーバ３での機械学習にかかる時間がこのようにして算出された差分時間よりも長くなる場合にはサーバ処理必要時間が車両処理必要時間よりも長くなることを意味する。一方、サーバ３での機械学習にかかる時間がこのようにして算出された差分時間以下である場合にはサーバ処理必要時間が車両処理必要時間以下であることを意味する。

一方、サーバ３での演算処理速度は、サーバ３の処理負荷に応じて変化する。サーバ３の処理負荷が高いときには、サーバ３での演算処理速度は遅く、よって機械学習に必要な時間が長くなる。逆に、サーバ３の処理負荷が低いときには、サーバ３での演算処理速度速く、よって機械学習に必要な時間が短くなる。

そこで、本実施形態では、基準処理量算出部３３６は、サーバ３において機械学習モデルの機械学習を行うのに上記差分時間が必要になるような負荷（以下、「差分時間相当負荷」という）を基準処理負荷として設定する。この結果、サーバ３では現在の処理負荷が基準処理負荷以下であるときに機械学習が行われることから、サーバ処理必要時間が車両処理必要時間以下であるときにのみサーバ３にて機械学習が行われることになる。

なお、本実施形態では、基準処理負荷は、差分時間相当負荷に設定されている。しかしながら、基準処理負荷は、差分時間相当負荷よりも低い負荷に設定されてもよい。この場合であっても、サーバ処理必要時間が車両処理必要時間以下であるときにのみサーバ３に機械学習を行わせることができる。また、基準処理負荷は、例えば、差分時間相当負荷よりも低い負荷であって且つ機械学習モデルの種類に応じて変化する負荷であってもよい。

＜第三実施形態＞
次に、図１１を参照して、第三実施形態に係る機械学習システム１及び機械学習システム１において行われる機械学習方法について説明する。第三実施形態に係る機械学習システム１の構成及び処理は基本的に第一実施形態及び第二実施形態に係る機械学習システム１の構成及び処理と同様である。以下では、第一実施形態及び第二実施形態に係る機械学習システム１と異なる点を中心に説明する。

上記第一実施形態及び第二実施形態に係る機械学習システム１では、車両２又はサーバ３のいずれか一方において、全ての機械学習処理が行われる。これに対して、本実施形態では、機械学習モデルの機械学習処理は、サーバ３の処理負荷に応じて、車両２とサーバ３とで分散して行われる。

図１１は、本実施形態に係る学習処理の、図７と同様な動作シーケンス図である。図７において行われる処理と同様な処理には同様なステップ番号が付されており、これら処理については説明を省略する。

本実施形態では、図１１に示したように、サーバ側受信部３３５が依頼信号を受信すると、処理量決定部３３２が、処理負荷検出部３３１によって検出されたサーバ３の現在の処理負荷に基づいて、サーバ３及び車両２のそれぞれで行う機械学習の処理量を決定する（ステップＳ３５）。本実施形態では、サーバ３の現在の処理負荷が高いほど、サーバ３での機械学習の処理量を減少させ、車両２での機械学習の処理量を増大させる。なお、サーバ３及び車両２での機械学習の処理量は処理負荷に応じて段階的に変化してもよいし、連続的に変化してもよい。したがって、以上をまとめて表現すると、第一実施形態及び第二実施形態を含む全ての実施形態では、サーバ３の現在の処理負荷が相対的に高いときには相対的に低いときに比べてサーバ３における機械学習の処理量が少なくされる。

処理量決定部３３２により処理量が決定されると、サーバ側送信部３３４は、外部通信モジュール３１を介して、車両２へ、車両２及びサーバ３それぞれの処理量の通知を送信する（ステップＳ３６）。車両側受信部１４８が通知を受信すると、車両側送信部１４７は、車両２の機械学習モデルの機械学習を行うために必要な情報を、車外通信モジュール２１を介して送信する（ステップＳ１７）。

サーバ側受信部３３５が外部通信モジュール３１を介して機械学習するために必要な情報を受信すると、サーバ側学習部３３３は、ステップＳ３５で決定されたサーバ３での処理量に応じて、機械学習モデルのモデルパラメータの値を機械学習する（ステップＳ３７）。サーバ側学習部３３３は、車両２から送信された現在のモデルパラメータの値を初期値として、訓練データセットを用いて、上述したような誤差逆伝播法などの公知の手法によってモデルパラメータの値を更新する。このとき、サーバ側学習部３３３は、ステップＳ３５で決定されたサーバ３での処理量が機械学習の全処理量でない限り、機械学習モデルの機械学習が完了する前に機械学習処理を終了する。

サーバ側学習部３３３における機械学習モデルの学習が終了されると、サーバ側送信部３３４は、外部通信モジュール３１を介して、サーバ側学習部３３３による機械学習によって得られた学習途中のモデルパラメータの値を車両２に送信する（ステップＳ３８）。

車両側受信部１４８が学習途中のモデルパラメータの値を受信すると、車両側学習部１４５は、サーバ３から送信された学習途中のモデルパラメータの値を初期値として、訓練データセットを用いて、ステップＳ３５で決定された車両２での処理量に応じて、機械学習モデルのモデルパラメータの値を機械学習する（ステップＳ３９）。車両側学習部１４５での機械学習は、学習が完了するまで行われ、車両側学習部１４５は学習済みの機械学習モデルを生成する。

なお、上記実施形態では、処理量決定部３３２が、サーバ３及び車両２のそれぞれで行う機械学習の処理量を決定している。しかしながら、処理量決定部３３２は、サーバ３によって行われる処理量と車両２で行われる処理量との比率（処理比率）を決定してもよい。また、上記実施形態では、最初にサーバ３にて機械学習モデルの機械学習が途中まで行われ、その後、車両２にて機械学習モデルの機械学習が完了するまで行われている。しかしながら、最初に車両２にて機械学習モデルの機械学習が途中まで行われ、その後、サーバ３にて機械学習モデルの機械学習が完了するまで行われてもよい。

以上、本発明に係る好適な実施形態を説明したが、本発明はこれら実施形態に限定されるものではなく、特許請求の範囲の記載内で様々な修正及び変更を施すことができる。

１機械学習システム
２車両
３サーバ
１１ＥＣＵ
１３記憶装置
１４プロセッサ
２２制御機器
２３センサ
３２記憶装置
３３プロセッサ

Claims

搭載された機器を制御するのに用いられる機械学習モデルを有する車両と、該車両と通信可能なサーバとを備える機械学習システムにおいて行われる、前記機械学習モデルを構成するモデルパラメータの値を機械学習する、機械学習方法であって、
前記車両が前記サーバへ前記モデルパラメータの値の機械学習を依頼する依頼信号を送信することと、
前記サーバが該サーバの現在の処理負荷を検出することと、
前記車両から前記依頼信号を受信したときに、前記サーバが、前記処理負荷に基づいて、前記サーバ及び前記車両それぞれで行う前記機械学習の処理量又は処理比率を決定することと、
前記サーバが、前記決定された該サーバにおける前記機械学習の処理量又は処理比率に応じて、前記モデルパラメータの値を機械学習するための訓練データセットに基づいて前記モデルパラメータの値を機械学習することと、
前記車両が、前記決定された該車両における前記機械学習の処理量又は処理比率に応じて、前記訓練データセットに基づいて前記モデルパラメータの値を機械学習すること、とを含み、
前記サーバは、前記処理負荷が相対的に高いときには相対的に低いときに比べて前記サーバにおける前記機械学習の処理量又は処理比率を少なくする、機械学習方法。
前記サーバは、前記処理負荷が所定の基準処理負荷よりも高いときには前記機械学習の全ての処理を前記車両にて行わせることを決定し、且つ、前記処理負荷が前記基準処理負荷以下であるときには前記機械学習の全ての処理を前記サーバにて行わせることを決定する、請求項１に記載の機械学習方法。
前記基準処理負荷は、前記機械学習モデルの種類に応じて変更される、請求項２に記載の機械学習方法。
前記基準処理負荷は、前記機械学習モデルが前記車両の安全性に関連するモデルである場合には、前記機械学習モデルが前記車両の安全性に関連しないモデルである場合に比べて、高い、請求項３に記載の機械学習方法。
前記車両で前記訓練データセットに基づいて前記機械学習を行った場合の予想学習時間と前記訓練データセット及び前記モデルパラメータの前記車両と前記サーバとの間の送受信に必要な予想通信時間とを算出することを更に含み、
前記基準処理負荷は、前記サーバにおいて前記モデルパラメータの値を機械学習するのに前記予想学習時間から前記予想通信時間を減算した時間が必要になるような負荷又はそれよりも低い負荷である、請求項２～４のいずれか１項に記載の機械学習方法。
前記車両で前記訓練データセットに基づいて前記機械学習を行った場合の予想学習時間と、前記訓練データセットの前記車両と前記サーバとの間での送受信に必要な予想通信時間とを算出することをさらに含み、
前記サーバは、前記処理負荷が相対的に高いときには相対的に低いときに比べて前記サーバにおける前記機械学習の処理量又は処理比率が少なくなるように、予想学習時間から予想通信時間を減算した値に基づいて、前記機械学習の処理量又は処理比率を連続的又は段階的に変化させる、請求項１に記載の機械学習方法。
搭載された機器を制御するのに用いられる機械学習モデルを有する車両と通信可能であり且つ前記機械学習モデルを構成するモデルパラメータの値を機械学習するサーバであって、
前記サーバが該サーバの現在の処理負荷を検出する処理負荷検出部と、
当該サーバへ前記モデルパラメータの値の機械学習を依頼する依頼信号を前記車両から受信したときに、前記処理負荷に基づいて、前記サーバ及び前記車両それぞれで行う前記機械学習の処理量又は処理比率を決定する処理量決定部と、
前記決定された該サーバにおける前記機械学習の処理量又は処理比率に応じて、前記モデルパラメータの値を機械学習するための訓練データセットに基づいて前記モデルパラメータの値を機械学習する学習部と、
前記学習部による前記モデルパラメータの値の機械学習が行われた場合に該機械学習によって得られた前記モデルパラメータの値を前記車両に送信する送信部と、を有し、
前記処理量決定部は、前記処理負荷が相対的に高いときには相対的に低いときに比べて前記サーバにおける前記機械学習の処理量又は処理比率を少なくする、サーバ。
搭載された機器を制御するのに用いられる機械学習モデルを有する車両と、該車両と通信可能なサーバとを備え、前記機械学習モデルを構成するモデルパラメータの値を機械学習する、機械学習システムであって、
前記車両は、
前記サーバへ前記モデルパラメータの値の機械学習を依頼する依頼信号を送信する学習依頼送信部と、
前記モデルパラメータの値を機械学習するための訓練データセットに基づいて前記モデルパラメータの値を機械学習する車両側学習部と、を備え、
前記サーバは、
前記サーバの現在の処理負荷を検出する処理負荷検出部と、
前記車両から前記依頼信号を受信したときに、前記処理負荷に基づいて、前記サーバ及び前記車両それぞれで行う前記機械学習の処理量又は処理比率を決定する処理量決定部と、
前記訓練データセットに基づいて前記モデルパラメータの値を機械学習するサーバ側学習部と、を備え、
前記サーバ側学習部及び前記車両側学習部は、それぞれ、前記決定された前記機械学習の処理量又は処理比率に応じて、前記モデルパラメータの値を機械学習する学習部を備え、
前記処理量決定部は、前記処理負荷が相対的に高いときには相対的に低いときに比べて前記サーバ側学習部における前記機械学習の処理量又は処理比率を少なくする、機械学習システム。