JP7040571B2 - 学習装置及びモデル学習システム - Google Patents

学習装置及びモデル学習システム Download PDF

Info

Publication number
JP7040571B2
JP7040571B2 JP2020148484A JP2020148484A JP7040571B2 JP 7040571 B2 JP7040571 B2 JP 7040571B2 JP 2020148484 A JP2020148484 A JP 2020148484A JP 2020148484 A JP2020148484 A JP 2020148484A JP 7040571 B2 JP7040571 B2 JP 7040571B2
Authority
JP
Japan
Prior art keywords
vehicle
server
learning
learning model
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020148484A
Other languages
English (en)
Other versions
JP2022042857A (ja
Inventor
大樹 横山
亮 中林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2020148484A priority Critical patent/JP7040571B2/ja
Priority to DE102021118615.3A priority patent/DE102021118615A1/de
Priority to US17/462,566 priority patent/US11820398B2/en
Priority to CN202111027569.3A priority patent/CN114139715A/zh
Publication of JP2022042857A publication Critical patent/JP2022042857A/ja
Application granted granted Critical
Publication of JP7040571B2 publication Critical patent/JP7040571B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C5/00Registering or indicating the working of vehicles
    • G07C5/008Registering or indicating the working of vehicles communicating information to a remotely located station
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Automation & Control Theory (AREA)
  • Human Computer Interaction (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Feedback Control In General (AREA)
  • Traffic Control Systems (AREA)

Description

本発明は学習装置及びモデル学習システムに関する。
特許文献1には、サーバや車両で学習を行った例えばニューラルネットワークモデルのような学習モデルを用いて、車両に搭載された内燃機関の排気浄化触媒の温度を推定するものが開示されている。
特開2019-183698号公報
移動又は持ち運びが可能な各種の機器(例えば、車両などの輸送機器やスマートフォンなどの携帯機器)に学習モデルを搭載して当該機器の制御を行うことが想定される。移動又は持ち運びが可能な機器であっても、各機器が使用されるエリアは通常は或る程度限定され、例えば輸送機器の代表例である車両の場合、自家用車であれば、基本的に各自家用車の所有者の生活圏内において使用され、タクシーやバス、モビリティサービス用の多目的車両といった商用車であれば、基本的に各商用車を所有する事業者のサービス提供地域内において使用される。また、携帯機器の代表例であるスマートフォンであれば、基本的に所有者の生活圏内において使用される。
したがって、各機器で使用される学習モデルを学習させる際には、各機器が日常的に使用される使用エリアの特性に応じた適切な訓練データセットを用いて学習を行うことで、各機器の使用エリアの特性に応じて最適化された精度の高い学習モデルを生成することができる。
しかしながら、移動又は持ち運びが可能な機器の場合、各機器を普段の使用エリアとは異なる別のエリア(例えば、旅行先や転居先、多目的車両の臨時派遣先など)で使用することになる場合がある。この場合、各機器の学習モデルは、普段の使用エリアの特性に応じて最適化された学習モデルであり、別のエリアの特性を反映させた学習が行われていないため、各機器を普段の使用エリアとは異なる別のエリアで使用すると、学習モデルの精度が低下するおそれがある。
本発明はこのような問題点に着目してなされたものであり、学習モデルが搭載された機器を普段の使用エリアとは異なるエリアで使用するときに、学習モデルの精度が低下するのを抑制することを目的とする。
上記課題を解決するために、本発明のある態様による学習装置は、学習モデルが搭載された複数の機器と通信可能に構成される。そして学習装置は、複数の機器のうち、所定の第1エリアで取得された訓練データセットを用いて学習された学習モデルが搭載されて制御が行われる第1機器が、所定の第2エリアで使用されるときは、第2エリアで取得された訓練データセットを用いて第1機器に搭載された学習モデルの再学習を実施するように構成される。
また本発明のある態様によるモデル学習システムは、サーバと、前記サーバと通信可能に構成された複数の機器と、を備える。そしてサーバは、複数の機器のうち、所定の第1エリアで取得された訓練データセットを用いて学習された学習モデルが搭載されて制御が行われる第1機器が、所定の第2エリアで使用されるときは、第2エリアで取得された訓練データセットを用いて学習モデルの再学習を実施するように構成される。
本発明のこれらの態様によれば、学習モデルが搭載された機器を普段の使用エリアとは異なるエリアで使用した場合であっても、学習モデルの精度が低下するのを抑制することができる。
図1は、本発明の一実施形態によるモデル学習システムの概略構成図である。 図2は、本発明の一実施形態による車両のハードウェア構成の一部を示す概略図である。 図3は、本発明の一実施形態による学習モデルの一例を示す図である。 図4は、各スマートシティの特性に応じた適切な訓練データセットを取得するために、サーバと、各車両と、の間で実行される処理の一例を示すフローチャートである。 図5は、各スマートシティの特性に応じた適切な学習モデルを生成するために、サーバと、第1スマートシティ内及び第2スマートシティ内の各多目的車両と、の間で実行される処理の一例を示すフローチャートである。 図6は、第2スマートシティ内で多目的車両が不足しているか、又は不足するおそれがあるときに、サーバと、第1スマートシティ内の各多目的車両と、の間で実行される処理の一例を示すフローチャートである。
以下、図面を参照して本発明の一実施形態について詳細に説明する。なお、以下の説明では、同様な構成要素には同一の参照番号を付す。
図1は、本発明の一実施形態によるモデル学習システム100の概略構成図である。
本実施形態によるモデル学習システム100は、サーバ1と、移動又は持ち運びが可能な機器の一例としての複数の車両2と、を備える。
サーバ1は、サーバ通信部11と、サーバ記憶部12と、サーバ処理部13と、を備える。
サーバ通信部11は、サーバ1を例えばゲートウェイ等を介してネットワーク3と接続するための通信インターフェース回路を有し、各車両2との間で相互に通信することができるように構成される。
サーバ記憶部12は、HDD(Hard Disk Drive)や光記録媒体、半導体メモリ等の記憶媒体を有し、サーバ処理部13での処理に用いられる各種のコンピュータプログラムやデータ等を記憶する。
サーバ処理部13は、一又は複数個のプロセッサ及びその周辺回路を有する。サーバ処理部13は、サーバ記憶部12に格納された各種のコンピュータプログラムを実行し、サーバ1の全体的な動作を統括的に制御するものであり、例えばCPU(Central Processing Unit)である。
本実施形態における車両2は、移動や物流、物販など、多目的な用途に使用されるモビリティサービス用の多目的車両であって、加速、操舵、及び制動に関する運転操作が自動的に行われるように構成される。また本実施形態では、各車両2は、図1に示すように特定のスマートシティ(本実施形態では、第1スマートシティ110又は第2スマートシティ120)と関連付けられており、基本的に関連付けられたスマートシティ内で使用される。
以下では、便宜上、第1スマートシティ110と関連付けられて基本的に第1スマートシティ110内で使用されることになる車両2のことを、必要に応じて第1多目的車両2aといい、第2スマートシティ120と関連付けられて基本的に第2スマートシティ120内で使用されることになる車両2のことを、必要に応じて第2多目的車両2bという。なお車両2は、動力源として内燃機関のみを備える車両であってもよいし、ハイブリッド車両やプラグインハイブリッド車両、電動車両(電気自動車や燃料電池自動車など)であってもよい。
図2は、車両2のハードウェア構成の一部を示す概略図である。
車両2は、電子制御ユニット20と、車外通信装置24と、例えば内燃機関や電動機、エアコン等の車両2に搭載される各種の制御部品25と、各種の制御部品25を制御したり、後述する学習モデルの入力パラメータ及び出力パラメータの実測値を検出したりするために必要な各種のセンサ類26と、を備える。電子制御ユニット20、車外通信装置24、及び各種の制御部品25やセンサ類26は、CAN(Controller Area Network)等の規格に準拠した車内ネットワーク27を介して互いに接続される。
電子制御ユニット20は、車内通信インターフェース21、車両記憶部22及び車両処理部23、を備える。車内通信インターフェース21、車両記憶部22及び車両処理部23、信号線を介して互いに接続されている。
車内通信インターフェース21は、CAN(Controller Area Network)等の規格に準拠した車内ネットワーク27に電子制御ユニット20を接続するための通信インターフェース回路である。
車両記憶部22は、HDD(Hard Disk Drive)や光記録媒体、半導体メモリ等の記憶媒体を有し、車両処理部23での処理に用いられる各種のコンピュータプログラムやデータ等を記憶する。
車両処理部23は、一又は複数個のプロセッサ及びその周辺回路を有する。車両処理部23は、車両記憶部22に格納された各種のコンピュータプログラムを実行し、車両2に搭載された各種の制御部品を統括的に制御するものであり、例えばCPUである。
車外通信装置24は、無線通信機能を有する車載の端末である。車外通信装置24は、ネットワーク3(図1参照)と不図示のゲートウェイ等を介して接続される無線基地局4(図1参照)にアクセスすることで、無線基地局4を介してネットワーク3と接続される。これにより、サーバ1との間で相互に通信が行われる。
各車両2では、各車両2に搭載された各種の制御部品25を制御するにあたり、例えば機械学習などの学習を実施した学習モデル(人工知能モデル)が必要に応じて使用されている。本実施形態では、学習モデルとして、ディープニューラルネットワーク(DNN;Deep Neural Network)や畳み込みニューラルネットワーク(CNN;Convolutional Neural Network)などを用いたニューラルネットワークモデル(以下「NNモデル」という。)に対して深層学習を実施したものを使用している。したがって、本実施形態による学習モデルは、深層学習を実施した学習済みのNNモデルということもできる。深層学習は、人工知能(AI;Artificial Intelligence)を代表する機械学習手法の一つである。
図3は、本実施形態による学習モデル(NNモデル)の一例を示す図である。
図3における丸印は人工ニューロンを表す。人工ニューロンは、通常、ノード又はユニットと称される(本明細書では、「ノード」と称す)。図3において、L=1は入力層を示し、L=2及びL=3は隠れ層を示し、L=4は出力層を示している。隠れ層は、中間層とも称される。なお、図3には、隠れ層が2層のNNモデルを例示しているが、隠れ層の層数は特に限られるものではなく、また、入力層、隠れ層及び出力層の各層のノードの数も特に限られるものではない。
図3において、x及びxは入力層(L=1)の各ノード及びそのノードからの出力値を示しており、yは出力層(L=4)のノード及びその出力値を示している。同様に、z (L=2) (L=2)及びz (L=2)は隠れ層(L=2)の各ノード及びそのノードからの出力値を示しており、z (L=3)及びz (L=3)は隠れ層(L=3)の各ノード及びそのノードからの出力値を示している。
入力層の各ノードでは入力がそのまま出力される。一方、隠れ層(L=2)の各ノードには、入力層の各ノードの出力値x及びxが入力され、隠れ層(L=2)の各ノードでは、それぞれ対応する重みw及びバイアスbを用いて総入力値uが算出される。例えば、図3において隠れ層(L=2)のz (L=2)(k=1、2、3)で示される各ノードにおいて算出される総入力値u (L=2)は、次式のようになる(Mは入力層のノードの数)。
Figure 0007040571000001
次いで、この総入力値u (L=2)は活性化関数fにより変換され、隠れ層(L=2)のz (L=2)で示されるノードから、出力値z (L=2)(=f(u (L=2)))として出力される。一方、隠れ層(L=3)の各ノードには、隠れ層(L=2)の各ノードの出力値z (L=2) (L=2)及びz (L=2)が入力され、隠れ層(L=3)の各ノードでは、それぞれ対応する重みw及びバイアスbを用いて総入力値u(=Σz・w+b)が算出される。この総入力値uは同様に活性化関数により変換され、隠れ層(L=3)の各ノードから、出力値z (L=3)、z (L=3)として出力される。活性化関数は例えばシグモイド関数σである。
また、出力層(L=4)のノードには、隠れ層(L=3)の各ノードの出力値z (L=3)及びz (L=3)が入力され、出力層のノードでは、それぞれ対応する重みw及びバイアスbを用いて総入力値u(Σz・w+b)が算出されるか、又は、それぞれ対応する重みwのみを用いて総入力値u(Σz・w)が算出される。例えば、出力層のノードでは活性化関数として恒等関数が用いられる。この場合、出力層のノードにおいて算出された総入力値uが、そのまま出力値yとして出力層のノードから出力される。
このように本実施形態による学習モデルは、入力層と、隠れ層と、出力層と、を備え、一又は複数の入力パラメータが入力層から入力されると、入力パラメータに対応する一又は複数の出力パラメータを出力層から出力する。
入力パラメータの例としては、例えば学習モデルを用いて車両2に搭載されたエアコンを制御する場合であれば、外気温や車両2の使用場所(緯度及び経度)、日時、直前の駐車時間(走行前の駐車時間)といった、車内温度に影響を与える各種パラメータが挙げられる。そして、このような入力パラメータに対応する出力パラメータの例としては、エアコンの設定温度が挙げられる。これにより、出力パラメータとして取得された設定温度となるようにエアコンを制御することで、車内温度を適切な温度に維持することができる。
また、入力パラメータの例としては、例えば学習モデルを用いて車両2に搭載された内燃機関を制御する場合であれば、機関回転速度や機関冷却水温度、燃料噴射量、燃料噴射時期、燃圧、吸入空気量、吸気温度、EGR率、過給圧といった、内燃機関の運転状態を示す各種パラメータの現在値が挙げられる。そして、このような入力パラメータに対応する出力パラメータの例としては、排気中のCO濃度やNOx濃度、その他の物質の濃度、機関出力トルクといった内燃機関の性能を表す各種パラメータの推定値が挙げられる。これにより、NNモデルに内燃機関の運転状態を示す各種パラメータの現在値を入力パラメータとして入力することで、内燃機関の性能を表す各種パラメータの推定値(現在の推定値又は将来の推定値)を出力パラメータとして取得することができるので、例えば出力パラメータに基づいて、内燃機関の性能が所望の性能に近づくように内燃機関を制御することができる。また、出力パラメータを実測するためのセンサ等を備える場合には、実測値と推定値との差に応じて、内燃機関やセンサ等の故障を判断したりすることもできる。
学習モデルの精度を向上させるためには、学習モデルを学習させる必要がある。学習モデルの学習には、入力パラメータの実測値と、この入力パラメータの実測値に対応した出力パラメータの実測値(正解データ)と、を含む多数の訓練データセットが用いられる。多数の訓練データセットを用いて、公知の誤差逆伝搬法によってニューラルネットワーク内の重みw及びバイアスbの値を繰り返し更新することで、重みw及びバイアスbの値が学習され、学習モデルの精度が向上する。
ここで、例えば第1多目的車両2aや第2多目的車両2bのように、基本的に使用エリアが決まっている車両2の場合、車両2の使用エリアの特性(例えば、エリア内の気候や地形、環境基準、住人の年齢層など)に応じた適切な訓練データセットを用いて車両2で使用する学習モデルの学習を行うことで、車両2の使用エリアの特性に応じて最適化された学習モデルを生成することができる。
これにより、学習モデルに入力パラメータを入力することによって、使用エリアの特性に応じた適切な出力パラメータを得ることができる。そのため、例えばエアコンを制御する場合であれば、車内温度を使用エリアの特性に応じた適切な温度に維持することができる。また、内燃機関を制御する場合であれば、例えば排気中のCO濃度やNOx濃度などを使用エリアの特性に応じた適切な濃度に制御することができる。
そのため本実施形態では、各車両2には、各車両2の使用エリアに応じた適切な訓練データセットを用いて学習させた学習モデルを搭載するようにしている。具体的には、第1多目的車両2aには、第1スマートシティ110内で取得された訓練データセットを用いて学習された学習モデルを搭載し、第2多目的車両2bには、第2スマートシティ120内で取得された訓練データセットを用いて学習された学習モデルを搭載するようにしている。
しかしながら、例えば第2スマートシティ120内でイベントの開催予定があって、第2スマートシティ120内での多目的車両の需要が一時的に増加することが予想される場合など、何らかの理由により、第1多目的車両2aを一時的に第2スマートシティ120に移動させて第2スマートシティ120内で使用することも考えられる。
ところが、第1多目的車両2aの学習モデルは、第1スマートシティ110の特性に応じて最適化された学習モデルであり、第2スマートシティ120の特性を反映させた学習が行われていないため、第1多目的車両2aを第2スマートシティ120で使用すると、学習モデルに入力パラメータを入力しても、入力パラメータに対応した適切な出力パラメータの値を得ることができないおそれがある。
そこで本実施形態では、何らかの理由により、第1多目的車両2aを第2スマートシティ120で使用することになった場合には、第1多目的車両2aに搭載された学習モデルを、第2スマートシティ120の特性に応じた適切な訓練データセットを用いて再学習させることとした。これにより、第1多目的車両2aの学習モデルを第2スマートシティ120にも対応させた学習モデルに更新することができるので、第1多目的車両2aを第2スマートシティ120で使用したときに、学習モデルを介して入力パラメータに対応した適切な出力パラメータの値を得ることができる。
図4は、本実施形態によるモデル学習システム100において、各スマートシティ110,120の特性に応じた適切な訓練データセットを取得するために、サーバ1と、車両2(多目的車両2a及び多目的車両2b)と、の間で実行される処理の一例を示すフローチャートである。
ステップS11において、車両2の電子制御ユニット20は、車両記憶部22に記憶された訓練データセットのデータ量が所定の送信規定量以上になっているか否かを判定する。電子制御ユニット20は、訓練データセットのデータ量が送信規定量以上になっていれば、ステップS12の処理に進む。一方で電子制御ユニット20は、訓練データセットのデータ量が送信規定量未満であれば、今回の処理を終了する。
なお本実施形態では、車両2の電子制御ユニット20は、車両走行中に、訓練データセット(学習モデルの入力パラメータの実測値と出力パラメータの実測値)を随時取得し、取得した訓練データセットを、取得場所情報(本実施形態では、第1スマートシティ110又は第2スマートシティ120)と関連付けて車両記憶部22に記憶している。
ステップS12において、車両2の電子制御ユニット20は、訓練データセットをその取得場所情報と共にサーバ1に送信し、送信後、車両記憶部22に記憶していた訓練データセットのデータを消去する。
ステップS13において、サーバ1は、車両2から訓練データセットを受信すると、訓練データセットの取得場所に応じて、訓練データセットをサーバ記憶部12の所定のデータベースに格納する。本実施形態ではサーバ1は、第1スマートシティ110内で取得された訓練データセットを、第1データベースに格納し、第2スマートシティ120内で取得された訓練データセットを、第2データベースに格納する。
図5は、本実施形態によるモデル学習システム100において、各スマートシティ110,120の特性に応じた適切な学習モデルを生成するために、サーバ1と、多目的車両2a及び多目的車両2bと、の間で実行される処理の一例を示すフローチャートである。
ステップS21において、サーバ1は、第1データベースに格納された訓練データセットのデータ量の、前回第1データベースに格納された訓練データセットを用いて学習を行ったときからの増加量が、所定の学習開始量以上になっているか否かを判定する。サーバ1は、第1データベースに格納された訓練データセットのデータ量の増加量が学習開始量以上であればば、ステップS22の処理に進む。一方でサーバ1は、第1データベースに格納された訓練データセットのデータ量の増加量が学習開始量未満であれば、ステップS26の処理に進む。
ステップS22において、サーバ1は、第1データベースに格納された直近の学習開始量分の訓練データセットを用いて学習を行った学習モデルを新たに作成する。
ステップS23において、サーバ1は、新たに作成した学習モデルを、第1スマートシティ110内で使用されている各多目的車両2aに送信する。
ステップS24において、多目的車両2aの電子制御ユニット20は、サーバ1から新たな学習モデルを受信したか否かを判定する。多目的車両2aの電子制御ユニット20は、サーバ1から新たな学習モデルを受信していれば、ステップS25の処理に進む。一方で多目的車両2aの電子制御ユニット20は、サーバ1から新たな学習モデルを受信していなければ、今回の処理を終了する。
ステップS25において、多目的車両2aの電子制御ユニット20は、自車両において使用していた学習モデルを、サーバ1から受信した新たな学習モデル、すなわち、第1スマートシティ110内で取得された直近の所定データ量分(学習開始量分)の訓練データセットを用いて学習が行われ、それにより第1スマートシティ110の最新の特性に応じて最適化された学習モデルに更新する。
ステップS26において、サーバ1は、第2データベースに格納された訓練データセットのデータ量の、前回第2データベースに格納された訓練データセットを用いて学習を行ったときからの増加量が、学習開始量以上になっているか否かを判定する。サーバ1は、第2データベースに格納された訓練データセットのデータ量の増加量が学習開始量以上になっていれば、ステップS27の処理に進む。一方でサーバ1は、第2データベースに格納された訓練データセットのデータ量の増加量が学習開始量未満であれば、今回の処理を終了する。
ステップS27において、サーバ1は、第2データベースに格納された直近の学習開始量分の訓練データセットを用いて学習を行った学習モデルを新たに作成する。
ステップS28において、サーバ1は、新たに作成した学習モデルを、第2スマートシティ120内で使用されている各多目的車両2bに送信する。
ステップS29において、多目的車両2bの電子制御ユニット20は、サーバ1から新たな学習モデルを受信したか否かを判定する。多目的車両2bの電子制御ユニット20は、サーバ1から新たな学習モデルを受信していれば、ステップS30の処理に進む。一方で多目的車両2bの電子制御ユニット20は、サーバ1から新たな学習モデルを受信していなければ、今回の処理を終了する。
ステップS30において、多目的車両2bの電子制御ユニット20は、自車両において使用していた学習モデルを、サーバ1から受信した新たな学習モデル、すなわち、第2スマートシティ120内で取得された直近の所定データ量分(学習開始量分)の訓練データセットを用いて学習が行われ、それにより第2スマートシティ120の最新の特性に応じて最適化された学習モデルに更新する。
図6は、本実施形態によるモデル学習システム100において、第2スマートシティ120内で多目的車両が不足しているか、又は不足するおそれがあるときに、サーバ1と、多目的車両2aと、の間で実行される処理の一例を示すフローチャートである。
ステップS31において、サーバ1は、第2スマートシティ120内で多目的車両が不足しているか、又は不足するおそれがあるか否かを判定する。第2スマートシティ120内で多目的車両が不足しているか、又は不足するおそれがあるか否かを判定する方法は特に限られるものではないが、例えば、人の動きを把握するための人流データ等に基づいて第2スマートシティ120内の混雑状況等を把握することにより判定することができる。サーバ1は、第2スマートシティ120内で多目的車両が不足しているか、又は不足するおそれがある場合は、ステップS32の処理に進む。一方でサーバ1は、第2スマートシティ120内で多目的車両が不足しておらず、また不足するおそれもない場合は、今回の処理を終了する。
ステップS32において、サーバ1は、第1スマートシティ110内の多目的車両2aの中から、第2スマートシティ120に一時的に移動させて稼働させることが可能な車両(以下「応援車両」という。)を必要数選択し、選択した応援車両(多目的車両2a)に対して移動要請を送信する。
ステップS33において、多目的車両2aの電子制御ユニット20は、移動要請を受信したか否かを判定する。多目的車両2aの電子制御ユニット20は、移動要請を受信していれば、ステップS34の処理に進み、移動要請を受信していなければ、今回の処理を終了する。
ステップS34において、多目的車両2aの電子制御ユニット20は、移動要請に基づいて自車両を移動要請のあった第2スマートシティ120へ向けて移動させると共に、自車両の学習モデルをサーバ1に送信する。
ステップS35において、サーバ1は、応援車両(すなわち、移動要請を送信した多目的車両2a)から学習モデルを受信したか否かを判定する。サーバ1は、応援車両から学習モデルを受信していれば、ステップS36の処理に進む。一方でサーバ1は、応援車両から学習モデルを受信していなければ、今回の処理を終了する。
ステップS36において、サーバ1は、第2データベースに格納されている、第2スマートシティ120内で取得された直近の所定データ量分(例えば、学習開始量分)の訓練データセット(すなわち、第2スマートシティ120の特性に応じた適切な訓練データセット)を用いて、応援車両の学習モデルの再学習を実施する。
この際の再学習については、応援車両の学習モデルの全体を再学習の対象として学習モデルの各隠れ層の各ノードの重みw及びバイアスbの値を再学習させてもよいし、応援車両の学習モデルの一部をそのまま流用し、残りの一部を再学習の対象とする転移学習を実施することにより、各隠れ層のうちの一部の隠れ層の各ノードの重みw及びバイアスbの値をそのまま流用し、残りの一部の隠れ層の各ノードの重みw及びバイアスbの値のみを再学習させるようにしてもよい。
再学習の際に転移学習を実施すれば、再学習に必要な演算量を減らして再学習に要する時間を短くすることができる。したがって、例えば応援車両の所定台数よりも多いときには転移学習を実施するように、応援車両の台数に応じて、再学習の際に応援車両の学習モデルの全体を再学習の対象とする通常の学習を実施するか、又は転移学習を実施するかを判断するようにしてもよい。
ステップS37において、サーバ1は、再学習を行った学習モデルを、その学習モデルを送信してきた応援車両に送信する。
ステップS38において、多目的車両2aの電子制御ユニット20は、サーバ1で再学習が行われた学習モデルを受信したか否かを判定する。多目的車両2aの電子制御ユニット20は、サーバ1で再学習が行われた学習モデルを受信していれば、ステップS39の処理に進む。一方で多目的車両2aの電子制御ユニット20は、サーバ1で再学習が行われた学習モデルを受信していなければ、今回の処理を終了する。
ステップS39において、多目的車両2aの電子制御ユニット20は、学習モデルをサーバ1で再学習が行われた学習モデルに更新する。これにより、応援車両として第2スマートシティ120に派遣された多目的車両2aの学習モデルを、第2スマートシティ120にも対応させた学習モデルに更新することができるので、第1多目的車両2aを第2スマートシティ120で使用したときに、学習モデルを介して入力パラメータに対応した適切な出力パラメータの値を得ることができる。
なお第1スマートシティ110内で多目的車両が不足しているか、又は不足するおそれがある場合には、サーバ1と多目的車両2bとの間で、図6に示した処理と同様の処理を実施すればよい。
以上説明した本実施形態によるモデル学習システム100は、学習装置としてのサーバ1と、当該サーバ1と通信可能に構成された複数の車両2(機器)と、を備える。そしてサーバ1は、複数の車両2のうち、第1スマートシティ110(所定の第1エリア)で取得された訓練データセットを用いて学習された学習モデルが搭載されて制御が行われる第1多目的車両2a(第1機器)が、第2スマートシティ120(所定の第2エリア)で使用されるときは、第2スマートシティ120で取得された訓練データセットを用いて第1多目的車両2aの学習モデルの再学習を実施するように構成されている。
これにより、第1多目的車両2aの学習モデルを第2スマートシティ120にも対応させた学習モデルに更新することができるので、第1多目的車両2aを第2スマートシティ120で使用したときに、学習モデルを介して入力パラメータに対応した適切な出力パラメータの値を得ることができる。したがって、第1多目的車両2aを普段の使用エリアである第1スマートシティ110とは異なる第2スマートシティ120で使用した場合であっても、学習モデルの精度が低下するのを抑制することができる。
また本実施形態において、第1多目的車両2aは、加速、操舵、及び制動に関する運転操作が自動的に行われる自動運転車両であり、第1スマートシティ110から第2スマートシティ120への移動要請をサーバ1から受信したときに、移動要請に基づいて第1多目的車両2aを第1スマートシティ110から第2スマートシティ120に移動させると共に第1多目的車両2aに搭載されている学習モデルをサーバ1に送信するように構成されている。またサーバ1は、移動要請を送信した第1多目的車両2aから学習モデルを受信したときは、第2スマートシティ120で取得された訓練データセットを用いて当該学習モデルの再学習を実施し、再学習した学習モデルを、移動要請を送信した第1多目的車両2aに再度送信するように構成されている。
また本実施形態によるサーバは、移動要請を行う第1多目的車両2aの台数が所定台数以上であるときは、第2スマートシティ120で取得された訓練データセットを用いて第1多目的車両2aから受信した学習モデルの再学習を実施する際に、当該学習モデルの一部を流用し、残りの一部を第2スマートシティ120で取得された訓練データセットを用いて学習させる転移学習を実施するように、さらに構成されている。
転移学習を行うことで、前述した通り、学習モデルの全体を再学習の対象とする通常の学習を実施する場合と比較して、再学習に必要な演算量を減らして再学習に要する時間を短くすることができる。そのため、移動要請を行った各第1多目的車両2aの台数が多いときには再学習の際に転移学習を実施することで、サーバ1の演算負荷を減らすと共に、再学習に要する時間を短くすることができる。
以上、本発明の実施形態について説明したが、上記実施形態は本発明の適用例の一部を示したに過ぎず、本発明の技術的範囲を上記実施形態の具体的構成に限定する趣旨ではない。
例えば上記の実施形態では、1つのサーバ1で図4から図6を参照して前述した各種の処理を実施していたが、複数のサーバ(例えば第1スマートシティ110内の多目的車両2aを管理するサーバと第2スマートシティ120内の多目的車両2bを管理するサーバ)を用いて前述した各種の処理と同等の処理が行われるように、各サーバ及び車両2を構成することもできる。
また、上記の実施形態では、第1スマートシティ110と第2スマートシティ120との間で車両2が移動する場合を例に挙げて説明したが、これに限らず、スマートシティの数は3つ以上でもあってもよい。また、第1スマートシティ110の中で、さらに細かい区域に分けて多目的車両の運用が行われている場合、すなわち区域ごとに使用する多目的車両が固定されている場合には、第1スマートシティ110内の或る区域から別の区域に多目的車両を移動させることになったときに、或る区域の特性に応じて最適化された学習モデルを、別の区域の特性に応じた適切な訓練データセットを用いて再学習させるようにしてもよい。
また上記の実施形態では、移動又は持ち運びが可能な機器の一例として車両2を用いた場合で説明を行ったが、その他の輸送機器や携帯機器が普段の使用エリア(第1エリア)とは異なる別のエリア(第2エリア)で使用される場合に、各機器に搭載された学習モデル(普段の使用エリアの特性に応じて最適化された学習モデル)を、当該別のエリアの特性に応じた適切な訓練データセットを用いて再学習させるように、サーバ1及び各機器を構成することもできる。
1 サーバ(学習装置)
2 車両(機器)
100 モデル学習システム
110 第1スマートシティ(第1エリア)
120 第2スマートシティ(第2エリア)

Claims (2)

  1. サーバと、前記サーバと通信可能に構成された複数の機器と、を備えるモデル学習システムであって、
    前記サーバは、
    前記複数の機器のうち、所定の第1エリアで取得された訓練データセットを用いて学習された学習モデルが搭載されて制御が行われる第1機器が、所定の第2エリアで使用されるときは、前記第2エリアで取得された訓練データセットを用いて前記第1機器に搭載された学習モデルの再学習を実施し、
    前記第1機器は自動運転車両であり、
    前記第1機器は、
    前記第1エリアから前記第2エリアへの移動要請を前記サーバから受信したときに、前記移動要請に基づいて前記第1機器を前記第1エリアから前記第2エリアに移動させると共に前記第1機器に搭載されている学習モデルを前記サーバに送信し、
    前記サーバは、
    前記移動要請を送信した前記第1機器から学習モデルを受信したときは、前記第2エリアで取得された訓練データセットを用いて受信した学習モデルの再学習を実施し、再学習した学習モデルを、前記移動要請を送信した前記第1機器に再度送信する、
    モデル学習システム。
  2. 請求項1に記載のモデル学習システムであって、
    前記サーバは、
    前記移動要請を行う前記第1機器の台数が所定台数以上であるときは、前記第2エリアで取得された訓練データセットを用いて前記第1機器から受信した学習モデルの再学習を実施する際に、当該学習モデルの一部を流用し、残りの一部を前記第2エリアで取得された訓練データセットを用いて学習させる転移学習を実施する、
    モデル学習システム。
JP2020148484A 2020-09-03 2020-09-03 学習装置及びモデル学習システム Active JP7040571B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2020148484A JP7040571B2 (ja) 2020-09-03 2020-09-03 学習装置及びモデル学習システム
DE102021118615.3A DE102021118615A1 (de) 2020-09-03 2021-07-19 Lernvorrichtung und Modell-Lernsystem
US17/462,566 US11820398B2 (en) 2020-09-03 2021-08-31 Learning apparatus and model learning system
CN202111027569.3A CN114139715A (zh) 2020-09-03 2021-09-02 学习装置及模型学习系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020148484A JP7040571B2 (ja) 2020-09-03 2020-09-03 学習装置及びモデル学習システム

Publications (2)

Publication Number Publication Date
JP2022042857A JP2022042857A (ja) 2022-03-15
JP7040571B2 true JP7040571B2 (ja) 2022-03-23

Family

ID=80221613

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020148484A Active JP7040571B2 (ja) 2020-09-03 2020-09-03 学習装置及びモデル学習システム

Country Status (4)

Country Link
US (1) US11820398B2 (ja)
JP (1) JP7040571B2 (ja)
CN (1) CN114139715A (ja)
DE (1) DE102021118615A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7040589B1 (ja) * 2020-12-01 2022-03-23 トヨタ自動車株式会社 機械学習方法及び機械学習システム
WO2023219371A1 (ko) * 2022-05-09 2023-11-16 삼성전자주식회사 학습 데이터를 증강시키는 전자 장치 및 그 제어 방법
KR20240087146A (ko) * 2022-12-12 2024-06-19 주식회사 카카오모빌리티 경로 안내와 연동된 자율주행 소프트웨어의 검색과 학습에 의한 자율주행 제어 방법 및 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080274728A1 (en) 2007-05-01 2008-11-06 Ian Bancroft Anderson Inferring a state of activity of a carrier of a mobile device
JP2019032821A (ja) 2017-06-26 2019-02-28 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド ニューラルネットワークによる画風変換を用いたデータオーグメンテーション技術
JP2020093760A (ja) 2018-12-14 2020-06-18 トヨタ自動車株式会社 制御支援装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10880118B2 (en) * 2014-05-01 2020-12-29 Elizabeth B. Stolfus Providing dynamic routing alternatives based on determined traffic conditions
MX2019009392A (es) * 2017-02-10 2019-11-28 Nissan North America Inc Control de la administracion operacional de vehiculos autonomos.
CN110248861B (zh) * 2018-01-07 2023-05-30 辉达公司 在车辆操纵过程中使用机器学习模型来引导车辆
JP6477951B1 (ja) 2018-04-05 2019-03-06 トヨタ自動車株式会社 車載電子制御ユニット
US11373115B2 (en) * 2018-04-09 2022-06-28 Here Global B.V. Asynchronous parameter aggregation for machine learning
WO2019232335A1 (en) * 2018-06-01 2019-12-05 Volkswagen Group Of America, Inc. Methodologies, systems, and components for incremental and continual learning for scalable improvement of autonomous systems

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080274728A1 (en) 2007-05-01 2008-11-06 Ian Bancroft Anderson Inferring a state of activity of a carrier of a mobile device
JP2019032821A (ja) 2017-06-26 2019-02-28 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド ニューラルネットワークによる画風変換を用いたデータオーグメンテーション技術
JP2020093760A (ja) 2018-12-14 2020-06-18 トヨタ自動車株式会社 制御支援装置

Also Published As

Publication number Publication date
CN114139715A (zh) 2022-03-04
DE102021118615A1 (de) 2022-03-03
US11820398B2 (en) 2023-11-21
JP2022042857A (ja) 2022-03-15
US20220063658A1 (en) 2022-03-03

Similar Documents

Publication Publication Date Title
JP7040571B2 (ja) 学習装置及びモデル学習システム
CN107444402A (zh) 利用学习用户偏好的车辆模式安排
JP2019001450A (ja) 車両エネルギー管理および自律運転のためのリアルタイム車両状態軌道予測
KR102609053B1 (ko) 자동차 쿨링 제어 시스템 및 방법
JP6741057B2 (ja) 内燃機関の制御システム、電子制御ユニット、サーバ及び内燃機関の制御方法
CN113830097B (zh) 车辆、模型学习系统以及服务器
US11614335B2 (en) Route planner optimization for hybrid-electric vehicles
CN113392573A (zh) 用于创建经训练的人工神经网络的方法、用于预测车辆排放数据的方法和确定校准值的方法
CN117252318B (zh) 一种智能网联汽车群机协同拼车调度方法及系统
JP6939963B1 (ja) モデル学習システム及びサーバ
JP7040589B1 (ja) 機械学習方法及び機械学習システム
JP6935837B1 (ja) 機械学習装置及び機械学習システム
CN114077237A (zh) 机器学习装置
US20230174042A1 (en) Intelligent Engine Activation Planner
JP7276298B2 (ja) モデル学習システム、車両の制御装置及びモデル学習方法
JP7056794B1 (ja) モデル学習システム及びモデル学習装置
JP2022038241A (ja) 配車システム
JP2022053033A (ja) 機械学習装置
JP2022030663A (ja) サーバ、車両の制御装置、および車両の機械学習システム
JP2023065975A (ja) 管理装置、管理方法、及び管理プログラム
JP2022063545A (ja) 機械学習装置
JP2022035222A (ja) 機械学習装置
JP2022016026A (ja) 機械学習装置
CN117273390A (zh) 一种基于智慧物流的电动汽车运输充电调度方法及系统
CN114506338A (zh) 用于自主车辆控制系统的情境处理和学习

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210625

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210727

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20211019

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220106

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20220106

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20220117

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20220118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220221

R151 Written notification of patent or utility model registration

Ref document number: 7040571

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151