JP2020093760A - 制御支援装置 - Google Patents

制御支援装置 Download PDF

Info

Publication number
JP2020093760A
JP2020093760A JP2018234853A JP2018234853A JP2020093760A JP 2020093760 A JP2020093760 A JP 2020093760A JP 2018234853 A JP2018234853 A JP 2018234853A JP 2018234853 A JP2018234853 A JP 2018234853A JP 2020093760 A JP2020093760 A JP 2020093760A
Authority
JP
Japan
Prior art keywords
vehicle
learned model
information
unit
learned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018234853A
Other languages
English (en)
Inventor
義之 影浦
Yoshiyuki Kageura
義之 影浦
大樹 横山
Daiki Yokoyama
大樹 横山
翠 栗橋
Midori Kurihashi
翠 栗橋
栄来 北川
Eiki Kitagawa
栄来 北川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2018234853A priority Critical patent/JP2020093760A/ja
Publication of JP2020093760A publication Critical patent/JP2020093760A/ja
Pending legal-status Critical Current

Links

Abstract

【課題】車両の制御のための学習済みモデルが所定領域ごとに設定されている場合に、車両の位置に応じて学習済みモデルを適切に切り替える。【解決手段】機械学習による学習済みモデルを用いて車両の制御を支援する制御支援装置であって、車両から送信された車両の車両情報および位置情報に基づいて、車両において更新可能であるとともに、位置情報に含まれる車両の現在の位置に対応する学習済みモデルを選択する制御部と、選択した学習済みモデルを車両に送信する送信部と、を備える。【選択図】図4

Description

本発明は、機械学習による学習済みモデルを用いた制御支援装置に関する。
ニューラルネットワークに基づいた機械学習による学習済みモデルを用いて内燃機関を制御する技術が知られている(例えば、特許文献1を参照)。この技術では、学習済みモデルを用いて内燃機関の所定の通路におけるガスの流量を推定し、推定結果に基づいて内燃機関を制御する。
特開2012−112277号公報
ところで、将来的に、車両の制御のための学習済みモデルを、ルート、地域、または仮想的に碁盤の目のように分けた所定領域ごとに作成し、所定領域ごとの学習済みモデルを管理するシステムが考えられている。この場合、所定領域ごとに適切な学習済みモデルが存在し、車両の走行によって所定領域が切り替わると、適切な学習済みモデルも異なることになる。学習済みモデルが適切な学習済みモデルでない場合、車両の制御が不適切に実行されることになるため、車両の制御に用いる学習済みモデルを常に最適な学習済みモデルに切り替えることができるシステムの開発が望まれていた。
本発明は、上記に鑑みてなされたものであって、その目的は、車両の制御のための学習済みモデルが所定領域ごとに設定されている場合に、車両の位置に応じて学習済みモデルを適切に切り替え可能な制御支援装置を提供することにある。
上述した課題を解決し、上記目的を達成するために、本発明の一態様に係る制御支援装置は、機械学習による学習済みモデルを用いて車両の制御を支援する制御支援装置であって、前記車両から送信された前記車両の車両情報および位置情報に基づいて、前記車両において更新可能であるとともに、前記位置情報に含まれる前記車両の現在の位置に対応する学習済みモデルを選択する制御部と、前記選択した学習済みモデルを前記車両に送信する送信部と、を備えることを特徴とする。
本発明に係る制御支援装置によれば、車両の車両情報および位置情報に基づいて、車両に対応する学習済みモデルを選択できるので、車両の位置に応じて学習済みモデルを適切に切り替えることが可能となる。
図1は、本発明の実施形態による制御支援装置を適用可能な制御支援システムを示す概略図である。 図2は、学習部が学習するニューラルネットワークの構成を模式的に示す図である。 図3は、ニューラルネットワークが有するノードの入出力の概要を説明する図である。 図4は、第1の実施形態による制御支援システムによる学習済みモデル切替方法の処理の流れを示すフロー図である。 図5は、第1の実施形態による制御支援サーバが学習済みモデルを切り替えるために用いる地図情報の一例を示す図である。 図6は、第2の実施形態による制御支援システムによる先読み方法の処理の流れを示すフロー図である。 図7は、第2の実施形態の車両における学習済みモデルの更新方法を説明するためのフローチャートである。 図8は、第2の実施形態の車両における学習済みモデルの更新方法を説明するための図である。
以下、本発明の実施形態について図面を参照しつつ説明する。なお、以下の実施形態の全図においては、同一または対応する部分には同一の符号を付す。また、本発明は以下に説明する実施形態によって限定されるものではない。
(制御支援システム)
まず、本発明の実施形態による制御支援システムについて説明する。図1は、この第1の実施形態による制御支援システムを示す。図1に示すように、制御支援システム1は、ネットワーク10を介して互いに通信可能な、制御支援サーバ2と複数の車両3とを有する。
ネットワーク10は、インターネット回線網や携帯電話回線網などから構成される。ネットワーク10は、例えば、インターネットなどの公衆通信網であって、例えばLAN(Local Area Network)、WAN(Wide Area Network)、携帯電話などの電話通信網や公衆回線、VPN(Virtual Private Network)、および専用線などの一または複数の組み合わせからなる。ネットワーク10は、有線通信および無線通信が適宜組み合わされている。
(制御支援サーバ)
制御支援装置としての制御支援サーバ2は、種々の情報によって機械学習を実行可能であり、機械学習によって生成した学習済みモデルのデータ(以下、学習済みモデルという)を記憶可能である。本実施形態による学習済みモデルは、例えばニューラルネットワークを用いた深層学習に基づいて生成された学習済みモデルである。制御支援サーバ2は、車両3に対して、車両3の各構成部を制御するための所定の学習済みモデルを送信する。具体的に、制御支援サーバ2は、複数の車両3からネットワーク10を介して送信された種々の情報に基づいて、学習済みモデルを、ネットワーク10を介してそれぞれの車両3に送信する。
制御支援サーバ2は、制御部21、記憶部22、および通信部23を備える。通信部23は、例えば、LAN(Local Area Network)インターフェースボード、無線通信のための無線通信回路である。LANインターフェースボードや無線通信回路は、公衆通信網であるインターネットなどのネットワーク10に接続される。送信部および受信部としての通信部23は、ネットワーク10に接続して、複数の車両3との間で通信を行う。サーバ通信部としての通信部23は、それぞれの車両3との間で、車両3に固有の車両識別情報や走行履歴情報を含む車両情報を受信したり、車両3に対して学習済みモデルや制御信号を送信したりする。
ここで、車両識別情報は、個々の車両3を互いに識別するための種々の情報を含む。走行履歴情報は、それぞれの車両3における走行時間帯、走行経路、走行地域、渋滞情報、天候、外気温、および外気の湿度などの情報を含む。走行時間帯の情報は、朝か昼か晩かの情報、通勤時間帯であるか否かの情報、または太陽が出ているか否かの情報などである。走行経路の情報は、特定の道路の上りか下りかの情報、または特定の道路の上りか下りかの情報に走行時間帯の情報を追加した情報などである。走行地域の情報は、走行路線の情報、市町村の情報、都道府県の情報、または関東や東海などの地域の情報である。渋滞情報は、実際の渋滞情報と走行時間帯とを関連付けた情報、または実際の渋滞情報と道路交通情報通信システム(VICS(登録商標):Vehicle Information and Communication System)などによって取得した渋滞原因とを関連付けた情報などである。天候の情報は、風向き、風速、および進行方向が関連付けられた情報、または雨や雪などによる路面状況の変化の情報などである。外気温や湿度は走行時における気温や湿度のみならず、外気の実際の計測温度や計測湿度の情報を含む。
制御部21は、具体的に、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field-Programmable Gate Array)などのプロセッサ、およびRAM(Random Access Memory)やROM(Read Only Memory)などの主記憶部(いずれも図示せず)を備える。
記憶部22は、RAM等の揮発性メモリ、ROM等の不揮発性メモリ、EPROM(Erasable Programmable ROM)、ハードディスクドライブ(HDD、Hard Disk Drive)、およびリムーバブルメディアなどから選ばれた記憶媒体から構成される。なお、リムーバブルメディアは、例えば、USB(Universal Serial Bus)メモリ、または、CD(Compact Disc)、DVD(Digital Versatile Disc)、またはBD(Blu-ray(登録商標) Disc)のようなディスク記録媒体である。また、外部から装着可能なメモリカード等のコンピュータ読み取り可能な記録媒体を用いて記憶部22を構成してもよい。記憶部22には、制御支援サーバ2の動作を実行するための、オペレーティングシステム(Operating System:OS)、各種プログラム、各種テーブル、各種データベースなどが記憶可能である。記憶部22は、各種プログラムには、第1の実施形態による制御支援プログラムも含まれる。これらの各種プログラムは、ハードディスク、フラッシュメモリ、CD−ROM、DVD−ROM、フレキシブルディスク等のコンピュータ読み取り可能な記録媒体に記録して広く流通させることも可能である。
制御部21は、記憶部22に記憶されたプログラムを主記憶部の作業領域にロードして実行し、プログラムの実行を通じて各構成部などを制御することで、所定の目的に合致した機能を実現できる。本実施形態においては、制御部21によるプログラムの実行によって、学習部211、学習済みモデル比較部212、先読み部213、およびモデルリスト作成部214のうちの必要な機能が選択的に実行される。
サーバ学習部でもある学習部211は、教師データとしての入出力データセットをもとに機械学習を行う。学習部211は、学習した結果を記憶部22の学習済みモデルデータベース221に書き込んで記憶させる。学習部211は、学習を行っているニューラルネットワークとは別に、所定のタイミングで、当該タイミングにおける最新の学習済みモデルを、記憶部22の学習済みモデルデータベース221に記憶させる。学習済みモデルデータベース221に記憶させる際には、古い学習済みモデルを削除して最新の学習済みモデルを記憶させる更新でもよいし、古い学習済みモデルの一部または全部を保存したまま最新の学習済みモデルを記憶させる蓄積でもよい。
サーバ比較部でもある学習済みモデル比較部212は、学習済みモデルデータベース221に記憶されている複数の学習済みモデルから、少なくとも2つの所定の学習済みモデルを選択して比較する。具体的に例えば、学習済みモデル比較部212は、車両3から送信された位置情報に基づいて選択された学習済みモデルと、車両3が現在使用している学習済みモデルとを比較する。
サーバ予測部でもある先読み部213は、車両3から送信された例えば車両3の現在位置、目的地、時刻、および曜日などの先読みに必要な情報と車両3の過去の走行履歴とに基づいたベイズ推定によって、先読みを実施して先読み情報を生成する。先読み部213によって生成された先読み情報は、モデルリスト作成部214に出力される。モデルリスト作成部214は、先読み部213から入力された先読み情報に基づいて、車両3において必要となる複数の学習済みモデルをリスト化した学習済みモデルリストを作成する。モデルリスト作成部214は、学習済みモデルリストに含まれる学習済みモデルを、後述する学習済みモデルデータベース221から索出して、車両3に送信する。
サーバ記憶部でもある記憶部22は、学習済みモデルデータベース221および地図情報データベース222を有する。学習済みモデルデータベース221には、学習済みモデルが検索可能に記憶されている。学習済みモデルデータベース221は、制御部21の学習部211によって生成された学習済みモデルを、蓄積したり更新したりして記憶される。なお、学習済みモデルデータベース221には最初に、初期状態の学習済みモデルが記憶されている。学習済みモデルを記憶するとは、学習済みモデルにおけるネットワークパラメータや演算のアルゴリズム等の情報を記憶することを意味する。
地図情報データベース222には、地図情報が検索可能に格納されている。本実施形態においては、地図が所定領域ごとに分割されて設定され、それぞれの領域にそれぞれ学習済みモデルが割り当てられている。記憶部22には、これらの所定領域の地図情報と、割り当てられた学習済みモデルとが互いに関連付けて記憶されている。換言すると、地図情報は、地図上の領域を、緯度および経度に基づいて分割してそれぞれを所定領域として設定したり、道路の路線(ルートID)ごとに分割してそれぞれを所定領域として設定したりして構成される。その上で、それぞれの所定領域ごとに、個別に学習済みモデルが生成されて設定されている。これにより、設定された所定領域ごとに最適化された学習済みモデルを設定できるので、車両3において制御部32により制御可能なアクチュエータ量を、地図情報に応じて所望の出力になるように制御できる。
ここで、機械学習の具体的な一例として、ニューラルネットワークを用いた深層学習について説明する。図2は、学習部211が学習するニューラルネットワークの構成を模式的に示す図である。図2に示すように、ニューラルネットワーク100は、順伝播型ニューラルネットワークであり、入力層101と、中間層102と、出力層103とを有する。入力層101は複数のノードからなり、各ノードには互いに異なる入力パラメータが入力される。中間層102は入力層101からの出力が入力される。中間層102は、入力層101からの入力を受ける複数のノードからなる層を含む多層の構造を有する。出力層103は、中間層102からの出力が入力され、出力パラメータを出力する。中間層102が多層構造を有するニューラルネットワークを用いた機械学習は、深層学習と呼ばれる。
図3は、ニューラルネットワーク100が有するノードにおける入出力の概要を説明する図である。図3においては、ニューラルネットワーク100のうち、I個のノードを有する入力層101と、J個のノードを有する第1中間層121と、K個のノードを有する第2中間層122におけるデータの入出力の一部を模式的に示している(I、J、Kは正の整数)。入力層101の上からi番目のノードには、入力パラメータxi(i=1,2,…,I)が入力される。以下、全ての入力パラメータの集合を「入力パラメータ{xi}」と記載する。
入力層101の各ノードは、隣接する第1中間層121の各ノードに対し、入力パラメータに所定の重みを乗じた値を有する信号を出力する。例えば、入力層101の上からi番目のノードは、第1中間層121の上からj番目(j=1,2,…,J)のノードに対して、入力パラメータxiに重みαijを乗じた値αijiを有する信号を出力する。第1中間層121の上からj番目のノードには、合計で入力層101の各ノードからの出力に所定のバイアスb(1) jを加えた値Σi=1〜Iαiji+b(1) jが入力される。ここで第1項目のΣi=1〜Iは、i=1,2,…,Iの和を取ることを意味する。
第1中間層121の上からj番目のノードの出力値yjは、そのノードへの入力層101からの入力値Σi=1〜Iαiji+b(1) jの関数として、yj=S(Σi=1〜Iαiji+b(1) j)と表される。この関数Sは活性化関数と呼ばれる。具体的な活性化関数として、例えばシグモイド関数S(u)=1/{1+exp(−u)}や正規化線形関数(ReLU)S(u)=max(0,u)などを挙げることができる。活性化関数は、非線形関数が用いられることが多い。
第1中間層121の各ノードは、隣接する第2中間層122の各ノードに対し、入力パラメータに所定の重みを乗じた値を有する信号を出力する。例えば、第1中間層121の上からj番目のノードは、第2中間層122の上からk番目(k=1,2,…,K)のノードに対して、入力値yjに重みβjkを乗じた値βjkjを有する信号を出力する。第2中間層122の上からk番目のノードには、合計で第1中間層121の各ノードからの出力に所定のバイアスb(2) kを加えた値Σj=1〜Jβjkj+b(2) kが入力される。ここで第1項目のΣj=1〜Jは、j=1,2,…,Jの和を取ることを意味する。
第2中間層122の上からk番目のノードの出力値zkは、そのノードへの第1中間層121からの入力値Σj=1〜Jβjkj+b(2) kを変数とする活性化関数を用いて、
k=S(Σj=1〜Jβjkj+b(2) k
と表される。
このようにして、入力層101の側から出力層103の側へ向かう順方向に沿って順次繰り返すことにより、最終的に出力層103から一つの出力パラメータYが出力される。以下、ニューラルネットワーク100が含む重みおよびバイアスをまとめてネットワークパラメータwという。このネットワークパラメータwは、ニューラルネットワーク100の全ての重みおよびバイアスを成分とするベクトルである。
学習部211は、入力パラメータ{xi}をニューラルネットワーク100へ入力することによって算出した出力パラメータYと、入力パラメータ{xi}とともに入出力データセットを構成する出力パラメータ(目標出力)Y0とに基づいて、ネットワークパラメータを更新する演算を行う。具体的には、2つの出力パラメータYとY0との誤差を最小化するための演算を行うことによってネットワークパラメータwを更新する。この際には、確率的勾配降下法がよく用いられる。以下、入力パラメータ{xi}および出力パラメータYの組({xi},Y)を総称して「学習データ」という。
以下、確率的勾配降下法の概要を説明する。確率的勾配降下法は、2つの出力パラメータYとY0を用いて定義される誤差関数E(w)のネットワークパラメータwの各成分に対する微分から求まる勾配∇wE(w)を最小化するように、ネットワークパラメータwを更新する方法である。誤差関数は、例えば学習データの出力パラメータYと入出力データセットの出力パラメータY0の2乗誤差|Y−Y02により定義される。また、勾配∇wE(w)は、誤差関数E(w)のネットワークパラメータwの成分に関する微分である
∂E(w)/∂αij、∂E(w)/∂βjk、∂E(w)/∂b(1) j、∂E(w)/∂b(2) k(ここで、i=1〜I、j=1〜J、k=1〜K)などを成分に有するベクトルである。
確率的勾配降下法では、ネットワークパラメータwを、自動または手動で定まる所定の学習率ηを用いて、w’=w−η∇wE(w)、w’’=w’−η∇w’E(w’)、…と順次更新する。なお、学習率ηは、学習の途中で変更してもよい。より一般的な確率的勾配降下法の場合、誤差関数E(w)は、全学習データを含むサンプルの中からランダムに抽出することによって定義される。この際に抽出する学習データの数は1つに限られず、その他の学習データを用いてもよい。
勾配∇wE(w)の計算を効率的に行うための方法として、誤差逆伝播法が知られている。誤差逆伝播法は、学習データ({xi}、Y)を算出後、出力層における目標出力Y0と出力パラメータYの誤差に基づいて、出力層→中間層→入力層へと勾配∇wE(w)の成分を逆にたどって計算していく方法である。学習部211は、誤差逆伝播法を用いて勾配∇wE(w)の全ての成分を算出した後、算出した勾配∇wE(w)を用いて上述した確率的勾配降下法を適用することにより、ネットワークパラメータwを更新する。
図1に示す記憶部22には、上述のように生成された学習済みモデルが検索可能に記憶される。記憶部22は、制御部21の学習部211によって生成された学習済みモデルを、蓄積したり更新したりして記憶する。学習済みモデルは、ニューラルネットワークを用いた深層学習に基づいて生成される。学習済みモデルを記憶するとは、学習済みモデルにおけるネットワークパラメータwや演算のアルゴリズムなどの情報を記憶することを意味する。また、記憶部22は、上述した入力パラメータと出力パラメータとの組からなる入出力データセットを記憶する。記憶部22は、学習部211が入力パラメータをニューラルネットワーク100に入力して算出した出力パラメータを当該入力パラメータとともに学習データとして記憶する。
上述のようにして生成された学習済みモデルの一例は、入力パラメータが「点火時期、燃料の噴射量、噴射時期、スロットル開度、可変バルブタイミング(VVT:Variable Valve Timing)、および排気再循環装置(EGR)のガス流量を調整するEGRバルブの制御量、地図情報、天候情報」であり、出力パラメータが「NOxの排出量」である。学習部211によって、ニューラルネットワーク100を用いた深層学習により生成された学習済みモデルから、出力パラメータとして出力されるNOxの排出量が最小になるように、入力パラメータを設定できる。設定される入力パラメータは、車両3の外部または内部において制御部32による制御が可能な制御情報である、点火時期、燃料の噴射量、噴射時期、スロットル開度、VVT、およびEGRバルブの制御量などである。
(車両)
図1に示す車両3は、運転者による運転によって走行する車両や、与えられた運行指令に従って自律走行可能に構成された自律走行車両である。車両3は、駆動部31、制御部32、記憶部33、通信部34、センサ群35、およびGPS部36を備える。
駆動部31は、車両3の走行に必要な従来公知の駆動部である。具体的には、車両3は、駆動源となる内燃機関であるエンジン、エンジンの駆動力を伝達する駆動伝達機構、および走行するための駆動輪などを備える。車両3のエンジンは、燃料の燃焼による駆動によって電動機などを用いて発電可能に構成される。発電された電力は充電可能なバッテリに充電される。
制御部32および記憶部33はそれぞれ、物理的には上述した制御部21および記憶部22と同様である。制御部32は、記憶部33に記憶されたプログラムの実行によって、車両3に搭載される各種構成要素の動作を統括的に制御する。記憶部33は、車両情報記憶部331および学習済みモデル記憶部332を備える。車両情報記憶部331には、車種、製造番号、およびナンバープレートの番号などの、個々の車両3を互いに識別するための種々の情報である車両識別情報が、書き換え不能に記憶されている。車両情報記憶部331にはさらに、総走行距離、燃料残量、現在位置などを含む車両情報が、蓄積可能および更新可能に記憶されている。また、車両情報記憶部331には、車両3における、速度、加速度、走行時間帯、走行経路、走行地域、渋滞情報、地図情報、外気の温度や湿度、および天候などを含む走行履歴情報が、蓄積可能および更新可能に記憶されている。
送信部および受信部としての通信部34は、ネットワーク10を介した無線通信によって、少なくとも制御支援サーバ2との間で通信を行う、例えば車載通信モジュール(DCM:Data Communication Module)などからなる。
センサ群35は、エンジンの冷却水の水温(冷却水温)を検出する水温センサ、エンジンの吸気温を検出する吸気温センサ、大気圧を検出する大気圧センサ、エンジンの油温を検出する油温センサ、排気中の酸素濃度を検出するA/Fセンサ、およびバッテリの充電状態を検出する電流センサなどの、車両3の状態を計測するセンサを含む。また、センサ群35は、車両3の速度や加速度をそれぞれ検出する、車速センサや加速度センサなどの、車両3の走行に関するセンサを含む。センサ群35は、外気温を検出する外気温センサや、外気の湿度を検出する湿度センサなどを含んでいてもよい。センサ群35はさらに、例えば車室内の種々の状況を検知可能な車室内センサや、例えば撮像カメラなどの撮像装置などを含んでいてもよい。
位置情報取得部としてのGPS部36は、GPS(Global Positioning System)衛星(図示せず)からの電波を受信して、車両3の位置を検出する。検出された位置は、車両情報における位置情報として、車両情報記憶部331に検索可能に記憶される。なお、車両3の位置を検出する方法として、LiDAR(Light Detection and Ranging、Laser Imaging Detection and Ranging)と3次元デジタル地図とを組み合わせた方法を採用してもよい。
次に、上述のように構成された制御支援システム1による学習済みモデルの切替方法の実施形態について説明する。以下の説明において、制御支援サーバ2と車両3との間の情報の送受信は、通信部23,34を通じ、ネットワーク10を介して行われるが、この点についての都度の説明は省略する。
(第1の実施形態)
図4は、第1の実施形態による制御支援システム1における学習済みモデル切替方法の処理の流れを示すフロー図である。図5は、第1の実施形態による制御支援サーバ2が学習済みモデルを選択および比較する際に用いる地図情報の一例を示す図である。
図4に示すように、ステップST1において車両3の制御部32は、GPS部36によって検出された車両3の位置を確認して位置情報を生成する。ステップST2に移行して制御部32は、通信部34を介して生成した位置情報、および車種の情報を含む車両情報を制御支援サーバ2に送信する。なお、これらのステップST1,ST2の処理は、車両3の駆動時において、所定のタイミングで繰り返し実行される。所定のタイミングとは、所定時間間隔ごとの周期的な時刻であったり、あらかじめ設定された所定時刻であったりする。
その後、ステップST3において制御支援サーバ2の制御部21は、受信した車両3における位置情報および車両情報を記憶部22に記憶させる。ステップST4に移行して制御部21の学習済みモデル比較部212は、記憶部22に記憶させた車両3の位置情報と車両情報、特に車種の情報とに基づいて、学習済みモデルデータベース221から車両3に適合する学習済みモデルを選択して索出する。
続いて、ステップST5に移行して学習済みモデル比較部212は、車両3が送信して制御支援サーバ2が受信した位置情報に関連付けされた学習済みモデル(今回の学習済みモデル)と、車両3が前回送信して制御支援サーバ2が前回受信した際の位置情報に関連付けされた学習済みモデル(前回の学習済みモデル)とを比較する。学習済みモデル比較部212は、今回の学習済みモデルと前回の学習済みモデルとが異なるか否かを判定する。学習済みモデル比較部212が、今回の学習済みモデルと前回の学習済みモデルとが同じ学習済みモデルであると判定した場合(ステップST5:No)、学習済みモデル切替処理を終了する。
一方、学習済みモデル比較部212が、今回の学習済みモデルと前回の学習済みモデルとが異なる学習済みモデルであると判定した場合(ステップST5:Yes)、ステップST6に移行する。ステップST6において制御部21は、車両3から受信した位置情報に基づいて、当該位置情報に関連付けされた学習済みモデルを車両3に送信する。
ステップST7において、車両3の制御部32は、現在使用している学習済みモデルと受信した学習済みモデルとを比較して、制御支援サーバ2から新しい学習済みモデルを受信したか否かを判定する。制御部32が、受信した学習済みモデルは新しい学習済みモデルではないと判定した場合(ステップST7:No)、車両3における学習済みモデルの切替処理は終了する。一方、制御部32が、受信した学習済みモデルは新しい学習済みモデルであると判定した場合(ステップST7:Yes)、ステップST8に移行する。ステップST8において制御部32は、受信した学習済みモデルを記憶部33の学習済みモデル記憶部332に記憶させる。車両3の制御部32は、学習済みモデル記憶部332に記憶された学習済みモデルを用いて、車両3の各構成部の制御を行う。
(実施例)
以上説明した学習済みモデルの切替処理の例について具体的に説明する。図5に示すように、本実施例においては、地図が碁盤状に分割されて設定され、それぞれの領域にそれぞれ学習済みモデルが割り当てられている。図5に示す太線矢印は車両3の走行経路である。図5においては、それぞれ所定領域として設定された領域i(i=1,2,…,24,25、図5中の数字)ごとに学習済みモデルiが設定されている。
図5に示す例において車両3は、領域3→領域8→領域13→領域12→領域17→領域22→領域21の順に走行する。車両3は、領域3から領域21へと移動する場合に、それぞれの領域iで学習済みモデルiをダウンロードして、車両3の学習済みモデル記憶部332の学習済みモデルを順次書き換える。
例えば、車両3が領域8内を移動している間は、車両3の各構成部の制御に適する学習済みモデルは、学習済みモデル8である。車両3の学習済みモデル記憶部332には学習済みモデル8が記憶されており、車両3の各構成部の制御は学習済みモデル8を用いて実行される。その後、車両3が領域8から領域13に移動した場合、制御支援サーバ2は、車両3の現在位置が領域13内であるという位置情報に基づいて、学習済みモデルデータベース221から領域13に関連付けされた学習済みモデル13を索出して、車両3に送信する。車両3においては、制御支援サーバ2から学習済みモデル13を受信してダウンロードし、学習済みモデルを更新する。車両3は、領域13内を走行している間は、学習済みモデル13を用いて各構成部を制御する。
以上説明した第1の実施形態によれば、制御支援サーバ2において、車両3の位置情報に基づいて、車両3の位置情報に含まれる現在位置に適した学習済みモデルを選択して、車両3に送信している。車両3においては、地図情報に基づいて現在位置に適した学習済みモデルを必要に応じて更新できるので、車両3の現在位置に適した学習済みモデルを用いて車両3の各構成部を制御できる。これにより、車両3の制御のための学習済みモデルが所定領域ごとに設定されている場合に、車両3の位置に応じて学習済みモデルを適切に切り替えることができる。
また、車両3において機械学習を行う、いわゆるオンボード機械学習の場合、学習済みモデルを作成する際の教師データの範囲が確定していることから、特に入出力データセットが場所によって定義域を有する可能性がある。この場合、所定の学習済みモデルは特定の場所でのみ精度が出る一方で、特定の場所以外では精度が悪くなる可能性がある。第1の実施形態によれば、車両3が移動して現在の学習済みモデルが使用できなくなっても、精度が担保された学習済みモデルを更新して使用できる。
(第2の実施形態)
次に、第2の実施形態による学習済みモデル切替方法について説明する。図6は、第2の実施形態による制御支援システムによる先読み方法の処理の流れを示すフロー図である。第2の実施形態においては、制御支援サーバ2における先読み部213による先読みを行った場合の学習済みモデルの切替方法について説明する。
図6に示すように、ステップST11において車両3の制御部32は、先読みに必要な各種情報を車両情報記憶部331およびGPS部36から取得して、先読み要因情報として生成する。先読み要因情報としては、例えば車両3の現在位置を含む位置情報、車両3の目的地、現在時刻、および現在の曜日などの情報である。なお、先読み要因情報はこれらの情報に限定されず、車両3の走行における先読みが可能になる情報であれば、種々の情報を採用することが可能である。ステップST12に移行して制御部32は、通信部34を介して、生成した先読み要因情報を制御支援サーバ2に送信する。なお、これらのステップST1,ST2の処理は、車両3の駆動時において、所定のタイミングで繰り返し実行される。所定のタイミングとは、所定時間間隔ごとの周期的な時刻であったり、あらかじめ設定された所定時刻であったりする。
ステップST13において制御支援サーバ2の先読み部213は、受信した先読み要因情報を記憶部22に記憶させた後、先読み要因情報に基づいて、先読みを実行して先読み情報を生成する。なお、先読み部213による先読みの具体的な方法としては、例えば車両3の過去の走行履歴に基づいたベイズ推定による先読みなどを採用できるが、先読みにおけるその他の種々の方法を採用することが可能である。先読み部213は、生成した先読み情報をモデルリスト作成部214に出力する。先読み情報は、車両3が現在以後に走行する可能性がある所定領域の情報を含む。
ステップST14に移行するとモデルリスト作成部214は、先読み部213から入力された先読み情報から、必要となる学習済みモデルのリストを作成する。具体的に例えば、先読み情報に含まれる少なくとも1つの所定領域のそれぞれに関連付けされた学習済みモデルのリストを作成する。より具体的に図5に示す例において、車両3が現在、例えば領域13を走行しているとする。この場合、車両3の過去の走行履歴情報および地図情報に基づくと、現在以後は、領域12、領域17、領域22、および領域21の順に走行する可能性が高い。先読み部213は、領域12,17,22,21の情報を先読み情報に含める。モデルリスト作成部214は、領域12、領域17、領域22、および領域21の情報に基づいて、学習済みモデル12,17,22,21のリストを作成する。制御部21は、モデルリスト作成部214が作成したリストに基づいて、学習済みモデルデータベース221から、学習済みモデル12,17,22,21を索出する。モデルリスト作成部214はさらに、領域12,17,22,21の情報に基づいて、学習済みモデルを切り替える位置の情報(切替位置情報)を作成する。
その後、図6に示すステップST15に移行して、制御部21は、モデルリスト作成部214が作成したリストに基づいて索出した少なくとも1つの学習済みモデルと、切替位置情報とを車両3に送信する。車両3においては、受信した学習済みモデル12,17,22,21および切替位置情報を、学習済みモデル記憶部332に記憶させる。
次に、車両3における学習済みモデルの更新方法について説明する。図7は、第2の実施形態の車両3における学習済みモデルの更新方法を説明するためのフローチャートである。図8は、第2の実施形態の車両3における学習済みモデルの更新方法を説明するための図である。なお、上述した先読み部213による先読み(ステップST13)によって、車両3の走行経路が先読みされ、この走行経路において使用される学習済みモデルが学習済みモデル記憶部332に格納されている。
図7に示すように、車両3においては、ステップST21において車両3の制御部32は、GPS部36によって検出された車両3の位置を確認して位置情報を取得する。次に、ステップST22に移行して制御部32は、取得した位置情報における車両3の現在位置と、学習済みモデル記憶部332に格納されている切替位置情報における切り替え位置とを比較する。制御部32は、車両3の現在位置が切替位置情報における切り替え位置の近辺であるか否かを判定する。図8に示す例においては、学習済みモデルXが適用される領域と、学習済みモデルYが適用される領域との切り替え位置に対して、その近辺が切り替え位置の近辺に設定される。なお、上述したステップST13における先読み部213の先読みによって、学習済みモデルX,Yも、制御支援サーバ2から送信されて学習済みモデル記憶部332に格納されているものとする。
図7に示すステップST22において制御部32が、車両3の現在位置が切替位置情報における切り替え位置の近辺ではないと判定した場合(ステップST22:No)、車両3における学習済みモデルの更新処理は終了する。一方、制御部32が、車両3の現在位置が切替位置情報における切り替え位置の近辺であると判定した場合(ステップST22:Yes)、ステップST23に移行する。
ステップST23において制御部32は、車両3の各構成部の制御に用いる学習済みモデルを、切り替え位置を通過した後の学習済みモデルに更新する。図8に示す例においては、車両3の各構成部の制御に学習済みモデルXが使用されている状態から、車両3が学習済みモデルYに関連付けされた領域に移動する際に切り替え位置の近辺において、車両3において使用される学習済みモデルXが学習済みモデルYに更新される。学習済みモデルX,Yはいずれも車両3の記憶部22における学習済みモデル記憶部332に格納されているため、車両3が切り替え位置の近辺に到達した時点で、車両3の制御に使用する学習済みモデルを容易に切り替えることができる。以上により、車両3における学習済みモデルの更新処理は終了する。以上のステップST21〜ST23の処理は、車両3において所定のタイミングで繰り返し実行される。所定のタイミングとは、所定時間間隔ごとの周期的な時刻であったり、あらかじめ設定された所定時刻であったりする。
以上、本発明の実施形態について具体的に説明したが、本発明は、上述した実施形態に限定されるものではなく、本発明の技術的思想に基づく各種の変形が可能である。例えば、上述した実施形態において挙げた入力パラメータや出力パラメータはあくまでも例に過ぎず、必要に応じてこれと異なる入力パラメータや出力パラメータを用いてもよい。
例えば、上述した実施形態においては、機械学習の一例としてニューラルネットワークを用いた深層学習を説明してきたが、それ以外の方法に基づく機械学習を行ってもよい。例えば、サポートベクターマシン、決定木、単純ベイズ、k近傍法など、他の教師あり学習を用いてもよい。また、教師あり学習に代えて半教師あり学習を用いてもよい。
(1)本発明は、機械学習による学習済みモデルを用いて車両の制御を支援する制御支援装置であって、車両から送信された車両の車両情報および位置情報に基づいて、車両において更新可能であるとともに、位置情報に含まれる車両の現在の位置に対応する学習済みモデルを選択する制御部と、選択した学習済みモデルを車両に送信する送信部と、を備える。
(2)上述した(1)において、車両の位置情報は、先読みによって得られた車両の現在以後の位置の情報を含む。
(3)上述した(2)において、先読みによって車両の走行経路を推定し、推定したルートに基づいて使用する学習済みモデルを特定し、あらかじめ車両に送信する。
(4)上述した(1)〜(3)のいずれか1つにおいて、車両の制御部は、第1の学習済みモデルに関連付けされた領域と第2の学習済みモデルに関連付けされた領域との切り替え位置の近辺において、車両の制御に使用する学習済みモデルを第1の学習済みモデルから第2の学習済みモデルに更新する。
さらなる効果や変形例は、当業者によって容易に導き出すことができる。本発明のより広範な態様は、以上のように表しかつ記述した特定の詳細および代表的な実施の形態に限定されるものではない。したがって、添付のクレームおよびその均等物によって定義される総括的な発明の概念の精神または範囲から逸脱することなく、様々な変更が可能である。
1 制御支援システム
2 制御支援サーバ
3 車両
21,32 制御部
22,33 記憶部
23,34 通信部
211 学習部
212 学習済みモデル比較部
213 先読み部
214 モデルリスト作成部
221 学習済みモデルデータベース
222 地図情報データベース
331 車両情報記憶部
332 学習済みモデル記憶部

Claims (1)

  1. 機械学習による学習済みモデルを用いて車両の制御を支援する制御支援装置であって、
    前記車両から送信された前記車両の車両情報および位置情報に基づいて、前記車両において更新可能であるとともに、前記位置情報に含まれる前記車両の現在の位置に対応する学習済みモデルを選択する制御部と、
    前記選択した学習済みモデルを前記車両に送信する送信部と、を備える
    ことを特徴とする制御支援装置。
JP2018234853A 2018-12-14 2018-12-14 制御支援装置 Pending JP2020093760A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018234853A JP2020093760A (ja) 2018-12-14 2018-12-14 制御支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018234853A JP2020093760A (ja) 2018-12-14 2018-12-14 制御支援装置

Publications (1)

Publication Number Publication Date
JP2020093760A true JP2020093760A (ja) 2020-06-18

Family

ID=71086014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018234853A Pending JP2020093760A (ja) 2018-12-14 2018-12-14 制御支援装置

Country Status (1)

Country Link
JP (1) JP2020093760A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022004168A1 (ja) * 2020-06-29 2022-01-06 住友電気工業株式会社 車載装置、車両通信システムおよびアルゴリズム提供方法
JP2022042857A (ja) * 2020-09-03 2022-03-15 トヨタ自動車株式会社 学習装置及びモデル学習システム
GB2603144A (en) * 2021-01-27 2022-08-03 Smart H Ltd Methods and systems for controlling vehicle performance
WO2023119800A1 (ja) * 2021-12-24 2023-06-29 日立Astemo株式会社 車載演算処理装置、および、演算処理方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022004168A1 (ja) * 2020-06-29 2022-01-06 住友電気工業株式会社 車載装置、車両通信システムおよびアルゴリズム提供方法
JP2022042857A (ja) * 2020-09-03 2022-03-15 トヨタ自動車株式会社 学習装置及びモデル学習システム
JP7040571B2 (ja) 2020-09-03 2022-03-23 トヨタ自動車株式会社 学習装置及びモデル学習システム
US11820398B2 (en) 2020-09-03 2023-11-21 Toyota Jidosha Kabushiki Kaisha Learning apparatus and model learning system
GB2603144A (en) * 2021-01-27 2022-08-03 Smart H Ltd Methods and systems for controlling vehicle performance
GB2603144B (en) * 2021-01-27 2023-07-19 Smart H Ltd Methods and systems for controlling vehicle performance
WO2023119800A1 (ja) * 2021-12-24 2023-06-29 日立Astemo株式会社 車載演算処理装置、および、演算処理方法

Similar Documents

Publication Publication Date Title
US10968855B2 (en) Control support device, vehicle, control support method, recording medium, learned model for causing computer to function, and method of generating learned model
JP2020093760A (ja) 制御支援装置
US10692371B1 (en) Systems and methods for changing autonomous vehicle operations based on user profiles
Thibault et al. A unified approach for electric vehicles range maximization via eco-routing, eco-driving, and energy consumption prediction
JP6477730B2 (ja) 駐車場と目的地との関連付け
CN110850861A (zh) 基于注意的分层变道深度强化学习
CN110850854A (zh) 自动驾驶员代理和为自动驾驶员代理提供策略的策略服务器
CN111197991B (zh) 基于深度神经网络的预测车辆最佳驾驶路径方法
US20190375421A1 (en) Systems and methods for prediction windows for optimal powertrain control
US20140032087A1 (en) Reducing fuel consumption by accommodating to anticipated road and driving conditions
CN110488842B (zh) 一种基于双向内核岭回归的车辆轨迹预测方法
JP2014019433A (ja) 逆強化学習を利用するハイブリッド車両の燃料効率向上
US11459962B2 (en) Electronic valve control
US9778658B2 (en) Pattern detection using probe data
JP6856575B2 (ja) 能動的探索なしの強化学習に基づく制御ポリシー学習及び車両制御方法
JP2020067762A (ja) 制御支援装置、機器制御装置、制御支援方法、制御支援プログラム、コンピュータを機能させるための学習済みモデル、および学習済みモデルの生成方法
CN110617829B (zh) 用于预测车辆的可能行驶路线的方法和装置
JP7345577B2 (ja) 自律走行車両用動的モデル評価パッケージ
JP2017122670A (ja) 経路探索装置、経路探索方法及び経路探索プログラム
Pecher et al. Data-driven vehicle trajectory prediction
JP2020071611A (ja) 機械学習装置
CN112967493A (zh) 一种基于神经网络的车辆通过交叉口行程时间的预测方法
Nadeem et al. Performance analysis of a real-time adaptive prediction algorithm for traffic congestion
Abi Akl et al. Trip-based prediction of hybrid electric vehicles velocity using artificial neural networks
US20230159047A1 (en) Learning-based critic for tuning a motion planner of autonomous driving vehicle