JP2020071611A - Machine learning device - Google Patents
Machine learning device Download PDFInfo
- Publication number
- JP2020071611A JP2020071611A JP2018204349A JP2018204349A JP2020071611A JP 2020071611 A JP2020071611 A JP 2020071611A JP 2018204349 A JP2018204349 A JP 2018204349A JP 2018204349 A JP2018204349 A JP 2018204349A JP 2020071611 A JP2020071611 A JP 2020071611A
- Authority
- JP
- Japan
- Prior art keywords
- machine learning
- information
- learned model
- vehicle
- map information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Combined Controls Of Internal Combustion Engines (AREA)
Abstract
Description
本発明は、機械学習装置に関する。 The present invention relates to a machine learning device.
ニューラルネットワークに基づいた機械学習による学習済モデルを用いて内燃機関を制御する技術が知られている(例えば、特許文献1を参照)。この技術では、学習済モデルを用いて内燃機関の所定の通路におけるガスの流量を推定し、推定結果に基づいて内燃機関を制御する。 A technique of controlling an internal combustion engine using a learned model by machine learning based on a neural network is known (for example, see Patent Document 1). In this technique, the flow rate of gas in a predetermined passage of the internal combustion engine is estimated using a learned model, and the internal combustion engine is controlled based on the estimation result.
ところで、将来的に、車両の制御のための学習済モデルを、ルート、地域、または仮想的に碁盤の目のように分けた所定領域ごとに作成し、所定領域ごとの学習済モデルを管理するシステムが考えられている。この場合、所定領域において、自然環境による地質学上の変化や、新たな道路の建設などによる人為的な変化が生じると、所定領域内の変化が生じた部分に、既存の学習済モデルが使用できなくなったり、学習済モデルの精度が極端に悪化したりする可能性がある。そこで、地質学上の変化や人為的な変化に対応した学習済モデルを早期に生成することができるシステムの開発が望まれている。 By the way, in the future, a learned model for vehicle control will be created for each route, region, or for each predetermined region virtually divided like a grid, and the learned model for each predetermined region will be managed. The system is considered. In this case, if a geological change due to the natural environment or an artificial change due to the construction of a new road occurs in the specified area, the existing trained model is used for the changed part in the specified area. It may not be possible or the accuracy of the trained model may be extremely deteriorated. Therefore, there is a demand for the development of a system that can generate a learned model at an early stage in response to geological changes and artificial changes.
本発明は、上記に鑑みてなされたものであって、その目的は、地質学上の変化や人為的な変化があった場合でも、車両の制御のための学習済モデルの精度の悪化を抑制できる機械学習装置を提供することにある。 The present invention has been made in view of the above, and an object thereof is to suppress deterioration of accuracy of a learned model for controlling a vehicle even when there is a geological change or an artificial change. It is to provide a machine learning device that can perform.
上述した課題を解決し、上記目的を達成するために、本発明に係る機械学習装置は、機械学習に用いる入力パラメータおよび出力パラメータを含むデータである入出力データセットを用いて、前記機械学習を行うことによって学習済モデルを生成する機械学習装置であって、前記入力パラメータが、車両の内部または外部の状態を制御する制御情報と、地図情報とを含み、前記地図情報に基づく複数の所定領域ごとにそれぞれ学習済モデルが設定され、前記地図情報における前記複数の所定領域において、地質学上の変化、または人為的な変化を認識した場合に、前記複数の所定領域から前記地質学上の変化または人為的な変化が生じた所定領域を特定し、前記特定した所定領域に設定されている学習済モデルを削除、または前記学習済みモデルを生成して更新する制御部を備えることを特徴とする。 In order to solve the above problems and achieve the above object, a machine learning device according to the present invention uses the input / output data set that is data including input parameters and output parameters used for machine learning to perform the machine learning. A machine learning device that generates a learned model by performing the input parameter, the input parameter including control information for controlling an internal or external state of the vehicle, and map information, and a plurality of predetermined regions based on the map information. A learned model is set for each of the plurality of predetermined areas in the map information, and when a geological change or an artificial change is recognized, the plurality of predetermined areas change the geology. Alternatively, a predetermined area where an artificial change has occurred is specified and the learned model set in the specified predetermined area is deleted, or the learned model is deleted. Characterized in that it comprises a control unit for updating to generate Le.
本発明に係る機械学習装置によれば、地質学上の変化や人為的な変化があった場合でも、車両の制御のための学習済モデルの精度の悪化を抑制することが可能となる。 According to the machine learning device of the present invention, it is possible to suppress deterioration of accuracy of a learned model for controlling a vehicle even when there is a geological change or an artificial change.
以下、本発明の実施形態について図面を参照しつつ説明する。なお、以下の実施形態の全図においては、同一または対応する部分には同一の符号を付す。また、本発明は以下に説明する実施形態によって限定されるものではない。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. In all the drawings of the following embodiments, the same or corresponding parts are designated by the same reference numerals. Moreover, the present invention is not limited to the embodiments described below.
まず、本発明の一実施形態による機械学習装置を適用可能な機械学習システムについて説明する。図1は、この一実施形態による機械学習システムを示す。図1に示すように、機械学習システム1は、ネットワーク10を介して互いに通信可能な、機械学習サーバ2と、複数の車両3と、地図サーバ4とを有する。
First, a machine learning system to which a machine learning device according to an embodiment of the present invention can be applied will be described. FIG. 1 shows a machine learning system according to this embodiment. As shown in FIG. 1, the machine learning system 1 includes a
本実施形態において、機械学習装置としての機械学習サーバ2は、車両の環境条件やエンジン状態における所定のデータを入力パラメータとし、車両から排出される窒素酸化物(NOx)の排出量を出力パラメータとする機械学習を行うことによって学習済モデルを生成する。また、車両3においては、機械学習によって生成された学習済モデルを用いて、NOxの排出量を予測する。
In the present embodiment, the
ネットワーク10は、インターネット回線網や携帯電話回線網などから構成される。ネットワーク10は、例えば、インターネットなどの公衆通信網であって、例えばLAN(Local Area Network)、WAN(Wide Area Network)、携帯電話などの電話通信網や公衆回線、VPN(Virtual Private Network)、および専用線などの一または複数の組み合わせからなる。ネットワーク10は、有線通信および無線通信が適宜組み合わされている。
The
(機械学習サーバ)
機械学習サーバ2は、通信部32を有する複数の車両3から送信された種々の情報を、ネットワーク10を介して収集するデータ収集処理を実行する。機械学習サーバ2は、収集した種々の情報によって機械学習を実行可能である。機械学習サーバ2は、制御部21、記憶部22、および通信部23を備える。
(Machine learning server)
The
制御部21は、具体的に、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field-Programmable Gate Array)などのプロセッサ、およびRAM(Random Access Memory)やROM(Read Only Memory)などの主記憶部(いずれも図示せず)を備える。
The
制御部21は、記憶部22に記憶されたプログラムを主記憶部の作業領域にロードして実行し、プログラムの実行を通じて各構成部などを制御することで、所定の目的に合致した機能を実現できる。
The
記憶部22は、物理的には、RAM等の揮発性メモリ、ROM等の不揮発性メモリ、EPROM(Erasable Programmable ROM)、ハードディスクドライブ(HDD、Hard Disk Drive)、およびリムーバブルメディアなどから選ばれた記憶媒体から構成される。なお、リムーバブルメディアは、例えば、USB(Universal Serial Bus)メモリ、または、CD(Compact Disc)、DVD(Digital Versatile Disc)、またはBD(Blu-ray(登録商標) Disc)のようなディスク記録媒体である。また、外部から装着可能なメモリカード等のコンピュータ読み取り可能な記録媒体を用いて記憶部22を構成してもよい。記憶部22には、機械学習サーバ2の動作を実行するための、オペレーティングシステム(Operating System :OS)、各種プログラム、各種テーブル、各種データベースなどが記憶可能である。各種プログラムには、本実施形態によるモデル更新処理プログラムも含まれる。これらの各種プログラムは、ハードディスク、フラッシュメモリ、CD−ROM、DVD−ROM、フレキシブルディスク等のコンピュータ読み取り可能な記録媒体に記録して広く流通させることも可能である。
The
本実施形態においては、制御部21によるプログラムの実行によって、学習部21aの機能が実行される。学習部21aは、機械学習サーバ2が受信した入出力データセットをもとに機械学習を行う。学習部21aは、学習した結果を記憶部22に書き込んで記憶させる。学習部21aは、学習を行っているニューラルネットワークとは別に、所定のタイミングで、当該タイミングにおける最新の学習済モデルを、記憶部22に記憶させる。記憶部22に記憶させる際には、古い学習済モデルを削除して最新の学習済モデルを記憶させる更新でもよいし、古い学習済モデルの一部または全部を保存したまま最新の学習済モデルを記憶させる蓄積でもよい。
In the present embodiment, the function of the learning unit 21a is executed by the execution of the program by the
以下、具体的な機械学習の一例として、ニューラルネットワークを用いた深層学習について説明する。図2は、学習部21aが学習するニューラルネットワークの構成を模式的に示す図である。図2に示すニューラルネットワーク100は、順伝播型ニューラルネットワークであり、入力層101と、中間層102と、出力層103とを有する。入力層101は複数のノードからなり、各ノードには互いに異なる入力パラメータが入力される。中間層102は入力層101からの出力が入力される。中間層102は、入力層101からの入力を受ける複数のノードからなる層を含む多層の構造を有する。出力層103は、中間層102からの出力が入力され、出力パラメータを出力する。中間層102が多層構造を有するニューラルネットワークを用いた機械学習は、深層学習と呼ばれる。
Deep learning using a neural network will be described below as a specific example of machine learning. FIG. 2 is a diagram schematically showing the configuration of the neural network learned by the learning unit 21a. The
図3は、ニューラルネットワーク100が有するノードにおける入出力の概要を説明する図である。図3においては、ニューラルネットワーク100のうち、I個のノードを有する入力層101と、J個のノードを有する第1中間層121と、K個のノードを有する第2中間層122におけるデータの入出力の一部を模式的に示している(I、J、Kは正の整数)。入力層101の上からi番目のノードには、入力パラメータxi(i=1,2,…,I)が入力される。以下、全ての入力パラメータの集合を「入力パラメータ{xi}」と記載する。
FIG. 3 is a diagram for explaining an outline of input / output in the node included in the
入力層101の各ノードは、隣接する第1中間層121の各ノードに対し、入力パラメータに所定の重みを乗じた値を有する信号を出力する。例えば、入力層101の上からi番目のノードは、第1中間層121の上からj番目(j=1,2,…,J)のノードに対して、入力パラメータxiに重みαijを乗じた値αijxiを有する信号を出力する。第1中間層121の上からj番目のノードには、合計で入力層101の各ノードからの出力に所定のバイアスb(1) jを加えた値Σi=1〜Iαijxi+b(1) jが入力される。ここで第1項目のΣi=1〜Iは、i=1,2,…,Iの和を取ることを意味する。
Each node of the
第1中間層121の上からj番目のノードの出力値yjは、そのノードへの入力層101からの入力値Σi=1〜Iαijxi+b(1) jの関数として、yj=S(Σi=1〜Iαijxi+b(1) j)と表される。この関数Sは活性化関数と呼ばれる。具体的な活性化関数として、例えばシグモイド関数S(u)=1/{1+exp(−u)}や正規化線形関数(ReLU)S(u)=max(0,u)などを挙げることができる。活性化関数は、非線形関数が用いられることが多い。
The output value y j of the j-th node from the top of the first
第1中間層121の各ノードは、隣接する第2中間層122の各ノードに対し、入力パラメータに所定の重みを乗じた値を有する信号を出力する。例えば、第1中間層121の上からj番目のノードは、第2中間層122の上からk番目(k=1,2,…,K)のノードに対して、入力値yjに重みβjkを乗じた値βjkyjを有する信号を出力する。第2中間層122の上からk番目のノードには、合計で第1中間層121の各ノードからの出力に所定のバイアスb(2) kを加えた値Σj=1〜Jβjkyj+b(2) kが入力される。ここで第1項目のΣj=1〜Jは、j=1,2,…,Jの和を取ることを意味する。
Each node of the first
第2中間層122の上からk番目のノードの出力値zkは、そのノードへの第1中間層121からの入力値Σj=1〜Jβjkyj+b(2) kを変数とする活性化関数を用いて、zk=S(Σj=1〜Jβjkyj+b(2) k)と表される。
The output value z k of the k-th node from the top of the second
上述したように、入力層101の側から出力層103の側へ向かう順方向に沿って順次繰り返すことにより、最終的に出力層103から一つの出力パラメータYが出力される。以下、ニューラルネットワーク100が含む重みおよびバイアスをまとめてネットワークパラメータwという。このネットワークパラメータwは、ニューラルネットワーク100の全ての重みおよびバイアスを成分とするベクトルである。
As described above, the
学習部21aは、入力パラメータ{xi}をニューラルネットワーク100へ入力することによって算出した出力パラメータYと、入力パラメータ{xi}とともに入出力データセットを構成する出力パラメータ(目標出力)Y0とに基づいて、ネットワークパラメータを更新する演算を行う。具体的には、2つの出力パラメータYとY0との誤差を最小化するための演算を行うことによってネットワークパラメータwを更新する。この際には、確率的勾配降下法がよく用いられる。以下、入力パラメータ{xi}および出力パラメータYの組({xi},Y)を総称して「学習データ」という。
The learning unit 21a outputs an output parameter Y calculated by inputting the input parameter {x i } to the
以下、確率的勾配降下法の概要を説明する。確率的勾配降下法は、2つの出力パラメータYとY0を用いて定義される誤差関数E(w)のネットワークパラメータwの各成分に対する微分から求まる勾配∇wE(w)を最小化するように、ネットワークパラメータwを更新する方法である。誤差関数は、例えば学習データの出力パラメータYと入出力データセットの出力パラメータY0の2乗誤差|Y−Y0|2により定義される。また、勾配∇wE(w)は、誤差関数E(w)のネットワークパラメータwの成分に関する微分である
∂E(w)/∂αij、∂E(w)/∂βjk、∂E(w)/∂b(1) j、∂E(w)/∂b(2) k(ここで、i=1〜I、j=1〜J、k=1〜K)などを成分に有するベクトルである。
The outline of the stochastic gradient descent method will be described below. The stochastic gradient descent method is designed to minimize the gradient ∇ w E (w) obtained by differentiating each component of the network parameter w of the error function E (w) defined using the two output parameters Y and Y 0. The method is to update the network parameter w. The error function is defined by, for example, the squared error | Y−Y 0 | 2 of the output parameter Y of the learning data and the output parameter Y 0 of the input / output data set. Further, the gradient ∇ w E (w) is a derivative with respect to the component of the network parameter w of the error function E (w), ∂E (w) / ∂α ij , ∂E (w) / ∂β jk , ∂E ( w) / ∂b (1) j , ∂E (w) / ∂b (2) k (where i = 1 to I, j = 1 to J, k = 1 to K) and the like as vectors Is.
確率的勾配降下法では、ネットワークパラメータwを、自動または手動で定まる所定の学習率ηを用いて、w’=w−η∇wE(w)、w’’=w’−η∇w’E(w’)、…と順次更新する。なお、学習率ηは、学習の途中で変更してもよい。学習部21aは、制御部21が学習データを取得するたびに、上述した更新処理を繰り返す。これにより、誤差関数E(w)は徐々に極小点に近づいていく。なお、より一般的な確率的勾配降下法の場合、誤差関数E(w)は、全学習データを含むサンプルの中からランダムに抽出することによって更新処理のたびに定義され、本実施形態においても適用可能である。この際に抽出する学習データの数は1つに限定されず、記憶部22が記憶する学習データの一部でもよい。
The stochastic gradient descent, the network parameters w, using a predetermined learning rate η determined automatically or manually, w '= w-η∇ w E (w), w''=w'-η∇w' E (w '), ... are sequentially updated. The learning rate η may be changed during learning. The learning unit 21a repeats the above-described update process every time the
勾配∇wE(w)の計算を効率的に行うための方法として、誤差逆伝播法が知られている。誤差逆伝播法は、学習データ({xi}、Y)を算出後、出力層における目標出力Y0と出力パラメータYの誤差に基づいて、出力層→中間層→入力層へと勾配∇wE(w)の成分を逆にたどって計算していく方法である。学習部21aは、誤差逆伝播法を用いて勾配∇wE(w)の全ての成分を算出した後、算出した勾配∇wE(w)を用いて上述した確率的勾配降下法を適用することにより、ネットワークパラメータwを更新する。 An error backpropagation method is known as a method for efficiently calculating the gradient ∇ w E (w). The error back-propagation method calculates the learning data ({x i }, Y) and then, based on the error between the target output Y 0 and the output parameter Y in the output layer, the gradient ∇ w from the output layer → the intermediate layer → the input layer. In this method, the components of E (w) are traced in reverse. The learning unit 21a calculates all the components of the gradient ∇ w E (w) using the error back propagation method, and then applies the above-described stochastic gradient descent method using the calculated gradient ∇ w E (w). By doing so, the network parameter w is updated.
図4は、本実施形態による機械学習サーバ2が実行する機械学習および入出力データセットを説明するための図である。図4に示すように、本実施形態においては、入力パラメータが「点火時期、燃料の噴射量、噴射時期、スロットル開度、可変バルブタイミング(VVT:Variable Valve Timing)、および排気再循環装置(EGR)のガス流量を調整するEGRバルブの制御量、地図情報、天候情報」であり、出力パラメータが「NOxの排出量」である。学習部21aによって、ニューラルネットワーク100を用いた深層学習により生成された学習済モデルから、出力パラメータとして出力されるNOxの排出量が最小になるように、入力パラメータが設定される。ここで、入力パラメータの内で、車両3の外部または内部において制御部31による制御が可能な制御情報である、点火時期、燃料の噴射量、噴射時期、スロットル開度、VVT、およびEGRバルブの制御量に関して目標値が設定される。
FIG. 4 is a diagram for explaining machine learning and input / output data sets executed by the
地図情報としては、地図上の領域を、緯度および経度に基づいて分割してそれぞれを所定領域として設定したり、道路の路線(ルートID)ごとに分割してそれぞれを所定領域として設定したりする。その上で、それぞれの所定領域ごとに、個別に学習済モデルが生成されて設定される。すなわち、設定された所定領域ごとに個々に学習済モデルが設定される。これにより、機械学習によって地図情報が加味されて最適化された学習済モデルが得られるので、車両3において制御部31により制御可能なアクチュエータ量を、地図情報および天候情報に応じてNOxが最小となるように制御できる。NOxが最小になるようにアクチュエータ量を制御することにより、従来に比してエミッションを改善することが可能になる。
As the map information, an area on the map is divided based on latitude and longitude and set as each predetermined area, or each area of a road (route ID) is divided and set as each predetermined area. .. Then, a learned model is individually generated and set for each of the predetermined regions. That is, the learned model is individually set for each set predetermined area. As a result, a learned model that is optimized by adding the map information by machine learning is obtained, so that the actuator amount that can be controlled by the
図1に示す記憶部22には、上述のように生成された学習済モデルが検索可能に記憶される。記憶部22は、制御部21の学習部21aによって生成された学習済モデルを、蓄積したり更新したりして記憶する。学習済モデルは、ニューラルネットワークを用いた深層学習に基づいて生成される。学習済モデルを記憶するとは、学習済モデルにおけるネットワークパラメータwや演算のアルゴリズムなどの情報を記憶することを意味する。また、記憶部22は、上述した入力パラメータと出力パラメータとの組からなる入出力データセットを記憶する。記憶部22は、学習部21aが入力パラメータをニューラルネットワーク100に入力して算出した出力パラメータを当該入力パラメータとともに学習データとして記憶する。
The learned model generated as described above is stored in the
通信部23は、例えば、LAN(Local Area Network)インターフェースボード、無線通信のための無線通信回路である。LANインターフェースボードや無線通信回路は、公衆通信網であるインターネットなどのネットワーク10に接続される。送信部および受信部としての通信部23は、ネットワーク10に接続して、複数の車両3との間で通信を行う。通信部23は、それぞれの車両3との間で、車両識別情報、走行履歴情報、車両情報、地図情報、および学習済モデルなどの種々の情報を受信したり、車両3に対して地図情報、学習済モデル、および制御信号などの種々の情報を送信したりする。
The
車両識別情報は、個々の車両3を互いに識別するための種々の情報を含む。走行履歴情報は、それぞれの車両3における走行経路ならびに走行地域、地図情報、および天候情報などの情報を含む。走行経路の情報は、特定の道路の上りか下りかの情報、または特定の道路の上りか下りかの情報などである。走行地域の情報は、走行路線の情報、市町村の情報、都道府県の情報、または関東や東海などの地域の情報などである。地図情報は、具体的な地図画像を出力可能な情報、および道路の状態の情報を含む。天候情報は、外気温や湿度の情報や、晴れ、曇り、雨、または雪などの天気の情報を含む。外気温や湿度の情報は、走行時における気温や湿度の情報のみならず、外気の実際の計測温度や計測湿度の情報を含んでもよい。また、天候情報は、風向き、風速、および車両3の進行方向が関連付けられた情報などを含んでもよい。車両情報は、車両3の特に内燃機関に関する情報として、点火時期、燃料の噴射量、噴射時期、スロットル開度、VVT、およびEGRバルブの制御量に関する情報を含む。車両情報はさらに、総走行距離、位置情報、速度情報、加速度情報、センサ群取得情報、および車種などの情報を含んでもよい。
The vehicle identification information includes various information for identifying the
(車両)
車両3は、運転者による運転によって走行する車両や、与えられた運行指令に従って自律走行可能に構成された自律走行車両である。車両3は、制御部31、通信部32、駆動部33、および記憶部34を備える。制御部31および記憶部34はそれぞれ、物理的には上述した制御部21および記憶部22と同様である。制御部31は、記憶部34に記憶されたプログラムの実行によって、車両3に搭載される各種構成要素の動作を統括的に制御する。
(vehicle)
The
送信部および受信部としての通信部32は、ネットワーク10を介した無線通信によって、少なくとも機械学習サーバ2との間で通信を行う、例えば車載通信モジュール(DCM:Data Communication Module)などからなる。
The
駆動部33は、車両3の走行に必要な従来公知の駆動部である。具体的には、車両3は、駆動源となる内燃機関であるエンジン、エンジンの駆動力を伝達する駆動伝達機構、および走行するための駆動輪などを備える。車両3のエンジンは、燃料の燃焼による駆動によって電動機などを用いて発電可能に構成される。発電された電力は充電可能なバッテリに充電される。
The
記憶部34には、車両3における、上述した車両識別情報、地図情報、走行履歴情報、車両情報、学習済モデルを含む各種情報が、蓄積可能および更新可能に記憶されている。記憶部34には、車両3における各種センサ(図示せず)によって検出された種々のデータが、センサ情報として蓄積可能および更新可能に記憶される。車両3はさらに、入出力部、センサ群、およびGPS部(いずれも図示せず)などを備える。
The
制御部31は、車両3の走行時や停車時においてセンサ群(図示せず)から取得した情報に基づいて、地図情報、走行履歴情報、および車両情報などの情報を記憶部34に逐次記憶させる。制御部31は、記憶部34に記憶させた地図情報、走行履歴情報、および車両情報などの情報を、所定のタイミングで通信部32を通じて機械学習サーバ2に送信する。機械学習サーバ2においては、それぞれの車両3から受信した地図情報、走行履歴情報、および車両情報などの情報を、記憶部22に記憶させる。これにより、機械学習サーバ2においては、記憶部22に、地図情報、走行履歴情報、および車両情報などの情報が蓄積されたり、更新されたり、併合されたりする。
The
(地図サーバ)
地図サーバ4は、機械学習サーバ2および複数の車両3から送信された地図に関する情報を、ネットワーク10を介して収集するデータ収集処理を実行する。地図サーバ4は、制御部41、記憶部42、および通信部43を備える。制御部41、記憶部42、および通信部43はそれぞれ、物理的には機械学習サーバ2における、制御部21、記憶部22、および通信部23と同様である。
(Map server)
The
地図サーバ4の制御部41は、記憶部42に記憶されたプログラムの実行により、データ収集部41aの機能を実行する。データ収集部41aは、地図情報や、地図情報に関連する情報(以下、地図関連情報)を収集する。上述したように地図情報は、具体的な地図画像を出力可能な情報、および道路の状態の情報を含む。地図関連情報とは、自然環境に基づく地質学上の変化の情報や、道路の工事や橋梁の架設などの人為的な変化の情報などの情報である。データ収集部41aは、これらの地図情報および地図関連情報を、所定のタイミングで通信部43を通じて、機械学習サーバ2、複数の車両3、および他の情報サーバ(図示せず)から収集して、記憶部42に記憶させる。これにより、地図サーバ4においては、記憶部42に、地図情報および地図関連情報などの情報が蓄積されたり、更新されたり、併合されたりする。地図サーバ4は、蓄積、更新、または併合された地図情報、および地図関連情報を機械学習サーバ2に送信し、機械学習サーバ2においては、地図サーバ4から受信した地図情報および地図関連情報を、記憶部22に記憶させる。
The control unit 41 of the
記憶部42には、具体的な地図画像を出力可能な情報および走行路の状態を含む地図情報が記憶されている。制御部41は、データ収集部41aによって収集された地図情報に関連する情報に基づいて、記憶部42に記憶された地図情報を適宜更新する。更新された地図情報は、機械学習サーバ2や車両3に送信される。機械学習サーバ2においては、更新された地図情報に基づいて、学習済モデルが更新される。
The
以下に、本実施形態による学習済モデルの更新方法の具体的な一例について説明する。以下の説明において、情報の送受信はネットワーク10を介して行われるが、この点についての都度の説明は省略する。図5は、本実施形態による機械学習サーバ2が実行する学習済モデルの更新方法を説明するためのフローチャートである。図6は、本実施形態による機械学習サーバ2が学習済モデルを更新する際の地図情報の一例を示す図である。図6に示すように、本実施形態においては、地図が碁盤状に分割されて設定され、それぞれの領域にそれぞれ学習済モデルが割り当てられた状態を例にする。図6においては、それぞれの領域にカウントi(i=1,2,…,24,25)が割り当てられ、所定領域として設定された領域ごとに学習済モデルiが設定されている。また、地図情報は、地図サーバ4から機械学習サーバ2に適切なタイミングで送信される。
A specific example of the learned model updating method according to this embodiment will be described below. In the following description, information transmission / reception is performed via the
図5に示すように、まず、ステップST1において機械学習サーバ2の制御部21は、カウントiの初期化を行って、i=0とする。ステップST2に移行して制御部21は、カウントアップを行ってカウントiを1増加させる。次に,ステップST3において制御部21は、図6に示す地図におけるカウントiの現在の状態が、過去の地図情報と異なるか否かを判定する。具体的に例えば、車両3が地図上においてカウントiの領域を走行した際の走行路の状況に関して車両3から受信した地図情報や、地図サーバ4から受信した地図情報および地図関連情報や、記憶部22に記憶されている地図情報および地図関連情報に基づいて、制御部21は、カウントiの領域における現在の状態を認識する。その後、制御部21は、過去の地図情報と現在の状態とを比較したり、地図サーバ4から受信した地図関連情報に含まれる変化の情報に基づいたりして、カウントiの領域の現在の状態が、過去の地図情報と異なるか否かを判定する。
As shown in FIG. 5, first, in step ST1, the
制御部21がカウントiの現在の状態が過去の地図情報と同じであると判定した場合(ステップST3:No)、ステップST2に復帰する。一方、制御部21がカウントiの現在の状態が過去の地図情報と異なると判定した場合(ステップST3:Yes)、ステップST4に移行する。図6に示す例においては、変更領域は実線で囲まれた打点領域であり、地図情報においてカウントiがi=11,12,16,17の領域に跨がった領域である。
When the
ステップST4において制御部21の学習部21aは、図4に示すニューラルネットワーク100に、入力パラメータとして更新された地図情報を入力する。これにより、カウントiの地図情報の部分に適用される新しい学習済モデルiが生成される。一方、記憶部22においては、古い学習済モデルiが削除され、生成された学習済モデルiによって更新される。なお、必要に応じて、新たな学習済モデルiを生成することなく、古い学習済モデルiを削除することも可能である。
In step ST4, the learning unit 21a of the
ステップST5に移行すると制御部21は、カウントiが、地図情報において地図を分割した数と一致するか否かを判定する。制御部21が、カウントiは分割した数(ここでは、25)と一致しないと判定した場合(ステップST5:No)、ステップST2に復帰する。一方、制御部21が、カウントiは分割した数(ここでは、25)と一致すると判定した場合(ステップST5:Yes)、学習済モデルの更新処理を終了する。以上により、地図情報の中で状態が変化した部分に対応する学習済モデルが更新される。
After shifting to step ST5, the
(第1変形例)
次に、上述した一実施形態の変形例について説明する。第1変形例においては、機械学習サーバ2における学習部21aが車両3に搭載されている。すなわち、車両3が機械学習装置を搭載している。この場合、車両3において機械学習を実行して、学習済モデルを生成できる。車両3において学習済モデルが生成された場合には、機械学習サーバ2に対して生成した学習済モデルを送信する。機械学習サーバ2は、複数の車両3から送信された学習済モデルに基づいて、新たに汎用的な学習済モデルを生成することが可能である。
(First modification)
Next, a modified example of the above-described embodiment will be described. In the first modification, the learning unit 21a in the
(第2変形例)
第2変形例においては、車両3が機械学習装置を搭載し、かつ上述した学習済モデルの更新も車両3において実行する。この場合、車両3が、実際に走行した道路の状態が記憶部34に記憶された地図情報と異なる状態であると検知した場合、制御部31は、地図情報の当該道路の部分を車両3が実際に走行した道路の状態に変更して、地図情報を更新する。その後、車両3の学習部は、更新した地図情報に基づいて、図5に示すフローチャートに従って、更新された少なくとも1つの地図情報に対応する学習済モデルを更新する。一方、車両3は、更新した地図情報を地図サーバ4に送信する。地図サーバ4は、複数の車両3から更新された地図情報を受信し、これらの更新された地図情報に基づいて、記憶部42に格納されている地図情報を更新する。なお、車両3は、更新した地図情報の代わりに、地図情報に関連する情報を地図サーバ4に送信するようにしてもよい。
(Second modified example)
In the second modification, the
以上説明した本発明の一実施形態によれば、地図情報の変化に対応して、学習済モデルを更新することができるので、車両3が走行する道路に、地質学上の変化や人為的な変化があった場合でも、車両3の制御のための学習済モデルの精度の悪化を抑制することが可能となる。
According to the embodiment of the present invention described above, the learned model can be updated in response to the change in the map information, so that the road on which the
以上、本発明の一実施形態について具体的に説明したが、本発明は、上述の一実施形態に限定されるものではなく、本発明の技術的思想に基づく各種の変形が可能である。例えば、上述の一実施形態において、機械学習サーバ2と地図サーバ4とは同一のサーバから構成してもよい。
Although one embodiment of the present invention has been specifically described above, the present invention is not limited to the above-described one embodiment, and various modifications based on the technical idea of the present invention are possible. For example, in the above-described embodiment, the
1 機械学習システム
2 機械学習サーバ
3 車両
4 地図サーバ
10 ネットワーク
21,31,41 制御部
21a 学習部
22,34,42 記憶部
23,32,43 通信部
33 駆動部
41a データ収集部
100 ニューラルネットワーク
101 入力層
102 中間層
103 出力層
121 第1中間層
122 第2中間層
1
Claims (1)
前記入力パラメータが、車両の内部または外部の状態を制御する制御情報と、地図情報とを含み、
前記地図情報に基づく複数の所定領域ごとにそれぞれ学習済モデルが設定され、
前記地図情報における前記複数の所定領域において、地質学上の変化、または人為的な変化を認識した場合に、前記複数の所定領域から前記地質学上の変化または人為的な変化が生じた所定領域を特定し、前記特定した所定領域に設定されている学習済モデルを削除、または前記学習済モデルを生成して更新する制御部を備える
ことを特徴とする機械学習装置。 A machine learning device for generating a trained model by performing the machine learning, using an input / output data set that is data including input parameters and output parameters used for machine learning,
The input parameter includes control information for controlling a state inside or outside the vehicle, and map information,
A learned model is set for each of a plurality of predetermined regions based on the map information,
In the plurality of predetermined regions in the map information, when a geological change or an artificial change is recognized, the predetermined region in which the geological change or the artificial change occurs from the plurality of predetermined regions The machine learning device is characterized by further comprising: a controller that deletes the learned model set in the specified predetermined area or that generates and updates the learned model.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018204349A JP2020071611A (en) | 2018-10-30 | 2018-10-30 | Machine learning device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018204349A JP2020071611A (en) | 2018-10-30 | 2018-10-30 | Machine learning device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020071611A true JP2020071611A (en) | 2020-05-07 |
Family
ID=70547798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018204349A Pending JP2020071611A (en) | 2018-10-30 | 2018-10-30 | Machine learning device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020071611A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673805A (en) * | 2020-05-13 | 2021-11-19 | 丰田自动车株式会社 | Vehicle allocation device, vehicle and terminal |
CN113805480A (en) * | 2020-06-11 | 2021-12-17 | 丰田自动车株式会社 | Machine learning device, machine learning system, machine learning method, and storage medium |
JP2022036586A (en) * | 2020-08-24 | 2022-03-08 | トヨタ自動車株式会社 | Model learning system and server |
-
2018
- 2018-10-30 JP JP2018204349A patent/JP2020071611A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113673805A (en) * | 2020-05-13 | 2021-11-19 | 丰田自动车株式会社 | Vehicle allocation device, vehicle and terminal |
CN113673805B (en) * | 2020-05-13 | 2024-05-14 | 丰田自动车株式会社 | Vehicle allocation device and vehicle |
CN113805480A (en) * | 2020-06-11 | 2021-12-17 | 丰田自动车株式会社 | Machine learning device, machine learning system, machine learning method, and storage medium |
JP2022036586A (en) * | 2020-08-24 | 2022-03-08 | トヨタ自動車株式会社 | Model learning system and server |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10968855B2 (en) | Control support device, vehicle, control support method, recording medium, learned model for causing computer to function, and method of generating learned model | |
Thibault et al. | A unified approach for electric vehicles range maximization via eco-routing, eco-driving, and energy consumption prediction | |
CN107169567B (en) | Method and device for generating decision network model for automatic vehicle driving | |
JP2020093760A (en) | Control support device | |
CN111899594B (en) | Automated training data extraction method for dynamic models of autonomous vehicles | |
JP2020071611A (en) | Machine learning device | |
Lemieux et al. | Vehicle speed prediction using deep learning | |
US11474529B2 (en) | System and method for motion planning of an autonomous driving machine | |
KR102254765B1 (en) | Device and method of prediction traffic data using deep learning model | |
US11661067B2 (en) | Method for ascertaining driving profiles | |
CN107886188B (en) | Liquefied natural gas bus tail gas emission prediction method | |
CN112101415B (en) | Accumulated carbon quantity prediction method and device, automobile, cloud server and computer readable storage medium | |
KR102118088B1 (en) | Method for real driving emission prediction using artificial intelligence technology | |
CN110488842A (en) | A kind of track of vehicle prediction technique based on two-way kernel ridge regression | |
CN112967493A (en) | Neural network-based prediction method for vehicle passing intersection travel time | |
CN110617829A (en) | Method and device for predicting a possible driving route of a vehicle | |
CN112534446B (en) | Electronic control device and neural network updating system | |
JP7338652B2 (en) | Power consumption prediction device | |
US20210293557A1 (en) | Methods and apparatus for ascertaining a driving route for a motor vehicle | |
CN116861370B (en) | Motion data processing method for underground explosion-proof rubber-tyred vehicle | |
CN116662815B (en) | Training method of time prediction model and related equipment | |
US20210380092A1 (en) | Vehicle allocation device, vehicle allocation method, and computer readable recording medium | |
CN109978174A (en) | Information processing method, information processing unit and program recorded medium | |
CN115752502A (en) | Path screening method and device and electronic equipment | |
JP2022067454A (en) | Vehicle control support system |