JP2020071611A - Machine learning device - Google Patents

Machine learning device Download PDF

Info

Publication number
JP2020071611A
JP2020071611A JP2018204349A JP2018204349A JP2020071611A JP 2020071611 A JP2020071611 A JP 2020071611A JP 2018204349 A JP2018204349 A JP 2018204349A JP 2018204349 A JP2018204349 A JP 2018204349A JP 2020071611 A JP2020071611 A JP 2020071611A
Authority
JP
Japan
Prior art keywords
machine learning
information
learned model
vehicle
map information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018204349A
Other languages
Japanese (ja)
Inventor
中村 文彦
Fumihiko Nakamura
中村  文彦
大樹 横山
Daiki Yokoyama
大樹 横山
栄来 北川
Eiki Kitagawa
栄来 北川
翠 栗橋
Midori Kurihashi
翠 栗橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2018204349A priority Critical patent/JP2020071611A/en
Publication of JP2020071611A publication Critical patent/JP2020071611A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Combined Controls Of Internal Combustion Engines (AREA)

Abstract

To provide a machine learning device capable of suppressing deterioration in accuracy of a learned model for vehicle control even when a geological change or an artificial change occurs.SOLUTION: A machine learning device generates a learned model by performing machine learning using an input-output dataset, which is data containing input and output parameters used for machine learning. The input parameters contain control information for controlling a state inside or outside a vehicle and map information. A learned model is set for each of a plurality of prescribed regions based on the map information. The machine learning device includes a control unit. When a geological change or an artificial change is recognized in the plurality of prescribed regions in the map information, the control unit identifies a prescribed region in which the geological change or the artificial change occurred from the plurality of prescribed regions, and deletes a learned model set in the identified prescribed region or generates and updates a learned model.SELECTED DRAWING: Figure 1

Description

本発明は、機械学習装置に関する。   The present invention relates to a machine learning device.

ニューラルネットワークに基づいた機械学習による学習済モデルを用いて内燃機関を制御する技術が知られている(例えば、特許文献1を参照)。この技術では、学習済モデルを用いて内燃機関の所定の通路におけるガスの流量を推定し、推定結果に基づいて内燃機関を制御する。   A technique of controlling an internal combustion engine using a learned model by machine learning based on a neural network is known (for example, see Patent Document 1). In this technique, the flow rate of gas in a predetermined passage of the internal combustion engine is estimated using a learned model, and the internal combustion engine is controlled based on the estimation result.

特開2012−112277号公報JP, 2012-112277, A

ところで、将来的に、車両の制御のための学習済モデルを、ルート、地域、または仮想的に碁盤の目のように分けた所定領域ごとに作成し、所定領域ごとの学習済モデルを管理するシステムが考えられている。この場合、所定領域において、自然環境による地質学上の変化や、新たな道路の建設などによる人為的な変化が生じると、所定領域内の変化が生じた部分に、既存の学習済モデルが使用できなくなったり、学習済モデルの精度が極端に悪化したりする可能性がある。そこで、地質学上の変化や人為的な変化に対応した学習済モデルを早期に生成することができるシステムの開発が望まれている。   By the way, in the future, a learned model for vehicle control will be created for each route, region, or for each predetermined region virtually divided like a grid, and the learned model for each predetermined region will be managed. The system is considered. In this case, if a geological change due to the natural environment or an artificial change due to the construction of a new road occurs in the specified area, the existing trained model is used for the changed part in the specified area. It may not be possible or the accuracy of the trained model may be extremely deteriorated. Therefore, there is a demand for the development of a system that can generate a learned model at an early stage in response to geological changes and artificial changes.

本発明は、上記に鑑みてなされたものであって、その目的は、地質学上の変化や人為的な変化があった場合でも、車両の制御のための学習済モデルの精度の悪化を抑制できる機械学習装置を提供することにある。   The present invention has been made in view of the above, and an object thereof is to suppress deterioration of accuracy of a learned model for controlling a vehicle even when there is a geological change or an artificial change. It is to provide a machine learning device that can perform.

上述した課題を解決し、上記目的を達成するために、本発明に係る機械学習装置は、機械学習に用いる入力パラメータおよび出力パラメータを含むデータである入出力データセットを用いて、前記機械学習を行うことによって学習済モデルを生成する機械学習装置であって、前記入力パラメータが、車両の内部または外部の状態を制御する制御情報と、地図情報とを含み、前記地図情報に基づく複数の所定領域ごとにそれぞれ学習済モデルが設定され、前記地図情報における前記複数の所定領域において、地質学上の変化、または人為的な変化を認識した場合に、前記複数の所定領域から前記地質学上の変化または人為的な変化が生じた所定領域を特定し、前記特定した所定領域に設定されている学習済モデルを削除、または前記学習済みモデルを生成して更新する制御部を備えることを特徴とする。   In order to solve the above problems and achieve the above object, a machine learning device according to the present invention uses the input / output data set that is data including input parameters and output parameters used for machine learning to perform the machine learning. A machine learning device that generates a learned model by performing the input parameter, the input parameter including control information for controlling an internal or external state of the vehicle, and map information, and a plurality of predetermined regions based on the map information. A learned model is set for each of the plurality of predetermined areas in the map information, and when a geological change or an artificial change is recognized, the plurality of predetermined areas change the geology. Alternatively, a predetermined area where an artificial change has occurred is specified and the learned model set in the specified predetermined area is deleted, or the learned model is deleted. Characterized in that it comprises a control unit for updating to generate Le.

本発明に係る機械学習装置によれば、地質学上の変化や人為的な変化があった場合でも、車両の制御のための学習済モデルの精度の悪化を抑制することが可能となる。   According to the machine learning device of the present invention, it is possible to suppress deterioration of accuracy of a learned model for controlling a vehicle even when there is a geological change or an artificial change.

図1は、本発明の一実施形態による機械学習装置を適用可能な機械学習システムを示す概略図である。FIG. 1 is a schematic diagram showing a machine learning system to which a machine learning device according to an embodiment of the present invention can be applied. 図2は、学習部が学習するニューラルネットワークの構成を模式的に示す図である。FIG. 2 is a diagram schematically showing the configuration of the neural network learned by the learning unit. 図3は、ニューラルネットワークが有するノードの入出力の概要を説明する図である。FIG. 3 is a diagram for explaining an outline of input / output of nodes included in the neural network. 図4は、本発明の一実施形態による機械学習装置が実行する機械学習および入出力データセットを説明するための図である。FIG. 4 is a diagram for explaining machine learning and an input / output data set executed by the machine learning device according to the embodiment of the present invention. 図5は、本発明の一実施形態による機械学習装置が実行する学習済モデルの更新方法を説明するためのフローチャートである。FIG. 5 is a flowchart for explaining a method of updating a learned model executed by the machine learning device according to the embodiment of the present invention. 図6は、本発明の一実施形態による機械学習装置が学習済モデルを更新する際の地図情報の一例を示す図である。FIG. 6 is a diagram showing an example of map information when the machine learning device according to the embodiment of the present invention updates a learned model.

以下、本発明の実施形態について図面を参照しつつ説明する。なお、以下の実施形態の全図においては、同一または対応する部分には同一の符号を付す。また、本発明は以下に説明する実施形態によって限定されるものではない。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. In all the drawings of the following embodiments, the same or corresponding parts are designated by the same reference numerals. Moreover, the present invention is not limited to the embodiments described below.

まず、本発明の一実施形態による機械学習装置を適用可能な機械学習システムについて説明する。図1は、この一実施形態による機械学習システムを示す。図1に示すように、機械学習システム1は、ネットワーク10を介して互いに通信可能な、機械学習サーバ2と、複数の車両3と、地図サーバ4とを有する。   First, a machine learning system to which a machine learning device according to an embodiment of the present invention can be applied will be described. FIG. 1 shows a machine learning system according to this embodiment. As shown in FIG. 1, the machine learning system 1 includes a machine learning server 2, a plurality of vehicles 3, and a map server 4, which can communicate with each other via a network 10.

本実施形態において、機械学習装置としての機械学習サーバ2は、車両の環境条件やエンジン状態における所定のデータを入力パラメータとし、車両から排出される窒素酸化物(NOx)の排出量を出力パラメータとする機械学習を行うことによって学習済モデルを生成する。また、車両3においては、機械学習によって生成された学習済モデルを用いて、NOxの排出量を予測する。   In the present embodiment, the machine learning server 2 as a machine learning device uses predetermined data on the environmental conditions of the vehicle and the engine state as input parameters, and the emission amount of nitrogen oxides (NOx) emitted from the vehicle as output parameters. A trained model is generated by performing machine learning. Further, in the vehicle 3, the learned model generated by machine learning is used to predict the NOx emission amount.

ネットワーク10は、インターネット回線網や携帯電話回線網などから構成される。ネットワーク10は、例えば、インターネットなどの公衆通信網であって、例えばLAN(Local Area Network)、WAN(Wide Area Network)、携帯電話などの電話通信網や公衆回線、VPN(Virtual Private Network)、および専用線などの一または複数の組み合わせからなる。ネットワーク10は、有線通信および無線通信が適宜組み合わされている。   The network 10 is composed of an internet network, a mobile phone network, or the like. The network 10 is, for example, a public communication network such as the Internet. For example, a LAN (Local Area Network), a WAN (Wide Area Network), a telephone communication network such as a mobile phone or a public line, a VPN (Virtual Private Network), and It consists of one or more combinations such as leased lines. Wired communication and wireless communication are appropriately combined in the network 10.

(機械学習サーバ)
機械学習サーバ2は、通信部32を有する複数の車両3から送信された種々の情報を、ネットワーク10を介して収集するデータ収集処理を実行する。機械学習サーバ2は、収集した種々の情報によって機械学習を実行可能である。機械学習サーバ2は、制御部21、記憶部22、および通信部23を備える。
(Machine learning server)
The machine learning server 2 executes a data collection process of collecting various information transmitted from the plurality of vehicles 3 having the communication unit 32 via the network 10. The machine learning server 2 can execute machine learning based on the various information collected. The machine learning server 2 includes a control unit 21, a storage unit 22, and a communication unit 23.

制御部21は、具体的に、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field-Programmable Gate Array)などのプロセッサ、およびRAM(Random Access Memory)やROM(Read Only Memory)などの主記憶部(いずれも図示せず)を備える。   The control unit 21 is specifically a CPU (Central Processing Unit), a DSP (Digital Signal Processor), a processor such as an FPGA (Field-Programmable Gate Array), and a RAM (Random Access Memory) or a ROM (Read Only Memory). Of the main memory (not shown).

制御部21は、記憶部22に記憶されたプログラムを主記憶部の作業領域にロードして実行し、プログラムの実行を通じて各構成部などを制御することで、所定の目的に合致した機能を実現できる。   The control unit 21 loads the program stored in the storage unit 22 into the work area of the main storage unit, executes the program, and controls each component through execution of the program to realize a function that matches a predetermined purpose. it can.

記憶部22は、物理的には、RAM等の揮発性メモリ、ROM等の不揮発性メモリ、EPROM(Erasable Programmable ROM)、ハードディスクドライブ(HDD、Hard Disk Drive)、およびリムーバブルメディアなどから選ばれた記憶媒体から構成される。なお、リムーバブルメディアは、例えば、USB(Universal Serial Bus)メモリ、または、CD(Compact Disc)、DVD(Digital Versatile Disc)、またはBD(Blu-ray(登録商標) Disc)のようなディスク記録媒体である。また、外部から装着可能なメモリカード等のコンピュータ読み取り可能な記録媒体を用いて記憶部22を構成してもよい。記憶部22には、機械学習サーバ2の動作を実行するための、オペレーティングシステム(Operating System :OS)、各種プログラム、各種テーブル、各種データベースなどが記憶可能である。各種プログラムには、本実施形態によるモデル更新処理プログラムも含まれる。これらの各種プログラムは、ハードディスク、フラッシュメモリ、CD−ROM、DVD−ROM、フレキシブルディスク等のコンピュータ読み取り可能な記録媒体に記録して広く流通させることも可能である。   The storage unit 22 is physically selected from a volatile memory such as a RAM, a non-volatile memory such as a ROM, an EPROM (Erasable Programmable ROM), a hard disk drive (HDD, Hard Disk Drive), and a removable medium. Composed of medium. The removable medium is, for example, a USB (Universal Serial Bus) memory, or a disc recording medium such as a CD (Compact Disc), a DVD (Digital Versatile Disc), or a BD (Blu-ray (registered trademark) Disc). is there. Further, the storage unit 22 may be configured by using a computer-readable recording medium such as a memory card that can be mounted from the outside. The storage unit 22 can store an operating system (OS) for executing the operation of the machine learning server 2, various programs, various tables, various databases, and the like. The various programs also include the model update processing program according to the present embodiment. These various programs can be recorded in a computer-readable recording medium such as a hard disk, a flash memory, a CD-ROM, a DVD-ROM, and a flexible disk, and distributed widely.

本実施形態においては、制御部21によるプログラムの実行によって、学習部21aの機能が実行される。学習部21aは、機械学習サーバ2が受信した入出力データセットをもとに機械学習を行う。学習部21aは、学習した結果を記憶部22に書き込んで記憶させる。学習部21aは、学習を行っているニューラルネットワークとは別に、所定のタイミングで、当該タイミングにおける最新の学習済モデルを、記憶部22に記憶させる。記憶部22に記憶させる際には、古い学習済モデルを削除して最新の学習済モデルを記憶させる更新でもよいし、古い学習済モデルの一部または全部を保存したまま最新の学習済モデルを記憶させる蓄積でもよい。   In the present embodiment, the function of the learning unit 21a is executed by the execution of the program by the control unit 21. The learning unit 21a performs machine learning based on the input / output data set received by the machine learning server 2. The learning unit 21a writes and stores the learned result in the storage unit 22. The learning unit 21a stores the latest learned model at the timing in the storage unit 22 at a predetermined timing, separately from the learning neural network. When storing in the storage unit 22, the old trained model may be deleted and the latest trained model may be stored, or the latest trained model may be stored while a part or all of the old trained model is saved. It may be stored to be stored.

以下、具体的な機械学習の一例として、ニューラルネットワークを用いた深層学習について説明する。図2は、学習部21aが学習するニューラルネットワークの構成を模式的に示す図である。図2に示すニューラルネットワーク100は、順伝播型ニューラルネットワークであり、入力層101と、中間層102と、出力層103とを有する。入力層101は複数のノードからなり、各ノードには互いに異なる入力パラメータが入力される。中間層102は入力層101からの出力が入力される。中間層102は、入力層101からの入力を受ける複数のノードからなる層を含む多層の構造を有する。出力層103は、中間層102からの出力が入力され、出力パラメータを出力する。中間層102が多層構造を有するニューラルネットワークを用いた機械学習は、深層学習と呼ばれる。   Deep learning using a neural network will be described below as a specific example of machine learning. FIG. 2 is a diagram schematically showing the configuration of the neural network learned by the learning unit 21a. The neural network 100 shown in FIG. 2 is a forward-propagation neural network and has an input layer 101, an intermediate layer 102, and an output layer 103. The input layer 101 includes a plurality of nodes, and input parameters different from each other are input to each node. The output from the input layer 101 is input to the intermediate layer 102. The intermediate layer 102 has a multi-layered structure including a layer composed of a plurality of nodes that receive inputs from the input layer 101. The output layer 103 receives the output from the intermediate layer 102 and outputs an output parameter. Machine learning using a neural network in which the intermediate layer 102 has a multilayer structure is called deep learning.

図3は、ニューラルネットワーク100が有するノードにおける入出力の概要を説明する図である。図3においては、ニューラルネットワーク100のうち、I個のノードを有する入力層101と、J個のノードを有する第1中間層121と、K個のノードを有する第2中間層122におけるデータの入出力の一部を模式的に示している(I、J、Kは正の整数)。入力層101の上からi番目のノードには、入力パラメータxi(i=1,2,…,I)が入力される。以下、全ての入力パラメータの集合を「入力パラメータ{xi}」と記載する。 FIG. 3 is a diagram for explaining an outline of input / output in the node included in the neural network 100. In FIG. 3, in the neural network 100, the input layer 101 having I nodes, the first intermediate layer 121 having J nodes, and the second intermediate layer 122 having K nodes are input with data. A part of the output is schematically shown (I, J, and K are positive integers). Input parameters x i (i = 1, 2, ..., I) are input to the i-th node from the top of the input layer 101. Hereinafter, the set of all input parameters will be referred to as “input parameter {x i }”.

入力層101の各ノードは、隣接する第1中間層121の各ノードに対し、入力パラメータに所定の重みを乗じた値を有する信号を出力する。例えば、入力層101の上からi番目のノードは、第1中間層121の上からj番目(j=1,2,…,J)のノードに対して、入力パラメータxiに重みαijを乗じた値αijiを有する信号を出力する。第1中間層121の上からj番目のノードには、合計で入力層101の各ノードからの出力に所定のバイアスb(1) jを加えた値Σi=1〜Iαiji+b(1) jが入力される。ここで第1項目のΣi=1〜Iは、i=1,2,…,Iの和を取ることを意味する。 Each node of the input layer 101 outputs a signal having a value obtained by multiplying an input parameter by a predetermined weight to each node of the adjacent first intermediate layer 121. For example, the i-th node from the top of the input layer 101 assigns the weight α ij to the input parameter x i for the j-th (j = 1, 2, ..., J) node from the top of the first intermediate layer 121. The signal having the multiplied value α ij x i is output. At the j-th node from the top of the first intermediate layer 121, a value obtained by adding a predetermined bias b (1) j to the output from each node of the input layer 101 in total Σ i = 1 to I α ij x i + b (1) j is input. Here, the first item Σ i = 1 to I means to take the sum of i = 1, 2, ..., I.

第1中間層121の上からj番目のノードの出力値yjは、そのノードへの入力層101からの入力値Σi=1〜Iαiji+b(1) jの関数として、yj=S(Σi=1〜Iαiji+b(1) j)と表される。この関数Sは活性化関数と呼ばれる。具体的な活性化関数として、例えばシグモイド関数S(u)=1/{1+exp(−u)}や正規化線形関数(ReLU)S(u)=max(0,u)などを挙げることができる。活性化関数は、非線形関数が用いられることが多い。 The output value y j of the j-th node from the top of the first intermediate layer 121 is y as a function of the input values Σ i = 1 to I α ij x i + b (1) j from the input layer 101 to the node. It is expressed as j = S (Σ i = 1 to I α ij x i + b (1) j ). This function S is called an activation function. Specific activation functions include, for example, a sigmoid function S (u) = 1 / {1 + exp (-u)} and a normalized linear function (ReLU) S (u) = max (0, u). .. A non-linear function is often used as the activation function.

第1中間層121の各ノードは、隣接する第2中間層122の各ノードに対し、入力パラメータに所定の重みを乗じた値を有する信号を出力する。例えば、第1中間層121の上からj番目のノードは、第2中間層122の上からk番目(k=1,2,…,K)のノードに対して、入力値yjに重みβjkを乗じた値βjkjを有する信号を出力する。第2中間層122の上からk番目のノードには、合計で第1中間層121の各ノードからの出力に所定のバイアスb(2) kを加えた値Σj=1〜Jβjkj+b(2) kが入力される。ここで第1項目のΣj=1〜Jは、j=1,2,…,Jの和を取ることを意味する。 Each node of the first intermediate layer 121 outputs a signal having a value obtained by multiplying an input parameter by a predetermined weight to each node of the adjacent second intermediate layer 122. For example, the j-th node from the top of the first intermediate layer 121 has a weight β for the input value y j with respect to the k-th node (k = 1, 2, ..., K) from the top of the second intermediate layer 122. Output the signal with the value β jk y j multiplied by jk . At the k-th node from the top of the second intermediate layer 122, a value obtained by adding a predetermined bias b (2) k to the output from each node of the first intermediate layer 121 in total Σ j = 1 to J β jk y. j + b (2) k is input. Here, Σ j = 1 to J of the first item means to take the sum of j = 1, 2, ..., J.

第2中間層122の上からk番目のノードの出力値zkは、そのノードへの第1中間層121からの入力値Σj=1〜Jβjkj+b(2) kを変数とする活性化関数を用いて、zk=S(Σj=1〜Jβjkj+b(2) k)と表される。 The output value z k of the k-th node from the top of the second intermediate layer 122 is a variable with the input values Σ j = 1 to J β jk y j + b (2) k from the first intermediate layer 121 to the node. It is expressed as z k = S (Σ j = 1 to J β jk y j + b (2) k ) by using the activation function.

上述したように、入力層101の側から出力層103の側へ向かう順方向に沿って順次繰り返すことにより、最終的に出力層103から一つの出力パラメータYが出力される。以下、ニューラルネットワーク100が含む重みおよびバイアスをまとめてネットワークパラメータwという。このネットワークパラメータwは、ニューラルネットワーク100の全ての重みおよびバイアスを成分とするベクトルである。   As described above, the output layer 103 finally outputs one output parameter Y by sequentially repeating the process in the forward direction from the input layer 101 side to the output layer 103 side. Hereinafter, the weight and the bias included in the neural network 100 are collectively referred to as a network parameter w. The network parameter w is a vector whose components are all weights and biases of the neural network 100.

学習部21aは、入力パラメータ{xi}をニューラルネットワーク100へ入力することによって算出した出力パラメータYと、入力パラメータ{xi}とともに入出力データセットを構成する出力パラメータ(目標出力)Y0とに基づいて、ネットワークパラメータを更新する演算を行う。具体的には、2つの出力パラメータYとY0との誤差を最小化するための演算を行うことによってネットワークパラメータwを更新する。この際には、確率的勾配降下法がよく用いられる。以下、入力パラメータ{xi}および出力パラメータYの組({xi},Y)を総称して「学習データ」という。 The learning unit 21a outputs an output parameter Y calculated by inputting the input parameter {x i } to the neural network 100, and an output parameter (target output) Y 0 that forms an input / output data set together with the input parameter {x i }. Based on, the calculation for updating the network parameter is performed. Specifically, the network parameter w is updated by performing an operation for minimizing the error between the two output parameters Y and Y 0 . In this case, the stochastic gradient descent method is often used. Hereinafter, the set ({x i }, Y) of the input parameter {x i } and the output parameter Y is collectively referred to as "learning data".

以下、確率的勾配降下法の概要を説明する。確率的勾配降下法は、2つの出力パラメータYとY0を用いて定義される誤差関数E(w)のネットワークパラメータwの各成分に対する微分から求まる勾配∇wE(w)を最小化するように、ネットワークパラメータwを更新する方法である。誤差関数は、例えば学習データの出力パラメータYと入出力データセットの出力パラメータY0の2乗誤差|Y−Y02により定義される。また、勾配∇wE(w)は、誤差関数E(w)のネットワークパラメータwの成分に関する微分である
∂E(w)/∂αij、∂E(w)/∂βjk、∂E(w)/∂b(1) j、∂E(w)/∂b(2) k(ここで、i=1〜I、j=1〜J、k=1〜K)などを成分に有するベクトルである。
The outline of the stochastic gradient descent method will be described below. The stochastic gradient descent method is designed to minimize the gradient ∇ w E (w) obtained by differentiating each component of the network parameter w of the error function E (w) defined using the two output parameters Y and Y 0. The method is to update the network parameter w. The error function is defined by, for example, the squared error | Y−Y 0 | 2 of the output parameter Y of the learning data and the output parameter Y 0 of the input / output data set. Further, the gradient ∇ w E (w) is a derivative with respect to the component of the network parameter w of the error function E (w), ∂E (w) / ∂α ij , ∂E (w) / ∂β jk , ∂E ( w) / ∂b (1) j , ∂E (w) / ∂b (2) k (where i = 1 to I, j = 1 to J, k = 1 to K) and the like as vectors Is.

確率的勾配降下法では、ネットワークパラメータwを、自動または手動で定まる所定の学習率ηを用いて、w’=w−η∇wE(w)、w’’=w’−η∇w’E(w’)、…と順次更新する。なお、学習率ηは、学習の途中で変更してもよい。学習部21aは、制御部21が学習データを取得するたびに、上述した更新処理を繰り返す。これにより、誤差関数E(w)は徐々に極小点に近づいていく。なお、より一般的な確率的勾配降下法の場合、誤差関数E(w)は、全学習データを含むサンプルの中からランダムに抽出することによって更新処理のたびに定義され、本実施形態においても適用可能である。この際に抽出する学習データの数は1つに限定されず、記憶部22が記憶する学習データの一部でもよい。 The stochastic gradient descent, the network parameters w, using a predetermined learning rate η determined automatically or manually, w '= w-η∇ w E (w), w''=w'-η∇w' E (w '), ... are sequentially updated. The learning rate η may be changed during learning. The learning unit 21a repeats the above-described update process every time the control unit 21 acquires the learning data. As a result, the error function E (w) gradually approaches the minimum point. Note that in the case of the more general stochastic gradient descent method, the error function E (w) is defined for each update process by randomly extracting from the sample including all learning data, and also in this embodiment. Applicable. The number of learning data extracted at this time is not limited to one, and may be a part of the learning data stored in the storage unit 22.

勾配∇wE(w)の計算を効率的に行うための方法として、誤差逆伝播法が知られている。誤差逆伝播法は、学習データ({xi}、Y)を算出後、出力層における目標出力Y0と出力パラメータYの誤差に基づいて、出力層→中間層→入力層へと勾配∇wE(w)の成分を逆にたどって計算していく方法である。学習部21aは、誤差逆伝播法を用いて勾配∇wE(w)の全ての成分を算出した後、算出した勾配∇wE(w)を用いて上述した確率的勾配降下法を適用することにより、ネットワークパラメータwを更新する。 An error backpropagation method is known as a method for efficiently calculating the gradient ∇ w E (w). The error back-propagation method calculates the learning data ({x i }, Y) and then, based on the error between the target output Y 0 and the output parameter Y in the output layer, the gradient ∇ w from the output layer → the intermediate layer → the input layer. In this method, the components of E (w) are traced in reverse. The learning unit 21a calculates all the components of the gradient ∇ w E (w) using the error back propagation method, and then applies the above-described stochastic gradient descent method using the calculated gradient ∇ w E (w). By doing so, the network parameter w is updated.

図4は、本実施形態による機械学習サーバ2が実行する機械学習および入出力データセットを説明するための図である。図4に示すように、本実施形態においては、入力パラメータが「点火時期、燃料の噴射量、噴射時期、スロットル開度、可変バルブタイミング(VVT:Variable Valve Timing)、および排気再循環装置(EGR)のガス流量を調整するEGRバルブの制御量、地図情報、天候情報」であり、出力パラメータが「NOxの排出量」である。学習部21aによって、ニューラルネットワーク100を用いた深層学習により生成された学習済モデルから、出力パラメータとして出力されるNOxの排出量が最小になるように、入力パラメータが設定される。ここで、入力パラメータの内で、車両3の外部または内部において制御部31による制御が可能な制御情報である、点火時期、燃料の噴射量、噴射時期、スロットル開度、VVT、およびEGRバルブの制御量に関して目標値が設定される。   FIG. 4 is a diagram for explaining machine learning and input / output data sets executed by the machine learning server 2 according to this embodiment. As shown in FIG. 4, in the present embodiment, the input parameters are “ignition timing, fuel injection amount, injection timing, throttle opening, variable valve timing (VVT), and exhaust gas recirculation device (EGR). ) "EGR valve control amount for adjusting gas flow rate, map information, weather information", and the output parameter is "NOx emission amount". The learning unit 21a sets the input parameters from the learned model generated by the deep learning using the neural network 100 so that the NOx emission amount output as the output parameter is minimized. Here, among the input parameters, the ignition timing, the fuel injection amount, the injection timing, the throttle opening, the VVT, and the EGR valve that are control information that can be controlled by the control unit 31 outside or inside the vehicle 3. A target value is set for the controlled variable.

地図情報としては、地図上の領域を、緯度および経度に基づいて分割してそれぞれを所定領域として設定したり、道路の路線(ルートID)ごとに分割してそれぞれを所定領域として設定したりする。その上で、それぞれの所定領域ごとに、個別に学習済モデルが生成されて設定される。すなわち、設定された所定領域ごとに個々に学習済モデルが設定される。これにより、機械学習によって地図情報が加味されて最適化された学習済モデルが得られるので、車両3において制御部31により制御可能なアクチュエータ量を、地図情報および天候情報に応じてNOxが最小となるように制御できる。NOxが最小になるようにアクチュエータ量を制御することにより、従来に比してエミッションを改善することが可能になる。   As the map information, an area on the map is divided based on latitude and longitude and set as each predetermined area, or each area of a road (route ID) is divided and set as each predetermined area. .. Then, a learned model is individually generated and set for each of the predetermined regions. That is, the learned model is individually set for each set predetermined area. As a result, a learned model that is optimized by adding the map information by machine learning is obtained, so that the actuator amount that can be controlled by the control unit 31 in the vehicle 3 has the minimum NOx according to the map information and the weather information. Can be controlled. By controlling the actuator amount so that NOx is minimized, it becomes possible to improve emissions as compared with the conventional case.

図1に示す記憶部22には、上述のように生成された学習済モデルが検索可能に記憶される。記憶部22は、制御部21の学習部21aによって生成された学習済モデルを、蓄積したり更新したりして記憶する。学習済モデルは、ニューラルネットワークを用いた深層学習に基づいて生成される。学習済モデルを記憶するとは、学習済モデルにおけるネットワークパラメータwや演算のアルゴリズムなどの情報を記憶することを意味する。また、記憶部22は、上述した入力パラメータと出力パラメータとの組からなる入出力データセットを記憶する。記憶部22は、学習部21aが入力パラメータをニューラルネットワーク100に入力して算出した出力パラメータを当該入力パラメータとともに学習データとして記憶する。   The learned model generated as described above is stored in the storage unit 22 shown in FIG. 1 in a searchable manner. The storage unit 22 stores the learned model generated by the learning unit 21a of the control unit 21 by accumulating or updating it. The trained model is generated based on deep learning using a neural network. Storing the learned model means storing information such as the network parameter w in the learned model and the calculation algorithm. The storage unit 22 also stores an input / output data set including the above-described set of input parameters and output parameters. The storage unit 22 stores the output parameter calculated by inputting the input parameter to the neural network 100 by the learning unit 21a together with the input parameter as learning data.

通信部23は、例えば、LAN(Local Area Network)インターフェースボード、無線通信のための無線通信回路である。LANインターフェースボードや無線通信回路は、公衆通信網であるインターネットなどのネットワーク10に接続される。送信部および受信部としての通信部23は、ネットワーク10に接続して、複数の車両3との間で通信を行う。通信部23は、それぞれの車両3との間で、車両識別情報、走行履歴情報、車両情報、地図情報、および学習済モデルなどの種々の情報を受信したり、車両3に対して地図情報、学習済モデル、および制御信号などの種々の情報を送信したりする。   The communication unit 23 is, for example, a LAN (Local Area Network) interface board or a wireless communication circuit for wireless communication. The LAN interface board and the wireless communication circuit are connected to the network 10 such as the Internet which is a public communication network. The communication unit 23 as a transmission unit and a reception unit is connected to the network 10 and communicates with the plurality of vehicles 3. The communication unit 23 receives various kinds of information such as vehicle identification information, traveling history information, vehicle information, map information, and a learned model with each vehicle 3, and transmits map information to the vehicle 3, It sends various information such as the learned model and control signals.

車両識別情報は、個々の車両3を互いに識別するための種々の情報を含む。走行履歴情報は、それぞれの車両3における走行経路ならびに走行地域、地図情報、および天候情報などの情報を含む。走行経路の情報は、特定の道路の上りか下りかの情報、または特定の道路の上りか下りかの情報などである。走行地域の情報は、走行路線の情報、市町村の情報、都道府県の情報、または関東や東海などの地域の情報などである。地図情報は、具体的な地図画像を出力可能な情報、および道路の状態の情報を含む。天候情報は、外気温や湿度の情報や、晴れ、曇り、雨、または雪などの天気の情報を含む。外気温や湿度の情報は、走行時における気温や湿度の情報のみならず、外気の実際の計測温度や計測湿度の情報を含んでもよい。また、天候情報は、風向き、風速、および車両3の進行方向が関連付けられた情報などを含んでもよい。車両情報は、車両3の特に内燃機関に関する情報として、点火時期、燃料の噴射量、噴射時期、スロットル開度、VVT、およびEGRバルブの制御量に関する情報を含む。車両情報はさらに、総走行距離、位置情報、速度情報、加速度情報、センサ群取得情報、および車種などの情報を含んでもよい。   The vehicle identification information includes various information for identifying the individual vehicles 3 from each other. The travel history information includes information such as a travel route and travel area of each vehicle 3, map information, and weather information. The information on the travel route is information on whether the particular road is going up or down, or information about whether a particular road is going up or down. The information on the traveling area is information on traveling routes, information on municipalities, information on prefectures, or information on areas such as Kanto and Tokai. The map information includes information that can output a specific map image and information on the state of the road. The weather information includes information on the outside temperature and humidity, and weather information such as fine weather, cloudy weather, rain, and snow. The information on the outside temperature and the humidity may include not only the information on the temperature and the humidity during traveling but also the information on the actual measured temperature and the measured humidity of the outside air. Further, the weather information may include information in which the wind direction, the wind speed, and the traveling direction of the vehicle 3 are associated with each other. The vehicle information includes information regarding the ignition timing, the fuel injection amount, the injection timing, the throttle opening, the VVT, and the EGR valve control amount as information regarding the internal combustion engine of the vehicle 3. The vehicle information may further include information such as total traveling distance, position information, speed information, acceleration information, sensor group acquisition information, and vehicle type.

(車両)
車両3は、運転者による運転によって走行する車両や、与えられた運行指令に従って自律走行可能に構成された自律走行車両である。車両3は、制御部31、通信部32、駆動部33、および記憶部34を備える。制御部31および記憶部34はそれぞれ、物理的には上述した制御部21および記憶部22と同様である。制御部31は、記憶部34に記憶されたプログラムの実行によって、車両3に搭載される各種構成要素の動作を統括的に制御する。
(vehicle)
The vehicle 3 is a vehicle that is driven by a driver, or an autonomous vehicle that is configured to be capable of autonomous traveling in accordance with a given operation command. The vehicle 3 includes a control unit 31, a communication unit 32, a drive unit 33, and a storage unit 34. The control unit 31 and the storage unit 34 are physically similar to the control unit 21 and the storage unit 22 described above, respectively. The control unit 31 centrally controls the operations of various components mounted on the vehicle 3 by executing the programs stored in the storage unit 34.

送信部および受信部としての通信部32は、ネットワーク10を介した無線通信によって、少なくとも機械学習サーバ2との間で通信を行う、例えば車載通信モジュール(DCM:Data Communication Module)などからなる。   The communication unit 32 as a transmission unit and a reception unit includes, for example, an in-vehicle communication module (DCM: Data Communication Module) that performs communication with at least the machine learning server 2 by wireless communication via the network 10.

駆動部33は、車両3の走行に必要な従来公知の駆動部である。具体的には、車両3は、駆動源となる内燃機関であるエンジン、エンジンの駆動力を伝達する駆動伝達機構、および走行するための駆動輪などを備える。車両3のエンジンは、燃料の燃焼による駆動によって電動機などを用いて発電可能に構成される。発電された電力は充電可能なバッテリに充電される。   The drive unit 33 is a conventionally known drive unit required for traveling of the vehicle 3. Specifically, the vehicle 3 includes an engine, which is an internal combustion engine serving as a drive source, a drive transmission mechanism that transmits the driving force of the engine, and drive wheels for traveling. The engine of the vehicle 3 is configured to be capable of generating power using a motor or the like by being driven by combustion of fuel. The generated electric power is charged into a rechargeable battery.

記憶部34には、車両3における、上述した車両識別情報、地図情報、走行履歴情報、車両情報、学習済モデルを含む各種情報が、蓄積可能および更新可能に記憶されている。記憶部34には、車両3における各種センサ(図示せず)によって検出された種々のデータが、センサ情報として蓄積可能および更新可能に記憶される。車両3はさらに、入出力部、センサ群、およびGPS部(いずれも図示せず)などを備える。   The storage unit 34 stores various information including the vehicle identification information, the map information, the traveling history information, the vehicle information, and the learned model of the vehicle 3, which can be accumulated and updated. Various data detected by various sensors (not shown) in the vehicle 3 are stored in the storage unit 34 as sensor information so that they can be accumulated and updated. The vehicle 3 further includes an input / output unit, a sensor group, a GPS unit (all not shown), and the like.

制御部31は、車両3の走行時や停車時においてセンサ群(図示せず)から取得した情報に基づいて、地図情報、走行履歴情報、および車両情報などの情報を記憶部34に逐次記憶させる。制御部31は、記憶部34に記憶させた地図情報、走行履歴情報、および車両情報などの情報を、所定のタイミングで通信部32を通じて機械学習サーバ2に送信する。機械学習サーバ2においては、それぞれの車両3から受信した地図情報、走行履歴情報、および車両情報などの情報を、記憶部22に記憶させる。これにより、機械学習サーバ2においては、記憶部22に、地図情報、走行履歴情報、および車両情報などの情報が蓄積されたり、更新されたり、併合されたりする。   The control unit 31 sequentially stores information such as map information, traveling history information, and vehicle information in the storage unit 34 based on information obtained from a sensor group (not shown) when the vehicle 3 is running or stopped. .. The control unit 31 transmits information such as map information, travel history information, and vehicle information stored in the storage unit 34 to the machine learning server 2 through the communication unit 32 at a predetermined timing. In the machine learning server 2, information such as map information, travel history information, and vehicle information received from each vehicle 3 is stored in the storage unit 22. As a result, in the machine learning server 2, the storage unit 22 stores, updates, or merges information such as map information, traveling history information, and vehicle information.

(地図サーバ)
地図サーバ4は、機械学習サーバ2および複数の車両3から送信された地図に関する情報を、ネットワーク10を介して収集するデータ収集処理を実行する。地図サーバ4は、制御部41、記憶部42、および通信部43を備える。制御部41、記憶部42、および通信部43はそれぞれ、物理的には機械学習サーバ2における、制御部21、記憶部22、および通信部23と同様である。
(Map server)
The map server 4 executes a data collection process of collecting information about the map transmitted from the machine learning server 2 and the plurality of vehicles 3 via the network 10. The map server 4 includes a control unit 41, a storage unit 42, and a communication unit 43. The control unit 41, the storage unit 42, and the communication unit 43 are physically the same as the control unit 21, the storage unit 22, and the communication unit 23 in the machine learning server 2, respectively.

地図サーバ4の制御部41は、記憶部42に記憶されたプログラムの実行により、データ収集部41aの機能を実行する。データ収集部41aは、地図情報や、地図情報に関連する情報(以下、地図関連情報)を収集する。上述したように地図情報は、具体的な地図画像を出力可能な情報、および道路の状態の情報を含む。地図関連情報とは、自然環境に基づく地質学上の変化の情報や、道路の工事や橋梁の架設などの人為的な変化の情報などの情報である。データ収集部41aは、これらの地図情報および地図関連情報を、所定のタイミングで通信部43を通じて、機械学習サーバ2、複数の車両3、および他の情報サーバ(図示せず)から収集して、記憶部42に記憶させる。これにより、地図サーバ4においては、記憶部42に、地図情報および地図関連情報などの情報が蓄積されたり、更新されたり、併合されたりする。地図サーバ4は、蓄積、更新、または併合された地図情報、および地図関連情報を機械学習サーバ2に送信し、機械学習サーバ2においては、地図サーバ4から受信した地図情報および地図関連情報を、記憶部22に記憶させる。   The control unit 41 of the map server 4 executes the function of the data collection unit 41a by executing the program stored in the storage unit 42. The data collection unit 41a collects map information and information related to the map information (hereinafter referred to as map-related information). As described above, the map information includes information that can output a specific map image and road state information. The map-related information is information such as information on geological changes based on the natural environment and information on artificial changes such as road construction and bridge construction. The data collection unit 41a collects these map information and map-related information from the machine learning server 2, the plurality of vehicles 3, and other information servers (not shown) through the communication unit 43 at a predetermined timing, It is stored in the storage unit 42. As a result, in the map server 4, information such as map information and map-related information is stored, updated, or merged in the storage unit 42. The map server 4 transmits the accumulated, updated, or merged map information and the map-related information to the machine learning server 2, and the machine learning server 2 receives the map information and the map-related information received from the map server 4, It is stored in the storage unit 22.

記憶部42には、具体的な地図画像を出力可能な情報および走行路の状態を含む地図情報が記憶されている。制御部41は、データ収集部41aによって収集された地図情報に関連する情報に基づいて、記憶部42に記憶された地図情報を適宜更新する。更新された地図情報は、機械学習サーバ2や車両3に送信される。機械学習サーバ2においては、更新された地図情報に基づいて、学習済モデルが更新される。   The storage unit 42 stores map information including information that can output a specific map image and the state of the road. The control unit 41 appropriately updates the map information stored in the storage unit 42 based on the information related to the map information collected by the data collection unit 41a. The updated map information is transmitted to the machine learning server 2 and the vehicle 3. In the machine learning server 2, the learned model is updated based on the updated map information.

以下に、本実施形態による学習済モデルの更新方法の具体的な一例について説明する。以下の説明において、情報の送受信はネットワーク10を介して行われるが、この点についての都度の説明は省略する。図5は、本実施形態による機械学習サーバ2が実行する学習済モデルの更新方法を説明するためのフローチャートである。図6は、本実施形態による機械学習サーバ2が学習済モデルを更新する際の地図情報の一例を示す図である。図6に示すように、本実施形態においては、地図が碁盤状に分割されて設定され、それぞれの領域にそれぞれ学習済モデルが割り当てられた状態を例にする。図6においては、それぞれの領域にカウントi(i=1,2,…,24,25)が割り当てられ、所定領域として設定された領域ごとに学習済モデルiが設定されている。また、地図情報は、地図サーバ4から機械学習サーバ2に適切なタイミングで送信される。   A specific example of the learned model updating method according to this embodiment will be described below. In the following description, information transmission / reception is performed via the network 10, but a description of this point will be omitted. FIG. 5 is a flowchart for explaining the method of updating the learned model executed by the machine learning server 2 according to this embodiment. FIG. 6 is a diagram showing an example of map information when the machine learning server 2 according to the present embodiment updates a learned model. As shown in FIG. 6, in this embodiment, the map is divided and set in a checkerboard pattern, and a learned model is assigned to each area. In FIG. 6, a count i (i = 1, 2, ..., 24, 25) is assigned to each area, and a learned model i is set for each area set as a predetermined area. The map information is transmitted from the map server 4 to the machine learning server 2 at an appropriate timing.

図5に示すように、まず、ステップST1において機械学習サーバ2の制御部21は、カウントiの初期化を行って、i=0とする。ステップST2に移行して制御部21は、カウントアップを行ってカウントiを1増加させる。次に,ステップST3において制御部21は、図6に示す地図におけるカウントiの現在の状態が、過去の地図情報と異なるか否かを判定する。具体的に例えば、車両3が地図上においてカウントiの領域を走行した際の走行路の状況に関して車両3から受信した地図情報や、地図サーバ4から受信した地図情報および地図関連情報や、記憶部22に記憶されている地図情報および地図関連情報に基づいて、制御部21は、カウントiの領域における現在の状態を認識する。その後、制御部21は、過去の地図情報と現在の状態とを比較したり、地図サーバ4から受信した地図関連情報に含まれる変化の情報に基づいたりして、カウントiの領域の現在の状態が、過去の地図情報と異なるか否かを判定する。   As shown in FIG. 5, first, in step ST1, the control unit 21 of the machine learning server 2 initializes the count i and sets i = 0. In step ST2, the control unit 21 increments the count i by 1 by counting up. Next, in step ST3, the control unit 21 determines whether or not the current state of the count i in the map shown in FIG. 6 is different from the past map information. Specifically, for example, the map information received from the vehicle 3 regarding the condition of the traveling path when the vehicle 3 travels in the region of count i on the map, the map information received from the map server 4 and the map-related information, and the storage unit. Based on the map information and the map-related information stored in 22, the control unit 21 recognizes the current state in the area of count i. After that, the control unit 21 compares the past map information with the current state, or based on the change information included in the map-related information received from the map server 4, the current state of the area of the count i. , It is determined whether or not it is different from the past map information.

制御部21がカウントiの現在の状態が過去の地図情報と同じであると判定した場合(ステップST3:No)、ステップST2に復帰する。一方、制御部21がカウントiの現在の状態が過去の地図情報と異なると判定した場合(ステップST3:Yes)、ステップST4に移行する。図6に示す例においては、変更領域は実線で囲まれた打点領域であり、地図情報においてカウントiがi=11,12,16,17の領域に跨がった領域である。   When the control unit 21 determines that the current state of the count i is the same as the past map information (step ST3: No), the process returns to step ST2. On the other hand, when the control unit 21 determines that the current state of the count i is different from the past map information (step ST3: Yes), the process proceeds to step ST4. In the example shown in FIG. 6, the changed area is a dot area surrounded by a solid line, and is an area where the count i in the map information extends over the area of i = 11, 12, 16, 17.

ステップST4において制御部21の学習部21aは、図4に示すニューラルネットワーク100に、入力パラメータとして更新された地図情報を入力する。これにより、カウントiの地図情報の部分に適用される新しい学習済モデルiが生成される。一方、記憶部22においては、古い学習済モデルiが削除され、生成された学習済モデルiによって更新される。なお、必要に応じて、新たな学習済モデルiを生成することなく、古い学習済モデルiを削除することも可能である。   In step ST4, the learning unit 21a of the control unit 21 inputs the updated map information as an input parameter into the neural network 100 shown in FIG. This creates a new trained model i that is applied to the map information portion of count i. On the other hand, in the storage unit 22, the old learned model i is deleted and updated with the generated learned model i. If necessary, the old learned model i can be deleted without generating a new learned model i.

ステップST5に移行すると制御部21は、カウントiが、地図情報において地図を分割した数と一致するか否かを判定する。制御部21が、カウントiは分割した数(ここでは、25)と一致しないと判定した場合(ステップST5:No)、ステップST2に復帰する。一方、制御部21が、カウントiは分割した数(ここでは、25)と一致すると判定した場合(ステップST5:Yes)、学習済モデルの更新処理を終了する。以上により、地図情報の中で状態が変化した部分に対応する学習済モデルが更新される。   After shifting to step ST5, the control unit 21 determines whether or not the count i matches the number of divided maps in the map information. When the control unit 21 determines that the count i does not match the divided number (here, 25) (step ST5: No), the process returns to step ST2. On the other hand, when the control unit 21 determines that the count i matches the number of divisions (here, 25) (step ST5: Yes), the learning model update process ends. As described above, the learned model corresponding to the part of the map information whose state has changed is updated.

(第1変形例)
次に、上述した一実施形態の変形例について説明する。第1変形例においては、機械学習サーバ2における学習部21aが車両3に搭載されている。すなわち、車両3が機械学習装置を搭載している。この場合、車両3において機械学習を実行して、学習済モデルを生成できる。車両3において学習済モデルが生成された場合には、機械学習サーバ2に対して生成した学習済モデルを送信する。機械学習サーバ2は、複数の車両3から送信された学習済モデルに基づいて、新たに汎用的な学習済モデルを生成することが可能である。
(First modification)
Next, a modified example of the above-described embodiment will be described. In the first modification, the learning unit 21a in the machine learning server 2 is mounted on the vehicle 3. That is, the vehicle 3 is equipped with the machine learning device. In this case, machine learning can be executed in the vehicle 3 to generate a learned model. When the learned model is generated in the vehicle 3, the generated learned model is transmitted to the machine learning server 2. The machine learning server 2 can newly generate a general-purpose learned model based on the learned models transmitted from the plurality of vehicles 3.

(第2変形例)
第2変形例においては、車両3が機械学習装置を搭載し、かつ上述した学習済モデルの更新も車両3において実行する。この場合、車両3が、実際に走行した道路の状態が記憶部34に記憶された地図情報と異なる状態であると検知した場合、制御部31は、地図情報の当該道路の部分を車両3が実際に走行した道路の状態に変更して、地図情報を更新する。その後、車両3の学習部は、更新した地図情報に基づいて、図5に示すフローチャートに従って、更新された少なくとも1つの地図情報に対応する学習済モデルを更新する。一方、車両3は、更新した地図情報を地図サーバ4に送信する。地図サーバ4は、複数の車両3から更新された地図情報を受信し、これらの更新された地図情報に基づいて、記憶部42に格納されている地図情報を更新する。なお、車両3は、更新した地図情報の代わりに、地図情報に関連する情報を地図サーバ4に送信するようにしてもよい。
(Second modified example)
In the second modification, the vehicle 3 is equipped with a machine learning device, and the vehicle 3 also updates the learned model described above. In this case, when the vehicle 3 detects that the state of the road on which the vehicle has actually traveled is different from the map information stored in the storage unit 34, the control unit 31 causes the vehicle 3 to detect the portion of the road in the map information. The map information is updated by changing the state of the road on which the vehicle actually traveled. After that, the learning unit of the vehicle 3 updates the learned model corresponding to the updated at least one map information based on the updated map information according to the flowchart shown in FIG. On the other hand, the vehicle 3 transmits the updated map information to the map server 4. The map server 4 receives the updated map information from the plurality of vehicles 3 and updates the map information stored in the storage unit 42 based on these updated map information. The vehicle 3 may transmit information related to the map information to the map server 4 instead of the updated map information.

以上説明した本発明の一実施形態によれば、地図情報の変化に対応して、学習済モデルを更新することができるので、車両3が走行する道路に、地質学上の変化や人為的な変化があった場合でも、車両3の制御のための学習済モデルの精度の悪化を抑制することが可能となる。   According to the embodiment of the present invention described above, the learned model can be updated in response to the change in the map information, so that the road on which the vehicle 3 runs changes in geology or is artificial. Even if there is a change, it is possible to suppress deterioration of the accuracy of the learned model for controlling the vehicle 3.

以上、本発明の一実施形態について具体的に説明したが、本発明は、上述の一実施形態に限定されるものではなく、本発明の技術的思想に基づく各種の変形が可能である。例えば、上述の一実施形態において、機械学習サーバ2と地図サーバ4とは同一のサーバから構成してもよい。   Although one embodiment of the present invention has been specifically described above, the present invention is not limited to the above-described one embodiment, and various modifications based on the technical idea of the present invention are possible. For example, in the above-described embodiment, the machine learning server 2 and the map server 4 may be configured by the same server.

1 機械学習システム
2 機械学習サーバ
3 車両
4 地図サーバ
10 ネットワーク
21,31,41 制御部
21a 学習部
22,34,42 記憶部
23,32,43 通信部
33 駆動部
41a データ収集部
100 ニューラルネットワーク
101 入力層
102 中間層
103 出力層
121 第1中間層
122 第2中間層
1 Machine Learning System 2 Machine Learning Server 3 Vehicle 4 Map Server 10 Network 21, 31, 41 Control Unit 21a Learning Unit 22, 34, 42 Storage Unit 23, 32, 43 Communication Unit 33 Drive Unit 41a Data Collection Unit 100 Neural Network 101 Input layer 102 Intermediate layer 103 Output layer 121 First intermediate layer 122 Second intermediate layer

Claims (1)

機械学習に用いる入力パラメータおよび出力パラメータを含むデータである入出力データセットを用いて、前記機械学習を行うことによって学習済モデルを生成する機械学習装置であって、
前記入力パラメータが、車両の内部または外部の状態を制御する制御情報と、地図情報とを含み、
前記地図情報に基づく複数の所定領域ごとにそれぞれ学習済モデルが設定され、
前記地図情報における前記複数の所定領域において、地質学上の変化、または人為的な変化を認識した場合に、前記複数の所定領域から前記地質学上の変化または人為的な変化が生じた所定領域を特定し、前記特定した所定領域に設定されている学習済モデルを削除、または前記学習済モデルを生成して更新する制御部を備える
ことを特徴とする機械学習装置。
A machine learning device for generating a trained model by performing the machine learning, using an input / output data set that is data including input parameters and output parameters used for machine learning,
The input parameter includes control information for controlling a state inside or outside the vehicle, and map information,
A learned model is set for each of a plurality of predetermined regions based on the map information,
In the plurality of predetermined regions in the map information, when a geological change or an artificial change is recognized, the predetermined region in which the geological change or the artificial change occurs from the plurality of predetermined regions The machine learning device is characterized by further comprising: a controller that deletes the learned model set in the specified predetermined area or that generates and updates the learned model.
JP2018204349A 2018-10-30 2018-10-30 Machine learning device Pending JP2020071611A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018204349A JP2020071611A (en) 2018-10-30 2018-10-30 Machine learning device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018204349A JP2020071611A (en) 2018-10-30 2018-10-30 Machine learning device

Publications (1)

Publication Number Publication Date
JP2020071611A true JP2020071611A (en) 2020-05-07

Family

ID=70547798

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018204349A Pending JP2020071611A (en) 2018-10-30 2018-10-30 Machine learning device

Country Status (1)

Country Link
JP (1) JP2020071611A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113673805A (en) * 2020-05-13 2021-11-19 丰田自动车株式会社 Vehicle allocation device, vehicle and terminal
CN113805480A (en) * 2020-06-11 2021-12-17 丰田自动车株式会社 Machine learning device, machine learning system, machine learning method, and storage medium
JP2022036586A (en) * 2020-08-24 2022-03-08 トヨタ自動車株式会社 Model learning system and server

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113673805A (en) * 2020-05-13 2021-11-19 丰田自动车株式会社 Vehicle allocation device, vehicle and terminal
CN113673805B (en) * 2020-05-13 2024-05-14 丰田自动车株式会社 Vehicle allocation device and vehicle
CN113805480A (en) * 2020-06-11 2021-12-17 丰田自动车株式会社 Machine learning device, machine learning system, machine learning method, and storage medium
JP2022036586A (en) * 2020-08-24 2022-03-08 トヨタ自動車株式会社 Model learning system and server

Similar Documents

Publication Publication Date Title
US10968855B2 (en) Control support device, vehicle, control support method, recording medium, learned model for causing computer to function, and method of generating learned model
Thibault et al. A unified approach for electric vehicles range maximization via eco-routing, eco-driving, and energy consumption prediction
CN107169567B (en) Method and device for generating decision network model for automatic vehicle driving
JP2020093760A (en) Control support device
CN111899594B (en) Automated training data extraction method for dynamic models of autonomous vehicles
JP2020071611A (en) Machine learning device
Lemieux et al. Vehicle speed prediction using deep learning
US11474529B2 (en) System and method for motion planning of an autonomous driving machine
KR102254765B1 (en) Device and method of prediction traffic data using deep learning model
US11661067B2 (en) Method for ascertaining driving profiles
CN107886188B (en) Liquefied natural gas bus tail gas emission prediction method
CN112101415B (en) Accumulated carbon quantity prediction method and device, automobile, cloud server and computer readable storage medium
KR102118088B1 (en) Method for real driving emission prediction using artificial intelligence technology
CN110488842A (en) A kind of track of vehicle prediction technique based on two-way kernel ridge regression
CN112967493A (en) Neural network-based prediction method for vehicle passing intersection travel time
CN110617829A (en) Method and device for predicting a possible driving route of a vehicle
CN112534446B (en) Electronic control device and neural network updating system
JP7338652B2 (en) Power consumption prediction device
US20210293557A1 (en) Methods and apparatus for ascertaining a driving route for a motor vehicle
CN116861370B (en) Motion data processing method for underground explosion-proof rubber-tyred vehicle
CN116662815B (en) Training method of time prediction model and related equipment
US20210380092A1 (en) Vehicle allocation device, vehicle allocation method, and computer readable recording medium
CN109978174A (en) Information processing method, information processing unit and program recorded medium
CN115752502A (en) Path screening method and device and electronic equipment
JP2022067454A (en) Vehicle control support system