JP2021196777A

JP2021196777A - 機械学習装置、機械学習システム、機械学習方法、及びプログラム

Info

Publication number: JP2021196777A
Application number: JP2020101906A
Authority: JP
Inventors: 古都瑠佐藤; Kotoru Sato; 大樹横山; Daiki Yokoyama
Original assignee: Toyota Motor Corp
Current assignee: Toyota Motor Corp
Priority date: 2020-06-11
Filing date: 2020-06-11
Publication date: 2021-12-27
Also published as: DE102021114119A1; CN113805480A; US20210390406A1

Abstract

【課題】複数の機器からパラメータデータを取得して教師データの数を増やしながら、学習精度が高い機械学習装置、機械学習システム、機械学習方法、及びプログラムを提供すること。【解決手段】機械学習装置は、複数の収集機器について収集されたパラメータデータ及び前記パラメータデータから作成した教師データの少なくとも一方を含む第１データと、前記第１データと紐づけられた、前記パラメータデータの収集条件を表す第２データと、を含む第３データを取得する取得部と、前記第３データから特定のデータを選定する選定部と、前記特定のデータを用いて機械学習を行い、対象機器に対して使用される学習済みモデルを生成する学習部と、を備え、前記選定部は、前記対象機器に対する前記学習済みモデルの使用条件と前記収集機器における前記収集条件とが所定基準よりも近い前記収集条件に紐づけられた前記特定のデータを選定する。【選択図】図１

Description

本発明は、機械学習装置、機械学習システム、機械学習方法、及びプログラムに関する。

機器の特性を予測する際に、学習済みモデルが用いられる場合がある。特許文献１に記載の技術では、機器は、収集した様々なパラメータのデータをサーバに送信する。サーバは、受信したデータから作成した教師データを用いて機械学習を行い、これにより生成した学習済みモデルを機器に送信する。機器は、受信した学習済みモデルを用いて特性の予測を行う。このような学習済みモデルを搭載した機器としては、車両等の輸送機器や、ロボット機器等がある。

特開２０１９−１８３６９８号公報

一般に、機械学習においては、教師データの数が多い方が、学習精度が高くなる。教師データを増やす方法として、複数の機器から教師データ又は教師データを作成するためのデータを収集する方法が考えられる。しかしながら、様々な機器から収集したデータの全てを機械学習に用いると、かえって学習精度の低下を招くおそれがある。学習精度の低下は、例えば、データを収集した機器と学習済みモデルを用いる機器とで種類が異なる場合に、教師データに有意でないバラつきが生じることで起こり得る。また、同じ種類の機器であっても、データを収集した条件と学習済みモデルを用いる条件とが異なる場合等も、学習精度の低下を招くおそれがある。

本発明は、上記に鑑みてなされたものであって、複数の機器からパラメータデータを取得して教師データの数を増やしながら、学習精度が高い機械学習装置、機械学習システム、機械学習方法、及びプログラムを提供することを目的とする。

本発明の一態様は、複数の収集機器について収集されたパラメータデータ及び前記パラメータデータから作成した教師データの少なくとも一方を含む第１データと、前記第１データと紐づけられた、前記パラメータデータの収集条件を表す第２データと、を含む第３データを取得する取得部と、前記第３データから特定のデータを選定する選定部と、前記特定のデータを用いて機械学習を行い、対象機器に対して使用される学習済みモデルを生成する学習部と、を備え、前記選定部は、前記対象機器に対する前記学習済みモデルの使用条件と前記収集機器における前記収集条件とが所定基準よりも近い前記収集条件に紐づけられた前記特定のデータを選定する、機械学習装置である。

これにより、機械学習装置は、対象機器に対して使用される学習済みモデルを生成するときに、複数の収集機器について収集されたパラメータデータ及びパラメータデータから作成した教師データの少なくとも一方から、学習済みモデルの使用条件に近い収集条件に紐づけられたデータを選定し、選定したデータを用いて機械学習を行うので、複数の機器からパラメータデータを取得して教師データの数を増やしながら、学習精度が高い機械学習装置を実現できる。

前記機械学習装置において、前記収集条件は、前記収集機器が有する特性を表す条件、前記収集機器の使用条件、及び前記収集機器の環境条件の少なくとも一つを含み、前記使用条件は、前記対象機器が有する特性を表す条件、及び前記対象機器の環境条件の少なくとも一つを含んでもよい。

これにより、機械学習装置は、様々な収集条件又は使用条件に基づいてデータを選定することができる。

前記機械学習装置は、前記学習済みモデルを前記対象機器に送信する通信部を備えていてもよい。

これにより、対象機器は、機械学習装置から送信された学習済みモデルを自車両にて使用することができる。

本発明の一態様は、前記収集機器についての前記パラメータデータを収集する収集装置と、前記対象機器において前記学習済みモデルを使用する対象装置と、前記機械学習装置と、を備える機械学習システムである。

これにより、複数の機器からパラメータデータを取得して教師データの数を増やしながら、学習精度が高い機械学習システムを実現できる。

前記機械学習システムにおいて、前記収集機器及び前記対象機器は輸送機器でもよい。

これにより、車両等の輸送機器を含む機械学習システムを実現できる。

前記機械学習システムにおいて、前記機械学習装置はサーバ装置に設けられていてもよい。

これにより、サーバ装置は、機械学習のためのデータの取得と学習済みモデルの作成とを一元的に行うことができる。

前記機械学習システムにおいて、前記収集装置は、前記パラメータデータから前記教師データを作成する教師データ作成部を備えてもよい。

これにより、収集装置は、パラメータデータ収集の機能とともに、教師データ作成の機能を担うことができる。

本発明の一態様は、複数の収集機器について収集されたパラメータデータ及び前記パラメータデータから作成した教師データの少なくとも一方を含む第１データと、前記第１データと紐づけられた、前記パラメータデータの収集条件を表す第２データと、を含む第３データを取得し、前記第３データを記憶部に格納し、前記第３データから特定のデータを選定し、前記記憶部から読み出した前記特定のデータを用いて機械学習を行い、対象機器に対して使用される学習済みモデルを生成すること、を備え、前記対象機器に対する前記学習済みモデルの使用条件と前記収集機器における前記収集条件とが基準よりも近い前記収集条件に紐づけられた前記特定のデータを選定する、機械学習方法である。

これにより、複数の機器からパラメータデータを取得して教師データの数を増やしながら、学習精度が高い機械学習方法を実現できる。

本発明の一態様は、ハードウェアを有するプロセッサに、複数の収集機器について収集されたパラメータデータ及び前記パラメータデータから作成した教師データの少なくとも一方を含む第１データと、前記第１データと紐づけられた、前記パラメータデータの収集条件を表す第２データと、を含む第３データを取得し、前記第３データを記憶部に格納し、前記第３データから特定のデータを選定し、前記記憶部から読み出した前記特定のデータを用いて機械学習を行い、対象機器に対して使用される学習済みモデルを生成する、ことを実行させ、前記対象機器に対する前記学習済みモデルの使用条件と前記収集機器における前記収集条件とが基準よりも近い前記収集条件に紐づけられた前記特定のデータを選定する、プログラムである。

これにより、複数の機器からパラメータデータを取得して教師データの数を増やしながら、学習精度が高い機械学習方法をプロセッサに実行させることができる。

本発明によれば、教師データの数を増やしながら、学習精度を高くできる。

図１は、実施形態に係る機械学習システムの構成を示す模式図である。図２は、ニューラルネットワークの構成を示す模式図である。図３は、ニューラルネットワークが有するノードの入出力の概要を説明する図である。図４は、収集装置及びサーバ装置において実行される処理を示すシーケンス図である。図５は、対象装置及びサーバ装置において実行される処理を示すシーケンス図である。

以下、図面を参照して、本発明の実施形態について具体的に説明する。なお、図面において、同一又は対応する構成要素には適宜同一符号を付し、重複説明を省略する。

＜システムの構成＞
図１は、実施形態に係る機械学習システムの構成を示す模式図である。機械学習システム１０００は、複数の収集車両１００と、サーバ装置２００と、対象車両３００とを備えている。

＜収集車両＞
複数の収集車両１００は、それぞれ、収集装置１１０と、センサ群１２０と、制御対象群１３０と、を備えている。収集装置１１０と、センサ群１２０と、制御対象群１３０とは、ＣＡＮ（Controller Area Network）等の車載ネットワークによって、相互に通信可能に接続されている。収集装置１１０は、制御部１１１と、記憶部１１２と、通信部１１３とを備えている。収集車両１００は、収集機器の一例であって、輸送機器の一例である。

制御部１１１は、例えば、ＣＰＵ（Central Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＦＰＧＡ（Field-Programmable Gate Array）等のプロセッサ、及びＲＡＭ（Random Access Memory）やＲＯＭ（Read Only Memory）等の主記憶部を備える。制御部１１１は、記憶部１１２に記憶されたプログラムを主記憶部の作業領域に読み出して実行し、プロセッサによるプログラムの実行を通じて各構成部等を制御することで、ハードウェアとソフトウェアとが協働し、所定の目的に合致した機能モジュールを実現する。

制御部１１１は、機能モジュールとして、取得部１１１ａと、条件特定部１１１ｂと、教師データ作成部１１１ｃと、送信データ生成部１１１ｄと、制御部１１１ｅとを備えている。取得部１１１ａは、センサ群１２０から、収集車両１００の状態や特性を表す各種のパラメータデータを収集する。条件特定部１１１ｂは、パラメータデータの収集条件を特定する。条件特定部１１１ｂは、例えば、パラメータデータの収集条件を表す収集条件データを生成することによって、収集条件を特定する。教師データ作成部１１１ｃは、収集されたパラメータデータをもとに教師データを作成する。送信データ生成部１１１ｄは、教師データと収集条件データとを含む送信データを生成する。送信データ生成部１１１ｄは、送信データを生成する際に、教師データと収集条件データとを紐づける。制御部１１１ｅは、例えば、パラメータデータをもとに収集車両１００の状態や特性を判定し、判定結果をもとに制御対象群１３０を制御する。

教師データは第１データの一例であり、収集条件データは第２データの一例であり、送信データは第３データの一例である。

記憶部１１２は、ＲＡＭ、ハードディスクドライブ（ＨＤＤ、Hard Disk Drive）、又はリムーバブルメディア等の記憶媒体で構成され、補助記憶部とも呼ばれる。なお、リムーバブルメディアは、例えば、ＵＳＢ（Universal Serial Bus）メモリ、又は、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disc）、及びＢＤ（Blu-ray（登録商標） Disc）のようなディスク記録媒体である。また、記憶部１１２は、外部から装着可能なメモリカード等のコンピュータ読み取り可能な記録媒体を用いて構成され得る。記憶部１１２には、収集装置１１０の機能を実現するための、オペレーティングシステム（Operating System :ＯＳ）、各種プログラム、各種テーブル、各種データベース等は、予め記憶されていたり、通信ネットワーク経由でダウンロードされることによって記憶されたりする。

通信部１１３は、例えばＤＣＭ（Data Communication Module）を含んで構成され、通信ネットワークＮを介した無線通信により、サーバ装置２００と通信を行う。通信部１１３は、送信データをサーバ装置２００に送信する。通信ネットワークＮは、例えば公衆通信網であるインターネット回線網等である。

センサ群１２０は、収集車両１００の状態や特性を測定する複数のセンサからなる。センサ群１２０は、測定結果をパラメータデータとして収集装置１１０に送信する。

パラメータデータは、収集車両１００の状態や特性を表すデータであり、例えば、収集車両１００の走行に関わる状態や特性を表すデータである。パラメータデータには、例えば、収集車両１００が有する特性を表すパラメータデータ、収集車両１００の使用条件を表すパラメータデータ、又は収集車両１００の環境条件を表すパラメータデータがある。収集車両１００が有する特性を表すパラメータデータは、例えば、車種や分類（ＳＵＶ（Sport Utility Vehicle）等）を表すデータ、駆動方式（電動車、ハイブリッド車等）やパワートレインシステムの特性を表すデータ、自動運転車両であるかを表すデータ等がある。さらに、収集車両１００が内燃機関を搭載する場合、収集車両１００が有する特性を表すパラメータデータとして、例えば、機関回転数、機関の負荷率、機関の空燃比、機関の点火時期、排気浄化に流入する排気ガス中のＨＣ（炭化水素）濃度、ＣＯ（一酸化炭素）濃度、排気浄化触媒の温度等がある。収集車両１００の使用条件を表すパラメータデータとしては、収集車両１００の乗車人数、運転者の属性（例えば、年齢、性別、家族構成）、走行場所、走行時間帯、走行時期（季節等）等を表すデータがある。収集車両１００の環境条件を表すパラメータデータとしては、標高、気温、気圧、天候等を表すデータがある。

上記に例示したパラメータデータの例は、いずれも収集条件データになり得る。条件特定部１１１ｂは、例えば、特定のパラメータデータに対して影響を与えるパラメータデータを、収集条件データとして選択することによって、収集条件を特定する。例えば、特定のパラメータデータに対して影響の程度が高いパラメータデータが、収集条件データとして優先的に選択される。また、異なる収集条件データセットの間で、収集条件データとして選択されるパラメータデータの共通性が高い場合に、それらの収集条件データセットにより表される収集条件は近いということができるので、収集条件の近さの判定に使用することができる。

制御対象群１３０は、パラメータデータをもとに制御部１１１ｅによって制御される。制御対象群１３０は、収集車両１００に搭載された各種装置を含み、例えば、収集車両１００の走行に関わる各種装置を含む。制御対象群１３０は、収集車両１００が内燃機関を搭載する場合、例えば、点火装置、燃料噴射弁、スロットル弁駆動用アクチュエータ、ＥＧＲ（Exhaust Gas Recirculation）制御弁、燃料ポンプ等を含む。また、制御対象群１３０は、パラメータデータをもとに情報の表示を行う表示装置を含んでいてもよい。

＜サーバ装置＞
サーバ装置２００は、機械学習装置が設けられたサーバ装置の一例であって、機械学習装置の構成要素として、制御部２１０と、記憶部２２０と、通信部２３０とを備えている。

制御部２１０は、収集車両１００の制御部１１１と同様に、プロセッサ及び主記憶部を備える。制御部２１０は、記憶部２２０に記憶されたプログラムを主記憶部の作業領域に読み出して実行し、プログラムの実行を通じて各構成部等を制御することで、所定の目的に合致した機能モジュールを実現する。

制御部２１０は、機能モジュールとして、取得部２１１と、選定部２１２と、学習部２１３とを備えている。取得部２１１は、複数の収集車両１００から通信ネットワークＮを介して送信された送信データを取得する。選定部２１２は、送信データから特定のデータを選定する。以降、当該選定されたデータを選定データと記載する場合がある。学習部２１３は、選定データを用いて機械学習を行い、対象車両３００に対して使用される学習済みモデルを生成する。

記憶部２２０は、収集車両１００の記憶部１１２と同様の記憶媒体で構成される。記憶部２２０には、サーバ装置２００の機能を実現するためのＯＳ、各種プログラム、各種テーブル、各種データベース等が記憶され得る。また、記憶部２２０は、学習部２１３が生成した学習済みモデルを記憶する。

通信部２３０は、例えばＬＡＮ（Local Area Network）インターフェースボード、無線通信のための無線通信回路を含んで構成され、通信ネットワークＮを介した無線通信により、複数の収集車両１００及び対象車両３００と通信を行う。例えば、通信部２３０は、複数の収集車両１００から送信された送信データを受信する。

＜対象車両＞
対象車両３００は、対象装置３１０と、センサ群３２０と、制御対象群３３０と、を備えている。対象装置３１０と、センサ群３２０と、制御対象群３３０とは、車載ネットワークによって、相互に通信可能に接続されている。対象装置３１０は、制御部３１１と、記憶部３１２と、通信部３１３とを備えている。対象車両３００は、対象機器の一例であって、輸送機器の一例である。

制御部３１１は、収集車両１００の制御部１１１と同様に、プロセッサ及び主記憶部を備える。制御部３１１は、記憶部３１２に記憶されたプログラムを主記憶部の作業領域に読み出して実行し、プログラムの実行を通じて各構成部等を制御することで、所定の目的に合致した機能モジュールを実現する。また、後述するように、記憶部３１２は学習済みモデル３１２ａを記憶している。

制御部３１１は、機能モジュールとして、取得部３１１ａと、条件特定部３１１ｂと、制御部３１１ｃとを備えている。取得部３１１ａは、センサ群３２０から、対象車両３００の状態や特性を表す各種のパラメータデータを収集する。条件特定部３１１ｂは、対象車両３００に対する学習済みモデル３２１の使用条件を特定し、その使用条件を表す使用条件データを生成する。制御部３１１ｃは、例えば、学習済みモデル３１２ａを用いて予測した特性をもとに、制御対象群３３０を制御する。制御対象群３３０の制御は、対象装置３１０における学習済みモデル３１２ａの使用態様の一例である。

記憶部３１２は、収集車両１００の記憶部１１２と同様の記憶媒体で構成される。記憶部３１２には、対象装置３１０の機能を実現するためのＯＳ、各種プログラム、各種テーブル、各種データベース等が記憶され得る。また、記憶部３１２は学習済みモデル３１２ａを記憶している。記憶部３１２が学習済みモデル３１２ａを記憶しているとは、学習済みモデル３１２ａにおけるネットワークパラメータや演算のアルゴリズム等の情報を記憶していることを意味する。また、以下、学習済みモデルを送信する、受信する、又は読み出す等についても同様に、ネットワークパラメータや演算のアルゴリズム等の情報を送信する、受信する、又は読み出す等を意味する。

通信部３１３は、例えばＤＣＭを含んで構成され、通信ネットワークＮを介した無線通信により、サーバ装置２００と通信を行う。通信部３１３は、例えば、使用条件データをサーバ装置２００に送信する。

センサ群３２０は、対象車両３００の状態や特性を測定する複数のセンサからなる。センサ群３２０は、測定結果をパラメータデータとして対象装置３１０に送信する。

パラメータデータは、対象車両３００の状態や特性を表すデータであり、例えば、対象車両３００の走行に関わる状態や特性を表すデータである。パラメータデータとしては、収集車両１００のパラメータデータとして上記に例示されたものがある。すなわち、パラメータデータには、例えば、対象車両３００が有する特性を表すパラメータデータ、又は対象車両３００の環境条件を表すパラメータデータがある。また、例示されたパラメータデータは、いずれも使用条件データになり得る。条件特定部３１１ｂは、例えば、特定のパラメータデータに対して影響を与えるパラメータデータを、使用条件データとして選択することによって、使用条件を特定する。例えば、特定のパラメータデータに対して影響の程度が高いパラメータデータが、使用条件データとして優先的に選択される。

制御対象群３３０は、パラメータデータをもとに制御部３１１ｃによって制御される。制御対象群３３０は、対象車両３００に搭載された各種装置を含み、例えば、対象車両３００の走行に関わる各種装置を含む。また、制御対象群３３０は、パラメータデータや学習済みモデル３１２ａによる予測をもとに情報の表示を行う表示装置を含んでいてもよい。

＜機械学習の例＞
次に、サーバ装置２００の学習部２１３が実行する機械学習の方法の一例として、ニューラルネットワークを用いた深層学習について説明する。図２は、学習部２１３が学習するニューラルネットワークの構成を示す模式図である。ニューラルネットワークＮＮは、順伝播型ニューラルネットワークであり、入力層ＮＮ１と、中間層ＮＮ２と、出力層ＮＮ３とを有する。入力層ＮＮ１は複数のノードからなり、各ノードには互いに異なる入力パラメータが入力される。中間層ＮＮ２は入力層ＮＮ１からの出力が入力される。中間層ＮＮ２は、入力層ＮＮ１からの入力を受ける複数のノードからなる層を含む多層の構造を有する。出力層ＮＮ３は、中間層ＮＮ２からの出力が入力され、出力パラメータを出力する。中間層ＮＮ２が多層構造を有するニューラルネットワークを用いた機械学習は、深層学習と呼ばれる。

図３は、ニューラルネットワークＮＮが有するノードにおける入出力の概要を説明する図である。図３においては、ニューラルネットワークＮＮのうち、Ｉ個のノードを有する入力層ＮＮ１と、Ｊ個のノードを有する第１中間層ＮＮ２１と、Ｋ個のノードを有する第２中間層ＮＮ２２におけるデータの入出力の一部を模式的に示している（Ｉ、Ｊ、Ｋは正の整数）。入力層ＮＮ１の上からｉ番目のノードには、入力パラメータｘ_i（ｉ＝１，２，…，Ｉ）が入力される。以下、全ての入力パラメータの集合を「入力パラメータ｛ｘ_i｝」と記載する。

入力層ＮＮ１の各ノードは、隣接する第１中間層ＮＮ２１の各ノードに対し、入力パラメータに所定の重みを乗じた値を有する信号を出力する。例えば、入力層ＮＮ１の上からｉ番目のノードは、第１中間層ＮＮ２１の上からｊ番目（ｊ＝１，２，…，Ｊ）のノードに対して、入力パラメータｘ_iに重みα_ijを乗じた値α_ijｘ_iを有する信号を出力する。第１中間層ＮＮ２１の上からｊ番目のノードには、合計で入力層ＮＮ１の各ノードからの出力に所定のバイアスｂ⁽¹⁾ _jを加えた値Σ_i=1〜Iα_ijｘ_i＋ｂ⁽¹⁾ _jが入力される。ここで第１項目のΣ_i=1〜Iは、ｉ＝１，２，…，Ｉの和を取ることを意味する。

第１中間層ＮＮ２１の上からｊ番目のノードの出力値ｙ_jは、そのノードへの入力層ＮＮ１からの入力値Σ_i=1〜Iα_ijｘ_i＋ｂ⁽¹⁾ _jの関数として、ｙ_j＝Ｓ（Σ_i=1〜Iα_ijｘ_i＋ｂ⁽¹⁾ _j）と表される。この関数Ｓは活性化関数と呼ばれる。具体的な活性化関数として、例えばシグモイド関数Ｓ（ｕ）＝１／｛１＋ｅｘｐ（−ｕ）｝や正規化線形関数（ＲｅＬＵ）Ｓ（ｕ）＝ｍａｘ（０，ｕ）等を挙げることができる。活性化関数は、非線形関数が用いられることが多い。

第１中間層ＮＮ２１の各ノードは、隣接する第２中間層ＮＮ２２の各ノードに対し、入力パラメータに所定の重みを乗じた値を有する信号を出力する。例えば、第１中間層ＮＮ２１の上からｊ番目のノードは、第２中間層ＮＮ２２の上からｋ番目（ｋ＝１，２，…，Ｋ）のノードに対して、入力値ｙ_jに重みβ_jkを乗じた値β_jkｙ_jを有する信号を出力する。第２中間層ＮＮ２２の上からｋ番目のノードには、合計で第１中間層ＮＮ２１の各ノードからの出力に所定のバイアスｂ⁽²⁾ _kを加えた値Σ_j=1〜Jβ_jkｙ_j＋ｂ⁽²⁾ _kが入力される。ここで第１項目のΣ_j=1〜Jは、ｊ＝１，２，…，Ｊの和を取ることを意味する。

第２中間層ＮＮ２２の上からｋ番目のノードの出力値ｚ_kは、そのノードへの第１中間層ＮＮ２１からの入力値Σ_j=1〜Jβ_jkｙ_j＋ｂ⁽²⁾ _kを変数とする活性化関数を用いて、ｚ_k＝Ｓ（Σ_j=1〜Jβ_jkｙ_j＋ｂ⁽²⁾ _k）と表される。

上述したように、入力層ＮＮ１の側から出力層ＮＮ３の側へ向かう順方向に沿って順次繰り返すことにより、最終的に出力層ＮＮ３から一つの出力パラメータＹが出力される。ニューラルネットワークＮＮが含む重み及びバイアスは、まとめてネットワークパラメータｗとも呼ばれる。このネットワークパラメータｗは、ニューラルネットワークＮＮの全ての重み及びバイアスを成分とするベクトルである。

学習部２１３は、入力パラメータ｛ｘ_i｝をニューラルネットワークＮＮへ入力することによって算出した出力パラメータＹと、入力パラメータ｛ｘ_i｝とともに入出力データセットを構成する出力パラメータ（目標出力）Ｙ₀とに基づいて、ネットワークパラメータを更新する演算を行う。具体的には、２つの出力パラメータＹとＹ₀との誤差を最小化するための演算を行うことによってネットワークパラメータｗを更新する。この際には、確率的勾配降下法がよく用いられる。以下、入力パラメータ｛ｘ_i｝及び出力パラメータＹの組（｛ｘ_i｝，Ｙ）を総称して「教師データ」という。

確率的勾配降下法では、ネットワークパラメータｗを、自動又は手動で定まる所定の学習率ηを用いて、ｗ’＝ｗ−η∇_wＥ（ｗ）、ｗ’’＝ｗ’−η∇_w’Ｅ（ｗ’）、…と順次更新する。なお、学習率ηは、学習の途中で変更してもよい。学習部２１３は、上述した更新処理を繰り返す。これにより、誤差関数Ｅ（ｗ）は徐々に極小点に近づいていく。なお、より一般的な確率的勾配降下法の場合、誤差関数Ｅ（ｗ）は、全教師データを含むサンプルの中からランダムに抽出することによって更新処理のたびに定義され、本実施形態においても適用可能である。

＜収集装置及びサーバ装置における処理シーケンス＞
図４は、収集装置１１０及びサーバ装置２００において実行される処理を示すシーケンス図である。当該シーケンスは例えば所定の周期で繰り返し実行される。なお、図４では１つの収集装置１１０の処理について説明しているが、各収集車両１００の収集装置１１０において同様に処理が実行される。

はじめに、ステップＳ１０１において、収集装置１１０の制御部１１１は、取得部１１１ａが、教師データの作成に必要なパラメータデータを収集したかを判定する。収集していないと判定した場合（ステップＳ１０１：Ｎｏ）、制御部１１１は処理を終了する。収集したと判定した場合（ステップＳ１０１：Ｙｅｓ）、シーケンスはステップＳ１０２に進む。

ステップＳ１０２において、教師データ作成部１１１ｃは、収集されたパラメータデータをもとに教師データを作成する。例えば、機械学習によって排気浄化触媒の温度を予測する際には、機関回転数、機関の負荷率、機関の空燃比、機関の点火時期、排気浄化に流入する排気ガス中のＨＣ濃度、ＣＯ濃度、及び排気浄化触媒の温度のパラメータデータセットが教師データと成り得る。教師データ作成部１１１ｃは、教師データを作成する際に、欠損データの削除や補完、データの規格化や標準化等の前処理を適宜行う。

続いて、ステップＳ１０３において、条件特定部１１１ｂは、パラメータデータの収集条件を表す収集条件データを生成することによって、収集条件を特定する。条件特定部１１１ｂは、例えば、教師データ作成部１１１ｃが作成する教師データを構成するパラメータデータ（入力パラメータ又は出力パラメータ）に対して影響を与えるパラメータデータを、収集条件データとして選択することによって、収集条件を特定する。例えば、教師データを構成するパラメータデータに対して影響の程度が高いパラメータデータが、収集条件データとして優先的に選択される。

続いて、ステップＳ１０４において、送信データ生成部１１１ｄは、教師データと収集条件データとを紐づけて、教師データと収集条件データとを含む送信データを生成する。送信データ生成部１１１ｄは生成した送信データを記憶部１１２に格納する。

続いて、ステップＳ１０５において、制御部１１１は、記憶部１１２に送信データが所定量以上蓄積されたかを判定する。所定量を表すデータは記憶部１１２に格納されている。蓄積されていないと判定した場合（ステップＳ１０５：Ｎｏ）、制御部１１１は処理を終了する。蓄積されたと判定した場合（ステップＳ１０５：Ｙｅｓ）、シーケンスはステップＳ１０６に進む。

ステップＳ１０６において、制御部１１１は、記憶部１１２から送信データを読み出し、通信部１１３に送信データを送信させる。したがって、ステップＳ１０５における所定量とは、送信データの送信のタイミングを設定するための量である。その後収集装置１１０のシーケンスは終了する。

サーバ装置２００では、通信部１１３から送信された送信データを通信部２３０が受信すると、ステップＳ１０７において、制御部２１０が送信データを記憶部２２０に格納する。記憶部２２０は、複数の収集装置１１０から送信された複数の送信データを記憶する。すなわち、記憶部２２０は、複数の収集装置１１０において収集されたパラメータデータから作成された複数の教師データ、及び、各教師データに紐づけられた収集条件データを記憶する。

＜対象装置及びサーバ装置における処理シーケンス＞
図５は、対象装置３１０及びサーバ装置２００において実行される処理を示すシーケンス図である。当該シーケンスは例えば所定の周期で繰り返し実行される。

はじめに、ステップＳ２０１において、対象装置３１０の制御部３１１は、対象装置３１０において学習済みモデルの受信が必要であるかを判定する。例えば、現に記憶部３１２に記憶されている学習済みモデル３１２ａの作成日時や前回の更新日時から所定期間が経過したと判定した場合や、現に記憶部３１２に格納されている学習済みモデル３１２ａとは異なる学習済みモデルが必要であると判定した場合には、制御部３１１は学習済みモデルの受信が必要であると判定する。学習済みモデルの受信が必要ではないと判定した場合（ステップＳ２０１：Ｎｏ）、制御部３１１は処理を終了する。学習済みモデルの受信が必要であると判定した場合（ステップＳ２０１：Ｙｅｓ）、シーケンスはステップＳ２０２に進む。

ステップＳ２０２において、条件特定部３１１ｂは、対象車両３００に対する学習済みモデル３２１の使用条件を表す使用条件データを生成することによって、使用条件を特定する。条件特定部３１１ｂは、例えば、学習済みモデル３１２ａの入力パラメータ又は出力パラメータに対して影響を与えるパラメータデータを選択して使用条件データを生成することによって、使用条件を特定する。例えば、学習済みモデル３１２ａの入力パラメータ又は出力パラメータに対して影響の程度が高いパラメータデータが、使用条件データとして優先的に選択される。条件特定部３１１ｂは、生成した使用条件データを記憶部３１２に格納する。

続いて、ステップＳ２０３において、制御部３１１は、記憶部３１２から使用条件データを読み出し、通信部３１３に使用条件データを送信させる。

サーバ装置２００では、通信部３１３から送信された使用条件データを通信部２３０が受信すると、制御部２１０は使用条件データを記憶部２２０に格納する。

続いて、ステップＳ２０４において、制御部２１０の選定部２１２は、記憶部２２０に記憶された複数の送信データに含まれる収集条件データのうち、使用条件データと近い収集条件データを選定し、さらにその選択した収集条件データに紐づけられた教師データを選定する。選択された教師データは、選定部２１２が送信データから選択する特定のデータの一例である。

選定される収集条件データは、使用条件データに対して所定基準よりも近い収集条件データである。使用条件データと収集条件データとの近さについては、例えばデータ間の距離、類似度、相関係数等の様々な指標を用いて判定される。また、所定基準については、例えば、要求させる学習精度に応じて設定され、例えば予め記憶部２２０に記憶されている。

続いて、ステップＳ２０５において、制御部２１０の学習部２１３は、選定された教師データを用いて、上述した方法等によって機械学習を行い、学習済みモデルを生成する。制御部２１０は、生成された学習済みモデルを記憶部２２０に格納する。

続いて、ステップＳ２０６において、制御部２１０は、記憶部２２０から学習済みモデルを読み出して、通信部２３０に送信させる。その後サーバ装置２００は処理を終了する。

続いて、ステップＳ２０７において、対象装置３１０の通信部３１３は、サーバ装置２００からの学習済みモデルを受信し、制御部３１１は学習済みモデルを記憶部３１２に格納し、対象装置３１０に反映させる。なお、本実施形態では、記憶部３１２には従前に学習済みモデル３１２ａが記憶されている。この場合、対象装置３１０への学習済みモデルの反映は、例えば以下のように行われる。すなわち、例えば、制御部３１１は、従前の学習済みモデルを削除し、サーバ装置２００から受信した最新の学習済みモデルを学習済みモデル３１２ａとして置き換える更新処理を行ってもよい。また、制御部３１１は、従前の学習済みモデルの一部又は全部を残して最新の学習済みモデルを書き込む蓄積処理を行い、新たな学習済みモデル３１２ａを構築してもよい。その後対象装置３１０は処理を終了する。

対象装置３１０は、サーバ装置２００にて生成され学習済みモデルを利用して、例えばより適正な制御対象群３３０の制御を実施することができる。

以上説明した、機械学習装置を有する機械学習システム１０００では、対象車両３００に対して使用される学習済みモデルを生成するときに、複数の収集車両１００について収集装置１１０にて収集されたパラメータデータから作成した教師データから、学習済みモデルの使用条件に近い収集条件に紐づけられた教師データを選定し、選定したデータを用いて機械学習を行う。その結果、複数の収集車両１００からパラメータデータを取得して教師データの数を増やしながら、学習精度が高い機械学習装置を実現できる。

また、収集条件は、収集車両１００が有する特性を表す条件、収集車両１００の使用条件、及び収集車両１００の環境条件の少なくとも一つを含み、使用条件は、対象車両３００が有する特性を表す条件、及び対象車両３００の環境条件の少なくとも一つを含んでいるので、様々な収集条件又は使用条件に基づいて教師データを選定することができる。

また、機械学習装置は、学習済みモデルを対象車両３００に送信する通信部２３０を備えているので、対象車両３００は、機械学習装置から送信された学習済みモデルを自車両にて使用することができる。

また、機械学習システム１０００では、サーバ装置２００が、機械学習のためのデータの取得と学習済みモデルの作成とを一元的に行うことができる。

また、収集装置１１０は、教師データ作成部１１１ｃを備えているので、パラメータデータ収集の機能とともに、教師データ作成の機能を担うことができる。

なお、上記実施形態では、収集装置１１０が教師データ作成部１１１ｃを備えているが、機械学習装置が、教師データ作成部を備えていてもよい。この場合、収集装置は、収集されたパラメータデータである第１データと、第１データと紐づけられた、パラメータデータの収集条件データである第２データと、を含む第３データを、送信データとして機械学習装置に送信する。機械学習装置では、選定部が、第３データから特定のデータを選定し、データ教師データ作成部が、当該特定のデータをもとに教師データを作成する。また、収集装置と機械学習装置とが、教師データ作成機能を分散して有していてもよい。この場合、第１データは、パラメータデータと教師データとの両方を含み得る。

また、機械学習装置は、通信ネットワークＮに接続されたサーバ装置以外の他の装置の一つに設けられていてもよいし、機械学習装置の構成要素が、通信ネットワークＮに接続された他の複数の装置に分散されて設けられていてもよい。他の装置とは、例えば、収集装置や対象装置や他のコンピュータ装置等である。

また、収集装置は、収集車両に搭載されず、収集車両から通信ネットワークを介してパラメータデータを収集してもよい。

また、上記実施形態において、収集車両や対象車両は、他の輸送機器やロボット機器に置き換えることができる。

また、上記実施形態により本発明が限定されるものではない。上述した各構成要素を適宜組み合わせて構成したものも本発明に含まれる。また、さらなる効果や変形例は、当業者によって容易に導き出すことができる。よって、本発明のより広範な態様は、上記の実施形態に限定されるものではなく、様々な変更が可能である。

２００：サーバ装置（機械学習装置）
２１１：取得部
２１２：選定部
２１３：学習部

Claims

複数の収集機器について収集されたパラメータデータ及び前記パラメータデータから作成した教師データの少なくとも一方を含む第１データと、前記第１データと紐づけられた、前記パラメータデータの収集条件を表す第２データと、を含む第３データを取得する取得部と、
前記第３データから特定のデータを選定する選定部と、
前記特定のデータを用いて機械学習を行い、対象機器に対して使用される学習済みモデルを生成する学習部と、
を備え、
前記選定部は、前記対象機器に対する前記学習済みモデルの使用条件と前記収集機器における前記収集条件とが所定基準よりも近い前記収集条件に紐づけられた前記特定のデータを選定する
機械学習装置。
前記収集条件は、前記収集機器が有する特性を表す条件、前記収集機器の使用条件、及び前記収集機器の環境条件の少なくとも一つを含み、
前記使用条件は、前記対象機器が有する特性を表す条件、及び前記対象機器の環境条件の少なくとも一つを含む
請求項１に記載の機械学習装置。
前記学習済みモデルを前記対象機器に送信する通信部を備える
請求項１又は２に記載の機械学習装置。
前記収集機器についての前記パラメータデータを収集する収集装置と、
前記対象機器において前記学習済みモデルを使用する対象装置と、
請求項１〜３のいずれか一つに記載の機械学習装置と、
を備える機械学習システム。
前記収集機器又は前記対象機器は輸送機器である
請求項４に記載の機械学習システム。
前記機械学習装置はサーバ装置に設けられている
請求項４又は５に記載の機械学習システム。
前記収集装置は、前記パラメータデータから前記教師データを作成する教師データ作成部を備える
請求項４〜６のいずれか一つに記載の機械学習システム。
複数の収集機器について収集されたパラメータデータ及び前記パラメータデータから作成した教師データの少なくとも一方を含む第１データと、前記第１データと紐づけられた、前記パラメータデータの収集条件を表す第２データと、を含む第３データを取得し、
前記第３データを記憶部に格納し、
前記第３データから特定のデータを選定し、
前記記憶部から読み出した前記特定のデータを用いて機械学習を行い、対象機器に対して使用される学習済みモデルを生成すること、
を備え、
前記対象機器に対する前記学習済みモデルの使用条件と前記収集機器における前記収集条件とが基準よりも近い前記収集条件に紐づけられた前記特定のデータを選定する
機械学習方法。
ハードウェアを有するプロセッサに、
複数の収集機器について収集されたパラメータデータ及び前記パラメータデータから作成した教師データの少なくとも一方を含む第１データと、前記第１データと紐づけられた、前記パラメータデータの収集条件を表す第２データと、を含む第３データを取得し、
前記第３データを記憶部に格納し、
前記第３データから特定のデータを選定し、
前記記憶部から読み出した前記特定のデータを用いて機械学習を行い、対象機器に対して使用される学習済みモデルを生成する、
ことを実行させ、
前記対象機器に対する前記学習済みモデルの使用条件と前記収集機器における前記収集条件とが基準よりも近い前記収集条件に紐づけられた前記特定のデータを選定する
プログラム。