JP7409421B2

JP7409421B2 - モデル作成装置及びモデル作成方法

Info

Publication number: JP7409421B2
Application number: JP2022048952A
Authority: JP
Inventors: 智啓下沢; 由佳水師
Original assignee: Isuzu Motors Ltd
Current assignee: Isuzu Motors Ltd
Priority date: 2022-03-24
Filing date: 2022-03-24
Publication date: 2024-01-09
Anticipated expiration: 2042-03-24
Also published as: JP2023142195A

Description

本開示は、車両に関連するデータを生成するための機械学習モデルを作成するモデル作成装置及びモデル作成方法に関する。

車両の速度及び加速度等のデータを取得し、取得したデータに基づいて車両を管理するシステムが知られている（例えば、特許文献１を参照）。

車両の状態を把握するためには、時間経過に伴って変化する多数のデータから構成される時系列データをシステムが解析することが望ましい。しかしながら、時系列データはデータサイズが大きいので、車両が時系列データを送信し続けると通信時の負荷が大きい。そこで、車両が送信するデータ量を抑制しつつ、車両の状態を把握しやすくする方法が求められている。

本出願の出願人は、特許文献２において、頻度情報から時系列データを生成する技術を提案している。一例として、特許文献２には、車速の時系列データと、それに対応する頻度データを学習データとして用いて機械学習を行うことで、頻度データの入力に応じて時系列データを出力する機械学習モデルの作成方法が記載されている。

また、特許文献２に開示された、機械学習モデルを作成するモデル作成装置は、作成した機械学習モデルを評価するモデル評価部を有する。モデル評価部は、所定の時系列データが測定された期間における車両の所定の部材の状態の変化に対応する第１情報（例えば燃費情報）と、所定の時系列データが入力された機械学習モデルＭから出力される生成時系列データに基づいて特定される所定の部材の状態の変化に対応する第２情報（例えば燃費情報）との差に基づいて機械学習モデルＭを評価した結果を、機械学習モデルを作成するモデル作成部に出力する。

モデル作成部は、例えば、第１情報と第２情報との差が基準値よりも大きい場合に機械学習モデルＭの学習を継続し、差が基準値以下である場合に機械学習モデルＭの学習を終了する。モデル作成部は、差が基準値以下になるまで、機械学習モデルＭの学習を行う。

特開２０１２－２４８０８７号公報特開２０２１－５１６４２号公報

しかしながら、従来の車両に関連するデータを生成するためのモデル作成装置においては、測定により得られた時系列データを、どのように学習用時系列データと評価用時系列データとして用いるかについては十分な検討がなされておらず、その結果、モデル評価部において正しい評価が行うことができなくなるおそれがあり、良好な機械学習モデルを作成できなくなるおそれがある。

本発明は、以上の点を考慮してなされたものであり、学習用時系列データ及び評価用時系列データとして用いる時系列データを適正化することにより、モデル評価部が正しく機械学習モデルの評価を行うことができる、モデル作成装置及びモデル作成方法を提供する。

本発明のモデル作成装置の一つの態様は、
車両が走行中に測定された時系列データから、類似道路区間を走行中に測定された時系列データ領域を抽出する類似時系列データ領域抽出部と、
前記類似時系列データ領域抽出部によって抽出された時系列データを、学習用時系列データ領域と評価用時系列データ領域とに互いに領域が重なることなく分割する学習・評価データ分割部と、
前記学習用時系列データ領域の時系列データから学習用時系列データを作成する学習用時系列データ作成部と、
前記学習用時系列データに関する発生頻度分布を示す学習用頻度データを作成する学習用頻度データ作成部と、
前記学習用時系列データと、それに対応する前記学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて前記頻度データに対応する生成時系列データを出力する機械学習モデルを作成するモデル作成部と、
前記生成時系列データと、前記評価用時系列データ領域の時系列データと、を比較することにより、前記モデル作成部により作成された前記機械学習モデルを評価するモデル評価部と、
を備える。

本発明のモデル作成方法の一つの態様は、
コンピューターが実行するモデル作成方法であって、
車両が走行中に測定された時系列データから、類似道路区間を走行中に測定された時系列データ領域を抽出するステップと、
抽出された時系列データを、学習用時系列データ領域と評価用時系列データ領域とに互いに領域が重なることなく分割するステップと、
前記学習用時系列データ領域の時系列データから学習用時系列データを作成するステップと、
前記学習用時系列データに関する発生頻度分布を示す学習用頻度データを作成するステップと、
前記学習用時系列データと、それに対応する前記学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて前記頻度データに対応する生成時系列データを出力する機械学習モデルを作成するステップと、
前記生成時系列データと、前記評価用時系列データ領域の時系列データと、を比較することにより、作成された前記機械学習モデルを評価するステップと、
を含む。

本発明によれば、車両が走行中に測定された時系列データから、類似道路区間を走行中に測定された時系列データ領域を抽出するとともに、抽出された時系列データを、学習用時系列データ領域と評価用時系列データ領域とに互いに領域が重なることなく分割したことにより、学習用時系列データ及び評価用時系列データとして用いる時系列データを適正化し、機械学習モデルを正しく評価できる。

データ生成システムの概要を説明するための図データ生成システムの概要を説明するための図図３Ａは時系列データを示す図、図３Ｂは車速の頻度データを示す図、図３Ｃは加速度の頻度データを示す図データ生成装置の構成を示すブロック図条件付きＶＡＥにより構成される機械学習モデルを、モデル作成部が作成する処理の概要を示す図データ生成部が機械学習モデルを用いて時系列データを生成する過程を示す図データ生成装置における処理の流れを示すフローチャート本発明の実施の形態に係るデータ生成装置の構成を示すブロック図類似時系列データ領域抽出部による時系列データの抽出の様子を示す図図９Ａは学習・評価データ分割部によるデータ分割の様子を示す図、図９Ｂは学習用時系列データ作成部及び評価用時系列データ作成部による時系列データ作成の様子を示す図

以下、本開示の実施の形態を、図面を参照して説明する。

＜１＞データ生成システムＳの概要
図１及び図２は、データ生成システムＳの概要を説明するための図である。データ生成システムＳは、車両Ｔにおいて測定された各種のパラメータの頻度データに基づいて、当該パラメータの時系列データを生成するためのシステムである。データ生成システムＳは、データ収集装置１及びデータ生成装置２を備えている。データ生成装置２は、機械学習モデルを用いて、頻度データに基づいて時系列データを生成する装置である。データ生成装置２は、機械学習モデルを作成するモデル作成装置としても機能する。当該機械学習モデルは、例えば条件付ＶＡＥ（Variational Auto Encoder）又は条件付ＧＡＮ（Generative Adversarial Networks）を含んで構成されている。

図３は、時系列データ及び頻度データの概要を示す図である。図３Ａに示すように、時系列データは、時間によって変化するパラメータの値を示すデータであり、例えば１秒ごとの車両Ｔの速度の値から構成されている。図３Ｂに示すように、頻度データは、所定の期間内における、パラメータの値（速度）の発生頻度の分布を示すデータである。頻度データは、図３Ｃに示したように、パラメータを一階微分した値（加速度）の発生頻度の分布を示すデータであってもよい。

パラメータが車両Ｔの速度である場合、頻度データは、例えば単位時間（例えば１時間）内に時速１ｋｍの状態が発生した時間、時速２ｋｍの状態が発生した時間等のように、時速Ｎｋｍ（Ｎは０以上の整数）の状態が発生した時間又は割合を示すデータである（図３Ｂ参照）。パラメータが車両Ｔの速度である場合、頻度データは、単位時間内に所定の加速度が発生した時間又は割合を示すデータであってもよい（図３Ｃ参照）。なお、車両Ｔが加速している間は加速度が正の値となり、減速している間は加速度が負の値となる。

車両Ｔにおいて測定されるパラメータは、データ生成システムＳは、車両Ｔにおいて測定されたパラメータの時系列データ及び頻度データを教師データとして機械学習（例えば深層学習）した機械学習モデルを作成し、作成した機械学習モデルを用いて、車両Ｔから得られた頻度データに基づいて時系列データを生成することを可能にする。

これにより、データ量の少ない頻度データに基づいて、データ量の大きい時系列データを生成できるようになる。

車両Ｔの管理者は、データ生成システムＳにおいて生成される時系列データを分析することで、車両Ｔの燃費、劣化度、運転の質等の各種の情報を得ることが可能になる。

以下、図１及び図２を参照しながら、データ生成システムＳの概要を説明する。データ収集装置１は、ネットワークＮを介して多数の車両Ｔにおいて測定されたパラメータのデータを取得する装置であり、例えばコンピューターである。

図１に示したように、データ生成装置２は、データ収集装置１を介して車両Ｔから取得した時系列データ及び当該時系列データに対応する頻度データを教師データとして機械学習した機械学習モデルを作成するコンピューターである。また、図２に示したように、データ生成装置２は、作成した機械学習モデルを用いて、車両Ｔから得られた頻度データに基づいて時系列データを生成する。

図１は、データ生成装置２が機械学習をして機械学習モデルを作成する際のデータ生成システムＳの動作を示す図である。データ収集装置１は、予め登録された車両Ｔから所定のパラメータ（例えば速度）の測定データを取得する（図１における（１））。データ収集装置１は、取得した測定データの時系列データをデータ生成装置２に送信する（図１における（２））。

データ生成装置２は、データ収集装置１から受信した時系列データに基づいて頻度データを生成し、時系列データ及び頻度データを教師データとして、頻度データが入力されると時系列データを出力する機械学習モデルを作成する（図１における（３））。データ生成装置２が頻度データを生成する代わりに、データ収集装置１が時系列データから頻度データを生成し、データ収集装置１が時系列データ及び頻度データをデータ生成装置２に送信してもよい。

続いて、図２を参照して、データ生成装置２が機械学習モデルを作成した後の動作を説明する。車両Ｔは、測定したパラメータの頻度データをデータ収集装置１に送信する（図２における（４））。データ収集装置１は車両Ｔから受信した頻度データをデータ生成装置２に送信する（図２における（５））。データ生成装置２は、受信した頻度データを機械学習モデルに入力し、機械学習モデルから出力される時系列データを取得することにより時系列データを生成する（図２における（６））。データ生成装置２は生成した時系列データをデータ収集装置１に送信する（図２における（７））。

以上の流れにより、データ生成装置２を利用する車両Ｔの管理者等のユーザーが、頻度データに基づいて、所望のパラメータの時系列データを取得することができる。データ生成装置２は、生成した時系列データをデータ収集装置１以外の任意のコンピューターに送信したり、ディスプレイに表示したり、印刷したりしてもよい。

＜２＞データ生成装置２の構成及び動作
図４は、データ生成装置２の構成を示す図である。データ生成装置２は、通信部２１と、記憶部２２と、制御部２３と、を有する。制御部２３は、時系列データ取得部２３１と、学習用頻度データ取得部２３２と、生成用頻度データ取得部２３３と、データ出力部２３４と、モデル作成部２３５と、データ生成部２３６とを有する。

データ生成装置２が生成用頻度データ取得部２３３、データ出力部２３４及びデータ生成部２３６を有しない場合、データ生成装置２は、機械学習モデルＭを作成するモデル作成装置として機能する。

通信部２１は、データ収集装置１又はその他の外部装置との間でデータを送受信するための通信インターフェースである。通信部２１は、受信したデータを制御部２３に送るとともに、制御部２３から入力したデータを外部装置に送る。

記憶部２２は、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）及びハードディスク等の記憶媒体を含む。記憶部２２は、制御部２３が実行するプログラムを記憶する。また、記憶部２２は、データ収集装置１から受信した時系列データ及び頻度データを一時的に記憶する。

制御部２３は、例えばＣＰＵ（Central Processing Unit）である。制御部２３は、記憶部２２に記憶されたプログラムを実行することにより、時系列データ取得部２３１、学習用頻度データ取得部２３２、生成用頻度データ取得部２３３、データ出力部２３４、モデル作成部２３５及びデータ生成部２３６として機能する。

時系列データ取得部２３１は、車両Ｔが走行中に測定されたパラメータの時系列データを学習用時系列データとして取得する。時系列データ取得部２３１は、例えば、車両Ｔが走行中に測定された車両の速度の時系列データを学習用時系列データとして取得し、これをモデル作成部２３５に送る。

学習用頻度データ取得部２３２は、時系列データ取得部２３１が取得した学習用時系列データに対応する学習用頻度データを取得する。学習用頻度データ取得部２３２は、例えば、通信部２１を介して学習用頻度データを取得するが、学習用頻度データ取得部２３２は、学習用時系列データに基づいて学習用頻度データを作成することにより、学習用時系列データから学習用頻度データを取得してもよい。

学習用頻度データ取得部２３２は、学習用頻度データとして、例えば学習用時系列データに関するパラメータの発生頻度分布を示すデータ（図３Ｂ参照）を取得する。また、学習用頻度データ取得部２３２は、学習用頻度データとして、学習用時系列データの一階微分値の発生頻度分布を示すデータ（図３Ｃ参照）を取得してもよい。

学習用時系列データが速度の時系列データである場合、学習用頻度データ取得部２３２は、学習用時系列データにおける速度の発生頻度分布を示す学習用速度頻度データ、及び／又は、学習用時系列データにおける加速度の発生頻度分布を示す学習用加速度頻度データを取得する。学習用頻度データ取得部２３２は、取得した学習用頻度データをモデル作成部２３５に送る。

生成用頻度データ取得部２３３は、機械学習モデルＭを用いて時系列データを生成するために用いられる生成用頻度データを取得する。本明細書において、機械学習モデルＭを用いて生成される時系列データを生成時系列データという。生成用頻度データ取得部２３３は、生成用頻度データとして、生成用速度頻度データ及び／又は生成用加速度頻度データを取得する。生成用頻度データ取得部２３３は、取得した生成用頻度データをデータ生成部２３６に送る。

データ出力部２３４は、データ生成部２３６が生成用頻度データに基づいて機械学習モデルＭから生成した生成時系列データを出力する。データ出力部２３４は、データ生成部２３６から出力された生成時系列データを、通信部２１などの外部の装置に送信する。

モデル作成部２３５は、機械学習モデルＭを作成し、作成した機械学習モデルＭの重みを記憶部２２に記憶させる。モデル作成部２３５は、モデル作成部２３５が有するメモリ（不図示）に重みを記憶させてもよい。

モデル作成部２３５は、学習用時系列データと、それに関する学習用頻度データと、を教師データとして重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて頻度データに対応する時系列データである生成時系列データを出力する機械学習モデルＭを作成する。

学習用時系列データが、車両Ｔの速度の時系列データであり、学習用頻度データが、車両Ｔの速度の頻度データ及び／又は加速度の頻度データであり、生成時系列データが速度の時系列データである場合、機械学習モデルＭは、速度頻度データ及び／又は加速度頻度データが入力されたことに応じて車両Ｔの速度の時系列データである生成時系列データを出力する。

データ生成部２３６は、生成用頻度データ取得部２３３から入力された生成用頻度データを機械学習モデルＭに入力することにより生成時系列データを生成する。生成用頻度データ取得部２３３から入力された生成用頻度データが、車両Ｔの速度の頻度データ及び／又は加速度の頻度データである場合、データ生成部２３６は、車両Ｔの速度の頻度データ及び／又は車両Ｔの加速度の頻度データを入力することにより機械学習モデルＭから出力される速度の時系列データを生成時系列データとして生成する。データ生成部２３６により生成された生成時系列データは、データ出力部２３４を介して外部に出力される。

＜３＞機械学習モデルＭの作成方法
図５Ａは、機械学習モデルＭの一例として、条件付きＶＡＥにより構成される機械学習モデルＭをモデル作成部２３５が作成する処理の概要を示す図である。図５Ｂは、データ生成部２３６が機械学習モデルＭを用いて時系列データを生成する過程を示す図である。

図５に示すように、機械学習モデルＭは、一例としてのディープニューラルネットワーク（ＤＮＮ）により構成されている。ＤＮＮは、入力層から出力層までの間に複数の層を有しており、それぞれの層に含まれる複数のノードそれぞれに可変の重みが設けられている。機械学習モデルＭが学習する前の重みは初期値となっている。

図５Ａに示すように、モデル作成部２３５は、入力された学習用時系列データ及び学習用頻度データのペアが入力される機械学習モデルＭ－１と、潜在変数ベクトルｚ及び学習用頻度データが入力される機械学習モデルＭ－２とで構成され、機械学習モデルＭ－２から出力される生成時系列データと、学習用時系列データとを比較する。

モデル作成部２３５は、機械学習モデルＭ－１及び機械学習モデルＭ－２に学習用頻度データを入力した際に機械学習モデルＭ－２から出力される生成時系列データと、学習用時系列データとの差分に基づいて、機械学習モデルＭ－１及び機械学習モデルＭ－２の重みを更新する。

モデル作成部２３５は、例えば生成時系列データと学習用時系列データとの差が閾値以上である場合に、前記差を逆伝搬させ、逆伝搬させた経路上のノードの重みを更新する。モデル作成部２３５は、生成時系列データと学習用時系列データとの差が閾値未満になるまで、学習用頻度データを機械学習モデルＭ－１及び機械学習モデルＭ－２に入力したことにより生成される生成時系列データと学習用時系列データとの比較と重みの更新とを繰り返す。モデル作成部２３５は、多数の学習用頻度データ及び学習用時系列データのペアを用いて上記の処理を実行することにより、図５Ｂに示す機械学習モデルＭ－３（機械学習モデルＭ－２と実質的に同一のモデル）を作成する。

モデル作成部２３５が機械学習モデルＭ－１及び機械学習モデルＭ－２を更新して機械学習モデルＭ－３として完成した後には、図５Ｂに示すように、データ生成部２３６が、車両Ｔから取得された頻度データ（生成用頻度データ）を機械学習モデルＭ－３に入力することにより、機械学習モデルＭ－３が、入力された頻度データに対応する生成時系列データを出力する。

＜４＞データ生成装置２における処理の流れ
図６は、データ生成装置２における処理の流れを示すフローチャートである。図６に示すフローチャートは、データ生成装置２が機械学習モデルＭの作成を開始する指示を受けた時点から開始される。

モデル作成部２３５は、機械学習モデルＭを作成する指示を受けると、時系列データ取得部２３１から学習用時系列データを取得する（ステップＳ１１）。また、モデル作成部２３５は、学習用頻度データ取得部２３２から学習用頻度データを取得する（ステップＳ１２）。ステップＳ１１とステップＳ１２を実行する順序は任意であり、モデル作成部２３５は、学習用時系列データと学習用頻度データとを同時に取得してもよい。モデル作成部２３５は、学習用時系列データと学習用頻度データのセットを教師データとして機械学習することにより機械学習モデルＭを更新する（ステップＳ１３）。具体的には、モデル作成部２３５は、記憶部２２に記憶された機械学習モデルＭの重みを更新する。

モデル作成部２３５は、更新された機械学習モデルＭの性能を評価し、評価した結果が基準レベル以上であるか否かを判定する（ステップＳ１４）。モデル作成部２３５は、例えば、頻度データを機械学習モデルＭに入力した際に機械学習モデルＭから出力される生成時系列データと、学習用時系列データとの差分が閾値未満である場合に、評価した結果が基準レベル以上であると判定する。

モデル作成部２３５は、評価した結果が基準レベルに達していないと判定した場合（ステップＳ１４においてＮＯ）、ステップＳ１１に戻り、さらなる学習用時系列データ及び学習用頻度データを用いて機械学習を繰り返す。モデル作成部２３５は、評価した結果が基準レベルに達していると判定した場合（ステップＳ１４においてＹＥＳ）、機械学習モデルＭの更新を終了する（ステップＳ１５）。

その後、データ生成部２３６は、時系列データを生成するための生成用頻度データを取得すると（ステップＳ１６）、生成用頻度データを機械学習モデルＭに入力する（ステップＳ１７）。データ生成部２３６は、機械学習モデルＭから出力された生成時系列データを出力する（ステップＳ１８）。

＜５＞モデル評価部を有するデータ生成装置
ところで、＜３＞及び＜４＞の項目で説明した方法では、モデル作成部２３５は機械学習モデルＭが出力する生成時系列データと学習用時系列データとの差分に基づいて、機械学習モデルＭの性能を評価したが、機械学習モデルＭが学習用データ以外のデータでも性能を発揮できるかについても評価する必要がある。

そのため機械学習では、データを学習用と評価用とに分けておくことが一般的である。学習用データは機械学習モデルを作成するために用いられ、評価用データは機械学習モデルが学習用データ以外でも性能を発揮できるか、汎化性能の高さを判断するものとして用いられる。

学習用データは機械学習モデルにとって既知であるため、学習用と評価用のデータが極端に類似していると（例えば同一であると）、機械学習モデルの性能が実際より高い値として評価されてしまい、機械学習モデルを正しく評価できない。

これとは逆に、学習用データと評価用データの特徴が大きく異なっている場合にも機械学習モデルを正しく評価できない。これは評価用データが機械学習モデルにとって、全く未知のデータとなってしまうためである。

このように、本発明の発明者らは、学習用データと評価用データは、同様の特徴を持ちながらも重複のないように分割（抽出）することが重要であると考え、本発明に至った。

図７は、本発明の実施の形態に係るデータ生成装置１００の構成示す。図７のデータ生成装置１００は、類似時系列データ領域抽出部３０１と、学習・評価データ分割部３０２と、学習用時系列データ作成部３０３と、評価用時系列データ作成部３０４と、学習用頻度データ作成部３０５と、モデル評価部２３９と、を有する。モデル作成部２３５がモデル評価部２３９を含んでいてもよい。

類似時系列データ領域抽出部３０１は、車両が走行中に測定された時系列データから、類似道路区間を走行中に測定された時系列データ領域を抽出する。

図８は、類似時系列データ領域抽出部３０１による時系列データの抽出の様子を示す図である。類似時系列データ領域抽出部３０１は、図中の領域Ｌ及び領域Ｒを類似時系列データ領域として抽出する。ここで領域Ｌは高速道路Aを走行中に測定された車速の時系列データであり、領域Ｒは高速道路Bを走行中に測定された車速の時系列データであり、それ以外の領域は一般道路を走行中に測定された車速の時系列データである。領域Ｌ、Ｒ中で車速が０近くまで落ち込んでいる部分は、料金所に相当する部分である。

本実施の形態の類似時系列データ領域抽出部３０１は、類似時系列データとして、高速道路を走行中に測定された時系列データを抽出するが、これに限らず、例えば一般道路を走行中に測定された時系列データを類似時系列データとして抽出してもよい。どの時系列データを類似時系列とするかは様々な形態がある。例えば、同じ高速道路でも制限速度が異なる場合では走り方が異なるので、類似時系列データとして扱わない形態もあり得る。また、同じ一般道路でも、平坦な道路と山岳道路とでは走り方が異なるので、類似時系列データとして扱わない形態もあり得る。どの道路区間を類似道路区間として扱うかは、ユーザーが適宜設定すればよい。

本実施の形態の例では、領域Ｌあるいは領域Ｒを、類似道路区間として扱う場合について説明する。

なお、類似時系列データ領域抽出部３０１は、地図情報やＧＰＳ情報から得た走行位置情報を用いて、自車が類似道路区間を走行しているか否かを判断し、この判断結果に基づいて類似道路区間を走行中に測定された時系列データ領域を抽出する。

また、類似時系列データ領域抽出部３０１は、高速道路を走行中に測定された時系列データ領域を抽出する場合には、速度閾値を設け、閾値以上（例えば６０ｋｍ/ｈ以上）の時系列データのみを有効データとして抽出することが好ましい。このようにすることで、料金所や渋滞中といった場面で測定された時系列データを除外することができる。

学習・評価データ分割部３０２は、類似時系列データ領域抽出部３０１によって抽出された時系列データを、学習用時系列データ領域と評価用時系列データ領域とに互いに領域が重なることなく分割する。

図９Ａは学習・評価データ分割部３０２によるデータ分割の様子を示す図である。図９Ａの例では、領域Ｌの有効データを６：４に分割し、６割を学習用時系列データとし、４割を評価用時系列データとして分割する。同様に、領域Ｒのデータを用いるのであれば、領域Ｒの有効データを６：４に分割し、６割を学習用時系列データ領域とし、４割を評価用時系列データ領域として分割する。ただし、この分割の割合はこれに限らない。重要なのは、学習用時系列データ領域と評価用時系列データ領域とが重なることなく分割することと、学習用時系列データ領域と評価用時系列データ領域とに大きなデータの特徴差がないことである。なお、複数領域のデータを用いる場合は、領域ごとに有効データを学習用時系列データ領域と評価用時系列データ領域とに分割し、学習用データ同士の結合や評価用データ同士の結合を行ってもよい。

図９Ｂは学習用時系列データ作成部３０３及び評価用時系列データ作成部３０４による時系列データ作成の様子を示す図である。なお、図９Ｂでは、評価用時系列データ作成部３０４よる時系列データ作成の様子が示されているが、学習用時系列データ作成部３０３も図９Ｂと同様の処理を行う。

学習用時系列データ作成部３０３は、学習用時系列データ領域を、所定の時間間隔ｔを隔てながら、所定長ずつ切り取ることで、車速時系列データ１、２、３、………を得、これらを学習用時系列データとしてモデル作成部２３５に出力する。同様に、評価用時系列データ作成部３０４は、評価用時系列データ領域を、所定の時間間隔ｔを隔てながら、所定長ずつ切り取ることで、車速時系列データ１、２、３、………を得、これらを評価用時系列データとしてモデル評価部２３９に出力する。

なお、学習用時系列データ作成部３０３及び評価用時系列データ作成部３０４の時系列データの切り取り方及び作成の仕方は様々の方法を採用し得る。例えば、学習用時系列データ作成部３０３及び評価用時系列データ作成部３０４は、一部のデータの切り取りの間隔ｔを変化させてもよく、または、一部のデータを削除してもよい。

学習用時系列データ作成部３０３により作成された学習用時系列データは、学習用頻度データ作成部３０５にも出力される。学習用頻度データ作成部３０５は、学習用時系列データにおける速度の発生頻度分布を示す学習用速度頻度データを得、これをモデル作成部２３５に出力する。

モデル評価部２３９は、評価用時系列データ作成部３０４が取得した評価用時系列データが測定された期間における車両Ｔの所定の部材の状態の変化に対応する第１情報（例えば燃費情報）と、評価用時系列データを変換した頻度データが入力された機械学習モデルＭから出力される生成時系列データに基づいて特定される所定の部材の状態の変化に対応する第２情報（例えば燃費情報）との差に基づいて機械学習モデルＭを評価した結果をモデル作成部２３５に対して出力する。ただし、前記差は機械学習モデルＭの性能を測る目的で使用し、機械学習モデルMの重みの更新には用いない。

モデル評価部２３９は、評価用時系列データ作成部３０４が取得した所定の評価用時系列データに基づいて第１情報を作成してもよく、外部装置から第１情報を取得してもよい。

一例として、評価用時系列データ作成部３０４が、評価用時系列データとして車両Ｔの速度の時系列データを取得し、評価用時系列データを変換して車両Ｔの速度の頻度データを取得したとする。この場合、モデル評価部２３９は、評価用時系列データに基づいて特定される燃費（第１情報に対応）と、前記頻度データを機械学習モデルＭに入力した場合に機械学習モデルＭから出力される生成時系列データに基づいて特定される燃費（第２情報に対応）との差に基づいて機械学習モデルＭを評価した結果を出力する。

モデル作成部２３５は、モデル評価部２３９から入力された評価結果に基づいて機械学習モデルＭの性能を判断する。具体的には、モデル作成部２３５は、評価結果がユーザーにより設定された基準レベル未満である場合に機械学習モデルＭの学習を継続し、評価結果が基準レベル以上である場合に機械学習モデルＭの学習を終了する。モデル作成部２３５は、第１情報と第２情報との差が基準値よりも大きい場合に機械学習モデルＭの学習を継続し、差が基準値以下である場合に機械学習モデルＭの学習を終了するようにしてもよい。

かくして、本実施の形態によるデータ生成装置１００は、類似時系列データ領域抽出部３０１によって、学習用及び評価用に用いる時系列データを、類似した道路区間を走行したときに得られたものにしたことにより、走行ルートの違いによるデータの特徴が学習用と評価用とで大きく異なることを抑制できる。加えて、データ生成装置１００は、学習・評価データ分割部３０２によって、類似時系列データを、互いに重複しないように分割することで学習用及び評価用に用いる時系列データを得るようにしたことにより、学習用時系列データと評価用時系列データとが極端に類似してしまうこと（例えば同一となること）を抑制できる。

この結果、学習用の時系列データと評価用の時系列データが、同様の特徴を持ちながらも重複のないものとなり、機械学習モデルＭの評価を正しく行うことができるようになる。

＜６＞まとめ
以上説明したように、本実施の形態のモデル作成装置（制御部２３）は、車両Ｔが走行中に測定された時系列データから、類似道路区間を走行中に測定された時系列データ領域を抽出する類似時系列データ領域抽出部３０１と、類似時系列データ領域抽出部３０１によって抽出された時系列データを、学習用時系列データ領域と評価用時系列データ領域とに互いに領域が重なることなく分割する学習・評価データ分割部３０２と、学習用時系列データ領域の時系列データから学習用時系列データを作成する学習用時系列データ作成部３０３と、学習用時系列データに関する発生頻度分布を示す学習用頻度データを作成する学習用頻度データ作成部３０５と、学習用時系列データとそれに対応する学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて頻度データに対応する生成時系列データを出力する機械学習モデルＭを作成するモデル作成部２３５と、生成時系列データと、評価用時系列データ領域の時系列データと、を比較することにより、モデル作成部２３５により作成された機械学習モデルＭを評価するモデル評価部２３９と、を備える。

これにより、車両が走行中に測定された時系列データから、類似道路区間を走行中に測定された時系列データ領域を抽出することで、走行ルートの違いによるデータの特徴差が学習用と評価用とで大きく異なることを抑制でき、かつ、抽出された時系列データを、学習用時系列データ領域と評価用時系列データ領域とに互いに領域が重なることなく分割することで、学習用時系列データと評価用時系列データとが極端に類似してしまうこと（例えば同一となること）を抑制できる。この結果、学習用時系列データ及び評価用時系列データとして用いる時系列データを適正化し、機械学習モデルＭを正しく評価できる。

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。

上述の実施の形態では、主に時系列データが車両Ｔの速度である場合について述べたが、上述したように時系列データは、これに限らず、例えば、車両Ｔの加速度、車両Ｔで使用される冷却水の温度、車両Ｔで使用される油の温度、車両Ｔのアクセル開度、車両Ｔの振動量など、車両Ｔの走行によりであり時間的に変化する種々のパラメータについての時系列データであり得る。

また、上述の実施の形態では、データ生成装置２がデータ収集装置１から時系列データ及び頻度データを取得する場合を例示したが、データ生成装置２がデータ収集装置１の機能を有しており、データ生成装置２が複数の車両Ｔから測定データを受信してもよい。

また、以上の説明においては、データ生成装置２として機能するコンピューターが、モデル作成装置の機能を有するとともに、生成用頻度データが入力されたことに応じて機械学習モデルＭから出力された生成時系列データを出力する機能も有する場合を例示したが、データ生成装置２の構成はこれに限らない。データ生成装置２は、モデル作成装置として機能する第１コンピューターと、第１コンピューターに生成用頻度データを入力し、第１コンピューターから生成時系列データを取得する第２コンピューターとによって構成されていてもよい。

さらに、上述の実施の形態の学習・評価データ分割部３０２は、学習用時系列データ領域と評価用時系列データ領域とが全く異なることなく分割した場合について述べたが、学習用時系列データ領域と評価用時系列データ領域との一部が重なるように分割してもよい。要は、学習用時系列データ領域と評価用時系列データ領域とが完全に同じとなることを避ければよい。

本発明は、車両走行中の車両に関する時系列データを、学習により少ないデータから再現する技術として広く用いることができる。

１データ収集装置
２、１００データ生成装置
２１通信部
２２記憶部
２３制御部
２３１時系列データ取得部
２３２学習用頻度データ取得部
２３３生成用頻度データ取得部
２３４データ出力部
２３５モデル作成部
２３６データ生成部
２３９モデル評価部
３０１類似時系列データ領域抽出部
３０２学習・評価データ分割部
３０３学習用時系列データ作成部
３０４評価用時系列データ作成部
３０５学習用頻度データ作成部
Ｍ機械学習モデル
Ｓデータ生成システム
Ｔ車両

Claims

車両が走行中に測定された時系列データから、類似道路区間を走行中に測定された時系列データ領域を抽出する類似時系列データ領域抽出部と、
前記類似時系列データ領域抽出部によって抽出された時系列データを、学習用時系列データ領域と評価用時系列データ領域とに互いに領域が重なることなく分割する学習・評価データ分割部と、
前記学習用時系列データ領域の時系列データから学習用時系列データを作成する学習用時系列データ作成部と、
前記学習用時系列データに関する発生頻度分布を示す学習用頻度データを作成する学習用頻度データ作成部と、
前記学習用時系列データと、それに対応する前記学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて前記頻度データに対応する生成時系列データを出力する機械学習モデルを作成するモデル作成部と、
前記生成時系列データと、前記評価用時系列データ領域の時系列データと、を比較することにより、前記モデル作成部により作成された前記機械学習モデルを評価するモデル評価部と、
を備えるモデル作成装置。
前記類似道路区間は、高速道路区間であり、
前記類似時系列データ領域抽出部は、前記時系列データ領域として、高速道路を走行中に測定された時系列データ領域を抽出する、
請求項１に記載のモデル作成装置。
前記類似道路区間は、高速道路区間であり、
前記類似時系列データ領域抽出部は、前記時系列データ領域として、高速道路を走行中に測定された時系列データ領域であり、かつ、所定値以上の車速で走行中に測定された時系列データ領域を抽出する、
請求項１に記載のモデル作成装置。
前記類似時系列データ領域抽出部は、走行位置情報を用いて、前記類似道路区間を走行中に測定された時系列データ領域を抽出する、
請求項１から３のいずれか一項に記載のモデル作成装置。
前記類似時系列データ領域抽出部は、速度閾値を用いて、前記類似道路区間を走行中に測定された時系列データ領域を抽出する、
請求項１から４のいずれか一項に記載のモデル作成装置。
コンピューターが実行するモデル作成方法であって、
車両が走行中に測定された時系列データから、類似道路区間を走行中に測定された時系列データ領域を抽出するステップと、
抽出された時系列データを、学習用時系列データ領域と評価用時系列データ領域とに互いに領域が重なることなく分割するステップと、
前記学習用時系列データ領域の時系列データから学習用時系列データを作成するステップと、
前記学習用時系列データに関する発生頻度分布を示す学習用頻度データを作成するステップと、
前記学習用時系列データと、それに対応する前記学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて前記頻度データに対応する生成時系列データを出力する機械学習モデルを作成するステップと、
前記生成時系列データと、前記評価用時系列データ領域の時系列データと、を比較することにより、作成された前記機械学習モデルを評価するステップと、
を含むモデル作成方法。