JP7409421B2 - モデル作成装置及びモデル作成方法 - Google Patents

モデル作成装置及びモデル作成方法 Download PDF

Info

Publication number
JP7409421B2
JP7409421B2 JP2022048952A JP2022048952A JP7409421B2 JP 7409421 B2 JP7409421 B2 JP 7409421B2 JP 2022048952 A JP2022048952 A JP 2022048952A JP 2022048952 A JP2022048952 A JP 2022048952A JP 7409421 B2 JP7409421 B2 JP 7409421B2
Authority
JP
Japan
Prior art keywords
time series
series data
data
learning
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022048952A
Other languages
English (en)
Other versions
JP2023142195A (ja
Inventor
智啓 下沢
由佳 水師
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Isuzu Motors Ltd
Original Assignee
Isuzu Motors Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Isuzu Motors Ltd filed Critical Isuzu Motors Ltd
Priority to JP2022048952A priority Critical patent/JP7409421B2/ja
Publication of JP2023142195A publication Critical patent/JP2023142195A/ja
Application granted granted Critical
Publication of JP7409421B2 publication Critical patent/JP7409421B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Traffic Control Systems (AREA)

Description

本開示は、車両に関連するデータを生成するための機械学習モデルを作成するモデル作成装置及びモデル作成方法に関する。
車両の速度及び加速度等のデータを取得し、取得したデータに基づいて車両を管理するシステムが知られている(例えば、特許文献1を参照)。
車両の状態を把握するためには、時間経過に伴って変化する多数のデータから構成される時系列データをシステムが解析することが望ましい。しかしながら、時系列データはデータサイズが大きいので、車両が時系列データを送信し続けると通信時の負荷が大きい。そこで、車両が送信するデータ量を抑制しつつ、車両の状態を把握しやすくする方法が求められている。
本出願の出願人は、特許文献2において、頻度情報から時系列データを生成する技術を提案している。一例として、特許文献2には、車速の時系列データと、それに対応する頻度データを学習データとして用いて機械学習を行うことで、頻度データの入力に応じて時系列データを出力する機械学習モデルの作成方法が記載されている。
また、特許文献2に開示された、機械学習モデルを作成するモデル作成装置は、作成した機械学習モデルを評価するモデル評価部を有する。モデル評価部は、所定の時系列データが測定された期間における車両の所定の部材の状態の変化に対応する第1情報(例えば燃費情報)と、所定の時系列データが入力された機械学習モデルMから出力される生成時系列データに基づいて特定される所定の部材の状態の変化に対応する第2情報(例えば燃費情報)との差に基づいて機械学習モデルMを評価した結果を、機械学習モデルを作成するモデル作成部に出力する。
モデル作成部は、例えば、第1情報と第2情報との差が基準値よりも大きい場合に機械学習モデルMの学習を継続し、差が基準値以下である場合に機械学習モデルMの学習を終了する。モデル作成部は、差が基準値以下になるまで、機械学習モデルMの学習を行う。
特開2012-248087号公報 特開2021-51642号公報
しかしながら、従来の車両に関連するデータを生成するためのモデル作成装置においては、測定により得られた時系列データを、どのように学習用時系列データと評価用時系列データとして用いるかについては十分な検討がなされておらず、その結果、モデル評価部において正しい評価が行うことができなくなるおそれがあり、良好な機械学習モデルを作成できなくなるおそれがある。
本発明は、以上の点を考慮してなされたものであり、学習用時系列データ及び評価用時系列データとして用いる時系列データを適正化することにより、モデル評価部が正しく機械学習モデルの評価を行うことができる、モデル作成装置及びモデル作成方法を提供する。
本発明のモデル作成装置の一つの態様は、
車両が走行中に測定された時系列データから、類似道路区間を走行中に測定された時系列データ領域を抽出する類似時系列データ領域抽出部と、
前記類似時系列データ領域抽出部によって抽出された時系列データを、学習用時系列データ領域と評価用時系列データ領域とに互いに領域が重なることなく分割する学習・評価データ分割部と、
前記学習用時系列データ領域の時系列データから学習用時系列データを作成する学習用時系列データ作成部と、
前記学習用時系列データに関する発生頻度分布を示す学習用頻度データを作成する学習用頻度データ作成部と、
前記学習用時系列データと、それに対応する前記学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて前記頻度データに対応する生成時系列データを出力する機械学習モデルを作成するモデル作成部と、
前記生成時系列データと、前記評価用時系列データ領域の時系列データと、を比較することにより、前記モデル作成部により作成された前記機械学習モデルを評価するモデル評価部と、
を備える。
本発明のモデル作成方法の一つの態様は、
コンピューターが実行するモデル作成方法であって、
車両が走行中に測定された時系列データから、類似道路区間を走行中に測定された時系列データ領域を抽出するステップと、
抽出された時系列データを、学習用時系列データ領域と評価用時系列データ領域とに互いに領域が重なることなく分割するステップと、
前記学習用時系列データ領域の時系列データから学習用時系列データを作成するステップと、
前記学習用時系列データに関する発生頻度分布を示す学習用頻度データを作成するステップと、
前記学習用時系列データと、それに対応する前記学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて前記頻度データに対応する生成時系列データを出力する機械学習モデルを作成するステップと、
前記生成時系列データと、前記評価用時系列データ領域の時系列データと、を比較することにより、作成された前記機械学習モデルを評価するステップと、
を含む。
本発明によれば、車両が走行中に測定された時系列データから、類似道路区間を走行中に測定された時系列データ領域を抽出するとともに、抽出された時系列データを、学習用時系列データ領域と評価用時系列データ領域とに互いに領域が重なることなく分割したことにより、学習用時系列データ及び評価用時系列データとして用いる時系列データを適正化し、機械学習モデルを正しく評価できる。
データ生成システムの概要を説明するための図 データ生成システムの概要を説明するための図 図3Aは時系列データを示す図、図3Bは車速の頻度データを示す図、図3Cは加速度の頻度データを示す図 データ生成装置の構成を示すブロック図 条件付きVAEにより構成される機械学習モデルを、モデル作成部が作成する処理の概要を示す図 データ生成部が機械学習モデルを用いて時系列データを生成する過程を示す図 データ生成装置における処理の流れを示すフローチャート 本発明の実施の形態に係るデータ生成装置の構成を示すブロック図 類似時系列データ領域抽出部による時系列データの抽出の様子を示す図 図9Aは学習・評価データ分割部によるデータ分割の様子を示す図、図9Bは学習用時系列データ作成部及び評価用時系列データ作成部による時系列データ作成の様子を示す図
以下、本開示の実施の形態を、図面を参照して説明する。
<1>データ生成システムSの概要
図1及び図2は、データ生成システムSの概要を説明するための図である。データ生成システムSは、車両Tにおいて測定された各種のパラメータの頻度データに基づいて、当該パラメータの時系列データを生成するためのシステムである。データ生成システムSは、データ収集装置1及びデータ生成装置2を備えている。データ生成装置2は、機械学習モデルを用いて、頻度データに基づいて時系列データを生成する装置である。データ生成装置2は、機械学習モデルを作成するモデル作成装置としても機能する。当該機械学習モデルは、例えば条件付VAE(Variational Auto Encoder)又は条件付GAN(Generative Adversarial Networks)を含んで構成されている。
図3は、時系列データ及び頻度データの概要を示す図である。図3Aに示すように、時系列データは、時間によって変化するパラメータの値を示すデータであり、例えば1秒ごとの車両Tの速度の値から構成されている。図3Bに示すように、頻度データは、所定の期間内における、パラメータの値(速度)の発生頻度の分布を示すデータである。頻度データは、図3Cに示したように、パラメータを一階微分した値(加速度)の発生頻度の分布を示すデータであってもよい。
パラメータが車両Tの速度である場合、頻度データは、例えば単位時間(例えば1時間)内に時速1kmの状態が発生した時間、時速2kmの状態が発生した時間等のように、時速Nkm(Nは0以上の整数)の状態が発生した時間又は割合を示すデータである(図3B参照)。パラメータが車両Tの速度である場合、頻度データは、単位時間内に所定の加速度が発生した時間又は割合を示すデータであってもよい(図3C参照)。なお、車両Tが加速している間は加速度が正の値となり、減速している間は加速度が負の値となる。
車両Tにおいて測定されるパラメータは、データ生成システムSは、車両Tにおいて測定されたパラメータの時系列データ及び頻度データを教師データとして機械学習(例えば深層学習)した機械学習モデルを作成し、作成した機械学習モデルを用いて、車両Tから得られた頻度データに基づいて時系列データを生成することを可能にする。
これにより、データ量の少ない頻度データに基づいて、データ量の大きい時系列データを生成できるようになる。
車両Tの管理者は、データ生成システムSにおいて生成される時系列データを分析することで、車両Tの燃費、劣化度、運転の質等の各種の情報を得ることが可能になる。
以下、図1及び図2を参照しながら、データ生成システムSの概要を説明する。データ収集装置1は、ネットワークNを介して多数の車両Tにおいて測定されたパラメータのデータを取得する装置であり、例えばコンピューターである。
図1に示したように、データ生成装置2は、データ収集装置1を介して車両Tから取得した時系列データ及び当該時系列データに対応する頻度データを教師データとして機械学習した機械学習モデルを作成するコンピューターである。また、図2に示したように、データ生成装置2は、作成した機械学習モデルを用いて、車両Tから得られた頻度データに基づいて時系列データを生成する。
図1は、データ生成装置2が機械学習をして機械学習モデルを作成する際のデータ生成システムSの動作を示す図である。データ収集装置1は、予め登録された車両Tから所定のパラメータ(例えば速度)の測定データを取得する(図1における(1))。データ収集装置1は、取得した測定データの時系列データをデータ生成装置2に送信する(図1における(2))。
データ生成装置2は、データ収集装置1から受信した時系列データに基づいて頻度データを生成し、時系列データ及び頻度データを教師データとして、頻度データが入力されると時系列データを出力する機械学習モデルを作成する(図1における(3))。データ生成装置2が頻度データを生成する代わりに、データ収集装置1が時系列データから頻度データを生成し、データ収集装置1が時系列データ及び頻度データをデータ生成装置2に送信してもよい。
続いて、図2を参照して、データ生成装置2が機械学習モデルを作成した後の動作を説明する。車両Tは、測定したパラメータの頻度データをデータ収集装置1に送信する(図2における(4))。データ収集装置1は車両Tから受信した頻度データをデータ生成装置2に送信する(図2における(5))。データ生成装置2は、受信した頻度データを機械学習モデルに入力し、機械学習モデルから出力される時系列データを取得することにより時系列データを生成する(図2における(6))。データ生成装置2は生成した時系列データをデータ収集装置1に送信する(図2における(7))。
以上の流れにより、データ生成装置2を利用する車両Tの管理者等のユーザーが、頻度データに基づいて、所望のパラメータの時系列データを取得することができる。データ生成装置2は、生成した時系列データをデータ収集装置1以外の任意のコンピューターに送信したり、ディスプレイに表示したり、印刷したりしてもよい。
<2>データ生成装置2の構成及び動作
図4は、データ生成装置2の構成を示す図である。データ生成装置2は、通信部21と、記憶部22と、制御部23と、を有する。制御部23は、時系列データ取得部231と、学習用頻度データ取得部232と、生成用頻度データ取得部233と、データ出力部234と、モデル作成部235と、データ生成部236とを有する。
データ生成装置2が生成用頻度データ取得部233、データ出力部234及びデータ生成部236を有しない場合、データ生成装置2は、機械学習モデルMを作成するモデル作成装置として機能する。
通信部21は、データ収集装置1又はその他の外部装置との間でデータを送受信するための通信インターフェースである。通信部21は、受信したデータを制御部23に送るとともに、制御部23から入力したデータを外部装置に送る。
記憶部22は、ROM(Read Only Memory)、RAM(Random Access Memory)及びハードディスク等の記憶媒体を含む。記憶部22は、制御部23が実行するプログラムを記憶する。また、記憶部22は、データ収集装置1から受信した時系列データ及び頻度データを一時的に記憶する。
制御部23は、例えばCPU(Central Processing Unit)である。制御部23は、記憶部22に記憶されたプログラムを実行することにより、時系列データ取得部231、学習用頻度データ取得部232、生成用頻度データ取得部233、データ出力部234、モデル作成部235及びデータ生成部236として機能する。
時系列データ取得部231は、車両Tが走行中に測定されたパラメータの時系列データを学習用時系列データとして取得する。時系列データ取得部231は、例えば、車両Tが走行中に測定された車両の速度の時系列データを学習用時系列データとして取得し、これをモデル作成部235に送る。
学習用頻度データ取得部232は、時系列データ取得部231が取得した学習用時系列データに対応する学習用頻度データを取得する。学習用頻度データ取得部232は、例えば、通信部21を介して学習用頻度データを取得するが、学習用頻度データ取得部232は、学習用時系列データに基づいて学習用頻度データを作成することにより、学習用時系列データから学習用頻度データを取得してもよい。
学習用頻度データ取得部232は、学習用頻度データとして、例えば学習用時系列データに関するパラメータの発生頻度分布を示すデータ(図3B参照)を取得する。また、学習用頻度データ取得部232は、学習用頻度データとして、学習用時系列データの一階微分値の発生頻度分布を示すデータ(図3C参照)を取得してもよい。
学習用時系列データが速度の時系列データである場合、学習用頻度データ取得部232は、学習用時系列データにおける速度の発生頻度分布を示す学習用速度頻度データ、及び/又は、学習用時系列データにおける加速度の発生頻度分布を示す学習用加速度頻度データを取得する。学習用頻度データ取得部232は、取得した学習用頻度データをモデル作成部235に送る。
生成用頻度データ取得部233は、機械学習モデルMを用いて時系列データを生成するために用いられる生成用頻度データを取得する。本明細書において、機械学習モデルMを用いて生成される時系列データを生成時系列データという。生成用頻度データ取得部233は、生成用頻度データとして、生成用速度頻度データ及び/又は生成用加速度頻度データを取得する。生成用頻度データ取得部233は、取得した生成用頻度データをデータ生成部236に送る。
データ出力部234は、データ生成部236が生成用頻度データに基づいて機械学習モデルMから生成した生成時系列データを出力する。データ出力部234は、データ生成部236から出力された生成時系列データを、通信部21などの外部の装置に送信する。
モデル作成部235は、機械学習モデルMを作成し、作成した機械学習モデルMの重みを記憶部22に記憶させる。モデル作成部235は、モデル作成部235が有するメモリ(不図示)に重みを記憶させてもよい。
モデル作成部235は、学習用時系列データと、それに関する学習用頻度データと、を教師データとして重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて頻度データに対応する時系列データである生成時系列データを出力する機械学習モデルMを作成する。
学習用時系列データが、車両Tの速度の時系列データであり、学習用頻度データが、車両Tの速度の頻度データ及び/又は加速度の頻度データであり、生成時系列データが速度の時系列データである場合、機械学習モデルMは、速度頻度データ及び/又は加速度頻度データが入力されたことに応じて車両Tの速度の時系列データである生成時系列データを出力する。
データ生成部236は、生成用頻度データ取得部233から入力された生成用頻度データを機械学習モデルMに入力することにより生成時系列データを生成する。生成用頻度データ取得部233から入力された生成用頻度データが、車両Tの速度の頻度データ及び/又は加速度の頻度データである場合、データ生成部236は、車両Tの速度の頻度データ及び/又は車両Tの加速度の頻度データを入力することにより機械学習モデルMから出力される速度の時系列データを生成時系列データとして生成する。データ生成部236により生成された生成時系列データは、データ出力部234を介して外部に出力される。
<3>機械学習モデルMの作成方法
図5Aは、機械学習モデルMの一例として、条件付きVAEにより構成される機械学習モデルMをモデル作成部235が作成する処理の概要を示す図である。図5Bは、データ生成部236が機械学習モデルMを用いて時系列データを生成する過程を示す図である。
図5に示すように、機械学習モデルMは、一例としてのディープニューラルネットワーク(DNN)により構成されている。DNNは、入力層から出力層までの間に複数の層を有しており、それぞれの層に含まれる複数のノードそれぞれに可変の重みが設けられている。機械学習モデルMが学習する前の重みは初期値となっている。
図5Aに示すように、モデル作成部235は、入力された学習用時系列データ及び学習用頻度データのペアが入力される機械学習モデルM-1と、潜在変数ベクトルz及び学習用頻度データが入力される機械学習モデルM-2とで構成され、機械学習モデルM-2から出力される生成時系列データと、学習用時系列データとを比較する。
モデル作成部235は、機械学習モデルM-1及び機械学習モデルM-2に学習用頻度データを入力した際に機械学習モデルM-2から出力される生成時系列データと、学習用時系列データとの差分に基づいて、機械学習モデルM-1及び機械学習モデルM-2の重みを更新する。
モデル作成部235は、例えば生成時系列データと学習用時系列データとの差が閾値以上である場合に、前記差を逆伝搬させ、逆伝搬させた経路上のノードの重みを更新する。モデル作成部235は、生成時系列データと学習用時系列データとの差が閾値未満になるまで、学習用頻度データを機械学習モデルM-1及び機械学習モデルM-2に入力したことにより生成される生成時系列データと学習用時系列データとの比較と重みの更新とを繰り返す。モデル作成部235は、多数の学習用頻度データ及び学習用時系列データのペアを用いて上記の処理を実行することにより、図5Bに示す機械学習モデルM-3(機械学習モデルM-2と実質的に同一のモデル)を作成する。
モデル作成部235が機械学習モデルM-1及び機械学習モデルM-2を更新して機械学習モデルM-3として完成した後には、図5Bに示すように、データ生成部236が、車両Tから取得された頻度データ(生成用頻度データ)を機械学習モデルM-3に入力することにより、機械学習モデルM-3が、入力された頻度データに対応する生成時系列データを出力する。
<4>データ生成装置2における処理の流れ
図6は、データ生成装置2における処理の流れを示すフローチャートである。図6に示すフローチャートは、データ生成装置2が機械学習モデルMの作成を開始する指示を受けた時点から開始される。
モデル作成部235は、機械学習モデルMを作成する指示を受けると、時系列データ取得部231から学習用時系列データを取得する(ステップS11)。また、モデル作成部235は、学習用頻度データ取得部232から学習用頻度データを取得する(ステップS12)。ステップS11とステップS12を実行する順序は任意であり、モデル作成部235は、学習用時系列データと学習用頻度データとを同時に取得してもよい。モデル作成部235は、学習用時系列データと学習用頻度データのセットを教師データとして機械学習することにより機械学習モデルMを更新する(ステップS13)。具体的には、モデル作成部235は、記憶部22に記憶された機械学習モデルMの重みを更新する。
モデル作成部235は、更新された機械学習モデルMの性能を評価し、評価した結果が基準レベル以上であるか否かを判定する(ステップS14)。モデル作成部235は、例えば、頻度データを機械学習モデルMに入力した際に機械学習モデルMから出力される生成時系列データと、学習用時系列データとの差分が閾値未満である場合に、評価した結果が基準レベル以上であると判定する。
モデル作成部235は、評価した結果が基準レベルに達していないと判定した場合(ステップS14においてNO)、ステップS11に戻り、さらなる学習用時系列データ及び学習用頻度データを用いて機械学習を繰り返す。モデル作成部235は、評価した結果が基準レベルに達していると判定した場合(ステップS14においてYES)、機械学習モデルMの更新を終了する(ステップS15)。
その後、データ生成部236は、時系列データを生成するための生成用頻度データを取得すると(ステップS16)、生成用頻度データを機械学習モデルMに入力する(ステップS17)。データ生成部236は、機械学習モデルMから出力された生成時系列データを出力する(ステップS18)。
<5>モデル評価部を有するデータ生成装置
ところで、<3>及び<4>の項目で説明した方法では、モデル作成部235は機械学習モデルMが出力する生成時系列データと学習用時系列データとの差分に基づいて、機械学習モデルMの性能を評価したが、機械学習モデルMが学習用データ以外のデータでも性能を発揮できるかについても評価する必要がある。
そのため機械学習では、データを学習用と評価用とに分けておくことが一般的である。学習用データは機械学習モデルを作成するために用いられ、評価用データは機械学習モデルが学習用データ以外でも性能を発揮できるか、汎化性能の高さを判断するものとして用いられる。
学習用データは機械学習モデルにとって既知であるため、学習用と評価用のデータが極端に類似していると(例えば同一であると)、機械学習モデルの性能が実際より高い値として評価されてしまい、機械学習モデルを正しく評価できない。
これとは逆に、学習用データと評価用データの特徴が大きく異なっている場合にも機械学習モデルを正しく評価できない。これは評価用データが機械学習モデルにとって、全く未知のデータとなってしまうためである。
このように、本発明の発明者らは、学習用データと評価用データは、同様の特徴を持ちながらも重複のないように分割(抽出)することが重要であると考え、本発明に至った。
図7は、本発明の実施の形態に係るデータ生成装置100の構成示す。図7のデータ生成装置100は、類似時系列データ領域抽出部301と、学習・評価データ分割部302と、学習用時系列データ作成部303と、評価用時系列データ作成部304と、学習用頻度データ作成部305と、モデル評価部239と、を有する。モデル作成部235がモデル評価部239を含んでいてもよい。
類似時系列データ領域抽出部301は、車両が走行中に測定された時系列データから、類似道路区間を走行中に測定された時系列データ領域を抽出する。
図8は、類似時系列データ領域抽出部301による時系列データの抽出の様子を示す図である。類似時系列データ領域抽出部301は、図中の領域L及び領域Rを類似時系列データ領域として抽出する。ここで領域Lは高速道路Aを走行中に測定された車速の時系列データであり、領域Rは高速道路Bを走行中に測定された車速の時系列データであり、それ以外の領域は一般道路を走行中に測定された車速の時系列データである。領域L、R中で車速が0近くまで落ち込んでいる部分は、料金所に相当する部分である。
本実施の形態の類似時系列データ領域抽出部301は、類似時系列データとして、高速道路を走行中に測定された時系列データを抽出するが、これに限らず、例えば一般道路を走行中に測定された時系列データを類似時系列データとして抽出してもよい。どの時系列データを類似時系列とするかは様々な形態がある。例えば、同じ高速道路でも制限速度が異なる場合では走り方が異なるので、類似時系列データとして扱わない形態もあり得る。また、同じ一般道路でも、平坦な道路と山岳道路とでは走り方が異なるので、類似時系列データとして扱わない形態もあり得る。どの道路区間を類似道路区間として扱うかは、ユーザーが適宜設定すればよい。
本実施の形態の例では、領域Lあるいは領域Rを、類似道路区間として扱う場合について説明する。
なお、類似時系列データ領域抽出部301は、地図情報やGPS情報から得た走行位置情報を用いて、自車が類似道路区間を走行しているか否かを判断し、この判断結果に基づいて類似道路区間を走行中に測定された時系列データ領域を抽出する。
また、類似時系列データ領域抽出部301は、高速道路を走行中に測定された時系列データ領域を抽出する場合には、速度閾値を設け、閾値以上(例えば60km/h以上)の時系列データのみを有効データとして抽出することが好ましい。このようにすることで、料金所や渋滞中といった場面で測定された時系列データを除外することができる。
学習・評価データ分割部302は、類似時系列データ領域抽出部301によって抽出された時系列データを、学習用時系列データ領域と評価用時系列データ領域とに互いに領域が重なることなく分割する。
図9Aは学習・評価データ分割部302によるデータ分割の様子を示す図である。図9Aの例では、領域Lの有効データを6:4に分割し、6割を学習用時系列データとし、4割を評価用時系列データとして分割する。同様に、領域Rのデータを用いるのであれば、領域Rの有効データを6:4に分割し、6割を学習用時系列データ領域とし、4割を評価用時系列データ領域として分割する。ただし、この分割の割合はこれに限らない。重要なのは、学習用時系列データ領域と評価用時系列データ領域とが重なることなく分割することと、学習用時系列データ領域と評価用時系列データ領域とに大きなデータの特徴差がないことである。なお、複数領域のデータを用いる場合は、領域ごとに有効データを学習用時系列データ領域と評価用時系列データ領域とに分割し、学習用データ同士の結合や評価用データ同士の結合を行ってもよい。
図9Bは学習用時系列データ作成部303及び評価用時系列データ作成部304による時系列データ作成の様子を示す図である。なお、図9Bでは、評価用時系列データ作成部304よる時系列データ作成の様子が示されているが、学習用時系列データ作成部303も図9Bと同様の処理を行う。
学習用時系列データ作成部303は、学習用時系列データ領域を、所定の時間間隔tを隔てながら、所定長ずつ切り取ることで、車速時系列データ1、2、3、………を得、これらを学習用時系列データとしてモデル作成部235に出力する。同様に、評価用時系列データ作成部304は、評価用時系列データ領域を、所定の時間間隔tを隔てながら、所定長ずつ切り取ることで、車速時系列データ1、2、3、………を得、これらを評価用時系列データとしてモデル評価部239に出力する。
なお、学習用時系列データ作成部303及び評価用時系列データ作成部304の時系列データの切り取り方及び作成の仕方は様々の方法を採用し得る。例えば、学習用時系列データ作成部303及び評価用時系列データ作成部304は、一部のデータの切り取りの間隔tを変化させてもよく、または、一部のデータを削除してもよい。
学習用時系列データ作成部303により作成された学習用時系列データは、学習用頻度データ作成部305にも出力される。学習用頻度データ作成部305は、学習用時系列データにおける速度の発生頻度分布を示す学習用速度頻度データを得、これをモデル作成部235に出力する。
モデル評価部239は、評価用時系列データ作成部304が取得した評価用時系列データが測定された期間における車両Tの所定の部材の状態の変化に対応する第1情報(例えば燃費情報)と、評価用時系列データを変換した頻度データが入力された機械学習モデルMから出力される生成時系列データに基づいて特定される所定の部材の状態の変化に対応する第2情報(例えば燃費情報)との差に基づいて機械学習モデルMを評価した結果をモデル作成部235に対して出力する。ただし、前記差は機械学習モデルMの性能を測る目的で使用し、機械学習モデルMの重みの更新には用いない。
モデル評価部239は、評価用時系列データ作成部304が取得した所定の評価用時系列データに基づいて第1情報を作成してもよく、外部装置から第1情報を取得してもよい。
一例として、評価用時系列データ作成部304が、評価用時系列データとして車両Tの速度の時系列データを取得し、評価用時系列データを変換して車両Tの速度の頻度データを取得したとする。この場合、モデル評価部239は、評価用時系列データに基づいて特定される燃費(第1情報に対応)と、前記頻度データを機械学習モデルMに入力した場合に機械学習モデルMから出力される生成時系列データに基づいて特定される燃費(第2情報に対応)との差に基づいて機械学習モデルMを評価した結果を出力する。
モデル作成部235は、モデル評価部239から入力された評価結果に基づいて機械学習モデルMの性能を判断する。具体的には、モデル作成部235は、評価結果がユーザーにより設定された基準レベル未満である場合に機械学習モデルMの学習を継続し、評価結果が基準レベル以上である場合に機械学習モデルMの学習を終了する。モデル作成部235は、第1情報と第2情報との差が基準値よりも大きい場合に機械学習モデルMの学習を継続し、差が基準値以下である場合に機械学習モデルMの学習を終了するようにしてもよい。
かくして、本実施の形態によるデータ生成装置100は、類似時系列データ領域抽出部301によって、学習用及び評価用に用いる時系列データを、類似した道路区間を走行したときに得られたものにしたことにより、走行ルートの違いによるデータの特徴が学習用と評価用とで大きく異なることを抑制できる。加えて、データ生成装置100は、学習・評価データ分割部302によって、類似時系列データを、互いに重複しないように分割することで学習用及び評価用に用いる時系列データを得るようにしたことにより、学習用時系列データと評価用時系列データとが極端に類似してしまうこと(例えば同一となること)を抑制できる。
この結果、学習用の時系列データと評価用の時系列データが、同様の特徴を持ちながらも重複のないものとなり、機械学習モデルMの評価を正しく行うことができるようになる。
<6>まとめ
以上説明したように、本実施の形態のモデル作成装置(制御部23)は、車両Tが走行中に測定された時系列データから、類似道路区間を走行中に測定された時系列データ領域を抽出する類似時系列データ領域抽出部301と、類似時系列データ領域抽出部301によって抽出された時系列データを、学習用時系列データ領域と評価用時系列データ領域とに互いに領域が重なることなく分割する学習・評価データ分割部302と、学習用時系列データ領域の時系列データから学習用時系列データを作成する学習用時系列データ作成部303と、学習用時系列データに関する発生頻度分布を示す学習用頻度データを作成する学習用頻度データ作成部305と、学習用時系列データとそれに対応する学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて頻度データに対応する生成時系列データを出力する機械学習モデルMを作成するモデル作成部235と、生成時系列データと、評価用時系列データ領域の時系列データと、を比較することにより、モデル作成部235により作成された機械学習モデルMを評価するモデル評価部239と、を備える。
これにより、車両が走行中に測定された時系列データから、類似道路区間を走行中に測定された時系列データ領域を抽出することで、走行ルートの違いによるデータの特徴差が学習用と評価用とで大きく異なることを抑制でき、かつ、抽出された時系列データを、学習用時系列データ領域と評価用時系列データ領域とに互いに領域が重なることなく分割することで、学習用時系列データと評価用時系列データとが極端に類似してしまうこと(例えば同一となること)を抑制できる。この結果、学習用時系列データ及び評価用時系列データとして用いる時系列データを適正化し、機械学習モデルMを正しく評価できる。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
上述の実施の形態では、主に時系列データが車両Tの速度である場合について述べたが、上述したように時系列データは、これに限らず、例えば、車両Tの加速度、車両Tで使用される冷却水の温度、車両Tで使用される油の温度、車両Tのアクセル開度、車両Tの振動量など、車両Tの走行によりであり時間的に変化する種々のパラメータについての時系列データであり得る。
また、上述の実施の形態では、データ生成装置2がデータ収集装置1から時系列データ及び頻度データを取得する場合を例示したが、データ生成装置2がデータ収集装置1の機能を有しており、データ生成装置2が複数の車両Tから測定データを受信してもよい。
また、以上の説明においては、データ生成装置2として機能するコンピューターが、モデル作成装置の機能を有するとともに、生成用頻度データが入力されたことに応じて機械学習モデルMから出力された生成時系列データを出力する機能も有する場合を例示したが、データ生成装置2の構成はこれに限らない。データ生成装置2は、モデル作成装置として機能する第1コンピューターと、第1コンピューターに生成用頻度データを入力し、第1コンピューターから生成時系列データを取得する第2コンピューターとによって構成されていてもよい。
さらに、上述の実施の形態の学習・評価データ分割部302は、学習用時系列データ領域と評価用時系列データ領域とが全く異なることなく分割した場合について述べたが、学習用時系列データ領域と評価用時系列データ領域との一部が重なるように分割してもよい。要は、学習用時系列データ領域と評価用時系列データ領域とが完全に同じとなることを避ければよい。
本発明は、車両走行中の車両に関する時系列データを、学習により少ないデータから再現する技術として広く用いることができる。
1 データ収集装置
2、100 データ生成装置
21 通信部
22 記憶部
23 制御部
231 時系列データ取得部
232 学習用頻度データ取得部
233 生成用頻度データ取得部
234 データ出力部
235 モデル作成部
236 データ生成部
239 モデル評価部
301 類似時系列データ領域抽出部
302 学習・評価データ分割部
303 学習用時系列データ作成部
304 評価用時系列データ作成部
305 学習用頻度データ作成部
M 機械学習モデル
S データ生成システム
T 車両

Claims (6)

  1. 車両が走行中に測定された時系列データから、類似道路区間を走行中に測定された時系列データ領域を抽出する類似時系列データ領域抽出部と、
    前記類似時系列データ領域抽出部によって抽出された時系列データを、学習用時系列データ領域と評価用時系列データ領域とに互いに領域が重なることなく分割する学習・評価データ分割部と、
    前記学習用時系列データ領域の時系列データから学習用時系列データを作成する学習用時系列データ作成部と、
    前記学習用時系列データに関する発生頻度分布を示す学習用頻度データを作成する学習用頻度データ作成部と、
    前記学習用時系列データと、それに対応する前記学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて前記頻度データに対応する生成時系列データを出力する機械学習モデルを作成するモデル作成部と、
    前記生成時系列データと、前記評価用時系列データ領域の時系列データと、を比較することにより、前記モデル作成部により作成された前記機械学習モデルを評価するモデル評価部と、
    を備えるモデル作成装置。
  2. 前記類似道路区間は、高速道路区間であり、
    前記類似時系列データ領域抽出部は、前記時系列データ領域として、高速道路を走行中に測定された時系列データ領域を抽出する、
    請求項1に記載のモデル作成装置。
  3. 前記類似道路区間は、高速道路区間であり、
    前記類似時系列データ領域抽出部は、前記時系列データ領域として、高速道路を走行中に測定された時系列データ領域であり、かつ、所定値以上の車速で走行中に測定された時系列データ領域を抽出する、
    請求項1に記載のモデル作成装置。
  4. 前記類似時系列データ領域抽出部は、走行位置情報を用いて、前記類似道路区間を走行中に測定された時系列データ領域を抽出する、
    請求項1から3のいずれか一項に記載のモデル作成装置。
  5. 前記類似時系列データ領域抽出部は、速度閾値を用いて、前記類似道路区間を走行中に測定された時系列データ領域を抽出する、
    請求項1から4のいずれか一項に記載のモデル作成装置。
  6. コンピューターが実行するモデル作成方法であって、
    車両が走行中に測定された時系列データから、類似道路区間を走行中に測定された時系列データ領域を抽出するステップと、
    抽出された時系列データを、学習用時系列データ領域と評価用時系列データ領域とに互いに領域が重なることなく分割するステップと、
    前記学習用時系列データ領域の時系列データから学習用時系列データを作成するステップと、
    前記学習用時系列データに関する発生頻度分布を示す学習用頻度データを作成するステップと、
    前記学習用時系列データと、それに対応する前記学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて前記頻度データに対応する生成時系列データを出力する機械学習モデルを作成するステップと、
    前記生成時系列データと、前記評価用時系列データ領域の時系列データと、を比較することにより、作成された前記機械学習モデルを評価するステップと、
    を含むモデル作成方法。
JP2022048952A 2022-03-24 2022-03-24 モデル作成装置及びモデル作成方法 Active JP7409421B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022048952A JP7409421B2 (ja) 2022-03-24 2022-03-24 モデル作成装置及びモデル作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022048952A JP7409421B2 (ja) 2022-03-24 2022-03-24 モデル作成装置及びモデル作成方法

Publications (2)

Publication Number Publication Date
JP2023142195A JP2023142195A (ja) 2023-10-05
JP7409421B2 true JP7409421B2 (ja) 2024-01-09

Family

ID=88206593

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022048952A Active JP7409421B2 (ja) 2022-03-24 2022-03-24 モデル作成装置及びモデル作成方法

Country Status (1)

Country Link
JP (1) JP7409421B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020194320A (ja) 2019-05-28 2020-12-03 株式会社日立製作所 情報処理装置、予測判別システム、および予測判別方法
JP2021182189A (ja) 2020-05-18 2021-11-25 株式会社オリエンタルコンサルタンツ 事故予測方法、コンピュータプログラム、事故予測装置及び学習モデル生成方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020194320A (ja) 2019-05-28 2020-12-03 株式会社日立製作所 情報処理装置、予測判別システム、および予測判別方法
JP2021182189A (ja) 2020-05-18 2021-11-25 株式会社オリエンタルコンサルタンツ 事故予測方法、コンピュータプログラム、事故予測装置及び学習モデル生成方法

Also Published As

Publication number Publication date
JP2023142195A (ja) 2023-10-05

Similar Documents

Publication Publication Date Title
JP7230755B2 (ja) モデル作成装置及びモデル作成方法
US11292466B2 (en) Method and system for vehicle curve speed restriction
JP7163893B2 (ja) モデル評価装置及びモデル評価方法
JP7243553B2 (ja) モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法
JP7163894B2 (ja) モデル作成装置及びモデル作成方法
JP2021051639A (ja) モデル作成装置及びモデル作成方法
JP2021051638A (ja) モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法
US20220187087A1 (en) Systems and methods for predicting fuel consumption efficiency
US20200331473A1 (en) Method for ascertaining driving profiles
JP2010009510A (ja) 局所交通量予測プログラム生成装置、局所交通量予測装置、局所交通量予測プログラム生成方法、局所交通量予測方法及びプログラム
CN107111938A (zh) 用于确定拥堵末端位置的服务器、系统和方法
Li et al. A new microscopic traffic model using a spring-mass-damper-clutch system
JP2019093896A (ja) 情報処理装置、分類方法およびコンピュータ・プログラム
JP7409420B2 (ja) モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法
JP7409421B2 (ja) モデル作成装置及びモデル作成方法
WO2021144923A1 (ja) 消費エネルギー推定プログラム、消費エネルギー推定方法及び消費エネルギー推定装置
CN113283460A (zh) 机器学习系统和用于操作该系统以便确定时间序列的方法
JP7487759B2 (ja) モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法
JP7444187B2 (ja) モデル作成装置及びモデル作成方法
EP2994903B1 (en) Method and computer program product for accurate motorway speed control
JP7447926B2 (ja) モデル作成装置及びモデル作成方法
JP7447925B2 (ja) モデル作成装置及びモデル作成方法
US20210241104A1 (en) Device, method and machine learning system for determining a velocity for a vehicle
JP7400856B2 (ja) モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法
JP2023005015A (ja) 交通状況予測装置、および、交通状況予測方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220926

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231204

R150 Certificate of patent or registration of utility model

Ref document number: 7409421

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150