JP7409420B2 - Model creation device, data generation device, model creation method, and data generation method - Google Patents

Model creation device, data generation device, model creation method, and data generation method Download PDF

Info

Publication number
JP7409420B2
JP7409420B2 JP2022047081A JP2022047081A JP7409420B2 JP 7409420 B2 JP7409420 B2 JP 7409420B2 JP 2022047081 A JP2022047081 A JP 2022047081A JP 2022047081 A JP2022047081 A JP 2022047081A JP 7409420 B2 JP7409420 B2 JP 7409420B2
Authority
JP
Japan
Prior art keywords
data
time series
series data
frequency
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022047081A
Other languages
Japanese (ja)
Other versions
JP2023140983A (en
Inventor
智啓 下沢
由佳 水師
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Isuzu Motors Ltd
Original Assignee
Isuzu Motors Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Isuzu Motors Ltd filed Critical Isuzu Motors Ltd
Priority to JP2022047081A priority Critical patent/JP7409420B2/en
Publication of JP2023140983A publication Critical patent/JP2023140983A/en
Application granted granted Critical
Publication of JP7409420B2 publication Critical patent/JP7409420B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Traffic Control Systems (AREA)

Description

本開示は、車両に関連するデータを生成するためのモデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法に関する。 The present disclosure relates to a model creation device, a data generation device, a model creation method, and a data generation method for generating data related to a vehicle.

車両の速度及び加速度等のデータを取得し、取得したデータに基づいて車両を管理するシステムが知られている(例えば、特許文献1を参照)。 BACKGROUND ART A system is known that acquires data such as speed and acceleration of a vehicle and manages the vehicle based on the acquired data (for example, see Patent Document 1).

車両の状態を把握するためには、時間経過に伴って変化する多数のデータから構成される時系列データをシステムが解析することが望ましい。しかしながら、時系列データはデータサイズが大きいので、車両が時系列データを送信し続けると通信時の負荷が大きい。そこで、車両が送信するデータ量を抑制しつつ、車両の状態を把握しやすくする方法が求められている。 In order to understand the state of a vehicle, it is desirable for the system to analyze time-series data consisting of a large amount of data that changes over time. However, since time series data has a large data size, if the vehicle continues to transmit time series data, the load during communication will be large. Therefore, there is a need for a method that makes it easier to understand the state of a vehicle while suppressing the amount of data transmitted by the vehicle.

本出願の出願人は、特許文献2において、頻度情報から時系列データを生成する技術を提案している。一例として、特許文献2には、車速の時系列データと、それに対応する車速頻度及び加減速頻度を学習データとして用いて機械学習を行うことで、それら頻度データの入力に応じて生成した車速時系列データを出力する機械学習モデルの作成方法が記載されている。 The applicant of the present application has proposed a technique for generating time series data from frequency information in Patent Document 2. As an example, Patent Document 2 discloses that by performing machine learning using vehicle speed time series data and the corresponding vehicle speed frequency and acceleration/deceleration frequency as learning data, vehicle speed It describes how to create a machine learning model that outputs series data.

特開2012-248087号公報Japanese Patent Application Publication No. 2012-248087 特開2021-51637号公報JP 2021-51637 Publication

ところで、特許文献2に記載された技術においては、頻度データの入力に応じて機械学習モデルから生成時系列データを出力するようになっているので、生成時系列データに関する頻度データは入力した頻度データと完全に一致することが望ましい。 By the way, in the technology described in Patent Document 2, generated time series data is output from the machine learning model according to the input of frequency data, so the frequency data regarding the generated time series data is based on the input frequency data. It is desirable that the values match exactly.

入力した頻度データと生成時系列データに関する頻度データに差が生じていた場合の改善策として、機械学習モデルを多層化などの構造変更することで、機械学習モデルをより複雑な表現を可能にする構造とする方法が挙げられる。 As an improvement measure when there is a difference between the input frequency data and the frequency data related to the generated time series data, it is possible to make more complex representations of the machine learning model by changing the structure of the machine learning model, such as making it multi-layered. One example is a method of creating a structure.

しかし、この方法では、多層化につれて計算量が増大し学習時間が長くなる上に、高価で高性能のコンピューターが必要となる場合もある。さらに、所望の精度を得ることが可能なモデル構造の見当をつけるためには試行回数が必要なため、手間もかかる欠点がある。 However, with this method, the amount of calculation increases as the number of layers increases, the learning time becomes longer, and an expensive and high-performance computer may be required. Furthermore, the method requires a number of trials in order to find a model structure that can achieve the desired accuracy, which has the disadvantage of being time-consuming.

本発明は、以上の点を考慮してなされたものであり、機械学習モデルを用いて頻度情報から時系列データを生成する場合に、機械学習モデルの構造を変更しなくとも、生成時系列データの再現度を向上させることができる、モデル作成装置、データ生成装置、モデル作成方法及びデータ生成方法を提供する。 The present invention has been made in consideration of the above points, and when generating time series data from frequency information using a machine learning model, it is possible to generate time series data without changing the structure of the machine learning model. Provided are a model creation device, a data generation device, a model creation method, and a data generation method that can improve the reproducibility of.

本発明のモデル作成装置の一つの態様は、
車両が走行中に測定された前記車両の走行中の時系列データを学習用時系列データとして取得する時系列データ取得部と、
前記学習用時系列データに関する発生頻度分布を示す学習用頻度データを取得する学習用頻度データ取得部と、
前記学習用時系列データと、それに対応する前記学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて生成時系列データを出力する機械学習モデルを作成するモデル作成部と、
前記機械学習モデルから出力される前記生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得る頻度データ生成部と、
前記機械学習モデルに入力した頻度データと前記生成頻度データとの差分を算出する差分算出部と、
前記差分が小さくなるように、前記生成時系列データを分割して削除及び複製することで、前記生成時系列データを補正する補正部と、
を備える。
One aspect of the model creation device of the present invention is
a time-series data acquisition unit that acquires time-series data while the vehicle is running, which is measured while the vehicle is running, as learning time-series data;
a learning frequency data acquisition unit that acquires learning frequency data indicating an occurrence frequency distribution regarding the learning time series data;
By performing machine learning using the learning time series data and the corresponding learning frequency data as teacher data using weighting processing based on the difference, time series data is generated in response to input of frequency data. a model creation unit that creates a machine learning model that outputs
a frequency data generation unit that obtains frequency data indicating an occurrence frequency distribution regarding the generated time series data output from the machine learning model as generated frequency data;
a difference calculation unit that calculates a difference between the frequency data input to the machine learning model and the generation frequency data;
a correction unit that corrects the generated time series data by dividing, deleting, and duplicating the generated time series data so that the difference is small;
Equipped with.

本発明のデータ生成装置の一つの態様は、
車両が走行中に測定された前記車両の走行中の時系列データから前記時系列データに関する発生頻度分布を示す頻度データを取得する頻度データ取得部と、
前記車両の走行中の学習用時系列データと、それに対応する学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより得られた機械学習モデルに、前記頻度データを入力することにより、前記頻度データに対応する時系列データである生成時系列データを生成するデータ生成部と、
前記機械学習モデルから出力される前記生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得る頻度データ生成部と、
前記機械学習モデルに入力した前記頻度データと前記生成頻度データとの差分を算出する差分算出部と、
前記差分が小さくなるように、前記生成時系列データを分割して削除及び複製することで、前記生成時系列データを補正する補正部と、
を備える。
One aspect of the data generation device of the present invention is
a frequency data acquisition unit that acquires frequency data indicating an occurrence frequency distribution regarding the time series data from time series data while the vehicle is running, which is measured while the vehicle is running;
The frequency data is applied to a machine learning model obtained by performing machine learning using weighting processing based on differences using learning time series data of the vehicle while the vehicle is running and corresponding learning frequency data as teacher data. a data generation unit that generates generated time series data that is time series data corresponding to the frequency data by inputting the frequency data;
a frequency data generation unit that obtains frequency data indicating an occurrence frequency distribution regarding the generated time series data output from the machine learning model as generated frequency data;
a difference calculation unit that calculates a difference between the frequency data input to the machine learning model and the generation frequency data;
a correction unit that corrects the generated time series data by dividing, deleting, and duplicating the generated time series data so that the difference is small;
Equipped with.

本発明のモデル作成方法の一つの態様は、
コンピューターが実行するモデル作成方法であって、
車両が走行中に測定された前記車両の走行中の時系列データを学習用時系列データとして取得するステップと、
前記学習用時系列データに関する発生頻度分布を示す学習用頻度データを取得するステップと、
前記学習用時系列データと、それに対応する前記学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて生成時系列データを出力する機械学習モデルを作成するステップと、
前記機械学習モデルから出力される前記生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得るステップと、
前記機械学習モデルに入力した頻度データと前記生成頻度データとの差分を算出するステップと、
前記差分が小さくなるように、前記生成時系列データを分割して削除及び複製することで、前記生成時系列データを補正するステップと、
を含む。
One aspect of the model creation method of the present invention is
A computer-implemented model creation method, the method comprising:
a step of acquiring time-series data of the vehicle while it is running, which is measured while the vehicle is running, as time-series data for learning;
obtaining learning frequency data indicating an occurrence frequency distribution regarding the learning time series data;
By performing machine learning using the learning time series data and the corresponding learning frequency data as teacher data using weighting processing based on the difference, time series data is generated in response to input of frequency data. a step of creating a machine learning model that outputs
obtaining frequency data indicating an occurrence frequency distribution regarding the generated time series data output from the machine learning model as generated frequency data;
calculating a difference between the frequency data input to the machine learning model and the generated frequency data;
correcting the generated time series data by dividing, deleting, and duplicating the generated time series data so that the difference is small;
including.

本発明のデータ生成方法の一つの態様は、
コンピューターが実行するデータ生成方法であって、
車両が走行中に測定された前記車両の走行中の時系列データから前記時系列データに関する発生頻度分布を示す頻度データを取得するステップと、
前記車両の走行中の学習用時系列データと、それに対応する学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより得られた機械学習モデルに、前記頻度データを入力することにより、前記頻度データに対応する時系列データである生成時系列データを生成するステップと、
前記機械学習モデルから出力される前記生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得るステップと、
前記機械学習モデルに入力した前記頻度データと前記生成頻度データとの差分を算出するステップと、
前記差分が小さくなるように、前記生成時系列データを分割して削除及び複製することで、前記生成時系列データを補正するステップと、
を含む。
One aspect of the data generation method of the present invention is
A data generation method performed by a computer, the method comprising:
acquiring frequency data indicating an occurrence frequency distribution regarding the time series data from time series data of the vehicle while the vehicle is running, which is measured while the vehicle is running;
The frequency data is applied to a machine learning model obtained by performing machine learning using weighting processing based on differences using learning time series data of the vehicle while the vehicle is running and corresponding learning frequency data as teacher data. a step of generating generated time series data that is time series data corresponding to the frequency data by inputting the frequency data;
obtaining frequency data indicating an occurrence frequency distribution regarding the generated time series data output from the machine learning model as generated frequency data;
calculating a difference between the frequency data input to the machine learning model and the generation frequency data;
correcting the generated time series data by dividing, deleting, and duplicating the generated time series data so that the difference is small;
including.

本発明によれば、生成時系列データに関する頻度データを生成頻度データとして得、機械学習モデルに入力した頻度データと生成頻度データとの差分を算出し、この差分が小さくなるように、生成時系列データを分割して削除及び複製することで、生成時系列データを補正するようにしたので、機械学習モデルを用いて頻度情報から時系列データを生成する場合に、機械学習モデルの構造を変更しなくとも、生成時系列データの再現度を向上させることができるようになる。 According to the present invention, frequency data regarding generated time series data is obtained as generation frequency data, the difference between the frequency data input to a machine learning model and the generation frequency data is calculated, and the generated time series data is Since the generated time series data is corrected by dividing, deleting, and duplicating the data, when generating time series data from frequency information using a machine learning model, the structure of the machine learning model must be changed. At the very least, it is possible to improve the reproducibility of generated time series data.

データ生成システムの概要を説明するための図Diagram to explain the overview of the data generation system データ生成システムの概要を説明するための図Diagram to explain the overview of the data generation system 図3Aは時系列データを示す図、図3Bは車速の頻度データを示す図、図3Cは加速度の頻度データを示す図FIG. 3A is a diagram showing time series data, FIG. 3B is a diagram showing frequency data of vehicle speed, and FIG. 3C is a diagram showing frequency data of acceleration. データ生成装置の構成を示すブロック図Block diagram showing the configuration of the data generation device 条件付きVAEにより構成される機械学習モデルを、モデル作成部が作成する処理の概要を示す図Diagram showing an overview of the process by which the model creation unit creates a machine learning model configured by conditional VAE データ生成部が機械学習モデルを用いて時系列データを生成する過程を示す図Diagram showing the process in which the data generation unit generates time series data using a machine learning model データ生成装置における処理の流れを示すフローチャートFlowchart showing the flow of processing in the data generation device 実施の形態による補正を実現するための、データ生成装置の構成を示すブロック図A block diagram showing the configuration of a data generation device for realizing correction according to an embodiment. 機械学習モデルから出力された生成時系列データ例を示す図Diagram showing an example of generated time series data output from a machine learning model 頻度データ生成部、差分算出部及び補正部の動作の説明に供する図であり、図9Aは車速別の機械学習モデルに入力した頻度データと生成頻度データとの差の様子を示す図、図9Bは補正前の生成車速時系列データを示す図、図9Cは補正後の生成車速時系列データを示す図FIG. 9A is a diagram illustrating the operation of the frequency data generation unit, the difference calculation unit, and the correction unit, and FIG. 9A is a diagram showing the difference between the frequency data input to the machine learning model by vehicle speed and the generated frequency data. 9C is a diagram showing generated vehicle speed time series data before correction, and FIG. 9C is a diagram showing generated vehicle speed time series data after correction. 図10Aは生成車速時系列データを複数の生成分割車速時系列データに分割した様子を示す図、図10Bは図10Aの生成分割車速時系列データを組み合わせて得た補正後の生成車速時系列データを示す図FIG. 10A is a diagram showing how the generated vehicle speed time series data is divided into a plurality of generated divided vehicle speed time series data, and FIG. 10B is the generated vehicle speed time series data after correction obtained by combining the generated divided vehicle speed time series data of FIG. 10A. Diagram showing

以下、本開示の実施の形態を、図面を参照して説明する。 Embodiments of the present disclosure will be described below with reference to the drawings.

<1>データ生成システムSの概要
図1及び図2は、データ生成システムSの概要を説明するための図である。データ生成システムSは、車両Tにおいて測定された各種のパラメータの頻度データに基づいて、当該パラメータの時系列データを生成するためのシステムである。データ生成システムSは、データ収集装置1及びデータ生成装置2を備えている。データ生成装置2は、機械学習モデルを用いて、頻度データに基づいて時系列データを生成する装置である。データ生成装置2は、機械学習モデルを作成するモデル作成装置としても機能する。当該機械学習モデルは、例えば条件付VAE(Variational Auto Encoder)又は条件付GAN(Generative Adversarial Networks)を含んで構成されている。
<1> Overview of data generation system S FIGS. 1 and 2 are diagrams for explaining an overview of the data generation system S. The data generation system S is a system for generating time series data of various parameters measured in the vehicle T based on frequency data of the parameters. The data generation system S includes a data collection device 1 and a data generation device 2. The data generation device 2 is a device that uses a machine learning model to generate time series data based on frequency data. The data generation device 2 also functions as a model creation device that creates a machine learning model. The machine learning model is configured to include, for example, a conditional VAE (Variational Auto Encoder) or a conditional GAN (Generative Adversarial Network).

図3は、時系列データ及び頻度データの概要を示す図である。図3Aに示すように、時系列データは、時間によって変化するパラメータの値を示すデータであり、例えば1秒ごとの車両Tの速度の値から構成されている。図3Bに示すように、頻度データは、所定の期間内における、パラメータの値(速度)の発生頻度の分布を示すデータである。頻度データは、図3Cに示したように、パラメータを一階微分した値(加速度)の発生頻度の分布を示すデータであってもよい。 FIG. 3 is a diagram showing an overview of time series data and frequency data. As shown in FIG. 3A, the time series data is data indicating values of parameters that change over time, and is composed of, for example, values of the speed of the vehicle T every second. As shown in FIG. 3B, the frequency data is data indicating the distribution of the frequency of occurrence of parameter values (velocity) within a predetermined period. The frequency data may be data indicating the distribution of the frequency of occurrence of a value (acceleration) obtained by first-order differentiation of a parameter, as shown in FIG. 3C.

パラメータが車両Tの速度である場合、頻度データは、例えば単位時間(例えば1時間)内に時速1kmの状態が発生した時間、時速2kmの状態が発生した時間等のように、時速Nkm(Nは0以上の整数)の状態が発生した時間又は割合を示すデータである(図3B参照)。パラメータが車両Tの速度である場合、頻度データは、単位時間内に所定の加速度が発生した時間又は割合を示すデータであってもよい(図3C参照)。なお、車両Tが加速している間は加速度が正の値となり、減速している間は加速度が負の値となる。 When the parameter is the speed of the vehicle T, the frequency data may be Nkm/h (N is an integer greater than or equal to 0) is data indicating the time or rate at which the state occurs (see FIG. 3B). When the parameter is the speed of the vehicle T, the frequency data may be data indicating the time or rate at which a predetermined acceleration occurs within a unit time (see FIG. 3C). Note that while the vehicle T is accelerating, the acceleration has a positive value, and while the vehicle T is decelerating, the acceleration has a negative value.

車両Tにおいて測定されるパラメータは、データ生成システムSは、車両Tにおいて測定されたパラメータの時系列データ及び頻度データを教師データとして機械学習(例えば深層学習)した機械学習モデルを作成し、作成した機械学習モデルを用いて、車両Tから得られた頻度データに基づいて時系列データを生成することを可能にする。 For the parameters measured in the vehicle T, the data generation system S creates a machine learning model that performs machine learning (for example, deep learning) using time series data and frequency data of the parameters measured in the vehicle T as training data. Using a machine learning model, it is possible to generate time series data based on frequency data obtained from the vehicle T.

これにより、データ量の少ない頻度データに基づいて、データ量の大きい時系列データを生成できるようになる。 This makes it possible to generate time-series data with a large amount of data based on frequency data with a small amount of data.

車両Tの管理者は、データ生成システムSにおいて生成される時系列データを分析することで、車両Tの燃費、劣化度、運転の質等の各種の情報を得ることが可能になる。 By analyzing the time-series data generated by the data generation system S, the administrator of the vehicle T can obtain various information such as the fuel efficiency, degree of deterioration, and driving quality of the vehicle T.

以下、図1及び図2を参照しながら、データ生成システムSの概要を説明する。データ収集装置1は、ネットワークNを介して多数の車両Tにおいて測定されたパラメータのデータを取得する装置であり、例えばコンピューターである。 Hereinafter, an overview of the data generation system S will be explained with reference to FIGS. 1 and 2. The data collection device 1 is a device that acquires data on parameters measured in a large number of vehicles T via a network N, and is, for example, a computer.

図1に示したように、データ生成装置2は、データ収集装置1を介して車両Tから取得した時系列データ及び当該時系列データに対応する頻度データを教師データとして機械学習した機械学習モデルを作成するコンピューターである。また、図2に示したように、データ生成装置2は、作成した機械学習モデルを用いて、車両Tから得られた頻度データに基づいて時系列データを生成する。 As shown in FIG. 1, the data generation device 2 generates a machine learning model that performs machine learning using time series data acquired from the vehicle T via the data collection device 1 and frequency data corresponding to the time series data as training data. It is a computer to create. Moreover, as shown in FIG. 2, the data generation device 2 generates time series data based on the frequency data obtained from the vehicle T using the created machine learning model.

図1は、データ生成装置2が機械学習をして機械学習モデルを作成する際のデータ生成システムSの動作を示す図である。データ収集装置1は、予め登録された車両Tから所定のパラメータ(例えば速度)の測定データを取得する(図1における(1))。データ収集装置1は、取得した測定データの時系列データをデータ生成装置2に送信する(図1における(2))。 FIG. 1 is a diagram showing the operation of the data generation system S when the data generation device 2 performs machine learning and creates a machine learning model. The data collection device 1 acquires measurement data of a predetermined parameter (for example, speed) from a vehicle T registered in advance ((1) in FIG. 1). The data collection device 1 transmits time-series data of the acquired measurement data to the data generation device 2 ((2) in FIG. 1).

データ生成装置2は、データ収集装置1から受信した時系列データに基づいて頻度データを生成し、時系列データ及び頻度データを教師データとして、頻度データが入力されると時系列データを出力する機械学習モデルを作成する(図1における(3))。データ生成装置2が頻度データを生成する代わりに、データ収集装置1が時系列データから頻度データを生成し、データ収集装置1が時系列データ及び頻度データをデータ生成装置2に送信してもよい。 The data generation device 2 is a machine that generates frequency data based on the time series data received from the data collection device 1, uses the time series data and frequency data as training data, and outputs time series data when the frequency data is input. Create a learning model ((3) in Figure 1). Instead of the data generation device 2 generating frequency data, the data collection device 1 may generate frequency data from time series data, and the data collection device 1 may transmit the time series data and frequency data to the data generation device 2. .

続いて、図2を参照して、データ生成装置2が機械学習モデルを作成した後の動作を説明する。車両Tは、測定したパラメータの頻度データをデータ収集装置1に送信する(図2における(4))。データ収集装置1は車両Tから受信した頻度データをデータ生成装置2に送信する(図2における(5))。データ生成装置2は、受信した頻度データを機械学習モデルに入力し、機械学習モデルから出力される時系列データを取得することにより時系列データを生成する(図2における(6))。データ生成装置2は生成した時系列データをデータ収集装置1に送信する(図2における(7))。 Next, with reference to FIG. 2, the operation after the data generation device 2 creates the machine learning model will be described. The vehicle T transmits frequency data of the measured parameters to the data collection device 1 ((4) in FIG. 2). The data collection device 1 transmits the frequency data received from the vehicle T to the data generation device 2 ((5) in FIG. 2). The data generation device 2 generates time series data by inputting the received frequency data into a machine learning model and acquiring time series data output from the machine learning model ((6) in FIG. 2). The data generation device 2 transmits the generated time series data to the data collection device 1 ((7) in FIG. 2).

以上の流れにより、データ生成装置2を利用する車両Tの管理者等のユーザが、頻度データに基づいて、所望のパラメータの時系列データを取得することができる。データ生成装置2は、生成した時系列データをデータ収集装置1以外の任意のコンピューターに送信したり、ディスプレイに表示したり、印刷したりしてもよい。 Through the above-described flow, a user such as an administrator of the vehicle T using the data generation device 2 can obtain time series data of desired parameters based on the frequency data. The data generation device 2 may transmit the generated time series data to any computer other than the data collection device 1, display it on a display, or print it.

<2>データ生成装置2の構成及び動作
図4は、データ生成装置2の構成を示す図である。データ生成装置2は、通信部21と、記憶部22と、制御部23と、を有する。制御部23は、時系列データ取得部231と、学習用頻度データ取得部232と、生成用頻度データ取得部233と、データ出力部234と、モデル作成部235と、データ生成部236とを有する。
<2> Configuration and operation of data generation device 2 FIG. 4 is a diagram showing the configuration of data generation device 2. The data generation device 2 includes a communication section 21, a storage section 22, and a control section 23. The control unit 23 includes a time series data acquisition unit 231, a learning frequency data acquisition unit 232, a generation frequency data acquisition unit 233, a data output unit 234, a model creation unit 235, and a data generation unit 236. .

データ生成装置2が生成用頻度データ取得部233、データ出力部234及びデータ生成部236を有しない場合、データ生成装置2は、機械学習モデルMを作成するモデル作成装置として機能する。 When the data generation device 2 does not have the generation frequency data acquisition unit 233, the data output unit 234, and the data generation unit 236, the data generation device 2 functions as a model creation device that creates the machine learning model M.

通信部21は、データ収集装置1又はその他の外部装置との間でデータを送受信するための通信インターフェースである。通信部21は、受信したデータを制御部23に送るとともに、制御部23から入力したデータを外部装置に送る。 The communication unit 21 is a communication interface for transmitting and receiving data with the data collection device 1 or other external devices. The communication unit 21 sends received data to the control unit 23, and also sends data input from the control unit 23 to an external device.

記憶部22は、ROM(Read Only Memory)、RAM(Random Access Memory)及びハードディスク等の記憶媒体を含む。記憶部22は、制御部23が実行するプログラムを記憶する。また、記憶部22は、データ収集装置1から受信した時系列データ及び頻度データを一時的に記憶する。 The storage unit 22 includes storage media such as a ROM (Read Only Memory), a RAM (Random Access Memory), and a hard disk. The storage unit 22 stores programs executed by the control unit 23. Furthermore, the storage unit 22 temporarily stores the time series data and frequency data received from the data collection device 1.

制御部23は、例えばCPU(Central Processing Unit)である。制御部23は、記憶部22に記憶されたプログラムを実行することにより、時系列データ取得部231、学習用頻度データ取得部232、生成用頻度データ取得部233、データ出力部234、モデル作成部235及びデータ生成部236として機能する。 The control unit 23 is, for example, a CPU (Central Processing Unit). The control unit 23 executes the program stored in the storage unit 22 to obtain a time series data acquisition unit 231, a learning frequency data acquisition unit 232, a generation frequency data acquisition unit 233, a data output unit 234, and a model creation unit. 235 and a data generation unit 236.

時系列データ取得部231は、車両Tが走行中に測定されたパラメータの時系列データを学習用時系列データとして取得する。時系列データ取得部231は、例えば、車両Tが走行中に測定された車両の速度の時系列データを学習用時系列データとして取得し、これをモデル作成部235に送る。 The time-series data acquisition unit 231 acquires time-series data of parameters measured while the vehicle T is running as learning time-series data. The time-series data acquisition unit 231 acquires, for example, time-series data of vehicle speed measured while the vehicle T is running as learning time-series data, and sends this to the model creation unit 235.

学習用頻度データ取得部232は、時系列データ取得部231が取得した学習用時系列データに対応する学習用頻度データを取得する。学習用頻度データ取得部232は、例えば、通信部21を介して学習用頻度データを取得するが、学習用頻度データ取得部232は、学習用時系列データに基づいて学習用頻度データを作成することにより、学習用時系列データから学習用頻度データを取得してもよい。 The learning frequency data acquisition unit 232 acquires learning frequency data corresponding to the learning time series data acquired by the time series data acquisition unit 231. The learning frequency data acquisition unit 232 acquires the learning frequency data via the communication unit 21, for example, but the learning frequency data acquisition unit 232 creates the learning frequency data based on the learning time series data. By doing so, the frequency data for learning may be obtained from the time series data for learning.

学習用頻度データ取得部232は、学習用頻度データとして、例えば学習用時系列データに関するパラメータの発生頻度分布を示すデータ(図3B参照)を取得する。また、学習用頻度データ取得部232は、学習用頻度データとして、学習用時系列データの一階微分値の発生頻度分布を示すデータ(図3C参照)を取得してもよい。 The learning frequency data acquisition unit 232 acquires, as the learning frequency data, for example, data indicating the occurrence frequency distribution of parameters related to the learning time series data (see FIG. 3B). Further, the learning frequency data acquisition unit 232 may acquire data (see FIG. 3C) indicating the occurrence frequency distribution of the first differential value of the learning time series data as the learning frequency data.

学習用時系列データが速度の時系列データである場合、学習用頻度データ取得部232は、学習用時系列データにおける速度の発生頻度分布を示す学習用速度頻度データ、及び/又は、学習用時系列データにおける加速度の発生頻度分布を示す学習用加速度頻度データを取得する。学習用頻度データ取得部232は、取得した学習用頻度データをモデル作成部235に送る。 When the learning time series data is speed time series data, the learning frequency data acquisition unit 232 acquires the learning speed frequency data indicating the frequency occurrence distribution of speed in the learning time series data and/or the learning time series data. Obtain learning acceleration frequency data that indicates the frequency distribution of acceleration in series data. The learning frequency data acquisition unit 232 sends the acquired learning frequency data to the model creation unit 235.

生成用頻度データ取得部233は、機械学習モデルMを用いて時系列データを生成するために用いられる生成用頻度データを取得する。本明細書において、機械学習モデルMを用いて生成される時系列データを生成時系列データという。生成用頻度データ取得部233は、生成用頻度データとして、生成用速度頻度データ及び/又は生成用加速度頻度データを取得する。生成用頻度データ取得部233は、取得した生成用頻度データをデータ生成部236に送る。 The generation frequency data acquisition unit 233 acquires generation frequency data used to generate time series data using the machine learning model M. In this specification, time series data generated using the machine learning model M is referred to as generated time series data. The generation frequency data acquisition unit 233 acquires generation speed frequency data and/or generation acceleration frequency data as generation frequency data. The generation frequency data acquisition unit 233 sends the acquired generation frequency data to the data generation unit 236.

データ出力部234は、データ生成部236が生成用頻度データに基づいて機械学習モデルMから生成した生成時系列データを出力する。データ出力部234は、データ生成部236から出力された生成時系列データを、通信部21などの外部の装置に送信する。 The data output unit 234 outputs generated time series data generated from the machine learning model M by the data generation unit 236 based on the generation frequency data. The data output unit 234 transmits the generated time series data output from the data generation unit 236 to an external device such as the communication unit 21.

モデル作成部235は、機械学習モデルMを作成し、作成した機械学習モデルMの重みを記憶部22に記憶させる。モデル作成部235は、モデル作成部235が有するメモリ(不図示)に重みを記憶させてもよい。 The model creation unit 235 creates a machine learning model M, and stores the weights of the created machine learning model M in the storage unit 22. The model creation unit 235 may store the weights in a memory (not shown) that the model creation unit 235 has.

モデル作成部235は、学習用時系列データと、それに関する学習用頻度データと、を教師データとして重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて頻度データに対応する時系列データである生成時系列データを出力する機械学習モデルMを作成する。 The model creation unit 235 performs machine learning using weighting processing using learning time series data and learning frequency data related thereto as teacher data, thereby responding to the frequency data in response to input of the frequency data. A machine learning model M that outputs generated time series data that is time series data is created.

学習用時系列データが、車両Tの速度の時系列データであり、学習用頻度データが、車両Tの速度の頻度データ及び/又は加速度の頻度データであり、生成時系列データが速度の時系列データである場合、機械学習モデルMは、速度頻度データ及び/又は加速度頻度データが入力されたことに応じて車両Tの速度の時系列データである生成時系列データを出力する。 The learning time series data is the speed time series data of the vehicle T, the learning frequency data is the speed frequency data and/or the acceleration frequency data of the vehicle T, and the generated time series data is the speed time series In the case of data, the machine learning model M outputs generated time series data that is time series data of the speed of the vehicle T in response to input of the speed frequency data and/or the acceleration frequency data.

データ生成部236は、生成用頻度データ取得部233から入力された生成用頻度データを機械学習モデルMに入力することにより生成時系列データを生成する。生成用頻度データ取得部233から入力された生成用頻度データが、車両Tの速度の頻度データ及び/又は加速度の頻度データである場合、データ生成部236は、車両Tの速度の頻度データ及び/又は車両Tの加速度の頻度データを入力することにより機械学習モデルMから出力される速度の時系列データを生成時系列データとして生成する。データ生成部236により生成された生成時系列データは、データ出力部234を介して外部に出力される。 The data generation unit 236 generates generation time series data by inputting the generation frequency data inputted from the generation frequency data acquisition unit 233 into the machine learning model M. When the generation frequency data input from the generation frequency data acquisition unit 233 is speed frequency data and/or acceleration frequency data of the vehicle T, the data generation unit 236 generates the speed frequency data and/or the acceleration frequency data of the vehicle T. Alternatively, by inputting the frequency data of the acceleration of the vehicle T, the time series data of the speed output from the machine learning model M is generated as the generated time series data. The generated time series data generated by the data generation section 236 is outputted to the outside via the data output section 234.

<3>機械学習モデルMの作成方法
図5Aは、機械学習モデルMの一例として、条件付きVAEにより構成される機械学習モデルMをモデル作成部235が作成する処理の概要を示す図である。図5Bは、データ生成部236が機械学習モデルMを用いて時系列データを生成する過程を示す図である。
<3> Method for Creating Machine Learning Model M FIG. 5A is a diagram illustrating an overview of a process in which the model creation unit 235 creates a machine learning model M configured by conditional VAE as an example of the machine learning model M. FIG. 5B is a diagram showing a process in which the data generation unit 236 generates time series data using the machine learning model M.

図5に示すように、機械学習モデルMは、一例としてのディープニューラルネットワーク(DNN)により構成されている。DNNは、入力層から出力層までの間に複数の層を有しており、それぞれの層に含まれる複数のノードそれぞれに可変の重みが設けられている。機械学習モデルMが学習する前の重みは初期値となっている。 As shown in FIG. 5, the machine learning model M is configured by a deep neural network (DNN) as an example. A DNN has a plurality of layers between an input layer and an output layer, and a variable weight is provided to each of a plurality of nodes included in each layer. The weights before the machine learning model M learns are initial values.

図5Aに示すように、モデル作成部235は、入力された学習用時系列データ及び学習用頻度データのペアが入力される機械学習モデルM-1と、潜在変数ベクトルz及び学習用頻度データが入力される機械学習モデルM-2とで構成され、機械学習モデルM-2から出力される生成時系列データと、入力した学習用時系列データとを比較する。 As shown in FIG. 5A, the model creation unit 235 creates a machine learning model M-1 in which a pair of input learning time series data and learning frequency data is input, and a machine learning model M-1 in which a latent variable vector z and a learning frequency data are input. The generated time series data output from the machine learning model M-2 is compared with the input learning time series data.

モデル作成部235は、機械学習モデルM-1及び機械学習モデルM-2に学習用頻度データを入力した際に機械学習モデルM-2から出力される生成時系列データと、学習用時系列データとの差分に基づいて、機械学習モデルM-1及び機械学習モデルM-2の重みを更新する。 The model creation unit 235 generates generated time series data output from the machine learning model M-2 when the learning frequency data is input to the machine learning model M-1 and the machine learning model M-2, and the learning time series data. The weights of machine learning model M-1 and machine learning model M-2 are updated based on the difference between machine learning model M-1 and machine learning model M-2.

モデル作成部235は、例えば生成時系列データと学習用時系列データとの差が閾値以上である場合に、前記差を逆伝搬させ、逆伝搬させた経路上のノードの重みを更新する。モデル作成部235は、生成時系列データと学習用時系列データとの差が閾値未満になるまで、学習用頻度データを機械学習モデルM-1及び機械学習モデルM-2に入力したことにより生成される生成時系列データと学習用時系列データとの比較と重みの更新とを繰り返す。モデル作成部235は、多数の学習用頻度データ及び学習用時系列データのペアを用いて上記の処理を実行することにより、図5Bに示す機械学習モデルM-3(機械学習モデルM-2と実質的に同一のモデル)を作成する。 For example, when the difference between the generated time series data and the learning time series data is greater than or equal to a threshold, the model creation unit 235 back-propagates the difference and updates the weights of nodes on the back-propagated route. The model creation unit 235 generates data by inputting the learning frequency data to the machine learning model M-1 and the machine learning model M-2 until the difference between the generated time series data and the learning time series data becomes less than a threshold value. The comparison between the generated time series data and the training time series data and the updating of the weights are repeated. The model creation unit 235 executes the above processing using a large number of pairs of learning frequency data and learning time series data, thereby creating the machine learning model M-3 (machine learning model M-2 and machine learning model M-2) shown in FIG. 5B. (substantially identical models).

モデル作成部235が機械学習モデルM-1及び機械学習モデルM-2を更新して機械学習モデルM-3として完成した後には、図5Bに示すように、データ生成部236が、車両Tから取得された頻度データ(生成用頻度データ)を機械学習モデルM-3に入力することにより、機械学習モデルM-3が、入力された頻度データに対応する生成時系列データを出力する。 After the model creation unit 235 updates the machine learning model M-1 and the machine learning model M-2 and completes the machine learning model M-3, the data generation unit 236 updates the machine learning model M-1 and the machine learning model M-2 from the vehicle T as shown in FIG. By inputting the acquired frequency data (generation frequency data) to the machine learning model M-3, the machine learning model M-3 outputs generated time series data corresponding to the input frequency data.

<4>データ生成装置2における処理の流れ
図6は、データ生成装置2における処理の流れを示すフローチャートである。図6に示すフローチャートは、データ生成装置2が機械学習モデルMの作成を開始する指示を受けた時点から開始される。
<4> Flow of processing in data generation device 2 FIG. 6 is a flowchart showing the flow of processing in data generation device 2. The flowchart shown in FIG. 6 starts from the time when the data generation device 2 receives an instruction to start creating the machine learning model M.

モデル作成部235は、機械学習モデルMを作成する指示を受けると、時系列データ取得部231から学習用時系列データを取得する(ステップS11)。また、モデル作成部235は、学習用頻度データ取得部232から学習用頻度データを取得する(ステップS12)。ステップS11とステップS12を実行する順序は任意であり、モデル作成部235は、学習用時系列データと学習用頻度データとを同時に取得してもよい。モデル作成部235は、学習用時系列データと学習用頻度データのセットを教師データとして機械学習することにより機械学習モデルMを更新する(ステップS13)。具体的には、モデル作成部235は、記憶部22に記憶された機械学習モデルMの重みを更新する。 Upon receiving the instruction to create the machine learning model M, the model creation unit 235 acquires learning time series data from the time series data acquisition unit 231 (step S11). The model creation unit 235 also acquires learning frequency data from the learning frequency data acquisition unit 232 (step S12). The order in which steps S11 and S12 are executed is arbitrary, and the model creation unit 235 may acquire the learning time series data and the learning frequency data at the same time. The model creation unit 235 updates the machine learning model M by performing machine learning using a set of learning time series data and learning frequency data as teacher data (step S13). Specifically, the model creation unit 235 updates the weights of the machine learning model M stored in the storage unit 22.

モデル作成部235は、更新された機械学習モデルMの性能を評価し、評価した結果が基準レベル以上であるか否かを判定する(ステップS14)。モデル作成部235は、例えば、頻度データを機械学習モデルMに入力した際に機械学習モデルMから出力される生成時系列データと、学習用時系列データとの差分が閾値未満である場合に、評価した結果が基準レベル以上であると判定する。 The model creation unit 235 evaluates the performance of the updated machine learning model M, and determines whether the evaluated result is equal to or higher than the reference level (step S14). For example, when the difference between the generated time series data output from the machine learning model M when frequency data is input to the machine learning model M and the learning time series data is less than a threshold, the model creation unit 235 It is determined that the evaluation result is equal to or higher than the reference level.

モデル作成部235は、評価した結果が基準レベルに達していないと判定した場合(ステップS14においてNO)、ステップS11に戻り、さらなる学習用時系列データ及び学習用頻度データを用いて機械学習を繰り返す。モデル作成部235は、評価した結果が基準レベルに達していると判定した場合(ステップS14においてYES)、機械学習モデルMの更新を終了する(ステップS15)。 If the model creation unit 235 determines that the evaluated result has not reached the reference level (NO in step S14), the process returns to step S11 and repeats machine learning using further learning time series data and learning frequency data. . If the model creation unit 235 determines that the evaluated result has reached the reference level (YES in step S14), it ends the update of the machine learning model M (step S15).

その後、データ生成部236は、時系列データを生成するための生成用頻度データを取得すると(ステップS16)、生成用頻度データを機械学習モデルMに入力する(ステップS17)。データ生成部236は、機械学習モデルMから出力された生成時系列データを出力する(ステップS18)。 After that, the data generation unit 236 acquires generation frequency data for generating time series data (step S16), and inputs the generation frequency data to the machine learning model M (step S17). The data generation unit 236 outputs the generated time series data output from the machine learning model M (step S18).

<5>生成時系列データの補正
図4との対応部分に同一符号を付して示す図7は、さらに改良を加えたデータ生成装置300の構成を示すブロック図である。データ生成装置300は、モデル作成部235が頻度データ生成部301、差分算出部302及び補正部303を有することを除いて、図4のデータ生成装置2と同様の構成となっている。
<5> Correction of Generated Time Series Data FIG. 7, in which parts corresponding to those in FIG. 4 are denoted by the same reference numerals, is a block diagram showing the configuration of a further improved data generation device 300. The data generation device 300 has the same configuration as the data generation device 2 in FIG. 4, except that the model creation section 235 includes a frequency data generation section 301, a difference calculation section 302, and a correction section 303.

なお、頻度データ生成部301、差分算出部302及び補正部303は、更新を終え完成した機械学習モデルMから出力される生成時系列データを補正するためのものであり、図7の例では、これらをモデル作成部235内に設けているが、これらはモデル作成部235とデータ生成部236との間や、データ生成部236内に設けてもよい。 Note that the frequency data generation unit 301, the difference calculation unit 302, and the correction unit 303 are for correcting the generated time series data output from the updated and completed machine learning model M, and in the example of FIG. Although these are provided within the model creation section 235, they may be provided between the model creation section 235 and the data generation section 236, or within the data generation section 236.

頻度データ生成部301は、機械学習モデルMから出力される生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得る。 The frequency data generation unit 301 obtains frequency data indicating an occurrence frequency distribution regarding the generated time series data output from the machine learning model M as generation frequency data.

差分算出部302は、生成用頻度データ取得部233により得られた生成用頻度データと、頻度データ生成部301により得られた生成頻度データとの差分を算出する。 The difference calculation unit 302 calculates the difference between the generation frequency data obtained by the generation frequency data acquisition unit 233 and the generation frequency data obtained by the frequency data generation unit 301.

補正部303は、差分算出部302により算出された差分が小さくなるように、機械学習モデルMからの生成時系列データを分割して削除及び複製することで、生成時系列データを補正する。 The correction unit 303 corrects the generated time series data by dividing, deleting, and duplicating the generated time series data from the machine learning model M so that the difference calculated by the difference calculation unit 302 becomes small.

補正された生成時系列データは、データ生成部236に出力する。つまり、生成用頻度データ取得部233で得られた生成用頻度データがデータ生成部236を経由してモデル作成部235に入力され、生成用頻度データに基づく生成時系列データを機械学習モデルMから出力されると、この生成時系列データが補正部303によって補正されてデータ生成部236に出力される。 The corrected generated time series data is output to the data generation unit 236. That is, the generation frequency data obtained by the generation frequency data acquisition unit 233 is input to the model creation unit 235 via the data generation unit 236, and generated time series data based on the generation frequency data is generated from the machine learning model M. Once output, this generated time series data is corrected by the correction unit 303 and output to the data generation unit 236.

これにより、機械学習モデルMを用いて生成用頻度データから生成時系列データを得る場合に、機械学習モデルMの構造を変更しなくとも、学習用時系列データに対する生成時系列データの再現度を向上させることができるようになる。 As a result, when obtaining generated time series data from generation frequency data using machine learning model M, the reproducibility of generated time series data with respect to training time series data can be improved without changing the structure of machine learning model M. be able to improve.

次に、図8及び図9を用いて、データ生成装置300の特徴的な動作について説明する。ここでは、扱うデータが車速データである場合を例にとって説明する。 Next, characteristic operations of the data generation device 300 will be described using FIGS. 8 and 9. Here, an example will be explained in which the data to be handled is vehicle speed data.

図8は、機械学習モデルMから出力された生成時系列データ(生成車速時系列データ)の例を示す。図9は、頻度データ生成部301、差分算出部302及び補正部303の動作の説明に供する図であり、図9Aは車速別の生成用頻度データと生成頻度データとの差の様子を示す図であり、図9Bは補正前の生成車速時系列データを示す図であり、図9Cは補正後の生成車速時系列データを示す図である。 FIG. 8 shows an example of generated time series data (generated vehicle speed time series data) output from the machine learning model M. FIG. 9 is a diagram for explaining the operations of the frequency data generation unit 301, the difference calculation unit 302, and the correction unit 303, and FIG. 9A is a diagram showing the difference between the generation frequency data and the generation frequency data for each vehicle speed. FIG. 9B is a diagram showing generated vehicle speed time series data before correction, and FIG. 9C is a diagram showing generated vehicle speed time series data after correction.

図9Aの例では、車速範囲cの車速に関して、頻度データ生成部301によって生成車速時系列データから変換して得られた生成頻度データと、生成用頻度データとの差分が所定閾値以上である。具体的には、生成頻度データが生成用頻度データよりも小さく、その差が所定閾値以上である。これは生成車速時系列データ中に車速範囲cの車速データが大きく不足していることを意味するので、図9B及び図9Cに示したように、補正部303は車速範囲cの車速を含む生成分割車速時系列データを複製して補正後の生成車速時系列データを作る。 In the example of FIG. 9A, regarding the vehicle speed in the vehicle speed range c, the difference between the generation frequency data obtained by converting the generated vehicle speed time series data by the frequency data generation unit 301 and the generation frequency data is greater than or equal to a predetermined threshold value. Specifically, the generation frequency data is smaller than the generation frequency data, and the difference therebetween is greater than or equal to a predetermined threshold. This means that there is a large shortage of vehicle speed data in vehicle speed range c in the generated vehicle speed time series data, so as shown in FIGS. 9B and 9C, the correction unit 303 generates data that includes vehicle speed in vehicle speed range c. Duplicate the divided vehicle speed time series data to create corrected generated vehicle speed time series data.

一方で、図9Aの例では、車速範囲bの車速に関して、頻度データ生成部301によって生成車速時系列データから変換して得られた生成頻度データと、生成用頻度データとの差分が所定閾値以上である。具体的には、生成頻度データが生成用頻度データよりも大きく、その差が所定閾値以上である。これは生成車速時系列データ中に車速範囲bの車速データが多過ぎることを意味するので、図9B及び図9Cに示したように、補正部303は車速範囲bの車速を含む生成分割車速時系列データを削除して補正後の生成車速時系列データを作る。 On the other hand, in the example of FIG. 9A, regarding the vehicle speed in vehicle speed range b, the difference between the generation frequency data obtained by converting the generated vehicle speed time series data by the frequency data generation unit 301 and the generation frequency data is greater than or equal to the predetermined threshold value. It is. Specifically, the generation frequency data is greater than the generation frequency data, and the difference is greater than or equal to a predetermined threshold. This means that there is too much vehicle speed data in vehicle speed range b in the generated vehicle speed time series data, so as shown in FIGS. 9B and 9C, the correction unit 303 uses Delete the series data to create corrected vehicle speed time series data.

本実施の形態では、補正部303が、生成時系列データを分割して複数の生成分割時系列データとし、差分算出部302での差分を任意の分割単位あたりに算出し直した差分が所定閾値以上であるか判定し、所定閾値以上の差分の要因となる生成分割時系列データを削除又は複製することで、前記差分が所定閾値以下となるように、生成時系列データを補正している。 In this embodiment, the correction unit 303 divides the generated time series data into a plurality of generated divided time series data, and the difference calculated by the difference calculation unit 302 for each arbitrary division unit is set to a predetermined threshold value. The generated time series data is corrected so that the difference is equal to or less than the predetermined threshold by determining whether the difference is greater than or equal to the predetermined threshold and deleting or duplicating the generated divided time series data that is the cause of the difference greater than or equal to the predetermined threshold.

ここで、生成時系列データの分割単位は、図中の山型の区間であり、換言すれば、基準値から値が変動して基準値に戻るまでの区間である。図9の例では、基準値は車速0[km/h]である。 Here, the unit of division of the generated time series data is the mountain-shaped section in the figure, in other words, the section where the value fluctuates from the reference value until it returns to the reference value. In the example of FIG. 9, the reference value is a vehicle speed of 0 [km/h].

図9B及び図9Cに示したように、生成時系列データの削除及び複製を、分割単位(山単位)で行うようにしたので、削除及び複製を簡単に行うことができるようになり、削除及び複製のための処理量を抑制できる。また、削除及び処理により容易に所望の長さの補正後の生成時系列信号を得ることができる。 As shown in FIGS. 9B and 9C, the generated time series data is deleted and duplicated in division units (mountain units), so deletion and duplication can be easily performed. The amount of processing for replication can be suppressed. Further, by deletion and processing, it is possible to easily obtain a corrected generated time-series signal having a desired length.

なお、図9の例では、生成用頻度データと、生成時系列データから変換した頻度データとの差から、生成分割車速時系列データの削除及び複製を行うことで補正生成時系列データを得たが、図10に示したような処理により補正生成時系列データを得るようにしてもよい。 In the example of FIG. 9, corrected generation time series data was obtained by deleting and duplicating the generation divided vehicle speed time series data based on the difference between the frequency data for generation and the frequency data converted from the generation time series data. However, the corrected generation time series data may be obtained by processing as shown in FIG.

図10Aは生成車速時系列データを複数の生成分割車速時系列データに分割した様子を示す図であり、図10Bは図10Aの生成分割車速時系列データを組み合わせて得た補正後の生成車速時系列データを示す図である。 FIG. 10A is a diagram showing how the generated vehicle speed time series data is divided into a plurality of generated divided vehicle speed time series data, and FIG. 10B is a diagram showing the generated vehicle speed time series data after correction obtained by combining the generated divided vehicle speed time series data of FIG. 10A. FIG. 3 is a diagram showing series data.

生成用頻度データと生成頻度データとの差分が0に近づくように、図10Aに示した生成分割車速時系列データを組み合わせて、図10Bに示した補正後の生成車速時系列データを作成することで、図9の処理と同様に、生成用頻度データと生成時系列データから変換した頻度データとを精度よく一致させることができるようになる。 The generated divided vehicle speed time series data shown in FIG. 10A are combined to create the corrected generated vehicle speed time series data shown in FIG. 10B so that the difference between the generation frequency data and the generation frequency data approaches 0. As in the process of FIG. 9, it becomes possible to match the generation frequency data with the frequency data converted from the generation time series data with high precision.

なお、図9及び図10のどちらの手法を用いた場合も、多様な生成分割時系列データが存在すると、生成用頻度データにより近い補正生成頻度データを得ることができる。これを考慮して、所望の時系列の長さよりも長い時系列データを生成しておくなど種々の方法で多くの生成分割時系列データを用意することが望ましい。ただし、所望の時系列の長さと同じ又はそれよりも短い生成時系列データを得、図9及び図10で示したようにその中に含まれる生成分割時系列データを複製及び削除して補正生成時系列データを作成してもよい。 In addition, when using either method of FIG. 9 or FIG. 10, if there are various generation division time series data, it is possible to obtain corrected generation frequency data closer to the generation frequency data. Taking this into consideration, it is desirable to prepare a large amount of generated and divided time series data using various methods, such as generating time series data that is longer than the desired time series length. However, after obtaining generated time series data that is the same as or shorter than the desired time series length, as shown in Figures 9 and 10, the generated divided time series data contained therein is duplicated and deleted to generate corrected data. Time series data may also be created.

<6>まとめ
以上説明したように、本実施の形態のモデル作成装置(制御部23)は、車両Tが走行中に測定された車両Tの走行中の時系列データを学習用時系列データとして取得する学習用時系列データ取得部231と、学習用時系列データに関する発生頻度分布を示す学習用頻度データを取得する学習用頻度データ取得部232と、学習用時系列データと、それに対応する学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて生成時系列データを出力する機械学習モデルMを作成するモデル作成部235と、機械学習モデルMから出力される生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得る頻度データ生成部301と、機械学習モデルに入力した頻度データと生成頻度データとの差分を算出する差分算出部302と、前記差分が小さくなるように、生成時系列データを分割して削除及び複製することで生成時系列データを補正する補正部303と、を備える。
<6> Summary As explained above, the model creation device (control unit 23) of the present embodiment uses time-series data of the vehicle T while it is running, which is measured while the vehicle T is running, as learning time-series data. A learning time series data acquisition unit 231 acquires learning frequency data acquisition unit 231, a learning frequency data acquisition unit 232 acquires learning frequency data indicating an occurrence frequency distribution regarding the learning time series data, and the learning time series data and the learning corresponding thereto. a model creation unit that creates a machine learning model M that outputs generated time series data in response to input of the frequency data by performing machine learning using weighting processing based on differences using the usage frequency data as training data; 235, a frequency data generation unit 301 that obtains frequency data indicating an occurrence frequency distribution regarding the generated time series data outputted from the machine learning model M as generated frequency data, and a frequency data generation unit 301 that generates frequency data input to the machine learning model and generated frequency data. It includes a difference calculation unit 302 that calculates a difference, and a correction unit 303 that corrects the generated time series data by dividing, deleting, and duplicating the generated time series data so that the difference becomes small.

本実施の形態のデータ生成装置(制御部23)は、車両Tが走行中に測定された車両Tの走行中の時系列データから時系列データに関する発生頻度分布を示す頻度データを取得する頻度データ取得部233と、車両Tの走行中の学習用時系列データと、それに対応する学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより得られた機械学習モデルMに、前記頻度データを入力することにより、前記頻度データに対応する時系列データである生成時系列データを生成するデータ生成部236と、機械学習モデルMから出力される生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得る頻度データ生成部301と、前記頻度データと生成頻度データとの差分を算出する差分算出部302と、差分が小さくなるように、生成時系列データを分割して削除及び複製することで生成時系列データを補正する補正部303と、を備える。 The data generation device (control unit 23) of the present embodiment acquires frequency data indicating an occurrence frequency distribution regarding time series data from time series data during running of the vehicle T measured while the vehicle T is running. A machine learning model obtained by performing machine learning using the acquisition unit 233, learning time series data while the vehicle T is traveling, and corresponding learning frequency data as teacher data using weighting processing based on differences. A data generation unit 236 that generates generated time series data that is time series data corresponding to the frequency data by inputting the frequency data to M, and an occurrence related to the generated time series data output from the machine learning model M. A frequency data generation unit 301 that obtains frequency data indicating a frequency distribution as generated frequency data, and a difference calculation unit 302 that calculates a difference between the frequency data and the generated frequency data, generate time series data so that the difference is small. and a correction unit 303 that corrects the generated time series data by dividing, deleting, and duplicating the data.

このようにすることで、機械学習モデルを用いて頻度情報から時系列データを生成する場合に、機械学習モデルの構造を変更しなくとも、生成時系列データの再現度を向上させることができるようになる。 By doing this, when generating time series data from frequency information using a machine learning model, it is possible to improve the reproducibility of the generated time series data without changing the structure of the machine learning model. become.

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。 Although the present invention has been described above using the embodiments, the technical scope of the present invention is not limited to the scope described in the above embodiments, and various modifications and changes can be made within the scope of the gist. be. For example, all or part of the device can be functionally or physically distributed and integrated into arbitrary units. In addition, new embodiments created by arbitrary combinations of multiple embodiments are also included in the embodiments of the present invention. The effects of the new embodiment resulting from the combination have the effects of the original embodiment.

上述の実施の形態では、主に時系列データが車両Tの速度である場合について述べたが、上述したように時系列データは、これに限らず、例えば、車両Tの加速度、車両Tで使用される冷却水の温度、車両Tで使用される油の温度、車両Tのアクセル開度、車両Tの振動量など、車両Tの走行によりであり時間的に変化する種々のパラメータについての時系列データであり得る。 In the above-described embodiment, the case where the time-series data is mainly the speed of the vehicle T has been described, but as described above, the time-series data is not limited to this, and for example, the acceleration of the vehicle T, and the case where the time-series data is used in the vehicle T are described. Time series of various parameters that change over time as the vehicle T travels, such as the temperature of the cooling water used in the vehicle T, the temperature of the oil used in the vehicle T, the accelerator opening of the vehicle T, and the amount of vibration of the vehicle T. It can be data.

また、上述の実施の形態では、データ生成装置2がデータ収集装置1から時系列データ及び頻度データを取得する場合を例示したが、データ生成装置2がデータ収集装置1の機能を有しており、データ生成装置2が複数の車両Tから測定データを受信してもよい。 Further, in the above-described embodiment, the case where the data generation device 2 acquires time series data and frequency data from the data collection device 1 is illustrated, but the data generation device 2 has the function of the data collection device 1. , the data generation device 2 may receive measurement data from a plurality of vehicles T.

また、以上の説明においては、データ生成装置2として機能するコンピューターが、モデル作成装置の機能を有するとともに、生成用頻度データが入力されたことに応じて機械学習モデルMから出力された生成時系列データを出力する機能も有する場合を例示したが、データ生成装置2の構成はこれに限らない。データ生成装置2は、モデル作成装置として機能する第1コンピューターと、第1コンピューターに生成用頻度データを入力し、第1コンピューターから生成時系列データを取得する第2コンピューターとによって構成されていてもよい。 In addition, in the above description, the computer functioning as the data generation device 2 has the function of a model creation device, and also generates a generation time series output from the machine learning model M in response to input of generation frequency data. Although the case where the data generation device 2 also has the function of outputting data has been illustrated, the configuration of the data generation device 2 is not limited to this. The data generation device 2 may include a first computer that functions as a model creation device, and a second computer that inputs frequency data for generation into the first computer and acquires generated time series data from the first computer. good.

本発明は、車両走行中の車両に関する時系列データを、学習により少ないデータから再現する技術として広く用いることができる。 INDUSTRIAL APPLICATION This invention can be widely used as a technique which reproduces the time series data regarding a vehicle while the vehicle is running from a small amount of data through learning.

1 データ収集装置
2、300 データ生成装置
21 通信部
22 記憶部
23 制御部
231 時系列データ取得部
232 学習用頻度データ取得部
233 生成用頻度データ取得部
234 データ出力部
235 モデル作成部
236 データ生成部
301 頻度データ生成部
302 差分算出部
303 補正部
M 機械学習モデル
S データ生成システム
T 車両
1 Data collection device 2, 300 Data generation device 21 Communication unit 22 Storage unit 23 Control unit 231 Time series data acquisition unit 232 Learning frequency data acquisition unit 233 Generation frequency data acquisition unit 234 Data output unit 235 Model creation unit 236 Data generation Section 301 Frequency data generation section 302 Difference calculation section 303 Correction section M Machine learning model S Data generation system T Vehicle

Claims (5)

車両が走行中に測定された前記車両の走行中の時系列データを学習用時系列データとして取得する学習用時系列データ取得部と、
前記学習用時系列データに関する発生頻度分布を示す学習用頻度データを取得する学習用頻度データ取得部と、
前記学習用時系列データと、それに対応する前記学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて生成時系列データを出力する機械学習モデルを作成するモデル作成部と、
前記機械学習モデルから出力される前記生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得る頻度データ生成部と、
前記機械学習モデルに入力した頻度データと前記生成頻度データとの差分を算出する差分算出部と、
前記差分が小さくなるように、前記生成時系列データを分割して削除及び複製することで、前記生成時系列データを補正する補正部と、
を備えるモデル作成装置。
a learning time-series data acquisition unit that acquires time-series data during running of the vehicle, which is measured while the vehicle is running, as learning time-series data;
a learning frequency data acquisition unit that acquires learning frequency data indicating an occurrence frequency distribution regarding the learning time series data;
By performing machine learning using the learning time series data and the corresponding learning frequency data as teacher data using weighting processing based on the difference, time series data is generated in response to input of frequency data. a model creation unit that creates a machine learning model that outputs
a frequency data generation unit that obtains frequency data indicating an occurrence frequency distribution regarding the generated time series data output from the machine learning model as generated frequency data;
a difference calculation unit that calculates a difference between the frequency data input to the machine learning model and the generation frequency data;
a correction unit that corrects the generated time series data by dividing, deleting, and duplicating the generated time series data so that the difference is small;
A model creation device comprising:
前記補正部は、
前記生成時系列データを分割して複数の生成分割時系列データとし、
前記差分又は前記差分を任意の分割単位あたりに算出し直した差分が所定閾値以上であるか判定し、
前記所定閾値以上の差分の要因となる生成時系列データを削除又は複製することで、前記差分が前記所定閾値以下となるように、前記生成時系列データを補正する、
請求項1に記載のモデル作成装置。
The correction unit is
The generated time series data is divided into a plurality of generated divided time series data,
Determining whether the difference or the difference obtained by recalculating the difference per arbitrary division unit is greater than or equal to a predetermined threshold;
Correcting the generated time series data so that the difference becomes less than or equal to the predetermined threshold by deleting or duplicating the generated time series data that is the cause of the difference that is greater than or equal to the predetermined threshold;
The model creation device according to claim 1.
車両が走行中に測定された前記車両の走行中の時系列データから前記時系列データに関する発生頻度分布を示す頻度データを取得する頻度データ取得部と、
前記車両の走行中の学習用時系列データと、それに対応する学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより得られた機械学習モデルに、前記頻度データを入力することにより、前記頻度データに対応する時系列データである生成時系列データを生成するデータ生成部と、
前記機械学習モデルから出力される前記生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得る頻度データ生成部と、
前記機械学習モデルに入力した前記頻度データと前記生成頻度データとの差分を算出する差分算出部と、
前記差分が小さくなるように、前記生成時系列データを分割して削除及び複製することで、前記生成時系列データを補正する補正部と、
を備えるデータ生成装置。
a frequency data acquisition unit that acquires frequency data indicating an occurrence frequency distribution regarding the time series data from time series data while the vehicle is running, which is measured while the vehicle is running;
The frequency data is applied to a machine learning model obtained by performing machine learning using weighting processing based on differences using learning time series data of the vehicle while the vehicle is running and corresponding learning frequency data as teacher data. a data generation unit that generates generated time series data that is time series data corresponding to the frequency data by inputting the frequency data;
a frequency data generation unit that obtains frequency data indicating an occurrence frequency distribution regarding the generated time series data output from the machine learning model as generated frequency data;
a difference calculation unit that calculates a difference between the frequency data input to the machine learning model and the generation frequency data;
a correction unit that corrects the generated time series data by dividing, deleting, and duplicating the generated time series data so that the difference is small;
A data generation device comprising:
コンピューターが実行するモデル作成方法であって、
車両が走行中に測定された前記車両の走行中の時系列データを学習用時系列データとして取得するステップと、
前記学習用時系列データに関する発生頻度分布を示す学習用頻度データを取得するステップと、
前記学習用時系列データと、それに対応する前記学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより、頻度データが入力されたことに応じて生成時系列データを出力する機械学習モデルを作成するステップと、
前記機械学習モデルから出力される前記生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得るステップと、
前記機械学習モデルに入力した頻度データと前記生成頻度データとの差分を算出するステップと、
前記差分が小さくなるように、前記生成時系列データを分割して削除及び複製することで、前記生成時系列データを補正するステップと、
を含むモデル作成方法。
A computer-implemented model creation method, the method comprising:
a step of acquiring time-series data of the vehicle while it is running, which is measured while the vehicle is running, as time-series data for learning;
obtaining learning frequency data indicating an occurrence frequency distribution regarding the learning time series data;
By performing machine learning using the learning time series data and the corresponding learning frequency data as teacher data using weighting processing based on the difference, time series data is generated in response to input of frequency data. a step of creating a machine learning model that outputs
obtaining frequency data indicating an occurrence frequency distribution regarding the generated time series data output from the machine learning model as generated frequency data;
calculating a difference between the frequency data input to the machine learning model and the generated frequency data;
correcting the generated time series data by dividing, deleting, and duplicating the generated time series data so that the difference is small;
Model creation methods including.
コンピューターが実行するデータ生成方法であって、
車両が走行中に測定された前記車両の走行中の時系列データから前記時系列データに関する発生頻度分布を示す頻度データを取得するステップと、
前記車両の走行中の学習用時系列データと、それに対応する学習用頻度データと、を教師データとして差分に基づく重み付け処理を用いて機械学習することにより得られた機械学習モデルに、前記頻度データを入力することにより、前記頻度データに対応する時系列データである生成時系列データを生成するステップと、
前記機械学習モデルから出力される前記生成時系列データに関する発生頻度分布を示す頻度データを生成頻度データとして得るステップと、
前記機械学習モデルに入力した前記頻度データと前記生成頻度データとの差分を算出するステップと、
前記差分が小さくなるように、前記生成時系列データを分割して削除及び複製することで、前記生成時系列データを補正するステップと、
を含むデータ生成方法。
A data generation method performed by a computer, the method comprising:
acquiring frequency data indicating an occurrence frequency distribution regarding the time series data from time series data of the vehicle while the vehicle is running, which is measured while the vehicle is running;
The frequency data is applied to a machine learning model obtained by performing machine learning using weighting processing based on differences using learning time series data of the vehicle while the vehicle is running and corresponding learning frequency data as teacher data. a step of generating generated time series data that is time series data corresponding to the frequency data by inputting the frequency data;
obtaining frequency data indicating an occurrence frequency distribution regarding the generated time series data output from the machine learning model as generated frequency data;
calculating a difference between the frequency data input to the machine learning model and the generation frequency data;
correcting the generated time series data by dividing, deleting, and duplicating the generated time series data so that the difference is small;
data generation methods including;
JP2022047081A 2022-03-23 2022-03-23 Model creation device, data generation device, model creation method, and data generation method Active JP7409420B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022047081A JP7409420B2 (en) 2022-03-23 2022-03-23 Model creation device, data generation device, model creation method, and data generation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022047081A JP7409420B2 (en) 2022-03-23 2022-03-23 Model creation device, data generation device, model creation method, and data generation method

Publications (2)

Publication Number Publication Date
JP2023140983A JP2023140983A (en) 2023-10-05
JP7409420B2 true JP7409420B2 (en) 2024-01-09

Family

ID=88206553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022047081A Active JP7409420B2 (en) 2022-03-23 2022-03-23 Model creation device, data generation device, model creation method, and data generation method

Country Status (1)

Country Link
JP (1) JP7409420B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7468726B1 (en) 2023-02-16 2024-04-16 いすゞ自動車株式会社 Data generation device and data generation method

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021051637A (en) 2019-09-26 2021-04-01 いすゞ自動車株式会社 Model generation apparatus, data generation apparatus, model generation method, and data generation method
JP2021051639A (en) 2019-09-26 2021-04-01 いすゞ自動車株式会社 Model generation apparatus and model generation method
JP2021051640A (en) 2019-09-26 2021-04-01 いすゞ自動車株式会社 Model generation apparatus and model generation method
JP2021051641A (en) 2019-09-26 2021-04-01 いすゞ自動車株式会社 Model evaluation apparatus and model evaluation method
JP2021051642A (en) 2019-09-26 2021-04-01 いすゞ自動車株式会社 Model generation apparatus and model generation method
JP2021051638A (en) 2019-09-26 2021-04-01 いすゞ自動車株式会社 Model generation apparatus, data generation apparatus, model generation method, and data generation method
EP3859459A1 (en) 2020-02-03 2021-08-04 Robert Bosch GmbH A computer implemented machine learning system and a method for operating the machine learning system for determining a time series

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220036200A (en) * 2020-09-15 2022-03-22 현대자동차주식회사 Apparatus for predicting speed of vehicle and method thereof

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021051637A (en) 2019-09-26 2021-04-01 いすゞ自動車株式会社 Model generation apparatus, data generation apparatus, model generation method, and data generation method
JP2021051639A (en) 2019-09-26 2021-04-01 いすゞ自動車株式会社 Model generation apparatus and model generation method
JP2021051640A (en) 2019-09-26 2021-04-01 いすゞ自動車株式会社 Model generation apparatus and model generation method
JP2021051641A (en) 2019-09-26 2021-04-01 いすゞ自動車株式会社 Model evaluation apparatus and model evaluation method
JP2021051642A (en) 2019-09-26 2021-04-01 いすゞ自動車株式会社 Model generation apparatus and model generation method
JP2021051638A (en) 2019-09-26 2021-04-01 いすゞ自動車株式会社 Model generation apparatus, data generation apparatus, model generation method, and data generation method
EP3859459A1 (en) 2020-02-03 2021-08-04 Robert Bosch GmbH A computer implemented machine learning system and a method for operating the machine learning system for determining a time series

Also Published As

Publication number Publication date
JP2023140983A (en) 2023-10-05

Similar Documents

Publication Publication Date Title
JP7230755B2 (en) MODEL CREATED DEVICE AND MODEL CREATED METHOD
JP7230754B2 (en) MODEL CREATED DEVICE AND MODEL CREATED METHOD
JP7163893B2 (en) Model evaluation device and model evaluation method
JP7243553B2 (en) MODEL CREATION DEVICE, DATA GENERATION DEVICE, MODEL CREATION METHOD AND DATA GENERATION METHOD
JP7226226B2 (en) MODEL CREATION DEVICE, DATA GENERATION DEVICE, MODEL CREATION METHOD AND DATA GENERATION METHOD
JP7163894B2 (en) MODEL CREATED DEVICE AND MODEL CREATED METHOD
TW202139045A (en) Privacy protection-based target service model determination
JP7409420B2 (en) Model creation device, data generation device, model creation method, and data generation method
CN116244954A (en) Vehicle comfort evaluation method, device, computer equipment and storage medium
JP7444187B2 (en) Model creation device and model creation method
JP7447926B2 (en) Model creation device and model creation method
JP7447925B2 (en) Model creation device and model creation method
JP7409421B2 (en) Model creation device and model creation method
JP7400856B2 (en) Model creation device, data generation device, model creation method, and data generation method
JP7468726B1 (en) Data generation device and data generation method
JP7487759B2 (en) Model creation device, data generation device, model creation method, and data generation method
JP7400855B2 (en) Model creation device, data generation device, model creation method, and data generation method
KR20190118766A (en) Constructing method of classification restricted boltzmann machine and computer apparatus for classification restricted boltzmann machine
KR102365450B1 (en) Method and system for deep metric learning
Lamare et al. Lyapunov techniques for stabilization of switched linear systems of conservation laws
CN116783561A (en) Machine learning device
JP4186785B2 (en) Driver model construction method, operation prediction method, and operation prediction apparatus
JP2021189848A (en) Model generation apparatus and program
JP7552755B2 (en) Estimation device and estimation method
JP3679817B2 (en) Nonlinear time series data prediction method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220926

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231204

R150 Certificate of patent or registration of utility model

Ref document number: 7409420

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150