JP2016105240A - データ近似装置およびデータ近似方法 - Google Patents

データ近似装置およびデータ近似方法 Download PDF

Info

Publication number
JP2016105240A
JP2016105240A JP2014243104A JP2014243104A JP2016105240A JP 2016105240 A JP2016105240 A JP 2016105240A JP 2014243104 A JP2014243104 A JP 2014243104A JP 2014243104 A JP2014243104 A JP 2014243104A JP 2016105240 A JP2016105240 A JP 2016105240A
Authority
JP
Japan
Prior art keywords
data
series data
time
time series
dynamic system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014243104A
Other languages
English (en)
Other versions
JP6390388B2 (ja
Inventor
亮 根山
Akira Neyama
亮 根山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2014243104A priority Critical patent/JP6390388B2/ja
Publication of JP2016105240A publication Critical patent/JP2016105240A/ja
Application granted granted Critical
Publication of JP6390388B2 publication Critical patent/JP6390388B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】時系列データを近似するデータ近似装置であって、対象の時系列データの特性を精度よく表した情報を生成するデータ近似装置を提供する。【解決手段】複数の値からなる時系列データが含まれるクラスタを近似するデータとして、当該時系列データを表す線形動的システムの係数と、1つ以上の時点における基準値とを出力するデータ近似装置であって、クラスタに含まれる1つ以上の時系列データを取得するデータ取得手段と、前記時系列データを近似する線形動的システムの係数を算出する第一の算出手段と、前記線形動的システムを用いて前記時系列データを近似する際に用いられる、時刻と値とからなる1つ以上の基準値を決定する第二の算出手段と、前記線形動的システムと、前記1つ以上の基準値とを関連付けて、対象の時系列データを表現するパラメータとして出力する出力手段と、を有する。【選択図】図1

Description

本発明は、時系列形式のデータを近似する装置に関する。
近年、自動車には様々なセンサが搭載され、速度、前後加速度、操舵角、ヨーレート、左右加速度など、車両の走行に関する様々な情報を取得することができるようになってきている。また、これらの情報をビッグデータとして収集し、様々な分野の研究に役立てることが期待されている。
車両から取得したデータを収集し、解析することを考えた場合、データ量の圧縮が課題となる。走行中の車両から発生する全てのデータを無加工でそのまま保持することは、容量的に現実的ではないためである。
この問題に関連する発明として、例えば、特許文献1に記載の関数近似装置がある。当該装置は、入力データを単位時間に分割してクラスタリングを行い、作成されたクラスタごとに近似式を求めるという特徴を有している。入力データ(車両に適用した場合、車両から取得したセンサデータ)を、類似したもの同士に分類し、近似式に変換することで、生のデータを保持する場合と比べて、容量を大きく圧縮することができる。
特開平7−065168号公報
一方、特許文献1に記載されたような方法によって求めた近似式は、あくまで値の変化を近似するものであるため、時間の経過とともに元データに対する誤差が大きくなるという課題がある。誤差を小さくするためには、入力データを分割する単位を小さくすればよいが、単位を小さくしすぎると、クラスタごとの特徴が失われてしまい、データ圧縮効果が薄れてしまう。
本発明は上記の課題を考慮してなされたものであり、時系列データを近似するデータ近似装置であって、対象の時系列データの特性を精度よく表した情報を生成するデータ近似装置を提供することを目的とする。
上記課題を解決するため、本発明に係るデータ近似装置は、
複数の値からなる時系列データが含まれるクラスタを近似するデータとして、当該時系列データを表す線形動的システムの係数と、1つ以上の時点における基準値とを出力するデータ近似装置であって、クラスタに含まれる1つ以上の時系列データを取得するデータ取得手段と、前記時系列データを近似する線形動的システムの係数を算出する第一の算出手段と、前記線形動的システムを用いて前記時系列データを近似する際に用いられる、時刻と値とからなる1つ以上の基準値を決定する第二の算出手段と、前記線形動的システムと、前記1つ以上の基準値とを関連付けて、対象の時系列データを表現するパラメータとして出力する出力手段と、を有することを特徴とする。
本発明に係るデータ近似装置は、クラスタに含まれる時系列データを近似するための情
報を出力する装置である。
近似対象となるクラスタは、時系列で発生するデータ(時系列データ)を一つ以上含むものであれば、どのようなものであってもよい。例えば、車両に搭載されたセンサが周期的に出力する値からなる時系列データの集合などであってもよい。
なお、対象のクラスタに時系列データが複数含まれる場合、いずれかの時系列データを近似してもよいし、当該複数の時系列データを代表する時系列データ(例えば窓内の相対時刻ごとの平均値や中央値の集合)を近似してもよい。当該複数の時系列データを代表する時系列データも、当該クラスタに含まれる時系列データとして扱うことができる。
第一の算出手段は、対象のクラスタを近似、すなわち、当該クラスタに含まれるいずれかの時系列データを近似するための線形動的システムを算出する手段である。線形動的システムは、時間の経過と共に状態が変化するシステムであって、ある時刻における状態を用いて、他の時刻における状態を表すことができるシステムである。
第二の算出手段は、線形動的システムを用いて、クラスタに含まれる時系列データを近似するための基準値を決定する手段である。第一の算出手段が算出した線形動的システムは、隣接するタイムステップからの変化量を数式によって表すものである。よって、時系列データを近似するためには、基準となる値を与える必要がある。第二の算出手段が決定した基準値を、第一の算出手段が算出した線形動的システムに適用することで、時系列データの近似が可能になる。
本発明に係るデータ近似装置は、時系列データに対応する線形動的システムに、当該時系列データに対応する1つ以上の基準値を関連付けて出力する。これにより、単一の近似式を用いて元の時系列データを近似する場合と比較して、近似の精度をより向上させることができる。
また、前記第二の算出手段は、仮に決定した1つ以上の基準値を始点として対象の線形動的システムを適用し、前記時系列データを近似する近似データを生成する手段と、前記近似データの、前記時系列データに対する近似誤差を取得し、当該近似誤差に基づいて、前記仮に決定した基準値を、出力する基準値として決定する手段と、からなることを特徴としてもよい。
線形動的システムを用いて時系列データを近似する場合、基準値の取り方によって近似誤差が大きく変化する。そこで、基準値を仮に置いて近似データを生成し、得られた近似誤差に基づいて、出力する基準値を決定する。これにより、より精度のよい近似が可能となる。
また、前記時系列データは、n個のタイムステップからなり、前記第二の算出手段は、前記時系列データが有する前記n個のタイムステップの中から、時刻と値の組み合わせを仮にm個選択し、前記近似誤差が最小となる組み合わせを探索することで、出力する基準値を決定し、かつ、前記mは、前記近似誤差が所定の閾値を下回る最小値であることを特徴としてもよい。
基準値は、その取り方によって近似の精度が大きく変動する。そこで、m個の基準値が取る組み合わせの候補を生成したうえで、実際に近似を行った際の誤差が最小になるような組み合わせを探索する。これにより、近似精度を最大限に高めることができる。
また、mの数は、実際に近似を行った際の誤差が所定の閾値を下回る最少の数とする。これにより、近似精度とデータ量とのバランスを取ることができる。
また、前記近似誤差は、前記時系列データが有する値と、前記近似データが有する値との差を、1つ以上の時点において取得した場合における、当該差の絶対値の、合計、平均
、二乗和のうちのいずれかであることを特徴としてもよい。
近似誤差は、ある時刻における近似値(すなわち、基準値に線形動的システムを適用した結果得られる近似値)と、当該時点における前記時系列データが有する値との誤差(差の絶対値)の合計、平均、二乗和などによって得ることができる。
また、前記時系列データを構成する複数の値は、それぞれ複数次元のベクトルであることを特徴としてもよい。例えば、時系列データが、車両から取得したセンサデータである場合、速度、前後加速度、操舵角、ヨーレート、左右加速度などを含む、複数次元のベクトルとすることができる。
また、本発明に係るデータ近似装置は、前記データ取得手段が取得した複数の時系列データをクラスタリングするクラスタリング手段をさらに有し、前記第一および第二の算出手段は、同じクラスタに分類された複数の時系列データに対して処理を行い、前記線形動的システムおよび前記基準値は、それぞれ対応するクラスタに関連付けられることを特徴としてもよい。
このように、クラスタに含まれる時系列データは、クラスタリングによって分類された、互いに類似する時系列データであることが好ましい。
また、本発明に係るデータ近似装置は、クラスタリングによって生成された複数のクラスタのうち、類似するクラスタ同士を結合する結合手段をさらに有することを特徴としてもよい。
類似するクラスタ同士を結合することで、生成されるデータの量をさらに圧縮することができる。例えば、階層的手法によってクラスタを生成した場合、下位層のクラスタ同士を、類似するクラスタとして結合することができる。また、分割最適化手法によってクラスタを生成した場合、クラスタ同士の距離などによって類似度を判定したうえで、結合することができる。
また、前記結合手段がクラスタを結合した際に、前記第一の算出手段は、結合後のクラスタに属する時系列データを用いて線形動的システムを再算出し、前記出力手段は、再算出された線形動的システムと、結合前の各クラスタにそれぞれ対応する基準値とを関連付けて出力することを特徴としてもよい。
クラスタが結合された場合、各クラスタに対応付いた線形動的システムも共通化することができる。しかし、このような手法を用いると、近似精度の低下が発生してしまう。そこで、本発明では、クラスタを結合した際に、線形動的システムのみ共通化し、各クラスタに属する基準値はそのまま各クラスタに関連付けたままで保持する。このようにすることで、クラスタを結合することによる近似精度の低下を最小限に抑えることができる。
また、前記第一の算出手段は、対象の時系列データが有する値と、線形動的システムによって表された近似値との誤差の二乗和が最小となるように、前記線形動的システムの係数を決定することを特徴としてもよい。
線形動的システムは、最小二乗法によって好適に求めることができる。すなわち、近似対象の時系列データが有する値と、近似された値との誤差の二乗和が最小となるようなパラメータを求めればよい。
また、前記時系列データは、車両の速度、前後加速度、操舵角、ヨーレート、左右加速
度のうち少なくとも一つ以上であることを特徴としてもよい。
本発明に係るデータ近似装置は、車両から発生したセンサデータを近似する装置に好適に適用することができる。
なお、本発明は、上記手段の少なくとも一部を含むデータ近似装置として特定することができる。また、前記データ近似装置が行うデータ近似方法として特定することもできる。また、前記データ近似装置と、センサ情報を当該データ近似装置に送信する車両からなる車両挙動分類システムとして特定することもできる。上記処理や手段は、技術的な矛盾が生じない限りにおいて、自由に組み合わせて実施することができる。
本発明によれば、時系列データを近似するデータ近似装置であって、対象の時系列データの特性を精度よく表した情報を生成するデータ近似装置を提供することができる。
第一の実施形態に係る車両挙動分類システムのシステム構成図である。 センサ情報取得部が取得する時系列データを説明する図である。 車両挙動記号の生成を説明する図である。 クラスタに含まれる時系列データを説明する図である。 近似誤差を説明する図である。 第一の実施形態における、第二の処理のフローチャート図である。 第二の実施形態に係る分類装置のシステム構成図である。 第二の実施形態における、第三の処理のフローチャート図である。 第二の実施形態において、クラスタを結合する例である。
(第一の実施形態)
<システム構成>
以下、本発明の好ましい実施形態について図面を参照しながら説明する。
第一の実施形態に係る車両挙動分類システムは、車両に搭載された車載装置10と、分類装置20からなるシステムであって、車載装置から送信された情報に基づいて、車両の挙動を分類し、蓄積するシステムである。
図1は、本実施形態に係る車載装置10および分類装置20のシステム構成図である。
まず、車載装置10について説明する。車載装置10は、自装置が搭載された車両の挙動についての情報を分類装置20に送信する装置である。車載装置10は、センサ情報取得部11と、通信部12から構成される。
センサ情報取得部11は、車両に搭載された複数のセンサから値(以下、センサ値)を取得する手段である。車両に搭載されたセンサとは、当該車両の挙動を表す値を取得するセンサであり、例えば、速度センサ、加速度センサ、ヨーレートセンサ、操舵角センサなどであるが、これに限定されない。センサ値は、所定の時間ごとに、後述の通信部12を介して、時系列のデータとして分類装置20に送信される。以降、センサ情報取得部11から送信されるデータをセンサ情報と称し、特に、時系列順に発生した複数のセンサ値からなるデータを時系列データと称する。
通信部12は、センサ情報取得部11によって取得されたセンサ情報を、分類装置20に送信する手段である。無線通信によって情報を送受信することができれば、使用するプロトコルおよび通信方法は特に限定されない。
次に、分類装置20について説明する。分類装置20は、車載装置10から送信されたデータを受信し、蓄積する装置である。また、データを蓄積する際には、本明細書に開示する方法によって、データの圧縮を行う。
分類装置20は、通信部21、クラスタ生成部22、近似式生成部23、記憶部24から構成される。
通信部21は、車載装置10から送信されたセンサ情報を受信する手段である。使用するプロトコルおよび通信方法は通信部12と同様である。
クラスタ生成部22は、車両から取得した時系列データを用いて、単位時間ごとの車両の挙動を表す記号を生成する手段である。車両の挙動を記号化したものを、車両挙動記号と称する。本実施形態では、車両から取得し、蓄積された時系列データを、単位時間ごとに分割してクラスタリングを行うことで、車両挙動記号を生成する。クラスタリングの結果は、後述する記憶部24に記憶される。なお、クラスタリングの具体的な例については後述する。
近似式生成部23は、クラスタ生成部22が生成したクラスタに対応する近似式を生成する手段である。具体的には、クラスタごとに、関連付いた時系列データを近似する線形動的システムを生成する。生成された線形動的システムは、クラスタと関連付けられて後述する記憶部24に記憶される。なお、線形動的システムの詳細と、線形動的システムを生成する方法については後述する。
記憶部24は、取得した時系列データ、車両挙動記号(クラスタ)、線形動的システムなどが格納される不揮発性の記憶媒体である。記憶部24には、高速に読み書きでき、かつ、大容量な記憶媒体を用いることが好ましい。例えば、フラッシュメモリなどを好適に用いることができる。
以上に説明した各手段の制御は、制御プログラムをCPUなどの処理装置(不図示)が実行することによって実現される。また、当該機能は、FPGA(Field-programmable Gate Array)やASIC(Application Specific Integrated Circuit)などによって実現されてもよいし、これらの組み合わせによって実現されてもよい。
<処理の概要>
本実施形態に係る分類装置20が行う処理は、主に、車載装置から時系列データを収集して蓄積する処理(第一の処理)と、蓄積された時系列データをクラスタリングし、生成したクラスタを数式によって近似する処理(第二の処理)の二つに分けられる。各処理の概要について説明する。
まず、第一の処理について、車載装置10から送信されるデータを説明する図である図2を参照しながら説明する。
<<センサ情報の送信処理>>
センサ情報取得部11は、車両が有する複数のセンサ(不図示)から、所定のサンプリングレート(例えば10Hz)でセンサ値を取得する。なお、センサ値は、目標のサンプリングレートよりも高いサンプリングレートで取得したのち、フィルタによって平滑化したものであってもよい。例えば、100Hzでサンプリングを行ったのち、ガウシアンフィルタ等によって10Hzにダウンサンプルしてもよい。
なお、本例では、操舵角、速度、前後加速度の三つのセンサを用いる。すなわち、3つのセンサそれぞれについて、毎秒10個のセンサ値が得られるため、1秒あたり30個の
センサ値が時系列データとして分類装置20に送信される(符号201)。なお、送信の周期は必ずしも固定でなくてもよく、送信の単位も必ずしも固定でなくてもよい。
分類装置20は、通信部21を介して車両から時系列データを受信すると、記憶部24に逐次記憶する。本例ではセンサが3つであるため、時系列データは、3次元のベクトルとして記憶される。
<<クラスタリング処理>>
次に、分類装置20が行う第二の処理について説明する。第二の処理は、時系列データをクラスタリングする処理と、クラスタごとに線形動的システムを生成する処理に分けられる。まず、クラスタ生成部22が行うクラスタリング処理について、図3を参照しながら説明する。
車両挙動記号は、単位時間(例えば5秒間)における車両の挙動を表す記号である。車両挙動記号は、車両で生成された時系列データ(単位時間分の情報を持つ3次元のベクトル)を単位時間に分割し、分割されたデータをクラスタリングすることで得ることができる。この結果、符号301で示したような、車両挙動記号の列が得られる。符号301は、80秒(5秒×16個)分の車両挙動記号を表している。なお、クラスタリングは、例えば、K平均法(K-means)や、スペクトラルクラスタリングなど、任意の手法を用いる
ことができる。また、時系列データを入力として、分類結果を得ることができれば、他の手法を用いて分類を行ってもよい。また、分類とクラスタリングの組み合わせを用いてもよい。例えば、サポートベクタマシン(SVM)で処理した余りをK-meansによって処理
するようにしてもよい。
なお、図3では、一台の車両から取得した時系列データを示したが、クラスタリングは、複数台の車両から取得した時系列データを用いて行ってもよい。また、図3では、時系列データを5秒ごとに分割したが、単位時間は5秒以外であってもよい。また、分割後のデータは、一部が重なり合っていてもよい。
生成されたクラスタについての情報は、記憶部24に一時的に記憶される。
<<線形動的システムの生成>>
次に、生成されたクラスタに対応する線形動的システムを生成する処理について説明する。図4は、クラスタ生成部22によって生成されたあるクラスタに属する、複数の時系列データを表す図である。本例では、単位時間が5秒であり、センサ値のサンプリングレートが10Hzであるため、各時系列データには、それぞれ50個のセンサ値が含まれる。
ここでは、符号401〜403によって表された3つの時系列データが、当該クラスタに分類されたものとする。なお、時系列データは、複数の次元を持つベクトルであるが、図4では、説明を簡単にするために一つの次元のみを示している。
ここでは、これらの時系列データを近似するための線形動的システムを生成する。なお、一つのクラスタに複数の時系列データが割り当たっている場合、例えば、当該複数の時系列データを時刻順に連結して、近似対象の時系列データとしてもよい。また、当該複数の時系列データを代表する新たな時系列データを生成して、近似対象の時系列データとしてもよい。例えば、符号401〜403の3つの時系列データの平均値や中央値を時刻ごとに求め、新規の時系列データを生成してもよい。このようにして求めた時系列データも、対象のクラスタに属する時系列データとして扱うことができる。
線形動的システムは、例えば、式(1)で表される。式(1)中、xtは時刻tにおけ
るシステムの状態(すなわち、センサ値の集合を表す多次元ベクトル)であり、xt-1
時刻t−1におけるシステムの状態である。また、Aおよびbは、時刻の経過に伴う状態
変化を表すパラメータである。また、vtはノイズに起因する誤差を表す項である。パラ
メータAおよびbは行列で表され、多次元ベクトルに対する演算を行うことができる。
Figure 2016105240
ある時系列データを近似する線形動的システムを求める方法として、最小二乗法がある。
具体的には、対象の時系列データが持つ値と、近似値との差の二乗和が最小となるように、線形動的システムのパラメータAおよびbを決定する。
<<パラメータ決定方法>>
パラメータAおよびbを求める具体的な方法について説明する。
まず、対象の時系列データに基づいて、入力ベクトルおよび出力ベクトルをタイムステップ(センサ値の取得間隔。本実施形態では0.1秒)ごとに生成する。入力ベクトルとは、時刻t−1におけるセンサ値を表すベクトルであり、出力ベクトルとは、時刻tにおけるセンサ値を表すベクトルである。式(2)が入力ベクトルであり、式(3)が出力ベクトルである。なお、nは次元数である。センサが3種類である場合、n=3となる。
Figure 2016105240
入力ベクトルおよび出力ベクトルは、2≦t≦Tの範囲で生成される。Tは、対象のクラスタに含まれるタイムステップの数(すなわち、センサ値の数)である。
次に、入力ベクトルおよび出力ベクトルから、平均を求める。平均値は、式(4)および式(5)によって求めることができる。
Figure 2016105240
そして、入力ベクトルおよび出力ベクトルから平均を減算することで、各ベクトルを正規化する。正規化した結果は、式(6)および式(7)で表される。
Figure 2016105240
次に、式(8)で表せられる入力行列と、式(9)で表せられる出力行列を生成する。
Figure 2016105240
最終的に、式(10)によってパラメータAを、式(11)によってパラメータbを求める。なお、X-1は、Xの逆行列を表す。
Figure 2016105240
Figure 2016105240
以上の説明によって生成した線形動的システムは、ある時点からのセンサ値の変化量を表したものである。すなわち、センサ値を近似するためには、基準となるセンサ値を最低ひとつ与えなければならない。そこで、本実施形態では、近似式生成部23が、基準となるセンサ値を選択し、クラスタと関連付けて記憶する。以降の説明では、近似式生成部23が選択した、基準となるセンサ値を基準値と称する。
基準値の具体的な選択方法は、後述するフローチャートにて説明する。
基準値をクラスタ(すなわち線形動的システム)と関連付けることの効果について、図5を参照して説明する。
符号501は、近似対象の時系列データであり、符号502は、線形動的システムによって近似した時系列データ(以下、近似データ)である。また、図中の黒丸は基準となるセンサ値、すなわち基準値である。
なお、実際の基準値の数は図示したものよりも多いが、説明を簡単にするため、ここでは基準値が一つおよび二つであるものとして説明する。
図5(A)は、基準値が一つである場合の例である。本例の場合、図からもわかるように、時間の経過とともに誤差が累積するため、タイムスロットの後半になると近似精度が落ちてしまう。
図5(B)は、基準値が二つである場合の例である。本例の場合、二つ目の基準値によって近似値を補正することができる。このように、基準値が複数個ある場合、値を適宜補正することができるため、同一の線形動的システムを用いた場合であっても、近似精度を高めることができる。
このように、本実施形態に係る分類装置は、第一に、線形動的システムによって、クラスタに属する時系列データを近似し、第二に、基準値をクラスタと関連付け、クラスタの特徴を表す情報として記憶する。このようにすることで、クラスタの持つ特徴を小さいデータ量、かつ、高い精度で表せるようになる。
<処理フローチャート>
次に、基準値の個数および配置位置を決定する方法について、第二の処理のフローチャートである図6を参照しながら説明する。なお、第一の処理は、時系列データを車載装置から周期的に受信して記憶部24に蓄積する処理であるため、説明は省略する。
図6に示した処理は、記憶部24に時系列データが蓄積されている状態において、任意のタイミングで実行される。なお、ステップS11〜S12が、クラスタ生成部22が行
う処理であり、ステップS13以降が、近似式生成部23が行う処理である。
まず、ステップS11で、記憶部24に記憶された全ての時系列データを取得する。
次に、ステップS12で、取得した時系列データを単位時間に分割し、特徴量ベクトルに変換したうえでクラスタリングを行う。
ステップS13〜S19の処理は、生成されたクラスタのそれぞれに対して、線形動的システムと、基準値を対応付ける処理である。
ステップS13では、全てのクラスタに対して処理が完了しているかを判定し、完了していない場合、処理をステップS14へ遷移させる。
ステップS14では、処理対象のクラスタを決定したうえで、前述した方法で、当該クラスタに対応する線形動的システムを求める。
ステップS15では、変数(Nおよびεの二種類)に初期値を設定する。なお、Nは、処理対象のクラスタに関連付ける基準値の個数を表す変数であり、初期値は1である。また、εは、誤差を表す変数であり、初期値は十分に大きな自然数である。
ステップS16では、誤差εが所定の閾値Eよりも小さいか否かを判定する。誤差が閾値Eよりも大きい場合、処理をステップS17へ遷移させる。
ステップS17〜S19は、基準値の個数がN個である場合における、基準値の最適な配置を探索するステップである。具体的には、対象のクラスタがn個のタイムステップを有していた場合、n個ある時刻とセンサ値の組み合わせの中から、N個を抽出し、仮の基準値として線形動的システムを適用して近似データを生成し、近似対象の時系列データとの誤差を算出する。これを、基準値の配置を変えながら全パターン(すなわち、nN個)について行い、誤差が最小となる組み合わせを探索する。
ステップS17では、N個の基準値の組み合わせについて、全パターンの検討が完了したかを判定し、完了していない場合、処理をステップS18へ遷移させる。
ステップS18では、未検討の基準値の組み合わせを仮に選択し、ステップS14で求めた線形動的システムを、仮に選択した基準値に適用して、近似データを得る。そして、当該近似データと、時系列データとの誤差の平均値εを求める。ここで求めたεは、例えば、図5(B)における、実線と点線との乖離量の平均値である。ここで、εがεよりも小さい場合、ステップS19でεを更新し、処理をステップS17へ遷移させる。
なお、誤差を求める際は、値の正規化を行ってもよい。また、誤差の平均ではなく、誤差の合計や二乗和などを用いてもよい。
この処理を、N個の基準値がとりうる組み合わせの数だけ繰り返すと、N個の基準値を用いる場合における、誤差の平均が最も小さくなる基準値の組み合わせを特定することができる。
N個の基準値がとりうる組み合わせが全て検討された場合(ステップS17−Yes)、Nをインクリメントし、処理をステップS16へ遷移させる。ここで、誤差εが所定の閾値Eよりも小さくなった場合、ステップS20で、線形動的システムと、ステップS18で仮に選択したN個の基準値を、処理対象のクラスタと関連付けて記憶部24に記憶させる。この際、元の時系列データは削除する。
以上に説明した処理は、クラスタの数だけ繰り返し実行される。最終的に、ステップS13にて、全てのクラスタに対する処理が完了したと判断されると、処理は終了する。
このように、本実施形態に係る分類装置は、元の時系列データを近似するための線形動的システムを求めたうえで、近似誤差が条件を満たすような基準値の組み合わせを探索し、当該基準値を関連付けて記憶する。これにより、生の時系列データをそのまま記憶する場合と比較して、データ量を大きく圧縮することができる。また、単一の近似式を記憶する場合と比較して、近似精度を向上させることができる。
なお、本実施形態では、生成した線形動的システムと基準値を記憶部に蓄積する例を挙げたが、線形動的システムと基準値は外部に出力してもよい。また、蓄積された情報に基づいて実際に値の近似を行い、結果を外部に出力するようにしてもよい。
(第二の実施形態)
第二の実施形態は、生成したクラスタのうち、類似するクラスタ同士を結合することで、データの圧縮率をさらに向上させる実施形態である。
図7は、第二の実施形態に係る分類装置30のシステム構成図である。第二の実施形態に係る分類装置30は、クラスタ結合部35を有しているという点において、第一の実施形態と相違する。その他の手段については第一の実施形態と同様であるため、説明は省略する。また、分類装置30と通信を行う車載装置10についても、第一の実施形態と同様であるため、説明は省略する。
第二の実施形態では、クラスタ結合部35が、第二の処理を終えた後に、生成済みのクラスタを結合することで更にデータ圧縮を行う処理(第三の処理)を実行する。
図8は、クラスタ結合部35が行う第三の処理のフローチャートである。当該処理は、図6に示した処理が完了した後で実行される。
まず、ステップS31で、分類された複数のクラスタのうち、最も類似するクラスタ同士を仮に結合し、各クラスタに含まれる時系列データを用いて、ステップS14と同様の処理によって、線形動的システムを求め直す。例えば、結合前のクラスタに含まれる各時系列データを代表する新たな時系列データを生成して、近似対象の時系列データとし、線形動的システムを求める。
なお、最も類似するクラスタは、例えば、クラスタリングに階層的手法を用いている場合、階層に基づいて決定してもよいし、分割最適化手法を用いている場合、クラスタ間の距離に基づいて決定してもよい。また、その他の手法を用いて決定してもよい。また、類似度に閾値を設定し、ある程度類似したクラスタ同士に対してのみ処理を行ってもよい。
次に、ステップS32で、結合対象の各クラスタに関連付いた基準値と、ステップS31で求め直した線形動的システムとを用いて、ステップS18と同様の処理によって、誤差をクラスタごとに求め、当該誤差の平均値εを算出する。ここで算出した誤差が十分小さければ、線形動的システムを共通化しても近似誤差が大きくならないことがわかる。
次に、ステップS33で、誤差平均εが閾値Eを上回っているか否かを判定する。ここで、εが閾値Eを上回っていなければ、処理をステップS34へ遷移させ、対象のクラスタを正式に結合する。具体的には、ステップS31で求めた線形動的システムを、結合後のクラスタに関連付けて記憶部24に記憶させる。この際、結合前のクラスタについては、サブクラスタとして、結合後のクラスタに含ませる。そして、結合前のクラスタにそれぞれ関連付いていた基準値については、結合前のクラスタ(サブクラスタ)に関連付いた状態のままで、そのまま保持する。
図9は、クラスタを結合した例である。図9(A)が結合前の状態を表し、図9(B)が結合後の状態を表す。本例では、クラスタAとクラスタBを含むクラスタCが生成され、クラスタAおよびBは、クラスタCに含まれるサブクラスタとなる。
ステップS33で、誤差平均εが閾値Eを上回っていた場合、対象のクラスタについては、結合が不可能であると判定し、仮に結合させたクラスタを元に戻す。すなわち、記憶部24に記憶されている情報が維持される。
以上の処理は、全てのクラスタについて処理が完了するまで繰り返し実行される(ステップS35)。
以上説明したように、第二の実施形態では、誤差が許容値を満たす範囲で、類似するクラスタ同士を結合し、線形動的システムを共通化することでデータ量をさらに圧縮する。一方、各クラスタに関連付いた基準値については共通化を行わず、そのままで保持する。これにより、近似精度を大きく悪化させることなく、さらなるデータ量の圧縮を実現することができる。
(変形例)
上記の実施形態はあくまでも一例であって、本発明はその要旨を逸脱しない範囲内で適宜変更して実施しうる。
例えば、実施形態の説明では、線形動的システムとして、あるタイムステップにおける状態を、一つ前のタイムステップにおける状態を用いて表したもの(前方向近似)を例示したが、これ以外のものを用いてもよい。例えば、あるタイムステップにおける状態を、一つ後のタイムステップにおける状態を用いて表してもよい(後方向近似)。また、あるタイムステップにおける状態を、前後双方の隣接する各タイムステップにおける状態を用いて表してもよい。
また、実施形態の説明では、車載装置10から無線通信によって周期的にセンサ情報を送信する例を挙げたが、センサ情報は、どのような方法で送信されてもよい。例えば、トリップが完了するごとに送信するようにしてもよいし、所定のスケジュールに従って送信するようにしてもよい。また、センサ情報は、必ずしも無線で送信しなくてもよく、オフラインでやり取りするようにしてもよい。
また、実施形態の説明では、センサによって取得できる情報として速度、前後加速度、操舵角、ヨーレート、左右加速度を例示したが、車両の走行状態を表すものであれば、例示したもの以外を用いてもよい。また、処理対象のデータは、時系列のデータであれば、センサによって取得されたものでなくてもよく、車両以外から取得したものであってもよい。
また、実施形態の説明では、車両から取得したセンサ情報をクラスタリングする例を挙げたが、必ずしもクラスタリングを行う必要はなく、時系列データは、必ずしもセンサ情報である必要はない。1つ以上の任意の時系列データに対してそのまま処理を行っても、発明の目的を達成することができる。
10 車載装置
11 センサ情報取得部
12 通信部
20 分類装置
21 通信部
22 クラスタ生成部
23 近似式生成部
24 記憶部

Claims (13)

  1. 複数の値からなる時系列データが含まれるクラスタを近似するデータとして、当該時系列データを表す線形動的システムの係数と、1つ以上の時点における基準値とを出力するデータ近似装置であって、
    クラスタに含まれる1つ以上の時系列データを取得するデータ取得手段と、
    前記時系列データを近似する線形動的システムの係数を算出する第一の算出手段と、
    前記線形動的システムを用いて前記時系列データを近似する際に用いられる、時刻と値とからなる1つ以上の基準値を決定する第二の算出手段と、
    前記線形動的システムと、前記1つ以上の基準値とを関連付けて、対象の時系列データを表現するパラメータとして出力する出力手段と、
    を有する、データ近似装置。
  2. 前記第二の算出手段は、
    仮に決定した1つ以上の基準値を始点として対象の線形動的システムを適用し、前記時系列データを近似する近似データを生成する手段と、
    前記近似データの、前記時系列データに対する近似誤差を取得し、当該近似誤差に基づいて、前記仮に決定した基準値を、出力する基準値として決定する手段と、からなる、
    請求項1に記載のデータ近似装置。
  3. 前記時系列データは、n個のタイムステップからなり、
    前記第二の算出手段は、前記時系列データが有する前記n個のタイムステップの中から、時刻と値の組み合わせを仮にm個選択し、前記近似誤差が最小となる組み合わせを探索することで、出力する基準値を決定し、かつ、前記mは、前記近似誤差が所定の閾値を下回る最小値である、
    請求項2に記載のデータ近似装置。
  4. 前記近似誤差は、前記時系列データが有する値と、前記近似データが有する値との差を、1つ以上の時点において取得した場合における、当該差の絶対値の、合計、平均、二乗和のうちのいずれかである、
    請求項3に記載のデータ近似装置。
  5. 前記時系列データを構成する複数の値は、それぞれ複数次元のベクトルである、
    請求項1から4のいずれかに記載のデータ近似装置。
  6. 前記データ取得手段が取得した複数の時系列データをクラスタリングするクラスタリング手段をさらに有し、
    前記第一および第二の算出手段は、同じクラスタに分類された複数の時系列データに対して処理を行い、
    前記線形動的システムおよび前記基準値は、それぞれ対応するクラスタに関連付けられる、
    請求項1から5のいずれかに記載のデータ近似装置。
  7. クラスタリングによって生成された複数のクラスタのうち、類似するクラスタ同士を結合する結合手段をさらに有する、
    請求項6に記載のデータ近似装置。
  8. 前記結合手段がクラスタを結合した際に、
    前記第一の算出手段は、結合後のクラスタに属する時系列データを用いて線形動的システムを再算出し、
    前記出力手段は、再算出された線形動的システムと、結合前の各クラスタにそれぞれ対応する基準値とを関連付けて出力する、
    請求項7に記載のデータ近似装置。
  9. 前記第一の算出手段は、対象の時系列データが有する値と、線形動的システムによって表された近似値との誤差の二乗和が最小となるように、前記線形動的システムの係数を決定する、
    請求項1から8のいずれかに記載のデータ近似装置。
  10. 前記時系列データは、車両の速度、前後加速度、操舵角、ヨーレート、左右加速度のうち少なくとも一つ以上である、
    請求項1から9のいずれかに記載のデータ近似装置。
  11. 複数のセンサを有し、取得したセンサ情報を時系列データとして送信する車両と、
    請求項1から10のいずれかに記載のデータ近似装置と、
    からなる、車両挙動分類システム。
  12. 複数の値からなる時系列データが含まれるクラスタを近似するデータとして、当該時系列データを表す線形動的システムの係数と、1つ以上の時点における基準値とを出力するデータ近似装置が行うデータ近似方法であって、
    クラスタに含まれる1つ以上の時系列データを取得するデータ取得ステップと、
    前記時系列データを近似する線形動的システムの係数を算出する第一の算出ステップと、
    前記線形動的システムを用いて前記時系列データを近似する際に用いられる、時刻と値とからなる1つ以上の基準値を決定する第二の算出ステップと、
    前記線形動的システムと、前記1つ以上の基準値を関連付けて、対象の時系列データを表現するパラメータとして出力する出力ステップと、
    を含む、データ近似方法。
  13. 複数の値からなる時系列データが含まれるクラスタを近似するデータとして、当該時系列データを表す線形動的システムの係数と、1つ以上の時点における基準値とを出力するデータ近似装置であって、
    クラスタに含まれる1つ以上の時系列データを取得するデータ取得手段と、
    前記時系列データを近似する線形動的システムの係数を算出する第一の算出手段と、
    前記線形動的システムを用いて前記時系列データを近似する際に用いられる、時刻と値とからなる1つ以上の基準値を決定する第二の算出手段と、
    前記線形動的システムと、前記1つ以上の基準値とを関連付けて、対象の時系列データを表現するパラメータとして出力する出力手段と、
    を有し、
    前記第二の算出手段は、
    仮に決定した1つ以上の基準値を始点として対象の線形動的システムを適用し、前記時系列データを近似する近似データを生成したうえで、前記近似データの、前記時系列データに対する近似誤差を取得する手段と、
    前記基準値の個数mを増加させながら、前記時系列データが有するn個のタイムステップの中から、前記近似誤差が最小となる時刻と値の組み合わせをm個探索し、かつ、前記近似誤差が所定の閾値を下回った場合に、探索処理を終了し、前記m個の基準値を出力する手段と、からなる、
    データ近似装置。
JP2014243104A 2014-12-01 2014-12-01 データ近似装置およびデータ近似方法 Active JP6390388B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014243104A JP6390388B2 (ja) 2014-12-01 2014-12-01 データ近似装置およびデータ近似方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014243104A JP6390388B2 (ja) 2014-12-01 2014-12-01 データ近似装置およびデータ近似方法

Publications (2)

Publication Number Publication Date
JP2016105240A true JP2016105240A (ja) 2016-06-09
JP6390388B2 JP6390388B2 (ja) 2018-09-19

Family

ID=56102491

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014243104A Active JP6390388B2 (ja) 2014-12-01 2014-12-01 データ近似装置およびデータ近似方法

Country Status (1)

Country Link
JP (1) JP6390388B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018036726A (ja) * 2016-08-29 2018-03-08 公立大学法人大阪府立大学 データ解析装置、制御装置、データ解析装置の制御方法、制御プログラム、および記録媒体
JP2019046023A (ja) * 2017-08-31 2019-03-22 富士通株式会社 情報処理装置、情報処理方法及びプログラム
EP3923158A1 (en) 2020-06-08 2021-12-15 Fujitsu Limited Program, time-series analysis method, and information processing apparatus

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010221962A (ja) * 2009-03-25 2010-10-07 Denso Corp 運転行動推定装置
JP2013246729A (ja) * 2012-05-28 2013-12-09 Nec Corp 類似時系列データ検索システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010221962A (ja) * 2009-03-25 2010-10-07 Denso Corp 運転行動推定装置
JP2013246729A (ja) * 2012-05-28 2013-12-09 Nec Corp 類似時系列データ検索システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
堤 公孝: "区間線形動的システムによる時系列イベントの学習と識別", 情報処理学会研究報告, vol. Vol.2004 No.40, JPN6017049146, 7 May 2004 (2004-05-07), JP, pages 41−48ページ *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018036726A (ja) * 2016-08-29 2018-03-08 公立大学法人大阪府立大学 データ解析装置、制御装置、データ解析装置の制御方法、制御プログラム、および記録媒体
JP2019046023A (ja) * 2017-08-31 2019-03-22 富士通株式会社 情報処理装置、情報処理方法及びプログラム
JP7013732B2 (ja) 2017-08-31 2022-02-01 富士通株式会社 情報処理装置、情報処理方法及びプログラム
EP3923158A1 (en) 2020-06-08 2021-12-15 Fujitsu Limited Program, time-series analysis method, and information processing apparatus
US11615106B2 (en) 2020-06-08 2023-03-28 Fujitsu Limited Non-transitory computer-readable storage medium storing program for performing time-series analysis by calculating approximation calculation application degree, time-series analysis method for performing time-series analysis by calculating approximation calculation application degree, and information processing apparatus for performing time-series analysis by calculating approximation calculation application degree

Also Published As

Publication number Publication date
JP6390388B2 (ja) 2018-09-19

Similar Documents

Publication Publication Date Title
CN107451524B (zh) 行为识别装置、学习装置、行为识别方法、学习方法及计算机可读的记录介质
CN112285676B (zh) 激光雷达与imu外参标定方法及装置
JP2017194915A (ja) 周辺情報収集システム及び周辺情報取得装置
CN108780313B (zh) 为装配线执行目标参数分析的方法、系统和计算机可读介质
JP6390388B2 (ja) データ近似装置およびデータ近似方法
CN113052966B (zh) 自动驾驶众包高精度地图更新方法、系统及介质
JP2015158421A (ja) 補正値生成装置、故障診断装置、補正値生成プログラム、および故障診断プログラム
CN104216936A (zh) 利用kd-fern 的快速最近邻居搜索
CN104392247A (zh) 一种用于数据聚类的相似性网络融合快速方法
JP6347190B2 (ja) 情報処理装置、プログラム及び方法
CN104573331B (zh) 一种基于MapReduce的K近邻数据预测方法
CN111967616B (zh) 自动时间序列回归方法和装置
CN104933411A (zh) 指纹识别处理方法及系统
JP2019191836A (ja) 異常検知システムおよびプログラム
JP2021051688A (ja) 運転技量評価装置
JPWO2018168695A1 (ja) 分散機械学習装置、分散機械学習方法および分散機械学習プログラム
JP7031625B2 (ja) グラフ構造推定装置、slam装置、グラフ構造推定方法、コンピュータプログラム、および記憶媒体
CN109783844B (zh) 一种基于跟踪精度和能量消耗指标下的多传感器管理方法
CN110928916A (zh) 基于流形空间的数据监测方法、装置及存储介质
US20210064941A1 (en) Method for adaptive context length control for on-line edge learning
JP7048896B2 (ja) 学習データ生成装置、学習データ生成方法およびプログラム
JP2020035042A (ja) データ判定装置、方法、及びプログラム
CN117289337B (zh) 瑞雷面波反演方法、装置、电子设备及存储介质
WO2022064575A1 (ja) モデル生成装置及びモデル生成方法
US20230367993A1 (en) Dnn contraction device and onboard computation device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180724

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180806

R151 Written notification of patent or utility model registration

Ref document number: 6390388

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151