JP7275903B2

JP7275903B2 - データ分析システム、データ分析方法及びプログラム

Info

Publication number: JP7275903B2
Application number: JP2019117776A
Authority: JP
Inventors: 洋一松尾; 丈浩川田; 研西松; 達明木村
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2019-06-25
Filing date: 2019-06-25
Publication date: 2023-05-18
Anticipated expiration: 2039-06-25
Also published as: JP2021005170A; US20220358352A1; WO2020262316A1

Description

本発明は、データ分析システム、データ分析方法及びプログラムに関する。

近年、例えば通信ネットワークやセンサ群等の様々なシステムから取得できる時系列データを用いて、所望の事象の予測や分類、回帰等のデータ分析を行うことが一般的になってきている。これらの時系列データには様々な種類のデータがあり、それぞれの種類に応じた特色を持っている。このようなデータの種類としては、例えば、連続値や離散値、カテゴリ数等を取り得る数値データ、文章形式のテキストデータ等が挙げられる。以降では、複数種類のデータを「マルチモーダルデータ」とも表す。

また、時系列データには周期性がある場合が多く、このような周期性や上記のデータの種類に応じた特色等の特徴を把握・抽出することが重要である。時系列データの分析手法としては、従来から様々な手法が提案されている。例えば、与えられた時系列データを用いてＤＮＮ（Deep Neural Network）の学習することで、このＤＮＮにより将来の値を予測する手法が知られている。

ここで、時系列データに対してＣＮＮ（Convolutional Neural Network）を適用して予測を行う手法としてＱＲＮＮ（Quasi-Recurrent Neural Network）が知られている（例えば非特許文献１参照）。ＱＲＮＮでは、時刻ｔ＋１に対して、１からｔまでのデータ全体を用いて予測を行う。すなわち、時系列データ｛ｘ_１，・・・，ｘ_ｔ｝が与えられた場合に、ｘ_ｔ＋１＝ＱＲＮＮ（ｘ_１，・・・ｘ_ｔ）によりｘ_ｔ＋１を予測する。ＱＲＮＮでは、ＣＮＮのフィルタが学習によって時系列間の関係性や周期成分等を学習していき、データの時系列方向の特徴を抽出することができる。

また、音声の時系列データに対する予測手法としてＷａｖｅｎｅｔが知られている（例えば非特許文献２参照）。音声の時系列データはデータ間に超長期の影響関係があるため、Ｗａｖｅｎｅｔでは、長期間のデータの関係性を抽出できるように、ｘ_ｔ＋１を予測する場合に、ｍ（ただし、ｍ＝２，４，８，１６，・・・，Ｍ）時刻前のｘ_ｍを入力としたＣＮＮにより予測を行っている。このとき、Ｗａｖｅｎｅｔでは、ＣＮＮの隠れ層において、これらｍ時刻のデータ間の関係性も抽出している。

また、複数種類の時系列データの特徴を抽出して予測を行う手法としてＤｅｅｐｓｅｎｓｅと呼ばれる手法が知られている（例えば非特許文献３参照）。Ｄｅｅｐｓｅｎｓｅでは、角速度や速度等の多次元の特徴の異なるデータに対して、まず各時刻において各データ内の次元間の関係性をＣＮＮにより抽出し、次に各時刻において各データ間の関係性をＣＮＮにより抽出し、最後に時系列間の関係性をＲＮＮ（Recurrent Neural Network）により抽出する、という手法である。

Bradbury, James, Merity, Stephen, Xiong, Caiming, and Socher, Richard. Quasi-Recurrent Neural Networks. arXiv preprint arXiv:1611.01576, 2016. A. van den Oord et al. "WaveNet: A Generative Model for Raw Audio". In: ArXiv e-prints (2016). Shuochao Yao, Shaohan Hu, Yiran Zhao, Aston Zhang, and Tarek Abdelzaher. Deepsense: A unified deep learning framework for timeseries mobile sensing data processing. In Proc. 26th International Conference on World Wide Web, pages 351-360. International World Wide Web Conferences Steering Committee, 2017.

マルチモーダルデータのデータ分析を行う場合には、複数種類のデータのそれぞれの特徴を抽出するために、例えば、データを種類ごとに分けて特徴を抽出した上で、各データの特徴全体を予測する、等の工夫が必要なる。このため、上記のＱＲＮＮやＷａｖｅｎｅｔはマルチモーダルデータのデータ分析には適さない。一方で、Ｄｅｅｐｓｅｎｓｅはマルチモーダルデータのデータ分析を行うことができるものの、データの種類がテキストデータ等である場合には扱うことができない。

本発明の実施の形態は、上記の点に鑑みてなされたもので、複数種類の時系列データのデータ分析を実現することを目的する。

上記目的を達成するため、本発明の実施の形態におけるデータ分析システムは、複数の種類の時系列データから、各時刻において、前記時系列データを構成する各データの次元間の特徴を示す第１の特徴量を抽出する第１の特徴量抽出手段と、前記第１の特徴量抽出手段により抽出された第１の特徴量から、各時刻において、前記種類間の特徴を示す第２の特徴量を抽出する第２の特徴量抽出手段と、前記第２の特徴量抽出手段により抽出された第２の特徴量から、各時刻間の特徴を示す第３の特徴量を抽出する第３の特徴量抽出手段と、前記第３の特徴量抽出手段により抽出された第３の特徴量を用いて、所定のデータ分析を行う分析手段と、を有することを特徴とする。

複数種類の時系列データのデータ分析を実現することができる。

本発明の実施の形態におけるデータ分析システムの全体構成（推論時）の一例を示す図である。本発明の実施の形態におけるデータ分析システムの全体構成（学習時）の一例を示す図である。本発明の実施の形態におけるデータ分析システムのハードウェア構成の一例を示す図である。本発明の実施の形態におけるデータ分析処理の一例を示すフローチャートである。マルチモーダルデータの一例を説明するための図である。本発明の実施の形態におけるパラメータ更新処理の一例を示すフローチャートである。

以下、本発明の実施の形態について説明する。本発明の実施の形態では、複数種類の時系列データのデータ分析を実現することができるデータ分析システム１０について説明する。

本発明の実施の形態では、一例として、データ分析の対象とする時系列データは通信ネットワークやセンサ群等から取得されたデータであるものとする。したがって、データ分析の対象とする時系列データは、複数種類の時系列データ（つまり、マルチモーダルデータの時系列データ）であるものとする。なお、通信ネットワークやセンサ群等から取得されるデータには、例えば、センサ値等の数値データの時系列データ、システムログ等のテキストデータの時系列データ等がある。これら以外にも、例えば、所定の機器での異常発生有無を表す数値データ（つまり、離散値（２値）を取り得る数値データ）の時系列データやＩＰ（Internet Protocol）アドレスが属するカテゴリを表す数値データの時系列データ等もある。

また、本発明の実施の形態では、一例として、データ分析としてデータの予測を行う場合について説明する。ただし、本発明の実施の形態は、データの予測に限られず、例えば、データの分類や回帰等のデータ分析を行う場合についても同様に適用することが可能である。

ここで、上述したように、マルチモーダルデータのデータ分析には、ＱＲＮＮやＷａｖｅｎｅｔは適さない。一方で、Ｄｅｅｐｓｅｎｓｅはマルチモーダルデータのデータ分析を行うことができるものの、データの種類がテキストデータ等である場合には扱うことができない。また、ＲＮＮはｘ_ｔ＋１を予測するためにｘ_ｔ－ｋ，・・・，ｘ_ｔを用いるが、このとき、ＲＮＮでは、ｊ＝０，・・・，ｋに対して、ｘ_{ｔ－ｋ＋ｊ}からｘ_{ｔ－ｋ＋ｊ＋１}を予測することを繰り返すことでｘ_ｔ＋１を予測する。この方法は勾配爆発又は勾配消失を起こすとも言われており、ｋ時刻前までのデータを用いてもそのデータの情報を利用できているかはわからない。したがって、時系列データに長期間の関係性がある場合には、ＲＮＮによるデータ分析は適さない。

一般に、通信ネットワークやセンサ群等のシステムから取得された時系列データは、データの種類ごとに時系列方向の関係性や周期が異なる場合が多い。このため、予測に使用するデータを明示的に決めてモデル化している場合、データの関係性や周期によっては当該モデルに当てはまらず、予測に適さないことがある。

そこで、本発明の実施の形態におけるデータ分析システム１０では、複数種類の時系列データに関して時系列方向の長期の関係や周期を抽出することで、予測や分類、回帰等のデータ分析を行う。なお、データ分析システム１０には、学習データを用いてニューラルネットワークのパラメータ等を更新する「学習時」と、学習済みのパラメータを用いたニューラルネットワークにより時系列データを分析する「推論時」とがある。

＜全体構成＞
まず、本発明の実施の形態におけるデータ分析システム１０の全体構成について、図１及び図２を参照しながら説明する。図１及び図２は、本発明の実施の形態におけるデータ分析システム１０の全体構成の一例を示す図である。

≪推論時≫
図１に示すように、推論時におけるデータ分析システム１０は、前処理部１０１と、第１の関係性抽出部１０２と、第２の関係性抽出部１０３と、第３の関係性抽出部１０４と、出力部１０５と、ユーザインタフェース部１０６と、記憶部１１０とを有する。

記憶部１１０には、各種データが記憶されている。本発明の実施の形態では、推論時には、データ分析の対象となる複数種類の時系列データが記憶部１１０に記憶されているものとする。

前処理部１０１は、データ分析の対象となる時系列データを記憶部１１０から読み出して、これらの時系列データに対して所定の前処理を行う。前処理としては、例えば、テキストデータの数値化してベクトルデータに変換する、数値データを正規化する、時系列データ全体をタイムウインドウで区切る、等が挙げられる。

第１の関係性抽出部１０２は、予め学習された学習済みのパラメータを用いたＣＮＮにより実現され、前処理後の時系列データを入力として、データの種類ごとに、各時刻で各データ内の次元間の関係性（特徴）を抽出する。

第２の関係性抽出部１０３は、予め学習された学習済みのパラメータを用いたＣＮＮにより実現され、第１の関係性抽出部１０２により抽出された特徴を入力として、各時刻でデータの種類間の関係性（特徴）を抽出する。

第３の関係性抽出部１０４は、予め学習された学習済みのパラメータを用いたＣＮＮにより実現され、第２の関係性抽出部１０３により抽出された特徴を入力として、データ分析の対象となる時系列データの時系列間の関係性（特徴）を抽出する。

出力部１０５は、第３の関係性抽出部１０４により抽出された特徴を入力として、データ分析結果を出力する。このとき、出力部１０５は、データの種類ごとに準備された所定の関数を用いてデータ分析結果を出力する。例えば、データ分析として予測や回帰を行う場合には、恒等関数を用いてデータ分析結果を出力する。一方で、例えば、データ分析として分類を行う場合には、ソフトマックス関数を用いてデータ分析結果を出力する。

ユーザインタフェース部１０６は、出力部１０５により出力されたデータ分析結果を所定のＵＩ（ユーザインタフェース）に提供する。ここで、所定のユーザインタフェースとしては、ディスプレイ等の表示装置であってもよいし、スピーカ等の音声出力装置であってもよい。これら以外にも、ユーザインタフェース部１０６は、任意のユーザインタフェースにデータ分析結果を提供してもよい。

≪学習時≫
図２に示すように、学習時におけるデータ分析システム１０は、前処理部１０１と、第１の関係性抽出部１０２と、第２の関係性抽出部１０３と、第３の関係性抽出部１０４と、出力部１０５と、ユーザインタフェース部１０６と、パラメータ更新部１０７と、記憶部１１０とを有する。なお、前処理部１０１、第１の関係性抽出部１０２、第２の関係性抽出部１０３、第３の関係性抽出部１０４、出力部１０５及びユーザインタフェース部１０６は、それぞれ推論時と同様であるため、その説明を省略する。ただし、第１の関係性抽出部１０２、第２の関係性抽出部１０３及び第３の関係性抽出部１０４は、学習済みでないパラメータを用いたＣＮＮによりそれぞれ実現される。

記憶部１１０には、各種データが記憶されている。本発明の実施の形態では、学習時には、ＣＮＮのパラメータを学習するための学習データが記憶部１１０に記憶されているものとする。学習データとは、ＣＮＮのパラメータの学習に用いられる時系列データと、この時系列データのデータ分析結果の正解（つまり、教師データ）とで構成されるデータのことである。学習時には、ＣＮＮのパラメータを学習するために、これらの学習データに含まれる時系列データを用いてデータ分析が行われる。

パラメータ更新部１０７は、出力部１０５により出力されたデータ分析結果と、教師データとを用いて、既知の最適化手法により、第１の関係性抽出部１０２、第２の関係性抽出部１０３及び第３の関係性抽出部１０４のそれぞれを実現するＣＮＮのパラメータを更新する。これより、各ＣＮＮのパラメータが学習される。

なお、図１及び図２に示すデータ分析システム１０の全体構成は一例であって、他の構成であってもよい。例えば、データ分析システム１０は複数台の装置で構成されていてもよい。また、この場合、例えば、データ分析システム１０が有する各機能部（前処理部１０１、第１の関係性抽出部１０２、第２の関係性抽出部１０３、第３の関係性抽出部１０４、出力部１０５、ユーザインタフェース部１０６及びパラメータ更新部１０７）は、複数の装置で分散して有していてもよい。

＜ハードウェア構成＞
次に、本発明の実施の形態におけるデータ分析システム１０のハードウェア構成について、図３を参照しながら説明する。図３は、本発明の実施の形態におけるデータ分析システム１０のハードウェア構成の一例を示す図である。

図３に示すように、本発明の実施の形態におけるデータ分析システム１０は、入力装置２０１と、表示装置２０２と、外部Ｉ／Ｆ２０３と、ＲＡＭ（Random Access Memory）２０４と、ＲＯＭ（Read Only Memory）２０５と、プロセッサ２０６と、通信Ｉ／Ｆ２０７と、補助記憶装置２０８とを有する。これら各ハードウェアは、それぞれがバスＢを介して相互に通信可能に接続されている。

入力装置２０１は、例えばキーボードやマウス、タッチパネル等である。表示装置２０２は、例えばディスプレイ等である。なお、データ分析システム１０は、入力装置２０１及び表示装置２０２の少なくとも一方を有していなくてもよい。

外部Ｉ／Ｆ２０３は、外部装置とのインタフェースである。外部装置には、記録媒体２０３ａ等がある。データ分析システム１０は、外部Ｉ／Ｆ２０３を介して、記録媒体２０３ａ等の読み取りや書き込みを行うことができる。記録媒体２０３ａとしては、例えば、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disk）、ＳＤメモリカード（Secure Digital memory card）、ＵＳＢ（Universal Serial Bus）メモリカード等が挙げられる。なお、記録媒体２０３ａには、データ分析システム１０が有する各機能部（例えば、前処理部１０１、第１の関係性抽出部１０２、第２の関係性抽出部１０３、第３の関係性抽出部１０４、出力部１０５及びユーザインタフェース部１０６等）を実現する１以上のプログラムが記録されていてもよい。

ＲＡＭ２０４は、プログラムやデータを一時保持する揮発性の半導体メモリである。ＲＯＭ２０５は、電源を切ってもプログラムやデータを保持することができる不揮発性の半導体メモリである。

プロセッサ２０６は、例えばＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）等の演算装置であり、ＲＯＭ２０５や補助記憶装置２０８等からプログラムやデータをＲＡＭ２０４上に読み出して処理を実行する。データ分析システム１０が有する各機能部は、例えば、補助記憶装置２０８に格納されている１以上のプログラムがプロセッサ２０６に実行させる処理により実現される。なお、データ分析システム１０は、プロセッサ２０６としてＣＰＵとＧＰＵとの両方を有していてもよいし、ＣＰＵ又はＧＰＵのいずれか一方のみを有していてもよい。また、データ分析システム１０は、プロセッサ２０６としてＦＰＧＡ（field-programmable gate array）等を有していてもよい。

通信Ｉ／Ｆ２０７は、データ分析システム１０を通信ネットワークに接続するためのインタフェースである。データ分析システム１０が有する各機能部を実現する１以上のプログラムは、通信Ｉ／Ｆ２０７を介して、所定のサーバ装置等から取得（ダウンロード）されてもよい。

補助記憶装置２０８は、例えばＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）等であり、プログラムやデータを格納している不揮発性の記憶装置である。補助記憶装置２０８に格納されているプログラムやデータには、例えば、ＯＳ（Operating System）、データ分析システム１０が有する各機能部を実現する１以上のプログラム等がある。データ分析システム１０が有する記憶部１１０は、補助記憶装置２０８を用いて実現可能である。ただし、当該記憶部１１０は、データ分析システム１０と通信ネットワークを介して接続される記憶装置等を用いて実現されていてもよい。

本発明の実施の形態におけるデータ分析システム１０は、図３に示すハードウェア構成を有することにより、後述するデータ分析処理やパラメータ更新処理を実現することができる。なお、図３に示す例では、本発明の実施の形態におけるデータ分析システム１０が１台の装置（コンピュータ）で実現されている場合について説明したが、これに限られない。本発明の実施の形態におけるデータ分析システム１０は、複数台の装置（コンピュータ）で実現されていてもよい。また、１台の装置（コンピュータ）には、複数のプロセッサ２０６や複数のメモリ（ＲＡＭ２０４、ＲＯＭ２０５、補助記憶装置２０８等）が含まれていてもよい。

＜データ分析処理＞
以降では、推論時におけるデータ分析処理について、図４を参照しながら説明する。図４は、本発明の実施の形態におけるデータ分析処理の一例を示すフローチャートである。なお、データ分析処理では、第１の関係性抽出部１０２、第２の関係性抽出部１０３及び第３の関係性抽出部１０４をそれぞれ実現するＣＮＮのパラメータは予め学習済みであるものとする。

まず、前処理部１０１は、データ分析の対象となる時系列データを記憶部１１０から読み出して、これらの時系列データに対して所定の前処理を行う（ステップＳ１０１）。前処理としては、上述したように、例えば、テキストデータの数値化してベクトルデータに変換する、数値データを正規化する、時系列データ全体をタイムウインドウで区切る、等が挙げられる。

以降では、データ分析の対象となる時系列データがｔ個のタイムウインドウに区切られたものとして、データの種類ごとに、１つのタイムウインドウに対して１つの時刻インデックスを対応付けるものとする。具体的には、データの種類をｋ（ｋ＝１，・・・，Ｋ；ただし、Ｋ≧２）、時刻インデックスをｔ（ｔは１以上の整数）として、種類ｋの時刻ｔにおけるデータをｘ^ｋ _ｔと表すものとする。また、種類ｋのデータの次元数をＮ^ｋ（ただし、Ｎ^ｋ≧１）と表すものとする。

ここで、テキストデータを数値化する場合、前処理部１０１は、予め番号が付与されたテンプレートを用いてベクトルデータに変換する。具体的には、テンプレートの総数をＮ^ｋとして、前処理部１０１は、当該テキストデータの可変部分（例えば、観測値等を表す文字列）以外の固定的な文字列と一致又は類似するテンプレートを特定した上で、特定したテンプレートに付与された番号に対応する要素のみが１、それ以外の要素は０であるＮ^ｋ次元のベクトルデータに当該テキストデータを変換する。

また、ＩＰアドレスが属するカテゴリを表す数値データについては、前処理部１０１は、この数値データをベクトルデータに変換する。具体的には、カテゴリの総数をＮ^ｋとして、前処理部１０１は、当該ＩＰアドレスが属するカテゴリに対応する要素のみが１、それ以外の要素は０であるＮ^ｋ次元のベクトルに当該数値データを変換する。

また、ＩＰアドレスを表すアドレスデータについては、前処理部１０１は、このアドレスデータをベクトルデータに変換する。具体的には、ＩＰアドレス空間の総数をＮ^ｋとして、前処理部１０１は、当該アドレスデータが表すＩＰアドレスが属するＩＰアドレス空間に対応する要素のみが１、それ以外の要素は０であるＮ^ｋ次元のベクトルに当該アドレスデータを変換する。

なお、以降では、次元数が１のデータ（つまり、スカラで表される数値データ）もベクトルデータと表す。これにより、数値データやテキストデータ、アドレスデータ等の各種データは、全てベクトルデータとして表されることになる。

また、時刻ｔに対応するタイムウインドウ中に複数のベクトルデータが含まれる場合、ｘ^ｋ _ｔは、当該タイムウインドウ中の複数のベクトルデータを集計（合計や平均、中央値の算出等）したベクトルデータ又は当該タイムウインドウ中の複数のベクトルデータのうちの代表となるベクトルデータとすればよい。

ここで、Ｋ＝２であり、ｋ＝１のデータの種類が数値データ、ｋ＝２のデータの種類がテキストデータである場合のマルチモーダルデータの例を図５に示す。図５に示す例では、時刻ｔにおける数値データは１次元のベクトルデータｘ^１ _ｔで表されている。また、時刻ｔにおけるテキストデータはＮ^２次元のベクトルデータｘ^２ _ｔに変換されて、このベクトルデータｘ^２ _ｔで表される。

なお、図５に示す例では、一例として、時刻ｔに対応するタイムウインドウ中に１つのデータのみが含まれる場合を示している。例えば、時刻ｔに対応するタイムウインドウ中に２つのテキストデータ（第１のテキストデータ及び第２のテキストデータ）が含まれる場合、ｘ^２ _ｔは、例えば、第１のテキストデータに対応する要素のみが１、それ以外の要素が０である第１のベクトルと、第２のテキストデータに対応する要素のみが１、それ以外の要素が０である第２のベクトルとの和で表されるベクトルデータとすればよい。

また、正規化については、前処理部１０１は、例えば、種類ｋごとに、学習データに含まれる時系列データの最大値で、データ分析対象の時系列データ全体を割ればよい。具体的には、前処理部１０１は、各ｋ及び各ｔに対して、以下により各ベクトルデータｘ^ｋ _ｔを正規化すればよい。

以降では、正規化後のベクトルデータもｘ^ｋ _ｔで表す。

次に、第１の関係性抽出部１０２は、上記のステップＳ１０１で前処理が行われたベクトルデータｘ^ｋ _ｔを用いて、各時刻ｔで各ベクトルデータｘ^ｋ _ｔ内の次元間の関係性（特徴）を抽出する（ステップＳ１０２）。具体的には、第１の関係性抽出部１０２は、学習済みのパラメータを用いた１ｄＣＮＮ（つまり、ベクトルに対するＣＮＮ）にｘ^ｋ _ｔを入力して、ベクトル

を出力する。ここで、１ｄＣＮＮで出力されるベクトルの次元数は予め設定されたＮ_１であるものとする。１ｄＣＮＮで出力されるベクトルの次元数がＮ_１となるように、ＣＮＮのフィルターサイズとスライディングウィンドウとがｋごとに調整される。これにより、ベクトルデータｘ^ｋ _ｔから特徴量を抽出すると共に、ｋごとに異なるサイズのベクトルデータを同一のサイズにすることができる。

なお、上記のステップＳ１０２では、上記の１ｄＣＮＮの代わりに、例えば、主成分分析（ＰＣＡ：principal component analysis）が用いられてもよいし、自己符号化器（Autoencoder）のエンコーダ（符号化器）が用いられてもよい。

次に、第２の関係性抽出部１０３は、上記のステップＳ１０２で出力されたベクトルデータ

を用いて、各時刻ｔでベクトルデータの種類ｋ間の関係性（特徴）を抽出する（ステップＳ１０３）。具体的には、第２の関係性抽出部１０３は、

を行方向に並べた行列

を作成する。そして、第２の関係性抽出部１０３は、学習済みのパラメータを用いた２ｄＣＮＮ（つまり、行列に対するＣＮＮ）にｚ^（１） _ｔを入力して、行列

を出力する。ここで、ｋ_２及びＮ_２は予め設定される。これにより、各時刻ｔで各データの種類ｋ間の特徴量を抽出することができる。

次に、第３の関係性抽出部１０４は、上記のステップＳ１０３で出力された行列データｚ ^（２） _ｔを用いて、時系列間の関係性（特徴）を抽出する（ステップＳ１０４）。具体的には、第３の関係性抽出部１０４は、時刻１からｔまでの行列データｚ ^（２） _ｔを列方向に並べた行列

を作成する。そして、第３の関係性抽出部１０４は、学習済みのパラメータを用いた２ｄＣＮＮにＺ^（２）を入力して、行列

を出力する。ここで、ｋ_３及びＮ_３は予め設定される。これにより、時刻１からｔまでの特徴量を抽出することができる。

続いて、出力部１０５は、上記のステップＳ１０４で出力された行列データＺ^（３）を用いてデータ分析を行って、データ分析結果を出力する（ステップＳ１０５）。すなわち、例えば、データ分析として予測を行う場合には、出力部１０５は、ｘ^ｋ _ｔ＋１を予測して、このｘ^ｋ _ｔ＋１を出力する。上述したように、出力部１０５は、データの種類ｋごとに準備された所定の関数（例えば、恒等関数やソフトマックス関数等）を用いてデータ分析結果を出力する。

最後に、ユーザインタフェース部１０６は、上記のステップＳ１０５で出力されたデータ分析結果を所定のＵＩに提供する（ステップＳ１０６）。これにより、データ分析結果がユーザに提示される。

以上のように、本発明の実施の形態におけるデータ分析システム１０は、各時刻で各データの次元間の特徴を抽出した後、各時刻で各データ間の特徴を抽出し、最後に時系列間の特徴を抽出する。これにより、本発明の実施の形態におけるデータ分析システム１０では、マルチモーダルな時系列データから、データの特徴やデータ間の特徴を抽出しつつ、時系列方向の特徴や周期性も抽出することができ、マルチモーダルな時系列データのデータ分析を高い精度で実現することが可能となる。

＜パラメータ更新処理＞
以降では、学習時におけるパラメータ更新処理について、図６を参照しながら説明する。図６は、本発明の実施の形態におけるパラメータ更新処理の一例を示すフローチャートである。なお、データ分析処理では、第１の関係性抽出部１０２、第２の関係性抽出部１０３及び第３の関係性抽出部１０４をそれぞれ実現するＣＮＮのパラメータは学習済みでないものとする。

図６のステップＳ２０１～ステップＳ２０５は、図４のステップＳ１０１～ステップＳ１０５とそれぞれ同様であるため、その説明を省略する。ただし、データ分析の対象となる時系列データとして、学習データに含まれる時系列データを用いる。

ステップＳ２０５に続いて、パラメータ更新部１０７は、ステップＳ２０５で出力されたデータ分析結果と、当該学習データに含まれる教師データとを用いて、第１の関係性抽出部１０２、第２の関係性抽出部１０３及び第３の関係性抽出部１０４をそれぞれ実現するＣＮＮのパラメータを更新する（ステップＳ２０６）。すなわち、パラメータ更新部１０７は、当該データ分析結果と当該教師データとの誤差が小さくなるように、既知の最適化手法によりＣＮＮのパラメータを更新する。このような最適化手法としては、例えば、確率的勾配降下法等を用いればよい。これにより、上記のデータ分析処理を実現するためのＣＮＮのパラメータが学習される。

なお、ＣＮＮの層の数やドロップアウトの有無等は任意に設定することが可能である。また、例えば、自己符号化器のエンコーダ等により第１の関係性抽出部１０２が実現されている場合は、更新対象のパラメータは、このエンコーダのパラメータとなる。

本発明は、具体的に開示された上記の実施の形態に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。

１０データ分析システム
１０１前処理部
１０２第１の関係性抽出部
１０３第２の関係性抽出部
１０４第３の関係性抽出部
１０５出力部
１０６ユーザインタフェース部
１０７パラメータ更新部
１１０記憶部

Claims

複数の種類の時系列データから、各時刻において、前記時系列データを構成する各データの次元間の特徴を示す第１の特徴量を抽出する第１の特徴量抽出手段と、
前記第１の特徴量抽出手段により抽出された第１の特徴量から、各時刻において、前記種類間の特徴を示す第２の特徴量を抽出する第２の特徴量抽出手段と、
前記第２の特徴量抽出手段により抽出された第２の特徴量から、各時刻間の特徴を示す第３の特徴量を抽出する第３の特徴量抽出手段と、
前記第３の特徴量抽出手段により抽出された第３の特徴量を用いて、所定のデータ分析を行う分析手段と、
を有することを特徴とするデータ分析システム。
前記第１の特徴量抽出手段は、予め学習された学習済みパラメータを用いた畳み込みニューラルネットワーク、主成分分析、又は予め学習された学習済みパラメータを用いた自己符号化器の符号化器のいずれかにより前記第１の特徴量を抽出し、
前記第２の特徴量抽出手段は、予め学習された学習済みパラメータを用いた畳み込みニューラルネットワークにより前記第２の特徴量を抽出し、
前記第３の特徴量抽出手段は、予め学習された学習済みパラメータを用いた畳み込みニューラルネットワークにより前記第３の特徴量を抽出する、ことを特徴とする請求項１に記載のデータ分析システム。
前記分析手段は、
前記データ分析の目的に応じて前記種類ごとに準備された関数を用いて、前記第３の特徴量からデータ分析結果を出力する、ことを特徴とする請求項１又は２に記載のデータ分析システム。
複数の種類の時系列データから、各時刻において、前記時系列データを構成する各データの次元間の特徴を示す第１の特徴量を抽出する第１の特徴量抽出手順と、
前記第１の特徴量抽出手順で抽出された第１の特徴量から、各時刻において、前記種類間の特徴を示す第２の特徴量を抽出する第２の特徴量抽出手順と、
前記第２の特徴量抽出手順で抽出された第２の特徴量から、各時刻間の特徴を示す第３の特徴量を抽出する第３の特徴量抽出手順と、
前記第３の特徴量抽出手順で抽出された第３の特徴量を用いて、所定のデータ分析を行う分析手順と、
をコンピュータが実行することを特徴とするデータ分析方法。
複数の種類の時系列データから、各時刻において、前記時系列データを構成する各データの次元間の特徴を示す第１の特徴量を抽出する第１の特徴量抽出手順と、
前記第１の特徴量抽出手順で抽出された第１の特徴量から、各時刻において、前記種類間の特徴を示す第２の特徴量を抽出する第２の特徴量抽出手順と、
前記第２の特徴量抽出手順で抽出された第２の特徴量から、各時刻間の特徴を示す第３の特徴量を抽出する第３の特徴量抽出手順と、
前記第３の特徴量抽出手順で抽出された第３の特徴量を用いて、所定のデータ分析を行う分析手順と、
をコンピュータに実行させることを特徴とするプログラム。