JP7294421B2

JP7294421B2 - 学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラム

Info

Publication number: JP7294421B2
Application number: JP2021528754A
Authority: JP
Inventors: 大祐佐藤; 達史松林; 浩之戸田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2019-06-26
Filing date: 2019-06-26
Publication date: 2023-06-20
Anticipated expiration: 2039-06-26
Also published as: WO2020261449A1; JPWO2020261449A1; US20220366272A1

Description

開示の技術は、学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラムに関する。

時空間データを予測するための手法は、これまでにも数多く提案されている。中でも、特許文献１に記載される従来手法は、例えばイベント会場に急激に人が集まるような、通常時と異なる突発的な変動を含む時空間データに対しても予測が可能である。

特開２０１８－２２２３７号公報

特許文献１に記載される手法は、時空間データの変動を区別することなく入力として扱うため、誤った相関を学習してしまう可能性がある。これを防ぐことが精度向上のためには重要である。例えば、あるエリアに２つの大規模イベント会場があり、お互いのイベントの参加者の行動にはまったく関係がないような場合がある。この手法では、２つのイベントに関係する参加者の変動を、イベントを考慮せずに増減の相関関係を捉えてしまうような場合が考えられ、予測の精度低下が問題となる。

本開示は、イベントごとの変動を考慮した時空間データの予測を可能とし、全体の予測精度を向上できる学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラムを提供することを目的とする。

本開示の第１態様は、学習装置であって、予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、変動時の前記時空間データとの変動の度合いを表すイベント成分を抽出する抽出部と、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類する分類部と、前記イベントごとの分類結果に基づいて、前記イベントごとに、前記時空間データの変動を予測するためのモデルを学習する学習部と、を含む。

本開示の第２態様は、予測装置であって、予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、入力された予測対象の前記時空間データとの変動の度合いを表すイベント成分を抽出する抽出部と、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類する分類部と、前記イベントごとの分類結果に基づいて、前記イベントごとに学習された前記時空間データの変動を予測するためのモデルを用いて、前記イベントごとの前記時空間データの変動を予測する予測部と、を含み、前記モデルは、学習用の前記時空間データについての、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、前記イベントごとの分類結果に基づいて学習されている。

本開示の第３態様は、学習方法であって、予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、変動時の前記時空間データとの変動の度合いを表すイベント成分を抽出し、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、前記イベントごとの分類結果に基づいて、前記イベントごとに、前記時空間データの変動を予測するためのモデルを学習する、ことを含む処理をコンピュータが実行することを特徴とする。

本開示の第４態様は、予測方法であって、予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、入力された予測対象の前記時空間データとの変動の度合いを表すイベント成分を抽出し、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、前記イベントごとの分類結果に基づいて、前記イベントごとに学習された前記時空間データの変動を予測するためのモデルを用いて、前記イベントごとの前記時空間データの変動を予測する、ことを含む処理をコンピュータが実行することを特徴とする予測方法であって、前記モデルは、学習用の前記時空間データについての、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、前記イベントごとの分類結果に基づいて学習されている予測方法である。

本開示の第５態様は、学習プログラムであって、予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、変動時の前記時空間データとの変動の度合いを表すイベント成分を抽出し、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、前記イベントごとの分類結果に基づいて、前記イベントごとに、前記時空間データの変動を予測するためのモデルを学習する、ことをコンピュータに実行させる。

本開示の第６態様は、予測プログラムであって、予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、入力された予測対象の前記時空間データとの変動の度合いを表すイベント成分を抽出し、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、前記イベントごとの分類結果に基づいて、前記イベントごとに学習された前記時空間データの変動を予測するためのモデルを用いて、前記イベントごとの前記時空間データの変動を予測する、ことをコンピュータに実行させる予測プログラムであって、前記モデルは、学習用の前記時空間データについての、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、前記イベントごとの分類結果に基づいて学習されている、予測プログラムである。

開示の技術によれば、イベントごとの変動を考慮した時空間データの予測を可能とし、全体の予測精度を向上できる。

本実施形態の学習装置の構成を示すブロック図である。学習装置及び予測装置のハードウェア構成を示すブロック図である。時空間データの一例を示す図である。本実施形態の予測装置の構成を示すブロック図である。学習装置による学習処理の流れを示すフローチャートである。予測装置による予測処理の流れを示すフローチャートである。分類処理の流れを示すフローチャートである。属性テンソルの一例を示す図である。成分行列の一例を示す図である。

以下、開示の技術の実施形態の一例を、図面を参照しつつ説明する。なお、各図面において同一又は等価な構成要素及び部分には同一の参照符号を付与している。また、図面の寸法比率は、説明の都合上誇張されており、実際の比率とは異なる場合がある。

まず、本開示の技術の概要について説明する。本実施形態では、時空間データに付随する属性情報を用いて、時空間データを関連性の強いクラスタごとにクラスタリングし、クラスタごとに時空間データの予測を行う。これにより、現実には誤っている相関を捉えるような学習及び予測を防ぎ、イベントの発生時においても精度の高い予測を可能とする。

以下、本実施形態の構成について説明する。本実施形態は、学習装置、及び予測装置による。学習装置、及び予測装置への入力はいずれも、観測された時空間データである。学習装置の出力はクラスタごとに学習されたモデルである。予測装置の出力は、予測対象時刻の各地点の予測値であり、これには属性を含まない。

＜学習装置＞
図１は、本実施形態の学習装置の構成を示すブロック図である。

図１に示すように、学習装置１００は、入力部１１０と、観測ＤＢ１２０と、抽出部１３０と、分類部１４０と、学習部１５０と、モデルＤＢ１６０とを含んで構成されている。

図２は、学習装置１００のハードウェア構成を示すブロック図である。

図２に示すように、学習装置１００は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１１、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１２、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１３、ストレージ１４、入力部１５、表示部１６及び通信インタフェース（Ｉ／Ｆ）１７を有する。各構成は、バス１９を介して相互に通信可能に接続されている。

ＣＰＵ１１は、中央演算処理ユニットであり、各種プログラムを実行したり、各部を制御したりする。すなわち、ＣＰＵ１１は、ＲＯＭ１２又はストレージ１４からプログラムを読み出し、ＲＡＭ１３を作業領域としてプログラムを実行する。ＣＰＵ１１は、ＲＯＭ１２又はストレージ１４に記憶されているプログラムに従って、上記各構成の制御及び各種の演算処理を行う。本実施形態では、ＲＯＭ１２又はストレージ１４には、学習プログラムが格納されている。

ＲＯＭ１２は、各種プログラム及び各種データを格納する。ＲＡＭ１３は、作業領域として一時的にプログラム又はデータを記憶する。ストレージ１４は、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）又はＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）により構成され、オペレーティングシステムを含む各種プログラム、及び各種データを格納する。

入力部１５は、マウス等のポインティングデバイス、及びキーボードを含み、各種の入力を行うために使用される。

表示部１６は、例えば、液晶ディスプレイであり、各種の情報を表示する。表示部１６は、タッチパネル方式を採用して、入力部１５として機能してもよい。

通信インタフェース１７は、端末等の他の機器と通信するためのインタフェースであり、例えば、イーサネット（登録商標）、ＦＤＤＩ、Ｗｉ－Ｆｉ（登録商標）等の規格が用いられる。

次に、学習装置１００の各機能構成について説明する。各機能構成は、ＣＰＵ１１がＲＯＭ１２又はストレージ１４に記憶された学習プログラムを読み出し、ＲＡＭ１３に展開して実行することにより実現される。

入力部１１０は、予め観測された通常時の時空間データを受け付け、観測ＤＢ１２０に格納する。図３は時空間データの一例を示す図である。観測ＤＢ１２０に格納される時空間データは、図３に示すように、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データである。属性とは、例えば「男，２０代」等のその時空間データの属性を表す情報である。ここで、通常時の時空間データとは、周期的な観測値が観測されている時空間データであり、イベントによる変動が生じていない時空間データである。入力部１１０は、変動時の時空間データを受け付ける。変動時の時空間データとは、イベントごとの変動が生じた際の時空間データである。

観測ＤＢ１２０は、入力部１１０で受け付けた通常時の時空間データと、変動時の時空間データとを格納するためのデータベースである。観測ＤＢ１２０には、図３に示したように、観測時刻、観測値、観測地点、及び属性の組が１つのレコードごとに格納され、これらを時空間データとして扱う。通常時の時空間データと、変動時の時空間データとは、テーブルを分けて格納すればよい。以下では、観測ＤＢ１２０に格納されたこれらの時空間データを用いて処理を行う。

抽出部１３０は、通常時の時空間データと、変動時の時空間データとの変動の度合いを表すイベント成分を抽出する。抽出部１３０は、観測ＤＢ１２０の変動時の時空間データと通常時の時空間データを比較し、所定の期間τのイベント成分を抽出する。ここでのイベント成分とは、観測値の変動を示す値を意味し、変動の観測値の差分である。例えば、通常時の時空間データは、時間の周期性が強くみられる人数の変動が観測値として観測ＤＢ１２０に格納されている。この場合、通常時の周期性から、例えば、水曜日の夜１０時にはどの地点にどの属性の人が何人程度観測できる、といった推定が可能である。期間τは、変動時を現在、通常時を過去として、現在の時刻から過去のある直近時刻までの期間と捉えられる。例えば、水曜日の夜９時から１０時の期間である。すなわち観測時刻ｉ及び観測地点ｊの観測値から期間の平均等によって推定された観測推定値を求められる。抽出部１３０は、通常時の観測推定値と、変動時の観測値を比較し、その差分をとって、学習用のイベント成分を抽出する。イベント成分は、期間τの属性付きの時空間データの観測値に代わる要素となる。期間τは、予測するためのモデルに用いる予測手法の入力として十分な期間を設定する。つまり、抽出部１３０は、期間τの時空間データに対応する観測時刻、観測地点、属性、及びイベント成分のデータの組の各々を分類部１４０に出力する。

分類部１４０は、期間τの時空間データに対応する観測時刻、観測地点、属性、及びイベント成分のデータの組の各々に基づいて、イベント成分を、予め与えられたイベントごとに分類する。ここでは、データの組の属性に基づいて、イベント成分を、それぞれが独立したイベントを示すクラスタにクラスタリングする。ここでいうイベントとは、上述したように、異なるイベント会場などであり、それぞれが関連性を持たずに独立したイベントである。ここでのクラスタリングには様々な手法を使用できる。単純な方法としては、属性ごとに異なるクラスタとする方法もある。しかし、より一般的に１つのイベントに複数の属性が混在している場合、さらには、同一地点及び同一時刻の観測値に複数の異なるイベントに属する観測が混在している場合にも対応できる手法が望ましい。例えば、ＬＤＡ（ＬａｔｅｎｔＤｉｒｉｃｈｌｅｔＡｌｌｏｃａｔｉｏｎ）などのトピックモデル、又はＮＴＦ（非負値テンソル因子分解）などによるクラスタリング手法を用いればよい。クラスタリングによるイベントごとの分類の詳細な処理の流れについては作用の説明において後述する。

学習部１５０は、イベントごとの分類結果に基づいて、イベントごとに、時空間データの変動を予測するためのモデルを学習し、学習したイベントごとのモデルをモデルＤＢ１６０に格納する。ここでイベントはクラスタに対応するため、クラスタごとのモデルを学習する。モデルの学習手法は、モデルを学習できる手法でれば何を用いてもよい。例えば、自己回帰モデル（ＡＲ）、又はロジスティック回帰などの時系列データに対する任意の回帰手法を用いる。また、ベクトル自己回帰モデル（ＶＡＲ）、状態空間モデル、ガウス過程回帰、又はＲＮＮ（ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋ）などの時空間データに対する様々な回帰手法、特許文献１のような、時空間データを対象とした様々な予測手法を用いてよい。

＜予測装置の構成＞
次に、予測装置の構成について説明する。図４は、本実施形態の予測装置の構成を示すブロック図である。

図４に示すように、予測装置２００は、入力部２１０と、観測ＤＢ２２０と、抽出部２３０と、分類部２４０と、モデルＤＢ２５０と、予測部２６０と、合成部２７０と、出力部２８０とを含んで構成されている。

なお、予測装置２００も学習装置１００と同様のハードウェア構成によって構成できる。図２に示すように、予測装置２００は、ＣＰＵ２１、ＲＯＭ２２、ＲＡＭ２３、ストレージ２４、入力部２５、表示部２６及び通信Ｉ／Ｆ２７を有する。各構成は、バス２９を介して相互に通信可能に接続されている。ＲＯＭ２２又はストレージ２４には、予測プログラムが格納されている。

入力部２１０は、入力された予測対象の時空間データを受け付け、観測ＤＢ２２０に格納する。

観測ＤＢ２２０は、予め観測された通常時の時空間データと、予測対象の時空間データとを格納するためのデータベースである。通常時の時空間データは予め格納しておく。通常時の時空間データと、予測対象の時空間データとは、テーブルを分けて格納すればよい。

抽出部２３０は、通常時の時空間データと、予測対象の時空間データとの変動の度合いを表すイベント成分を抽出する。イベント成分の抽出手法は、上記学習装置１００の抽出部１３０で説明した手法と同じである。抽出部１３０は、期間τの時空間データに対応する観測時刻、観測地点、属性、及びイベント成分のデータの組の各々を分類部２４０に出力する。

分類部２４０は、期間τの時空間データに対応する観測時刻、観測地点、属性、及びイベント成分のデータの組の各々に基づいて、イベント成分を、予め与えられたイベントごとに分類する。イベント成分を分類するためのクラスタリング手法は、上記学習装置１００の分類部１４０で説明した手法と同じである。

モデルＤＢ２５０には、学習装置１００でイベントごとに学習された時空間データの変動を予測するための各々が格納されている。

予測部２６０は、イベントごとの分類結果に基づいて、イベントごとに学習されたモデルを用いて、イベントごとの時空間データの変動を予測する。予測部２６０が出力する予測値は、クラスタごとの、予測対象となる時刻ｔ_ｆの時刻ｉ及び地点ｊの予測値を要素とした３次元のテンソルである。時刻ｔ_ｆは、期間τから予測可能なモデルにおいて定義された時刻である。予測部２６０は、予測したクラスタの各々の予測値を合成部２７０に出力する。

合成部２７０は、予測部２６０で出力されたクラスタの各々の予測値と、通常時の観測推定値とを足し合わせて最終的な予測値を合成する。通常時の観測推定値は、観測ＤＢ２２０の通常時の時空間データの観測時刻ｉ及び観測地点ｊから予測対象となる時刻ｔ_ｆについて求めればよい。クラスタの各々の予測値を使うため、イベントごとに独立した予測値を反映した予測結果が最終的な予測値として求められる。

出力部２８０は、合成部２７０で合成された最終的な予測値を外部に出力して処理を終了する。

＜学習装置の作用＞
次に、学習装置１００の作用について説明する。

図５は、学習装置１００による学習処理の流れを示すフローチャートである。ＣＰＵ１１がＲＯＭ１２又はストレージ１４から学習プログラムを読み出して、ＲＡＭ１３に展開して実行することにより、学習処理が行なわれる。学習装置１００は、入力として、予め観測された通常時の時空間データ、及び変動時の時空間データを受け付けて観測ＤＢ１２０に格納して以下の処理を行う。

ステップＳ１００で、ＣＰＵ１１は、通常時の時空間データと、変動時の時空間データとの変動の度合いを表すイベント成分を抽出する。

ステップＳ１０２で、ＣＰＵ１１は、期間τの時空間データに対応する観測時刻、観測地点、属性、及びイベント成分のデータの組の各々に基づいて、イベント成分を、予め与えられたイベントごとに分類する。なお、分類の詳細な処理の流れは後述する。

ステップＳ１０４で、ＣＰＵ１１は、イベントごとの分類結果に基づいて、イベントごとに、時空間データの変動を予測するためのモデルを学習し、学習したイベントごとのモデルをモデルＤＢ１６０に格納する。

以上説明したように本実施形態の学習装置１００によれば、イベントごとの変動を考慮した時空間データを予測するためのモデルを学習できる。

＜予測装置の作用＞
次に、予測装置２００の作用について説明する。

図６は、予測装置２００による予測処理の流れを示すフローチャートである。ＣＰＵ２１がＲＯＭ２２又はストレージ２４から予測プログラムを読み出して、ＲＡＭ２３に展開して実行することにより、予測処理が行なわれる。予測装置２００は、入力として、予測対象の時空間データを受け付けて観測ＤＢ２２０に格納して以下の処理を行う。

ステップＳ２００で、ＣＰＵ２１は、通常時の時空間データと、予測対象の時空間データとの変動の度合いを表すイベント成分を抽出する。

ステップＳ２０２で、ＣＰＵ２１は、期間τの時空間データに対応する観測時刻、観測地点、属性、及びイベント成分のデータの組の各々に基づいて、イベント成分を、予め与えられたイベントごとに分類する。なお、分類の詳細な処理の流れは後述する。

ステップＳ２０４で、ＣＰＵ２１は、イベントごとの分類結果に基づいて、イベントごとに学習されたモデルを用いて、イベントごとの時空間データの変動を予測する。すなわち、クラスタごとの予測値を出力する。

ステップＳ２０６で、ＣＰＵ２１は、ステップＳ２０４で出力されたクラスタの各々の予測値と、通常時の観測推定値とを足し合わせて最終的な予測値を合成する。

ステップＳ２０８で、ＣＰＵ２１は、ステップＳ２０６で合成された最終的な予測値を外部に出力して処理を終了する。

次に上記ステップＳ１０２及びＳ２０２の分類に係る、分類部１４０又は分類部２４０としての処理の詳細を説明する。図７は、分類処理の流れを示すフローチャートである。以下は、予測装置２００の分類部２４０として処理する場合を例に説明するが、学習装置１００の分類部１４０であっても同様であり、各ステップの処理をＣＰＵ１１が実行すればよい。

ステップ１０００で、ＣＰＵ２１は、期間τの時空間データに対応する観測時刻、観測地点、属性、及びイベント成分のデータの組の各々から、属性テンソル及び成分行列を作成する。属性テンソルは、いわば、時空間属性テンソルである。成分行列は、いわば、時空間イベント成分行列である。属性テンソルは以下で表される、観測時刻Ｉ、観測地点Ｊ、及び属性Ｋの３つの次元からなり、属性テンソルの各要素ｘ_ｉｊｋはイベント成分の絶対値である。以降、説明の便宜のためｘをイベント成分とも表記する。

属性テンソルはクラスタリングの入力として用いる。図８は、属性テンソルの一例を示す図である。

成分行列は以下で表される、観測時刻Ｉ、観測地点Ｊからなる行列であり、行列の各要素ｅ_ｉｊは時刻ｉ、地点ｊの全ての属性のイベント成分を足し合わせた値である。

成分行列は、クラスタリングの結果出力されるクラスタの各々の所属率と掛け合わせクラスタごとの時空間データとする。クラスタごとの時空間データは、次の処理で、クラスタごとの予測値を生成するために用いる。図９は、成分行列の一例を示す図である。

以上のように、ステップＳ１０００では、観測時刻Ｉ、観測地点Ｊ、及び属性Ｋを次元とし各要素をイベント成分ｘとするテンソルである属性テンソルＸを作成する。また、ステップＳ１０００では、観測時刻Ｉ及び観測地点Ｊを行列とし全属性のイベント成分の合計値を要素とする成分行列Ｅを作成する。

ステップＳ１００２で、ＣＰＵ２１は、クラスタリングによって生成するクラスタ数Ｒを設定する。適切なクラスタ数は、対象となるイベント成分のデータを構成するイベント数である。イベント数が予めわかっている場合には、その値をクラスタ数Ｒに設定し、わかっていない場合には過去データの傾向から判断して定めればよい。

ステップＳ１００４で、ＣＰＵ２１は、属性テンソルＸに対しＮＴＦを用いてクラスタリングを行う。ここでは、３次の属性テンソルＸを、ランク数をクラスタ数Ｒとした以下の３個の行列Ａ，Ｂ，Ｃの内積としてテンソル分解を行う。

テンソル分解は、分解後の行列Ａ，Ｂ，Ｃの内積＾Ｘ＝［＾ｘ_ｉｊｋ］（＾は数式では後ろの記号の上に付く、以下同様）が、元のテンソルＸ＝［ｘ_ｉｊｋ］を再現するように分解を行う。具体的には下記（１）式の目的関数を最小化するように行列Ａ，Ｂ，Ｃを求める。

・・・（１）

ここで、ｄｄ（・，・）は距離関数を表し、ＫＬダイバージェンス、又はユークリッド距離が用いられる。以上のように、ステップＳ１００４では、イベントをクラスタとし、属性テンソルをクラスタごとに、観測時刻Ｉで表す行列Ａ、観測地点Ｊで表す行列Ｂ、及び属性Ｋで表す行列Ｃの内積となるようにテンソル分解してクラスタリングする。これにより行列Ａ，Ｂ，Ｃからクラスタごとのイベント成分＾ｘ_ｉｊｋが求められる。

ステップＳ１００６で、ＣＰＵ２１は、テンソル分解によって得られた行列Ａ，Ｂ，Ｃを使って、クラスタごとのイベント成分ｘの所属率Ｐを求める。以下、所属率Ｐを求めるための処理の流れを説明する。まず、イベント成分＾ｘ_ｉｊｋは、下記（２）式のように表せる。

・・・（２）

クラスタリングのために用いた属性の情報は、予測値を求めるための処理では使用しないため、以下（３）式のように、各ランクの属性テンソルの属性ごとのイベント成分を足し合わせて属性列を消去する。

・・・（３）

さらに、下記（４）式のようにイベント成分＾ｘ_ｉｊｒをクラスタｒの総和で割り、クラスタｒについての割合に変換する。

・・・（４）

このようにして生成されたＰ_ｒ＝［ｐ_ｉｊｒ］は、イベント成分＾ｘ_ｉｊｒのクラスタｒの所属率を表すと同時に、時空間データがクラスタｒに所属する割合を示す所属率を表している。

以上のように、ステップＳ１００６では、クラスタごとに、イベント成分が当該クラスタに所属する割合を示す所属率を求める。

ステップＳ１００８で、ＣＰＵ２１は、クラスタごとの所属率Ｐ_ｒと、成分行列Ｅとに基づいて、クラスタごとの時空間データを生成して出力する。クラスタごとの時空間データは、イベントごとの分類結果として予測値を求めるための処理、すなわちステップＳ１０４又はステップＳ２０４に受け渡される。以下（５）式のように、ステップＳ１０００で生成した成分行列Ｅとクラスタごとの所属率Ｐ_ｒとの内積をとり、クラスタごとの時空間データＳ_ｒを生成し、出力する。クラスタごとの時空間データＳ_ｒは、観測時刻及び観測地点の要素として当該クラスタｒの成分を含む時空間データである。

・・・（５）

クラスタｒの成分とは、成分行列Ｅとクラスタごとの所属率Ｐ_ｒとの内積をとった結果得られる各要素であり、成分行列Ｅで表される変動の度合いと、所属率Ｐ_ｒで表されるクラスタにおけるイベント成分の割合とを反映した成分といえる。以上のように、ステップＳ１００８では、クラスタごとの所属率と、成分行列との内積を求めて得られる、クラスタごとの時空間データをイベントごとの分類結果として出力する。上述したステップＳ２０４では、このようにして得られたクラスタごとの時空間データを、クラスタごとのモデルの入力として用いて予測を行うため、クラスタごとに適切な予測値の出力が可能となる。同様に、上述したステップＳ１０４では、このようにして得られたクラスタごとの時空間データを、クラスタごとのモデルの学習の入力として用いて学習を行うため、クラスタごとに適切な予測値の出力が可能なモデルを学習できる。

以上説明したように本実施形態の予測装置２００によれば、イベントごとの変動を考慮した時空間データの予測を可能とし、全体の予測精度を向上できる。

なお、上記各実施形態でＣＰＵがソフトウェア（プログラム）を読み込んで実行した学習処理又は予測処理を、ＣＰＵ以外の各種のプロセッサが実行してもよい。この場合のプロセッサとしては、ＦＰＧＡ（Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）等の製造後に回路構成を変更可能なＰＬＤ（ＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ）、及びＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が例示される。また、学習処理又は予測処理を、これらの各種のプロセッサのうちの１つで実行してもよいし、同種又は異種の２つ以上のプロセッサの組み合わせ（例えば、複数のＦＰＧＡ、及びＣＰＵとＦＰＧＡとの組み合わせ等）で実行してもよい。また、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路である。

また、上記実施形態では、学習プログラムがストレージ１４に予め記憶（インストール）されている態様を説明したが、これに限定されない。プログラムは、ＣＤ－ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｋＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＤＶＤ－ＲＯＭ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、及びＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）メモリ等の非一時的（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙ）記憶媒体に記憶された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。

以上の実施形態に関し、更に以下の付記を開示する。

（付記項１）
メモリと、
前記メモリに接続された少なくとも１つのプロセッサと、
を含み、
前記プロセッサは、
予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、変動時の前記時空間データとの変動の度合いを表すイベント成分を抽出し、
前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、
前記イベントごとの分類結果に基づいて、前記イベントごとに、前記時空間データの変動を予測するためのモデルを学習する、
ように構成されている学習装置。

（付記項２）
予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、変動時の前記時空間データとの変動の度合いを表すイベント成分を抽出し、
前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、
前記イベントごとの分類結果に基づいて、前記イベントごとに、前記時空間データの変動を予測するためのモデルを学習する、
ことをコンピュータに実行させる学習プログラムを記憶した非一時的記憶媒体。

１００学習装置
１１０入力部
１２０観測ＤＢ
１３０抽出部
１４０分類部
１５０学習部
１６０モデルＤＢ
２００予測装置
２１０入力部
２２０観測ＤＢ
２３０抽出部
２４０分類部
２５０モデルＤＢ
２６０予測部
２７０合成部
２８０出力部

Claims

予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、変動時の前記時空間データとの観測値の差分を、変動の度合いを表すイベント成分として抽出する抽出部と、
前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々に基づいて、予め与えられた複数のイベントの各々をクラスタとして扱い、所定のクラスタリング手法により前記組をクラスタリングすることにより、クラスタごとの所定のクラスタ時空間データを生成し、前記クラスタ時空間データを分類結果として出力する分類部と、
前記分類結果に基づいて、前記イベントごとに、学習手法として時系列データを対象とした予測を行うための回帰手法を用いて、前記時空間データの変動を予測するためのモデルを学習する学習部と、
を含み、
前記分類部は、
前記観測時刻、前記観測地点、及び前記属性を次元とし各要素を前記イベント成分とするテンソルである属性テンソル、並びに前記観測地点、及び前記観測時刻を行列とし全属性の前記イベント成分の合計値を要素とする成分行列を作成し、
前記属性テンソルを前記クラスタごとに、前記観測時刻で表す行列、前記観測地点で表す行列、及び前記属性で表す行列の内積となるようにテンソル分解してクラスタリングを行い、テンソル分解して得られた各行列から当該クラスタのイベント成分を求め、
前記クラスタごとに、全てのクラスタのイベント成分の総和に対する当該クラスタのイベント成分の割合から、当該クラスタのイベント成分が当該クラスタに所属する割合を示す所属率を求め、
前記クラスタごとの確率ベクトルとしての前記所属率と、前記成分行列との内積を求めて、当該クラスタの成分を含む前記クラスタ時空間データを生成し、前記イベントごとの分類結果とする、
学習装置。
予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、入力された予測対象の前記時空間データとの観測値の差分を、変動の度合いを表すイベント成分として抽出する抽出部と、
前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々に基づいて、予め与えられた複数のイベントの各々をクラスタとして扱い、所定のクラスタリング手法により前記組をクラスタリングすることにより、クラスタごとの所定のクラスタ時空間データを生成し、前記クラスタ時空間データを分類結果として出力する分類部と、
前記分類結果に基づいて、前記イベントごとに学習された前記時空間データの変動を予測するためのモデルを用いて、前記イベントごとの前記時空間データの変動を予測する予測部と、を含み、
前記モデルは、学習用の前記時空間データについての、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々をクラスタリングした前記イベントごとの前記分類結果に基づいて、学習手法として時系列データを対象とした予測を行うための回帰手法を用いて学習されており、
前記分類部は、
前記観測時刻、前記観測地点、及び前記属性を次元とし各要素を前記イベント成分とするテンソルである属性テンソル、並びに前記観測地点、及び前記観測時刻を行列とし全属性の前記イベント成分の合計値を要素とする成分行列を作成し、
前記属性テンソルを前記クラスタごとに、前記観測時刻で表す行列、前記観測地点で表す行列、及び前記属性で表す行列の内積となるようにテンソル分解してクラスタリングを行い、テンソル分解して得られた各行列から当該クラスタのイベント成分を求め、
前記クラスタごとに、全てのクラスタのイベント成分の総和に対する当該クラスタのイベント成分の割合から、当該クラスタのイベント成分が当該クラスタに所属する割合を示す所属率を求め、
前記クラスタごとの確率ベクトルとしての前記所属率と、前記成分行列との内積を求めて、当該クラスタの成分を含む前記クラスタ時空間データを生成し、前記イベントごとの分類結果とする、
予測装置。
予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、変動時の前記時空間データとの観測値の差分を、変動の度合いを表すイベント成分として抽出し、
前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々に基づいて、予め与えられた複数のイベントの各々をクラスタとして扱い、所定のクラスタリング手法により前記組をクラスタリングすることにより、クラスタごとの所定のクラスタ時空間データを生成し、前記クラスタ時空間データを分類結果として出力し、
前記分類結果に基づいて、前記イベントごとに、学習手法として時系列データを対象とした予測を行うための回帰手法を用いて、前記時空間データの変動を予測するためのモデルを学習する、
ことを含む処理をコンピュータが実行することを特徴とする学習方法であって、
前記分類結果を求める処理では、
前記観測時刻、前記観測地点、及び前記属性を次元とし各要素を前記イベント成分とするテンソルである属性テンソル、並びに前記観測地点、及び前記観測時刻を行列とし全属性の前記イベント成分の合計値を要素とする成分行列を作成し、
前記属性テンソルを前記クラスタごとに、前記観測時刻で表す行列、前記観測地点で表す行列、及び前記属性で表す行列の内積となるようにテンソル分解してクラスタリングを行い、テンソル分解して得られた各行列から当該クラスタのイベント成分を求め、
前記クラスタごとに、全てのクラスタのイベント成分の総和に対する当該クラスタのイベント成分の割合から、当該クラスタのイベント成分が当該クラスタに所属する割合を示す所属率を求め、
前記クラスタごとの確率ベクトルとしての前記所属率と、前記成分行列との内積を求めて、当該クラスタの成分を含む前記クラスタ時空間データを生成し、前記イベントごとの分類結果とする、学習方法。
予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、入力された予測対象の前記時空間データとの観測値の差分を、変動の度合いを表すイベント成分として抽出し、
前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々に基づいて、予め与えられた複数のイベントの各々をクラスタとして扱い、所定のクラスタリング手法により前記組をクラスタリングすることにより、クラスタごとの所定のクラスタ時空間データを生成し、前記クラスタ時空間データを分類結果として出力し、
前記分類結果に基づいて、前記イベントごとに学習された前記時空間データの変動を予測するためのモデルを用いて、前記イベントごとの前記時空間データの変動を予測する、ことを含む処理をコンピュータが実行することを特徴とする予測方法であって、
前記モデルは、学習用の前記時空間データについての、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々をクラスタリングした前記イベントごとの前記分類結果に基づいて、学習手法として時系列データを対象とした予測を行うための回帰手法を用いて学習されており、
前記分類結果を求める処理では、
前記観測時刻、前記観測地点、及び前記属性を次元とし各要素を前記イベント成分とするテンソルである属性テンソル、並びに前記観測地点、及び前記観測時刻を行列とし全属性の前記イベント成分の合計値を要素とする成分行列を作成し、
前記属性テンソルを前記クラスタごとに、前記観測時刻で表す行列、前記観測地点で表す行列、及び前記属性で表す行列の内積となるようにテンソル分解してクラスタリングを行い、テンソル分解して得られた各行列から当該クラスタのイベント成分を求め、
前記クラスタごとに、全てのクラスタのイベント成分の総和に対する当該クラスタのイベント成分の割合から、当該クラスタのイベント成分が当該クラスタに所属する割合を示す所属率を求め、
前記クラスタごとの確率ベクトルとしての前記所属率と、前記成分行列との内積を求めて、当該クラスタの成分を含む前記クラスタ時空間データを生成し、前記イベントごとの分類結果とする、予測方法。
予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、変動時の前記時空間データとの観測値の差分を、変動の度合いを表すイベント成分として抽出し、
前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々に基づいて、予め与えられた複数のイベントの各々をクラスタとして扱い、所定のクラスタリング手法により前記組をクラスタリングすることにより、クラスタごとの所定のクラスタ時空間データを生成し、前記クラスタ時空間データを分類結果として出力し、
前記分類結果に基づいて、前記イベントごとに、学習手法として時系列データを対象とした予測を行うための回帰手法を用いて、前記時空間データの変動を予測するためのモデルを学習する、
ことをコンピュータに実行させる学習プログラムであって、
前記分類結果を求める処理では、
前記観測時刻、前記観測地点、及び前記属性を次元とし各要素を前記イベント成分とするテンソルである属性テンソル、並びに前記観測地点、及び前記観測時刻を行列とし全属性の前記イベント成分の合計値を要素とする成分行列を作成し、
前記属性テンソルを前記クラスタごとに、前記観測時刻で表す行列、前記観測地点で表す行列、及び前記属性で表す行列の内積となるようにテンソル分解してクラスタリングを行い、テンソル分解して得られた各行列から当該クラスタのイベント成分を求め、
前記クラスタごとに、全てのクラスタのイベント成分の総和に対する当該クラスタのイベント成分の割合から、当該クラスタのイベント成分が当該クラスタに所属する割合を示す所属率を求め、
前記クラスタごとの確率ベクトルとしての前記所属率と、前記成分行列との内積を求めて、当該クラスタの成分を含む前記クラスタ時空間データを生成し、前記イベントごとの分類結果とする、学習プログラム。
予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、入力された予測対象の前記時空間データとの観測値の差分を、変動の度合いを表すイベント成分として抽出し、
前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々に基づいて、予め与えられた複数のイベントの各々をクラスタとして扱い、所定のクラスタリング手法により前記組をクラスタリングすることにより、クラスタごとの所定のクラスタ時空間データを生成し、前記クラスタ時空間データを分類結果として出力し、
前記分類結果に基づいて、前記イベントごとに学習された前記時空間データの変動を予測するためのモデルを用いて、前記イベントごとの前記時空間データの変動を予測する、ことをコンピュータに実行させる予測プログラムであって、
前記モデルは、学習用の前記時空間データについての、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々をクラスタリングした前記イベントごとの前記分類結果に基づいて、学習手法として時系列データを対象とした予測を行うための回帰手法を用いて学習されており、
前記分類結果を求める処理では、
前記観測時刻、前記観測地点、及び前記属性を次元とし各要素を前記イベント成分とするテンソルである属性テンソル、並びに前記観測地点、及び前記観測時刻を行列とし全属性の前記イベント成分の合計値を要素とする成分行列を作成し、
前記属性テンソルを前記クラスタごとに、前記観測時刻で表す行列、前記観測地点で表す行列、及び前記属性で表す行列の内積となるようにテンソル分解してクラスタリングを行い、テンソル分解して得られた各行列から当該クラスタのイベント成分を求め、
前記クラスタごとに、全てのクラスタのイベント成分の総和に対する当該クラスタのイベント成分の割合から、当該クラスタのイベント成分が当該クラスタに所属する割合を示す所属率を求め、
前記クラスタごとの確率ベクトルとしての前記所属率と、前記成分行列との内積を求めて、当該クラスタの成分を含む前記クラスタ時空間データを生成し、前記イベントごとの分類結果とする、予測プログラム。