JP7294421B2 - 学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラム - Google Patents

学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラム Download PDF

Info

Publication number
JP7294421B2
JP7294421B2 JP2021528754A JP2021528754A JP7294421B2 JP 7294421 B2 JP7294421 B2 JP 7294421B2 JP 2021528754 A JP2021528754 A JP 2021528754A JP 2021528754 A JP2021528754 A JP 2021528754A JP 7294421 B2 JP7294421 B2 JP 7294421B2
Authority
JP
Japan
Prior art keywords
cluster
event
spatio
temporal data
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021528754A
Other languages
English (en)
Other versions
JPWO2020261449A1 (ja
Inventor
大祐 佐藤
達史 松林
浩之 戸田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2020261449A1 publication Critical patent/JPWO2020261449A1/ja
Application granted granted Critical
Publication of JP7294421B2 publication Critical patent/JP7294421B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

開示の技術は、学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラムに関する。
時空間データを予測するための手法は、これまでにも数多く提案されている。中でも、特許文献1に記載される従来手法は、例えばイベント会場に急激に人が集まるような、通常時と異なる突発的な変動を含む時空間データに対しても予測が可能である。
特開2018-22237号公報
特許文献1に記載される手法は、時空間データの変動を区別することなく入力として扱うため、誤った相関を学習してしまう可能性がある。これを防ぐことが精度向上のためには重要である。例えば、あるエリアに2つの大規模イベント会場があり、お互いのイベントの参加者の行動にはまったく関係がないような場合がある。この手法では、2つのイベントに関係する参加者の変動を、イベントを考慮せずに増減の相関関係を捉えてしまうような場合が考えられ、予測の精度低下が問題となる。
本開示は、イベントごとの変動を考慮した時空間データの予測を可能とし、全体の予測精度を向上できる学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラムを提供することを目的とする。
本開示の第1態様は、学習装置であって、予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、変動時の前記時空間データとの変動の度合いを表すイベント成分を抽出する抽出部と、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類する分類部と、前記イベントごとの分類結果に基づいて、前記イベントごとに、前記時空間データの変動を予測するためのモデルを学習する学習部と、を含む。
本開示の第2態様は、予測装置であって、予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、入力された予測対象の前記時空間データとの変動の度合いを表すイベント成分を抽出する抽出部と、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類する分類部と、前記イベントごとの分類結果に基づいて、前記イベントごとに学習された前記時空間データの変動を予測するためのモデルを用いて、前記イベントごとの前記時空間データの変動を予測する予測部と、を含み、前記モデルは、学習用の前記時空間データについての、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、前記イベントごとの分類結果に基づいて学習されている。
本開示の第3態様は、学習方法であって、予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、変動時の前記時空間データとの変動の度合いを表すイベント成分を抽出し、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、前記イベントごとの分類結果に基づいて、前記イベントごとに、前記時空間データの変動を予測するためのモデルを学習する、ことを含む処理をコンピュータが実行することを特徴とする。
本開示の第4態様は、予測方法であって、予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、入力された予測対象の前記時空間データとの変動の度合いを表すイベント成分を抽出し、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、前記イベントごとの分類結果に基づいて、前記イベントごとに学習された前記時空間データの変動を予測するためのモデルを用いて、前記イベントごとの前記時空間データの変動を予測する、ことを含む処理をコンピュータが実行することを特徴とする予測方法であって、前記モデルは、学習用の前記時空間データについての、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、前記イベントごとの分類結果に基づいて学習されている予測方法である。
本開示の第5態様は、学習プログラムであって、予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、変動時の前記時空間データとの変動の度合いを表すイベント成分を抽出し、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、前記イベントごとの分類結果に基づいて、前記イベントごとに、前記時空間データの変動を予測するためのモデルを学習する、ことをコンピュータに実行させる。
本開示の第6態様は、予測プログラムであって、予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、入力された予測対象の前記時空間データとの変動の度合いを表すイベント成分を抽出し、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、前記イベントごとの分類結果に基づいて、前記イベントごとに学習された前記時空間データの変動を予測するためのモデルを用いて、前記イベントごとの前記時空間データの変動を予測する、ことをコンピュータに実行させる予測プログラムであって、前記モデルは、学習用の前記時空間データについての、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、前記イベントごとの分類結果に基づいて学習されている、予測プログラムである。
開示の技術によれば、イベントごとの変動を考慮した時空間データの予測を可能とし、全体の予測精度を向上できる。
本実施形態の学習装置の構成を示すブロック図である。 学習装置及び予測装置のハードウェア構成を示すブロック図である。 時空間データの一例を示す図である。 本実施形態の予測装置の構成を示すブロック図である。 学習装置による学習処理の流れを示すフローチャートである。 予測装置による予測処理の流れを示すフローチャートである。 分類処理の流れを示すフローチャートである。 属性テンソルの一例を示す図である。 成分行列の一例を示す図である。
以下、開示の技術の実施形態の一例を、図面を参照しつつ説明する。なお、各図面において同一又は等価な構成要素及び部分には同一の参照符号を付与している。また、図面の寸法比率は、説明の都合上誇張されており、実際の比率とは異なる場合がある。
まず、本開示の技術の概要について説明する。本実施形態では、時空間データに付随する属性情報を用いて、時空間データを関連性の強いクラスタごとにクラスタリングし、クラスタごとに時空間データの予測を行う。これにより、現実には誤っている相関を捉えるような学習及び予測を防ぎ、イベントの発生時においても精度の高い予測を可能とする。
以下、本実施形態の構成について説明する。本実施形態は、学習装置、及び予測装置による。学習装置、及び予測装置への入力はいずれも、観測された時空間データである。学習装置の出力はクラスタごとに学習されたモデルである。予測装置の出力は、予測対象時刻の各地点の予測値であり、これには属性を含まない。
<学習装置>
図1は、本実施形態の学習装置の構成を示すブロック図である。
図1に示すように、学習装置100は、入力部110と、観測DB120と、抽出部130と、分類部140と、学習部150と、モデルDB160とを含んで構成されている。
図2は、学習装置100のハードウェア構成を示すブロック図である。
図2に示すように、学習装置100は、CPU(Central Processing Unit)11、ROM(Read Only Memory)12、RAM(Random Access Memory)13、ストレージ14、入力部15、表示部16及び通信インタフェース(I/F)17を有する。各構成は、バス19を介して相互に通信可能に接続されている。
CPU11は、中央演算処理ユニットであり、各種プログラムを実行したり、各部を制御したりする。すなわち、CPU11は、ROM12又はストレージ14からプログラムを読み出し、RAM13を作業領域としてプログラムを実行する。CPU11は、ROM12又はストレージ14に記憶されているプログラムに従って、上記各構成の制御及び各種の演算処理を行う。本実施形態では、ROM12又はストレージ14には、学習プログラムが格納されている。
ROM12は、各種プログラム及び各種データを格納する。RAM13は、作業領域として一時的にプログラム又はデータを記憶する。ストレージ14は、HDD(Hard Disk Drive)又はSSD(Solid State Drive)により構成され、オペレーティングシステムを含む各種プログラム、及び各種データを格納する。
入力部15は、マウス等のポインティングデバイス、及びキーボードを含み、各種の入力を行うために使用される。
表示部16は、例えば、液晶ディスプレイであり、各種の情報を表示する。表示部16は、タッチパネル方式を採用して、入力部15として機能してもよい。
通信インタフェース17は、端末等の他の機器と通信するためのインタフェースであり、例えば、イーサネット(登録商標)、FDDI、Wi-Fi(登録商標)等の規格が用いられる。
次に、学習装置100の各機能構成について説明する。各機能構成は、CPU11がROM12又はストレージ14に記憶された学習プログラムを読み出し、RAM13に展開して実行することにより実現される。
入力部110は、予め観測された通常時の時空間データを受け付け、観測DB120に格納する。図3は時空間データの一例を示す図である。観測DB120に格納される時空間データは、図3に示すように、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データである。属性とは、例えば「男,20代」等のその時空間データの属性を表す情報である。ここで、通常時の時空間データとは、周期的な観測値が観測されている時空間データであり、イベントによる変動が生じていない時空間データである。入力部110は、変動時の時空間データを受け付ける。変動時の時空間データとは、イベントごとの変動が生じた際の時空間データである。
観測DB120は、入力部110で受け付けた通常時の時空間データと、変動時の時空間データとを格納するためのデータベースである。観測DB120には、図3に示したように、観測時刻、観測値、観測地点、及び属性の組が1つのレコードごとに格納され、これらを時空間データとして扱う。通常時の時空間データと、変動時の時空間データとは、テーブルを分けて格納すればよい。以下では、観測DB120に格納されたこれらの時空間データを用いて処理を行う。
抽出部130は、通常時の時空間データと、変動時の時空間データとの変動の度合いを表すイベント成分を抽出する。抽出部130は、観測DB120の変動時の時空間データと通常時の時空間データを比較し、所定の期間τのイベント成分を抽出する。ここでのイベント成分とは、観測値の変動を示す値を意味し、変動の観測値の差分である。例えば、通常時の時空間データは、時間の周期性が強くみられる人数の変動が観測値として観測DB120に格納されている。この場合、通常時の周期性から、例えば、水曜日の夜10時にはどの地点にどの属性の人が何人程度観測できる、といった推定が可能である。期間τは、変動時を現在、通常時を過去として、現在の時刻から過去のある直近時刻までの期間と捉えられる。例えば、水曜日の夜9時から10時の期間である。すなわち観測時刻i及び観測地点jの観測値から期間の平均等によって推定された観測推定値を求められる。抽出部130は、通常時の観測推定値と、変動時の観測値を比較し、その差分をとって、学習用のイベント成分を抽出する。イベント成分は、期間τの属性付きの時空間データの観測値に代わる要素となる。期間τは、予測するためのモデルに用いる予測手法の入力として十分な期間を設定する。つまり、抽出部130は、期間τの時空間データに対応する観測時刻、観測地点、属性、及びイベント成分のデータの組の各々を分類部140に出力する。
分類部140は、期間τの時空間データに対応する観測時刻、観測地点、属性、及びイベント成分のデータの組の各々に基づいて、イベント成分を、予め与えられたイベントごとに分類する。ここでは、データの組の属性に基づいて、イベント成分を、それぞれが独立したイベントを示すクラスタにクラスタリングする。ここでいうイベントとは、上述したように、異なるイベント会場などであり、それぞれが関連性を持たずに独立したイベントである。ここでのクラスタリングには様々な手法を使用できる。単純な方法としては、属性ごとに異なるクラスタとする方法もある。しかし、より一般的に1つのイベントに複数の属性が混在している場合、さらには、同一地点及び同一時刻の観測値に複数の異なるイベントに属する観測が混在している場合にも対応できる手法が望ましい。例えば、LDA(Latent Dirichlet Allocation)などのトピックモデル、又はNTF(非負値テンソル因子分解)などによるクラスタリング手法を用いればよい。クラスタリングによるイベントごとの分類の詳細な処理の流れについては作用の説明において後述する。
学習部150は、イベントごとの分類結果に基づいて、イベントごとに、時空間データの変動を予測するためのモデルを学習し、学習したイベントごとのモデルをモデルDB160に格納する。ここでイベントはクラスタに対応するため、クラスタごとのモデルを学習する。モデルの学習手法は、モデルを学習できる手法でれば何を用いてもよい。例えば、自己回帰モデル(AR)、又はロジスティック回帰などの時系列データに対する任意の回帰手法を用いる。また、ベクトル自己回帰モデル(VAR)、状態空間モデル、ガウス過程回帰、又はRNN(Recurrent Neural Network)などの時空間データに対する様々な回帰手法、特許文献1のような、時空間データを対象とした様々な予測手法を用いてよい。
<予測装置の構成>
次に、予測装置の構成について説明する。図4は、本実施形態の予測装置の構成を示すブロック図である。
図4に示すように、予測装置200は、入力部210と、観測DB220と、抽出部230と、分類部240と、モデルDB250と、予測部260と、合成部270と、出力部280とを含んで構成されている。
なお、予測装置200も学習装置100と同様のハードウェア構成によって構成できる。図2に示すように、予測装置200は、CPU21、ROM22、RAM23、ストレージ24、入力部25、表示部26及び通信I/F27を有する。各構成は、バス29を介して相互に通信可能に接続されている。ROM22又はストレージ24には、予測プログラムが格納されている。
入力部210は、入力された予測対象の時空間データを受け付け、観測DB220に格納する。
観測DB220は、予め観測された通常時の時空間データと、予測対象の時空間データとを格納するためのデータベースである。通常時の時空間データは予め格納しておく。通常時の時空間データと、予測対象の時空間データとは、テーブルを分けて格納すればよい。
抽出部230は、通常時の時空間データと、予測対象の時空間データとの変動の度合いを表すイベント成分を抽出する。イベント成分の抽出手法は、上記学習装置100の抽出部130で説明した手法と同じである。抽出部130は、期間τの時空間データに対応する観測時刻、観測地点、属性、及びイベント成分のデータの組の各々を分類部240に出力する。
分類部240は、期間τの時空間データに対応する観測時刻、観測地点、属性、及びイベント成分のデータの組の各々に基づいて、イベント成分を、予め与えられたイベントごとに分類する。イベント成分を分類するためのクラスタリング手法は、上記学習装置100の分類部140で説明した手法と同じである。
モデルDB250には、学習装置100でイベントごとに学習された時空間データの変動を予測するための各々が格納されている。
予測部260は、イベントごとの分類結果に基づいて、イベントごとに学習されたモデルを用いて、イベントごとの時空間データの変動を予測する。予測部260が出力する予測値は、クラスタごとの、予測対象となる時刻tの時刻i及び地点jの予測値を要素とした3次元のテンソルである。時刻tは、期間τから予測可能なモデルにおいて定義された時刻である。予測部260は、予測したクラスタの各々の予測値を合成部270に出力する。
合成部270は、予測部260で出力されたクラスタの各々の予測値と、通常時の観測推定値とを足し合わせて最終的な予測値を合成する。通常時の観測推定値は、観測DB220の通常時の時空間データの観測時刻i及び観測地点jから予測対象となる時刻tについて求めればよい。クラスタの各々の予測値を使うため、イベントごとに独立した予測値を反映した予測結果が最終的な予測値として求められる。
出力部280は、合成部270で合成された最終的な予測値を外部に出力して処理を終了する。
<学習装置の作用>
次に、学習装置100の作用について説明する。
図5は、学習装置100による学習処理の流れを示すフローチャートである。CPU11がROM12又はストレージ14から学習プログラムを読み出して、RAM13に展開して実行することにより、学習処理が行なわれる。学習装置100は、入力として、予め観測された通常時の時空間データ、及び変動時の時空間データを受け付けて観測DB120に格納して以下の処理を行う。
ステップS100で、CPU11は、通常時の時空間データと、変動時の時空間データとの変動の度合いを表すイベント成分を抽出する。
ステップS102で、CPU11は、期間τの時空間データに対応する観測時刻、観測地点、属性、及びイベント成分のデータの組の各々に基づいて、イベント成分を、予め与えられたイベントごとに分類する。なお、分類の詳細な処理の流れは後述する。
ステップS104で、CPU11は、イベントごとの分類結果に基づいて、イベントごとに、時空間データの変動を予測するためのモデルを学習し、学習したイベントごとのモデルをモデルDB160に格納する。
以上説明したように本実施形態の学習装置100によれば、イベントごとの変動を考慮した時空間データを予測するためのモデルを学習できる。
<予測装置の作用>
次に、予測装置200の作用について説明する。
図6は、予測装置200による予測処理の流れを示すフローチャートである。CPU21がROM22又はストレージ24から予測プログラムを読み出して、RAM23に展開して実行することにより、予測処理が行なわれる。予測装置200は、入力として、予測対象の時空間データを受け付けて観測DB220に格納して以下の処理を行う。
ステップS200で、CPU21は、通常時の時空間データと、予測対象の時空間データとの変動の度合いを表すイベント成分を抽出する。
ステップS202で、CPU21は、期間τの時空間データに対応する観測時刻、観測地点、属性、及びイベント成分のデータの組の各々に基づいて、イベント成分を、予め与えられたイベントごとに分類する。なお、分類の詳細な処理の流れは後述する。
ステップS204で、CPU21は、イベントごとの分類結果に基づいて、イベントごとに学習されたモデルを用いて、イベントごとの時空間データの変動を予測する。すなわち、クラスタごとの予測値を出力する。
ステップS206で、CPU21は、ステップS204で出力されたクラスタの各々の予測値と、通常時の観測推定値とを足し合わせて最終的な予測値を合成する。
ステップS208で、CPU21は、ステップS206で合成された最終的な予測値を外部に出力して処理を終了する。
次に上記ステップS102及びS202の分類に係る、分類部140又は分類部240としての処理の詳細を説明する。図7は、分類処理の流れを示すフローチャートである。以下は、予測装置200の分類部240として処理する場合を例に説明するが、学習装置100の分類部140であっても同様であり、各ステップの処理をCPU11が実行すればよい。
ステップ1000で、CPU21は、期間τの時空間データに対応する観測時刻、観測地点、属性、及びイベント成分のデータの組の各々から、属性テンソル及び成分行列を作成する。属性テンソルは、いわば、時空間属性テンソルである。成分行列は、いわば、時空間イベント成分行列である。属性テンソルは以下で表される、観測時刻I、観測地点J、及び属性Kの3つの次元からなり、属性テンソルの各要素xijkはイベント成分の絶対値である。以降、説明の便宜のためxをイベント成分とも表記する。
Figure 0007294421000001
属性テンソルはクラスタリングの入力として用いる。図8は、属性テンソルの一例を示す図である。
成分行列は以下で表される、観測時刻I、観測地点Jからなる行列であり、行列の各要素eijは時刻i、地点jの全ての属性のイベント成分を足し合わせた値である。
Figure 0007294421000002
成分行列は、クラスタリングの結果出力されるクラスタの各々の所属率と掛け合わせクラスタごとの時空間データとする。クラスタごとの時空間データは、次の処理で、クラスタごとの予測値を生成するために用いる。図9は、成分行列の一例を示す図である。
以上のように、ステップS1000では、観測時刻I、観測地点J、及び属性Kを次元とし各要素をイベント成分xとするテンソルである属性テンソルXを作成する。また、ステップS1000では、観測時刻I及び観測地点Jを行列とし全属性のイベント成分の合計値を要素とする成分行列Eを作成する。
ステップS1002で、CPU21は、クラスタリングによって生成するクラスタ数Rを設定する。適切なクラスタ数は、対象となるイベント成分のデータを構成するイベント数である。イベント数が予めわかっている場合には、その値をクラスタ数Rに設定し、わかっていない場合には過去データの傾向から判断して定めればよい。
ステップS1004で、CPU21は、属性テンソルXに対しNTFを用いてクラスタリングを行う。ここでは、3次の属性テンソルXを、ランク数をクラスタ数Rとした以下の3個の行列A,B,Cの内積としてテンソル分解を行う。
Figure 0007294421000003

Figure 0007294421000004

Figure 0007294421000005
テンソル分解は、分解後の行列A,B,Cの内積^X=[^xijk](^は数式では後ろの記号の上に付く、以下同様)が、元のテンソルX=[xijk]を再現するように分解を行う。具体的には下記(1)式の目的関数を最小化するように行列A,B,Cを求める。
Figure 0007294421000006

・・・(1)
ここで、dd(・,・)は距離関数を表し、KLダイバージェンス、又はユークリッド距離が用いられる。以上のように、ステップS1004では、イベントをクラスタとし、属性テンソルをクラスタごとに、観測時刻Iで表す行列A、観測地点Jで表す行列B、及び属性Kで表す行列Cの内積となるようにテンソル分解してクラスタリングする。これにより行列A,B,Cからクラスタごとのイベント成分^xijkが求められる。
ステップS1006で、CPU21は、テンソル分解によって得られた行列A,B,Cを使って、クラスタごとのイベント成分xの所属率Pを求める。以下、所属率Pを求めるための処理の流れを説明する。まず、イベント成分^xijkは、下記(2)式のように表せる。
Figure 0007294421000007

・・・(2)
クラスタリングのために用いた属性の情報は、予測値を求めるための処理では使用しないため、以下(3)式のように、各ランクの属性テンソルの属性ごとのイベント成分を足し合わせて属性列を消去する。
Figure 0007294421000008

・・・(3)
さらに、下記(4)式のようにイベント成分^xijrをクラスタrの総和で割り、クラスタrについての割合に変換する。
Figure 0007294421000009

・・・(4)
このようにして生成されたP=[pijr]は、イベント成分^xijrのクラスタrの所属率を表すと同時に、時空間データがクラスタrに所属する割合を示す所属率を表している。
以上のように、ステップS1006では、クラスタごとに、イベント成分が当該クラスタに所属する割合を示す所属率を求める。
ステップS1008で、CPU21は、クラスタごとの所属率Pと、成分行列Eとに基づいて、クラスタごとの時空間データを生成して出力する。クラスタごとの時空間データは、イベントごとの分類結果として予測値を求めるための処理、すなわちステップS104又はステップS204に受け渡される。以下(5)式のように、ステップS1000で生成した成分行列Eとクラスタごとの所属率Pとの内積をとり、クラスタごとの時空間データSを生成し、出力する。クラスタごとの時空間データSは、観測時刻及び観測地点の要素として当該クラスタrの成分を含む時空間データである。
Figure 0007294421000010

・・・(5)
クラスタrの成分とは、成分行列Eとクラスタごとの所属率Pとの内積をとった結果得られる各要素であり、成分行列Eで表される変動の度合いと、所属率Pで表されるクラスタにおけるイベント成分の割合とを反映した成分といえる。以上のように、ステップS1008では、クラスタごとの所属率と、成分行列との内積を求めて得られる、クラスタごとの時空間データをイベントごとの分類結果として出力する。上述したステップS204では、このようにして得られたクラスタごとの時空間データを、クラスタごとのモデルの入力として用いて予測を行うため、クラスタごとに適切な予測値の出力が可能となる。同様に、上述したステップS104では、このようにして得られたクラスタごとの時空間データを、クラスタごとのモデルの学習の入力として用いて学習を行うため、クラスタごとに適切な予測値の出力が可能なモデルを学習できる。
以上説明したように本実施形態の予測装置200によれば、イベントごとの変動を考慮した時空間データの予測を可能とし、全体の予測精度を向上できる。
なお、上記各実施形態でCPUがソフトウェア(プログラム)を読み込んで実行した学習処理又は予測処理を、CPU以外の各種のプロセッサが実行してもよい。この場合のプロセッサとしては、FPGA(Field-Programmable Gate Array)等の製造後に回路構成を変更可能なPLD(Programmable Logic Device)、及びASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が例示される。また、学習処理又は予測処理を、これらの各種のプロセッサのうちの1つで実行してもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGA、及びCPUとFPGAとの組み合わせ等)で実行してもよい。また、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路である。
また、上記実施形態では、学習プログラムがストレージ14に予め記憶(インストール)されている態様を説明したが、これに限定されない。プログラムは、CD-ROM(Compact Disk Read Only Memory)、DVD-ROM(Digital Versatile Disk Read Only Memory)、及びUSB(Universal Serial Bus)メモリ等の非一時的(non-transitory)記憶媒体に記憶された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
以上の実施形態に関し、更に以下の付記を開示する。
(付記項1)
メモリと、
前記メモリに接続された少なくとも1つのプロセッサと、
を含み、
前記プロセッサは、
予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、変動時の前記時空間データとの変動の度合いを表すイベント成分を抽出し、
前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、
前記イベントごとの分類結果に基づいて、前記イベントごとに、前記時空間データの変動を予測するためのモデルを学習する、
ように構成されている学習装置。
(付記項2)
予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、変動時の前記時空間データとの変動の度合いを表すイベント成分を抽出し、
前記観測時刻、前記観測地点、前記属性、及び前記イベント成分に基づいて、前記イベント成分を、予め与えられたイベントごとに分類し、
前記イベントごとの分類結果に基づいて、前記イベントごとに、前記時空間データの変動を予測するためのモデルを学習する、
ことをコンピュータに実行させる学習プログラムを記憶した非一時的記憶媒体。
100 学習装置
110 入力部
120 観測DB
130 抽出部
140 分類部
150 学習部
160 モデルDB
200 予測装置
210 入力部
220 観測DB
230 抽出部
240 分類部
250 モデルDB
260 予測部
270 合成部
280 出力部

Claims (6)

  1. 予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、変動時の前記時空間データとの観測値の差分を、変動の度合いを表すイベント成分として抽出する抽出部と、
    前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々に基づいて、予め与えられた複数のイベントの各々をクラスタとして扱い、所定のクラスタリング手法により前記組をクラスタリングすることにより、クラスタごとの所定のクラスタ時空間データを生成し、前記クラスタ時空間データを分類結果として出力する分類部と、
    記分類結果に基づいて、前記イベントごとに、学習手法として時系列データを対象とした予測を行うための回帰手法を用いて、前記時空間データの変動を予測するためのモデルを学習する学習部と、
    を含み、
    前記分類部は、
    前記観測時刻、前記観測地点、及び前記属性を次元とし各要素を前記イベント成分とするテンソルである属性テンソル、並びに前記観測地点、及び前記観測時刻を行列とし全属性の前記イベント成分の合計値を要素とする成分行列を作成し、
    前記属性テンソルを前記クラスタごとに、前記観測時刻で表す行列、前記観測地点で表す行列、及び前記属性で表す行列の内積となるようにテンソル分解してクラスタリングを行い、テンソル分解して得られた各行列から当該クラスタのイベント成分を求め、
    前記クラスタごとに、全てのクラスタのイベント成分の総和に対する当該クラスタのイベント成分の割合から、当該クラスタのイベント成分が当該クラスタに所属する割合を示す所属率を求め、
    前記クラスタごとの確率ベクトルとしての前記所属率と、前記成分行列との内積を求めて、当該クラスタの成分を含む前記クラスタ時空間データを生成し、前記イベントごとの分類結果とする、
    学習装置。
  2. 予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、入力された予測対象の前記時空間データとの観測値の差分を、変動の度合いを表すイベント成分として抽出する抽出部と、
    前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々に基づいて、予め与えられた複数のイベントの各々をクラスタとして扱い、所定のクラスタリング手法により前記組をクラスタリングすることにより、クラスタごとの所定のクラスタ時空間データを生成し、前記クラスタ時空間データを分類結果として出力する分類部と、
    記分類結果に基づいて、前記イベントごとに学習された前記時空間データの変動を予測するためのモデルを用いて、前記イベントごとの前記時空間データの変動を予測する予測部と、を含み、
    前記モデルは、学習用の前記時空間データについての、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々をクラスタリングした前記イベントごとの前記分類結果に基づいて、学習手法として時系列データを対象とした予測を行うための回帰手法を用いて学習されており、
    前記分類部は、
    前記観測時刻、前記観測地点、及び前記属性を次元とし各要素を前記イベント成分とするテンソルである属性テンソル、並びに前記観測地点、及び前記観測時刻を行列とし全属性の前記イベント成分の合計値を要素とする成分行列を作成し、
    前記属性テンソルを前記クラスタごとに、前記観測時刻で表す行列、前記観測地点で表す行列、及び前記属性で表す行列の内積となるようにテンソル分解してクラスタリングを行い、テンソル分解して得られた各行列から当該クラスタのイベント成分を求め、
    前記クラスタごとに、全てのクラスタのイベント成分の総和に対する当該クラスタのイベント成分の割合から、当該クラスタのイベント成分が当該クラスタに所属する割合を示す所属率を求め、
    前記クラスタごとの確率ベクトルとしての前記所属率と、前記成分行列との内積を求めて、当該クラスタの成分を含む前記クラスタ時空間データを生成し、前記イベントごとの分類結果とする、
    予測装置。
  3. 予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、変動時の前記時空間データとの観測値の差分を、変動の度合いを表すイベント成分として抽出し、
    前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々に基づいて、予め与えられた複数のイベントの各々をクラスタとして扱い、所定のクラスタリング手法により前記組をクラスタリングすることにより、クラスタごとの所定のクラスタ時空間データを生成し、前記クラスタ時空間データを分類結果として出力し、
    記分類結果に基づいて、前記イベントごとに、学習手法として時系列データを対象とした予測を行うための回帰手法を用いて、前記時空間データの変動を予測するためのモデルを学習する、
    ことを含む処理をコンピュータが実行することを特徴とする学習方法であって、
    前記分類結果を求める処理では、
    前記観測時刻、前記観測地点、及び前記属性を次元とし各要素を前記イベント成分とするテンソルである属性テンソル、並びに前記観測地点、及び前記観測時刻を行列とし全属性の前記イベント成分の合計値を要素とする成分行列を作成し、
    前記属性テンソルを前記クラスタごとに、前記観測時刻で表す行列、前記観測地点で表す行列、及び前記属性で表す行列の内積となるようにテンソル分解してクラスタリングを行い、テンソル分解して得られた各行列から当該クラスタのイベント成分を求め、
    前記クラスタごとに、全てのクラスタのイベント成分の総和に対する当該クラスタのイベント成分の割合から、当該クラスタのイベント成分が当該クラスタに所属する割合を示す所属率を求め、
    前記クラスタごとの確率ベクトルとしての前記所属率と、前記成分行列との内積を求めて、当該クラスタの成分を含む前記クラスタ時空間データを生成し、前記イベントごとの分類結果とする、学習方法。
  4. 予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、入力された予測対象の前記時空間データとの観測値の差分を、変動の度合いを表すイベント成分として抽出し、
    前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々に基づいて、予め与えられた複数のイベントの各々をクラスタとして扱い、所定のクラスタリング手法により前記組をクラスタリングすることにより、クラスタごとの所定のクラスタ時空間データを生成し、前記クラスタ時空間データを分類結果として出力し、
    記分類結果に基づいて、前記イベントごとに学習された前記時空間データの変動を予測するためのモデルを用いて、前記イベントごとの前記時空間データの変動を予測する、ことを含む処理をコンピュータが実行することを特徴とする予測方法であって、
    前記モデルは、学習用の前記時空間データについての、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々をクラスタリングした前記イベントごとの前記分類結果に基づいて、学習手法として時系列データを対象とした予測を行うための回帰手法を用いて学習されており、
    前記分類結果を求める処理では、
    前記観測時刻、前記観測地点、及び前記属性を次元とし各要素を前記イベント成分とするテンソルである属性テンソル、並びに前記観測地点、及び前記観測時刻を行列とし全属性の前記イベント成分の合計値を要素とする成分行列を作成し、
    前記属性テンソルを前記クラスタごとに、前記観測時刻で表す行列、前記観測地点で表す行列、及び前記属性で表す行列の内積となるようにテンソル分解してクラスタリングを行い、テンソル分解して得られた各行列から当該クラスタのイベント成分を求め、
    前記クラスタごとに、全てのクラスタのイベント成分の総和に対する当該クラスタのイベント成分の割合から、当該クラスタのイベント成分が当該クラスタに所属する割合を示す所属率を求め、
    前記クラスタごとの確率ベクトルとしての前記所属率と、前記成分行列との内積を求めて、当該クラスタの成分を含む前記クラスタ時空間データを生成し、前記イベントごとの分類結果とする、予測方法。
  5. 予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、変動時の前記時空間データとの観測値の差分を、変動の度合いを表すイベント成分として抽出し、
    前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々に基づいて、予め与えられた複数のイベントの各々をクラスタとして扱い、所定のクラスタリング手法により前記組をクラスタリングすることにより、クラスタごとの所定のクラスタ時空間データを生成し、前記クラスタ時空間データを分類結果として出力し、
    記分類結果に基づいて、前記イベントごとに、学習手法として時系列データを対象とした予測を行うための回帰手法を用いて、前記時空間データの変動を予測するためのモデルを学習する、
    ことをコンピュータに実行させる学習プログラムであって、
    前記分類結果を求める処理では、
    前記観測時刻、前記観測地点、及び前記属性を次元とし各要素を前記イベント成分とするテンソルである属性テンソル、並びに前記観測地点、及び前記観測時刻を行列とし全属性の前記イベント成分の合計値を要素とする成分行列を作成し、
    前記属性テンソルを前記クラスタごとに、前記観測時刻で表す行列、前記観測地点で表す行列、及び前記属性で表す行列の内積となるようにテンソル分解してクラスタリングを行い、テンソル分解して得られた各行列から当該クラスタのイベント成分を求め、
    前記クラスタごとに、全てのクラスタのイベント成分の総和に対する当該クラスタのイベント成分の割合から、当該クラスタのイベント成分が当該クラスタに所属する割合を示す所属率を求め、
    前記クラスタごとの確率ベクトルとしての前記所属率と、前記成分行列との内積を求めて、当該クラスタの成分を含む前記クラスタ時空間データを生成し、前記イベントごとの分類結果とする、学習プログラム。
  6. 予め観測された、観測時刻及び観測地点の要素として観測値を含む属性付きの時空間データであって通常時の前記時空間データと、入力された予測対象の前記時空間データとの観測値の差分を、変動の度合いを表すイベント成分として抽出し、
    前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々に基づいて、予め与えられた複数のイベントの各々をクラスタとして扱い、所定のクラスタリング手法により前記組をクラスタリングすることにより、クラスタごとの所定のクラスタ時空間データを生成し、前記クラスタ時空間データを分類結果として出力し、
    記分類結果に基づいて、前記イベントごとに学習された前記時空間データの変動を予測するためのモデルを用いて、前記イベントごとの前記時空間データの変動を予測する、ことをコンピュータに実行させる予測プログラムであって、
    前記モデルは、学習用の前記時空間データについての、前記観測時刻、前記観測地点、前記属性、及び前記イベント成分のデータの組の各々をクラスタリングした前記イベントごとの前記分類結果に基づいて、学習手法として時系列データを対象とした予測を行うための回帰手法を用いて学習されており、
    前記分類結果を求める処理では、
    前記観測時刻、前記観測地点、及び前記属性を次元とし各要素を前記イベント成分とするテンソルである属性テンソル、並びに前記観測地点、及び前記観測時刻を行列とし全属性の前記イベント成分の合計値を要素とする成分行列を作成し、
    前記属性テンソルを前記クラスタごとに、前記観測時刻で表す行列、前記観測地点で表す行列、及び前記属性で表す行列の内積となるようにテンソル分解してクラスタリングを行い、テンソル分解して得られた各行列から当該クラスタのイベント成分を求め、
    前記クラスタごとに、全てのクラスタのイベント成分の総和に対する当該クラスタのイベント成分の割合から、当該クラスタのイベント成分が当該クラスタに所属する割合を示す所属率を求め、
    前記クラスタごとの確率ベクトルとしての前記所属率と、前記成分行列との内積を求めて、当該クラスタの成分を含む前記クラスタ時空間データを生成し、前記イベントごとの分類結果とする、予測プログラム。
JP2021528754A 2019-06-26 2019-06-26 学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラム Active JP7294421B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/025474 WO2020261449A1 (ja) 2019-06-26 2019-06-26 学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラム

Publications (2)

Publication Number Publication Date
JPWO2020261449A1 JPWO2020261449A1 (ja) 2020-12-30
JP7294421B2 true JP7294421B2 (ja) 2023-06-20

Family

ID=74061097

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021528754A Active JP7294421B2 (ja) 2019-06-26 2019-06-26 学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラム

Country Status (3)

Country Link
US (1) US20220366272A1 (ja)
JP (1) JP7294421B2 (ja)
WO (1) WO2020261449A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118043826A (zh) * 2021-09-29 2024-05-14 株式会社力森诺科 预测模型制作方法、预测方法、预测模型制作装置、预测装置、预测模型制作程序、预测程序

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010176342A (ja) 2009-01-29 2010-08-12 Fujitsu Ltd 解析装置、解析方法及び解析方法のプログラム
JP2014081899A (ja) 2012-10-18 2014-05-08 Panasonic Corp 共クラスタリング装置、共クラスタリング方法、プログラム及び集積回路
JP2016031639A (ja) 2014-07-29 2016-03-07 日本電信電話株式会社 クラスタ抽出装置、クラスタ抽出方法、及びクラスタ抽出プログラム
JP2018092439A (ja) 2016-12-05 2018-06-14 株式会社日立製作所 データ処理システム及びデータ処理方法
WO2018154958A1 (ja) 2017-02-27 2018-08-30 株式会社Nttドコモ 需要予測装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010176342A (ja) 2009-01-29 2010-08-12 Fujitsu Ltd 解析装置、解析方法及び解析方法のプログラム
JP2014081899A (ja) 2012-10-18 2014-05-08 Panasonic Corp 共クラスタリング装置、共クラスタリング方法、プログラム及び集積回路
JP2016031639A (ja) 2014-07-29 2016-03-07 日本電信電話株式会社 クラスタ抽出装置、クラスタ抽出方法、及びクラスタ抽出プログラム
JP2018092439A (ja) 2016-12-05 2018-06-14 株式会社日立製作所 データ処理システム及びデータ処理方法
WO2018154958A1 (ja) 2017-02-27 2018-08-30 株式会社Nttドコモ 需要予測装置

Also Published As

Publication number Publication date
WO2020261449A1 (ja) 2020-12-30
JPWO2020261449A1 (ja) 2020-12-30
US20220366272A1 (en) 2022-11-17

Similar Documents

Publication Publication Date Title
Li et al. A new methodology to support group decision-making for IoT-based emergency response systems
Megahed et al. Statistical perspectives on “big data”
JP2018195308A (ja) プロセス及び製造業における業績評価指標のデータに基づく最適化のための方法及びシステム
JP4254623B2 (ja) トピック分析方法及びその装置並びにプログラム
CA3088689C (en) Finite rank deep kernel learning for robust time series forecasting and regression
JP5480755B2 (ja) 需要予測システム及び需要予測方法
CN110291542B (zh) 主要原因估计装置、主要原因估计系统以及主要原因估计方法
Duan et al. Sliced full factorial-based Latin hypercube designs as a framework for a batch sequential design algorithm
JPWO2019229931A1 (ja) 情報処理装置、制御方法、及びプログラム
US11977978B2 (en) Finite rank deep kernel learning with linear computational complexity
JP6950504B2 (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
CN115221396A (zh) 基于人工智能的信息推荐方法、装置及电子设备
CN113326440A (zh) 基于人工智能的推荐方法、装置及电子设备
CN116523104A (zh) 基于情景感知和深度学习的异常群体流量预测方法及装置
JP7294421B2 (ja) 学習装置、予測装置、学習方法、予測方法、学習プログラム、及び予測プログラム
Wang et al. Baysian inference for ordered response data with a dynamic spatial‐ordered probit model
Butt et al. Hybrid of deep learning and exponential smoothing for enhancing crime forecasting accuracy
JP2021043477A (ja) 需要予測装置、需要予測方法、及びプログラム
Li et al. Impact of the pre-simulation process of occupant behaviour modelling for residential energy demand simulations
US9875443B2 (en) Unified attractiveness prediction framework based on content impact factor
CA3119351C (en) Extending finite rank deep kernel learning to forecasting over long time horizons
JP7400819B2 (ja) 予測装置、予測方法、及び予測プログラム
Solvang et al. Estimation and classification of temporal trends to support integrated ecosystem assessment
Soto-Ferrari et al. AGGFORCLUS: A hybrid methodology integrating forecasting with clustering to assess mitigation plans and contagion risk in pandemic outbreaks: the COVID-19 Case Study
Kong et al. A novel ConvLSTM with multifeature fusion for financial intelligent trading

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230522

R150 Certificate of patent or registration of utility model

Ref document number: 7294421

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150