JP2019185163A - データ予測装置、方法、及びプログラム - Google Patents

データ予測装置、方法、及びプログラム Download PDF

Info

Publication number
JP2019185163A
JP2019185163A JP2018071497A JP2018071497A JP2019185163A JP 2019185163 A JP2019185163 A JP 2019185163A JP 2018071497 A JP2018071497 A JP 2018071497A JP 2018071497 A JP2018071497 A JP 2018071497A JP 2019185163 A JP2019185163 A JP 2019185163A
Authority
JP
Japan
Prior art keywords
rank
data
dimensional array
external information
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018071497A
Other languages
English (en)
Other versions
JP6947108B2 (ja
Inventor
真耶 大川
Maya Okawa
真耶 大川
浩之 戸田
Hiroyuki Toda
浩之 戸田
倉島 健
Takeshi Kurashima
健 倉島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2018071497A priority Critical patent/JP6947108B2/ja
Priority to PCT/JP2019/011877 priority patent/WO2019193981A1/ja
Priority to US17/044,799 priority patent/US20210141858A1/en
Publication of JP2019185163A publication Critical patent/JP2019185163A/ja
Application granted granted Critical
Publication of JP6947108B2 publication Critical patent/JP6947108B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/909Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/17Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method
    • G06F17/175Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method of multidimensional data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Library & Information Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】予測対象の時期のデータを精度よく予測することができる。【解決手段】操作部10が、各時期のデータを表す高次元配列データと、各時期の外部情報を表すテンソル又は行列である外部情報データとを受け付ける。パラメータ推定部16が、高次元配列データを、ランク毎の複数の因子行列の積の重み付き和に分解すること、及び外部情報データを、ランク毎の複数の因子行列の積の重み付き和に分解することを、ランク毎の重み付けパラメータのスパース制約の下で行う。予測部22が、高次元配列データについて得られた、ランク毎の重み付けパラメータとランク毎の複数の因子行列とに基づいて、予測対象の時間の前記データを予測する。【選択図】図1

Description

本発明は、予測対象の時期のデータを予測するためのデータ予測装置、方法、及びプログラムに関する。
高次元配列データはテンソルを用いて表すことができる。ここで高次元配列データは複数のインデックスに対して値を持つデータを指す。今、n個のR次元配列データ

が与えられたとする。このようなデータはR階のテンソル

で表現できる。

(1)
テンソルで表されるデータの解析には、CP分解やTucker分解等のテンソル分解が用いられる(非特許文献1)。
テンソル分解はデータテンソルを複数の行列の積の形に分解するもので、データの低次元表現を与える。これらの行列は「因子行列」と呼ばれ、テンソルの各次元に対応する潜在的なパターンを表す。テンソルに欠損値が含まれる場合はまず欠損していないデータのみを用いて因子行列を推定する。予測時にはデータから学習した行列を掛け合わせて元に戻すことで欠損値の補完を行う。ただし、これらの手法は予測対象のデータに影響を与える外部情報を考慮できないという問題がある。そこで提案されたのがテンソルの同時分解手法(非特許文献2)である。これは複数種類のデータに対応する複数個のテンソルを同時に分解する手法である。
これにより、外的要因の影響を加味しながら予測を行うことができる。
Fvotte, Cdric, Nancy Bertin, and Jean-Louis Durrieu. "Nonnegative matrix factorization with the Itakura-Saito divergence: With application to music analysis." Neural computation 21.3(2009): 793-830. ERMI, Beyza; ACAR, Evrim; CEMGIL, A. Taylan. Link prediction via generalized coupled tensor factorisation. arXiv preprint arXiv:1208.6231, 2012.
しかしながら、非特許文献2に記載の手法は外部情報を全て等しく考慮するもので、情報の取捨選択ができない。従って、予測対象のデータと関係のない補助情報を用いた場合に予測精度が下がってしまうという問題が存在する。
このように、従来手法では、外部情報のうち対象のデータに影響を与えるものとそうでないものを分離することができない。そのため、予測対象のデータと共通する性質を持たない外部情報が含まれる場合に予測精度が下がるという問題が存在した。
本発明は、上記の事情を鑑みてなされたものであり、予測対象の時期のデータを精度よく予測することができるデータ予測装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明に係るデータ予測装置は、各時期のデータを表す高次元配列データと、前記高次元配列データと相関がある、各時期の外部情報を表すテンソル又は行列である外部情報データとを受け付ける操作部と、前記高次元配列データを、テンソル分解のランク毎の重み付けパラメータを用いたランク毎の複数の因子行列の積の重み付き和に分解すること、及び前記外部情報データを、ランク毎の重み付けパラメータと、前記高次元配列データと共通の因子行列を含む複数の因子行列とを用いたランク毎の複数の因子行列の積の重み付き和に分解することを、前記ランク毎の重み付けパラメータのスパース制約の下で行うパラメータ推定部と、前記パラメータ推定部によって前記高次元配列データについて得られた、前記ランク毎の重み付けパラメータと前記ランク毎の複数の因子行列とに基づいて、予測対象の時間の前記データを予測する予測部と、を含んで構成されている。
また、本発明に係るデータ予測方法は、操作部が、各時期のデータを表す高次元配列データと、前記高次元配列データと相関がある、各時期の外部情報を表すテンソル又は行列である外部情報データとを受け付け、パラメータ推定部が、前記高次元配列データを、テンソル分解のランク毎の重み付けパラメータを用いたランク毎の複数の因子行列の積の重み付き和に分解すること、及び前記外部情報データを、ランク毎の重み付けパラメータと、前記高次元配列データと共通の因子行列を含む複数の因子行列とを用いたランク毎の複数の因子行列の積の重み付き和に分解することを、前記ランク毎の重み付けパラメータのスパース制約の下で行い、予測部が、前記パラメータ推定部によって前記高次元配列データについて得られた、前記ランク毎の重み付けパラメータと前記ランク毎の複数の因子行列とに基づいて、予測対象の時間の前記データを予測する。
また、本発明のプログラムは、コンピュータを、上記のデータ予測装置を構成する各部として機能させるためのプログラムである。
以上説明したように、本発明のデータ予測装置、方法、及びプログラムによれば、前記高次元配列データを、テンソル分解のランク毎の重み付けパラメータを用いたランク毎の複数の因子行列の積の重み付き和に分解すること、及び前記外部情報データを、ランク毎の重み付けパラメータと、前記高次元配列データと共通の因子行列を含む複数の因子行列とを用いたランク毎の複数の因子行列の積の重み付き和に分解することを、前記ランク毎の重み付けパラメータのスパース制約の下で行うことにより、予測対象の時期のデータを精度よく予測することができる、という効果が得られる。
本発明の実施の形態におけるデータ予測装置のブロック図である。 高次元配列データ格納装置に格納されている高次元配列データの一例を示す図である。 外部情報格納装置に格納されている外部情報の一例を示す図である。 本発明の実施の形態におけるデータ予測装置の学習処理ルーチンを示すフローチャートである。 本発明の実施の形態におけるデータ予測装置のデータ予測処理ルーチンを示すフローチャートである。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<概要>
本発明の実施の形態では、テンソルの同時分解時にスパース制約を導入することで外部情報の取捨選択を行う。テンソル同時分解手法は、データを表すテンソル(データテンソル)と外部情報を表すテンソル(あるいは行列)を、因子行列を共有させつつ同時に分解するもので、データと外部情報の間接的な関係を捉えることができる。その際、データテンソルは複数の因子行列の積で近似される。本発明の実施の形態では、各々の因子行列に対応する重み付けパラメータを導入し、データテンソルを因子行列と各因子行列の重み付けパラメータの積で近似する。この重み付けパラメータに対してL1ノルム等のスパース制約をかけることで必要のないパラメータを0に潰し、予測時には一部の因子行列のみを参考にデータテンソルを再構築することができる。
<本発明の実施の形態に係るデータ予測装置の構成>
次に、本発明の実施の形態に係るデータ予測装置の構成について説明する。図1に示すように、本発明の実施の形態に係るデータ予測装置100は、CPUと、RAMと、後述する各処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。データ予測装置100は、地理空間上の任意のメッシュエリアの各時期の人口を表す高次元配列データと、当該任意のメッシュエリアの周辺のメッシュエリアの各時期の人口を表すテンソル又は行列である外部情報データとに基づいて、予測対象の時期における当該任意のメッシュエリアの人口を予測する。このデータ予測装置100は、機能的には図1に示すように、操作部10と、パラメータ推定部16と、パラメータ格納部18と、検索部20と、予測部22と、出力部24とを備えている。
操作部10は、後述する高次元配列データ格納装置12及び外部情報格納装置14に格納されているデータに対するユーザからの各種操作を受け付ける。各種操作とは、高次元配列データ格納装置12及び外部情報格納装置14に格納された情報を登録、修正、削除する操作等である。
操作部10の入力手段は、キーボードやマウス、メニュー画面、タッチパネルによるもの等、何でもよい。操作部10は、マウス等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェアで実現され得る。
検索部20は、予測対象となる時間(週、曜日、時刻)と場所(メッシュエリア)の情報を受け付ける。検索部20の入力手段は、キーボードやマウスやメニュー画面やタッチパネルによるもの等、何でも良い。検索部20は、マウス等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェアで実現され得る。
高次元配列データ格納装置12は、装置により解析され得る高次元配列データの履歴情報を格納しており、装置からの要求に従って、高次元配列データの履歴情報を読み出し、当該情報をデータ予測装置100に送信する。高次元配列データは、例えば、地理空間上の任意のメッシュエリアにおける人口推移であり、時間tiと人数yiの組

からなる。ここでNはデータ数である。時間tiに対応する週、曜日、時間帯をそれぞれi1, i2, i3 とおくと人口推移は4つの成分からなるタプルの系列

で書き換えることができる(図2参照)。このようなデータは、週i1, 曜日i2, 時間帯i3の3つの軸からなる3階のテンソル

で表される。

の各成分は

に対応している。j番目のメッシュエリアにおけるテンソルを

とおく。高次元配列データ格納装置12は、Webページを保持するWebサーバや、データベースを具備するデータベースサーバ等である。
外部情報格納装置14は、装置により解析され得る外部情報を格納しており、装置からの要求に従って、外部情報を読み出し、当該情報をデータ予測装置100に送信する。外部情報は高次元配列データに影響を与える外的要因に関するデータであり、例えば近くのメッシュエリアにおける人口データの集合

である(図3参照)。ここで

はj 番目のエリアに近接するメッシュエリアの集合である。このようなデータは、週i1, 曜日i2, 時間帯i3 にメッシュエリアのインデックスj′を加えた4つの軸からなる4階のテンソル

で表される。
外部情報格納装置14は、Webページを保持するWebサーバや、データベースを具備するデータベースサーバ等である。
パラメータ推定部16は、高次元配列データ格納装置12と外部情報格納装置14に格納されている情報に基づき、これらの情報の低次元表現を抽出し、時間発展を推定する。前述の例を使って手順を説明する。高次元配列データの履歴情報を表すテンソルにテンソル分解をかけることを考える。テンソル分解は、因子行列の積で近似する手法である。本実施の形態のゴールは、元のテンソルをよく再現する因子行列の組を見つけることである。高次元配列データのデータテンソル

は以下のように分解される。

(2)
ここで

は因子行列、

は因子ごとの重み付けパラメータ、K はテンソル分解のランク数であり、事前の知見に基づいて手動で与えるかクロスバリデーション等で決める。

はベクトルの外積を表す。同様に、外部情報を表すテンソル

を以下のように分解する。

(3)
ここで、

は因子ごとの重み付けパラメータ、

は因子行列である。ここで、高次元配列データのテンソル

の因子行列と外部情報のテンソル

の因子行列を共有させている。これにより、外部情報を考慮したテンソル分解が可能になる。
因子行列の取捨選択を行うため、重み付けパラメータ

に対してスパース制約をかける。一般的なスパースモデリングの手続きに従い、尤度関数Lに

に関する正則化項

を導入する。

(4)

(5)

(6)
λは正則化項の効果を制御するハイパーパラメータである。


の形はなんでもよいが、本実施の形態では回帰問題の特徴選択時に一般的に用いられるLASSO (Least Absolute Shrinkage and Selection Operator) を導入する。

(7)
これはベクトル

の一部の要素を0 にする方向に働く制約であり、外部情報と共有している潜在行列のうち対象のデータをよく説明するもののみを抽出する効果が期待できる。本モデルの尤度関数は以下のように書き下せる。

(8)

(9)

(10)

はx, y 間の距離を表す任意の距離測度であり、要素ごとのダイバージェンスの和で定義される。

(11)
ここで

はx, y 間のダイバージェンスであり、

に対して次式で定義される。

(12)
βダイバージェンスは、テンソル分解で一般的に用いられるユークリッド距離(β = 2) やKL ダイバージェンス(β= 1)を特別なケースとして含む。この後の議論は、どのようなβの値に対しても成り立つ。本実施の形態のゴールは、尤度関数Lの値を最小化するような因子行列の組

と重み付けパラメータ

を推定することである。パラメータの最適化には、例えばADMM (Alternating Direction Multiplier Method)(非特許文献3)を用いることができる。
[非特許文献3] Huang, Kejun, Nicholas D. Sidiropoulos, and Athanasios P. Liavas. ”A flexible and efficient algorithmic framework for constrained matrix and tensor factorization.” IEEE Transactions on Signal Processing 64.19 (2016): 5052-5065.
ADMMの手続きに従い、提案モデルのパラメータ最適化問題を次式のように書き換える。

(13)

(14)
尤度関数は以下の通り書き換えることができる。

(15)
ここで

はLagrangian multiplier、ρはステップサイズをコントロールするハイパーパラメータである。あとはパラメータセット

各々について以下の式に従って上式を交互に最適化すればよい。
(17)

(18)
(19)

(20)

(21)
コスト関数としてKLダイバージェンスを用いた場合(β = 1)、

の更新式は次式で書き下せる。

(22)

(23)
なお、

の更新式の記載は省略する。
以上説明したように、パラメータ推定部16は、高次元配列データを、テンソル分解のランク毎の重み付けパラメータを用いたランク毎の複数の因子行列の積の重み付き和に分解すること、及び外部情報データを、ランク毎の重み付けパラメータと、高次元配列データと共通の因子行列を含む複数の因子行列とを用いたランク毎の複数の因子行列の積の重み付き和に分解することを、ランク毎の重み付けパラメータのスパース制約の下で行う。すわなち、パラメータ推定部16は、高次元配列データと、ランク毎の重み付けパラメータを用いたランク毎の複数の因子行列の積の重み付き和との距離、外部情報データと、ランク毎の重み付けパラメータを用いたランク毎の複数の因子行列の積の重み付き和との距離、及びランク毎の重み付けパラメータの正則化項を用いて表される上記(4)式の尤度関数Lの値を最適化するように、上記(17)式〜(23)式に従って、高次元配列データについてのランク毎の重み付けパラメータとランク毎の複数の因子行列、及び外部情報データについてのランク毎の重み付けパラメータとランク毎の複数の因子行列を更新することを繰り返す。
パラメータ格納部18は、パラメータ推定部16で得られた最適パラメータの組を格納する。パラメータ格納部18は、推定したパラメータの組が保存され、復元可能なものであれば、なんでも良い。例えば、データベースや、予め備えられた汎用的な記憶装置(メモリやハードディスク装置)の特定領域に記憶される。
予測部22は、操作部10によって受け付けた予測対象の時間及び場所に関する情報と、パラメータ格納部18に格納された、高次元配列データについてのランク毎の重み付けパラメータとランク毎の複数の因子行列とに基づいて、予測対象の時間及び場所に関するデータを予測する。
例えば前述の例の場合、予測対象の時間に対応する時期(i1番目の週の曜日i2,時間帯i3)の人口は次式で推定できる.

(24)
出力部24は、予測部22によって予測された結果を出力する。ここで、出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部装置への送信等を含む概念である。出力部24は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部24は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
<本発明の実施の形態に係るデータ予測装置の作用>
次に、本発明の実施の形態に係るデータ予測装置100の作用について説明する。
<学習処理ルーチン>
まず、データ予測装置100は、操作部10より高次元配列データの履歴情報が入力されると、高次元配列データの履歴情報を高次元配列データ格納装置12に格納し、操作部10により外部情報が入力されると、外部情報を外部情報格納装置14に格納する。そして、データ予測装置100は、図4に示す学習処理ルーチンを実行する。
まず、ステップS100では、パラメータセット

各々を初期化する。
ステップS102では、パラメータセット

に基づいて、上記(17)式〜(20)式に従って重み付けパラメータ

を更新する。
ステップS104では、パラメータセット

に基づいて、上記(21)式に従って、因子行列

を更新する。
ステップS106では、パラメータセット

に基づいて、上記(22)式、(23)式に従って、テンソル

を更新する。
また、

を更新する。
ステップS108では、予め定められた収束判定条件を満たしたか否かを判定し、収束判定条件を満たしていない場合には、上記ステップS102へ戻り、一方、収束判定条件を満たした場合には、ステップS110へ進む。
なお、収束判定条件としては、推定された各パラメータの変化量が閾値以下となることや、予め定めた繰り返し回数に到達したことを用いればよい。
ステップS110では、上記ステップS102〜ステップS106で最終的に更新されたパラメータセット

をパラメータ格納部18に格納して、学習処理ルーチンを終了する。
<データ予測処理ルーチン>
次に、図5に示すデータ予測処理ルーチンについて説明する。
上記学習処理ルーチンが実行され、パラメータ格納部18にパラメータセット

が格納され、予測対象の時間及び場所に関する情報が入力されると、データ予測装置100は、図5に示すデータ予測処理ルーチンを実行する。
ステップS120において、操作部10は、予測対象の時間及び場所に関する情報を受け付ける。
ステップS122において、パラメータ格納部18に格納された、高次元配列データについてのパラメータセット


を読み出す。
ステップS124において、上記ステップS122で読み込まれたパラメータセットに基づいて、上記(24)式に従って、予測対象の時間に対応する週、曜日、時間帯、及び場所に関する人口を予測する。
ステップS126において、出力部24は、上記ステップS124で予測された予測対象の時間に対応する週、曜日、時間帯、及び場所に関する人口を結果として出力して、データ予測処理ルーチンを終了する。
以上説明したように、本発明の実施の形態に係るデータ予測装置によれば、高次元配列データを、テンソル分解のランク毎の重み付けパラメータを用いたランク毎の複数の因子行列の積の重み付き和に分解すること、及び外部情報データを、ランク毎の重み付けパラメータと、高次元配列データと共通の因子行列を含む複数の因子行列とを用いたランク毎の複数の因子行列の積の重み付き和に分解することを、ランク毎の重み付けパラメータのスパース制約の下で行うことにより、複数種類の外部情報からデータをよく説明する情報のみを選択することができ、予測対象の時期のデータを精度よく予測することができる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上記の実施の形態では、外部情報を表すテンソルを用いる場合を例に説明したが、これに限定されるものではなく、外部情報を表す行列を用いてもよい。
また、上述のデータ予測装置100は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。
10 操作部
12 高次元配列データ格納装置
14 外部情報格納装置
16 パラメータ推定部
18 パラメータ格納部
20 検索部
22 予測部
24 出力部
100 データ予測装置

Claims (7)

  1. 各時期のデータを表す高次元配列データと、前記高次元配列データと相関がある、各時期の外部情報を表すテンソル又は行列である外部情報データとを受け付ける操作部と、
    前記高次元配列データを、テンソル分解のランク毎の重み付けパラメータを用いたランク毎の複数の因子行列の積の重み付き和に分解すること、及び
    前記外部情報データを、ランク毎の重み付けパラメータと、前記高次元配列データと共通の因子行列を含む複数の因子行列とを用いたランク毎の複数の因子行列の積の重み付き和に分解することを、前記ランク毎の重み付けパラメータのスパース制約の下で行うパラメータ推定部と、
    前記パラメータ推定部によって前記高次元配列データについて得られた、前記ランク毎の重み付けパラメータと前記ランク毎の複数の因子行列とに基づいて、予測対象の時間の前記データを予測する予測部と、
    を含むデータ予測装置。
  2. 前記パラメータ推定部は、
    前記高次元配列データと、前記ランク毎の重み付けパラメータを用いたランク毎の複数の因子行列の積の重み付き和との距離、
    前記外部情報データと、前記ランク毎の重み付けパラメータを用いたランク毎の複数の因子行列の積の重み付き和との距離、及び
    前記ランク毎の重み付けパラメータの正則化項を用いて表される尤度関数を最適化するように、前記高次元配列データについての前記ランク毎の重み付けパラメータと前記ランク毎の複数の因子行列、及び前記外部情報データについての前記ランク毎の重み付けパラメータと前記ランク毎の複数の因子行列を推定する請求項1記載のデータ予測装置。
  3. 前記高次元配列データは、地理空間上の任意のメッシュエリアの各時期の人口を表し、
    前記外部情報データは、前記任意のメッシュエリアの周辺のメッシュエリアの各時期の人口を表す請求項1又は2記載のデータ予測装置。
  4. 操作部が、各時期のデータを表す高次元配列データと、前記高次元配列データと相関がある、各時期の外部情報を表すテンソル又は行列である外部情報データとを受け付け、
    パラメータ推定部が、前記高次元配列データを、テンソル分解のランク毎の重み付けパラメータを用いたランク毎の複数の因子行列の積の重み付き和に分解すること、及び
    前記外部情報データを、ランク毎の重み付けパラメータと、前記高次元配列データと共通の因子行列を含む複数の因子行列とを用いたランク毎の複数の因子行列の積の重み付き和に分解することを、前記ランク毎の重み付けパラメータのスパース制約の下で行い、
    予測部が、前記パラメータ推定部によって前記高次元配列データについて得られた、前記ランク毎の重み付けパラメータと前記ランク毎の複数の因子行列とに基づいて、予測対象の時間の前記データを予測する
    データ予測方法。
  5. 前記パラメータ推定部が推定することでは、
    前記高次元配列データと、前記ランク毎の重み付けパラメータを用いたランク毎の複数の因子行列の積の重み付き和との距離、
    前記外部情報データと、前記ランク毎の重み付けパラメータを用いたランク毎の複数の因子行列の積の重み付き和との距離、及び
    前記ランク毎の重み付けパラメータの正則化項を用いて表される尤度関数を最適化するように、前記高次元配列データについての前記ランク毎の重み付けパラメータと前記ランク毎の複数の因子行列、及び前記外部情報データについての前記ランク毎の重み付けパラメータと前記ランク毎の複数の因子行列を推定する請求項4記載のデータ予測方法。
  6. 前記高次元配列データは、地理空間上の任意のメッシュエリアの各時期の人口を表し、
    前記外部情報データは、前記任意のメッシュエリアの周辺のメッシュエリアの各時期の人口を表す請求項4又は5記載のデータ予測方法。
  7. コンピュータを、請求項1〜請求項3の何れか1項記載のデータ予測装置を構成する各部として機能させるためのプログラム。
JP2018071497A 2018-04-03 2018-04-03 データ予測装置、方法、及びプログラム Active JP6947108B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018071497A JP6947108B2 (ja) 2018-04-03 2018-04-03 データ予測装置、方法、及びプログラム
PCT/JP2019/011877 WO2019193981A1 (ja) 2018-04-03 2019-03-20 データ予測装置、方法、及びプログラム
US17/044,799 US20210141858A1 (en) 2018-04-03 2019-03-20 Data prediction device, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018071497A JP6947108B2 (ja) 2018-04-03 2018-04-03 データ予測装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2019185163A true JP2019185163A (ja) 2019-10-24
JP6947108B2 JP6947108B2 (ja) 2021-10-13

Family

ID=68100337

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018071497A Active JP6947108B2 (ja) 2018-04-03 2018-04-03 データ予測装置、方法、及びプログラム

Country Status (3)

Country Link
US (1) US20210141858A1 (ja)
JP (1) JP6947108B2 (ja)
WO (1) WO2019193981A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022131760A (ja) * 2021-02-26 2022-09-07 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
CN115454807A (zh) * 2022-11-11 2022-12-09 云智慧(北京)科技有限公司 一种运维系统的容量预测方法、装置及设备
JP7342194B1 (ja) 2022-05-19 2023-09-11 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP7491371B2 (ja) 2020-05-11 2024-05-28 日本電気株式会社 数式モデル生成システム、数式モデル生成方法および数式モデル生成プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017016186A (ja) * 2015-06-26 2017-01-19 日本電信電話株式会社 流れ推定装置、予測装置、及びプログラム
JP2017076196A (ja) * 2015-10-13 2017-04-20 日本電信電話株式会社 パターン抽出装置、方法、及びプログラム
JP2017220000A (ja) * 2016-06-07 2017-12-14 日本電信電話株式会社 流量予測装置、パターン推定装置、流量予測方法、パターン推定方法、及びプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106600053B (zh) * 2016-12-12 2020-04-10 西安交通大学 一种基于时空轨迹和社会网络的用户属性预测系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017016186A (ja) * 2015-06-26 2017-01-19 日本電信電話株式会社 流れ推定装置、予測装置、及びプログラム
JP2017076196A (ja) * 2015-10-13 2017-04-20 日本電信電話株式会社 パターン抽出装置、方法、及びプログラム
JP2017220000A (ja) * 2016-06-07 2017-12-14 日本電信電話株式会社 流量予測装置、パターン推定装置、流量予測方法、パターン推定方法、及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7491371B2 (ja) 2020-05-11 2024-05-28 日本電気株式会社 数式モデル生成システム、数式モデル生成方法および数式モデル生成プログラム
JP2022131760A (ja) * 2021-02-26 2022-09-07 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP7134279B1 (ja) 2021-02-26 2022-09-09 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP7342194B1 (ja) 2022-05-19 2023-09-11 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム
CN115454807A (zh) * 2022-11-11 2022-12-09 云智慧(北京)科技有限公司 一种运维系统的容量预测方法、装置及设备

Also Published As

Publication number Publication date
US20210141858A1 (en) 2021-05-13
JP6947108B2 (ja) 2021-10-13
WO2019193981A1 (ja) 2019-10-10

Similar Documents

Publication Publication Date Title
Willis et al. Estimating diversity in networked ecological communities
US10360500B2 (en) Two-phase distributed neural network training system
EP3629246B1 (en) Systems and methods for neural architecture search
WO2019193981A1 (ja) データ予測装置、方法、及びプログラム
US10360517B2 (en) Distributed hyperparameter tuning system for machine learning
Rullière et al. Nested Kriging predictions for datasets with a large number of observations
Prangle Lazy abc
Wan et al. Simulation-based optimization with surrogate models—application to supply chain management
CN110543935B (zh) 处理交互序列数据的方法及装置
JP6775469B2 (ja) Odトラヒック予測装置、方法、及びプログラム
Yang et al. A stochastic expectation-maximization algorithm for the analysis of system lifetime data with known signature
US10963802B1 (en) Distributed decision variable tuning system for machine learning
Xie et al. Joint estimation of multiple dependent Gaussian graphical models with applications to mouse genomics
CN113420421B (zh) 移动边缘计算中基于时序正则化张量分解的QoS预测方法
WO2012176863A1 (ja) 情報処理システム、ネットワーク構造学習装置、リンク強度予測装置、リンク強度予測方法およびプログラム
Lester et al. Extending the multi-level method for the simulation of stochastic biological systems
Hull Machine learning for economics and finance in tensorflow 2
Zhan et al. Neural networks for geospatial data
Kerleguer Multifidelity surrogate modeling for time-series outputs
CA3119351A1 (en) Extending finite rank deep kernel learning to forecasting over long time horizons
Ching et al. On multi-dimensional Markov chain models
WO2020013236A1 (ja) データ解析装置、方法、及びプログラム
Yuan et al. An evolution strategy method for computing eigenvalue bounds of interval matrices
Racca et al. Predicting turbulent dynamics with the convolutional autoencoder echo state network
Kong et al. New machine learning techniques for simulation-based inference: InferoStatic nets, kernel score estimation, and kernel likelihood ratio estimation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200730

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210817

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210830

R150 Certificate of patent or registration of utility model

Ref document number: 6947108

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150