JP6368684B2 - 推定方法、装置、及びプログラム - Google Patents

推定方法、装置、及びプログラム Download PDF

Info

Publication number
JP6368684B2
JP6368684B2 JP2015100327A JP2015100327A JP6368684B2 JP 6368684 B2 JP6368684 B2 JP 6368684B2 JP 2015100327 A JP2015100327 A JP 2015100327A JP 2015100327 A JP2015100327 A JP 2015100327A JP 6368684 B2 JP6368684 B2 JP 6368684B2
Authority
JP
Japan
Prior art keywords
node
event
propagation
coordinate
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015100327A
Other languages
English (en)
Other versions
JP2016218579A (ja
Inventor
倉島 健
健 倉島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015100327A priority Critical patent/JP6368684B2/ja
Publication of JP2016218579A publication Critical patent/JP2016218579A/ja
Application granted granted Critical
Publication of JP6368684B2 publication Critical patent/JP6368684B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、推定方法、装置、及びプログラムに関する。
グラフ構造を推定する従来の技術として、Rodriguezらが提案したNETRATEが知られている(例えば、非特許文献1)。非特許文献1に記載されている技術は、どのノードでどのイベントがいつ発生したかの観測データをもとに、それらを引き起こした重み付き有向グラフにおける各エッジの重みを推定する技術である。例えば、あるノードAから別のノードBへの重み付きエッジは、ノードAとノードBが同時に関与したイベントが多いほど、また、同時に関与したイベントにおいて同じような時間に関与しているほど、また、ノードAが関与した後にノードBが関与するほど、大きな値をとるものとして推定される。
また、PLNV(PLNV:Probabilistic latent network visualization)が知られている(例えば、非特許文献2)。非特許文献2には、推定するグラフにおける各ノードが低次元の潜在空間においてある座標を持ち、あるノードから別のノードへの伝搬のしやすさ(を示すエッジの重み)は、座標の近さによって決まるとしたモデルが記載されている。非特許文献2の技術の直接的な出力は、各ノードの潜在座標系における座標値であり、ノード間をつなぐエッジの重みは、ノード間のユークリッド距離によって計算される。
Manuel Gomez-Rodriguez, David Balduzzi, Bernhard Scholkopf,"Uncovering the Temporal Dynamics of Diffusion Networks.",ICML 2011:561-568 Takeshi Kurashima, Tomoharu Iwata, Noriko Takaya, Hiroshi Sawada"Probabilistic latent network visualization: inferring and embedding diffusion networks.",KDD2014: 1236-1245
上記非特許文献1の技術は、分析対象とする全体ノード数をNとすると、全ノードの全ての組み合わせに関するNの二乗(ノード数N×ノード数N)個のパラメータを推定する必要がある。そのため、パラメータの推定に伴う計算量が多く、かつ、すべてのパラメータを推定するためには、大量の観測データが必要であった。
また、上記非特許文献2の技術は、低次元空間の次元数をDとすると、D×N個のパラメータを推定する。一般には、D<<Nであるため上記非特許文献1の技術と比較して、推定にかかる計算コストが低く、観測データの量が少ない場合でも、頑健にグラフ推定可能な特徴がある。
しかし、ノードからノードへの伝搬のしやすさは、座標間の距離から計算するため、ノードAからノードBへのエッジの重みは、その逆方向であるノードBからノードAと等しいものとして推定されてしまう。
例えば、ノードAからノードBへはイベントが伝搬しやすいが、その逆は伝搬しないといった、非対称なノード間の関係性をうまく表現できない。その結果、特に大量の観測データが存在する場合に、推定精度が低下する問題があった。
本発明は、上記の点に鑑みてなされたものであり、グラフ上のノード間の非対称な関係を表現することができる推定方法、推定装置、及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明に係る推定方法は、座標推定手段を含む推定装置における推定方法であって、前記座標推定手段が、イベントの発生源を表す複数のノードの各々において前記イベントが発生した時間情報を表すイベント履歴情報に基づいて、前記複数のノードの各々について、予め定められた潜在空間における、前記ノードとは異なるノードへ前記イベントの伝搬を引き起こすときの前記ノードの座標を表す第1の座標と、前記ノードとは異なるノードからの前記イベントの伝搬を受けるときの前記ノードの座標を表す第2の座標とのペアを、前記イベントの伝搬を引き起こすときの前記ノードの第1の座標と、前記イベントの伝搬を受けるときの、前記ノードとは異なるノードの第2の座標との距離、及び、前記イベントの伝搬を受けるときの前記ノードの第2の座標と、前記イベントの伝搬を引き起こすときの、前記ノードとは異なるノードの第1の座標との距離が、前記イベントの伝搬を引き起こすノードから、前記イベントの伝搬を受けるノードへの伝搬のしやすさを表すように推定するステップを含む。
本発明に係る推定装置は、イベントの発生源を表す複数のノードの各々において前記イベントが発生した時間情報を表すイベント履歴情報に基づいて、前記複数のノードの各々について、予め定められた潜在空間における、前記ノードとは異なるノードへ前記イベントの伝搬を引き起こすときの前記ノードの座標を表す第1の座標と、前記ノードとは異なるノードからの前記イベントの伝搬を受けるときの前記ノードの座標を表す第2の座標とのペアを、前記イベントの伝搬を引き起こすときの前記ノードの第1の座標と、前記イベントの伝搬を受けるときの、前記ノードとは異なるノードの第2の座標との距離、及び、前記イベントの伝搬を受けるときの前記ノードの第2の座標と、前記イベントの伝搬を引き起こすときの、前記ノードとは異なるノードの第1の座標との距離が、前記イベントの伝搬を引き起こすノードから、前記イベントの伝搬を受けるノードへの伝搬のしやすさを表すように推定する座標推定手段を含んで構成されている。
また、本発明に係る推定方法は、前記座標推定手段が推定するステップは、前記イベント履歴情報に基づいて、前記イベントの伝搬を引き起こすノードと、前記イベントの伝搬を受けるノードとの組み合わせの各々における、前記イベントの伝搬を引き起こすノードで前記イベントが発生した時間情報、及び前記イベントの伝搬を受けるノードで前記イベントが発生した時間情報の差と、前記イベントの伝搬を引き起こすノードの前記第1の座標及び前記イベントの伝搬を受けるノードの前記第2の座標の間の距離とを用いて表される目的関数を最適化するように、前記複数のノードの各々について、前記第1の座標と前記第2の座標とのペアを推定するようにすることができる。
また、本発明に係る推定方法は、前記座標推定手段が推定するステップは、複数の種類のイベントの各々についての、前記複数のノードの各々において前記種類のイベントが発生した時間情報を表すイベント履歴情報に基づいて、前記複数のノードの各々について、前記第1の座標と前記第2の座標とのペアを推定することができる。
また、本発明に係る推定方法は、入力手段及び伝搬確率算出手段を更に含み、前記入力手段が、仮想イベントが発生したノードと、前記仮想イベントが発生してからの経過時間とを受け付けるステップと、前記伝搬確率算出手段が、前記入力手段によって受け付けた前記仮想イベントが発生したノード及び前記経過時間と、前記座標推定手段によって推定された前記複数のノードの各々についての前記第1の座標と前記第2の座標との前記ペアとに基づいて、前記複数のノードの各々について、前記経過時間までの間に前記イベントが前記ノードに発生する確率を算出するステップと、を含むようにすることができる。
また、本発明のプログラムは、上記推定方法の各ステップをコンピュータに実行させるためのプログラムである。
以上説明したように、本発明の推定方法、装置、及びプログラムによれば、イベントの発生源を表す複数のノードの各々において、イベントが発生した時間情報を表すイベント履歴情報に基づいて、複数のノードの各々について、予め定められた潜在空間における、当該ノードとは異なるノードへイベントの伝搬を引き起こすときの当該ノードの座標を表す第1の座標と、当該ノードとは異なるノードからのイベントの伝搬を受けるときの当該ノードの座標を表す第2の座標とのペアを、イベントの伝搬を引き起こすときの当該ノードの第1の座標と、イベントの伝搬を受けるときの、当該ノードとは異なるノードの第2の座標との距離、及び、イベントの伝搬を受けるときの当該ノードの第2の座標と、イベントの伝搬を引き起こすときの、当該ノードとは異なるノードの第1の座標との距離が、イベントの伝搬を引き起こすノードから、イベントの伝搬を受けるノードへの伝搬のしやすさを表すように推定することにより、グラフ上のノード間の非対称な関係を表現することができる、という効果が得られる。
有向グラフ上でのイベント伝搬プロセスを説明するための概念図である。 グラフ構造推定の概念図である。 従来技術におけるグラフ構造推定を説明するための説明図である。 従来技術におけるグラフ構造推定の問題点を説明するための説明図である。 本発明の実施の形態におけるグラフ構造推定を説明するための説明図である。 本発明の実施の形態における推定装置のブロック図である。 本発明の実施の形態におけるイベント履歴情報記憶部に格納されている情報の一例である。 本発明の実施の形態における入力部の構成例である。 本発明の実施の形態における座標推定部によって推定された座標の一例である。 仮想イベントの伝搬シミュレーション結果の一例である。 本発明の実施の形態における推定装置のグラフ構造推定処理ルーチンを示すフローチャートである。 本発明の実施の形態における推定装置の座標推定処理ルーチンを示すフローチャートである。 本発明の実施の形態における推定装置の予測処理ルーチンを示すフローチャートである。 本発明の実施の形態における推定装置と従来技術との比較を表す図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<概要>
WebサイトからWebサイトへの情報の伝搬、人から人への病気の感染、場所から場所への物体の移動などのプロセスは、図1に示すように、それぞれ、Webサイト、ヒト、場所などをノードとした有向グラフ上でのエッジを介したノードからノードへのイベント伝搬プロセスとみなせる。
本発明の実施の形態では、重み付き有向グラフの構造によって引き起こされたと考えられるイベント集合を分析し、重み付き有向グラフの構造そのものを推定する。具体的には、どのノードでどのイベントがいつ発生したかの観測データをもとに、それらを引き起こした重み付き有向グラフにおける各エッジの重みを求めるための各ノードの座標を推定する。
図2にグラフ構造推定の概念図を示す。図2に示すように、本実施の形態では、実際の観測情報である「いつ、どのノードで、どのイベントが発生したか」を手掛かりにしてグラフ構造(エッジの重み)を推定する。本発明の実施の形態では、イベントが発生するメカニズム(有向グラフの構造)を推定可能なため、将来のイベント発生、イベント伝搬の予測が可能となる。
図3に、従来技術におけるグラフ構造推定方法の概念図を示す。上記非特許文献2に記載の技術(PLNV:Probabilistic latent network visualization)では、図3に示すように、各ノードnのD次元座標xを推定し、推定された座標間の距離によってノードからノードへの伝搬しやすさ(エッジの重み)を決定する。
しかし、PLNVでは、非対称な関係が表現できないため、例えば図4に示すように、ノードAからノードBへ、ノードBからノードCへは伝搬しやすいが、その逆はあまりないという関係を表現することができない。
そこで、本発明の実施の形態では、図5に示すように、グラフの各ノードが2種類の座標を持つことを許し、他に影響を及ぼす立場での座標(丸印)と他から影響を受ける立場での座標(四角印)とを設定する。
本発明の実施の形態は、イベント伝搬を説明する重み付き有向グラフの構造の推定に関するものであり、推定するグラフにおける各ノードが低次元の潜在空間において、伝搬を引き起こす立場における第1の座標と、伝搬を受ける側の立場における第2の座標という、2種類の座標を持ち、あるノードAからノードBへの伝搬の起きやすさは、ノードAの第1の座標とノードBの第2の座標との間の距離(近さ)によって決まり、逆に、ノードBからノードAへの伝搬の起きやすさは、ノードBの第1の座標とノードAの第2の座標との間の距離(近さ)によって決まるとするモデルを推定することにより、ノード間の非対称な関係を表現可能な潜在空間を学習する。
なお、本発明の実施の形態に係る推定装置は、様々なデータを対象としたものであり、観測データに応じて柔軟に適用することができる。
<本発明の実施の形態に係る推定装置の構成>
次に、本発明の実施の形態に係る推定装置の構成について説明する。図6に示すように、本発明の実施の形態に係る推定装置100は、CPUと、RAMと、後述する各処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この推定装置100は、機能的には図6に示すように、操作部10と、イベント履歴情報記憶部12と、入力部14と、演算部20と、出力部30とを備えている。操作部10及び演算部20は、イベント履歴情報記憶部12と接続されている。
操作部10は、後述するイベント履歴情報記憶部12に格納されているデータに対する操作者からの各種操作を受け付ける。各種操作とは、イベント履歴情報記憶部12に格納された情報を登録、修正、削除する操作等である。また、操作部10は、イベント履歴情報記憶部12に記憶されたイベント履歴情報を操作者に提示することも可能である。操作部10の入力手段は、キーボードやマウスやメニュー画面やタッチパネルによるもの等、何でもよい。操作部10は、マウス等の入力手段のデバイスドライバや、メニュー画面の制御ソフトウェアで実現され得る。
イベント履歴情報記憶部12には、複数の種類のイベントの各々についての、イベントの発生源を表す複数のノードにおいて当該種類のイベントが発生した時間情報を表すイベント履歴情報が格納されている。
イベント履歴情報記憶部12には、後述する演算部20が解析するイベント履歴情報が格納されており、演算部20からの要求に従って、イベント履歴情報を読み出し、当該情報を演算部20に送信する。
イベント履歴情報記憶部12に記憶される典型的なイベント履歴情報は、ノードを一意に識別するためのノードIDと、該ノードにおいて発生したイベントの種類を一意に識別するためのイベントIDと、当該種類のイベントが発生した時間情報とを含んで構成される。例えば、人から人への病気感染に関するイベントを分析する場合、「A型インフルエンザ」のような、各病名に対してイベントIDが付与され、各人に対してノードIDが付与される。ある人がある病気にある時間で感染したという情報は、ノードID(人名)、イベントID(病名)、時間情報の組み合わせである一つのイベント履歴情報として記憶されることになる。
また、例えば、場所から場所への人の移動データを扱う場合、「東京駅」のような、各場所に対してノードIDが付与され、あるユーザに対して、イベントIDを付与しても良い。ある場所である人をある時間に観測したという情報は、ノードID(場所)、イベントID(人名)、時間情報の組み合わせである一つのイベント履歴情報として記憶されることになる。結果として推定されるのは、場所から場所への人の移動しやすさがグラフ上のエッジの重みに反映された都市行動グラフである。
この他、人から人へのトレンドキーワードの伝搬など、グラフ上での伝搬プロセスとみなせる情報であれば何でも良く、イベント履歴情報記憶部12に格納することができる。また、時間情報は、ユーザがイベントに関与した時刻情報でも良いし、各イベントが最初に発生してからの経過時間でも良い。イベント履歴情報記憶部12はWebページを保持するWebサーバや、データベースを具備するデータベースサーバ等である。
図7に本発明の実施の形態におけるイベント履歴情報記憶部12に格納されている情報の一例を示す。本発明の実施の形態では、前記の通り、ノードを一意に識別するためのノード情報、各ノードにおいて発生したイベントを一意に識別するためのイベント情報、そして、イベントが発生した時間情報との組み合わせが格納されている。また、イベント情報だけをまとめて記憶しても良い。イベントの発生時間には、イベント履歴情報において、該当イベントが最初に発生した時間が記憶され、イベントの観測終了時間には、イベント履歴情報において、該当イベントが最後に発生した時間が、記憶される。もし、実際にイベントが発生した時間、観測終了時間が他の情報源によって与えられた場合、そちらを用いても良い。なお、各ユーザにおいて、観測終了時間の時点でイベントが発生していない場合は、無限大を値として記憶する。
本実施の形態では、イベント履歴情報が、ノードID(人名)、イベントID(病名)及び時間情報の組み合わせである場合を例に説明する。
入力部14は、推定装置100の出力に対する条件の指定を受け付ける。推定装置100の操作者は、後述する演算部20の座標推定部22の各種パラメータ(潜在空間の次元数及び推定の終了条件)を推定装置100に入力し、推定装置100で推定した潜在空間における各ユーザの座標を出力するように要求することができる。
また、入力部14は、操作者によって入力された、仮想イベントが発生したノードと当該仮想イベントが発生してからの経過時間とを受け付ける。本実施の形態では、操作者が仮想イベントを発生させ、伝搬シミュレーションの結果を推定装置100に要求する。伝搬シミュレーションの結果を操作者が要求する場合、仮想イベントが発生するノード及び、仮想イベントが発生してからの経過時間を操作者は入力する。伝搬シミュレーションに関する条件は、後述する演算部20の伝搬確率算出部26へと送信される。
入力部14の入力手段は、キーボードやマウスやメニュー画面やタッチパネルによるもの等、何でもよい。入力部14は、マウス等の入力手段のデバイスドライバや、メニュー画面の制御ソフトウェアで実現され得る。
図8に本実施の形態における入力部14の構成例を示す。図8の構成例では、座標推定実行に関する入力手段と伝搬シミュレーションに関する入力手段とを別のボタンで示したが、座標推定に関する入力手段から、伝搬シミュレーションに関する入力手段をワンストップで構成しても良い。また、後述する出力部30と連動し、出力部30が提示した情報に対する選択操作によって、イベント発生ノードや経過時間を指定するように構成しても良い。
次に、説明の簡略化のため、演算部20の座標推定部22及び伝搬確率算出部26の説明の前に、本実施の形態におけるモデルについて説明する。
本発明の実施の形態は、生存時間分析の考え方に基づく。あるイベントがノードjで時間tで発生した条件のもとで、同じイベントがノードiで時間tにどの程度発生しやすいかを示す伝搬関数をf(t|t)とする。もし、f(t|t)が確率密度関数ならば、時間tから時間tの間にノードiでイベントが発生する確率を示すF(t|t)は累積分布関数として以下の式(1)に示すように計算できる。
また、あるイベントがノードjで時間tに発生した条件のもとで、ノードiで時間tまでにイベントが起きていない確率(生存関数)は以下の式(2)に示す通りである。
ここで、Δji=t−tとすると、S(Δji=0)=1であり、S(Δji=∞)=0である。さらに、ノードiで時間tまでイベントが発生していなかった条件のもとで、その直後におけるイベントの起きやすさを示す瞬間率(ハザード関数)は以下の式(3)に示す通りである。
上記式(1)〜(3)は生存時間分析の基本的事項である。例えば、伝搬関数f(t|t)の確率分布として、指数関数を選択すると、伝搬(確率密度)関数、ハザード関数、生存関数は以下の式(4)〜(6)に示す通りになる。
ここで、αjiはノードjからノードiへの伝搬のしやすさを示す重みである。本実施の形態では、αjiは、D次元の潜在空間において、ノードjの伝搬を引き起こす立場における第1の座標xとノードiの伝搬を受ける立場における第2の座標yのユークリッド距離で決まると仮定する。
上記式(7)のβは座標間の距離の影響範囲を決定するパラメータである。ノードjの伝搬を引き起こす立場における第1の座標xとノードiの伝搬を受ける立場における第2の座標yとの間の距離が近いほど、αjiの値は大きくなる。つまり、グラフのエッジの重みが大きくなり、伝搬が起こりやすくなる。逆に、ノードiからノードjへの伝搬のしやすさαijは、D次元の潜在空間において、ノードiの伝搬を引き起こす立場における第1の座標xとノードjの伝搬を受ける立場における第2の座標yのユークリッド距離で決まる。
重要なことは、ノードj(ノードi)が2種類の座標、第1の座標xと第2の座標y(第1の座標xと第2の座標y)を持つことである。例えば、ノードjからノードiへは伝搬しやすいが、ノードiからノードjへは伝搬しにくいという関係を表現したい場合を考える。説明の簡略化のため、ノードiに関する2種類の座標xとyがx=yだったとする。この場合、ノードjの伝搬を引き起こす立場における座標xは、y(=x)の近くに配置し、ノードjの伝搬を受ける立場における座標yは、x(=y)から遠くに配置すれば良い。本発明の実施の形態で用いるモデルは、上記のように、二つのノードの非対称な関係性を表現可能なモデルである。
演算部20は、座標推定部22と、座標格納部24と、伝搬確率算出部26とを備えている。
座標推定部22は、イベント履歴情報記憶部12に格納されたイベント履歴情報に基づいて、複数のノードの各々について、予め定められたD次元潜在空間上における、当該ノードiとは異なるノードへイベントの伝搬を引き起こすときの当該ノードの座標を表す第1の座標xと、当該ノードiとは異なるノードからのイベントの伝搬を受けるときの当該ノードiの座標を表す第2の座標yとのペアを、ある種類のイベントの伝搬を引き起こすときの当該ノードiの第1の座標xと、当該種類のイベントの伝搬を受けるときの、当該ノードiとは異なるノードjの第2の座標yとの距離が、当該種類のイベントの伝搬を引き起こすノードから、当該種類のイベントの伝搬を受けるノードへの伝搬のしやすさを表すように推定する。
具体的には、座標推定部22は、イベント履歴情報記憶部12に格納されたイベント履歴情報に基づいて、イベントの伝搬を引き起こすノードと、イベントの伝搬を受けるノードとの組み合わせの各々における、イベントの伝搬を引き起こすノードでイベントが発生した時間情報、及びイベントの伝搬を受けるノードでイベントが発生した時間情報の差と、イベントの伝搬を引き起こすノードの第1の座標及びイベントの伝搬を受けるノードの第2の座標の間の距離とを用いて表される目的関数を最適化するように、複数のノードの各々について、第1の座標xと第2の座標yとのペアを推定する。
本実施の形態では、イベント履歴情報記憶部12に記憶された全観測データ(イベント履歴集合)に関する対数尤度関数を最大化(負の対数尤度関数を最小化)することより、複数のノードの各々について、第1の座標と第2の座標とのペアを自動的に推定する。全観測データの負の対数尤度関数は以下の式(9)に示すようになる。なお、以下の式におけるSji(Δji )はS(t|t)と等しく、hji(Δji )はh(t|t)と等しい。
なお、イベントをc、複数種類のイベントからなるイベント集合をC、t はユーザjにおいてイベントcが起きた時間を表し、Δji =t −t である。また、Tは、イベントcの観測窓の終点を表し、予め設定される。なお、Tはイベントc毎に設定されてもよいし、全てのイベントcに対して共通して設定されていてもよい。実際は、座標推定部22は、上記式(9)に式(4)〜(6)を代入した負の対数尤度関数を最小化するパラメータを推定する。推定するパラメータは、各ノードkの座標xと座標yである。これは準ニュートン法などの最適化手法を用いて求めることができる。準ニュートン法で用いる、ノードkの座標xで偏微分した式(10)、ノードkの座標yで偏微分した式(11)は以下の通りである。
座標推定部22が推定した各ノードに関する2種類のD次元座標は、座標格納部24へ格納される。なお、関数の確率分布として、指数分布ではなく、べき乗分布や、レイリー分布などの他の分布を用いても良い。関数の確率分布として他の分布を用いる場合も同様の処理ステップで推定することが可能である。
座標格納部24には、座標推定部22によって推定された、複数のノード各々についての第1の座標xと第2の座標yとのペア(各ノードに関する2種類のD次元座標)が格納される。図9に本発明の実施の形態における座標格納部24に格納されている座標情報の一例を示す。図9は、潜在空間の次元数Dとして2が指定された場合であり、左の図は、伝搬を引き起こす立場における各ノードの座標が記録されており、右の図は、伝搬を受ける立場における各ノードの座標が記録されている。なお、3以上の自然数を次元数として指定しても良い。
伝搬確率算出部26は、入力部14によって受け付けた仮想イベントが発生したノード及び経過時間と、座標格納部24に格納された複数のノードの各々についての第1の座標xと第2の座標yとのペアとに基づいて、2つのノードの組み合わせの各々について、当該組み合わせの一方のノードの第1の座標と他方のノードの第2の座標との間の距離に基づいて、当該組み合わせのノード間のエッジの重みを推定し、2つのノードの組み合わせの各々について推定された組み合わせのノード間のエッジの重みに基づいて、複数のノードの各々について、経過時間までの間にイベントが当該ノードに発生する確率を算出する。
具体的には、伝搬確率算出部26は、入力部14によって指定された、仮想イベントが発生したノードjと、仮想イベントが発生してからの経過時間Δtを入力として受け取り、Δtが経過した時点での、他のノードiが仮想イベントに関与している確率を算出する。確率値は上記式(1)で計算可能であり、座標格納部24に格納された各ノードに関する2種類のD次元座標を用いて計算する。各ノードに関して計算した確率値は出力部30へと送られる。
出力部30は、伝搬確率算出部26によって算出された確率値を出力する。また、出力部30は、座標格納部24に格納された座標の情報を出力する。具体的には、出力部30は、入力部14と伝搬確率算出部26とからの要求に応じて、座標格納部24に格納された座標の情報や、操作者が仮想的に発生させたイベントの伝搬シミュレーションの結果を装置の操作者に提示する。
ここで、出力部30における出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部装置への送信等を含む概念である。出力部30は、ディスプレイやスピーカ等の出力デバイスを含むと考えても含まないと考えてもよい。出力部30は、出力デバイスのドライバソフトまたは、出力デバイスのドライバソフトと出力デバイス等で実現され得る。
図10に伝搬シミュレーションの出力例を示す。図10に示す伝搬シミュレーションの結果は、潜在空間の次元数として2を選択し、ノード数が8の場合の出力である。白抜き円が、イベントが起きていないノード、色つき円が、イベントが起きたノードである。指定された経過時間までにどのノードでイベントが起きるかの予測結果を確認することができる。なお、実際は、各ノードで、ある時間にイベントが起きる確率が計算される。この確率値が、ある閾値を越えた場合、イベントが起きたとみなす。また、確率値を表現するものとして、各ノードの色の濃さを用いたり、各ノードの隣接する座標に確率値を表示させたりしても良い。つまり、各ノードで、どの程度、イベントが起きやすいかを表現する方法であれば何でも良い。なお、イベントが発生したノードjの座標は、伝搬を引き起こす立場における座標値であるxに基づいて潜在空間上に配置されており、それ以外のノードiは伝搬を受ける立場における座標値であるyに基づいて潜在空間上に配置されている。
<本発明の実施の形態に係る推定装置の作用>
次に、本発明の実施の形態に係る推定装置100の作用について説明する。図11に、本発明の実施の形態におけるグラフ構造推定処理のフローチャートを示す。推定装置100で推定したいのは、グラフ上の全ノードに関する第1の座標x,...,x|K|と、第2のy,...,y|K|である。なお、全ノード集合をKとしている。
推定装置100は、イベント履歴情報が入力されると、イベント履歴情報記憶部12に格納する。そして、推定装置100は、グラフ構造推定のための各パラメータが入力されると、図11に示すグラフ構造推定処理ルーチンを実行する。
まず、ステップS100において、入力部14は、座標の次元数Dと終了条件Min_Diffとをパラメータとして受け付ける。
次に、ステップS102において、座標推定部22は、イベント履歴情報記憶部12に格納されたイベント履歴情報と上記ステップS100で受け付けたパラメータとに基づいて、複数のノードの各々について、予め定められたD次元潜在空間上における、当該ノードiとは異なるノードへイベントの伝搬を引き起こすときの当該ノードの座標を表す第1の座標xと、当該ノードiとは異なるノードからのイベントの伝搬を受けるときの当該ノードiの座標を表す第2の座標yとのペアを、ある種類のイベントの伝搬を引き起こすときの当該ノードiの第1の座標xと、当該種類のイベントの伝搬を受けるときの、当該ノードiとは異なるノードjの第2の座標yとの距離が、当該種類のイベントの伝搬を引き起こすノードから、当該種類のイベントの伝搬を受けるノードへの伝搬のしやすさを表すように推定する。ステップS102は、図12に示す座標推定処理ルーチンによって実現される。ステップS102の座標推定処理では、尤度関数の最適化を繰り返し、尤度の変化が、指定した終了条件以下になったら最適化処理を終了する。
<座標推定処理ルーチン>
ステップS200において、上記ステップS100で受け付けた座標の次元数Dと終了条件Min_Diffとを取得する。
ステップS202において、複数のノードの各々について、予め定められたD次元潜在空間上における、第1の座標xと第2の座標yとを初期化する。
ステップS204において、繰り返しのための一時変数itrに0を代入し、初期化する。
ステップS206において、イベント履歴情報記憶部12に格納されたイベント履歴情報と、上記ステップS204で初期化された複数のノードの各々についての第1の座標xと第2の座標y又は後述するステップS218で前回更新された複数のノードの各々についての第1の座標xと第2の座標yとに基づいて、上記式(9)に従って、負の対数尤度関数Litrを計算する。
ステップS208において、上記ステップS206で計算された負の対数尤度関数Litrと、前回のステップS206で計算された負の対数尤度関数Litr−1との差分を変数Diffに代入する。
ステップS210において、上記ステップS208で得られたDiffが上記ステップS200で取得したMin_Diff以下であるか否かを判定する。上記ステップS208で得られたDiffが上記ステップS200で取得したMin_Diff以下である場合には、ステップS222へ進む。一方、上記ステップS208で得られたDiffが上記ステップS200で取得したMin_Diffより大きい場合には、ステップS211へ進む。
ステップS211において、イベント履歴情報記憶部12に格納されているイベント履歴情報のノードkを1つ設定する。
ステップS212において、上記ステップS211で設定されたノードkについて、イベント履歴情報記憶部12に格納されているイベント履歴情報に基づいて、上記式(10)に従って、負の対数尤度関数を第1の座標xで偏微分した値を計算する。
ステップS214において、上記ステップS211で設定されたノードkについて、イベント履歴情報記憶部12に格納されているイベント履歴情報に基づいて、上記式(11)に従って、負の対数尤度関数を第2の座標yで偏微分した値を計算する。
ステップS216において、イベント履歴情報記憶部12に格納されている全てのノードkについて、上記ステップS211〜S214の処理を実行したか否かを判定する。全てのノードkについて、上記ステップS211〜S214の処理を実行した場合には、ステップS218へ進む。一方、上記ステップS211〜S214の処理を実行していないノードkが存在する場合には、ステップS211へ戻る。
ステップS218において、上記ステップS212で得られた値と上記ステップS214で得られた値とに基づいて、準ニュートン法に従って、全てのノードkについて、第1の座標xと第2の座標yとを更新する。
ステップS220において、変数itrを1インクリメントしてステップS206へ戻る。
ステップS222において、上記ステップS218で得られた座標を結果として出力して、座標推定処理ルーチンを終了する。
次にグラフ構造推定処理ルーチンに戻り、ステップS104において、上記ステップS102で得られた全てのノードkについての第1の座標xと第2の座標yとのペアを座標格納部24に格納して、グラフ構造推定処理ルーチンを終了する。
そして、推定装置100に、仮想イベントが発生したノード及び経過時間が操作者によって入力されると、推定装置100は、図13に示す予測処理ルーチンを実行する。
<予測処理ルーチン>
まず、ステップS300では、入力部14は、操作者によって入力された、仮想イベントが発生したノードと当該仮想イベントが発生してからの経過時間とを受け付ける。
ステップS302において、伝搬確率算出部26は、座標格納部24に格納された複数のノードの各々についての第1の座標xと第2の座標yとのペアを読み込む。
ステップS304において、伝搬確率算出部26は、上記ステップS302で読み込んだ複数のノードの各々についての第1の座標xと第2の座標yとのペアに基づいて、上記式(7)又は式(8)に従って、2つのノードの組み合わせの各々について、当該組み合わせの一方のノードの第1の座標と他方のノードの第2の座標との間の距離に基づいて、当該組み合わせのノード間のエッジの重みを推定する。
ステップS306において、2つのノードの組み合わせの各々について推定された組み合わせのノード間のエッジの重みに基づいて、上記式(4)〜式(6)に従って、複数のノードの各々について、経過時間までの間にイベントが当該ノードに発生する確率を算出する。
ステップS308において、上記ステップS306で算出された、複数のノードの各々について経過時間までの間にイベントが当該ノードに発生する確率を結果として出力して、予測処理ルーチンを終了する。
以上説明したように、本発明の実施の形態に係る推定装置によれば、イベントの発生源を表す複数のノードの各々において、イベントが発生した時間情報を表すイベント履歴情報に基づいて、複数のノードの各々について、予め定められた潜在空間における、当該ノードとは異なるノードへイベントの伝搬を引き起こすときの当該ノードの座標を表す第1の座標と、当該ノードとは異なるノードからのイベントの伝搬を受けるときの当該ノードの座標を表す第2の座標とのペアを、イベントの伝搬を引き起こすときの当該ノードの第1の座標と、イベントの伝搬を受けるときの、当該ノードとは異なるノードの第2の座標との距離、及び、イベントの伝搬を受けるときの当該ノードの第2の座標と、イベントの伝搬を引き起こすときの、当該ノードとは異なるノードの第1の座標との距離が、イベントの伝搬を引き起こすノードから、イベントの伝搬を受けるノードへの伝搬のしやすさを表すように推定することにより、グラフ上のノード間の非対称な関係を表現することができる。
図14に本実施の形態と従来技術との比較結果を示す。図14に示すように低次元空間の次元数をDとし、ノード数をNとすると、本実施の形態は2×D×N個のパラメータを推定するだけで良いため、上記非特許文献2と同様、上記非特許文献1と比較して小規模な観測データでも頑健にグラフ構造を推定できる。また、本実施の形態は、ノード間の非対称な関係を表現可能なため、上記非特許文献1と同様、上記非特許文献2と比較して大規模な観測データが得られた場合でも高精度にグラフ構造を推定することができる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上記の実施の形態では、イベント履歴情報がノードID(人名)、イベントID(病名)及び時間情報の組み合わせである場合を例に説明したが、他の様々なデータを観測データとして本発明を適用することができる。
また、本実施の形態においては、推定装置100によって、各ノードの座標を推定し、伝搬シミュレーションを実行する場合を例に説明したが、これに限定されるものではなく、推定装置100とは別の装置(例えば、予測装置)によって、伝搬シミュレーションを実行し、複数のノードの各々について、経過時間までの間にイベントが当該ノードに発生する確率を算出するようにしてもよい。この場合には、予測装置は、入力部14、座標格納部24、伝搬確率算出部26、及び出力部30を備えるようにすればよい。
また、上述の推定装置100は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。
10 操作部
12 イベント履歴情報記憶部
14 入力部
20 演算部
22 座標推定部
24 座標格納部
26 伝搬確率算出部
30 出力部
100 推定装置

Claims (7)

  1. 座標推定手段を含む推定装置における推定方法であって、
    前記座標推定手段が、イベントの発生源を表す複数のノードの各々において前記イベントが発生した時間情報を表すイベント履歴情報に基づいて、前記複数のノードの各々について、予め定められた潜在空間における、前記ノードとは異なるノードへ前記イベントの伝搬を引き起こすときの前記ノードの座標を表す第1の座標と、前記ノードとは異なるノードからの前記イベントの伝搬を受けるときの前記ノードの座標を表す第2の座標とのペアを、前記イベントの伝搬を引き起こすときの前記ノードの第1の座標と、前記イベントの伝搬を受けるときの、前記ノードとは異なるノードの第2の座標との距離、及び、前記イベントの伝搬を受けるときの前記ノードの第2の座標と、前記イベントの伝搬を引き起こすときの、前記ノードとは異なるノードの第1の座標との距離が、前記イベントの伝搬を引き起こすノードから、前記イベントの伝搬を受けるノードへの伝搬のしやすさを表すように推定するステップ
    を含む推定方法。
  2. 前記座標推定手段が推定するステップは、前記イベント履歴情報に基づいて、前記イベントの伝搬を引き起こすノードと、前記イベントの伝搬を受けるノードとの組み合わせの各々における、前記イベントの伝搬を引き起こすノードで前記イベントが発生した時間情報、及び前記イベントの伝搬を受けるノードで前記イベントが発生した時間情報の差と、前記イベントの伝搬を引き起こすノードの前記第1の座標及び前記イベントの伝搬を受けるノードの前記第2の座標の間の距離とを用いて表される目的関数を最適化するように、前記複数のノードの各々について、前記第1の座標と前記第2の座標とのペアを推定する
    請求項1記載の推定方法。
  3. 前記座標推定手段が推定するステップは、複数の種類のイベントの各々についての、前記複数のノードの各々において前記種類のイベントが発生した時間情報を表すイベント履歴情報に基づいて、前記複数のノードの各々について、前記第1の座標と前記第2の座標とのペアを推定する
    請求項1又は請求項2に記載の推定方法。
  4. 入力手段及び伝搬確率算出手段を更に含み、
    前記入力手段が、仮想イベントが発生したノードと、前記仮想イベントが発生してからの経過時間とを受け付けるステップと、
    前記伝搬確率算出手段が、前記入力手段によって受け付けた前記仮想イベントが発生したノード及び前記経過時間と、前記座標推定手段によって推定された前記複数のノードの各々についての前記第1の座標と前記第2の座標との前記ペアとに基づいて、前記複数のノードの各々について、前記経過時間までの間に前記イベントが前記ノードに発生する確率を算出するステップと、
    を含む請求項1〜請求項3の何れか1項に記載の推定方法。
  5. 前記伝搬確率算出手段が算出するステップは、2つのノードの組み合わせの各々について、前記組み合わせの一方のノードの前記第1の座標と他方のノードの前記第2の座標との間の距離に基づいて、前記組み合わせのノード間のエッジの重みを推定し、前記2つのノードの組み合わせの各々について推定された前記組み合わせのノード間のエッジの重みに基づいて、前記複数のノードの各々について、前記経過時間までの間に前記イベントが前記ノードに発生する確率を算出する
    請求項4に記載の推定方法。
  6. イベントの発生源を表す複数のノードの各々において前記イベントが発生した時間情報を表すイベント履歴情報に基づいて、前記複数のノードの各々について、予め定められた潜在空間における、前記ノードとは異なるノードへ前記イベントの伝搬を引き起こすときの前記ノードの座標を表す第1の座標と、前記ノードとは異なるノードからの前記イベントの伝搬を受けるときの前記ノードの座標を表す第2の座標とのペアを、前記イベントの伝搬を引き起こすときの前記ノードの第1の座標と、前記イベントの伝搬を受けるときの、前記ノードとは異なるノードの第2の座標との距離、及び、前記イベントの伝搬を受けるときの前記ノードの第2の座標と、前記イベントの伝搬を引き起こすときの、前記ノードとは異なるノードの第1の座標との距離が、前記イベントの伝搬を引き起こすノードから、前記イベントの伝搬を受けるノードへの伝搬のしやすさを表すように推定する座標推定手段
    を含む推定装置。
  7. 請求項1〜請求項5の何れか1項に記載の推定方法の各ステップをコンピュータに実行させるためのプログラム。
JP2015100327A 2015-05-15 2015-05-15 推定方法、装置、及びプログラム Active JP6368684B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015100327A JP6368684B2 (ja) 2015-05-15 2015-05-15 推定方法、装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015100327A JP6368684B2 (ja) 2015-05-15 2015-05-15 推定方法、装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2016218579A JP2016218579A (ja) 2016-12-22
JP6368684B2 true JP6368684B2 (ja) 2018-08-01

Family

ID=57581184

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015100327A Active JP6368684B2 (ja) 2015-05-15 2015-05-15 推定方法、装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP6368684B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7412283B2 (ja) * 2020-06-16 2024-01-12 株式会社Nttドコモ 予測モデル生成システム及び予測システム
CN117473435B (zh) * 2023-07-21 2024-05-17 南京审计大学 一种基于时空特征的突发公共卫生事件虚假异常信息检测方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002099866A (ja) * 2000-09-26 2002-04-05 Masanobu Suga 情報の伝播をシミュレートする情報処理装置
JP2011118776A (ja) * 2009-12-04 2011-06-16 Sony Corp データ処理装置、データ処理方法、およびプログラム
JP6088962B2 (ja) * 2013-12-02 2017-03-01 日本電信電話株式会社 位置座標推定装置及び方法及びプログラム

Also Published As

Publication number Publication date
JP2016218579A (ja) 2016-12-22

Similar Documents

Publication Publication Date Title
EP3490223B1 (en) System and method for simulating and foiling attacks on a vehicle on-board network
JP4891817B2 (ja) 設計ルール管理方法、設計ルール管理プログラム、ルール構築装置およびルールチェック装置
JP2011222017A (ja) 技術設計最適化における最も影響力のある設計変数の識別方法
JP6007906B2 (ja) システム性能予測方法、情報処理装置およびその制御プログラム
JP2008536218A (ja) 確率モデル作成用のコンピュータシステム
Schimit et al. Disease spreading in complex networks: A numerical study with Principal Component Analysis
JP6361837B2 (ja) 訓練装置、訓練方法、及び訓練プログラム
CN109189935B (zh) 一种基于知识图谱的app传播分析方法及系统
JP2021093120A (ja) 二言語コーパススクリーニング方法及び装置、並びに記憶媒体
JP2018195244A (ja) Odトラヒック予測装置、方法、及びプログラム
JP6368684B2 (ja) 推定方法、装置、及びプログラム
Parham et al. Space and contact networks: capturing the locality of disease transmission
JP6744767B2 (ja) 人流予測装置、パラメータ推定装置、方法、及びプログラム
JP6647992B2 (ja) 設計支援装置
Melikechi et al. Limits of epidemic prediction using SIR models
JP2019082874A (ja) 設計支援装置及び設計支援システム
US20160241671A1 (en) Profile update evaluator
D’Innocenzo et al. A numerical investigation of discrete oscillating epidemic models
JP2019095895A (ja) 人流量予測装置、方法、及びプログラム
KR20220047046A (ko) 디지털 트윈기반 다중이용시설 내 전염병 확산 예측 장치 및 방법
JP2016045536A (ja) 設計支援装置
JP6088962B2 (ja) 位置座標推定装置及び方法及びプログラム
JP6228909B2 (ja) 行動ネットワーク情報抽出装置、行動ネットワーク情報抽出方法及び行動ネットワーク情報抽出プログラム
JPWO2013114911A1 (ja) リスク評価システム、リスク評価方法、及びプログラム
Mizera et al. ASSA-PBN 3.0: Analysing context-sensitive probabilistic Boolean networks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170621

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180625

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180703

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180709

R150 Certificate of patent or registration of utility model

Ref document number: 6368684

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150