WO2022259487A1

WO2022259487A1 - 予測装置、予測方法およびプログラム

Info

Publication number: WO2022259487A1
Application number: PCT/JP2021/022203
Authority: WO
Inventors: 真耶大川; 浩之戸田
Original assignee: 日本電信電話株式会社
Priority date: 2021-06-10
Filing date: 2021-06-10
Publication date: 2022-12-15
Also published as: JPWO2022259487A1

Abstract

複数のユーザによる意見の発信の履歴を示す情報拡散系列情報と、前記複数のユーザ間の関係を示すネットワーク情報と、に基づいて、各ユーザの意見の発信が発生する確率を表す強度関数のパラメータを推定するパラメータ推定部と、推定された前記パラメータに基づいて、各ユーザの意見の発信を予測する予測部と、を備える予測装置である。

Description

予測装置、予測方法およびプログラム

　本発明は、予測装置、予測方法およびプログラムに関する。

　近年、スマートフォンの普及により、ソーシャルメディアを介したコミュニケーションが一般的になっている。これらのソーシャルメディアにおいては、友人関係などに基づいて形成されたソーシャルネットワークを介して情報が拡散される。情報拡散メカニズムは、確率モデルを用いてモデル化することができる。最も代表的なものはＨａｗｋｅｓ過程である。Ｈａｗｋｅｓ過程は点過程の一種である。点過程は、微小区間におけるイベントの発生数を記述するためのモデルであり、イベントはツイート等、ソーシャルネットワークにおける情報発信である。「強度関数」と呼ばれる関数を用いて任意の時刻におけるイベントの発生確率をモデル化する。Ｈａｗｋｅｓ過程は、情報のバースト的な拡散(情報が短期間に爆発的に拡散する現象)を記述する点過程である。

　ソーシャルメディアは、ニュース、政治問題、製品など様々なトピックについてユーザが自分の意見を述べる場として広く利用されている。意見の拡散過程においては、各ユーザの意見が友人の影響で変化するということが知られている。各ユーザは、友人の投稿から学ぶことで、各トピックに関する意見を更新する。例えば、非特許文献１には、意見の拡散過程における友人の影響を考慮した点過程モデルが開示されている。この手法は、線形微分方程式を用いて強度関数を記述することで、友人の影響で変化するユーザの意見の変遷を記述することができる。

Abir, De, et al., Learning and Forecasting Opinion Dynamics in Social Networks. (2016).

　上記の従来技術は、線形微分方程式を用いて点過程の強度関数を記述することで、拡散過程のモデル化を行っている。しかし、従来技術は、ユーザ間の相互作用に線形性を仮定しているため、複雑な相互作用を考慮した高精度な意見の発信の予測を実現することができないという問題がある。

　開示の技術は、意見の発信の予測精度を向上させることを目的とする。

　開示の技術は、複数のユーザによる意見の発信の履歴を示す情報拡散系列情報と、前記複数のユーザ間の関係を示すネットワーク情報と、に基づいて、各ユーザの意見の発信が発生する確率を表す強度関数のパラメータを推定するパラメータ推定部と、推定された前記パラメータに基づいて、各ユーザの意見の発信を予測する予測部と、を備える予測装置である。

　意見の発信の予測精度を向上させることができる。

予測装置の機能構成図である。情報拡散系列情報の一例を示す図である。学習処理の流れの一例を示すフローチャートである。予測処理の流れの一例を示すフローチャートである。コンピュータのハードウェア構成例を示す図である。

　以下、図面を参照して本発明の実施の形態（本実施の形態）を説明する。以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。

　（本実施の形態の概要）
　本実施の形態に係る予測装置は、従来と同様に、ユーザ間の相互作用の時間変化を微分方程式で記述し、微分方程式の時間発展をグラフニューラルネットワーク（ＧＮＮ；graph neural network）を用いて記述する。具体的には、予測装置は、ソーシャルネットワークを、ユーザを頂点とし、ユーザ間の関係を辺とするグラフとして捉え、ＧＮＮを用いてノードの潜在ベクトルを得る。こうして得られた潜在ベクトルの時間変化を、微分方程式を用いて記述する。この微分方程式を用いて点過程の強度関数をモデル化することで、情報(意見)の拡散過程をモデル化するとともに近未来の情報(意見)発信を予測する。

　（予測装置の機能構成例）
　図１は、予測装置の機能構成図である。予測装置１０は、操作部３と、パラメータ推定部４と、パラメータ格納部５と、予測部６と、出力部７と、を備える。

　操作部３は、情報拡散系列格納装置１、ネットワーク情報格納装置２のデータに対する各種操作を受け付ける。各種操作とは、格納された情報を登録、修正、削除する操作等である。操作部３の入力手段は、例えばキーボード、マウス、タッチパネル等である。操作部３は、マウス等の入力手段のデバイスドライバー、メニュー画面の制御ソフトウェア等によって実現される。

　情報拡散系列格納装置１は、装置により解析され得る情報拡散の履歴情報を格納しており、装置からの要求に従って、情報拡散系列情報を読み出し、当該情報を情報拡散予測装置に送信する。情報拡散系列は、例えば、犯罪の発生履歴、金融取引の履歴、デモやストライキの発生履歴を表すデータであり、時刻の系列で表される。解析の対象とする情報拡散の系列は、

　で表される。ここでｕ_ｉはユーザ、ｙ_ｉは特定のトピックに対する意見、ｔ_ｉは時刻、Ｉはデータ数である。ユーザ数をＵとする。ここでは、特定のトピックに対する意見としてバイナリ値ｙ_ｉ∈｛０，１｝が与えられているケースを考える。例えば、米大統領選期間中に政治関連のツイートを収集し、共和党に関するタグを含む投稿をｙ_ｉ＝０、民主党に関するタグを含む投稿をｙ_ｉ＝１として抽出することでデータセットを生成する。ここでは、意見の種類はＹ＝２である。情報拡散系列格納装置１は、Ｗｅｂページを保持するＷｅｂサーバや、データベースを具備するデータベースサーバ等である。

　ネットワーク情報格納装置２は、装置により解析され得るネットワーク情報を格納しており、装置からの要求に従って、ネットワーク情報を読み出し、当該情報を情報拡散予測装置に送信する。ここでネットワーク情報は、友人関係などに基づいて形成されたソーシャルネットワークの隣接行列である。ソーシャルネットワークは、ユーザを頂点、ユーザ間の関係を辺とするグラフＧ＝（Ｖ，Ｅ）で表される。ここでＶは頂点(ユーザ)の集
合、Ｅは辺の集合である。ネットワーク情報は、グラフＧの隣接行列であり、

　で表される。隣接行列は、例えば、ソーシャルメディア上の友人関係(フォロー・フォロワー関係)をバイナリ値で表したものである。ユーザ(ノード)ｉとｊの間に何らかの関係(エッジ)が存在する場合、行列Ｇのｉ行ｊ列の要素Ｇ_ｉ，ｊを１とする。ユーザ(ノード)ｉとｊの間に関係(エッジ)が存在しない場合、Ｇ_ｉ，ｊを０とする。

　パラメータ推定部４は、情報拡散系列格納装置１、ネットワーク情報格納装置２に格納されている情報に基づき、イベントの発生確率を表す強度関数のパラメータを学習する。ここで、イベントはツイート等、ソーシャルネットワークにおける意見の発信である。

　パラメータ格納部５は、パラメータ推定部４で得られた最適パラメータの組を格納する。格納に用いる装置は、推定したパラメータの組が保存され、復元可能なものであれば良い。例えば、パラメータの組は、データベースや、予め備えられた汎用的な記憶装置(メモリやハードディスク装置)の特定領域に記憶される。

　予測部６は、パラメータ推定部４の推定結果に基づき、点過程のシミュレーションを行って、各ユーザの意見の発信確率を算出する。点過程のシミュレーションを行う手法は複数存在するが、例えば予測部６は、"ｔｈｉｎｎｉｎｇ"と呼ばれる手法（参考文献［１］）を適用することができる。

　出力部７は、予測部６で得られた結果を出力する。ここで、出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部装置への送信等を含む概念である。出力部７は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部７は、出力デバイスのドライバーソフト等によって実現される。

　（情報拡散系列情報の具体例）
　図２は、情報拡散系列情報の一例を示す図である。情報拡散系列情報１０１は、項目として、「ユーザ」と、「意見」と「時刻」とを含む。

　項目「ユーザ」の値は、各ユーザを識別するための識別子である。項目「意見」の値は、投稿された意見を示すバイナリ値である。項目「時刻」の値は、意見が投稿された時刻を示す値である。

　（予測装置の動作例）
　次に、予測装置１０の動作例について、図面を参照して説明する。予測装置１０は、ユーザの操作等を受けて、または定期的に、学習処理を開始する。

　図３は、学習処理の流れの一例を示すフローチャートである。予測装置１０は、情報拡散系列を取得する（ステップＳ１１）。次に、パラメータ推定部４は、パラメータを推定する（ステップＳ１２）。具体的には、パラメータ推定部４は、一般的な点過程モデルの手続きに従って設計された強度関数のパラメータを推定する。強度関数は、単位時間当たりに情報発信が起こる確率を表す関数である。例えば、ユーザｕが時刻ｔに意見ｙを発信する確率は、強度関数λ_ｕ（ｔ，ｙ）を用いて式（１）と表される。

　ここでｔは時刻、ｙは意見である。ここでは簡単のため、強度関数を意見ｙに依存する項Ｐ^＊ _ｕ（ｙ｜ｔ）と時刻ｔのみに依存する項λ^＊ _ｕ（ｔ）に分解される例を示したが、他の式によって表される強度関数であっても良い。また、λ^＊ _ｕ（ｔ）は、式（２）に示すように、Ｈａｗｋｅｓ過程の強度関数を用いてモデル化されている。

　ここでμ_ｕは「バックグランドレート」と呼ばれ、過去のイベントに依らないイベントの発生確率を表す。ここでは簡単のため時間変化しない定数μ_ｕを用いるが、μ_ｕが時間に依存して変化する場合であっても良い。ここでｋ（・）は従来のＨａｗｋｅｓ過程モデルにおいて用いられるトリガー関数であり、例えば指数減衰関数、ワイブル分布、ガンマ分布等を用いてモデル化される。ここではユーザｕごとに異なるバックグラウンドレートを仮定する。Ｐ^＊ _ｕ（ｙ｜ｔ）はユーザｕの意見の時間変化を表す関数であり、微分方程式を用いてモデル化される。具体的には、微分方程式の潜在状態を

　と置き、その時間発展を式（３）のように記述する。

　ここで、ｄは潜在状態の次元数、ｆ（・）は微分方程式の時間発展を記述する関数である。Ｘ_０は潜在状態Ｘ（ｔ）の初期値、ＷはＧＮＮのパラメータ、

　はネットワーク情報であり、例えばユーザ間の友人関係を表す。

　他のユーザの影響による複雑な意見の変遷をモデル化するため、グラフニューラルネットワーク（ＧＮＮ）を用いてｆ（・）を記述する。意見ｙがバイナリ値で表される場合、時刻ｔにおいてユーザｕが意見ｙ＝ｋを持つ確率Ｐ^＊ _ｕ（ｙ＝ｋ）は、ソフトマックス関数を用いて式（４）に示すように記述される。

　ここで、

　は、潜在状態Ｘ（ｔ）からユーザｕに関する成分を抽出したベクトル、

　は、意見ｋごとのソフトマックス関数のパラメータである。

　時刻Ｔまでの情報拡散系列が与えられたとき、本モデルの尤度は式（５）に示すように表される。

　Ｋ（・）はトリガー関数ｋ（・）の積分であり、指数減衰関数、ワイブル分布、ガンマ分布等多くのトリガー関数ｋ（・）について解析解が得られる。

　パラメータ推定部４は、尤度Ｌを最小化するようなＧＮＮであるｆ（・）のパラメータＷ、潜在状態Ｘ（ｔ）の初期値Ｘ_０、Ｐ^＊ _ｕ（・）のパラメータ｛Ｗ_ｋ，ｂ_ｋ｝、カーネル関数ｋ（・）のパラメータ、強度関数のパラメータμ＝｛μ_１，・・・，μ_Ｕ｝、

　を推定する。パラメータ推定部４は、パラメータの最適化にはどんな方法を用いても良い。式（５）の尤度は全てのパラメータについて微分可能なため、パラメータ推定部４は、例えば誤差逆伝播法などの最急降下法(勾配法)を用いて最適化することができる。

　次に、パラメータ格納部５は、推定されたパラメータを格納する（ステップＳ１３）。

　また、予測装置１０は、ユーザの操作等を受けて、予測処理を開始する。

　図４は、予測処理の流れの一例を示すフローチャートである。予測装置１０は、情報拡散系列を取得する（ステップＳ２１）。次に、予測部６は、学習処理によって推定されたパラメータを読み出す（ステップＳ２２）。続いて、予測部６は、読み出したパラメータを用いて、点過程のシミュレーションを行って、近未来の情報発信を予測する（ステップＳ２３）。そして、出力部は、予測結果を出力する（ステップＳ２４）。

　（本実施の形態に係るハードウェア構成例）
　予測装置１０は、例えば、コンピュータに、本実施の形態で説明する処理内容を記述したプログラムを実行させることにより実現可能である。なお、この「コンピュータ」は、物理マシンであってもよいし、クラウド上の仮想マシンであってもよい。仮想マシンを使用する場合、ここで説明する「ハードウェア」は仮想的なハードウェアである。

　上記プログラムは、コンピュータが読み取り可能な記録媒体（可搬メモリ等）に記録して、保存したり、配布したりすることが可能である。また、上記プログラムをインターネットや電子メール等、ネットワークを通して提供することも可能である。

　図５は、上記コンピュータのハードウェア構成例を示す図である。図５のコンピュータは、それぞれバスＢで相互に接続されているドライブ装置１０００、補助記憶装置１００２、メモリ装置１００３、ＣＰＵ１００４、インタフェース装置１００５、表示装置１００６、入力装置１００７、出力装置１００８等を有する。

　当該コンピュータでの処理を実現するプログラムは、例えば、ＣＤ－ＲＯＭ又はメモリカード等の記録媒体１００１によって提供される。プログラムを記憶した記録媒体１００１がドライブ装置１０００にセットされると、プログラムが記録媒体１００１からドライブ装置１０００を介して補助記憶装置１００２にインストールされる。但し、プログラムのインストールは必ずしも記録媒体１００１より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置１００２は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。

　メモリ装置１００３は、プログラムの起動指示があった場合に、補助記憶装置１００２からプログラムを読み出して格納する。ＣＰＵ１００４は、メモリ装置１００３に格納されたプログラムに従って、当該装置に係る機能を実現する。インタフェース装置１００５は、ネットワークに接続するためのインタフェースとして用いられる。表示装置１００６はプログラムによるＧＵＩ（Ｇｒａｐｈｉｃａｌ　Ｕｓｅｒ　Ｉｎｔｅｒｆａｃｅ）等を表示する。入力装置１００７はキーボード及びマウス、ボタン、又はタッチパネル等で構成され、様々な操作指示を入力させるために用いられる。出力装置１００８は演算結果を出力する。なお、上記コンピュータは、ＣＰＵ１００４の代わりにＧＰＵ（Graphics Processing Unit）またはＴＰＵ（Tensor processing unit）を備えていても良く、ＣＰＵ１００４に加えて、ＧＰＵまたはＴＰＵを備えていても良い。その場合、例えばニューラルネットワーク等の特殊な演算が必要な処理をＧＰＵまたはＴＰＵが実行し、その他の処理をＣＰＵ１００４が実行する、というように処理を分担して実行しても良い。

　（本実施の形態の効果）
　本実施の形態に係る予測装置１０によれば、意見の変遷を、ＧＮＮを用いてモデル化することで、ユーザ間の複雑な影響を学習することができる。したがって、意見の発信の予測精度を向上させることができる。

　（参考文献）
　［１］：OGATA, Yosihiko. On Lewis' simulation method for point processes. IEEE Transactions on Information Theory, 1981, 27.1: 23-31.

　（実施の形態のまとめ）
　本明細書には、少なくとも下記の各項に記載した予測装置、予測方法およびプログラムが記載されている。
（第１項）
　複数のユーザによる意見の発信の履歴を示す情報拡散系列情報と、前記複数のユーザ間の関係を示すネットワーク情報と、に基づいて、各ユーザの意見の発信が発生する確率を表す強度関数のパラメータを推定するパラメータ推定部と、
　推定された前記パラメータに基づいて、各ユーザの意見の発信を予測する予測部と、を備える、
　予測装置。
（第２項）
　前記ネットワーク情報は、ユーザ間の相互作用の時間変化を表す微分方程式の時間発展を表すＧＮＮの隣接行列である、
　第１項に記載の予測装置。
（第３項）
　前記パラメータ推定部は、前記意見の発信が行われる尤度を最小化するパラメータを、勾配法を用いて推定する、
　第１項または第２項に記載の予測装置。
（第４項）
　前記予測部は、推定された前記パラメータに基づく点過程のシミュレーションによって、各ユーザの意見の発信確率を算出する、
　第１項から第３項のいずれか１項に記載の予測装置。
（第５項）
　予測装置が実行する予測方法であって、
　複数のユーザによる意見の発信の履歴を示す情報拡散系列情報と、前記複数のユーザ間の関係を示すネットワーク情報と、に基づいて、各ユーザの意見の発信が発生する確率を表す強度関数のパラメータを推定するステップと、
　推定された前記パラメータに基づいて、各ユーザの意見の発信を予測するステップと、を備える、
　予測方法。
（第６項）
　コンピュータを、第１項から第４項のいずれか１項に記載の予測装置における各部として機能させるためのプログラム。

　以上、本実施の形態について説明したが、本発明はかかる特定の実施形態に限定されるものではなく、請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。

１　情報拡散系列格納装置
２　ネットワーク情報格納装置
３　操作部
４　パラメータ推定部
５　パラメータ格納部
６　予測部
７　出力部
１０　予測装置
１０００　ドライブ装置
１００１　記録媒体
１００２　補助記憶装置
１００３　メモリ装置
１００４　ＣＰＵ
１００５　インタフェース装置
１００６　表示装置
１００７　入力装置
１００８　出力装置

Claims

　複数のユーザによる意見の発信の履歴を示す情報拡散系列情報と、前記複数のユーザ間の関係を示すネットワーク情報と、に基づいて、各ユーザの意見の発信が発生する確率を表す強度関数のパラメータを推定するパラメータ推定部と、
　推定された前記パラメータに基づいて、各ユーザの意見の発信を予測する予測部と、を備える、
　予測装置。
　前記ネットワーク情報は、ユーザ間の相互作用の時間変化を表す微分方程式の時間発展を表すＧＮＮの隣接行列である、
　請求項１に記載の予測装置。
　前記パラメータ推定部は、前記意見の発信が行われる尤度を最小化するパラメータを、勾配法を用いて推定する、
　請求項１または２に記載の予測装置。
　前記予測部は、推定された前記パラメータに基づく点過程のシミュレーションによって、各ユーザの意見の発信確率を算出する、
　請求項１から３のいずれか１項に記載の予測装置。
　予測装置が実行する予測方法であって、
　複数のユーザによる意見の発信の履歴を示す情報拡散系列情報と、前記複数のユーザ間の関係を示すネットワーク情報と、に基づいて、各ユーザの意見の発信が発生する確率を表す強度関数のパラメータを推定するステップと、
　推定された前記パラメータに基づいて、各ユーザの意見の発信を予測するステップと、を備える、
　予測方法。
　コンピュータを、請求項１から４のいずれか１項に記載の予測装置における各部として機能させるためのプログラム。