WO2022259487A1 - 予測装置、予測方法およびプログラム - Google Patents

予測装置、予測方法およびプログラム Download PDF

Info

Publication number
WO2022259487A1
WO2022259487A1 PCT/JP2021/022203 JP2021022203W WO2022259487A1 WO 2022259487 A1 WO2022259487 A1 WO 2022259487A1 JP 2021022203 W JP2021022203 W JP 2021022203W WO 2022259487 A1 WO2022259487 A1 WO 2022259487A1
Authority
WO
WIPO (PCT)
Prior art keywords
opinion
prediction
users
user
parameter
Prior art date
Application number
PCT/JP2021/022203
Other languages
English (en)
French (fr)
Inventor
真耶 大川
浩之 戸田
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to JP2023526777A priority Critical patent/JPWO2022259487A1/ja
Priority to PCT/JP2021/022203 priority patent/WO2022259487A1/ja
Publication of WO2022259487A1 publication Critical patent/WO2022259487A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism

Definitions

  • the present invention relates to a prediction device, a prediction method, and a program.
  • a Hawkes process is a kind of point process.
  • a point process is a model for describing the number of occurrences of events in a minute interval, and events are information transmissions in social networks such as tweets.
  • a function called the "intensity function" is used to model the probability of occurrence of an event at any given time.
  • the Hawkes process is a point process that describes the bursty diffusion of information (a phenomenon in which information explodes in a short period of time).
  • Non-Patent Document 1 discloses a point process model that considers the influence of friends in the process of spreading opinions. This method can describe the transition of the user's opinion, which changes under the influence of friends, by describing the strength function using a linear differential equation.
  • the above conventional technology models the diffusion process by describing the intensity function of the point process using a linear differential equation.
  • the conventional technology assumes linearity in the interaction between users, there is a problem that it is not possible to realize a highly accurate prediction of the transmission of opinions in consideration of complex interactions.
  • the purpose of the disclosure technology is to improve the accuracy of forecasting the transmission of opinions.
  • the disclosed technique calculates the probability of occurrence of each user's opinion transmission based on information diffusion sequence information that indicates the history of opinion transmission by a plurality of users and network information that indicates the relationship between the plurality of users.
  • a prediction device comprising: a parameter estimator for estimating parameters of an intensity function to be represented; and a prediction unit for predicting each user's opinion transmission based on the estimated parameters.
  • FIG. 4 is a diagram showing an example of information spreading sequence information
  • 6 is a flowchart showing an example of the flow of learning processing
  • 6 is a flowchart showing an example of the flow of prediction processing
  • It is a figure which shows the hardware configuration example of a computer.
  • the prediction device describes the time change of the interaction between users with a differential equation, and describes the time evolution of the differential equation using a graph neural network (GNN). do. Specifically, the prediction device captures the social network as a graph with users as vertices and relationships between users as edges, and obtains latent vectors of nodes using GNN. The temporal change of the latent vector thus obtained is described using a differential equation.
  • GNN graph neural network
  • FIG. 1 is a functional configuration diagram of a prediction device.
  • the prediction device 10 includes an operation unit 3 , a parameter estimation unit 4 , a parameter storage unit 5 , a prediction unit 6 and an output unit 7 .
  • the operation unit 3 accepts various operations on the data in the information diffusion sequence storage device 1 and the network information storage device 2. Various operations include operations for registering, correcting, and deleting stored information.
  • Input means of the operation unit 3 are, for example, a keyboard, a mouse, a touch panel, and the like.
  • the operation unit 3 is implemented by device drivers for input means such as a mouse, control software for menu screens, and the like.
  • the information spreading sequence storage device 1 stores history information of information spreading that can be analyzed by the device, reads information spreading sequence information according to a request from the device, and transmits the information to the information spreading prediction device.
  • the information diffusion series is, for example, data representing the history of crime occurrence, financial transaction history, demonstration and strike occurrence history, and is represented by a time series.
  • the sequence of information diffusion to be analyzed is
  • the information diffusion sequence storage device 1 is a web server that holds web pages, a database server that has a database, or the like.
  • the network information storage device 2 stores network information that can be analyzed by the device, reads the network information according to a request from the device, and transmits the information to the information diffusion prediction device.
  • the network information is an adjacency matrix of social networks formed based on friendships and the like.
  • the network information is the adjacency matrix of the graph G,
  • the adjacency matrix represents, for example, a friendship relationship (follow-follower relationship) on social media with a binary value. If there is some relationship (edge) between users (nodes) i and j, let the element G i,j in the i-th row, j-th column of the matrix G be 1. Let G i,j be 0 if there is no relationship (edge) between users (nodes) i and j.
  • the parameter estimator 4 learns the parameters of the intensity function representing the event occurrence probability based on the information stored in the information spreading sequence storage device 1 and the network information storage device 2 .
  • an event is a transmission of an opinion on a social network, such as a tweet.
  • the parameter storage unit 5 stores the set of optimal parameters obtained by the parameter estimation unit 4. Any device may be used for storage as long as the set of estimated parameters can be saved and restored. For example, a set of parameters is stored in a specific area of a database or a general-purpose storage device (memory or hard disk device) provided in advance.
  • the prediction unit 6 performs a point process simulation based on the estimation result of the parameter estimation unit 4 to calculate the probability of each user's opinion transmission.
  • the prediction unit 6 can apply a technique called "thinning" (Reference [1]).
  • the output unit 7 outputs the result obtained by the prediction unit 6.
  • output is a concept including display on a display, printing on a printer, sound output, transmission to an external device, and the like.
  • the output unit 7 may or may not include output devices such as a display and speakers.
  • the output unit 7 is implemented by driver software or the like of the output device.
  • FIG. 2 is a diagram showing an example of information spreading sequence information.
  • the information spreading sequence information 101 includes “user”, “opinion” and “time” as items.
  • the value of the item "user” is an identifier for identifying each user.
  • the value of the item “opinion” is a binary value indicating the posted opinion.
  • the value of the item “time” is a value indicating the time when the opinion was posted.
  • the prediction device 10 starts learning processing in response to a user's operation or the like, or periodically.
  • FIG. 3 is a flowchart showing an example of the flow of learning processing.
  • the prediction device 10 acquires an information spreading sequence (step S11).
  • the parameter estimator 4 estimates parameters (step S12). Specifically, the parameter estimator 4 estimates the parameters of the intensity function designed according to the procedure of a general point process model.
  • the intensity function is a function representing the probability of information transmission occurring per unit time. For example, the probability that user u will give opinion y at time t is represented by Equation (1) using the intensity function ⁇ u (t, y).
  • ⁇ u is called a “background rate” and represents the event occurrence probability that does not depend on past events.
  • ⁇ u a constant that does not change with time is used, but ⁇ u may change depending on time.
  • k( ⁇ ) is a trigger function used in a conventional Hawkes process model, and is modeled using, for example, an exponential decay function, Weibull distribution, gamma distribution, or the like.
  • t) is a function representing time-varying opinion of user u, and is modeled using a differential equation. Specifically, let the latent state of the differential equation be
  • Equation (3) Equation (3)
  • d is the number of dimensions of the latent state
  • f( ⁇ ) is a function describing the time evolution of the differential equation.
  • X 0 is the initial value of the latent state X(t)
  • W is the parameter of the GNN
  • network information is network information, and represents, for example, friendship relationships between users.
  • a graph neural network (GNN) is used to describe f( ⁇ ) in order to model complex changes in opinions influenced by other users.
  • opinion y is represented by a binary value
  • Equation (5) When the information spreading sequence up to time T is given, the likelihood of this model is expressed as shown in Equation (5).
  • K( ⁇ ) is the integral of the trigger function k( ⁇ ), and analytical solutions can be obtained for many trigger functions k( ⁇ ) such as exponential decay function, Weibull distribution, gamma distribution, and the like.
  • the parameter estimator 4 may use any method for parameter optimization. Since the likelihood of Equation (5) can be differentiated for all parameters, the parameter estimator 4 can optimize using a steepest descent method (gradient method) such as error backpropagation.
  • gradient method steepest descent method
  • the parameter storage unit 5 stores the estimated parameters (step S13).
  • the prediction device 10 starts prediction processing in response to a user's operation or the like.
  • FIG. 4 is a flowchart showing an example of the flow of prediction processing.
  • the prediction device 10 acquires an information spreading sequence (step S21).
  • the prediction unit 6 reads parameters estimated by the learning process (step S22).
  • the prediction unit 6 performs a point process simulation using the read parameters to predict information transmission in the near future (step S23).
  • an output part outputs a prediction result (step S24).
  • Prediction device 10 can be implemented, for example, by causing a computer to execute a program describing the processing details described in the present embodiment.
  • this "computer” may be a physical machine or a virtual machine on the cloud.
  • the "hardware” described here is virtual hardware.
  • the above program can be recorded on a computer-readable recording medium (portable memory, etc.), saved, or distributed. It is also possible to provide the above program through a network such as the Internet or e-mail.
  • FIG. 5 is a diagram showing a hardware configuration example of the computer.
  • the computer of FIG. 5 has a drive device 1000, an auxiliary storage device 1002, a memory device 1003, a CPU 1004, an interface device 1005, a display device 1006, an input device 1007, an output device 1008, etc., which are connected to each other via a bus B, respectively.
  • a program that implements the processing in the computer is provided by a recording medium 1001 such as a CD-ROM or memory card, for example.
  • a recording medium 1001 such as a CD-ROM or memory card
  • the program is installed from the recording medium 1001 to the auxiliary storage device 1002 via the drive device 1000 .
  • the program does not necessarily need to be installed from the recording medium 1001, and may be downloaded from another computer via the network.
  • the auxiliary storage device 1002 stores installed programs, as well as necessary files and data.
  • the memory device 1003 reads and stores the program from the auxiliary storage device 1002 when a program activation instruction is received.
  • the CPU 1004 implements functions related to the device according to programs stored in the memory device 1003 .
  • the interface device 1005 is used as an interface for connecting to the network.
  • a display device 1006 displays a GUI (Graphical User Interface) or the like by a program.
  • An input device 1007 is composed of a keyboard, a mouse, buttons, a touch panel, or the like, and is used to input various operational instructions.
  • the output device 1008 outputs the calculation result.
  • the computer may include a GPU (Graphics Processing Unit) or TPU (Tensor Processing Unit) instead of the CPU 1004, or may include a GPU or TPU in addition to the CPU 1004. In that case, the processing may be divided and executed such that the GPU or TPU executes processing that requires special computation, such as a neural network, and the CPU 1004 executes other processing.
  • This specification describes at least the prediction device, the prediction method, and the program described in each of the following items.
  • (Section 1) A parameter of an intensity function representing the probability of each user's opinion transmission occurring based on information diffusion sequence information indicating a history of opinion transmission by a plurality of users and network information indicating a relationship between the plurality of users. a parameter estimator for estimating a prediction unit that predicts the transmission of each user's opinion based on the estimated parameters; prediction device.
  • the network information is a GNN adjacency matrix representing the time evolution of a differential equation representing the time change of interaction between users, A prediction device according to claim 1.
  • the parameter estimation unit estimates a parameter that minimizes the likelihood that the opinion will be transmitted using a gradient method, 3.
  • a prediction device according to claim 1 or 2.
  • the prediction unit calculates the probability of each user's opinion transmission by a point process simulation based on the estimated parameters.
  • the prediction device according to any one of items 1 to 3.
  • (Section 5) A prediction method performed by a prediction device, A parameter of an intensity function representing the probability that each user's opinion will occur, based on information diffusion sequence information that indicates the history of opinion transmission by a plurality of users, and network information that indicates the relationship between the plurality of users. estimating the predicting each user's opinion transmission based on the estimated parameters; Forecast method.

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

複数のユーザによる意見の発信の履歴を示す情報拡散系列情報と、前記複数のユーザ間の関係を示すネットワーク情報と、に基づいて、各ユーザの意見の発信が発生する確率を表す強度関数のパラメータを推定するパラメータ推定部と、推定された前記パラメータに基づいて、各ユーザの意見の発信を予測する予測部と、を備える予測装置である。

Description

予測装置、予測方法およびプログラム
 本発明は、予測装置、予測方法およびプログラムに関する。
 近年、スマートフォンの普及により、ソーシャルメディアを介したコミュニケーションが一般的になっている。これらのソーシャルメディアにおいては、友人関係などに基づいて形成されたソーシャルネットワークを介して情報が拡散される。情報拡散メカニズムは、確率モデルを用いてモデル化することができる。最も代表的なものはHawkes過程である。Hawkes過程は点過程の一種である。点過程は、微小区間におけるイベントの発生数を記述するためのモデルであり、イベントはツイート等、ソーシャルネットワークにおける情報発信である。「強度関数」と呼ばれる関数を用いて任意の時刻におけるイベントの発生確率をモデル化する。Hawkes過程は、情報のバースト的な拡散(情報が短期間に爆発的に拡散する現象)を記述する点過程である。
 ソーシャルメディアは、ニュース、政治問題、製品など様々なトピックについてユーザが自分の意見を述べる場として広く利用されている。意見の拡散過程においては、各ユーザの意見が友人の影響で変化するということが知られている。各ユーザは、友人の投稿から学ぶことで、各トピックに関する意見を更新する。例えば、非特許文献1には、意見の拡散過程における友人の影響を考慮した点過程モデルが開示されている。この手法は、線形微分方程式を用いて強度関数を記述することで、友人の影響で変化するユーザの意見の変遷を記述することができる。
Abir, De, et al., Learning and Forecasting Opinion Dynamics in Social Networks. (2016).
 上記の従来技術は、線形微分方程式を用いて点過程の強度関数を記述することで、拡散過程のモデル化を行っている。しかし、従来技術は、ユーザ間の相互作用に線形性を仮定しているため、複雑な相互作用を考慮した高精度な意見の発信の予測を実現することができないという問題がある。
 開示の技術は、意見の発信の予測精度を向上させることを目的とする。
 開示の技術は、複数のユーザによる意見の発信の履歴を示す情報拡散系列情報と、前記複数のユーザ間の関係を示すネットワーク情報と、に基づいて、各ユーザの意見の発信が発生する確率を表す強度関数のパラメータを推定するパラメータ推定部と、推定された前記パラメータに基づいて、各ユーザの意見の発信を予測する予測部と、を備える予測装置である。
 意見の発信の予測精度を向上させることができる。
予測装置の機能構成図である。 情報拡散系列情報の一例を示す図である。 学習処理の流れの一例を示すフローチャートである。 予測処理の流れの一例を示すフローチャートである。 コンピュータのハードウェア構成例を示す図である。
 以下、図面を参照して本発明の実施の形態(本実施の形態)を説明する。以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。
 (本実施の形態の概要)
 本実施の形態に係る予測装置は、従来と同様に、ユーザ間の相互作用の時間変化を微分方程式で記述し、微分方程式の時間発展をグラフニューラルネットワーク(GNN;graph neural network)を用いて記述する。具体的には、予測装置は、ソーシャルネットワークを、ユーザを頂点とし、ユーザ間の関係を辺とするグラフとして捉え、GNNを用いてノードの潜在ベクトルを得る。こうして得られた潜在ベクトルの時間変化を、微分方程式を用いて記述する。この微分方程式を用いて点過程の強度関数をモデル化することで、情報(意見)の拡散過程をモデル化するとともに近未来の情報(意見)発信を予測する。
 (予測装置の機能構成例)
 図1は、予測装置の機能構成図である。予測装置10は、操作部3と、パラメータ推定部4と、パラメータ格納部5と、予測部6と、出力部7と、を備える。
 操作部3は、情報拡散系列格納装置1、ネットワーク情報格納装置2のデータに対する各種操作を受け付ける。各種操作とは、格納された情報を登録、修正、削除する操作等である。操作部3の入力手段は、例えばキーボード、マウス、タッチパネル等である。操作部3は、マウス等の入力手段のデバイスドライバー、メニュー画面の制御ソフトウェア等によって実現される。
 情報拡散系列格納装置1は、装置により解析され得る情報拡散の履歴情報を格納しており、装置からの要求に従って、情報拡散系列情報を読み出し、当該情報を情報拡散予測装置に送信する。情報拡散系列は、例えば、犯罪の発生履歴、金融取引の履歴、デモやストライキの発生履歴を表すデータであり、時刻の系列で表される。解析の対象とする情報拡散の系列は、
Figure JPOXMLDOC01-appb-M000001
 で表される。ここでuはユーザ、yは特定のトピックに対する意見、tは時刻、Iはデータ数である。ユーザ数をUとする。ここでは、特定のトピックに対する意見としてバイナリ値y∈{0,1}が与えられているケースを考える。例えば、米大統領選期間中に政治関連のツイートを収集し、共和党に関するタグを含む投稿をy=0、民主党に関するタグを含む投稿をy=1として抽出することでデータセットを生成する。ここでは、意見の種類はY=2である。情報拡散系列格納装置1は、Webページを保持するWebサーバや、データベースを具備するデータベースサーバ等である。
 ネットワーク情報格納装置2は、装置により解析され得るネットワーク情報を格納しており、装置からの要求に従って、ネットワーク情報を読み出し、当該情報を情報拡散予測装置に送信する。ここでネットワーク情報は、友人関係などに基づいて形成されたソーシャルネットワークの隣接行列である。ソーシャルネットワークは、ユーザを頂点、ユーザ間の関係を辺とするグラフG=(V,E)で表される。ここでVは頂点(ユーザ)の集
合、Eは辺の集合である。ネットワーク情報は、グラフGの隣接行列であり、
Figure JPOXMLDOC01-appb-M000002
 で表される。隣接行列は、例えば、ソーシャルメディア上の友人関係(フォロー・フォロワー関係)をバイナリ値で表したものである。ユーザ(ノード)iとjの間に何らかの関係(エッジ)が存在する場合、行列Gのi行j列の要素Gi,jを1とする。ユーザ(ノード)iとjの間に関係(エッジ)が存在しない場合、Gi,jを0とする。
 パラメータ推定部4は、情報拡散系列格納装置1、ネットワーク情報格納装置2に格納されている情報に基づき、イベントの発生確率を表す強度関数のパラメータを学習する。ここで、イベントはツイート等、ソーシャルネットワークにおける意見の発信である。
 パラメータ格納部5は、パラメータ推定部4で得られた最適パラメータの組を格納する。格納に用いる装置は、推定したパラメータの組が保存され、復元可能なものであれば良い。例えば、パラメータの組は、データベースや、予め備えられた汎用的な記憶装置(メモリやハードディスク装置)の特定領域に記憶される。
 予測部6は、パラメータ推定部4の推定結果に基づき、点過程のシミュレーションを行って、各ユーザの意見の発信確率を算出する。点過程のシミュレーションを行う手法は複数存在するが、例えば予測部6は、"thinning"と呼ばれる手法(参考文献[1])を適用することができる。
 出力部7は、予測部6で得られた結果を出力する。ここで、出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部装置への送信等を含む概念である。出力部7は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部7は、出力デバイスのドライバーソフト等によって実現される。
 (情報拡散系列情報の具体例)
 図2は、情報拡散系列情報の一例を示す図である。情報拡散系列情報101は、項目として、「ユーザ」と、「意見」と「時刻」とを含む。
 項目「ユーザ」の値は、各ユーザを識別するための識別子である。項目「意見」の値は、投稿された意見を示すバイナリ値である。項目「時刻」の値は、意見が投稿された時刻を示す値である。
 (予測装置の動作例)
 次に、予測装置10の動作例について、図面を参照して説明する。予測装置10は、ユーザの操作等を受けて、または定期的に、学習処理を開始する。
 図3は、学習処理の流れの一例を示すフローチャートである。予測装置10は、情報拡散系列を取得する(ステップS11)。次に、パラメータ推定部4は、パラメータを推定する(ステップS12)。具体的には、パラメータ推定部4は、一般的な点過程モデルの手続きに従って設計された強度関数のパラメータを推定する。強度関数は、単位時間当たりに情報発信が起こる確率を表す関数である。例えば、ユーザuが時刻tに意見yを発信する確率は、強度関数λ(t,y)を用いて式(1)と表される。
Figure JPOXMLDOC01-appb-M000003
 ここでtは時刻、yは意見である。ここでは簡単のため、強度関数を意見yに依存する項P (y|t)と時刻tのみに依存する項λ (t)に分解される例を示したが、他の式によって表される強度関数であっても良い。また、λ (t)は、式(2)に示すように、Hawkes過程の強度関数を用いてモデル化されている。
Figure JPOXMLDOC01-appb-M000004
 ここでμは「バックグランドレート」と呼ばれ、過去のイベントに依らないイベントの発生確率を表す。ここでは簡単のため時間変化しない定数μを用いるが、μが時間に依存して変化する場合であっても良い。ここでk(・)は従来のHawkes過程モデルにおいて用いられるトリガー関数であり、例えば指数減衰関数、ワイブル分布、ガンマ分布等を用いてモデル化される。ここではユーザuごとに異なるバックグラウンドレートを仮定する。P (y|t)はユーザuの意見の時間変化を表す関数であり、微分方程式を用いてモデル化される。具体的には、微分方程式の潜在状態を
Figure JPOXMLDOC01-appb-M000005
 と置き、その時間発展を式(3)のように記述する。
Figure JPOXMLDOC01-appb-M000006
 ここで、dは潜在状態の次元数、f(・)は微分方程式の時間発展を記述する関数である。Xは潜在状態X(t)の初期値、WはGNNのパラメータ、
Figure JPOXMLDOC01-appb-M000007
 はネットワーク情報であり、例えばユーザ間の友人関係を表す。
 他のユーザの影響による複雑な意見の変遷をモデル化するため、グラフニューラルネットワーク(GNN)を用いてf(・)を記述する。意見yがバイナリ値で表される場合、時刻tにおいてユーザuが意見y=kを持つ確率P (y=k)は、ソフトマックス関数を用いて式(4)に示すように記述される。
Figure JPOXMLDOC01-appb-M000008
 ここで、
Figure JPOXMLDOC01-appb-M000009
 は、潜在状態X(t)からユーザuに関する成分を抽出したベクトル、
Figure JPOXMLDOC01-appb-M000010
 は、意見kごとのソフトマックス関数のパラメータである。
 時刻Tまでの情報拡散系列が与えられたとき、本モデルの尤度は式(5)に示すように表される。
Figure JPOXMLDOC01-appb-M000011
 K(・)はトリガー関数k(・)の積分であり、指数減衰関数、ワイブル分布、ガンマ分布等多くのトリガー関数k(・)について解析解が得られる。
 パラメータ推定部4は、尤度Lを最小化するようなGNNであるf(・)のパラメータW、潜在状態X(t)の初期値X、P (・)のパラメータ{W,b}、カーネル関数k(・)のパラメータ、強度関数のパラメータμ={μ,・・・,μ}、
Figure JPOXMLDOC01-appb-M000012
 を推定する。パラメータ推定部4は、パラメータの最適化にはどんな方法を用いても良い。式(5)の尤度は全てのパラメータについて微分可能なため、パラメータ推定部4は、例えば誤差逆伝播法などの最急降下法(勾配法)を用いて最適化することができる。
 次に、パラメータ格納部5は、推定されたパラメータを格納する(ステップS13)。
 また、予測装置10は、ユーザの操作等を受けて、予測処理を開始する。
 図4は、予測処理の流れの一例を示すフローチャートである。予測装置10は、情報拡散系列を取得する(ステップS21)。次に、予測部6は、学習処理によって推定されたパラメータを読み出す(ステップS22)。続いて、予測部6は、読み出したパラメータを用いて、点過程のシミュレーションを行って、近未来の情報発信を予測する(ステップS23)。そして、出力部は、予測結果を出力する(ステップS24)。
 (本実施の形態に係るハードウェア構成例)
 予測装置10は、例えば、コンピュータに、本実施の形態で説明する処理内容を記述したプログラムを実行させることにより実現可能である。なお、この「コンピュータ」は、物理マシンであってもよいし、クラウド上の仮想マシンであってもよい。仮想マシンを使用する場合、ここで説明する「ハードウェア」は仮想的なハードウェアである。
 上記プログラムは、コンピュータが読み取り可能な記録媒体(可搬メモリ等)に記録して、保存したり、配布したりすることが可能である。また、上記プログラムをインターネットや電子メール等、ネットワークを通して提供することも可能である。
 図5は、上記コンピュータのハードウェア構成例を示す図である。図5のコンピュータは、それぞれバスBで相互に接続されているドライブ装置1000、補助記憶装置1002、メモリ装置1003、CPU1004、インタフェース装置1005、表示装置1006、入力装置1007、出力装置1008等を有する。
 当該コンピュータでの処理を実現するプログラムは、例えば、CD-ROM又はメモリカード等の記録媒体1001によって提供される。プログラムを記憶した記録媒体1001がドライブ装置1000にセットされると、プログラムが記録媒体1001からドライブ装置1000を介して補助記憶装置1002にインストールされる。但し、プログラムのインストールは必ずしも記録媒体1001より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置1002は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。
 メモリ装置1003は、プログラムの起動指示があった場合に、補助記憶装置1002からプログラムを読み出して格納する。CPU1004は、メモリ装置1003に格納されたプログラムに従って、当該装置に係る機能を実現する。インタフェース装置1005は、ネットワークに接続するためのインタフェースとして用いられる。表示装置1006はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置1007はキーボード及びマウス、ボタン、又はタッチパネル等で構成され、様々な操作指示を入力させるために用いられる。出力装置1008は演算結果を出力する。なお、上記コンピュータは、CPU1004の代わりにGPU(Graphics Processing Unit)またはTPU(Tensor processing unit)を備えていても良く、CPU1004に加えて、GPUまたはTPUを備えていても良い。その場合、例えばニューラルネットワーク等の特殊な演算が必要な処理をGPUまたはTPUが実行し、その他の処理をCPU1004が実行する、というように処理を分担して実行しても良い。
 (本実施の形態の効果)
 本実施の形態に係る予測装置10によれば、意見の変遷を、GNNを用いてモデル化することで、ユーザ間の複雑な影響を学習することができる。したがって、意見の発信の予測精度を向上させることができる。
 (参考文献)
 [1]:OGATA, Yosihiko. On Lewis' simulation method for point processes. IEEE Transactions on Information Theory, 1981, 27.1: 23-31.
 (実施の形態のまとめ)
 本明細書には、少なくとも下記の各項に記載した予測装置、予測方法およびプログラムが記載されている。
(第1項)
 複数のユーザによる意見の発信の履歴を示す情報拡散系列情報と、前記複数のユーザ間の関係を示すネットワーク情報と、に基づいて、各ユーザの意見の発信が発生する確率を表す強度関数のパラメータを推定するパラメータ推定部と、
 推定された前記パラメータに基づいて、各ユーザの意見の発信を予測する予測部と、を備える、
 予測装置。
(第2項)
 前記ネットワーク情報は、ユーザ間の相互作用の時間変化を表す微分方程式の時間発展を表すGNNの隣接行列である、
 第1項に記載の予測装置。
(第3項)
 前記パラメータ推定部は、前記意見の発信が行われる尤度を最小化するパラメータを、勾配法を用いて推定する、
 第1項または第2項に記載の予測装置。
(第4項)
 前記予測部は、推定された前記パラメータに基づく点過程のシミュレーションによって、各ユーザの意見の発信確率を算出する、
 第1項から第3項のいずれか1項に記載の予測装置。
(第5項)
 予測装置が実行する予測方法であって、
 複数のユーザによる意見の発信の履歴を示す情報拡散系列情報と、前記複数のユーザ間の関係を示すネットワーク情報と、に基づいて、各ユーザの意見の発信が発生する確率を表す強度関数のパラメータを推定するステップと、
 推定された前記パラメータに基づいて、各ユーザの意見の発信を予測するステップと、を備える、
 予測方法。
(第6項)
 コンピュータを、第1項から第4項のいずれか1項に記載の予測装置における各部として機能させるためのプログラム。
 以上、本実施の形態について説明したが、本発明はかかる特定の実施形態に限定されるものではなく、請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
1 情報拡散系列格納装置
2 ネットワーク情報格納装置
3 操作部
4 パラメータ推定部
5 パラメータ格納部
6 予測部
7 出力部
10 予測装置
1000 ドライブ装置
1001 記録媒体
1002 補助記憶装置
1003 メモリ装置
1004 CPU
1005 インタフェース装置
1006 表示装置
1007 入力装置
1008 出力装置

Claims (6)

  1.  複数のユーザによる意見の発信の履歴を示す情報拡散系列情報と、前記複数のユーザ間の関係を示すネットワーク情報と、に基づいて、各ユーザの意見の発信が発生する確率を表す強度関数のパラメータを推定するパラメータ推定部と、
     推定された前記パラメータに基づいて、各ユーザの意見の発信を予測する予測部と、を備える、
     予測装置。
  2.  前記ネットワーク情報は、ユーザ間の相互作用の時間変化を表す微分方程式の時間発展を表すGNNの隣接行列である、
     請求項1に記載の予測装置。
  3.  前記パラメータ推定部は、前記意見の発信が行われる尤度を最小化するパラメータを、勾配法を用いて推定する、
     請求項1または2に記載の予測装置。
  4.  前記予測部は、推定された前記パラメータに基づく点過程のシミュレーションによって、各ユーザの意見の発信確率を算出する、
     請求項1から3のいずれか1項に記載の予測装置。
  5.  予測装置が実行する予測方法であって、
     複数のユーザによる意見の発信の履歴を示す情報拡散系列情報と、前記複数のユーザ間の関係を示すネットワーク情報と、に基づいて、各ユーザの意見の発信が発生する確率を表す強度関数のパラメータを推定するステップと、
     推定された前記パラメータに基づいて、各ユーザの意見の発信を予測するステップと、を備える、
     予測方法。
  6.  コンピュータを、請求項1から4のいずれか1項に記載の予測装置における各部として機能させるためのプログラム。
PCT/JP2021/022203 2021-06-10 2021-06-10 予測装置、予測方法およびプログラム WO2022259487A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2023526777A JPWO2022259487A1 (ja) 2021-06-10 2021-06-10
PCT/JP2021/022203 WO2022259487A1 (ja) 2021-06-10 2021-06-10 予測装置、予測方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/022203 WO2022259487A1 (ja) 2021-06-10 2021-06-10 予測装置、予測方法およびプログラム

Publications (1)

Publication Number Publication Date
WO2022259487A1 true WO2022259487A1 (ja) 2022-12-15

Family

ID=84425052

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/022203 WO2022259487A1 (ja) 2021-06-10 2021-06-10 予測装置、予測方法およびプログラム

Country Status (2)

Country Link
JP (1) JPWO2022259487A1 (ja)
WO (1) WO2022259487A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013179340A1 (ja) * 2012-05-30 2013-12-05 株式会社日立製作所 情報分析システム及び情報分析方法
CN112199608A (zh) * 2020-11-03 2021-01-08 北京中科研究院 基于网络信息传播图建模的社交媒体谣言检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013179340A1 (ja) * 2012-05-30 2013-12-05 株式会社日立製作所 情報分析システム及び情報分析方法
CN112199608A (zh) * 2020-11-03 2021-01-08 北京中科研究院 基于网络信息传播图建模的社交媒体谣言检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DE ABIR, VALERA ISABEL, GANGULY NILOY, BHATTACHARYA SOURANGSHU, RODRIGUEZ MANUEL GOMEZ: "Learning and Forecasting Opinion Dynamics in Social Networks", 30TH CONFERENCE ON NEURAL INFORMATION PROCESSING SYSTEMS (NIPS 2016), BARCELONA, SPAIN, 17 June 2015 (2015-06-17), Barcelona, Spain, pages 1 - 9, XP093015062, Retrieved from the Internet <URL:https://dl.acm.org/doi/pdf/10.5555/3157096.3157141> [retrieved on 20230118], DOI: 10.48550/arxiv.1506.05474 *
YOSHIKAWA, YUYA ET AL.: "Information Diffusion Model with Latent Features of Users on Social Networks", IPSJ TRANSACTIONS ON DATABASES (TOD) [CO-EDITED BY IEICE DATA ENGINEERING RESEARCH COMMITTEE, vol. 6, no. 5, 27 December 2013 (2013-12-27) *

Also Published As

Publication number Publication date
JPWO2022259487A1 (ja) 2022-12-15

Similar Documents

Publication Publication Date Title
US10958748B2 (en) Resource push method and apparatus
US11551239B2 (en) Characterizing and modifying user experience of computing environments based on behavior logs
US11170395B2 (en) Digital banking platform and architecture
WO2021027260A1 (zh) 处理交互序列数据的方法及装置
US20190244110A1 (en) Enhancing Evolutionary Optimization in Uncertain Environments By Allocating Evaluations Via Multi-Armed Bandit Algorithms
US11501161B2 (en) Method to explain factors influencing AI predictions with deep neural networks
US8190537B1 (en) Feature selection for large scale models
CN111373415A (zh) 使用神经网络分析序列数据
MX2015006174A (es) Pronosticadores personalizados para acciones de usuario en un sistema en linea.
US9715486B2 (en) Annotation probability distribution based on a factor graph
CN105144227A (zh) 社交媒体影响力评估
CN112528110A (zh) 确定实体业务属性的方法及装置
CN114663198A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
CN112070310A (zh) 基于人工智能的流失用户预测方法、装置及电子设备
WO2021139513A1 (zh) 处理交互序列数据的方法及装置
US20190324606A1 (en) Online training of segmentation model via interactions with interactive computing environment
US20220108334A1 (en) Inferring unobserved event probabilities
US20210357699A1 (en) Data quality assessment for data analytics
Lukita et al. Predictive and Analytics using Data Mining and Machine Learning for Customer Churn Prediction
JP6357435B2 (ja) 選択行動モデル化装置、選択行動予測装置、方法、及びプログラム
WO2022259487A1 (ja) 予測装置、予測方法およびプログラム
US20230052255A1 (en) System and method for optimizing a machine learning model
US20230153843A1 (en) System to combine intelligence from multiple sources that use disparate data sets
US20160042277A1 (en) Social action and social tie prediction
KR20220006580A (ko) 방문 예측

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21945161

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 18558460

Country of ref document: US

Ref document number: 2023526777

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE