JP2012048683A

JP2012048683A - インフルエンサを発見する装置及び方法

Info

Publication number: JP2012048683A
Application number: JP2010192925A
Authority: JP
Inventors: Yusuke Fukazawa; 佑介深澤
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2010-08-30
Filing date: 2010-08-30
Publication date: 2012-03-08
Anticipated expiration: 2030-08-30
Also published as: JP5489924B2

Abstract

【課題】ネットワークにおけるインフルエンサを効率的に発見すること。
【解決手段】Ｎユーザの中からネットワークにおけるインフルエンサを発見する装置は、ｉ番目のユーザにとってｊ番目のユーザがどのように影響するかを示す行列要素を算出することで（１≦ｉ，ｊ≦Ｎ）、遷移確率行列を決定する決定部と、前記遷移確率行列の固有ベクトルを求める固有ベクトル算出部とを有し、前記固有ベクトルの成分はＮユーザ各々の遷移確率を表し、相対的に大きな遷移確率を有するユーザが、ネットワークにおけるインフルエンサとして決定され、行列要素は、ｊ番目のユーザの発言回数に応じて変化する第１の値と、ｊ番目のユーザの発言の重要性を示す第２の値との線形結合により表現される。
【選択図】図１

Description

本発明は、インフルエンサを発見する装置及び方法に関連する。

ネットワーク社会の中では、最新のニュースや新製品の情報は、ネットワークにおける「口コミ」により広がって行くことが多い。特に、ブログ、ツイッタ、ソーシャルネットワーキングサービス（SNS）その他のコミュニティサイト等のようなユーザが情報を発信するメディア（CGM）を通じて、そのような口コミの情報が広まってゆく。ブログやツイッタ等では、極めて様々な人々（ユーザ）が、各自の意見や情報を記録し、閲覧する。これらのユーザの内、「インフルエンサ」と呼ばれるユーザは、他のユーザの消費行動や考え方に大きな影響を及ぼす。例えば、特定の分野に非常に詳しい専門家や、インターネット上で強い影響力を有する個人、芸能人、有名人等が、インフルエンサになることが多い。したがって、ネットワークを利用してマーケティング活動を行う際、そのようなインフルエンサが新製品の良さを理解できるようにすれば、口コミによる極めて効果的な宣伝を行うことができる。したがって、インフルエンサを発見することは、ネットワーク社会において重要な課題である。インフルエンサを発見する従来方法については、特許文献１に記載されている。

特開２００７−２０６８７６号公報

従来は、ユーザ間で発生するコミュニケーションの頻度に基づき、インフルエンサを算出する方法が提案されてきた。しかしながら、ユーザ間の間でコミュニケーション（個別のユーザを宛先とする通信信号の送受信）がない場合であっても、あるユーザが他のユーザの発言から影響を受ける場合もある。特に、発言の多いユーザほど他のユーザから閲覧される可能性が高くなり、結果として、他のユーザに影響を与える可能性が高くなる。従来は、インフルエンサを探す際に、あるユーザの発言が、他のユーザの目に触れる可能性については、考慮されていない。このため、あるユーザＡが他ユーザＢへ及ぼす影響度を計算する際、ユーザＡが他のユーザＢとコミュニケーションをとっていなかった場合、ユーザＡの発言を他のユーザＢが如何に頻繁に見ていたとしてもそれは考慮されず、ユーザＡによる影響度は、かなり低く見積もられてしまっている。したがって、従来の方法の場合、インフルエンサを正確に判別することは困難であるという問題がある。

本発明の課題は、ネットワークにおけるインフルエンサを効率的に発見することである。

本発明の一形態による装置は、
Ｎユーザの中からネットワークにおけるインフルエンサを発見する装置であって、
ｉ番目のユーザにとってｊ番目のユーザがどのように影響するかを示す行列要素を算出することで（１≦ｉ，ｊ≦Ｎ）、遷移確率行列を決定する決定部と、
前記遷移確率行列の固有ベクトルを求める固有ベクトル算出部と
を有し、前記固有ベクトルの成分はＮユーザ各々の遷移確率を表し、相対的に大きな遷移確率を有するユーザが、前記ネットワークにおけるインフルエンサとして決定され、
前記行列要素は、ｊ番目のユーザの発言回数に応じて変化する第１の値と、ｊ番目のユーザの発言の重要性を示す第２の値との線形結合により表現される、装置である。

本発明の一形態によれば、ネットワークにおけるインフルエンサを効率的に発見することができる。

インフルエンサを決定する装置の機能ブロック図。インフルエンサを決定する方法のフローチャート。フォロー関係による遷移確率行列を決定する様子を示す図。遷移確率行列を用いてベクトルを変換する様子を示す図。べき乗法により固有ベクトル及び遷移確率を求める様子を示す図。 R（Ui→Uj）を説明するための図。 C（Ui→Uj）を説明するための図。 C（Ui→Uj）を説明するための図。遷移確率行列を示す図。

以下の観点から実施例を説明する。

１．インフルエンサを決定する装置
２．インフルエンサを決定する方法
３．フォロー関係による遷移確率行列
４．実施例で使用される遷移確率行列
５．変形例

以下、ツイッタ（Twitter）における機能及び用語を用いて実施例を説明するが、このことは本発明に必須ではない。本発明は、ツイッタ以外の様々な用途（ブログ、ソーシャルネットワーキングサービス（SNS）その他のコミュニティサイト等）に適用可能である。

＜１．インフルエンサを決定する装置＞
図１は、インフルエンサを決定する装置の機能ブロック図を示す。この装置は、様々なユーザの端末とネットワークを介して通信することが可能なサーバに設けられる。図１には、本装置に備わる様々な機能要素の内、実施例の説明に特に関係のあるものが示されている。本装置は、ユーザ情報データベース10、フォロー管理部11、リツィート管理部12、リプライ管理部13、お気に入り管理部14、遷移確率行列決定部15、遷移確率・固有ベクトル算出部16を少なくとも有する。

ユーザ情報データベース10は、ネットワークを通じてツイッタ等により、やり取りを行うユーザの個人情報（識別番号、アカウント番号等）に加えて、ネットワークにおけるユーザのステータス情報を保存する。ステータス情報は、フォロー関係、リツィート関係、リプライ関係及びお気に入り保存状態により表現され、これらについては後述する。

フォロー管理部11は、ユーザ同士のフォロー（follow）関係を管理する。フォロー関係は、どのユーザがどのユーザの発言を自動的に表示するようにしているかを示す。例えば、ユーザＡが、ユーザＢに対してフォロー関係を設定していたとすると（Ａ→Ｂ）、ユーザＢによる発言は、ユーザＡの端末に自動的に表示され、ユーザＡは、ユーザＢの発言を速やかに参考にすることができる。ユーザＡの表示画面に登場するユーザＢの発言回数が多いほど、ユーザＡはユーザＢから大きな影響を受けることになる。したがって、ユーザＢの発言回数は、ユーザＡがユーザＢから影響を受ける際の量的な指標になる。

リツィート管理部12は、ユーザ同士のリツィート（re−tweet）関係を管理する。リツィート関係は、どのユーザが、どのユーザの発言を引用して発言したかを示す。例えば、ユーザＡがユーザＢに対してリツィート関係を設定していたとすると（Ａ→Ｂ）、ユーザＡは、ユーザＢの発言を引用して発言を行っている。その結果、ユーザＡに対してフォロー関係を設定しているユーザＣ（Ｃ→Ａ）は、ユーザＡの発言を参照する際、引用されているユーザＢの発言も参照できる。リツィートは、発言に賛同する場合、特に興味を持った場合、あるいは逆に発言に反対する場合等のように、その発言から大きな影響を受けた場合に行われる。上記の例では、ユーザＡはユーザＢの発言から大きな影響を受けており、ユーザＢの発言はユーザＡにとって重要である。したがって、ユーザＢの発言を引用するリツィート回数（引用回数）は、ユーザＡにとってユーザＢの発言がどの程度重要であるかを示す指標になる。

リプライ管理部13は、ユーザ同士のリプライ（reply）関係を管理する。リプライ関係は、どのユーザがどのユーザに個人的に返信を行ったかを示す。例えば、ユーザＢの発言を見たユーザＡが、ユーザＢ宛にメッセージを送ることでリプライ又は返信が行われる。リプライ関係は、通常、個人的な交流があるユーザ同士で行われるので、その個人にとって重要度は高い。ユーザＢに対するリプライ回数（返信回数）が多いほど、ユーザＢの発言はユーザＡにとって重要である。したがって、ユーザＢの発言に返信するリプライ回数は、ユーザＡにとってユーザＢの発言がどの程度重要であるかを示す指標になる。

お気に入り管理部14は、ユーザの「お気に入り（favorite）」保存状態を管理する。お気に入り保存状態は、どのユーザがどのユーザの発言を「お気に入り」として登録（又は保存）しているかを示す。ユーザＡがユーザＢの発言を登録している場合、ユーザＢの発言は、ユーザＡにとって重要である。したがって、ユーザＢの発言を登録した数は、ユーザＡにとってユーザＢの発言がどの程度重要であるかを示す指標になる。

なお、本願における「発言」は、ブログやツイッタ等において、ユーザが自ら作成した意見やコメントに加えて、他ユーザの発言を引用した発言（リツィートによる発言）や、特定の相手に返信することによる発言（リプライによる発言）を含む。

遷移確率行列決定部15は、後述の方法により、ユーザのステータス情報（フォロー関係、リツィート関係、リプライ関係及びお気に入り保存状態）に基づいて遷移確率行列を決定する。

遷移確率・固有ベクトル算出部16は、遷移確率行列と、何らかの初期ベクトルとを用いて固有ベクトルを算出する。ユーザ数がＮの場合、遷移確率行列はＮ行Ｎ列の行列として表現される。変換前のＮ次元初期ベクトルを遷移確率行列にしたがって変換し、変換後のＮ次元ベクトルを次の変換前のＮ次元ベクトルとする手順を反復することで、固有ベクトルが求められる。Ｎ次元の固有ベクトルの各成分は、Ｎユーザ各々の遷移確率である。相対的に大きな遷移確率を有するユーザが、ネットワークにおけるインフルエンサとして決定される。

＜２．インフルエンサを決定する方法＞
図２は、インフルエンサを決定する方法のフローチャートを示す。この方法は、図１の装置において使用される。

ステップ21において、後述の方法により、Ｎユーザのステータス情報（フォロー関係、リツィート関係、リプライ関係及びお気に入り保存状態）に基づいて遷移確率行列が決定される。Ｎは２以上の整数である。遷移確率行列の具体的な決定法については後述する。

ステップ22において、変換前のベクトルが決定される。ユーザ数がＮの場合、ベクトルはＮ次元のベクトルである。フローがステップ22に始めて至った場合、所定の初期ベクトルが変換前のベクトルに決定される。

ステップ23において、遷移確率行列と、何らかの初期ベクトルとを用いて固有ベクトルが算出される。ユーザ数がＮの場合、遷移確率行列はＮ行Ｎ列の行列として表現される。変換前のＮ次元初期ベクトルは遷移確率行列にしたがって変換される。

ステップ24において、変換後のベクトルは収束しているか否かが判定される。収束していなかった場合、フローはステップ22に戻り、変換後のＮ次元ベクトルが、次の変換前のＮ次元ベクトルとして決定され、再びステップ23及びステップ24における処理が行われる。ステップ24において、変換後のベクトルが収束していると判定された場合、フローはステップ25に進む。収束したベクトルは、固有ベクトルである。Ｎ次元の固有ベクトルの各成分は、Ｎユーザ各々の遷移確率である。

ステップ25において、相対的に大きな遷移確率を有するユーザを特定することで、ネットワークにおけるインフルエンサが決定される。

ステップ24における収束の判定は、前回のベクトルと今回のベクトルとの差分が所定値より小さいか否かにより判定されてもよい。あるいは、収束の判定を行わずに、ステップ22−24の処理が所定回数だけ反復された場合に、フローはステップ25に進んでもよい。

＜３．フォロー関係による遷移確率行列＞
次に、遷移確率行列、固有ベクトル及び遷移確率を求める具体的な方法を説明する。説明の便宜上、先ず、フォロー関係による遷移確率行列を用いた方法を説明し、その後に「４．ウェイトを考慮した遷移確率行列」において、より適切な遷移確率行列を説明する。

図３に示されるように、３人のユーザＡ、Ｂ、Ｃが、フォロー関係で結ばれている。ユーザＡはユーザＢ及びユーザＣをフォローしている。したがって、ユーザＢの発言はユーザＡの端末に自動的に表示され、ユーザＣの発言もユーザＡの端末に自動的に表示される。ユーザＢはユーザＣをフォローしている。したがって、ユーザＣの発言はユーザＢの端末に自動的に表示される。ユーザＣはユーザＡをフォローしている。したがって、ユーザＡの発言はユーザＣの端末に自動的に表示される。図中、「ステップ１」は、このようなフォロー関係の様子を行列形式で表現したものである。ｉ番目の行のユーザは、ｊ番目の列のユーザに影響を与えている。さらに、「ステップ２」に示されるように、各列の中で正規化を行うことで、遷移確率行列が求められる。

図４を参照しながら、この遷移確率行列を利用して、固有ベクトル及び遷移確率をべき乗法により算出する様子を説明する。この目的のため、先ず、初期値ベクトルが使用される。初期値ベクトルは、任意のベクトルでよいが、説明の便宜上、（１００）^Ｔとする。ただし、「Ｔ」は転置を表す。ベクトルの第１成分はユーザＡに対応し、ベクトルの第２成分はユーザＢに対応し、ベクトルの第３成分はユーザＣに対応する。べき乗法における反復回数をｋ＝０，１，...とする。

ｋ＝０（初期値）において、初期値ベクトルは（1 0 0）^Ｔであり、ユーザＡにのみ値「１」がある。この値を遷移確率行列により分配する際、Ａ→Ａの遷移確率（１行１列における行列要素）は０なので、ｋ＝１におけるユーザＡの値は０になる。Ａ→Ｂ及びＡ→Ｃの遷移確率はそれぞれ0．5なので、Ａの値である「１」の半分「0．5」をＢとＣに分配する。ＢおよびＣは分配すべき値を持たないので、ｋ＝０における計算は終了である。このように、ｋ＝０からｋ＝１への計算により、ベクトル（1 0 0）^Ｔは、（0 0．5 0．5）^Ｔに変換される。

ｋ＝１において、変換前のベクトルＡは（0 0．5 0．5）^Ｔなので、Ａは分配すべき値をもたない。Ｂは0．5を有するので、分配を行う。遷移確率行列により、Ｂ→Ｃの遷移確率は１なので（３行２列における行列要素）、Ｂが有する全ての値をＣに移す。同様にＣも0．5の値を有し、Ｃ→Ａの遷移確率も１なので（１行３列における行列要素）、Ｃが有する全ての値をＡに移す。このように、ｋ＝１からｋ＝２への計算により、ベクトル（0 0．5 0．5）^Ｔは、（0．5 0 0．5）^Ｔに変換される。

以下、同様に反復回数ｋを増やすことで、ベクトルが次々に変換される。反復回数が十分に大きかった場合、ベクトルは固有ベクトルに収束する。上記の例の場合、図５に示すように、ｋ＝４７以降において、ベクトルは固有ベクトルに収束している。固有ベクトルの各成分は、ユーザＡ、Ｂ、Ｃの遷移確率に対応する。図示の例の場合、ユーザＡに対する遷移確率は、0．4であり、ユーザＢに対する遷移確率は、0．2であり、ユーザＣに対する遷移確率は、0．4である。したがって、遷移確率が相対的に大きいユーザＡ、Ｃをインフルエンサと判断することができる。

上記の例では、３ユーザしか登場していなかったが、上記の方法をＮユーザの場合に同様に拡張できることは、当業者にとって自明である。

＜４．実施例で使用される遷移確率行列＞
図３−５の計算例に登場した遷移確率行列は、ユーザ間のフォロー関係を考慮しているが、これだけではユーザ同士の相互関係を適切に表現しているとは言えない。例えば、ユーザＡは、ユーザＢ及びユーザＣに対してフォロー関係がある（Ａ→Ｂ、Ａ→Ｃ）。ユーザＢの発言はユーザＡの端末に自動的に表示され、ユーザＣの発言もユーザＡの端末に自動的に表示される。ユーザＢの発言が100回あるのに対して、ユーザＣの発言が3回しかなかったとする。この場合、ユーザＡは、ユーザＢの発言を目にする機会が圧倒的に多く、ユーザＡがユーザＣの発言を参考にする機会は非常に少ない。しかしながら図３−５に示す遷移確率行列は、このような事情を考慮しておらず、必ずしも実情を反映していない。

本実施例では、遷移確率行列の行列要素を、さらに適切な値に設定することができる。具体的には、Ｎユーザに対するＮ行Ｎ列の遷移確率行列の行列要素P_ijは、次式により算出される。

P_ij＝α×R（Ui→Uj）＋β×C（Ui→Uj）・・・（１）
ここで、Ｎは２以上の整数であり、ｉ及びｊは１以上Ｎ以下の整数であり、ｉ≠ｊである。α、βは所定の定数である。

R（Ui→Uj）は、ｉ番目のユーザUiがｊ番目のユーザUjから影響を受ける際の量的な指標、言い換えれば、ユーザUiがユーザUjの発言を目にする量的な指標である。具体的には、R（Ui→Uj）は、ユーザUjの発言回数に応じて変動する量であり、より具体的には、ユーザUiが、ユーザUjの発言を参照する確率を表す。

R（Ui→Uj）＝（Ujの発言回数）／（Uiがフォローしている全ユーザの発言回数）・・・（２）
Uiがフォローしている全ユーザの発言回数は、言い換えれば、ｉ番目のユーザの端末に提示される他のユーザの総発言回数である。（２）式を参照するに、分子のUjの発言回数が多いほど、R（Ui→Uj）は大きくなる。これは、Ujの発言回数が多いほど、ユーザUiはユーザUjの発言を目にする機会が多くなり、ユーザUjの影響を受けやすいことを反映している。Ujの発言回数を分母の全ユーザの発言回数で除算したものは、ユーザUiが目にする他ユーザの発言の内、ユーザUjの発言が占める割合を示す。したがって、ユーザUjの発言回数が例えば50回あったとしても、ユーザUjが他の発言を1000回見ていた場合、ユーザUjの発言は、ユーザUiにそれほど大きな影響を及ぼさない。ユーザUiが目にする他ユーザの発言の内、ユーザUjの発言が占める割合が大きい場合こそ、ユーザUjの発言は、ユーザUiに大きな影響を及ぼす。

図６は、R（Ui→Uj）の計算例を示す。ユーザＡは、ユーザＢ及びユーザＣに対してフォロー関係があり、ユーザＢは１日に５回発言し、ユーザＣは１日に２回発言している。この場合、
R（A→B）＝（Bの発言回数）／（B及びCの全発言回数）＝5／7
R（A→C）＝（Cの発言回数）／（B及びCの全発言回数）＝2／7
となる。このように、ユーザＡはユーザＢ及びユーザＣをフォローしているが、ユーザＢ及びユーザＣの発言回数に応じて、R（Ui→Uj）の値は異なる。この点、図３−５における遷移確率行列の行列要素と大きく異なる。

C（Ui→Uj）は、ｉ番目のユーザUiにとってｊ番目のユーザUjの発言がどの程度重要であるかを示す指標であり、発言内容に関わる質的な指標である。この点、量的な指標であるR（Ui→Uj）と性質が異なる。具体的には、C（Ui→Uj）は、ユーザUiがユーザUjの発言を引用して発言した引用回数に応じて変化する量であり、及び／又はユーザUiがユーザUjに個人的に返信した返信回数に応じて変化する量である。さらに具体的には、C（Ui→Uj）は、ユーザUiがユーザUjの発言を引用して発言した引用回数、及びユーザUiがユーザUjに個人的に返信した返信回数の和と、ユーザUiによる総発言回数との比率により表現される。

C（Ui→Uj）＝（（ユーザUiがユーザUjの発言を引用して発言した引用回数）＋（ユーザUiがユーザUjに個人的に返信した返信回数））／（ユーザUiによる総発言回数）・・・（３）
上述したように、引用回数及び返信回数は、Ujの発言が重要であることの指標であり、この数が多い場合、ユーザUjの発言は、ユーザUiにとって重要であることになる。一方、上述したように、発言は、自らの発言だけでなく、リツィートによる発言（引用による発言）と、リプライによる発言（返信による発言）とがあり、分母の「ユーザUiによる総発言回数」は、これらすべての数を含む。したがって、引用回数や返信回数がある程度なされていたとしても（例えば、50回）、自らの発言が非常に多かった場合（例えば、1000回）、引用や返信による発言の回数は、総発言回数に比較して相対的に小さく、ユーザUiにとってユーザUjは相対的に重要ではないことになる。逆に、自らの発言全体の内、引用や返信による発言の回数が占める割合が比較的多かった場合、ユーザUiにとってユーザUjは相対的に重要であることになる。このように、自らの発言全体に対する引用発言や返信発言の割合を考慮する観点から、（３）式は好ましい。

図７は、（３）式に基づくC（Ui→Uj）の計算例を示す。ユーザＡは、全部で100回発言している。ユーザＡは、ユーザＢに対して２回リツィートし（引用回数＝２）、１回リプライしている（返信回数＝１）。ユーザＡは、ユーザＣに対して１回リツィート（引用回数＝１）している。この場合、
C（A→B）＝（Bの発言の引用回数＋Bへの返信回数）／（Aの発言回数）＝3／100
C（A→C）＝（Cの発言の引用回数＋Cへの返信回数）／（Aの発言回数）＝1／100
となる。

ところで、C（Ui→Uj）は、次式のように算出してもよい。

C（Ui→Uj）＝（（ユーザUiがユーザUjの発言を引用して発言した引用回数）＋（ユーザUiがユーザUjに個人的に返信した返信回数））／（（ユーザUiによる総引用回数）＋（ユーザUiによる総返信回数））・・・（４）
（４）式を参照するに、分子は（３）式と共通しているが、分母が異なる。（４）式の場合、分母は、（ユーザUiによる総引用回数）と、（ユーザUiによる総返信回数）との和である。したがって、ユーザUiの発言の内、引用と返信による総発言回数が分母の値になっている。（４）式は、引用や返信に特化して他ユーザの発言の重要度を計る観点から好ましい。

図８は、（４）式に基づくC（Ui→Uj）の計算例を示す。上記と同様に、ユーザＡは、全部で100回発言している。ユーザＡは、ユーザＢに対して２回リツィートし（引用回数＝２）、１回リプライしている（返信回数＝１）。ユーザＡは、ユーザＣに対して１回リツィート（引用回数＝１）している。この場合、
C（A→B）＝（Bの発言の引用回数＋Bへの返信回数）／（Aによる総引用回数＋Aによる総返信回数）＝（2＋1）／（3＋1）＝3／4
C（A→C）＝（Cの発言の引用回数＋Cへの返信回数）／（Aによる総引用回数＋Aによる総返信回数）＝（1＋0）／（3＋1）＝1／4
となる。このように、（３）式による場合も、（４）式による場合も、ユーザＢはユーザＣよりも、ユーザＡに影響を及ぼしている。しかしながら、（３）式による場合、C（A→B）＝3／100＝0．03であるのに対して、（４）式の場合、C（A→B）＝3／4＝0．75であり、ユーザＢの発言の重要度C（A→B）が大きく異なる。また、（３）式による場合、C（A→C）＝1／100＝0．01であるのに対して、（４）式の場合、C（A→C）＝1／4＝0．25であり、ユーザＣの発言の重要度C（A→C）も大きく異なる。ユーザＡによる発言回数全体に対する重要度を算出する観点からは、（３）式によりC（Ui→Uj）を算出することが好ましい。これに対して、引用や返信に特化して重要度を算出する観点からは、（４）式によりC（Ui→Uj）を算出することが好ましい。

このように本実施例による遷移確率行列の行列要素P_ijは、
P_ij＝α×R（Ui→Uj）＋β×C（Ui→Uj）・・・（１）
として算出される。Ｎは２以上の整数であり、ｉ及びｊは１以上Ｎ以下の整数であり、ｉ≠ｊである。α、βは所定の定数である。

図９は、（１）式により算出される行列要素により規定される遷移確率行列を示す。行列要素が、S_A、S_B、S_Cにより除算されているのは、行列要素の値を列ごとに正規化するためである。本実施例の場合、図３−５に示される遷移確率行列の代わりに、図９に示される遷移確率行列を使用して、固有ベクトル及び遷移確率がべき乗法により算出される。固有ベクトル及び遷移確率の求め方自体は、図３−５を参照しながら説明したのと同様な方法である。各行列要素の値は、ユーザ同士の相互関係により、量的観点及び質的観点から重み付けされている。この点、行列要素が単なる１又は０である図３−５に示す遷移確率行列と大きく異なる。本実施例によれば、ユーザの相互関係を遷移確率行列に適切に反映させることができるので、商品毎ではなく、ユーザ同士の相互関係に基づいて、従来よりも適切な固有ベクトル及び遷移確率を求めることができ、ひいてはインフルエンサを効率的かつ的確に特定することができる。

＜５．変形例＞
上述したように、ユーザUiにとってユーザUjの発言がどの程度重要であるかを示す指標として、リツィート回数及びリプライ回数に加えて、お気に入りに保存した回数もある。したがって、ユーザUiにとってユーザUjの発言がどの程度重要であるかを示す指標であるC（Ui→Uj）は、お気に入り登録数を考慮して算出されてもよい。

C（Ui→Uj）＝（（ユーザUiがユーザUjの発言を引用して発言した引用回数）＋（ユーザUiがユーザUjに個人的に返信した返信回数）＋（ユーザUiがユーザUjの発言を登録した登録数））／（（ユーザUiによる総発言回数）＋（ユーザUiによるお気に入り登録数））・・・（５）
分子に（ユーザUiがユーザUjの発言を登録した登録数）が加わっている点、及び分母に（ユーザUiによるお気に入り登録数）が加わっている点が（３）式と異なる。さらに、C（Ui→Uj）は、次式のように算出されてもよい。

C（Ui→Uj）＝（（ユーザUiがユーザUjの発言を引用して発言した引用回数）＋（ユーザUiがユーザUjに個人的に返信した返信回数）＋（ユーザUiがユーザUjの発言を登録した登録数））／（（ユーザUiによる総引用回数）＋（ユーザUiによる総返信回数）＋（ユーザUiによるお気に入り登録数））・・・（６）
分母に（ユーザUiによるお気に入り登録数）が加わっている点が（４）式と異なる。

上記の説明（図２）では、何らかの初期ベクトルを使用して、反復的な計算を行うことで、遷移確率行列の固有ベクトルが導出されたが、反復計算を行うことは本発明に必須ではなく、反復計算法以外の方法で固有ベクトルを算出することもできる。例えば、Ｎ行Ｎ列の遷移確率行列Ｐ、Ｐの固有値λ及びＰの固有ベクトルｘに対してＰｘ＝λｘが成立するので、この方程式を解くことで、固有ベクトルを求めることができる。

以上本発明は特定の実施例を参照しながら説明されてきたが、それらは単なる例示に過ぎず、当業者は様々な変形例、修正例、代替例、置換例等を理解するであろう。例えば、本発明は、ブログ、ツイッタ、ソーシャルネットワーキングサービス（SNS）その他のコミュニティサイト等のようなユーザが情報を発信するメディア（CGM）が利用される適切な如何なる通信システムに適用されてもよい。より正確に言えば、ブログやＳＮＳにおけるコメントや引用、トラックバック等のユーザ間の興味を観察できるアクションの回数を用いることで、本願発明を実施することができる。発明の理解を促すため具体的な数値例を用いて説明がなされたが、特に断りのない限り、それらの数値は単なる一例に過ぎず適切な如何なる値が使用されてもよい。発明の理解を促すため具体的な数式を用いて説明がなされたが、特に断りのない限り、それらの数式は単なる一例に過ぎず適切な如何なる数式が使用されてもよい。実施例又は項目の区分けは本発明に本質的ではなく、２以上の項目に記載された事項が必要に応じて組み合わせて使用されてよいし、ある項目に記載された事項が、別の項目に記載された事項に（矛盾しない限り）適用されてよい。説明の便宜上、本発明の実施例に係る装置は機能的なブロック図を用いて説明されたが、そのような装置はハードウェアで、ソフトウェアで又はそれらの組み合わせで実現されてもよい。ソフトウェアは、ランダムアクセスメモリ（RAM）、フラッシュメモリ、読み取り専用メモリ（ROM）、EPROM、EEPROM、レジスタ、ハードディスク（HDD）、リムーバブルディスク、CD−ROM、データベース、サーバその他の適切な如何なる記憶媒体に用意されてもよい。本発明は上記実施例に限定されず、本発明の精神から逸脱することなく、様々な変形例、修正例、代替例、置換例等が本発明に包含される。

10 ユーザ情報データベース
11 フォロー管理部
12 リツィート管理部
13 リプライ管理部
14 お気に入り管理部
15 遷移確率行列決定部
16 遷移確率・固有ベクトル算出部

Claims

Ｎユーザの中からネットワークにおけるインフルエンサを発見する装置であって、
ｉ番目のユーザにとってｊ番目のユーザがどのように影響するかを示す行列要素を算出することで（１≦ｉ，ｊ≦Ｎ）、遷移確率行列を決定する決定部と、
前記遷移確率行列の固有ベクトルを求める固有ベクトル算出部と
を有し、前記固有ベクトルの成分はＮユーザ各々の遷移確率を表し、相対的に大きな遷移確率を有するユーザが、前記ネットワークにおけるインフルエンサとして決定され、
前記行列要素は、ｊ番目のユーザの発言回数に応じて変化する第１の値と、ｊ番目のユーザの発言の重要性を示す第２の値との線形結合により表現される、装置。
前記第１の値は、ｊ番目のユーザの発言回数と、ｉ番目のユーザに提示される他のユーザの総発言回数との比率により表現される、請求項１記載の装置。
前記第２の値は、ｉ番目のユーザがｊ番目のユーザの発言を引用して発言した引用回数に応じて変化する、請求項１又は２に記載の装置。
前記第２の値は、ｉ番目のユーザがｊ番目のユーザに個人的に返信した返信回数に応じて変化する、請求項１ないし３の何れか１項に記載の装置。
前記第２の値は、ｉ番目のユーザがｊ番目のユーザの発言を引用して発言した引用回数、及びｉ番目のユーザがｊ番目のユーザに個人的に返信した返信回数の和と、ｉ番目のユーザによる総発言回数との比率により表現される、請求項１ないし４の何れか１項に記載の装置。
前記第２の値は、ｉ番目のユーザがｊ番目のユーザの発言を引用して発言した引用回数、及びｉ番目のユーザがｊ番目のユーザに個人的に返信した返信回数の和と、ｉ番目のユーザによる総引用回数及び総返信回数の和との比率により表現される、請求項１ないし４の何れか１項に記載の装置。
Ｎユーザの中からネットワークにおけるインフルエンサを発見する方法であって、
ｉ番目のユーザにとってｊ番目のユーザがどのように影響するかを示す行列要素を算出することで（１≦ｉ，ｊ≦Ｎ）、遷移確率行列を決定し、
前記遷移確率行列の固有ベクトルを求めるステップ
を有し、前記固有ベクトルの成分はＮユーザ各々の遷移確率を表し、相対的に大きな遷移確率を有するユーザが、前記ネットワークにおけるインフルエンサとして決定され、
前記行列要素は、ｊ番目のユーザの発言回数に応じて変化する第１の値と、ｊ番目のユーザの発言の重要性を示す第２の値との線形結合により表現される、方法。
前記第１の値は、ｊ番目のユーザの発言回数と、ｉ番目のユーザに提示される他のユーザの総発言回数との比率により表現される、請求項７記載の方法。
前記第２の値は、ｉ番目のユーザがｊ番目のユーザの発言を引用して発言した引用回数に応じて変化する、請求項７又は８に記載の方法。
前記第２の値は、ｉ番目のユーザがｊ番目のユーザに個人的に返信した返信回数に応じて変化する、請求項７ないし９の何れか１項に記載の方法。
前記第２の値は、ｉ番目のユーザがｊ番目のユーザの発言を引用して発言した引用回数、及びｉ番目のユーザがｊ番目のユーザに個人的に返信した返信回数の和と、ｉ番目のユーザによる総発言回数との比率により表現される、請求項７ないし１０の何れか１項に記載の方法。
前記第２の値は、ｉ番目のユーザがｊ番目のユーザの発言を引用して発言した引用回数、及びｉ番目のユーザがｊ番目のユーザに個人的に返信した返信回数の和と、ｉ番目のユーザによる総引用回数及び総返信回数の和との比率により表現される、請求項７ないし１０の何れか１項に記載の方法。