JP2012048683A - インフルエンサを発見する装置及び方法 - Google Patents

インフルエンサを発見する装置及び方法 Download PDF

Info

Publication number
JP2012048683A
JP2012048683A JP2010192925A JP2010192925A JP2012048683A JP 2012048683 A JP2012048683 A JP 2012048683A JP 2010192925 A JP2010192925 A JP 2010192925A JP 2010192925 A JP2010192925 A JP 2010192925A JP 2012048683 A JP2012048683 A JP 2012048683A
Authority
JP
Japan
Prior art keywords
user
transition probability
users
replies
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010192925A
Other languages
English (en)
Other versions
JP5489924B2 (ja
Inventor
Yusuke Fukazawa
佑介 深澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2010192925A priority Critical patent/JP5489924B2/ja
Publication of JP2012048683A publication Critical patent/JP2012048683A/ja
Application granted granted Critical
Publication of JP5489924B2 publication Critical patent/JP5489924B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ネットワークにおけるインフルエンサを効率的に発見すること。
【解決手段】Nユーザの中からネットワークにおけるインフルエンサを発見する装置は、i番目のユーザにとってj番目のユーザがどのように影響するかを示す行列要素を算出することで(1≦i,j≦N)、遷移確率行列を決定する決定部と、前記遷移確率行列の固有ベクトルを求める固有ベクトル算出部とを有し、前記固有ベクトルの成分はNユーザ各々の遷移確率を表し、相対的に大きな遷移確率を有するユーザが、ネットワークにおけるインフルエンサとして決定され、行列要素は、j番目のユーザの発言回数に応じて変化する第1の値と、j番目のユーザの発言の重要性を示す第2の値との線形結合により表現される。
【選択図】図1

Description

本発明は、インフルエンサを発見する装置及び方法に関連する。
ネットワーク社会の中では、最新のニュースや新製品の情報は、ネットワークにおける「口コミ」により広がって行くことが多い。特に、ブログ、ツイッタ、ソーシャルネットワーキングサービス(SNS)その他のコミュニティサイト等のようなユーザが情報を発信するメディア(CGM)を通じて、そのような口コミの情報が広まってゆく。ブログやツイッタ等では、極めて様々な人々(ユーザ)が、各自の意見や情報を記録し、閲覧する。これらのユーザの内、「インフルエンサ」と呼ばれるユーザは、他のユーザの消費行動や考え方に大きな影響を及ぼす。例えば、特定の分野に非常に詳しい専門家や、インターネット上で強い影響力を有する個人、芸能人、有名人等が、インフルエンサになることが多い。したがって、ネットワークを利用してマーケティング活動を行う際、そのようなインフルエンサが新製品の良さを理解できるようにすれば、口コミによる極めて効果的な宣伝を行うことができる。したがって、インフルエンサを発見することは、ネットワーク社会において重要な課題である。インフルエンサを発見する従来方法については、特許文献1に記載されている。
特開2007−206876号公報
従来は、ユーザ間で発生するコミュニケーションの頻度に基づき、インフルエンサを算出する方法が提案されてきた。しかしながら、ユーザ間の間でコミュニケーション(個別のユーザを宛先とする通信信号の送受信)がない場合であっても、あるユーザが他のユーザの発言から影響を受ける場合もある。特に、発言の多いユーザほど他のユーザから閲覧される可能性が高くなり、結果として、他のユーザに影響を与える可能性が高くなる。従来は、インフルエンサを探す際に、あるユーザの発言が、他のユーザの目に触れる可能性については、考慮されていない。このため、あるユーザAが他ユーザBへ及ぼす影響度を計算する際、ユーザAが他のユーザBとコミュニケーションをとっていなかった場合、ユーザAの発言を他のユーザBが如何に頻繁に見ていたとしてもそれは考慮されず、ユーザAによる影響度は、かなり低く見積もられてしまっている。したがって、従来の方法の場合、インフルエンサを正確に判別することは困難であるという問題がある。
本発明の課題は、ネットワークにおけるインフルエンサを効率的に発見することである。
本発明の一形態による装置は、
Nユーザの中からネットワークにおけるインフルエンサを発見する装置であって、
i番目のユーザにとってj番目のユーザがどのように影響するかを示す行列要素を算出することで(1≦i,j≦N)、遷移確率行列を決定する決定部と、
前記遷移確率行列の固有ベクトルを求める固有ベクトル算出部と
を有し、前記固有ベクトルの成分はNユーザ各々の遷移確率を表し、相対的に大きな遷移確率を有するユーザが、前記ネットワークにおけるインフルエンサとして決定され、
前記行列要素は、j番目のユーザの発言回数に応じて変化する第1の値と、j番目のユーザの発言の重要性を示す第2の値との線形結合により表現される、装置である。
本発明の一形態によれば、ネットワークにおけるインフルエンサを効率的に発見することができる。
インフルエンサを決定する装置の機能ブロック図。 インフルエンサを決定する方法のフローチャート。 フォロー関係による遷移確率行列を決定する様子を示す図。 遷移確率行列を用いてベクトルを変換する様子を示す図。 べき乗法により固有ベクトル及び遷移確率を求める様子を示す図。 R(Ui→Uj)を説明するための図。 C(Ui→Uj)を説明するための図。 C(Ui→Uj)を説明するための図。 遷移確率行列を示す図。
以下の観点から実施例を説明する。
1.インフルエンサを決定する装置
2.インフルエンサを決定する方法
3.フォロー関係による遷移確率行列
4.実施例で使用される遷移確率行列
5.変形例
以下、ツイッタ(Twitter)における機能及び用語を用いて実施例を説明するが、このことは本発明に必須ではない。本発明は、ツイッタ以外の様々な用途(ブログ、ソーシャルネットワーキングサービス(SNS)その他のコミュニティサイト等)に適用可能である。
<1.インフルエンサを決定する装置>
図1は、インフルエンサを決定する装置の機能ブロック図を示す。この装置は、様々なユーザの端末とネットワークを介して通信することが可能なサーバに設けられる。図1には、本装置に備わる様々な機能要素の内、実施例の説明に特に関係のあるものが示されている。本装置は、ユーザ情報データベース10、フォロー管理部11、リツィート管理部12、リプライ管理部13、お気に入り管理部14、遷移確率行列決定部15、遷移確率・固有ベクトル算出部16を少なくとも有する。
ユーザ情報データベース10は、ネットワークを通じてツイッタ等により、やり取りを行うユーザの個人情報(識別番号、アカウント番号等)に加えて、ネットワークにおけるユーザのステータス情報を保存する。ステータス情報は、フォロー関係、リツィート関係、リプライ関係及びお気に入り保存状態により表現され、これらについては後述する。
フォロー管理部11は、ユーザ同士のフォロー(follow)関係を管理する。フォロー関係は、どのユーザがどのユーザの発言を自動的に表示するようにしているかを示す。例えば、ユーザAが、ユーザBに対してフォロー関係を設定していたとすると(A→B)、ユーザBによる発言は、ユーザAの端末に自動的に表示され、ユーザAは、ユーザBの発言を速やかに参考にすることができる。ユーザAの表示画面に登場するユーザBの発言回数が多いほど、ユーザAはユーザBから大きな影響を受けることになる。したがって、ユーザBの発言回数は、ユーザAがユーザBから影響を受ける際の量的な指標になる。
リツィート管理部12は、ユーザ同士のリツィート(re−tweet)関係を管理する。リツィート関係は、どのユーザが、どのユーザの発言を引用して発言したかを示す。例えば、ユーザAがユーザBに対してリツィート関係を設定していたとすると(A→B)、ユーザAは、ユーザBの発言を引用して発言を行っている。その結果、ユーザAに対してフォロー関係を設定しているユーザC(C→A)は、ユーザAの発言を参照する際、引用されているユーザBの発言も参照できる。リツィートは、発言に賛同する場合、特に興味を持った場合、あるいは逆に発言に反対する場合等のように、その発言から大きな影響を受けた場合に行われる。上記の例では、ユーザAはユーザBの発言から大きな影響を受けており、ユーザBの発言はユーザAにとって重要である。したがって、ユーザBの発言を引用するリツィート回数(引用回数)は、ユーザAにとってユーザBの発言がどの程度重要であるかを示す指標になる。
リプライ管理部13は、ユーザ同士のリプライ(reply)関係を管理する。リプライ関係は、どのユーザがどのユーザに個人的に返信を行ったかを示す。例えば、ユーザBの発言を見たユーザAが、ユーザB宛にメッセージを送ることでリプライ又は返信が行われる。リプライ関係は、通常、個人的な交流があるユーザ同士で行われるので、その個人にとって重要度は高い。ユーザBに対するリプライ回数(返信回数)が多いほど、ユーザBの発言はユーザAにとって重要である。したがって、ユーザBの発言に返信するリプライ回数は、ユーザAにとってユーザBの発言がどの程度重要であるかを示す指標になる。
お気に入り管理部14は、ユーザの「お気に入り(favorite)」保存状態を管理する。お気に入り保存状態は、どのユーザがどのユーザの発言を「お気に入り」として登録(又は保存)しているかを示す。ユーザAがユーザBの発言を登録している場合、ユーザBの発言は、ユーザAにとって重要である。したがって、ユーザBの発言を登録した数は、ユーザAにとってユーザBの発言がどの程度重要であるかを示す指標になる。
なお、本願における「発言」は、ブログやツイッタ等において、ユーザが自ら作成した意見やコメントに加えて、他ユーザの発言を引用した発言(リツィートによる発言)や、特定の相手に返信することによる発言(リプライによる発言)を含む。
遷移確率行列決定部15は、後述の方法により、ユーザのステータス情報(フォロー関係、リツィート関係、リプライ関係及びお気に入り保存状態)に基づいて遷移確率行列を決定する。
遷移確率・固有ベクトル算出部16は、遷移確率行列と、何らかの初期ベクトルとを用いて固有ベクトルを算出する。ユーザ数がNの場合、遷移確率行列はN行N列の行列として表現される。変換前のN次元初期ベクトルを遷移確率行列にしたがって変換し、変換後のN次元ベクトルを次の変換前のN次元ベクトルとする手順を反復することで、固有ベクトルが求められる。N次元の固有ベクトルの各成分は、Nユーザ各々の遷移確率である。相対的に大きな遷移確率を有するユーザが、ネットワークにおけるインフルエンサとして決定される。
<2.インフルエンサを決定する方法>
図2は、インフルエンサを決定する方法のフローチャートを示す。この方法は、図1の装置において使用される。
ステップ21において、後述の方法により、Nユーザのステータス情報(フォロー関係、リツィート関係、リプライ関係及びお気に入り保存状態)に基づいて遷移確率行列が決定される。Nは2以上の整数である。遷移確率行列の具体的な決定法については後述する。
ステップ22において、変換前のベクトルが決定される。ユーザ数がNの場合、ベクトルはN次元のベクトルである。フローがステップ22に始めて至った場合、所定の初期ベクトルが変換前のベクトルに決定される。
ステップ23において、遷移確率行列と、何らかの初期ベクトルとを用いて固有ベクトルが算出される。ユーザ数がNの場合、遷移確率行列はN行N列の行列として表現される。変換前のN次元初期ベクトルは遷移確率行列にしたがって変換される。
ステップ24において、変換後のベクトルは収束しているか否かが判定される。収束していなかった場合、フローはステップ22に戻り、変換後のN次元ベクトルが、次の変換前のN次元ベクトルとして決定され、再びステップ23及びステップ24における処理が行われる。ステップ24において、変換後のベクトルが収束していると判定された場合、フローはステップ25に進む。収束したベクトルは、固有ベクトルである。N次元の固有ベクトルの各成分は、Nユーザ各々の遷移確率である。
ステップ25において、相対的に大きな遷移確率を有するユーザを特定することで、ネットワークにおけるインフルエンサが決定される。
ステップ24における収束の判定は、前回のベクトルと今回のベクトルとの差分が所定値より小さいか否かにより判定されてもよい。あるいは、収束の判定を行わずに、ステップ22−24の処理が所定回数だけ反復された場合に、フローはステップ25に進んでもよい。
<3.フォロー関係による遷移確率行列>
次に、遷移確率行列、固有ベクトル及び遷移確率を求める具体的な方法を説明する。説明の便宜上、先ず、フォロー関係による遷移確率行列を用いた方法を説明し、その後に「4.ウェイトを考慮した遷移確率行列」において、より適切な遷移確率行列を説明する。
図3に示されるように、3人のユーザA、B、Cが、フォロー関係で結ばれている。ユーザAはユーザB及びユーザCをフォローしている。したがって、ユーザBの発言はユーザAの端末に自動的に表示され、ユーザCの発言もユーザAの端末に自動的に表示される。ユーザBはユーザCをフォローしている。したがって、ユーザCの発言はユーザBの端末に自動的に表示される。ユーザCはユーザAをフォローしている。したがって、ユーザAの発言はユーザCの端末に自動的に表示される。図中、「ステップ1」は、このようなフォロー関係の様子を行列形式で表現したものである。i番目の行のユーザは、j番目の列のユーザに影響を与えている。さらに、「ステップ2」に示されるように、各列の中で正規化を行うことで、遷移確率行列が求められる。
図4を参照しながら、この遷移確率行列を利用して、固有ベクトル及び遷移確率をべき乗法により算出する様子を説明する。この目的のため、先ず、初期値ベクトルが使用される。初期値ベクトルは、任意のベクトルでよいが、説明の便宜上、(1 0 0)とする。ただし、「T」は転置を表す。ベクトルの第1成分はユーザAに対応し、ベクトルの第2成分はユーザBに対応し、ベクトルの第3成分はユーザCに対応する。べき乗法における反復回数をk=0,1,...とする。
k=0(初期値)において、初期値ベクトルは(1 0 0)であり、ユーザAにのみ値「1」がある。この値を遷移確率行列により分配する際、A→Aの遷移確率(1行1列における行列要素)は0なので、k=1におけるユーザAの値は0になる。A→B及びA→Cの遷移確率はそれぞれ0.5なので、Aの値である「1」の半分「0.5」をBとCに分配する。BおよびCは分配すべき値を持たないので、k=0における計算は終了である。このように、k=0からk=1への計算により、ベクトル(1 0 0)は、(0 0.5 0.5)に変換される。
k=1において、変換前のベクトルAは(0 0.5 0.5)なので、Aは分配すべき値をもたない。Bは0.5を有するので、分配を行う。遷移確率行列により、B→Cの遷移確率は1なので(3行2列における行列要素)、Bが有する全ての値をCに移す。同様にCも0.5の値を有し、C→Aの遷移確率も1なので(1行3列における行列要素)、Cが有する全ての値をAに移す。このように、k=1からk=2への計算により、ベクトル(0 0.5 0.5)は、(0.5 0 0.5)に変換される。
以下、同様に反復回数kを増やすことで、ベクトルが次々に変換される。反復回数が十分に大きかった場合、ベクトルは固有ベクトルに収束する。上記の例の場合、図5に示すように、k=47以降において、ベクトルは固有ベクトルに収束している。固有ベクトルの各成分は、ユーザA、B、Cの遷移確率に対応する。図示の例の場合、ユーザAに対する遷移確率は、0.4であり、ユーザBに対する遷移確率は、0.2であり、ユーザCに対する遷移確率は、0.4である。したがって、遷移確率が相対的に大きいユーザA、Cをインフルエンサと判断することができる。
上記の例では、3ユーザしか登場していなかったが、上記の方法をNユーザの場合に同様に拡張できることは、当業者にとって自明である。
<4.実施例で使用される遷移確率行列>
図3−5の計算例に登場した遷移確率行列は、ユーザ間のフォロー関係を考慮しているが、これだけではユーザ同士の相互関係を適切に表現しているとは言えない。例えば、ユーザAは、ユーザB及びユーザCに対してフォロー関係がある(A→B、A→C)。ユーザBの発言はユーザAの端末に自動的に表示され、ユーザCの発言もユーザAの端末に自動的に表示される。ユーザBの発言が100回あるのに対して、ユーザCの発言が3回しかなかったとする。この場合、ユーザAは、ユーザBの発言を目にする機会が圧倒的に多く、ユーザAがユーザCの発言を参考にする機会は非常に少ない。しかしながら図3−5に示す遷移確率行列は、このような事情を考慮しておらず、必ずしも実情を反映していない。
本実施例では、遷移確率行列の行列要素を、さらに適切な値に設定することができる。具体的には、Nユーザに対するN行N列の遷移確率行列の行列要素Pijは、次式により算出される。
Pij=α×R(Ui→Uj)+β×C(Ui→Uj) ・・・(1)
ここで、Nは2以上の整数であり、i及びjは1以上N以下の整数であり、i≠jである。α、βは所定の定数である。
R(Ui→Uj)は、i番目のユーザUiがj番目のユーザUjから影響を受ける際の量的な指標、言い換えれば、ユーザUiがユーザUjの発言を目にする量的な指標である。具体的には、R(Ui→Uj)は、ユーザUjの発言回数に応じて変動する量であり、より具体的には、ユーザUiが、ユーザUjの発言を参照する確率を表す。
R(Ui→Uj)=(Ujの発言回数)/(Uiがフォローしている全ユーザの発言回数)・・・(2)
Uiがフォローしている全ユーザの発言回数は、言い換えれば、i番目のユーザの端末に提示される他のユーザの総発言回数である。(2)式を参照するに、分子のUjの発言回数が多いほど、R(Ui→Uj)は大きくなる。これは、Ujの発言回数が多いほど、ユーザUiはユーザUjの発言を目にする機会が多くなり、ユーザUjの影響を受けやすいことを反映している。Ujの発言回数を分母の全ユーザの発言回数で除算したものは、ユーザUiが目にする他ユーザの発言の内、ユーザUjの発言が占める割合を示す。したがって、ユーザUjの発言回数が例えば50回あったとしても、ユーザUjが他の発言を1000回見ていた場合、ユーザUjの発言は、ユーザUiにそれほど大きな影響を及ぼさない。ユーザUiが目にする他ユーザの発言の内、ユーザUjの発言が占める割合が大きい場合こそ、ユーザUjの発言は、ユーザUiに大きな影響を及ぼす。
図6は、R(Ui→Uj)の計算例を示す。ユーザAは、ユーザB及びユーザCに対してフォロー関係があり、ユーザBは1日に5回発言し、ユーザCは1日に2回発言している。この場合、
R(A→B)=(Bの発言回数)/(B及びCの全発言回数)=5/7
R(A→C)=(Cの発言回数)/(B及びCの全発言回数)=2/7
となる。このように、ユーザAはユーザB及びユーザCをフォローしているが、ユーザB及びユーザCの発言回数に応じて、R(Ui→Uj)の値は異なる。この点、図3−5における遷移確率行列の行列要素と大きく異なる。
C(Ui→Uj)は、i番目のユーザUiにとってj番目のユーザUjの発言がどの程度重要であるかを示す指標であり、発言内容に関わる質的な指標である。この点、量的な指標であるR(Ui→Uj)と性質が異なる。具体的には、C(Ui→Uj)は、ユーザUiがユーザUjの発言を引用して発言した引用回数に応じて変化する量であり、及び/又はユーザUiがユーザUjに個人的に返信した返信回数に応じて変化する量である。さらに具体的には、C(Ui→Uj)は、ユーザUiがユーザUjの発言を引用して発言した引用回数、及びユーザUiがユーザUjに個人的に返信した返信回数の和と、ユーザUiによる総発言回数との比率により表現される。
C(Ui→Uj)=((ユーザUiがユーザUjの発言を引用して発言した引用回数)+(ユーザUiがユーザUjに個人的に返信した返信回数))/(ユーザUiによる総発言回数)・・・(3)
上述したように、引用回数及び返信回数は、Ujの発言が重要であることの指標であり、この数が多い場合、ユーザUjの発言は、ユーザUiにとって重要であることになる。一方、上述したように、発言は、自らの発言だけでなく、リツィートによる発言(引用による発言)と、リプライによる発言(返信による発言)とがあり、分母の「ユーザUiによる総発言回数」は、これらすべての数を含む。したがって、引用回数や返信回数がある程度なされていたとしても(例えば、50回)、自らの発言が非常に多かった場合(例えば、1000回)、引用や返信による発言の回数は、総発言回数に比較して相対的に小さく、ユーザUiにとってユーザUjは相対的に重要ではないことになる。逆に、自らの発言全体の内、引用や返信による発言の回数が占める割合が比較的多かった場合、ユーザUiにとってユーザUjは相対的に重要であることになる。このように、自らの発言全体に対する引用発言や返信発言の割合を考慮する観点から、(3)式は好ましい。
図7は、(3)式に基づくC(Ui→Uj)の計算例を示す。ユーザAは、全部で100回発言している。ユーザAは、ユーザBに対して2回リツィートし(引用回数=2)、1回リプライしている(返信回数=1)。ユーザAは、ユーザCに対して1回リツィート(引用回数=1)している。この場合、
C(A→B)=(Bの発言の引用回数+Bへの返信回数)/(Aの発言回数)=3/100
C(A→C)=(Cの発言の引用回数+Cへの返信回数)/(Aの発言回数)=1/100
となる。
ところで、C(Ui→Uj)は、次式のように算出してもよい。
C(Ui→Uj)=((ユーザUiがユーザUjの発言を引用して発言した引用回数)+(ユーザUiがユーザUjに個人的に返信した返信回数))/((ユーザUiによる総引用回数)+(ユーザUiによる総返信回数))・・・(4)
(4)式を参照するに、分子は(3)式と共通しているが、分母が異なる。(4)式の場合、分母は、(ユーザUiによる総引用回数)と、(ユーザUiによる総返信回数)との和である。したがって、ユーザUiの発言の内、引用と返信による総発言回数が分母の値になっている。(4)式は、引用や返信に特化して他ユーザの発言の重要度を計る観点から好ましい。
図8は、(4)式に基づくC(Ui→Uj)の計算例を示す。上記と同様に、ユーザAは、全部で100回発言している。ユーザAは、ユーザBに対して2回リツィートし(引用回数=2)、1回リプライしている(返信回数=1)。ユーザAは、ユーザCに対して1回リツィート(引用回数=1)している。この場合、
C(A→B)=(Bの発言の引用回数+Bへの返信回数)/(Aによる総引用回数+Aによる総返信回数)=(2+1)/(3+1)=3/4
C(A→C)=(Cの発言の引用回数+Cへの返信回数)/(Aによる総引用回数+Aによる総返信回数)=(1+0)/(3+1)=1/4
となる。このように、(3)式による場合も、(4)式による場合も、ユーザBはユーザCよりも、ユーザAに影響を及ぼしている。しかしながら、(3)式による場合、C(A→B)=3/100=0.03であるのに対して、(4)式の場合、C(A→B)=3/4=0.75であり、ユーザBの発言の重要度C(A→B)が大きく異なる。また、(3)式による場合、C(A→C)=1/100=0.01であるのに対して、(4)式の場合、C(A→C)=1/4=0.25であり、ユーザCの発言の重要度C(A→C)も大きく異なる。ユーザAによる発言回数全体に対する重要度を算出する観点からは、(3)式によりC(Ui→Uj)を算出することが好ましい。これに対して、引用や返信に特化して重要度を算出する観点からは、(4)式によりC(Ui→Uj)を算出することが好ましい。
このように本実施例による遷移確率行列の行列要素Pijは、
Pij=α×R(Ui→Uj)+β×C(Ui→Uj)・・・(1)
として算出される。Nは2以上の整数であり、i及びjは1以上N以下の整数であり、i≠jである。α、βは所定の定数である。
図9は、(1)式により算出される行列要素により規定される遷移確率行列を示す。行列要素が、SA、SB、SCにより除算されているのは、行列要素の値を列ごとに正規化するためである。本実施例の場合、図3−5に示される遷移確率行列の代わりに、図9に示される遷移確率行列を使用して、固有ベクトル及び遷移確率がべき乗法により算出される。固有ベクトル及び遷移確率の求め方自体は、図3−5を参照しながら説明したのと同様な方法である。各行列要素の値は、ユーザ同士の相互関係により、量的観点及び質的観点から重み付けされている。この点、行列要素が単なる1又は0である図3−5に示す遷移確率行列と大きく異なる。本実施例によれば、ユーザの相互関係を遷移確率行列に適切に反映させることができるので、商品毎ではなく、ユーザ同士の相互関係に基づいて、従来よりも適切な固有ベクトル及び遷移確率を求めることができ、ひいてはインフルエンサを効率的かつ的確に特定することができる。
<5.変形例>
上述したように、ユーザUiにとってユーザUjの発言がどの程度重要であるかを示す指標として、リツィート回数及びリプライ回数に加えて、お気に入りに保存した回数もある。したがって、ユーザUiにとってユーザUjの発言がどの程度重要であるかを示す指標であるC(Ui→Uj)は、お気に入り登録数を考慮して算出されてもよい。
C(Ui→Uj)=((ユーザUiがユーザUjの発言を引用して発言した引用回数)+(ユーザUiがユーザUjに個人的に返信した返信回数)+(ユーザUiがユーザUjの発言を登録した登録数))/((ユーザUiによる総発言回数)+(ユーザUiによるお気に入り登録数))・・・(5)
分子に(ユーザUiがユーザUjの発言を登録した登録数)が加わっている点、及び分母に(ユーザUiによるお気に入り登録数)が加わっている点が(3)式と異なる。さらに、C(Ui→Uj)は、次式のように算出されてもよい。
C(Ui→Uj)=((ユーザUiがユーザUjの発言を引用して発言した引用回数)+(ユーザUiがユーザUjに個人的に返信した返信回数)+(ユーザUiがユーザUjの発言を登録した登録数))/((ユーザUiによる総引用回数)+(ユーザUiによる総返信回数)+(ユーザUiによるお気に入り登録数))・・・(6)
分母に(ユーザUiによるお気に入り登録数)が加わっている点が(4)式と異なる。
上記の説明(図2)では、何らかの初期ベクトルを使用して、反復的な計算を行うことで、遷移確率行列の固有ベクトルが導出されたが、反復計算を行うことは本発明に必須ではなく、反復計算法以外の方法で固有ベクトルを算出することもできる。例えば、N行N列の遷移確率行列P、Pの固有値λ及びPの固有ベクトルxに対して Px=λx が成立するので、この方程式を解くことで、固有ベクトルを求めることができる。
以上本発明は特定の実施例を参照しながら説明されてきたが、それらは単なる例示に過ぎず、当業者は様々な変形例、修正例、代替例、置換例等を理解するであろう。例えば、本発明は、ブログ、ツイッタ、ソーシャルネットワーキングサービス(SNS)その他のコミュニティサイト等のようなユーザが情報を発信するメディア(CGM)が利用される適切な如何なる通信システムに適用されてもよい。より正確に言えば、ブログやSNSにおけるコメントや引用、トラックバック等のユーザ間の興味を観察できるアクションの回数を用いることで、本願発明を実施することができる。発明の理解を促すため具体的な数値例を用いて説明がなされたが、特に断りのない限り、それらの数値は単なる一例に過ぎず適切な如何なる値が使用されてもよい。発明の理解を促すため具体的な数式を用いて説明がなされたが、特に断りのない限り、それらの数式は単なる一例に過ぎず適切な如何なる数式が使用されてもよい。実施例又は項目の区分けは本発明に本質的ではなく、2以上の項目に記載された事項が必要に応じて組み合わせて使用されてよいし、ある項目に記載された事項が、別の項目に記載された事項に(矛盾しない限り)適用されてよい。説明の便宜上、本発明の実施例に係る装置は機能的なブロック図を用いて説明されたが、そのような装置はハードウェアで、ソフトウェアで又はそれらの組み合わせで実現されてもよい。ソフトウェアは、ランダムアクセスメモリ(RAM)、フラッシュメモリ、読み取り専用メモリ(ROM)、EPROM、EEPROM、レジスタ、ハードディスク(HDD)、リムーバブルディスク、CD−ROM、データベース、サーバその他の適切な如何なる記憶媒体に用意されてもよい。本発明は上記実施例に限定されず、本発明の精神から逸脱することなく、様々な変形例、修正例、代替例、置換例等が本発明に包含される。
10 ユーザ情報データベース
11 フォロー管理部
12 リツィート管理部
13 リプライ管理部
14 お気に入り管理部
15 遷移確率行列決定部
16 遷移確率・固有ベクトル算出部

Claims (12)

  1. Nユーザの中からネットワークにおけるインフルエンサを発見する装置であって、
    i番目のユーザにとってj番目のユーザがどのように影響するかを示す行列要素を算出することで(1≦i,j≦N)、遷移確率行列を決定する決定部と、
    前記遷移確率行列の固有ベクトルを求める固有ベクトル算出部と
    を有し、前記固有ベクトルの成分はNユーザ各々の遷移確率を表し、相対的に大きな遷移確率を有するユーザが、前記ネットワークにおけるインフルエンサとして決定され、
    前記行列要素は、j番目のユーザの発言回数に応じて変化する第1の値と、j番目のユーザの発言の重要性を示す第2の値との線形結合により表現される、装置。
  2. 前記第1の値は、j番目のユーザの発言回数と、i番目のユーザに提示される他のユーザの総発言回数との比率により表現される、請求項1記載の装置。
  3. 前記第2の値は、i番目のユーザがj番目のユーザの発言を引用して発言した引用回数に応じて変化する、請求項1又は2に記載の装置。
  4. 前記第2の値は、i番目のユーザがj番目のユーザに個人的に返信した返信回数に応じて変化する、請求項1ないし3の何れか1項に記載の装置。
  5. 前記第2の値は、i番目のユーザがj番目のユーザの発言を引用して発言した引用回数、及びi番目のユーザがj番目のユーザに個人的に返信した返信回数の和と、i番目のユーザによる総発言回数との比率により表現される、請求項1ないし4の何れか1項に記載の装置。
  6. 前記第2の値は、i番目のユーザがj番目のユーザの発言を引用して発言した引用回数、及びi番目のユーザがj番目のユーザに個人的に返信した返信回数の和と、i番目のユーザによる総引用回数及び総返信回数の和との比率により表現される、請求項1ないし4の何れか1項に記載の装置。
  7. Nユーザの中からネットワークにおけるインフルエンサを発見する方法であって、
    i番目のユーザにとってj番目のユーザがどのように影響するかを示す行列要素を算出することで(1≦i,j≦N)、遷移確率行列を決定し、
    前記遷移確率行列の固有ベクトルを求めるステップ
    を有し、前記固有ベクトルの成分はNユーザ各々の遷移確率を表し、相対的に大きな遷移確率を有するユーザが、前記ネットワークにおけるインフルエンサとして決定され、
    前記行列要素は、j番目のユーザの発言回数に応じて変化する第1の値と、j番目のユーザの発言の重要性を示す第2の値との線形結合により表現される、方法。
  8. 前記第1の値は、j番目のユーザの発言回数と、i番目のユーザに提示される他のユーザの総発言回数との比率により表現される、請求項7記載の方法。
  9. 前記第2の値は、i番目のユーザがj番目のユーザの発言を引用して発言した引用回数に応じて変化する、請求項7又は8に記載の方法。
  10. 前記第2の値は、i番目のユーザがj番目のユーザに個人的に返信した返信回数に応じて変化する、請求項7ないし9の何れか1項に記載の方法。
  11. 前記第2の値は、i番目のユーザがj番目のユーザの発言を引用して発言した引用回数、及びi番目のユーザがj番目のユーザに個人的に返信した返信回数の和と、i番目のユーザによる総発言回数との比率により表現される、請求項7ないし10の何れか1項に記載の方法。
  12. 前記第2の値は、i番目のユーザがj番目のユーザの発言を引用して発言した引用回数、及びi番目のユーザがj番目のユーザに個人的に返信した返信回数の和と、i番目のユーザによる総引用回数及び総返信回数の和との比率により表現される、請求項7ないし10の何れか1項に記載の方法。
JP2010192925A 2010-08-30 2010-08-30 インフルエンサを発見する装置及び方法 Expired - Fee Related JP5489924B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010192925A JP5489924B2 (ja) 2010-08-30 2010-08-30 インフルエンサを発見する装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010192925A JP5489924B2 (ja) 2010-08-30 2010-08-30 インフルエンサを発見する装置及び方法

Publications (2)

Publication Number Publication Date
JP2012048683A true JP2012048683A (ja) 2012-03-08
JP5489924B2 JP5489924B2 (ja) 2014-05-14

Family

ID=45903428

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010192925A Expired - Fee Related JP5489924B2 (ja) 2010-08-30 2010-08-30 インフルエンサを発見する装置及び方法

Country Status (1)

Country Link
JP (1) JP5489924B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014010491A (ja) * 2012-06-27 2014-01-20 Exa Corp アカウント抽出支援装置及びアカウント抽出支援プログラム
JP2015069232A (ja) * 2013-09-26 2015-04-13 Kddi株式会社 友人整理装置、友人整理方法およびプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006202253A (ja) * 2004-12-24 2006-08-03 Nippon Telegr & Teleph Corp <Ntt> 情報評価装置、コンテンツ検索装置、情報評価方法、コンテンツ検索方法、それらのプログラム及び記録媒体
WO2009013788A1 (ja) * 2007-07-20 2009-01-29 Hewlett-Packard Development Company, L.P. 情報伝播解析システム、情報伝播解析装置、情報伝播解析方法およびそのプログラム
JP2010061332A (ja) * 2008-09-03 2010-03-18 Nifty Corp ブランド分析方法及び装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006202253A (ja) * 2004-12-24 2006-08-03 Nippon Telegr & Teleph Corp <Ntt> 情報評価装置、コンテンツ検索装置、情報評価方法、コンテンツ検索方法、それらのプログラム及び記録媒体
WO2009013788A1 (ja) * 2007-07-20 2009-01-29 Hewlett-Packard Development Company, L.P. 情報伝播解析システム、情報伝播解析装置、情報伝播解析方法およびそのプログラム
JP2010061332A (ja) * 2008-09-03 2010-03-18 Nifty Corp ブランド分析方法及び装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014010491A (ja) * 2012-06-27 2014-01-20 Exa Corp アカウント抽出支援装置及びアカウント抽出支援プログラム
JP2015069232A (ja) * 2013-09-26 2015-04-13 Kddi株式会社 友人整理装置、友人整理方法およびプログラム

Also Published As

Publication number Publication date
JP5489924B2 (ja) 2014-05-14

Similar Documents

Publication Publication Date Title
Zhao et al. Disentangling social media influence in crises: Testing a four-factor model of social media influence with large data
Keusch et al. Coverage error in data collection combining mobile surveys with passive measurement using apps: Data from a German national survey
Kimble et al. Big data and business intelligence: Debunking the myths
US20190182621A1 (en) Privacy-sensitive methods, systems, and media for geo-social targeting
Hajli et al. Establishing trust in social commerce through social word of mouth
Davoudi et al. Social trust model for rating prediction in recommender systems: Effects of similarity, centrality, and social ties
McCabe et al. Efficient probabilistic forecasts for counts
US20110258256A1 (en) Predicting future outcomes
US20240037573A1 (en) Method and apparatus for group filtered reports
Wang et al. Networked publics and the organizing of collective action on Twitter: Examining the# Freebassel campaign
David Powering economic growth and development in Africa: telecommunication operations
Ciavolino et al. Simultaneous equation model based on the generalized maximum entropy for studying the effect of management factors on enterprise performance
Ruiz-Herrera et al. Technology acceptance factors of e-commerce among young people: An integration of the technology acceptance model and theory of planned behavior
US9208509B1 (en) System, method, and computer program for personalizing content for a user based on a size of a working vocabulary of the user
Debreceny et al. Corporate network centrality score: Methodologies and informativeness
Hannum et al. Spatial analysis of Twitter sentiment and district-level housing prices
Weitzel et al. Measuring node importance on twitter microblogging
US20170213283A1 (en) Device and a computer software for provisioning a user with requested services
Khardani et al. Non linear parametric mode regression
JP5489924B2 (ja) インフルエンサを発見する装置及び方法
De Choudhury et al. Analyzing the dynamics of communication in online social networks
AU2019202083B2 (en) Real-time method and system for assessing and improving a presence and perception of an entity
US10853820B2 (en) Method and apparatus for recommending topic-cohesive and interactive implicit communities in social customer relationship management
Li et al. ICT, human capital and productivity in Chinese cities
Rakhmetullina et al. Mathematical modeling of the interests of social network users

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140225

R150 Certificate of patent or registration of utility model

Ref document number: 5489924

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees