JP2016218531A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2016218531A
JP2016218531A JP2015099520A JP2015099520A JP2016218531A JP 2016218531 A JP2016218531 A JP 2016218531A JP 2015099520 A JP2015099520 A JP 2015099520A JP 2015099520 A JP2015099520 A JP 2015099520A JP 2016218531 A JP2016218531 A JP 2016218531A
Authority
JP
Japan
Prior art keywords
community
resolution
node
communities
classification ratio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015099520A
Other languages
English (en)
Other versions
JP6511951B2 (ja
Inventor
シュウレ 邱
Xule Qiu
シュウレ 邱
岡本 洋
Hiroshi Okamoto
洋 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2015099520A priority Critical patent/JP6511951B2/ja
Priority to US14/918,915 priority patent/US10558918B2/en
Priority to SG10201509496XA priority patent/SG10201509496XA/en
Priority to AU2015268671A priority patent/AU2015268671B2/en
Priority to EP16153080.3A priority patent/EP3094065A1/en
Publication of JP2016218531A publication Critical patent/JP2016218531A/ja
Application granted granted Critical
Publication of JP6511951B2 publication Critical patent/JP6511951B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】2以上の解像度により得られたコミュニティ間の関係を導く情報処理装置及びプログラムの提供を目的とする。【解決手段】情報処理装置は、ネットワーク情報の予め定められた数の複数のコミュニティそれぞれに注目ノードが分類される分類割合を、前記複数のコミュニティそれぞれに隣接ノードが分類される分類割合と、所与の解像度に応じた相関を有するようにして算出する分類割合算出手段と、前記解像度の第1の値に応じて算出された、前記注目ノードに関する前記分類割合から、前記注目ノードが属する、前記ネットワーク情報の1以上の第1種コミュニティを生成する第1種コミュニティ生成手段と、前記注目ノードに関する前記分類割合を、前記複数のコミュニティそれぞれに前記隣接ノードが分類される分類割合と、前記解像度の第2の値に応じた相関を有するようにして更新する分類割合更新手段と、を備える。【選択図】図1

Description

本発明は情報処理装置及びプログラムに関する。
従来、ベクトル型データについていわゆるコミュニティ(クラスタ)分解を行い、大域的特徴を解析する場合があった。コミュニティ分解は、ノードと、ノードを結ぶリンクとを含むネットワーク型データに対して行われる場合もある。
下記特許文献1には、複数のメンバ投稿者の間のグループ情報に基づいて、1つ以上のコミュニティグループに分類し、コミュニティグループ毎に各属性要素の割合値を算出して、属性種別毎に抽出した属性要素を投稿者のプロフィール情報とする投稿者分析装置が記載されている。
下記特許文献2には、第1の利用者に係る電話番号或いはメールアドレスを、他の利用者の利用者データから検索して、一方向ソーシャルラインを設定し、一方向ソーシャルラインが設定された第2の利用者に係る電話帳データと、第1の利用者に係る電話帳データに双方向ソーシャルラインを設定する電話帳管理システムが記載されている。
下記特許文献3には、複数のクライアント端末が参加可能な仮想コミュニティに投稿されるメッセージを話題毎に分類、蓄積し、メッセージ相互間の階層関係に関する表示方法を設定する知識蓄積支援システムが記載されている。
特開2013−196070号公報 特開2010−004229号公報 特開2003−030216号公報
ネットワーク型データをコミュニティ分解する方法として、例えば、凝集型クラスタリングと呼ばれる方法や、分割最適化の方法が知られている。凝集型クラスタリングでは、所定の方法でノード間の距離を評価し、距離の近いノードを1つのコミュニティ(クラスタ)に凝集する処理を繰り返して、段階的にコミュニティを大きくしていく。また、分割最適化の方法では、仮定された分割について評価関数の値を算出し、評価関数の値が最大(又は最小)となる分割を探ることで最適なコミュニティ分解を求める。
凝集型クラスタリングの方法では、コミュニティが適切な解像度で形成されているか否かが必ずしも明らかでなかった。この点、分割最適化の方法では、仮定する分割の数は任意であり、異なる解像度によるコミュニティ分解が行える。
しかし、分割最適化の方法では、ある解像度により得られたコミュニティと、他の解像度により得られたコミュニティとの関係が必ずしも明らかでなかった。
そこで、本発明は、2以上の解像度により得られたコミュニティ間の関係を導く情報処理装置及びプログラムの提供を目的とする。
上記課題を解決するために、請求項1に記載の情報処理装置は、リンクで結ばれる注目ノード及び隣接ノードを含むネットワーク情報を取得するネットワーク情報取得手段と、前記ネットワーク情報の予め定められた数の複数のコミュニティそれぞれに前記注目ノードが分類される分類割合を、前記複数のコミュニティそれぞれに前記隣接ノードが分類される分類割合と、所与の解像度に応じた相関を有するようにして算出する分類割合算出手段と、前記解像度の第1の値に応じて算出された、前記注目ノードに関する前記分類割合から、前記注目ノードが属する、前記ネットワーク情報の1以上の第1種コミュニティを生成する第1種コミュニティ生成手段と、前記注目ノードに関する前記分類割合を、前記複数のコミュニティそれぞれに前記隣接ノードが分類される分類割合と、前記解像度の第2の値に応じた相関を有するようにして更新する分類割合更新手段と、前記分類割合更新手段により更新された前記注目ノードに関する前記分類割合から、前記注目ノードが属する、前記ネットワーク情報の1以上の第2種コミュニティを生成する第2種コミュニティ生成手段と、を備える。
また、請求項2に記載の情報処理装置は、前記1以上の第2種コミュニティのうち1つの上層コミュニティが、前記1以上の第1種コミュニティのうち1つの下層コミュニティに依存する割合を示す依存度を、前記上層コミュニティに分類される1以上の前記ノードと、前記下層コミュニティに分類される1以上の前記ノードとの重複が多いほど大きくなるように算出する依存度算出手段をさらに備える。
また、請求項3に記載の情報処理装置は、前記複数のコミュニティのうち1つのコミュニティの重要度を、前記複数のコミュニティ全体に対して当該1つのコミュニティが占める割合が大きいほど大きな値となるように、前記分類割合算出手段により算出された前記分類割合を用いて算出する重要度算出手段と、前記分類割合更新手段により更新された前記分類割合を用いて前記重要度算出手段により算出された前記重要度を更新する重要度更新手段と、前記重要度更新手段により更新された前記重要度の、更新前後の変化の量を算出する重要度変化算出手段と、前記重要度変化算出手段により算出された変化の量が予め定められた量よりも大きいか否かを判定する重要度変化判定手段と、をさらに備える。
また、請求項4に記載の情報処理装置は、前記重要度変化判定手段により前記重要度の変化の量が予め定められた量よりも大きいと判定された場合における前記解像度の値を取得する解像度取得手段と、前記解像度取得手段により取得された2つの前記解像度の値の間の値を有する安定解像度を算出する安定解像度算出手段と、をさらに備え、前記依存度算出手段は、前記安定解像度を用いて、前記依存度を算出する。
また、請求項5に記載の情報処理装置は、前記安定解像度算出手段は、前記解像度取得手段により取得された2つの前記解像度の値の中点の値を前記安定解像度として算出する。
また、請求項6に記載の情報処理装置は、前記分類割合算出手段は、逐次計算により、前記分類割合を算出し、前記分類割合更新手段は、前記分類割合算出手段による逐次計算の回数よりも少ない回数の逐次計算により、前記第1の分類割合を前記第2の分類割合に更新する。
また、請求項7に記載の情報処理装置は、前記分類割合更新手段による更新の前に、前記1以上の第1種コミュニティのうち少なくとも1つが、2以上の独立した部分を含むか否かを判定する独立部分判定手段と、前記独立部分判定手段により、前記1以上の第1種コミュニティのうち少なくとも1つが、2以上の独立した部分を含むと判定される場合に、当該2以上の独立した部分が2以上の第1種コミュニティとなるように前記1以上の第1種コミュニティを修正するコミュニティ修正手段と、をさらに備える。
また、請求項8に記載の情報処理装置は、前記第1種コミュニティ生成手段及び前記第2種コミュニティ生成手段は、2以上の前記第1種コミュニティ及び2以上の前記第2種コミュニティをそれぞれ生成する。
また、請求項9に記載の発明は、情報処理装置に備えられたコンピュータを、リンクで結ばれる注目ノード及び隣接ノードを含むネットワーク情報を取得するネットワーク情報取得手段、前記ネットワーク情報の予め定められた数の複数のコミュニティそれぞれに前記注目ノードが分類される分類割合を、前記複数のコミュニティそれぞれに前記隣接ノードが分類される分類割合と、所与の解像度に応じた相関を有するようにして算出する分類割合算出手段、前記解像度の第1の値に応じて算出された、前記注目ノードに関する前記分類割合から、前記注目ノードが属する、前記ネットワーク情報の1以上の第1種コミュニティを生成する第1種コミュニティ生成手段、前記注目ノードに関する前記分類割合を、前記複数のコミュニティそれぞれに前記隣接ノードが分類される分類割合と、前記解像度の第2の値に応じた相関を有するようにして更新する分類割合更新手段、前記分類割合更新手段により更新された前記注目ノードに関する前記分類割合から、前記注目ノードが属する、前記ネットワーク情報の1以上の第2種コミュニティを生成する第2種コミュニティ生成手段、として機能させるプログラムである。
請求項1及び9に記載の発明によれば、2以上の解像度により得られたコミュニティ間の関係を導く情報処理装置及びプログラムが得られる。
請求項2に記載の発明によれば、上層コミュニティと下層コミュニティの親子関係を算出する情報処理装置が得られる。
請求項3に記載の発明によれば、コミュニティに階層構造が表れる解像度の値を導出する情報処理装置が得られる。
請求項4に記載の発明によれば、安定的な計算結果が得られる解像度を用いる情報処理装置が得られる。
請求項5に記載の発明によれば、安定的な計算結果が得られる解像度をより少ない計算量で求める情報処理装置が得られる。
請求項6に記載の発明によれば、2以上の解像度それぞれについて独立してコミュニティの生成を行う場合に比較して、少ない計算量で2以上の解像度それぞれについてコミュニティの生成を行う情報処理装置が得られる。
請求項7に記載の発明によれば、コミュニティの生成を比較的粗い精度で行った場合であっても、より精度良くコミュニティ生成を行った場合と同等の分類結果を導出する情報処理装置が得られる。
請求項8に記載の発明によれば、1つのノードが複数のコミュニティに重複して分類され得る情報処理装置が得られる。
本発明の実施形態に係る情報処理装置の機能ブロック図である。 本発明の実施形態に係る情報処理装置に取得されるネットワーク情報の例を示す図である。 本発明の実施形態に係る情報処理装置における、第1種コミュニティ生成のフローチャートである。 本発明の実施形態に係る情報処理装置における、第2種コミュニティ生成のフローチャートである。 本発明の実施形態に係る情報処理装置によって算出される重要度と、解像度の関係を示す図である。 本発明の実施形態に係る情報処理装置によって生成されるコミュニティの階層を示す概略図である。 本発明の実施形態に係る情報処理装置における、依存度算出のフローチャートである。 本発明の実施形態に係る情報処理装置によって算出される、第3階層のコミュニティと第2階層のコミュニティの間の依存度を示す表である。 本発明の実施形態に係る情報処理装置によって算出される、第2階層のコミュニティと第1階層のコミュニティの間の依存度を示す表である。
以下、本発明の実施の形態について、図面を参照しながら説明する。
図1は、本発明の実施形態に係る情報処理装置1の構成図である。情報処理装置1は、ネットワーク情報10及び解像度12を取得し、入力部11、制御部13、記憶部14、及び表示部15を含む。
記憶部10は、例えばRAM(Random Access Memory)やROM(Read Only Memory)を含む。記憶部10は、制御部12が実行するプログラムを格納するとともに、制御部12のワークメモリとしても機能する。なお、記憶部10に格納される制御部12が実行するプログラムは、電気通信回線を介して提供されるものであってもよいし、半導体記憶素子等のコンピュータで読み取り可能な情報記憶媒体に格納されて提供されるものであってもよい。
ネットワーク情報10は、リンクで結ばれる注目ノード及び隣接ノードを含む。ネットワーク情報10は、複数のノード及び複数のノードを結ぶ複数のリンクを含み、複数のノードのうち1つが注目ノードとなる。ネットワーク情報10は、例えば相互参照を含むHTMLデータ、組織の所属関係のデータ、友人関係のデータ等であってよい。ネットワーク情報10は、少なくともノード間の結び付きの関係(ノードとリンクの関係)を示すものであればよく、ノードが含む具体的な内容(HTMLデータの内容等)を示すものでなくてもよい。
入力部11は、例えばキーボードやマウス等であり、ユーザの指示を制御部12に伝達する。解像度12は、正の実数であって、情報処理装置1によってネットワーク情報10をコミュニティに分類する場合に、コミュニティの大きさを定めるパラメータである。
制御部13は、例えばCPU(Central Processing Unit)を含んでおり、記憶部14に格納されるプログラムを実行することにより、情報処理装置1の全体を制御する。制御部12は、機能的に、ネットワーク情報取得部130、第1種コミュニティ生成部131、第2種コミュニティ生成部132、依存度算出部133、独立部分判定部134及びコミュニティ修正部135を含む。ここで、第1種コミュニティ生成部131は、分類割合算出部131a、重要度算出部131b及び帰属度算出部131cを含む。また、第2種コミュニティ生成部132は、分類割合更新部132a、重要度更新部132b、帰属度更新部132c、重要度変化算出部132d、重要度変化判定部132e、解像度取得部132f及び安定解像度算出部132gを含む。制御部13の行う制御については、後に詳細に説明する。
記憶部14は、例えばRAM(Random Access Memory)やROM(Read Only Memory)を含んで構成される。記憶部10は、制御部13が実行するプログラムを格納するとともに、制御部13のワークメモリとしても機能する。なお、記憶部14に格納される制御部13が実行するプログラムは、電気通信回線を介して提供されるものであってもよいし、半導体記憶素子等のコンピュータで読み取り可能な情報記憶媒体に格納されて提供されるものであってもよい。表示部15は、制御部13により処理された情報をユーザに表示するものであり、例えば液晶表示装置である。
なお、ネットワーク情報10及び解像度12は、入力部11によりユーザによって入力されるものであってもよいし、記憶部14に格納されるものであってもよいし、電気通信回線を介して提供されるものであってもよい。
図2は、本発明の実施形態に係る情報処理装置1に取得されるネットワーク情報10の例を示す図である。本例のネットワーク情報10は、7つのノードと、9つのリンクの情報を含むものである。各ノードには、1から7までのノード番号が付与されており、例えばノード番号1であるノード(以下、ノード[1]と表す)は、ノード[2]及びノード[4]のノードとリンクを有する。本実施形態では、説明を簡明にするため7つのノードを有するネットワークの場合を示すが、ノード数及びリンク数はこれより多くてもよく、例えば10万程度であってもよい。本例のネットワーク情報10では、ノード間を結ぶリンクは方向を持たないこととしているが、リンクは一方通行であってもよい。
行列Tは、ノード間をリンクに沿ってランダムに遷移する場合における遷移確率を表すものである。例えば、ノード[1]を起点としてリンクに沿ってランダムに他のノードに遷移する場合、1/2の確率でノード[2]に遷移し、1/2の確率でノード[4]に遷移する。これらの遷移確率をまとめて表したものが、行列Tの第1列である。他の行列要素についても同様に構成されている。一般に、ノード[n]とノード[m]がリンクで接続されている場合にAnm=1、ノード[n]とノード[m]がリンクで接続されていない場合にAnm=0となる行列Aを用いて、ノードの総数をNとする場合に、行列Tは以下の数式(1)で定義される。遷移確率の総和は1であるから、任意のノード[m]について、Σnm=1が成り立つ。
Figure 2016218531
図3は、本発明の実施形態に係る情報処理装置1における、第1種コミュニティ生成のフローチャートである。第1種コミュニティを生成する処理では、ネットワーク情報10及び解像度12を入力として、ネットワークに含まれるN個のノードをK個以下の複数のコミュニティに分類する。ここで、N及びKは正の整数である。また、本実施形態に係る情報処理装置1は、1つのノードが複数のコミュニティに分類され得るように、コミュニティを生成する。なお、成分の総数Kはユーザが仮決めすることのできるパラメータであり、例えばK=Nと定めることができるが、後述するように、コミュニティの総数は、第1種コミュニティの生成により自動的に定まる。第1種コミュニティ生成、複数のコミュニティそれぞれについて、複数のノードそれぞれが当該コミュニティに分類される分類割合を求め、複数のコミュニティの重要度を求める。すなわち、コミュニティ[k]について、ノード[n]がコミュニティ[k]に分類される分類割合p(n|k)を求め、コミュニティ[k]の重要度π(k)を求める。分類割合p(n|k)、及び重要度π(k)を求めるにあたって、第d番目の通過情報τ(d)に基づく、複数のコミュニティ全体に対するコミュニティ[k]が占める割合γ(d)(k)を求めることとなる。ここで、第d番目の通過情報τ(d)はN次元のベクトルであり、τ(1)、τ(2)…τ(D)(Dは正の整数)というD個のデータである。
第1種コミュニティ生成処理では、はじめに、ネットワーク情報10が表すネットワークのノード間をランダムに遷移する場合における定常確率分布pst(n)を算出する(S1)。定常確率分布pst(n)は、以下の数式(2)で定められる連立N次方程式を解くことにより求められる。定常確率分布pst(n)は、行列Tの固有ベクトルであって、固有値が1のものである。
Figure 2016218531
いわゆるランクシンク等の問題が懸念され、定常確率分布の値が特定のノードに集中するおそれがある場合、数式(2)を変形し、例えば、pst(n)=(1−r)Σnmst(m)+rという関係によって定常確率分布pst(n)を求めることとしてもよい。ここで、rは0以上1以下の実数である。rは、ノード間をリンクに沿わずにランダムに遷移する確率を表す。
次に、複数のノード間を複数のリンクに沿ってランダムに遷移する場合に通過するノードを示す複数の通過情報τ (d)を生成する(S2)。本実施形態では、通過情報は、定常確率分布pst(n)に従って選出されたノード[n]についてτ (d)=1、かつ、ノード[n]を起点としてノード[m]に遷移する確率を与えるTmnに従って選出されたノード[m]についてτ (d)=1として生成する。このようなN次元ベクトルを、D回生成する。通過情報τ (d)は、Στ (d)=2を満たす量である。通過情報τ (d)は、仮想エージェントがノード間をリンクに沿ってランダムに遷移する場合に、仮想エージェントをノード[n]とノード[m]とを結ぶリンク上に見出す場合を表している。
本実施形態に係る分類割合算出部131a及び重要度算出部131bは、逐次計算により分類割合p(n|k)及び重要度π(k)をそれぞれ算出する。分類割合算出部131aは、ネットワーク情報10の予め定められた数の複数のコミュニティそれぞれに注目ノードが分類される分類割合を、複数のコミュニティそれぞれに、注目ノードとリンクで結ばれる隣接ノードが分類される分類割合と、所与の解像度12に応じた相関を有するようにして算出する。逐次計算を開始するにあたって、p(n|k)、π(k)、γ (d)(k)を仮決めする(S3)。ここで、Σ(n|k)=1、Σπ(k)=1を満たす値を与えるものとする。p(n|k)は、k=1〜Kの成分について、n=1〜Nのノードが分類される割合を示すものであるから、仮決めではK×N−1個の正の実数を与えることになる。また、π(k)は、k=1〜Kに分類されたネットワークのコミュニティについて、重要度を示すものであるから、仮決めではK−1個の正の実数を与えることになる。γ (d)(k)は、複数のコミュニティ全体に対するコミュニティ[k]が占める割合を表す係数であり、d=1〜Dの通過情報τ(d)に対応して定まる係数であるから、仮決めではK×D個の正の実数を与えることになる。
また、本実施形態に係る分類割合算出部131a及び重要度算出部131bは、ネットワークのコミュニティの大きさを定めるパラメータとして、解像度12を第1の値αに設定する(S4)。ここで、αはユーザが自由に定めることのできる値であるが、ネットワーク情報10のコミュニティ分類が、十分に細かくなるような値を設定することが望ましい。解像度12の値は0以上であるから、αとして0に近い値を設定することが望ましい。
逐次計算の第1ステップでは、第t回目の逐次計算による分類割合p(n|k)を計算する(S5)。ここで、tは正の整数であり、逐次計算の回数を表す。p(n|k)は、1つ前の逐次計算により得られるpt−1(n|k)、πt−1(k)、及びγt−1 (d)(k)より算出される。例えば、仮決め(S3)の後行われる第一回目の逐次計算では、p(n|k)、π(k)、及びγ (d)(k)を用いてp(n|k)を求めることになる。
本実施形態に係る分類割合算出部131aは、以下の数式(3)で定められる関係により第t回目の逐次計算による分類割合p(n|k)を算出する(S5)。
Figure 2016218531
ここで、αはS4において設定された解像度12であり、正の実数である。本実施形態では、解像度12は、αが0に近付くほど分解の粒度が細かくなり、αが無限大に近付くほど分解の粒度が粗くなるパラメータである。また、Dt−1(k)はγt−1 (d)(k)から定まる係数であり、Dt−1(k)=Σγt−1 (d)(k)である。
分類割合p(n|k)は、ノード[n]との間でリンクを有するノード(Tnm≠0であるノード[m])のコミュニティ[k]に関する分類割合pt−1(m|k)が大きいほど大きな値となる第1の寄与(右辺第一項)と、複数のコミュニティ全体に対するコミュニティ[k]が占める割合γt−1 (d)(k)が大きいほど大きな値となる第2の寄与(右辺第二項)とから構成される値により算出される。
また、第1の寄与は、解像度12を粗くすると(αを無限大に近付けると)1に近付く第1の係数α/(α+2Dt−1(k))と、ノード[n]との間でリンクを有するノード(Tnm≠0であるノード[m])に関して直前に算出された分類割合pt−1(m|k)と、から定められる。また、第2の寄与は、解像度12を粗くすると(αを無限大に近付けると)0に近付く第2の係数1/(α+2Dt−1(k))と、複数の通過情報τ (d)と、複数のコミュニティ全体に対するコミュニティ[k]が占める割合γt−1 (d)(k)と、から定められる。なお、以下に示すように、複数のコミュニティ全体に対するコミュニティ[k]が占める割合γt−1 (d)(k)は、直前に算出された分類割合pt−1(n|k)及び重要度πt−1(k)から算出される。
次に、直前に算出された分類割合pt−1(n|k)及び重要度πt−1(k)、並びに複数の通過情報τ (d)から、複数のコミュニティ全体に対するコミュニティ[k]が占める割合γ (d)(k)を算出する(S6)。本実施形態では、以下の数式(4)により割合γ (d)(k)を算出する。割合γ (d)(k)は、コミュニティ全体の中で重要度が相対的に大きいコミュニティについて大きな値をとる。
Figure 2016218531
さらに、ネットワークのコミュニティ[k]の重要度π(k)を算出する(S7)。重要度π(k)は、複数のコミュニティ全体に対するコミュニティ[k]が占める割合γ (d)(k)が大きいほど大きな値となるように算出される。重要度算出部131bは、複数のコミュニティのうち1つのコミュニティ[k]の重要度π(k)を、複数のコミュニティ全体に対して当該1つのコミュニティ[k]が占める割合γ (d)(k)が大きいほど大きな値となるように、分類割合算出部131aにより算出された分類割合pt−1(n|k)を用いて算出する。本実施形態では、以下の数式(5)によりコミュニティ[k]の重要度π(k)を算出する。
Figure 2016218531
以上の数式(3)、(4)及び(5)により、直前に算出された分類割合pt−1(n|k)、重要度πt−1(k)及び割合γt−1 (d)(k)、並びに通過情報τ (d)から、分類割合p(n|k)、重要度π(k)及び割合γ (d)(k)が算出される。
第1コミュニティ生成処理では、逐次計算の前後における評価値Qの差の絶対値|Q−Qt−1|が予め定められた基準値εより小さいか否かを判定し、逐次計算を終了するか否かを決定する(S8)。本実施形態において、評価値Qは以下の数式(6)で定められる量である。
Figure 2016218531
|Q−Qt−1|<εが成立しない場合、最新の分類割合p(n|k)、重要度π(k)及び割合γ (d)(k)を直前の分類割合、重要度及び割合であるとして更新する(S9)。その後、分類割合pt+1(n|k)を算出する工程(S5)、割合γt+1 (d)(k)を算出する工程(S6)、重要度πt+1(k)を算出する工程(S7)を行い、|Qt+1−Q|<εが成立するか否かを判定する(S8)、という一連の工程を繰り返す。本実施形態に係る分類割合算出部131a及び重要度算出部131bは、評価値の差の絶対値が予め定められた値より小さくなるまで、以上の工程を繰り返し、逐次計算により分類割合及び重要度を算出する。これにより、ネットワーク情報10のコミュニティ分類が漸近的に行われる。
一方、|Q−Qt−1|<εが成立する場合、ノード[n]がコミュニティ[k]に分類される分類割合をp(I)(n|k)=p(n|k)により定め、コミュニティ[k]の重要度をπ(I)(k)=π(k)により定める(S10)。ここで、添字(I)は、これらの値が第1種コミュニティ生成のために用いられる値であることを示す。本実施形態に係る情報処理装置1によれば、予め定められた値εを調整することで、任意の精度で分類割合p(I)(n|k)及び重要度π(I)(k)を求め、ネットワークのコミュニティ分類を任意の精度で行う。なお、逐次計算の回数を予め定めておき、定められた回数だけ逐次計算を行った場合におけるp(n|k)及びπ(k)の値を、それぞれ分類割合p(I)(n|k)及び重要度π(I)(k)と決定することとしてもよい。
次に、帰属度算出部131cにより、複数のノードそれぞれについて、ノード[n]がコミュニティ[k]に分類される分類割合p(n|k)が大きいほど、大きな値となるように帰属度を算出する(S11)。本実施形態では、ノード[n]がコミュニティ[k]に帰属する帰属度q(I)(k|n)は、以下の数式(7)によって求められる。
Figure 2016218531
数式(7)から読み取れるように、帰属度q(k|n)は、Σq(k|n)=1を満たす量である。すなわち、あるノードが各コミュニティに帰属する帰属度の総和は1となる。帰属度q(k|n)は、あるノード[n]が、コミュニティ[k]に帰属する度合いをコミュニティ全体に関して相対的に測った量である。
第1種コミュニティ生成部131は、解像度12の第1の値αに応じた相関を有するようにして算出された、注目ノード[n]に関する分類割合p(I)(n|k)から、注目ノード[n]が属する、ネットワーク情報10の1以上の第1種コミュニティを生成する(S12)。第1種コミュニティ生成部131は、注目ノード[n]がコミュニティ[k]に属する割合を、分類割合p(I)(n|k)の値によって定めてよい。また、第1種コミュニティ生成部131は、分類割合p(I)(n|k)及び重要度π(I)(k)から算出される帰属度q(I)(k|n)に基づき、注目ノード[n]が属する第1種コミュニティを生成してもよい。その場合、注目ノード[n]がコミュニティ[k]に属する割合を、帰属度q(I)(k|n)の値によって定める。いずれの場合も、第1種コミュニティ生成部131は、注目ノード[n]が属する2以上の第1種コミュニティを生成する。そのため、本実施形態に係る第1種コミュニティ生成部131によれば、1つのノードが複数の属性を有する場合を表現したコミュニティ分類が行われる。
以上のように、本実施形態に係る第1種コミュニティ生成部131は、逐次計算により第1種コミュニティを生成する。逐次計算の精度は、数式(6)のεで定められる。εを十分に小さく設定しなかった場合、独立した部分を含むコミュニティが生成される場合がある。本実施形態に係る独立部分判断部134は、分類割合更新部132aによる更新の前に、1以上の第1種コミュニティのうち少なくとも1つが、2以上の独立した部分を含むか否かを判定する。ここで、コミュニティに含まれる独立した部分とは、ノードの集合であって、当該集合に含まれるノード間は互いにリンクで直接結ばれているが、当該コミュニティに含まれ、当該集合に含まれないノードとは、リンクで直接結ばれていない集合をいう。
本実施形態に係るコミュニティ修正部135は、独立部分判定部134により、1以上の第1種コミュニティのうち少なくとも1つが、2以上の独立した部分を含むと判定される場合に、当該2以上の独立した部分が2以上の第1種コミュニティとなるように1以上の第1種コミュニティを修正する。これにより、コミュニティの生成を比較的粗い精度で行った場合であっても、より精度良くコミュニティ生成を行った場合と同等の分類結果が得られる。
図4は、本発明の実施形態に係る情報処理装置1における、第2種コミュニティ生成のフローチャートである。第2種コミュニティ生成部132は、第1種コミュニティ生成部131により逐次計算で求められた分類割合p(I)(n|k)及び重要度π(I)(k)を計算の出発点として、解像度12を第1の値αからわずかに増加させた第2の値α=α+Δαとして、解像度12の第2の値αに応じた相関を有するようにして分類割合、重要度及び帰属度を更新する。また、第2種コミュニティ生成部132は、第2種コミュニティ生成部132により更新された分類割合、重要度及び帰属度を、わずかに増加させた解像度12に応じた相関を有するように更新していく。
第2種コミュニティ生成処理は、第1種コミュニティ生成処理のS1において算出された定常確率分布pst(n)を取得することから始まる(S21)。また、第1種コミュニティ生成処理のS2において生成された通過情報τ (d)を取得する(S22)。さらに、第1種コミュニティ生成処理のS10において算出された分類割合p(I)(n|k)、重要度π(I)(k)及び割合γ(I) (d)(k)を取得する(S23)。ここで、割合γ(I) (d)(k)は、|Q−Qt−1|<εが成立した場合における割合γ (d)(k)の値である。
本実施形態に係る分類割合更新部132aは、注目ノード[n]に関する分類割合p(I)(n|k)を、複数のコミュニティそれぞれに隣接ノードが分類される分類割合と、解像度12の第2の値α=α+Δαに応じた相関を有するようにして更新する。そのため、第2種コミュニティ生成部132は、解像度12として、第1の値αを増加させた第2の値α=α+Δαを設定する(S24)。本実施形態の場合、解像度12を粗くすることは解像度12の値を大きくすることに対応するため、増加量Δαは正の値である。しかし、解像度12を粗くすることが解像度12の値を小さくすることに対応する場合、Δαは負の値であってよい。
本実施形態に係る分類割合更新部132aは、分類割合等の変化が比較的小さくなる程度(準静的な変化となる程度)の変化量Δαによって、解像度12の第2の値α=α+Δαを設定する。例えば、分類割合更新部132aは、分類割合等の変化が、数式(6)において逐次計算の収束性の判定に用いた値ε以下となるように解像度12の変化量Δαを定めて、解像度12を第2の値αに設定してよい。
分類割合更新部132aは、具体的に、以下の数式(8)によって分類割合を更新する(S25)。ここで、分類割合p(II)(n|k)は、第2種コミュニティを生成するために用いられる更新された分類割合である。また、D(I)(k)=Σγ(I) (d)(k)である。
Figure 2016218531
数式(8)は、数式(3)の解像度12の第1の値αを第2の値αに置き換え、第t回目の逐次計算による分類割合p(n|k)及び割合γ (d)(k)を、それぞれ第1種コミュニティ分類処理で算出された分類割合p(I)(n|k)及び割合γ(I) (d)(k)に置き換えたものである。
また、本実施形態に係る重要度更新部132bは、第1種コミュニティ分類処理で算出された重要度π(I)(k)を、第2種コミュニティを生成するために用いられるπ(II)(k)に更新する。具体的には、重要度更新部132bは、第1種コミュニティ分類処理で算出された割合γ(I) (d)(k)を以下の数式(9)で割合γ(II) (d)(k)に更新する。
Figure 2016218531
数式(9)は、数式(4)における第t−1回目の逐次計算による分類割合pt−1(n|k)及び重要度πt−1(k)を、第1種コミュニティ分類処理で算出された分類割合p(I)(n|k)及び重要度π(I)(k)に置き換えたものである。重要度更新部132bは、分類割合更新部132aにより更新された分類割合p(II)(n|k)を用いて重要度算出部131bにより算出された重要度π(I)(k)を更新する。具体的に、重要度更新部132bは、更新された割合γ(II) (d)(k)を用いて、以下の数式(10)によって重要度を更新する(S25)。
Figure 2016218531
数式(10)は、数式(5)における第t回目の逐次計算による割合γ (d)(k)を、更新された割合γ(II) (d)(k)に置き換えたものである。
さらに、帰属度更新部132cは、第1種コミュニティ分類処理で算出された帰属度q(I)(k|n)を、以下の数式(11)によって、第2種コミュニティを生成するために用いられる帰属度q(II)(k|n)に更新する(S26)。
Figure 2016218531
数式(11)は、数式(7)における第1種コミュニティ分類処理で算出された分類割合p(I)(n|k)及び重要度π(I)(k)を、第2種コミュニティ分類処理で更新された分類割合p(II)(n|k)及び重要度π(II)(k)に置き換えたものである。
第2種コミュニティ生成部132は、分類割合更新部132aにより更新された注目ノード[n]に関する分類割合p(II)(n|k)から、注目ノード[n]が属する、ネットワーク情報10の1以上の第2種コミュニティを生成する(S27)。第2種コミュニティ生成部132は、注目ノード[n]がコミュニティ[k]に属する割合を、分類割合p(II)(n|k)の値によって定めてよい。また、第2種コミュニティ生成部132は、分類割合p(II)(n|k)及び重要度π(II)(k)から算出される帰属度q(II)(k|n)に基づき、注目ノード[n]が属する第2種コミュニティを生成してもよい。その場合、注目ノード[n]がコミュニティ[k]に属する割合を、帰属度q(II)(k|n)の値によって定める。いずれの場合も、第2種コミュニティ生成部132は、注目ノード[n]が属する2以上の第2種コミュニティを生成する。そのため、本実施形態に係る第2種コミュニティ生成部132によれば、1つのノードが複数の属性を有する場合を表現したコミュニティ分類が行われる。
また、本実施形態に係る第1種コミュニティ生成部131及び第2種コミュニティ生成部132によれば、第1種コミュニティ生成処理において算出された分類割合p(I)(n|k)、重要度π(I)(k)及び割合γ(I) (d)(k)を計算の出発点として第2種コミュニティ生成処理が行われ、2以上の解像度(解像度12の第1の値αと第2の値α)により得られたコミュニティ間の関係が導かれる。また、第1種コミュニティ生成部131により、逐次計算の収束性の判定を行い、第2種コミュニティ生成部132において第1種コミュニティ生成部131による算出結果を用いることで、十分に精度良く分類されたコミュニティを更新することとなり、2以上の解像度それぞれについて独立してコミュニティの生成を行う場合に比較して、少ない計算量で2以上の解像度それぞれについてコミュニティの生成が行われる。本実施形態では、第2種コミュニティ生成部132は、数式(8)、(9)及び(10)によって一度の計算で分類割合、割合及び重要度を更新することとしたが、これらの値を数回の逐次計算(分類割合算出部131a及び重要度算出部131bによる逐次計算の回数よりも少ない回数の逐次計算)によって更新することとしてもよい。第1種コミュニティ生成部131により十分精度良くコミュニティ生成がされているから、第2種コミュニティ生成部132における逐次計算の回数が第1種コミュニティ生成部131における逐次計算の回数よりも少なくても、第2種コミュニティ生成部132によって、十分な精度でコミュニティ生成が行われる。
以上の説明において、第2種コミュニティ生成部132は、第1種コミュニティ生成処理において算出された分類割合p(I)(n|k)、重要度π(I)(k)及び割合γ(I) (d)(k)並びに解像度12の第2の値α=α+Δαを入力として、更新された分類割合p(II)(n|k)、重要度π(II)(k)、割合γ(II) (d)(k)及び帰属度q(II)(k|n)を算出した。第2種コミュニティ生成部132は、さらに、第2種コミュニティ生成処理において算出された分類割合p(II)(n|k)、重要度π(II)(k)及び割合γ(II) (d)(k)並びに解像度12の第3の値α+2Δαを入力として、更新された分類割合、重要度、割合及び帰属度を算出する。このように、解像度12の値をΔαずつ増加させて、分類割合、重要度、割合及び帰属度を更新していくことで、解像度12の値に対するコミュニティ形成状態の変化が追跡される。次図において、解像度12の値を第1の値αから増加させた場合における、重要度π(II)(k)の変化の様子を示す。
図5は、本発明の実施形態に係る情報処理装置1によって算出される重要度π(k)と、解像度12の関係を示す図である。同図では、横軸に解像度12の値αを示し、縦軸に重要度π(k)の値を示している。
同図の縦軸に最も近い3つのデータ点は、図2に示すネットワーク情報10について、解像度12の値が第1の値αである場合において、重要度算出部131bにより算出された重要度π(0)(k)の値を表している。ここで、重要度π(0)(k)は、第1種コミュニティの重要度であるが、添字を(0)に変更し、解像度12の第1の値αに対応した添字としている。
重要度π(0)(k)は、k=1、2、3について0でない値を有し、それ以外のkについて0である。このことは、ネットワーク情報10を解像度12の第1の値αに応じた相関を有するようにコミュニティ分類すると、3つの第1種コミュニティに分類されることを表している。
同図には、解像度12を第1の値αからΔαだけ増加させて第2の値αとした場合において、重要度更新部132bにより算出された重要度π(1)(k)の値が表されている。ここで、重要度π(1)(k)は、第2種コミュニティの重要度であるが、添字を(1)に変更し、解像度12の第2の値αに対応した添字としている。重要度π(1)(k)は、k=1、2、3について重要度π(0)(k)とほぼ変わらない値を有する。
本発明の発明者は、解像度12の値を増加させて第2種コミュニティ生成部132による重要度の更新を繰返していくと、重要度π(k)の値が比較的大きく変化する不安定領域が表れ、1以上のコミュニティについて重要度の値が0になることを見出した。同図の場合、解像度12の値を増加させていくと、第1の不安定領域R1が表れ、π(k=2)の値が0に変化している。また、第1の不安定領域R1において、π(k=1)<π(k=2)からπ(k=1)>π(k=2)へ入れ替わりが生じている。これらの変化は、解像度12の値を増加させて解像度12を粗くしていくと、コミュニティ[2]が消滅してコミュニティ[1]に吸収され、相対的にコミュニティ[3]の重要度が減少したために生じていると解釈される。
本実施形態に係る重要度変化算出部132dは、重要度更新部132bにより更新された重要度の、更新前後の変化の量を算出する。すなわち、重要度変化算出部132dは、解像度の値がΔαだけ異なる場合において算出された、2つの重要度の変化の量を、各コミュニティについて算出する。
また、本実施形態に係る重要度変化判定部132eは、重要度変化算出部132dにより算出された変化の量が予め定められた量よりも大きいか否かを判定する。予め定められた量(基準量)としては、安定領域(不安定領域以外の領域)における重要度の変化の量を採用してよい。図5の例の場合、|π(1)(k)−π(0)(k)|のうち最も値が大きいコミュニティ[k]についての変化量を基準量とすることができる。
重要度変化算出部132dは、解像度12の値がΔα増加した場合における、π(1)、π(2)及びπ(3)の変化量を算出する。それぞれの変化量は、第1の不安定領域R1において、基準量より大きいから、重要度変化判定部132eは、π(1)、π(2)及びπ(3)の変化の量が予め定められた量よりも大きいと判定する。
本実施形態に係る解像度取得部132fは、重要度変化判定部132eにより重要度の変化の量が予め定められた量よりも大きいと判定された場合における解像度12の値を取得する。本例の場合、重要度変化判定部132eは、第1の不安定領域R1において、重要度の変化の量が予め定められた量よりも大きいと判定するため、解像度取得部132fは、第1の不安定領域R1に属する解像度12の値を取得する。解像度取得部132fは、第1の不安定領域R1に属する解像度12の値のうち中点の値を取得してもよい。これにより、コミュニティに階層構造が表れる解像度12の値が判別される。
解像度12の値をさらに増加させ、重要度の値の更新を続けると、解像度12の値がαである場合の重要度の値はπ(2)(k)となる。さらに重要度の更新を続けると、第2の不安定領域R2が表れる。第2の不安定領域R2では、コミュニティ[2]の重要度が0になり、コミュニティ[1]の重要度が1に漸近する。このことは、コミュニティ[2]が消滅してコミュニティ[1]に吸収され、全体として1つのコミュニティになったと解釈される。第2の不安定領域R2を過ぎて、重要度の値の更新を続けると、解像度12の値がαである場合の重要度の値はπ(3)(k)となる。
本実施形態に係る安定解像度算出部132gは、解像度取得部132fにより取得された2つの解像度12の値の間の値を有する安定解像度を算出する。具体的に、安定解像度算出部132gは、解像度取得部132fにより取得された2つの解像度12の値の中点の値を安定解像度として算出する。図5の例において、安定解像度算出132gは、第1の不安定領域R1の上端と、第2の不安定領域R2の下端との中点の値を安定解像度αとして算出する。算出された安定解像度は、後に詳細に説明する依存度算出部133によるコミュニティ間の依存度の算出を行う場合に用いられる。仮に、コミュニティ間の依存度を不安定領域において算出すると、計算結果が不安定となり、計算時間が長くなったり、計算結果の精度が悪くなったりする場合がある。本実施形態に係る依存度算出部133は、安定解像度を用いて依存度を算出することで、安定的な計算結果を得る。また、本実施形態に係る安定解像度算出部132gは、解像度取得部132fにより取得された2つの解像度12の値の中点の値を安定解像度として用いることで、安定的な計算結果が得られる解像度をより少ない計算量で求めている。
以下の説明において、重要度の値がπ(1)(k)である場合の3つのコミュニティを第1階層コミュニティ、重要度の値がπ(2)(k)である場合の2つのコミュニティを第2階層コミュニティ、重要度の値がπ(3)(k)である場合の1つのコミュニティを第3階層コミュニティと称する。第2階層コミュニティは、第1階層コミュニティに対する上層コミュニティである。逆に、第1階層コミュニティは、第2階層コミュニティに対する下層コミュニティである。同様に、第3階層コミュニティは、第2階層コミュニティに対する上層コミュニティであり、第2階層コミュニティは、第3階層コミュニティに対する下層コミュニティである。
図6は、本発明の実施形態に係る情報処理装置1によって生成されるコミュニティの階層を示す概略図である。同図には、解像度12の値を示す縦軸が示され、解像度12の値がα、α、αの場合におけるネットワーク情報10のコミュニティが破線で示されている。解像度12の値がαである場合、ノード[2]及び[3]を含む第1の第1階層コミュニティ2aと、ノード[1]及び[4]を含む第2の第1階層コミュニティ2bと、ノード[5]、[6]及び[7]を含む第3の第1階層コミュニティ2cが破線で示されている。また、解像度12の値がαである場合、ノード[1]、[2]、[3]及び[4]を含む第1の第2階層コミュニティ3aと、ノード[5]、[6]及び[7]を含む第2の第2階層コミュニティ3bが破線で示されている。また、解像度12の値がαである場合、ノード[1]乃至[7]を含む第3階層コミュニティ4が破線で示されている。
それぞれの階層のコミュニティ間には、破線矢印で、依存度p(C(a) |C(b) )が示されている。ここで、C(a) は、第a階層のコミュニティ[k]を示す記号であり、依存度p(C(a) |C(b) )は、第a階層のコミュニティ[k]が、第b階層のコミュニティ[l]に依存する割合を示す。本実施形態に係る依存度算出部133は、1以上の第2種コミュニティのうち1つの上層コミュニティが、1以上の第1種コミュニティのうち1つの下層コミュニティに依存する割合を示す依存度を、上層コミュニティに分類される1以上のノードと、下層コミュニティに分類される1以上のノードとの重複が多いほど大きくなるように算出する。
図7は、本発明の実施形態に係る情報処理装置1における、依存度算出のフローチャートである。本実施形態に係る依存度算出部133は、はじめに第1種コミュニティ生成部131により算出された定常確率分布pst(n)を取得する(S31)。そして、第2種コミュニティ生成部132の帰属度更新部132cにより算出された各階層の帰属度q(a)(k|n)を取得する(S32)。各階層の帰属度q(a)(k|n)は、安定解像度の下で算出された分類割合及び重要度から求められることが望ましい。
その後、依存度算出部133は、第a階層のコミュニティ[k]と第b階層のコミュニティ[l]との間の絶対重みp(C(a) 、C(b) )を算出する(S33)。本実施形態に係る依存度算出部133は、以下の数式(12)によって、絶対重みp(C(a) 、C(b) )を算出する。
Figure 2016218531
ここで、I(n∈C(a) )は、ノード[n]が第a階層のコミュニティ[k]に属する場合に1、ノード[n]が第a階層のコミュニティ[k]に属さない場合に0となる関数である。ノード[n]が第a階層のコミュニティ[k]に属するか否かは、第a階層の帰属度q(a)(k|n)により判定する。任意のノード[n]について、帰属度q(a)(k|n)はΣ(a)(k|n)=1を満たすから、帰属度が最も大きいコミュニティが存在する(仮に、複数のコミュニティについて帰属度が同じ値で最大となる場合、当該複数のコミュニティのうちからランダムに1つのコミュニティを選んでよい)。本実施形態に係る依存度算出部133は、第a階層において、ノード[n]は、帰属度q(a)(k|n)の値が最も大きいコミュニティ[k]に属すると判定する。
次に、依存度算出部133は、第a階層のコミュニティ[k]について、固有重みp(C(a) )を算出する(S34)。本実施形態に係る依存度算出部133は、以下の数式(13)によって、第a階層のコミュニティ[k]の固有重みp(C(a) )を算出する。
Figure 2016218531
以上説明した絶対重みp(C(a) 、C(b) )及び固有重みp(C(a) )を算出する第1の方法は、1つの例であり、他にも絶対重み及び固有重みを算出する方法がある。後に絶対重み及び固有重みを算出する第2の方法及び第3の方法を詳細に説明する。
絶対重みp(C(a) 、C(b) )及び固有重みp(C(a) )に基づいて、依存度算出部133は、第a階層のコミュニティ[k]と第b階層のコミュニティ[l]との間の相対重み(依存度)p(C(a) |C(b) )を算出する(S35)。本実施形態に係る依存度算出部133は、以下の数式(14)によって、第a階層のコミュニティ[k]が第b階層のコミュニティ[l]に依存する割合である依存度p(C(a) |C(b) )を算出する。
Figure 2016218531
図8は、本発明の実施形態に係る情報処理装置1によって算出される、第1階層のコミュニティと第2階層のコミュニティの間の依存度p(C(1) |C(2) )を示す表である。また、図9は、本発明の実施形態に係る情報処理装置1によって算出される、第2階層のコミュニティと第3階層のコミュニティの間の依存度p(C(2) |C(3) )を示す表である。両図には、絶対重みp(C(1) 、C(2) )及びp(C(2) 、C(3) )と、固有重みp(C(2) )及びp(C(3) )も示している。
図2に示すネットワーク情報10について、解像度12の値αでコミュニティ分類を行うと3つの第1階層のコミュニティが検出される。ノード[2]及び[3]について第1階層の帰属度q(1)(k|n)が最も大きいコミュニティはコミュニティ[1]であり、I([2]∈C(1) )={1(k=1の場合)、0(k=2及び3の場合)}となり、I([3]∈C(1) )={1(k=1の場合)、0(k=2及び3の場合)}となる。同様に、I([1、4]∈C(1) )={1(k=2の場合)、0(k=1及び3の場合)}となる。また、I([5〜7]∈C(1) )={3(k=1の場合)、0(k=1及び2の場合)}となる。
また、第2階層の帰属度q(2)(k|n)から、I([1〜4]∈C(2) )={1(k=1の場合)、0(k=2の場合)}となり、I([5〜7]∈C(2) )={1(k=2の場合)、0(k=1の場合)}となる。
これらのI(n∈C(1) )及びI(n∈C(2) )と、取得された定常確率分布pst(n)から、数式(12)に従って絶対重みp(C(1) 、C(2) )を算出すると、図8の左の表に示す値が得られる。絶対重みp(C(1) 、C(2) )は、Σk、lp(C(1) 、C(2) )=1を満たす。これらの値から、第1階層のコミュニティ[1]及び[2]は、第2階層のコミュニティ[1]と関係性があるが、第2階層のコミュニティ[2]とは関係性が無いことがわかる。また、第1階層のコミュニティ[3]は、第2階層のコミュニティ[1]と関係性が無く、第2階層のコミュニティ[2]と関係性があることがわかる。
I(n∈C(2) )と、取得された定常確率分布pst(n)から、数式(13)に従って第2階層のコミュニティの固有重みp(C(2) )を算出すると、図8の中央の表に示す値が得られる。固有重みp(C(2) )は、固有重みΣp(C(2) )=1を満たす。これらの値から、第2階層では、コミュニティ[1]がコミュニティ[2]より相対的に大きいことが読み取れる。
算出された絶対重みp(C(1) 、C(2) )と、固有重みp(C(2) )から、数式(14)に従って第1階層のコミュニティと第2階層のコミュニティの間の依存度p(C(1) |C(2) )を算出すると、図8の右の表に示す値が得られる。依存度p(C(1) |C(2) )は、第2階層のコミュニティそれぞれについて(任意のlについて)、Σp(C(1) |C(2) )=1を満たす。これらの値から、第1階層のコミュニティ[1]及び[2]は、第2階層のコミュニティ[1]に依存し、第2階層のコミュニティ[2]には依存しないことがわかる。また、第1階層のコミュニティ[1]が第2階層のコミュニティ[1]に依存する割合は0.523であり、第1階層のコミュニティ[2]が第2階層のコミュニティ[1]に依存する割合は0.477であって、第1階層のコミュニティ[1]の方が、依存度が僅かに大きいことがわかる。また、第1階層のコミュニティ[3]は、第2階層のコミュニティ[2]に依存し、第2階層のコミュニティ[1]には依存しない。
同様に、図9には、第2階層の2つのコミュニティと、第3階層の1つのコミュニティについて、絶対重みp(C(2) 、C(3) )と、固有重みp(C(3) )と、依存度p(C(2) |C(3) )と、をそれぞれ表に示している。第3階層には1つのコミュニティしかないので、第2階層のコミュニティは、それぞれ第3階層のコミュニティ[1]に依存している。ただし、依存の割合は、第2階層のコミュニティ[1]が0.62であり、第2階層のコミュニティ[2]は0.38であり、偏りがあることがわかる。
本実施形態に係る依存度算出部133によれば、ネットワーク情報10の異なる階層のコミュニティについて、コミュニティの吸収を反映した上層コミュニティと下層コミュニティの親子関係が算出される。コミュニティは、必ずしも1対1の親子関係を有するとは限らず、2以上のコミュニティが1つのコミュニティに統合され、親子関係をつくる場合もある。図6に示す例では、第1階層のコミュニティ[1]及び[2]が、第2階層のコミュニティ[1]に統合されており、第2階層のコミュニティ[1]は2つのコミュニティを親に持つといえる。このように、本実施形態に係る依存度算出部133によれば、2以上のコミュニティを親に持つコミュニティが判別され、より詳細なコミュニティの親子関係を導出される。
以下では、第a階層のコミュニティ[k]と第b階層のコミュニティ[l]との間の絶対重みp(C(a) 、C(b) )と、第a階層のコミュニティ[k]の固有重みp(C(a) )を算出する第2の方法及び第3の方法について説明する。第2の方法は、ノード[n]が属するコミュニティを1つに定めず、1つのノードが複数のコミュニティに属することを許容しつつ、これらの量を求める方法である。第3の方法は、リンクが向きを有する場合に、これらの量を求める方法である。
第2の方法では、第a階層のコミュニティ[k]と第b階層のコミュニティ[l]との間の絶対重みp(C(a) 、C(b) )は、以下の数式(15)により求められる。
Figure 2016218531
ここで、S(a)、(b) k、l(n)は、以下の数式(16)により、逐次計算により求められる。ここで、Kは、第a階層のコミュニティの総数であり、Kは、第b階層のコミュニティの総数である。
Figure 2016218531
(a)、(b) k、l(n)を求めるにあたって、はじめにS(a)、(b) k、l(n)の値を仮決めする。その後、仮決めしたS(a)、(b) k、l(n)と、帰属度更新部132cにより算出された第a階層の帰属度q(a)(k|n)及び第b階層の帰属度q(b)(k|n)とを用いて、数式(16)によりρ(a)、(b) k、l(n)を算出する。さらに、算出されたρ(a)、(b) k、l(n)を用いて、数式(16)によりS(a)、(b) k、l(n)の値を更新する。以上の計算をS(a)、(b) k、l(n)の値の変動が十分に小さくなるまで繰返す。S(a)、(b) k、l(n)の値の収束性の判定は、逐次計算前後のS(a)、(b) k、l(n)の値の変化が、数式(6)のε以下となるか否かによって行ってよい。
第2の方法では、第a階層のコミュニティ[k]の固有重みp(C(a) )は、以下の数式(17)により求められる。
Figure 2016218531
数式(15)により算出された絶対重みp(C(a) 、C(b) )及び数式(16)により算出された固有重みp(C(a) )から、第1の方法においても、数式(14)により第a階層のコミュニティ[k]と第b階層のコミュニティ[l]との間の相対重み(依存度)p(C(a) |C(b) )が算出される。第1の方法の特徴は、1つのノードが複数のコミュニティに属する場合に、コミュニティ間の親子関係を導出する点である。そのため、上層コミュニティは、潜在的に全ての下層コミュニティを親として持つこととなる。
次に、依存度を求める第3の方法について説明する。第3の方法は、ネットワーク情報10が向きを持ったリンクを含む場合に適用される。図2に示すネットワーク情報10の例では、リンクは向きを持たないが、全てのリンクそれぞれを、向きが互いに逆である2つのリンクに置き換えることで、第3の方法を適用することができる。図2に示すネットワーク情報10の例では、リンクの総数は9だが、全てのリンクを有向リンクに置き換えると、リンクの総数は18となる。
第3の方法では、第a階層のコミュニティ[k]と第b階層のコミュニティ[k’]との間の絶対重みp(C(a) 、C(b) k’)は、以下の数式(18)により求められる。ここで、p(l)は、ネットワーク情報10に含まれるリンクの確率分布であり、数式(19)で与えられる。また、Lはネットワーク情報10に含まれるリンクの総数である。I(l∈C(a) )は、リンク[l]が第a階層のコミュニティ[k]に属する場合に1、リンク[l]が第a階層のコミュニティ[k]に属さない場合に0となる関数である。I(l∈C(a) )は、リンク[l]がコミュニティ[k]に属するか否かを表す関数といえる。
Figure 2016218531
(l)の具体的な表式は、以下の数式(19)で与えられる。p(l)は、リンク[l]の出発ノード[n]の定常確率分布pst(n)を、ノード[n]から発するリンクの数dout(n)で割った値である。ここで、出発ノード[n]は、リンク[l]が結ぶ2つのノードのうち出発側のノードを表す。p(l)は、ノードの定常確率分布を、当該ノードに繋がるリンクの数で割ったものであり、Σ(l)=1を満たす。
Figure 2016218531
第3の方法では、第a階層のコミュニティ[k]の固有重みp(C(a) )は、以下の数式(20)により求められる。
Figure 2016218531
数式(18)により算出された絶対重みp(C(a) 、C(b) k’)及び数式(20)により算出された固有重みp(C(a) )から、第3の方法においても、数式(14)により第a階層のコミュニティ[k]と第b階層のコミュニティ[k’]との間の相対重み(依存度)p(C(a) |C(b) k’)が算出される。第3の方法の特徴は、ネットワーク情報10に含まれる有向リンクに着目し、コミュニティの親子関係を、リンクがいずれのコミュニティに属するかという観点から算出する点である。そのため、ネットワーク情報10を構成するリンクの接続状態に応じて、異なる階層間のコミュニティの親子関係が導出される。
1 情報処理装置、10 ネットワーク情報、11 入力部、12 解像度、13 制御部、14 記憶部、15 表示部、130 ネットワーク情報取得部、131 第1階層コミュニティ生成部、131a 分類割合算出部、131b 重要度算出部、131c 帰属度算出部、132 第2階層コミュニティ生成部、132a 分類割合更新部、132b 重要度更新部、132c 帰属度更新部、132d 重要度変化算出部、132e 重要度変化判定部、132f 解像度取得部、132g 安定解像度算出部、133 依存度算出部、134 独立部分判定部、135 コミュニティ修正部。

Claims (9)

  1. リンクで結ばれる注目ノード及び隣接ノードを含むネットワーク情報を取得するネットワーク情報取得手段と、
    前記ネットワーク情報の予め定められた数の複数のコミュニティそれぞれに前記注目ノードが分類される分類割合を、前記複数のコミュニティそれぞれに前記隣接ノードが分類される分類割合と、所与の解像度に応じた相関を有するようにして算出する分類割合算出手段と、
    前記解像度の第1の値に応じて算出された、前記注目ノードに関する前記分類割合から、前記注目ノードが属する、前記ネットワーク情報の1以上の第1種コミュニティを生成する第1種コミュニティ生成手段と、
    前記注目ノードに関する前記分類割合を、前記複数のコミュニティそれぞれに前記隣接ノードが分類される分類割合と、前記解像度の第2の値に応じた相関を有するようにして更新する分類割合更新手段と、
    前記分類割合更新手段により更新された前記注目ノードに関する前記分類割合から、前記注目ノードが属する、前記ネットワーク情報の1以上の第2種コミュニティを生成する第2種コミュニティ生成手段と、
    を備える情報処理装置。
  2. 前記1以上の第2種コミュニティのうち1つの上層コミュニティが、前記1以上の第1種コミュニティのうち1つの下層コミュニティに依存する割合を示す依存度を、前記上層コミュニティに分類される1以上の前記ノードと、前記下層コミュニティに分類される1以上の前記ノードとの重複が多いほど大きくなるように算出する依存度算出手段をさらに備える
    請求項1に記載の情報処理装置。
  3. 前記複数のコミュニティのうち1つのコミュニティの重要度を、前記複数のコミュニティ全体に対して当該1つのコミュニティが占める割合が大きいほど大きな値となるように、前記分類割合算出手段により算出された前記分類割合を用いて算出する重要度算出手段と、
    前記分類割合更新手段により更新された前記分類割合を用いて前記重要度算出手段により算出された前記重要度を更新する重要度更新手段と、
    前記重要度更新手段により更新された前記重要度の、更新前後の変化の量を算出する重要度変化算出手段と、
    前記重要度変化算出手段により算出された変化の量が予め定められた量よりも大きいか否かを判定する重要度変化判定手段と、
    をさらに備える請求項2に記載の情報処理装置。
  4. 前記重要度変化判定手段により前記重要度の変化の量が予め定められた量よりも大きいと判定された場合における前記解像度の値を取得する解像度取得手段と、
    前記解像度取得手段により取得された2つの前記解像度の値の間の値を有する安定解像度を算出する安定解像度算出手段と、をさらに備え、
    前記依存度算出手段は、前記安定解像度を用いて、前記依存度を算出する
    請求項3に記載の情報処理装置。
  5. 前記安定解像度算出手段は、前記解像度取得手段により取得された2つの前記解像度の値の中点の値を前記安定解像度として算出する
    請求項4に記載の情報処理装置。
  6. 前記分類割合算出手段は、逐次計算により、前記分類割合を算出し、
    前記分類割合更新手段は、前記分類割合算出手段による逐次計算の回数よりも少ない回数の逐次計算により、前記第1の分類割合を前記第2の分類割合に更新する
    請求項1乃至5のいずれか1項に記載の情報処理装置。
  7. 前記分類割合更新手段による更新の前に、前記1以上の第1種コミュニティのうち少なくとも1つが、2以上の独立した部分を含むか否かを判定する独立部分判定手段と、
    前記独立部分判定手段により、前記1以上の第1種コミュニティのうち少なくとも1つが、2以上の独立した部分を含むと判定される場合に、当該2以上の独立した部分が2以上の第1種コミュニティとなるように前記1以上の第1種コミュニティを修正するコミュニティ修正手段と、
    をさらに備える請求項1乃至6のいずれか1項に記載の情報処理装置。
  8. 前記第1種コミュニティ生成手段及び前記第2種コミュニティ生成手段は、2以上の前記第1種コミュニティ及び2以上の前記第2種コミュニティをそれぞれ生成する
    請求項1乃至7のいずれか1項に記載の情報処理装置。
  9. 情報処理装置に備えられたコンピュータを、
    リンクで結ばれる注目ノード及び隣接ノードを含むネットワーク情報を取得するネットワーク情報取得手段、
    前記ネットワーク情報の予め定められた数の複数のコミュニティそれぞれに前記注目ノードが分類される分類割合を、前記複数のコミュニティそれぞれに前記隣接ノードが分類される分類割合と、所与の解像度に応じた相関を有するようにして算出する分類割合算出手段、
    前記解像度の第1の値に応じて算出された、前記注目ノードに関する前記分類割合から、前記注目ノードが属する、前記ネットワーク情報の1以上の第1種コミュニティを生成する第1種コミュニティ生成手段、
    前記注目ノードに関する前記分類割合を、前記複数のコミュニティそれぞれに前記隣接ノードが分類される分類割合と、前記解像度の第2の値に応じた相関を有するようにして更新する分類割合更新手段、
    前記分類割合更新手段により更新された前記注目ノードに関する前記分類割合から、前記注目ノードが属する、前記ネットワーク情報の1以上の第2種コミュニティを生成する第2種コミュニティ生成手段、
    として機能させるプログラム。
JP2015099520A 2015-05-14 2015-05-14 情報処理装置及びプログラム Active JP6511951B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2015099520A JP6511951B2 (ja) 2015-05-14 2015-05-14 情報処理装置及びプログラム
US14/918,915 US10558918B2 (en) 2015-05-14 2015-10-21 Information processing apparatus and non-transitory computer readable medium
SG10201509496XA SG10201509496XA (en) 2015-05-14 2015-11-18 Information processing apparatus and program
AU2015268671A AU2015268671B2 (en) 2015-05-14 2015-12-11 Information processing apparatus and program
EP16153080.3A EP3094065A1 (en) 2015-05-14 2016-01-28 Information processing apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015099520A JP6511951B2 (ja) 2015-05-14 2015-05-14 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2016218531A true JP2016218531A (ja) 2016-12-22
JP6511951B2 JP6511951B2 (ja) 2019-05-15

Family

ID=55456563

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015099520A Active JP6511951B2 (ja) 2015-05-14 2015-05-14 情報処理装置及びプログラム

Country Status (5)

Country Link
US (1) US10558918B2 (ja)
EP (1) EP3094065A1 (ja)
JP (1) JP6511951B2 (ja)
AU (1) AU2015268671B2 (ja)
SG (1) SG10201509496XA (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019040285A (ja) * 2017-08-23 2019-03-14 富士ゼロックス株式会社 情報処理装置およびプログラム
US10623270B2 (en) 2017-02-03 2020-04-14 Fuji Xerox Co., Ltd. Non-transitory computer readable medium, image processing apparatus, and image processing method
US11068525B2 (en) 2017-02-27 2021-07-20 Fujifilm Business Innovation Corp. Non-transitory computer readable medium, information processing apparatus, and information processing method

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170323028A1 (en) * 2016-05-04 2017-11-09 Uncharted Software Inc. System and method for large scale information processing using data visualization for multi-scale communities
US10635939B2 (en) * 2018-07-06 2020-04-28 Capital One Services, Llc System, method, and computer-accessible medium for evaluating multi-dimensional synthetic data using integrated variants analysis
JP6852141B2 (ja) * 2018-11-29 2021-03-31 キヤノン株式会社 情報処理装置、撮像装置、情報処理装置の制御方法、および、プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008077403A (ja) * 2006-09-21 2008-04-03 Ntt Data Corp 評価装置、評価方法及び評価プログラム
JP2013196070A (ja) * 2012-03-16 2013-09-30 Kddi Corp 投稿者のプロフィール情報を分析する投稿者分析装置、プログラム及び方法
US20150100574A1 (en) * 2013-10-07 2015-04-09 Facebook, Inc. Systems and methods for mapping and routing based on clustering

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1330786A4 (en) 2000-09-20 2008-08-27 Nik Software Inc DIGITAL IMAGE FEEDBACK SYSTEM
US7154631B2 (en) 2001-05-10 2006-12-26 Hewlett-Packard Development Company, L.P. System and method for selecting a paper size for printing an image file
JP4146109B2 (ja) 2001-07-16 2008-09-03 株式会社東芝 知識蓄積支援システムおよび同システムにおけるメッセージ階層表示設定方法
US7975035B2 (en) * 2003-12-01 2011-07-05 International Business Machines Corporation Method and apparatus to support application and network awareness of collaborative applications using multi-attribute clustering
US20050213119A1 (en) 2004-03-26 2005-09-29 Lexmark International, Inc. Processing print jobs according to size of to-be-printed objects and bands containing same
JP2010004229A (ja) 2008-06-19 2010-01-07 SBI Robo株式会社 電話帳管理システム、電話帳管理方法及び電話帳管理サーバ
JP5499732B2 (ja) * 2009-06-23 2014-05-21 ソニー株式会社 生体サンプル像取得装置、生体サンプル像取得方法及び生体サンプル像取得プログラム
US8733874B2 (en) 2009-06-23 2014-05-27 Canon Kabushiki Kaisha Printing apparatus and image processing method
JP6031278B2 (ja) 2012-07-09 2016-11-24 キヤノン株式会社 情報処理装置及びその制御方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008077403A (ja) * 2006-09-21 2008-04-03 Ntt Data Corp 評価装置、評価方法及び評価プログラム
JP2013196070A (ja) * 2012-03-16 2013-09-30 Kddi Corp 投稿者のプロフィール情報を分析する投稿者分析装置、プログラム及び方法
US20150100574A1 (en) * 2013-10-07 2015-04-09 Facebook, Inc. Systems and methods for mapping and routing based on clustering

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
岡本 洋: "脳ネットワークからの重なりと階層を持つコミュニティ構造の抽出", 第10回NEシンポ合宿 予稿集, JPN6019008483, 3 September 2013 (2013-09-03), JP, pages 1 - 2, ISSN: 0003995177 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10623270B2 (en) 2017-02-03 2020-04-14 Fuji Xerox Co., Ltd. Non-transitory computer readable medium, image processing apparatus, and image processing method
US11068525B2 (en) 2017-02-27 2021-07-20 Fujifilm Business Innovation Corp. Non-transitory computer readable medium, information processing apparatus, and information processing method
JP2019040285A (ja) * 2017-08-23 2019-03-14 富士ゼロックス株式会社 情報処理装置およびプログラム

Also Published As

Publication number Publication date
US10558918B2 (en) 2020-02-11
SG10201509496XA (en) 2016-12-29
AU2015268671A1 (en) 2016-12-01
US20160335545A1 (en) 2016-11-17
AU2015268671B2 (en) 2017-06-29
EP3094065A1 (en) 2016-11-16
JP6511951B2 (ja) 2019-05-15

Similar Documents

Publication Publication Date Title
JP2016218531A (ja) 情報処理装置及びプログラム
Cai et al. Using crowdsourced data in location-based social networks to explore influence maximization
CN109408734B (zh) 一种融合信息熵相似度与动态信任的协同过滤推荐方法
CN103106279B (zh) 一种同时基于节点属性以及结构关系相似度的聚类方法
US10482482B2 (en) Predicting behavior using features derived from statistical information
US8572017B2 (en) User-based collaborative filtering recommendation system and method for amending similarity using information entropy
Lo et al. Temporal matrix factorization for tracking concept drift in individual user preferences
US10956454B2 (en) Probabilistically generated identity database system and method
CN110704739A (zh) 资源推荐方法、装置及计算机存储介质
Abualigah et al. Feature selection with β-hill climbing search for text clustering application
CN104050258A (zh) 一种基于兴趣群组的群体推荐方法
JP6390239B2 (ja) 情報処理装置、及びプログラム
CN109903138B (zh) 一种个性化商品推荐方法
Shi et al. A social sensing model for event detection and user influence discovering in social media data streams
CN109951377A (zh) 一种好友分组方法、装置、计算机设备和存储介质
CN109241442B (zh) 基于预测值填充的项目推荐方法、可读存储介质和终端
CN104699804A (zh) 一种基于基因表达式编程的n中心点分类方法
Ban et al. Micro-directional propagation method based on user clustering
US20150169794A1 (en) Updating location relevant user behavior statistics from classification errors
You et al. QoS evaluation for web service recommendation
CN110457592A (zh) 一种基于图熵的社交网络推荐方法
CN108228896B (zh) 一种基于密度的缺失数据填补方法及装置
CN106651461A (zh) 基于灰理论的电影个性化推荐方法
Ishioka Imputation of missing values for unsupervised data using the proximity in random forests
KR101708440B1 (ko) 분산 환경에서 lda 및 능동 학습 기법을 융합한 적응형 아이템 추천 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190325

R150 Certificate of patent or registration of utility model

Ref document number: 6511951

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350