JP6511971B2 - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP6511971B2
JP6511971B2 JP2015114781A JP2015114781A JP6511971B2 JP 6511971 B2 JP6511971 B2 JP 6511971B2 JP 2015114781 A JP2015114781 A JP 2015114781A JP 2015114781 A JP2015114781 A JP 2015114781A JP 6511971 B2 JP6511971 B2 JP 6511971B2
Authority
JP
Japan
Prior art keywords
event
time
nodes
community
network information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015114781A
Other languages
English (en)
Other versions
JP2017004098A (ja
Inventor
岡本 洋
洋 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2015114781A priority Critical patent/JP6511971B2/ja
Priority to US14/947,232 priority patent/US10362102B2/en
Priority to SG10201600054RA priority patent/SG10201600054RA/en
Priority to AU2016200128A priority patent/AU2016200128B2/en
Priority to EP16153031.6A priority patent/EP3101925A1/en
Publication of JP2017004098A publication Critical patent/JP2017004098A/ja
Application granted granted Critical
Publication of JP6511971B2 publication Critical patent/JP6511971B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/20Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
    • H04W4/21Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel for social networking applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は情報処理装置及びプログラムに関する。
従来、ベクトル型データについていわゆるコミュニティ(クラスタ)分解を行い、大域的特徴を解析する場合があった。コミュニティ分解は、ノードと、ノードを結ぶリンクとを含むネットワーク型データ(ネットワーク情報)に対して行われる場合もある。
下記特許文献1には、作業者に装着されるセンサデバイスに割り当てられた識別子及び二人以上の作業者が対面した時刻から、会合に参加した二人以上の作業者からなるグループをコミュニティとして特定するセンサネットワークシステムが記載されている。
下記特許文献2には、転送又は返信の電子メールの情報に基づき、電子メールを転送する関係にあるユーザ群を1つのコミュニティとするプログラムが記載されている。
下記特許文献3には、同一文書に対するアクセスを実行した異なるユーザを、コミュニティ関係を有するユーザとして選択抽出するコミュニティ分析装置が記載されている。
特開2012−027589号公報 特開2005−244647号公報 特開2007−102657号公報
ネットワーク情報は、イベントによりノード間がリンクで結ばれることにより、時間的に内容が変化する場合がある。例えば、互いに引用関係を有する複数の文書データに対して、複数のユーザがアクセスする場合、アクセスというイベント毎に文書データとユーザとの間にリンクが形成され、時間的に内容が変化するネットワーク情報が構成される。また、複数のユーザのネットワークにおいて、ユーザが互いに電子メールを送受信する場合、電子メールの送受信というイベントが発生した時にユーザ間にリンクが形成され、時間的に内容が変化するネットワーク情報が構成される。
時間的に内容が変化するネットワーク情報について、コミュニティを生成する方法が研究されている。例えば、ネットワーク情報を一定時間間隔でスライスして、各スライス時点におけるネットワーク情報と、各スライス間のリンクとを取得してコミュニティを生成することが考えられる。
しかしながら、ネットワーク情報をスライスしてコミュニティ生成を行う方法では、ネットワーク情報を一定時間間隔でスライスするため、より良い精度でコミュニティ生成を行おうとしてスライス間隔を狭くすると、イベントの発生回数とは無関係に計算量が増大する。
そこで、本発明は、内容が時間的に変化するネットワーク情報のコミュニティ生成を、イベントの発生回数に応じた計算量で行う情報処理装置及びプログラムの提供を目的とする。
上記課題を解決するために、請求項1に記載の情報処理装置は、複数のイベントノードと、前記複数のイベントノードのうちイベントに関与した一対のイベントノードを結ぶイベントリンクと、を含む第1ネットワーク情報を取得する第1ネットワーク情報取得手段と、前記複数のイベントノード及び複数の時刻ノードと、前記一対のイベントノードと前記イベントのあった時刻を示す前記時刻ノードをそれぞれ結ぶ少なくとも2本の時刻リンクと、を含む第2ネットワーク情報を取得する第2ネットワーク情報取得手段と、前記第1ネットワーク情報について、前記複数のイベントノード間を前記イベントリンクに沿って移動する場合における確率分布を用いて、前記複数のイベントノードが属する第1コミュニティを1以上生成する第1コミュニティ生成手段と、前記第2ネットワーク情報について、前記複数のイベントノード及び前記複数の時刻ノードからなるノード群を前記時刻リンクに沿って移動する場合における確率分布を用いて、前記複数のイベントノード及び前記複数の時刻ノードが属する第2コミュニティを1以上生成する第2コミュニティ生成手段と、を備える。
また、請求項2に記載の情報処理装置は、前記複数のイベントノードのうち1の前記第2コミュニティに属する1以上の注目ノードについて、前記1以上の注目ノードが属する前記第1コミュニティが2以上ある場合に、当該1の前記第2コミュニティを、当該2以上の前記第1コミュニティに従って2以上に分解するコミュニティ分解手段をさらに備える。
また、請求項3に記載の情報処理装置は、前記第2ネットワーク情報は、前記イベントのあった時刻を示す前記時刻ノードと、他の前記時刻ノードとを結び、前記イベントのあった時刻から遠ざかるほど小さくなる重みを有する時間相関リンクをさらに含み、前記第2コミュニティ生成手段は、前記ノード群を前記時刻リンク及び前記時間相関リンクに沿って移動する場合における確率分布を用いて、前記複数のイベントノード及び前記複数の時刻ノードが属する第2コミュニティを1以上生成する。
また、請求項4に記載の情報処理装置は、前記重みは、前記イベントのあった時刻と相関のある時間範囲を示す相関長パラメータを含む関数により定められる。
また、請求項5に記載の情報処理装置は、前記第2ネットワーク情報は、前記一対のイベントノードと、前記イベントのあった時刻を示す前記時刻ノード及び前記イベントのあった時刻と相関のある時間範囲を示す前記時刻ノードと、をそれぞれ結ぶ偶数本の時間相関時刻リンクを含む。
また、請求項6に記載の情報処理装置は、前記第1コミュニティ生成手段及び前記第2コミュニティ生成手段は、互いの計算結果を用いて交互に逐次計算を行うことにより、第1コミュニティ及び第2コミュニティをそれぞれ生成する。
また、請求項7に記載のプログラムは、情報処理装置に備えられたコンピュータを、複数のイベントノードと、前記複数のイベントノードのうちイベントに関与した一対のイベントノードを結ぶイベントリンクと、を含む第1ネットワーク情報を取得する第1ネットワーク情報取得手段、前記複数のイベントノード及び複数の時刻ノードと、前記一対のイベントノードと前記イベントのあった時刻を示す前記時刻ノードをそれぞれ結ぶ少なくとも2本の時刻リンクと、を含む第2ネットワーク情報を取得する第2ネットワーク情報取得手段、前記第1ネットワーク情報について、前記複数のイベントノード間を前記イベントリンクに沿って移動する場合における確率分布を用いて、前記複数のイベントノードが属する第1コミュニティを1以上生成する第1コミュニティ生成手段、前記第2ネットワーク情報について、前記複数のイベントノード及び前記複数の時刻ノードからなるノード群を前記時刻リンクに沿って移動する場合における確率分布を用いて、前記複数のイベントノード及び前記複数の時刻ノードが属する第2コミュニティを1以上生成する第2コミュニティ生成手段、として機能させる。
請求項1及び7に記載の発明によれば、内容が時間的に変化するネットワーク情報のコミュニティ生成を、イベントの発生回数に応じた計算量で行う情報処理装置及びプログラムが得られる。
請求項2に記載の発明によれば、時間的に重複した範囲に複数のコミュニティが生成される情報処理装置が得られる。
請求項3に記載の発明によれば、イベントの影響が及ぶ時間的範囲にコミュニティが生成される情報処理装置が得られる。
請求項4に記載の発明によれば、イベントの影響が及ぶ時間的範囲を単一のパラメータによって調整する情報処理装置が得られる。
請求項5に記載の発明によれば、リンクの種類を増やすこと無く、イベントの影響が及ぶ時間的範囲にコミュニティが生成される情報処理装置が得られる。
請求項6に記載の発明によれば、精度を逐次向上させてコミュニティを生成する情報処理装置が得られる。
本発明の実施形態に係る情報処理装置の機能ブロック図である。 本発明の実施形態に係る情報処理装置に取得される第1ネットワーク情報の例を示す図である。 本発明の実施形態に係る情報処理装置に取得される第2ネットワーク情報の例を示す図である。 本発明の実施形態に係る情報処理装置に取得される第2ネットワーク情報の時間相関リンクの例を示す図である。 本発明の実施形態に係る情報処理装置に取得される第2ネットワーク情報の時間相関時刻リンクの例を示す図である。 本発明の実施形態に係る情報処理装置における、第1コミュニティ生成のフローチャートである。 本発明の実施形態に係る情報処理装置における、第2コミュニティ生成のフローチャートである。 本発明の実施形態に係る情報処理装置により算出された第2重要度と第2分類割合の積のうちイベントノード[n]についての値を示すグラフである。 本発明の実施形態に係る情報処理装置により算出された第2重要度と第2分類割合の積の値を示すグラフである。 本発明の実施形態に係る情報処理装置により分解された第2コミュニティを示すグラフである。
以下、本発明の実施の形態について、図面を参照しながら説明する。
図1は、本発明の実施形態に係る情報処理装置1の構成図である。情報処理装置1は、第1ネットワーク情報100、第2ネットワーク情報110、解像度13、相関長パラメータ14及びリンク重み15を取得し、入力部12、制御部16、記憶部17及び表示部18を含む。
記憶部17は、例えばRAM(Random Access Memory)やROM(Read Only Memory)を含む。記憶部17は、制御部16が実行するプログラムを格納するとともに、制御部16のワークメモリとしても機能する。なお、記憶部17に格納される制御部16が実行するプログラムは、電気通信回線を介して提供されるものであってもよいし、半導体記憶素子等のコンピュータで読み取り可能な情報記憶媒体に格納されて提供されるものであってもよい。
第1ネットワーク情報100は、複数のイベントノードと、複数のイベントノードのうちイベントに関与した一対のイベントノードを結ぶイベントリンクと、を含む。第1ネットワーク情報100は、例えば組織における人物の所属関係のデータ、友人関係のデータ等であってよい。友人関係のデータが第1ネットワーク情報100である場合、イベントノードは人物に対応し、イベントリンクは人物間における連絡(電子メールの送受信等)に対応する。第1ネットワーク情報100は、少なくともイベントノード間の結び付きの関係(イベントノードとイベントリンクの関係)を示すものであればよく、イベントノードが含む具体的な内容(人物名等)を示すものでなくてもよい。
第2ネットワーク情報110は、複数のイベントノード及び複数の時刻ノードと、複数のイベントノードのうちイベントに関与した一対のイベントノードとイベントのあった時刻を示す時刻ノードをそれぞれ結ぶ少なくとも2本の時刻リンクと、を含む。第2ネットワーク情報100は、第1ネットワーク情報100を包含するネットワーク情報であり、イベントノードの他に時刻ノードを含む。時刻ノードは、イベントのあった時刻を表すために用いられるノードである。また、第2ネットワーク情報110は、イベントリンクの他に時刻リンクを含む。時刻リンクは、イベントのあった時刻を示す時刻ノードと、イベントに関与した一対のイベントノードとを結ぶ。例えば、友人関係のデータが第1ネットワーク情報100である場合、人物間において連絡があると、連絡のあった時刻に対応する時刻ノードと連絡に関与した人物に対応する一対のイベントノードとの間に時刻リンクが形成される。このように、本実施形態に係る情報処理装置1は、時刻ノード及び時刻リンクを含む第2ネットワーク情報110を取得することで、内容が時間的に変化するネットワーク情報を扱うこととなる。
入力部12は、例えばキーボードやマウス等であり、ユーザの指示を制御部16に伝達する。解像度13は、正の実数であって、情報処理装置1によって第1ネットワーク情報100及び第2ネットワーク情報110よりコミュニティを生成する場合に、コミュニティの大きさを定めるパラメータである。
制御部16は、例えばCPU(Central Processing Unit)を含んでおり、記憶部17に格納されるプログラムを実行することにより、情報処理装置1の全体を制御する。制御部16は、機能的に、第1ネットワーク情報取得部160、第1コミュニティ生成部161、第2ネットワーク情報取得部162及び第2コミュニティ生成部163を含む。ここで、第1コミュニティ生成部161は、第1分類割合算出部161a、第1重要度算出部161b及び第1帰属度算出部161cを含む。また、第2コミュニティ生成部163は、第2分類割合算出部163a、第2重要度算出部163b、第2帰属度算出部163c及びコミュニティ分解部163dを含む。制御部16の行う制御については、後に詳細に説明する。
記憶部17は、例えばRAM(Random Access Memory)やROM(Read Only Memory)を含んで構成される。記憶部17は、制御部16が実行するプログラムを格納するとともに、制御部16のワークメモリとしても機能する。なお、記憶部17に格納される制御部16が実行するプログラムは、電気通信回線を介して提供されるものであってもよいし、半導体記憶素子等のコンピュータで読み取り可能な情報記憶媒体に格納されて提供されるものであってもよい。表示部18は、制御部16により処理された情報をユーザに表示するものであり、例えば液晶表示装置である。
なお、第1ネットワーク情報100、第2ネットワーク情報110、解像度13、相関長パラメータ14及びリンク重み15は、入力部12によりユーザによって入力されるものであってもよいし、記憶部17に格納されるものであってもよいし、電気通信回線を介して提供されるものであってもよい。
図2は、本発明の実施形態に係る情報処理装置1に取得される第1ネットワーク情報100の例を示す図である。本例の第1ネットワーク情報100は、7つのイベントノード101と、6つのイベントリンク102を含むものである。各イベントノード101には、1から7までのイベントノード番号が付与されており、例えばイベントノード番号1であるノード(以下、イベントノード[1]と表す)は、イベントノード[2]とイベントリンクで結ばれている。本実施形態では、説明を簡明にするため7つのイベントノードを有する第1ネットワーク情報100の例を示すが、イベントノード数及びイベントリンク数はこれより多くてもよく、例えば10万程度であってもよい。本例の第1ネットワーク情報100では、イベントノード間を結ぶイベントリンクは方向を持たないこととしているが、イベントリンクは一方通行であってもよい。なお、同図には、第2ネットワーク情報に含まれる時刻ノード及び時刻リンクを破線で示している。第2ネットワーク情報については、次図において詳細に説明する。
図3は、本発明の実施形態に係る情報処理装置1に取得される第2ネットワーク情報110の例を示す図である。本例の第2ネットワーク情報110は、7つのイベントノード101と、6つの時刻ノード111と、11の時刻リンクと、を含むものである。各イベントノード101には、1から7までのイベントノード番号が付与されており、各時刻ノード111には、AからFまでの記号が付与されている。同図には、時間の進行方向を示す矢印が表されており、時刻ノード111は、時刻ノード[A]が最も過去の時刻を表す時刻ノード111であり、時刻ノード[A]〜[F]は時間順に並んでいる。例えば、時刻ノード[A]は、2015年5月1日に対応するノードであり、時刻ノード[B]〜[F]は、2015年5月2日〜2015年5月6日の各日に対応するものであってよい。また、各ノードは日ではなく、月や時分秒に対応するものであってもよいし、時刻ノード111の対応する時刻の時間間隔は等間隔でなくてもよい。なお、同図には、第1ネットワーク情報100に含まれるイベントリンクを破線で示している。
第2ネットワーク情報110に含まれる時刻リンク112は、イベントノード101と時刻ノード111とを結び、イベントの発生した時刻を示すものである。例えば、本例では、時刻リンク[A]と、イベントノード[3]及び[4]とは、それぞれ時刻リンク112で結ばれている。これにより、イベントノード[3]と[4]の関与したイベントが時刻ノード[A]で示される時刻に発生したという情報を表している。同様に、イベントノード[5]と[7]の関与したイベントが時刻ノード[B]で示される時刻に発生し、イベントノード[6]と[7]の関与したイベントが時刻ノード[C]で示される時刻に発生し、イベントノード[1]と[2]の関与したイベントが時刻ノード[E]で示される時刻に発生したことが読み取れる。また、時刻ノード[F]で示される時刻には、イベントノード[1]と[4]の関与したイベントと、イベントノード[4]と[5]の関与したイベントとが発生したことが読み取れる。
時刻リンク112は、イベントリンク102の重みを1としたとき、それに対してリンク重み15により定められる重みωを有する。ここで、ωは0より大きい実数である。なお、ωは1以上であってもよい。これにより、後述する第1コミュニティ生成部161と第2コミュニティ生成部163による交互の逐次計算において、イベントリンク102に対する時刻リンク112の影響の大きさを調整することができる。
第2ネットワーク情報110は、時刻リンク112を含むことで、イベントの発生した時刻を記録する。ここで、イベントは、時間相関をもって発生する場合がある。例えば、人物間の電子メールの送受信というイベントによりネットワーク情報が形成される場合、1通の電子メールが送信されると、返信メールが一定期間やり取りされることが予想される。このように、1つのイベントに起因して、ある時間範囲に集中してイベントが発生する状況を扱うため、第2ネットワーク情報110は、時刻ノード111同士を結ぶ時間相関リンクを含んでもよい。又は、第2ネットワーク情報110は、イベントノード101と時刻ノード111を結ぶ時刻リンク112に付随する時間相関時刻リンクを含んでもよい。時間相関リンクについては、次図において詳細に説明する。また、時間相関時刻リンクについては、図5において詳細に説明する。
図4は、本発明の実施形態に係る情報処理装置1に取得される第2ネットワーク情報110の時間相関リンク113の例を示す図である。同図では、説明を簡明にするため、図3に示す第2ネットワーク情報110に含まれるノードのうち、イベントノード[6]及び[7]、並びに時刻ノード[A]乃至[F]を示している。イベントノード[6]及び[7]と、時刻ノード[C]とは、それぞれ時刻リンク112で結ばれており、当該イベントが時刻ノード[C]で示される時刻に発生したことを表している。さらに、同図には、当該イベントのあった時刻を示す時刻ノード[C]と、他の時刻ノード[A]、[B]、[D]及び[E]とを結び、当該イベントのあった時刻から遠ざかるほど小さくなる重みを有する時間相関リンク113が表され、当該イベントと時間相関のある時間範囲を示している。時間相関は、イベントのあった時刻から遠ざかるほど小さくなるため、時間相関リンク113は、イベントのあった時刻を示す時刻ノード[C]から遠い時刻ノードを結ぶものほど小さい重みを有する。なお、同図に示す例では、時間相関リンク113が、イベントのあった時刻を示す時刻ノード[C]を中心に対称に設けられているが、時間相関リンク113は、イベントのあった時刻を示す時刻ノードを中心に非対称に設けてもよい。例えば、時間相関リンクを、イベントのあった時刻より前の時刻を示す時刻ノードとの間にのみ設けてもよい。イベントのあった時刻より前の時刻を示す時刻ノードとの間にのみ時間相関リンク113を設けることにより、イベントの因果関係を表すことができる。このように、時間相関リンク113を含む第2ネットワーク情報110を取得することで、イベントの影響が及ぶ時間的範囲にコミュニティが生成される。
時間相関リンク113の重みは、イベントのあった時刻と相関のある時間範囲を示す相関長パラメータτを含む関数により定められる。本実施形態に係る情報処理装置1では、時刻リンク112の重みを1として、時間相関リンク113の重みを定める関数をexp(−([t]−[e])/2τ)で与える。ここで、([t]−[e])は、注目する時刻ノード[t]とイベントが発生した時刻を示す時刻ノード[e]との時間差を表す。なお、上記の関数を定数倍した関数を、重みを定める関数としてもよいし、異なる関数を採用してもよい。例えば、イベントのあった時刻から遠ざかるに従って線形に重みが小さくなり、イベントのあった時刻を中心に相関長パラメータτの範囲にだけ値を有する関数を用いてもよい。このように、相関長パラメータτを含む関数によって時間相関リンク113の重みを定めることで、イベントと相関のある時間的範囲が単一のパラメータによって調整され、時間相関の取り扱いが容易となる。
図5は、本発明の実施形態に係る情報処理装置1に取得される第2ネットワーク情報110の時間相関時刻リンク114の例を示す図である。同図では、説明を簡明にするため、図3に示す第2ネットワーク情報110に含まれるノードのうち、イベントノード[6]及び[7]、並びに時刻ノード[A]乃至[F]を示している。イベントノード[6]及び[7]と、時刻ノード[C]とは、それぞれ時刻リンク112で結ばれており、イベントノ当該イベントが時刻ノード[C]で示される時刻に発生したことを表している。さらに、同図には、イベントに関与した一対のイベントノード[6]及び[7]と、イベントのあった時刻を示す時刻ノード[C]及びイベントのあった時刻と相関のある時間範囲を示す時刻ノード(時刻ノード[A]及び[B])と、をそれぞれ結ぶ偶数本の時間相関時刻リンク114を示している。時間相関時刻リンク114は、時刻ノード[A]及び[B]についてそれぞれ2本あり、時刻ノード[C]で示される時刻に発生したイベントと相関のある時間範囲は、時刻ノード[A]及び[B]で示される時刻であることを表している。なお、同図では、イベントのあった時刻より前の時刻を示す時刻ノードとの間に時間相関時刻リンク114を設ける例を示しているが、時間相関時刻リンク114は、イベントのあった時刻より後の時刻を示す時刻ノードとの間に設けられてもよい。また、時間相関時刻リンク114の重みとして、イベントのあった時刻から遠ざかるほど小さくなる重みを与えることとしてもよい。このように、時間相関時刻リンク114を導入することで、時刻リンク112以外にリンクの種類を増やすこと無く、イベントの影響が及ぶ時間的範囲にコミュニティが生成される。
図6は、本発明の実施形態に係る情報処理装置1における、第1コミュニティ生成のフローチャートである。本実施形態に係る第1コミュニティ生成部161は、第1ネットワーク情報100について、複数のイベントノード101間をイベントリンク102に沿って移動する場合における確率分布を用いて、複数のイベントノード101が属する第1コミュニティを1以上生成する。以下、第1コミュニティ生成部161による第1コミュニティ生成の流れを詳細に説明する。
はじめに、第1コミュニティ生成部161は、第1ネットワーク情報取得部160により、第1ネットワーク情報100を取得する(S1)。次に、第1ネットワーク情報100に含まれるイベントノード101間をイベントリンク102に沿って移動する場合における第1定常確率分布pst(I)(n)を算出する(S2)。第1定常確率分布pst(I)(n)は、E個のイベントノード101間をイベントリンクに沿ってランダムに遷移する場合における定常確率分布である。第1定常確率分布pst(I)(n)は、以下の数式(1)で定められる連立E次方程式を解くことにより求められる。定常確率分布pst(I)(n)は、行列T(I)の固有ベクトルであって、固有値が1のものである。
Figure 0006511971
ここで、行列T(I)は、イベントノード101間をイベントリンク102に沿ってランダムに遷移する場合における遷移確率を表すものである。図2に示す第1ネットワーク情報100の例により説明すると、イベントノード[1]を起点としてイベントリンク102に沿ってランダムに他のイベントノードに遷移する場合、1/2の確率でイベントノード[2]に遷移し、1/2の確率でイベントノード[4]に遷移する。これらの遷移確率をまとめて表したものが、行列T(I)の第1列である。他の行列要素についても同様に構成されている。一般に、イベントノード[n]とイベントノード[m]がイベントリンクで接続されている場合にAnm=1、イベントノード[n]とイベントノード[m]がイベントリンクで接続されていない場合にAnm=0となる行列Aを用いて、ノードの総数をNとする場合に、行列T(I)は、T(I) nm=Anm/Σsmで定義される。遷移確率の総和は1であるから、任意のイベントノード[m]について、Σ(I) nm=1が成り立つ。
いわゆるランクシンク等の問題が懸念され、定常確率分布の値が特定のノードに集中するおそれがある場合、数式(1)を変形し、例えば、pst(I)(n)=(1−r)Σ(I) nmst(I)(m)+rという関係によって第1定常確率分布pst(I)(n)を求めることとしてもよい。ここで、rは0以上1以下の実数である。rは、イベントノード間をイベントリンクに沿わずにランダムに遷移する確率を表す。
次に、複数のイベントノード間を複数のイベントリンクに沿ってランダムに遷移する場合に通過するイベントノードを示す複数の第1通過情報τ (I)(d)を生成する(S3)。本実施形態では、第1通過情報は、第1定常確率分布pst(I)(n)に従って選出されたイベントノード[n]についてτ (I)(d)=1、かつ、イベントノード[n]を起点としてイベントノード[m]に遷移する確率を与えるT(I) mnに従って選出されたイベントノード[m]についてτ (I)(d)=1として生成する。このようなE次元ベクトルを、D回生成する。第1通過情報τ (d)は、Στ (I)(d)=2を満たす量である。第1通過情報τ (I)(d)は、仮想エージェントがイベントノード間をイベントリンクに沿ってランダムに遷移する場合に、仮想エージェントをイベントノード[n]とイベントノード[m]とを結ぶイベントリンク上に見出す場合を表している。
本実施形態に係る第1分類割合算出部161a及び第1重要度算出部161bは、逐次計算により第1分類割合p(I)(n|k)及び第1重要度π(I)(k)をそれぞれ算出する。第1分類割合算出部161aは、第1ネットワーク情報100の予め定められた数の複数のコミュニティそれぞれに注目するイベントノードが分類される分類割合を、複数のコミュニティそれぞれに、注目イベントノードとイベントリンクで結ばれる隣接イベントノードが分類される分類割合と、所与の解像度13に応じた相関を有するようにして算出する。逐次計算を開始するにあたって、p (I)(n|k)、π (I)(k)、γ (I)(d)(k)を仮決めする(S4)。ここで、Σ (I)(n|k)=1、Σπ (I)(k)=1を満たす値を与えるものとする。p (I)(n|k)は、k=1〜Cの成分について、n=1〜Eのイベントノードが分類される割合を示すものであるから、仮決めではC×E−1個の正の実数を与えることになる。また、π (I)(k)は、k=1〜Cに分類されたネットワークのコミュニティについて、重要度を示すものであるから、仮決めではC−1個の正の実数を与えることになる。γ (I)(d)(k)は、複数のコミュニティ全体に対するコミュニティ[k]が占める割合を表す係数であり、d=1〜Dの通過情報τ(I)(d)に対応して定まる係数であるから、仮決めではC×D個の正の実数を与えることになる。
また、本実施形態に係る第1分類割合算出部161a及び第1重要度算出部161bは、ネットワークのコミュニティの大きさを定めるパラメータとして、正の実数αである解像度13を用いる。ここで、αはユーザが自由に定めることのできる値であるが、第1ネットワーク情報100のコミュニティ分類が、十分に細かくなるような値を設定することが望ましい。
逐次計算の第1ステップでは、第t回目の逐次計算による分類割合p(n|k)を計算する(S5)。ここで、tは正の整数であり、逐次計算の回数を表す。p(n|k)は、1つ前の逐次計算により得られるpt−1(n|k)、πt−1(k)、及びγt−1 (d)(k)より算出される。例えば、仮決め(S3)の後行われる第一回目の逐次計算では、p (I)(n|k)、π (I)(k)、及びγ (I)(d)(k)を用いてp(n|k)を求めることになる。
本実施形態に係る第1分類割合算出部161aは、以下の数式(2)で定められる関係により第t回目の逐次計算による分類割合p(n|k)を算出する(S5)。
Figure 0006511971
本実施形態では、解像度13は、αが0に近付くほどコミュニティ分解の粒度が細かくなり、αが無限大に近付くほどコミュニティ分解の粒度が粗くなるパラメータである。また、Dt−1(k)はγt−1 (d)(k)から定まる係数であり、Dt−1(k)=Σγt−1 (d)(k)である。
分類割合p(n|k)は、イベントノード[n]とイベントリンクで結ばれるイベントノード(T(I) nm≠0であるイベントノード[m])のコミュニティ[k]に関する分類割合pt−1(m|k)が大きいほど大きな値となる第1の寄与(右辺第一項)と、複数のコミュニティ全体に対するコミュニティ[k]が占める割合γt−1 (d)(k)が大きいほど大きな値となる第2の寄与(右辺第二項)とから構成される値により算出される。
また、第1の寄与は、解像度13を粗くすると(αを無限大に近付けると)1に近付く第1の係数α/(α+2Dt−1(k))と、イベントノード[n]との間でイベントリンクを有するイベントノード(T(I) nm≠0であるイベントノード[m])に関して直前に算出された分類割合pt−1(m|k)と、から定められる。また、第2の寄与は、解像度13を粗くすると(αを無限大に近付けると)0に近付く第2の係数1/(α+2Dt−1(k))と、複数の第1通過情報τ (I)(d)と、複数のコミュニティ全体に対するコミュニティ[k]が占める割合γt−1 (d)(k)と、から定められる。なお、以下に示すように、複数のコミュニティ全体に対するコミュニティ[k]が占める割合γt−1 (d)(k)は、直前に算出された分類割合pt−1(n|k)及び重要度πt−1(k)から算出される。
次に、直前に算出された分類割合pt−1(n|k)及び重要度πt−1(k)、並びに複数の第1通過情報τ (I)(d)から、複数のコミュニティ全体に対するコミュニティ[k]が占める割合γ (d)(k)を算出する(S6)。本実施形態では、以下の数式(3)により割合γ (d)(k)を算出する。割合γ (d)(k)は、コミュニティ全体の中で重要度が相対的に大きいコミュニティについて大きな値をとる。
Figure 0006511971
さらに、ネットワークのコミュニティ[k]の重要度π(k)を算出する(S7)。重要度π(k)は、複数のコミュニティ全体に対するコミュニティ[k]が占める割合γ (d)(k)が大きいほど大きな値となるように算出される。第1重要度算出部161bは、複数のコミュニティのうち1つのコミュニティ[k]の重要度π(k)を、複数のコミュニティ全体に対して当該1つのコミュニティ[k]が占める割合γ (d)(k)が大きいほど大きな値となるように、第1分類割合算出部161aにより算出された分類割合pt−1(n|k)を用いて算出する。本実施形態では、以下の数式(4)によりコミュニティ[k]の重要度π(k)を算出する。
Figure 0006511971
以上の数式(2)、(3)及び(4)により、直前に算出された分類割合pt−1(n|k)、重要度πt−1(k)及び割合γt−1 (d)(k)、並びに第1通過情報τ (I)(d)から、分類割合p(n|k)、重要度π(k)及び割合γ (d)(k)が算出される。
第1分類割合算出部161a及び第1重要度算出部161bにより行われる逐次計算を終了するか否かは、逐次計算の前後における評価値Qの差の絶対値|Q−Qt−1|が予め定められた基準値εより小さいか否かによって判定される(S8)。本実施形態において、評価値Qは以下の数式(5)で定められる量である。
Figure 0006511971
|Q−Qt−1|<εが成立しない場合、最新の分類割合p(n|k)、重要度π(k)及び割合γ (d)(k)を直前の分類割合、重要度及び割合であるとして更新する(S9)。その後、分類割合pt+1(n|k)を算出する工程(S5)、割合γt+1 (d)(k)を算出する工程(S6)、重要度πt+1(k)を算出する工程(S7)を行い、|Qt+1−Q|<εが成立するか否かを判定する(S8)、という一連の工程を繰り返す。本実施形態に係る第1分類割合算出部161a及び第1重要度算出部161bは、評価値の差の絶対値が予め定められた値より小さくなるまで、以上の工程を繰り返し、逐次計算により第1分類割合及び第1重要度を算出する。これにより、第1ネットワーク情報100のコミュニティ分類が漸近的に行われる。
一方、|Q−Qt−1|<εが成立する場合、イベントノード[n]がコミュニティ[k]に分類される第1分類割合をp(I)(n|k)=p(n|k)により定め、コミュニティ[k]の第1重要度をπ(I)(k)=π(k)により定める(S10)。ここで、添字(I)は、これらの値が第1コミュニティ生成のために用いられる値であることを示す。本実施形態に係る情報処理装置1によれば、予め定められた値εを調整することで、任意の精度で第1分類割合p(I)(n|k)及び第1重要度π(I)(k)を求め、ネットワークのコミュニティ分類を任意の精度で行う。なお、逐次計算の回数を予め定めておき、定められた回数だけ逐次計算を行った場合におけるp(n|k)及びπ(k)の値を、それぞれ第1分類割合p(I)(n|k)及び第1重要度π(I)(k)と決定することとしてもよい。
次に、第1帰属度算出部161cにより、複数のイベントノードそれぞれについて、イベントノード[n]がコミュニティ[k]に分類される第1分類割合p(I)(n|k)が大きいほど、大きな値となるように第1帰属度を算出する(S11)。本実施形態では、イベントノード[n]がコミュニティ[k]に帰属する第1帰属度q(I)(k|n)は、以下の数式(6)によって求められる。
Figure 0006511971
数式(6)から読み取れるように、第1帰属度q(I)(k|n)は、Σ(I)(k|n)=1を満たす量である。すなわち、あるイベントノードが各コミュニティに帰属する第1帰属度の総和は1となる。第1帰属度q(I)(k|n)は、あるイベントノード[n]が、コミュニティ[k]に帰属する度合いをコミュニティ全体に関して相対的に測った量である。
第1コミュニティ生成部161は、解像度13の値αに応じた相関を有するようにして算出された、注目イベントノード[n]に関する第1分類割合p(I)(n|k)から、注目イベントノード[n]が属する、第1ネットワーク情報100の1以上の第1コミュニティを生成する(S12)。第1コミュニティ生成部161は、注目イベントノード[n]がコミュニティ[k]に属する割合を、第1分類割合p(I)(n|k)の値によって定めてよい。また、第1コミュニティ生成部161は、第1分類割合p(I)(n|k)及び第1重要度π(I)(k)から算出される第1帰属度q(I)(k|n)に基づき、注目イベントノード[n]が属する第1コミュニティを生成してもよい。その場合、注目イベントノード[n]がコミュニティ[k]に属する割合を、第1帰属度q(I)(k|n)の値によって定める。いずれの場合も、第1コミュニティ生成部161は、注目イベントノード[n]が属する2以上の第1コミュニティを生成する。そのため、本実施形態に係る第1コミュニティ生成部161によれば、1つのノードが複数の属性を有する場合を表現したコミュニティ分類が行われる。
図7は、本発明の実施形態に係る情報処理装置1における、第2コミュニティ生成のフローチャートである。本実施形態に係る第2コミュニティ生成部163は、第2ネットワーク情報110について、複数のイベントノード101及び複数の時刻ノード111からなるノード群を時刻リンク112に沿って移動する場合における確率分布を用いて、複数のイベントノード101及び複数の時刻ノード111が属する第2コミュニティを1以上生成する。第2コミュニティ生成部163は、ノード群を時刻リンク112及び時間相関リンク113に沿って移動する場合における確率分布を用いて、複数のイベントノード101及び複数の時刻ノード111が属する第2コミュニティを1以上生成してもよい。また、時刻リンク112として、時間相関時刻リンク114が含まれていてもよい。第2コミュニティ生成部163による第2コミュニティ生成の流れは、第1コミュニティ生成部161による第1コミュニティ生成の流れに類似するため、相違点について詳細に説明し、繰返しの説明は省略する。
はじめに、第2コミュニティ生成部163は、第2ネットワーク情報取得部162により、第2ネットワーク情報110を取得する(S21)。次に、第2ネットワーク情報110に含まれる複数のイベントノード101及び複数の時刻ノード111からなるノード群を時刻リンク112に沿って移動する場合における第2定常確率分布pst(II)(N)を算出する(S22)。ここで、図3に示す第2ネットワーク情報110の場合、記号Nは、イベントノード[1]〜[7]を表すN=1〜7と、時刻ノード[A]〜[F]を表すN=8〜13の値を取り得る。第2定常確率分布pst(II)(N)は、E個のイベントノード101及びT個の時刻ノード111からなるノード群を時刻リンク112に沿ってランダムに遷移する場合における定常確率分布である。第2定常確率分布pst(II)(N)は、数式(1)における行列T(I)を行列T(II)に置き換えた関係式により定められる連立(E+T)次方程式を解くことにより求められる。ここで、行列T(II)は、(E+T)×(E+T)行列であり、イベントノード101及び時刻ノード111間を時刻リンク112に沿ってランダムに遷移する場合における遷移確率である。図3に示す第2ネットワーク情報110の例により説明すると、イベントノード[1]を起点として時刻リンク112に沿ってランダムに時刻ノードに遷移する場合、1/2の確率で時刻ノード[E]に遷移し、1/2の確率で時刻ノード[F]に遷移する。これらの遷移確率をまとめて表したものが、行列T(II)の第1列である。また、時刻ノード[A]を起点として時刻リンク112に沿ってランダムにイベントノードに遷移する場合、1/2の確率でイベントノード[3]に遷移し、1/2の確率でイベントノード[4]に遷移する。これらの遷移確率をまとめて表したものが、行列T(II)の第8列である。ここで、任意のノード[N]について、Σ(II) NM=1が成り立つ。
第2ネットワーク情報110が時間相関リンク113を含む場合、行列T(II)は、イベントノード101及び時刻ノード111間を時刻リンク112及び時間相関リンク113に沿ってランダムに遷移する場合における遷移確率を表すものである。また、第2ネットワーク情報110が時間相関時刻リンク114を含む場合、行列T(II)は、イベントノード101及び時刻ノード111間を時刻リンク112及び時間相関時刻リンク114に沿ってランダムに遷移する場合における遷移確率を表すものである。
次に、複数のイベントノード及び複数の時刻ノードからなるノード群を複数の時刻リンクに沿ってランダムに遷移する場合に通過するイベントノード及び時刻ノードを示す複数の第2通過情報τ (II)(d)を生成する(S23)。本実施形態では、第2通過情報は、第2定常確率分布pst(II)(N)に従って選出されたノード[N](イベントノード及び時刻ノードからなるノード群に含まれるノード)についてτ (II)(d)=1、かつ、ノード[N]を起点としてノード[M]に遷移する確率を与えるT(II) MNに従って選出されたノード[M]についてτ (II)(d)=1として生成する。このようなE+T次元ベクトルを、D回生成する。
本実施形態に係る第2分類割合算出部163a及び第2重要度算出部163bは、逐次計算により第2分類割合p(II)(N|K)及び第2重要度π(II)(K)をそれぞれ算出する。逐次計算を開始するにあたって、p (II)(N|K)、π (II)(K)、γ (II)(d)(K)を仮決めする(S24)。また、ネットワークのコミュニティの大きさを定めるパラメータとして、正の実数αである解像度13を用いる。
本実施形態に係る第2コミュニティ生成部163は、第1コミュニティ生成部161の計算結果を用いて第2コミュニティ生成を行う。具体的に、本実施形態に係る第2分類割合算出部163a及び第2重要度算出部163bは、仮決めの値であるp (II)(N|K)のうちイベントノード101に係る値(N=1〜Eの場合の値)と、π (II)(K)の値と、γ (II)(d)(K)の値とを、第1分類割合算出部161a及び第1重要度算出部161bにより算出された第1分類割合p(I)(n|k)、第1重要度π(I)(k)及び最新の割合γ (d)(k)の値によって定める。このように定めることで、仮決めの値を任意に定める場合に比較して計算量が少なくなり、第2コミュニティ生成に要する時間が短縮化される。また、より高精度な第2コミュニティ生成が行われる。
逐次計算の第1ステップでは、第t回目の逐次計算による分類割合p(n|k)を、数式(2)における行列T(I)及び第1通過情報τ (I)(d)を行列T(II)及び第2通過情報τ (II)(d)に置き換えた関係式によって算出する(S25)。
次に、直前に算出された分類割合pt−1(N|K)及び重要度πt−1(K)、並びに複数の第2通過情報τ (II)(d)から、複数のコミュニティ全体に対するコミュニティ[K]が占める割合γ (d)(K)を算出する(S26)。割合γ (d)(K)は、数式(3)における第1通過情報τ (I)(d)を第2通過情報τ (II)(d)に置き換えた関係式によって算出する。
さらに、ネットワークのコミュニティ[K]の重要度π(K)を数式(4)により算出する(S27)。また、第2分類割合算出部163a及び第2重要度算出部163bによる逐次計算を終了するか否かを、逐次計算の前後における評価値Qの差の絶対値|Q−Qt−1|が予め定められた基準値εより小さいか否かによって判定する(S28)。ここで、評価値Qは、数式(5)における行列T(I)及び第1通過情報τ (I)(d)を行列T(II)及び第2通過情報τ (II)(d)に置き換えた関係式によって与えられる。
|Q−Qt−1|<εが成立しない場合、最新の分類割合p(N|K)、重要度π(K)及び割合γ (d)(K)を直前の分類割合、重要度及び割合であるとして更新する(S29)。一方、|Q−Qt−1|<εが成立する場合、ノード[N]がコミュニティ[K]に分類される第2分類割合をp(II)(N|K)=p(N|K)により定め、コミュニティ[K]の第2重要度をπ(II)(K)=π(K)により定める(S30)。
また、第2帰属度算出部163cにより、ノード群に含まれるイベントノード及び時刻ノードそれぞれについて、ノード[N]がコミュニティ[K]に分類される第2分類割合p(II)(n|k)が大きいほど、大きな値となるように第2帰属度q(II)(K|N)を算出する(S31)。第2帰属度q(II)(K|N)は、数式(6)の第1分類割合p(I)(n|k)及び第1重要度π(I)(k)を第2分類割合p(II)(N|K)及び第2重要度π(II)(K)に置き換えた関係式により与えられる。
第2コミュニティ生成部163は、解像度13の値αに応じた相関を有するようにして算出された、注目ノード[N]に関する第2分類割合p(II)(N|K)から、注目ノード[N]が属する、第2ネットワーク情報110の1以上の第2コミュニティを生成する(S32)。第2コミュニティ生成部163は、注目ノード[N]がコミュニティ[K]に属する割合を、第2分類割合p(II)(N|K)の値によって定めてよい。また、第2コミュニティ生成部163は、第2分類割合p(II)(N|K)及び第2重要度π(II)(K)から算出される第2帰属度q(II)(K|N)に基づき、注目ノード[N]が属する第2コミュニティを生成してもよい。その場合、注目ノード[N]がコミュニティ[K]に属する割合を、第2帰属度q(II)(K|N)の値によって定める。いずれの場合も、第2コミュニティ生成部163は、注目ノード[N]が属する2以上の第2コミュニティを生成する。そのため、本実施形態に係る第2コミュニティ生成部163によれば、1つのノードが複数の属性を有する場合を表現したコミュニティ分類が行われる。
本実施形態に係る第1コミュニティ生成部161は、第2コミュニティ生成部163の計算結果を用いて第1コミュニティ生成を再び行う。具体的に、本実施形態に係る第1分類割合算出部161a及び第1重要度算出部161bは、仮決めの値であるp (I)(n|k)、π (I)(k)及びγ (I)(d)(k)を、第2分類割合算出部163a及び第2重要度算出部163bにより算出された第2分類割合p(II)(N|K)、第2重要度π(II)(K)及び最新の割合γ (d)(K)の値によって定めて、第1分類割合及び第1重要度の算出を再び行い、第1帰属度の算出を再び行う。このように、本実施形態に係る第1コミュニティ生成部161及び第2コミュニティ生成部163は、互いの計算結果を用いて交互に逐次計算を行うことにより、第1コミュニティ及び第2コミュニティをそれぞれ生成する。交互に逐次計算する回数は、予め定められた回数であってよい。また、第1コミュニティ生成部161における繰返し計算の繰返し回数と、第2コミュニティ生成部163における繰返し計算の繰返し回数との比が、リンク重み15の値ωとなるようにして、互いの計算結果の影響の度合いを調整することとしてもよい。このように、第1コミュニティ生成と第2コミュニティ生成とを、互いの計算結果に基づいて交互に繰り返すことで、コミュニティ生成の精度が逐次向上する。
本実施形態に係る情報処理装置1は、イベントに関与したイベントノードを表すイベントリンクを含む第1ネットワーク情報100を取得し、第1コミュニティ生成部161によって第1コミュニティを生成する。また、イベントの発生回数に応じた本数の時刻リンクを含む第2ネットワーク情報110を取得し、第2コミュニティ生成部163によって第2コミュニティを生成する。コミュニティ生成に要する計算量を決定する支配的な要因は、ネットワーク情報に含まれるリンクの本数である。そのため、本実施形態に係る情報処理装置1によれば、内容が時間的に変化するネットワーク情報のコミュニティ生成が、イベントの発生回数に応じた計算量で行われる。
図8は、本発明の実施形態に係る情報処理装置1により算出された第2重要度と第2分類割合の積のうちイベントノード[n]についての値π(II)(K)p(II)(n|K)を示すグラフである。同図のグラフは、100個のイベントノード101を含む第1ネットワーク情報100と第2ネットワーク情報110についての交互計算によって、π(II)(K)p(II)(n|K)を算出した結果を示したものである。グラフの横軸はn=1〜100のイベントノード番号を表し、縦軸は第2重要度と第2分類割合の積の値を表している。グラフには、K=1〜5の場合における値がプロットされている。
π(II)(K=1)p(II)(n|K=1)の値に注目すると、n=1〜20について比較的大きな値をとり、それ以外のイベントノード(n=21〜100のイベントノード)について比較的小さな値をとっている。K=2〜5の場合のπ(II)(K)p(II)(n|K)の値も加味すると、n=1〜20のイベントノードは、K=1のコミュニティに属する割合が大きく、K=2〜5のコミュニティに属する割合が小さいことが読み取れる。同様に、n=21〜40のイベントノードは、K=2のコミュニティに属する割合が大きく、K=1、3〜5のコミュニティに属する割合が小さいことが読み取れる。また、n=41〜60のイベントノードは、K=3のコミュニティに属する割合が大きく、K=1、2、4、5のコミュニティに属する割合が小さいことが読み取れる。また、n=61〜80のイベントノードは、K=4のコミュニティに属する割合が大きく、K=1〜3、5のコミュニティに属する割合が小さいことが読み取れる。また、n=81〜100のイベントノードは、K=5のコミュニティに属する割合が大きく、K=2〜4のコミュニティに属する割合が小さいことが読み取れる。これらの情報から、n=1〜20のイベントノードを含むコミュニティ[1−1]と、n=21〜40のイベントノードを含むコミュニティ[1−2]と、n=41〜60のイベントノードを含むコミュニティ[1−3]と、n=61〜80のイベントノードを含むコミュニティ[1−4]と、n=81〜100のイベントノードを含むコミュニティ[1−5]と、という5つの第1コミュニティが生成されることが読み取れる。
しかしながら、イベントノード101のコミュニティ分類は、イベントリンク102がいかなる時刻に形成されたものかという情報を含まないため、生成される5つのコミュニティは、時間的に異なるタイミングで形成されたイベントリンク102に基づいて形成されている場合がある。そのため、イベントノード101に基づいてコミュニティを生成するだけでは、ネットワーク情報の時間的構造が捉えられない場合がある。この点、本実施形態に係る情報処理装置1では、時刻ノード111のコミュニティ分類を併せて行うことで、ネットワーク情報の時間的構造を捉える。
図9は、本発明の実施形態に係る情報処理装置1により算出された第2重要度と第2分類割合の積の値π(II)(K)p(II)(N|K)を示すグラフである。同図では、100個のイベントノード101を含む第1ネットワーク情報100と第2ネットワーク情報110についての交互計算によって算出された第2重要度と第2分類割合の積の値π(II)(K)p(II)(N|K)を示す。当該第2ネットワーク情報110は、100個のイベントノード101と、365個の時刻ノードとを含む。ここで、365個の時刻ノードは、1年間の日に対応した時刻ノードである。当該第2ネットワーク情報110では、イベントの発生した日を示す時刻ノードとイベントノードとを時刻リンクで結ぶことで、イベントの発生日を記録している。
同図の左側には、5つのグラフを示しており、各グラフの横軸はn=1〜100のイベントノード番号を表し、縦軸は第2重要度と第2分類割合の積の値のうちイベントノードに関する値(N=1〜100の場合におけるπ(II)(K)p(II)(N|K)の値)を表している。また、同図の右側には、時刻ノードに関する第2重要度と第2分類割合の積の値のグラフを示しており、グラフの縦軸はt=1〜365の時刻ノード番号を表し、横軸は第2帰属度の値のうち時刻ノードに関する値(N=101〜465の場合におけるπ(II)(K)p(II)(N|K)の値)を表している。
π(II)(K=1)p(II)(N|K=1)の値に注目すると、イベントノードに関して、n=1〜20について比較的大きな値をとり、それ以外のイベントノード(n=21〜100のイベントノード)について比較的小さな値をとっている。また、時刻ノードに関して、t=1〜73について比較的大きな値をとり、それ以外の時刻ノード(t=74〜365の時刻ノード)について比較的小さな値をとっている。K=2〜4の場合のπ(II)(K)p(II)(N|K)の値を加味すると、n=1〜20のイベントノード及びt=1〜73の時刻ノードは、K=1のコミュニティに属する割合が大きく、K=2〜5のコミュニティに属する割合が小さいことが読み取れる。また、π(II)(K=2)p(II)(N|K=2)の値に注目すると、イベントノードに関して、n=21〜40及び61〜80について比較的大きな値をとり、それ以外のイベントノード(n=1〜20、41〜60、81〜100のイベントノード)について比較的小さな値をとっている。また、π(II)(K=2)p(II)(N|K=2)の値は、時刻ノードに関して、t=74〜146について比較的大きな値をとり、それ以外の時刻ノード(t=1〜73、147〜365の時刻ノード)について比較的小さな値をとっている。このことから、n=21〜40及び61〜80のイベントノード並びにt=74〜146の時刻ノードは、K=2のコミュニティに属する割合が大きく、K=1、3〜5のコミュニティに属する割合が小さいことが読み取れる。また、n=41〜60のイベントノード及びt=147〜219の時刻ノードは、K=3のコミュニティに属する割合が大きく、K=1、2、4、5のコミュニティに属する割合が小さいことが読み取れる。また、n=61〜80のイベントノード及びt=220〜292の時刻ノードは、K=4のコミュニティに属する割合が大きく、K=1〜3、5のコミュニティに属する割合が小さいことが読み取れる。また、n=81〜100のイベントノード及びt=293〜365の時刻ノードは、K=5のコミュニティに属する割合が大きく、K=1〜4のコミュニティに属する割合が小さいことが読み取れる。
これらの情報から、n=1〜20のイベントノード及びt=1〜73の時刻ノードを含むコミュニティ[2−1]と、n=21〜40及び61〜80のイベントノード並びにt=74〜146の時刻ノードを含むコミュニティ[2−2]と、n=41〜60のイベントノード及びt=147〜219の時刻ノードを含むコミュニティ[2−3]と、n=61〜80のイベントノード及びt=220〜292の時刻ノードを含むコミュニティ[2−4]と、n=81〜100のイベントノード及びt=293〜365の時刻ノードを含むコミュニティ[2−5]と、という5つの第2コミュニティが生成されることが読み取れる。
ここで、π(II)(K=2)p(II)(N|K=2)に対応する第2のコミュニティは、n=21〜40及び61〜80のイベントノードを含む。つまり、t=74〜146の時刻ノードで示される時刻に発生したイベントは、n=21〜40のイベントノードと、n=61〜80のイベントノードという2つのまとまりを包含していることがわかる。
本実施形態に係るコミュニティ分解部163dは、複数のイベントノード101のうち1の第2コミュニティに属する1以上の注目ノードについて、1以上の注目ノードが属する第1コミュニティが2以上ある場合に、当該1の第2コミュニティを、当該2以上の第1コミュニティに従って2以上に分解する。図8及び9の例で説明すると、1以上の注目ノードであるn=21〜40及び61〜80のイベントノードは、1の第2コミュニティ(コミュニティ[2−2])に属し、2以上の第1コミュニティ(コミュニティ[1−2]及びコミュニティ[1−4])に属する。従って、コミュニティ分解部163dは、1の第2コミュニティであるコミュニティ[2−2]を、コミュニティ[1−2]及びコミュニティ[1−4]に従って、n=21〜40のイベントノード及びt=74〜146の時刻ノードを含むコミュニティ[2−2a]と、n=61〜80のイベントノード及びt=74〜146の時刻ノードを含むコミュニティ[2−2b]と、に分解する。このように、第1コミュニティを参照して第2コミュニティを分解することで、時間的に重複した範囲に複数のイベントが発生している場合であっても、イベントノードのコミュニティ分解が行われ、コミュニティが生成される。
図10は、本発明の実施形態に係る情報処理装置1により分解された第2コミュニティを示すグラフである。同図では、横軸にn=1〜100のイベントノード番号を表し、縦軸にt=1〜365の時刻ノード番号を表している。グラフ中の「K=1」と書かれた矩形領域は、n=1〜20のイベントノード及びt=1〜73の時刻ノードを含むコミュニティ[2−1]120を表している。また、グラフ中の「K=2a」と書かれた矩形領域は、n=21〜40のイベントノード及びt=74〜146の時刻ノードを含むコミュニティ[2−2a]121を表している。また、また、グラフ中の「K=2b」と書かれた矩形領域は、n=61〜80のイベントノード及びt=74〜146の時刻ノードを含むコミュニティ[2−2b]122を表している。また、グラフ中の「K=3」と書かれた矩形領域は、n=41〜60のイベントノード及びt=147〜219の時刻ノードを含むコミュニティ[2−3]123を表している。また、グラフ中の「K=4」と書かれた矩形領域は、n=61〜80のイベントノード及びt=220〜292の時刻ノードを含むコミュニティ[2−4]124を表している。また、グラフ中の「K=5」と書かれた矩形領域は、n=81〜100のイベントノード及びt=293〜365の時刻ノードを含むコミュニティ[2−5]125を表している。
同図より、例えば、n=61〜80のイベントノードについては、t=74〜146の時刻ノードで示される時間範囲と、t=220〜292の時刻ノードで示される時間範囲の2度にわたってイベントが発生していることが読み取れる。このように、同じイベントノードについて時間的に異なるタイミングで異なるイベントが発生する場合、第1コミュニティ生成では時間的先後関係を捉えられない場合があるが、第2コミュニティを生成することで時間的構造を捉えたコミュニティ生成が行われる。
1 情報処理装置、10 第1ネットワーク情報、11 第2ネットワーク情報、12 入力部、13 解像度、14 相関長パラメータ、15 リンク重み、16 制御部、17 記憶部、18 表示部、100 第1ネットワーク情報、101 イベントノード、102 イベントリンク、110 第2ネットワーク情報、111 時刻ノード、112 時刻リンク、113 時間相関リンク、114 時間相関時刻リンク、120 コミュニティ[2−1]、121 コミュニティ[2−2a]、122 コミュニティ[2−2b]、123 コミュニティ[2−3]、124 コミュニティ[2−4]、125 コミュニティ[2−5]、160 第1ネットワーク情報取得部、161 第1コミュニティ生成部、161a 第1分類割合算出部、161b 第1重要度算出部、161c 第1帰属度算出部、162 第2ネットワーク情報取得部、163 第2コミュニティ生成部、163a 第2分類割合算出部、163b 第2重要度算出部、163c 第2帰属度算出部、163d コミュニティ分解部。

Claims (7)

  1. 複数のイベントノードと、前記複数のイベントノードのうちイベントに関与した一対のイベントノードを結ぶイベントリンクと、を含む第1ネットワーク情報を取得する第1ネットワーク情報取得手段と、
    前記複数のイベントノード及び複数の時刻ノードと、前記一対のイベントノードと前記イベントのあった時刻を示す前記時刻ノードをそれぞれ結ぶ少なくとも2本の時刻リンクと、を含む第2ネットワーク情報を取得する第2ネットワーク情報取得手段と、
    前記第1ネットワーク情報について、前記複数のイベントノード間を前記イベントリンクに沿って移動する場合における確率分布を用いて、前記複数のイベントノードが属する第1コミュニティを1以上生成する第1コミュニティ生成手段と、
    前記第2ネットワーク情報について、前記複数のイベントノード及び前記複数の時刻ノードからなるノード群を前記時刻リンクに沿って移動する場合における確率分布を用いて、前記複数のイベントノード及び前記複数の時刻ノードが属する第2コミュニティを1以上生成する第2コミュニティ生成手段と、
    を備える情報処理装置。
  2. 前記複数のイベントノードのうち1の前記第2コミュニティに属する1以上の注目ノードについて、前記1以上の注目ノードが属する前記第1コミュニティが2以上ある場合に、当該1の前記第2コミュニティを、当該2以上の前記第1コミュニティに従って2以上に分解するコミュニティ分解手段をさらに備える
    請求項1に記載の情報処理装置。
  3. 前記第2ネットワーク情報は、前記イベントのあった時刻を示す前記時刻ノードと、他の前記時刻ノードとを結び、前記イベントのあった時刻から遠ざかるほど小さくなる重みを有する時間相関リンクをさらに含み、
    前記第2コミュニティ生成手段は、前記ノード群を前記時刻リンク及び前記時間相関リンクに沿って移動する場合における確率分布を用いて、前記複数のイベントノード及び前記複数の時刻ノードが属する第2コミュニティを1以上生成する
    請求項1又は2に記載の情報処理装置。
  4. 前記重みは、前記イベントのあった時刻と相関のある時間範囲を示す相関長パラメータを含む関数により定められる
    請求項3に記載の情報処理装置。
  5. 前記第2ネットワーク情報は、前記一対のイベントノードと、前記イベントのあった時刻を示す前記時刻ノード及び前記イベントのあった時刻と相関のある時間範囲を示す前記時刻ノードと、をそれぞれ結ぶ偶数本の時間相関時刻リンクを含む
    請求項1又は2に記載の情報処理装置。
  6. 前記第1コミュニティ生成手段及び前記第2コミュニティ生成手段は、互いの計算結果を用いて交互に逐次計算を行うことにより、第1コミュニティ及び第2コミュニティをそれぞれ生成する
    請求項1乃至5のいずれか1項に記載の情報処理装置。
  7. 情報処理装置に備えられたコンピュータを、
    複数のイベントノードと、前記複数のイベントノードのうちイベントに関与した一対のイベントノードを結ぶイベントリンクと、を含む第1ネットワーク情報を取得する第1ネットワーク情報取得手段、
    前記複数のイベントノード及び複数の時刻ノードと、前記一対のイベントノードと前記イベントのあった時刻を示す前記時刻ノードをそれぞれ結ぶ少なくとも2本の時刻リンクと、を含む第2ネットワーク情報を取得する第2ネットワーク情報取得手段、
    前記第1ネットワーク情報について、前記複数のイベントノード間を前記イベントリンクに沿って移動する場合における確率分布を用いて、前記複数のイベントノードが属する第1コミュニティを1以上生成する第1コミュニティ生成手段、
    前記第2ネットワーク情報について、前記複数のイベントノード及び前記複数の時刻ノードからなるノード群を前記時刻リンクに沿って移動する場合における確率分布を用いて、前記複数のイベントノード及び前記複数の時刻ノードが属する第2コミュニティを1以上生成する第2コミュニティ生成手段、
    として機能させるプログラム。
JP2015114781A 2015-06-05 2015-06-05 情報処理装置及びプログラム Expired - Fee Related JP6511971B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2015114781A JP6511971B2 (ja) 2015-06-05 2015-06-05 情報処理装置及びプログラム
US14/947,232 US10362102B2 (en) 2015-06-05 2015-11-20 Information processing apparatus for analyzing network type data
SG10201600054RA SG10201600054RA (en) 2015-06-05 2016-01-05 Information processing apparatus and program
AU2016200128A AU2016200128B2 (en) 2015-06-05 2016-01-08 Information processing apparatus and program
EP16153031.6A EP3101925A1 (en) 2015-06-05 2016-01-27 Information processing apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015114781A JP6511971B2 (ja) 2015-06-05 2015-06-05 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2017004098A JP2017004098A (ja) 2017-01-05
JP6511971B2 true JP6511971B2 (ja) 2019-05-15

Family

ID=55456562

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015114781A Expired - Fee Related JP6511971B2 (ja) 2015-06-05 2015-06-05 情報処理装置及びプログラム

Country Status (5)

Country Link
US (1) US10362102B2 (ja)
EP (1) EP3101925A1 (ja)
JP (1) JP6511971B2 (ja)
AU (1) AU2016200128B2 (ja)
SG (1) SG10201600054RA (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11310144B2 (en) 2019-10-07 2022-04-19 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019040285A (ja) * 2017-08-23 2019-03-14 富士ゼロックス株式会社 情報処理装置およびプログラム
CN110650187B (zh) * 2019-09-09 2020-09-18 北京邮电大学 一种边缘节点的节点类型确定方法及目标网络

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001086472A1 (en) 2000-05-11 2001-11-15 Chikka Pte Ltd Method and system for tracking the online status of active users of an internet-based instant messaging system
US7035911B2 (en) 2001-01-12 2006-04-25 Epicrealm, Licensing Llc Method and system for community data caching
US7536472B2 (en) 2001-09-13 2009-05-19 Network Foundation Technologies, Llc Systems for distributing data over a computer network and methods for arranging nodes for distribution of data over a computer network
JP2005244647A (ja) 2004-02-26 2005-09-08 Fuji Xerox Co Ltd コミュニティ形成装置
US20070053283A1 (en) 2005-09-06 2007-03-08 International Business Machines Corporation Correlation and consolidation of link events to facilitate updating of status of source-destination routes in a multi-path network
JP2007102657A (ja) 2005-10-07 2007-04-19 Fuji Xerox Co Ltd コミュニティ分析装置、およびコミュニティ分析方法、並びにコンピュータ・プログラム
US8392418B2 (en) * 2009-06-25 2013-03-05 University Of Tennessee Research Foundation Method and apparatus for predicting object properties and events using similarity-based information retrieval and model
JP4720853B2 (ja) * 2008-05-19 2011-07-13 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
US10324598B2 (en) * 2009-12-18 2019-06-18 Graphika, Inc. System and method for a search engine content filter
US20130232263A1 (en) * 2009-12-18 2013-09-05 Morningside Analytics System and method for classifying a contagious phenomenon propagating on a network
US8566360B2 (en) * 2010-05-28 2013-10-22 Drexel University System and method for automatically generating systematic reviews of a scientific field
JP5417627B2 (ja) 2010-07-21 2014-02-19 株式会社日立製作所 コミュニケーションの質を測定するセンサネットワークシステム、管理計算機及び方法
US9116995B2 (en) * 2011-03-30 2015-08-25 Vcvc Iii Llc Cluster-based identification of news stories
US9026519B2 (en) * 2011-08-09 2015-05-05 Microsoft Technology Licensing, Llc Clustering web pages on a search engine results page
US8917661B2 (en) 2011-09-08 2014-12-23 Mediatek Inc. Apparatuses and methods for enhancing data rate for packet-switched (PS) data service
US9286391B1 (en) * 2012-03-19 2016-03-15 Amazon Technologies, Inc. Clustering and recommending items based upon keyword analysis
US9740773B2 (en) * 2012-11-02 2017-08-22 Qualcomm Incorporated Context labels for data clusters
JP6047017B2 (ja) * 2013-01-11 2016-12-21 キヤノン株式会社 パターン抽出装置および制御方法
US10365797B2 (en) * 2013-03-15 2019-07-30 Ambient Consulting, LLC Group membership content presentation and augmentation system and method
US9280587B2 (en) * 2013-03-15 2016-03-08 Xerox Corporation Mailbox search engine using query multi-modal expansion and community-based smoothing
US9529890B2 (en) * 2013-04-29 2016-12-27 Moogsoft, Inc. System for decomposing events from managed infrastructures using a topology proximity engine, graph topologies, and k-means clustering
US10379932B2 (en) * 2013-04-29 2019-08-13 Moogsoft, Inc. System for decomposing events from managed infrastructures
US10474520B2 (en) * 2013-04-29 2019-11-12 Moogsoft, Inc. Methods for decomposing events from managed infrastructures
US10402428B2 (en) * 2013-04-29 2019-09-03 Moogsoft Inc. Event clustering system
WO2015039222A1 (en) * 2013-09-19 2015-03-26 Sysomos L.P. Systems and methods for actively composing content for use in continuous social communication
US9836517B2 (en) * 2013-10-07 2017-12-05 Facebook, Inc. Systems and methods for mapping and routing based on clustering
US9705801B2 (en) * 2013-10-07 2017-07-11 Facebook, Inc. Systems and methods for mapping and routing based on clustering
JP6260195B2 (ja) * 2013-10-22 2018-01-17 富士通株式会社 情報処理装置、情報処理端末、ソーシャルネットワークシステム、プログラム及び処理方法
CA2927150A1 (en) * 2013-10-25 2015-04-30 Sysomos L.P. Systems and methods for determining influencers in a social data network
US20150120717A1 (en) * 2013-10-25 2015-04-30 Marketwire L.P. Systems and methods for determining influencers in a social data network and ranking data objects based on influencers
US9886521B2 (en) * 2014-03-13 2018-02-06 International Business Machines Corporation Adaptive sampling schemes for clustering streaming graphs
US9225730B1 (en) * 2014-03-19 2015-12-29 Amazon Technologies, Inc. Graph based detection of anomalous activity
CA2943970A1 (en) * 2014-04-30 2015-11-05 Landmark Graphics Corporation Forecasting production data for existing wells and new wells
US20160071162A1 (en) * 2014-09-10 2016-03-10 Sysomos L.P. Systems and Methods for Continuous Analysis and Procurement of Advertisement Campaigns

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11310144B2 (en) 2019-10-07 2022-04-19 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Also Published As

Publication number Publication date
AU2016200128B2 (en) 2017-01-12
US20160359966A1 (en) 2016-12-08
AU2016200128A1 (en) 2016-12-22
JP2017004098A (ja) 2017-01-05
SG10201600054RA (en) 2017-01-27
US10362102B2 (en) 2019-07-23
EP3101925A1 (en) 2016-12-07

Similar Documents

Publication Publication Date Title
Mbuvha et al. Bayesian inference of COVID-19 spreading rates in South Africa
Dai et al. Deep coevolutionary network: Embedding user and item features for recommendation
CN103577413B (zh) 搜索结果排序方法及系统、搜索结果排序优化方法及系统
TW201237647A (en) Method and system for identifying rare-event failure rates
KR20060048943A (ko) 대인 관계에 기초하여 통신의 우선 순위를 선정하기 위한방법 및 시스템
Clerkin et al. A prescription for galaxy biasing evolution as a nuisance parameter
JP6511971B2 (ja) 情報処理装置及びプログラム
CN105868256A (zh) 处理用户行为数据的方法和系统
CN108241888A (zh) 信息估计装置和信息估计方法
Amancio et al. Three-feature model to reproduce the topology of citation networks and the effects from authors’ visibility on their h-index
Li et al. First-order mixed integer-valued autoregressive processes with zero-inflated generalized power series innovations
CN113379042B (zh) 保护数据隐私的业务预测模型训练方法及装置
Ryder et al. Missing data in a stochastic Dollo model for binary trait data, and its application to the dating of Proto-Indo-European
JP2016029526A (ja) 情報処理装置、及びプログラム
Thompson et al. Inferring extinction risks from sighting records
WO2020086336A1 (en) Space utilization measurement and modeling using artificial intelligence
Choo et al. On the persistence of higher-order interactions in real-world hypergraphs
CN103559318B (zh) 对异质信息网络包含的对象进行排序的方法
Malesios Some variations on the standard theoretical models for the h‐index: A comparative analysis
CN106776757A (zh) 用户完成网银操作的指示方法及装置
JP6414966B2 (ja) 健康データ分析補助装置
Fierro et al. Statistical inference on a stochastic epidemic model
Terpstra et al. Optimal rank set sampling estimates for a population proportion
Chaussé et al. GMM estimation of a realized stochastic volatility model: A Monte Carlo study
Shahzamal et al. Vaccination strategies on dynamic networks with indirect transmission links and limited contact information

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190325

R150 Certificate of patent or registration of utility model

Ref document number: 6511971

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees