JP2016029526A

JP2016029526A - 情報処理装置、及びプログラム

Info

Publication number: JP2016029526A
Application number: JP2014151512A
Authority: JP
Inventors: 岡本　洋; Hiroshi Okamoto; 洋岡本
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2014-07-25
Filing date: 2014-07-25
Publication date: 2016-03-03
Anticipated expiration: 2034-07-25
Also published as: JP6390239B2; AU2015203002A1; US20160028850A1; AU2015203002B2; US9690969B2

Abstract

【課題】ネットワーク型データのソフトクラスタリングを行う情報処理装置、及びプログラムの提供を目的とする。
【解決手段】情報処理装置は、複数のノード及び前記複数のノードを結ぶ複数のリンクを含むネットワークの情報と、前記複数のノードを複数の成分に分類する粒度とを取得する取得手段と、前記複数の成分それぞれについて、前記複数のノードそれぞれが当該成分に分類される分類割合を、当該ノードとの間でリンクを有するノードの当該成分に関する前記分類割合が大きいほど大きな値となる第１の寄与と、前記複数の成分全体に対する当該成分が占める割合が大きいほど大きな値となる第２の寄与と、から構成される値により算出する分類割合算出手段と、を備えることを特徴とする。
【選択図】図１

Description

本発明は情報処理装置、及びプログラムに関する。

従来、データ点の集合等、ベクトル型データの大域的特徴を捉えるため、いわゆるクラスタリングを行う場合があった。ここで、クラスタリングの種類として、１つのデータ点が１つのクラスタに属するように分類するハードクラスタリングと、１つのデータ点が複数のクラスタに属し得るように分類するソフトクラスタリングとがあった。

下記特許文献１には、複数のストリングエントリのインデクシングを行う方法であって、ユーザのリクエストを渡す前にユーザに関連するロックテーブルへの問い合わせを実行するステップを有する、衝突検出又は衝突マネージメントのための方法が記載されている。

下記特許文献２には、対象点と周囲点とのリンクを除去し、周囲点と周囲点に最も近い点との間に新たにリンクを生成するグラフインデックス再構成装置が記載されている。

下記特許文献３には、Ｗｅｂｌｏｇコミュニティにおいて頻出するキーワードによりコ
ミュニティをインデクシングすると共に、コミュニケーション鮮度を算出し、Ｗｅｂｌｏｇコミュニティ検索結果をキーワード適合度及びコミュニケーション鮮度に基づきソートして表示可能とするコミュニティ検索支援方法が記載されている。

下記特許文献４には、コミュニティでやり取りされるメッセージから索引を作成し、ユーザがネットワークを介して送信した質問メッセージについて、質問先とするコミュニティを索引に基づいて選択して、質問メッセージを送信する質問先選択サーバが記載されている。

特開２００６−００４４３９号公報特開２０１２−１３３５２２号公報特開２００６−３３１２９２号公報特開２００７−２８７０４６号公報

近年、情報処理技術の発達により、相互参照を含むＨＴＭＬデータ等、ネットワーク型データの重要性が高まっている。ネットワーク型データは、ノードと、ノードを結ぶリンクとを含み、ベクトル型データと同様に複数のクラスタに分類される場合がある。

しかし、ネットワーク型データのノードが複数のクラスタに属し得るようにソフトクラスタリングする方法は必ずしも確立されていない。

そこで、本発明は、ネットワーク型データのソフトクラスタリングを行う情報処理装置、及びプログラムの提供を目的とする。

上記課題を解決するために、請求項１に記載の情報処理装置は、複数のノード及び前記複数のノードを結ぶ複数のリンクを含むネットワークの情報と、前記複数のノードを複数の成分に分類する粒度とを取得する取得手段と、前記複数の成分それぞれについて、前記複数のノードそれぞれが当該成分に分類される分類割合を、当該ノードとの間でリンクを有するノードの当該成分に関する前記分類割合が大きいほど大きな値となる第１の寄与と、前記複数の成分全体に対する当該成分が占める割合が大きいほど大きな値となる第２の寄与と、から構成される値により算出する分類割合算出手段と、を備えることを特徴とする。

また、請求項２に記載の発明は、前記複数のノードそれぞれについて、前記複数の成分に帰属する帰属度を、当該ノードが当該成分に分類される前記分類割合が大きいほど、大きな値となるように算出する帰属度算出手段をさらに備えることを特徴とする請求項１に記載の情報処理装置である。

また、請求項３に記載の発明は、前記複数の成分それぞれについて、前記複数の成分の重要度を、前記複数の成分全体に対する当該成分が占める割合が大きいほど大きな値となるように算出する重要度算出手段をさらに備え、前記帰属度算出手段は、前記複数のノードそれぞれについて、前記複数の成分に帰属する帰属度を、当該成分の前記重要度が大きいほど、大きな値となるように算出することを特徴とする請求項２に記載の情報処理装置である。

また、請求項４に記載の発明は、前記取得手段は、前記複数のノードそれぞれについて、ユーザの興味の多寡を表す数値をさらに取得し、前記複数のノードそれぞれについて、前記数値に基づく固有順位を、前記数値が相対的に大きいノードについての前記帰属度が相対的に大きい成分について、当該成分に帰属する前記帰属度が大きいノードほど上位となるように算出する固有順位算出手段をさらに備えることを特徴とする請求項３に記載の情報処理装置である。

また、請求項５に記載の発明は、前記分類割合算出手段及び前記重要度算出手段は、逐次計算により前記分類割合及び前記重要度をそれぞれ算出し、前記第１の寄与は、前記粒度を粗くすると１に近付く第１の係数と、当該ノードとの間でリンクを有するノードに関して直前に算出された前記分類割合と、から定められ、前記第２の寄与は、前記粒度を粗くすると０に近付く第２の係数と、前記複数のノード間を前記複数のリンクに沿ってランダムに遷移する場合に通過するノードを示す複数の通過情報と、直前に算出された前記分類割合及び前記重要度から算出される前記複数の成分全体に対する当該成分が占める割合と、から定められることを特徴とする請求項１乃至４のいずれか一項に記載の情報処理装置である。

また、請求項６に記載の発明は、前記複数のノードの１つをｎと表し、前記複数の成分の１つをｋと表し、ノードｎが成分ｋに分類される前記分類割合のうち直前に算出された前記分類割合をｐ_ｔ−１（ｎ｜ｋ）と表し、前記粒度をαと表し、ノードｎとノードｍとを結ぶリンクの情報をＴ_ｎｍと表し、ノードｎの通過を示す前記複数の通過情報をτ_ｎ ^（ｄ）と表し、成分ｋの前記重要度のうち直前に算出された前記重要度をπ_ｔ−１（ｋ）と表し、直前に算出された前記分類割合ｐ_ｔ−１（ｎ｜ｋ）及び前記重要度π_ｔ−１（ｋ）、並びに前記複数の通過情報τ_ｎ ^（ｄ）から算出される前記複数の成分全体に対する成分ｋが占める割合γ_ｔ ^（ｄ）（ｋ）をγ_ｔ ^（ｄ）（ｋ）＝π_ｔ−１（ｋ）Π_ｎ（ｐ_ｔ−１（ｎ｜ｋ））^{τｎ（ｄ）}／Σ_ｊ（π_ｔ−１（ｊ）Π_ｍ（ｐ_ｔ−１（ｍ｜ｊ））^{τｍ（ｄ）}）と定め、Ｄ_ｔ−１（ｋ）＝Σ_ｄγ_ｔ−１ ^（ｄ）（ｋ）と定める場合に、前記分類割合算出手段は、ｐ_ｔ（ｎ｜ｋ）＝αΣ_ｍＴ_ｎｍｐ_ｔ−１（ｍ｜ｋ）／（α＋２Ｄ_ｔ−１（ｋ））＋Σ_ｄγ_ｔ−１ ^（ｄ）（ｋ）τ_ｎ ^（ｄ）／（α＋２Ｄ_ｔ−１（ｋ））の関係により前記分類割合を逐次計算し、前記重要度算出手段は、π_ｔ（ｋ）＝Ｄ_ｔ−１（ｋ）／Σ_ｊＤ_ｔ−１（ｊ）の関係により前記重要度を逐次計算し、Ｑ_ｔ＝Σ_ｋΣ_ｄγ_ｔ ^（ｄ）（ｋ）ｌｏｇ（π_ｔ（ｋ））＋Σ_ｋΣ_ｎ（Σ_ｄγ_ｔ ^（ｄ）（ｋ）τ_ｎ ^（ｄ）＋αΣ_ｍＴ_ｎｍｐ_ｔ（ｍ｜ｋ））ｌｏｇ（ｐ_ｔ（ｎ｜ｋ））で定められる判定値Ｑ_ｔが、予め定められた数値εとの間で、｜Ｑ_ｔ−Ｑ_ｔ−１｜＜εの関係を満たす場合に、ノードｎが成分ｋに分類される前記分類割合をｐ（ｎ｜ｋ）＝ｐ_ｔ（ｎ｜ｋ）、成分ｋの前記重要度をπ（ｋ）＝π_ｔ（ｋ）、と定めることを特徴とする請求項５に記載の情報処理装置である。

また、請求項７に記載の発明は、ノードｎが成分ｋに帰属する前記帰属度をｑ（ｋ｜ｎ）と表す場合に、前記帰属度算出手段は、ｑ（ｋ｜ｎ）＝π（ｋ）ｐ（ｎ｜ｋ）／（Σ_ｊπ（ｊ）ｐ（ｎ｜ｊ））の関係により前記帰属度を算出することを特徴とする請求項６に記載の情報処理装置である。

また、請求項８に記載の発明は、ノードｎについての、前記ユーザの興味の多寡を表す数値をＩ_ｎと表し、ノードｎについての前記ユーザの前記固有順位をｐ（ｎ｜Ｉ）と表す場合に、前記固有順位算出手段は、ｐ（ｎ｜Ｉ）＝Σ_ｋｐ（ｎ｜ｋ）Π_ｍ（ｑ（ｋ｜ｍ））^Ｉｍ／（Σ_ｊΠ_ｒ（ｑ（ｊ｜ｒ））^Ｉｒ）の関係により前記固有順位を算出することを特徴とする請求項７に記載の情報処理装置である。

また、請求項９に記載の発明は、情報処理装置に備えられたコンピュータを、複数のノード及び前記複数のノードを結ぶ複数のリンクを含むネットワークの情報と、前記複数のノードを複数の成分に分類する粒度とを取得する取得手段、前記複数の成分それぞれについて、前記複数のノードそれぞれが当該成分に分類される分類割合を、当該ノードとの間でリンクを有するノードの当該成分に関する前記分類割合が大きいほど大きな値となる第１の寄与と、前記複数の成分全体に対する当該成分が占める割合が大きいほど大きな値となる第２の寄与と、から構成される値により算出する分類割合算出手段、として機能させることを特徴とするプログラムである。

請求項１、及び９に記載の発明によれば、ネットワーク型データのソフトクラスタリングを行う情報処理装置、及びプログラムが得られる。

請求項２に記載の発明によれば、ノードのインデクシングが行われる。

請求項３に記載の発明によれば、成分の重要度に応じたインデクシングが行われる。

請求項４に記載の発明によれば、ノードのパーソナライズドランキングが得られる。

請求項５に記載の発明によれば、ネットワーク型データのソフトクラスタリングが漸近的に行われる。

請求項６に記載の発明によれば、ネットワーク型データのソフトクラスタリングが任意の精度で行われる。

請求項７に記載の発明によれば、ノードのインデクシングが任意の精度で行われる。

請求項８に記載の発明によれば、ノードのパーソナライズドランキングがリアルタイムで得られる。

本発明の実施形態に係る情報処理装置の構成図である。ネットワーク情報を示す図である。本発明の実施形態に係る情報処理装置において実行される分解工程のフローチャートである。本発明の実施形態に係る情報処理装置において算出された分類割合及び重要度を示す図である。本発明の実施形態に係る情報処理装置において算出された帰属度を示す図である。本発明の実施形態に係る情報処理装置において算出された、各ノードについての帰属度を表すグラフである。本発明の実施形態に係る情報処理装置において取得される興味ベクトルと、算出された固有順位とを示す図である。本発明の実施形態に係る情報処理装置において算出された、各ノードについての固有順位を表すグラフである。本発明の実施形態に係る情報処理装置において取得される粒度と、成分数の関係を示す図である。

以下、本発明の実施の形態について、図面を参照しながら説明する。

図１は、本発明の実施形態に係る情報処理装置１の構成図である。情報処理装置１は、記憶部１０、入力部１１、制御部１２、表示部１３を含む。

記憶部１０は、例えばRAM（Random Access Memory）やROM（Read Only Memory）を含む。記憶部１０は、制御部１２が実行するプログラムを格納するとともに、制御部１２のワークメモリとしても機能する。なお、記憶部１０に格納される制御部１２が実行するプログラムは、電気通信回線を介して提供されるものであってもよいし、半導体記憶素子等のコンピュータで読み取り可能な情報記憶媒体に格納されて提供されるものであってもよい。

本実施形態に係る情報処理装置１の記憶部１０には、ネットワーク情報１００、粒度α１０１、及び興味ベクトルＩ１０２が記憶される。ネットワーク情報１００は、複数のノード及び複数のノードを結ぶ複数のリンクを含むネットワークの情報である。ネットワーク情報１００は、例えば相互参照を含むＨＴＭＬデータ、友人関係のデータ等であってよい。ネットワーク情報１００は、少なくともノード間の結び付きの関係（ノードとリンクの関係）を示すものであればよく、ノードが含む具体的な内容（ＨＴＭＬデータの内容等）を示すものでなくてもよい。

粒度α１０１は、正の実数であって、情報処理装置１によってネットワーク情報１００をソフトクラスタリングする場合に、クラスタの大きさを定めるパラメータである。興味ベクトルＩ１０２は、ネットワーク情報１００に含まれるノードの数と同じ次元を有するベクトルであり、各要素は正の実数であり、各要素の総和が１となるものである。興味ベクトルＩ１０２は、各ノードの固有順位（パーソナライズドランキング）を算出するために用いられる。

入力部１１は、例えばキーボードやマウス等であり、ユーザの指示を制御部１２に伝達する。本実施形態では、記憶部１０に粒度α１０１及び興味ベクトルＩ１０２が記憶されることとしたが、ユーザが入力部１１によって、粒度α１０１及び興味ベクトルＩ１０２を入力することとしてもよい。

制御部１２は、例えばＣＰＵ（Central Processing Unit）を含んでおり、記憶部１０に格納されるプログラムを実行することにより、情報処理装置１の全体を制御する。制御部１２は、機能的に、取得部１２０、算出部１２１、帰属度算出部１２２、固有順位算出部１２３を含む。ここで、算出部１２１は、分類割合算出部１２１０、及び重要度算出部１２１１を含む。制御部１２の行う制御については、後に詳細に説明する。

表示部１３は、制御部１２により処理された情報をユーザに表示するものであり、例えば液晶ディスプレイである。

図２は、ネットワーク情報１００を示す図である。本実施形態では、ネットワーク情報１００は、７つのノードと、９つのリンクの情報を含むものである。各ノードには、１から７までのノード番号が付与されており、例えばノード番号１であるノード（以下、ノード［１］と表す）は、ノード［２］及びノード［４］のノードとリンクを有する。本実施形態では、簡明な説明のため７つのノードを有するネットワークの場合を示すが、ノード数及びリンク数はこれより多くてもよく、例えば１０万程度であってもよい。本実施形態では、ノード間を結ぶリンクは方向を持たないこととしているが、リンクは一方通行であってもよい。

行列Ｔは、ノード間をリンクに沿ってランダムに遷移する場合における遷移確率を表すものである。例えば、ノード［１］を起点としてリンクに沿ってランダムに他のノードに遷移する場合、１／２の確率でノード［２］に遷移し、１／２の確率でノード［４］に遷移する。これらの遷移確率をまとめて表したものが、行列Ｔの第１列である。他の行列要素についても同様に構成されている。一般に、ノード［ｎ］とノード［ｍ］がリンクで接続されている場合にＡ_ｎｍ＝１、ノード［ｎ］とノード［ｍ］がリンクで接続されていない場合にＡ_ｎｍ＝０となる行列Ａを用いて、ノードの総数をＮとする場合に、行列Ｔは以下の数式（１）で定義される。遷移確率の総和は１であるから、任意のノード［ｍ］について、Σ_ｎＴ_ｎｍ＝１が成り立つ。

図３は、本発明の実施形態に係る情報処理装置１において実行される分解工程のフローチャートである。分解工程では、ネットワーク情報１００及び粒度α１０１を入力として、ネットワークに含まれるＮ個のノードをＫ個の成分に分類することにより、ネットワークのソフトクラスタリングを行う。ここで、Ｎ及びＫは正の整数である。なお、成分の総数Ｋはユーザが仮決めすることのできるパラメータであるが、後述するようにクラスタの総数は分解工程を実行することにより自動的に定まる。分解工程では、複数の成分それぞれについて、複数のノードそれぞれが当該成分に分類される分類割合を求め、複数の成分の重要度を求める。すなわち、成分［ｋ］について、ノード［ｎ］が成分［ｋ］に分類される分類割合ｐ（ｎ｜ｋ）を求め、成分［ｋ］の重要度π（ｋ）を求める。分類割合ｐ（ｎ｜ｋ）、及び重要度π（ｋ）を求めるにあたって、第ｄ番目の通過情報τ^（ｄ）に基づく、複数の成分全体に対する成分［ｋ］が占める割合γ^（ｄ）（ｋ）を求めることとなる。ここで、第ｄ番目の通過情報τ^（ｄ）はＮ次元のベクトルであり、τ^（１）、τ^（２）…τ^（Ｄ）（Ｄは正の整数）というＤ個のデータである。

分解工程では、はじめに、ネットワーク情報１００が表すネットワークのノード間をランダムに遷移する場合における定常確率分布ｐ^ｓｔ（ｎ）を算出する（Ｓ１）。定常確率分布ｐ^ｓｔ（ｎ）は、以下の数式（２）で定められる連立Ｎ次方程式を解くことにより求められる。定常確率分布ｐ^ｓｔ（ｎ）は、行列Ｔの固有ベクトルであって、固有値が１のものである。

一方通行のリンクを含むネットワークを想定する場合、いわゆるランクシンク等の問題が発生し、定常確率分布が特定のノードにのみ値を有する場合がある。そのような場合、数式（２）を変形し、例えば、ｐ^ｓｔ（ｎ）＝（１−ｒ）Σ_ｍＴ_ｎｍｐ^ｓｔ（ｍ）＋ｒという関係によって定常確率分布ｐ^ｓｔ（ｎ）を求めることとしてもよい。ここで、ｒは０以上１以下の実数である。ｒは、ノード間をリンクに沿わずにランダムに遷移する確率を表す。

次に、複数のノード間を複数のリンクに沿ってランダムに遷移する場合に通過するノードを示す複数の通過情報τ_ｎ ^（ｄ）を生成する（Ｓ２）。本実施形態では、通過情報は、定常確率分布ｐ^ｓｔ（ｎ）に従って選出されたノード［ｎ］についてτ_ｎ ^（ｄ）＝１、かつ、ノード［ｎ］を起点としてノード［ｍ］に遷移する確率を与えるＴ_ｍｎに従って選出されたノード［ｍ］についてτ_ｍ ^（ｄ）＝１として生成する。このようなＮ次元ベクトルを、Ｄ回生成する。通過情報τ_ｎ ^（ｄ）は、Σ_ｎτ_ｎ ^（ｄ）＝２を満たす量である。通過情報τ_ｎ ^（ｄ）は、仮想エージェントがノード間をリンクに沿ってランダムに遷移する場合に、仮想エージェントをノード［ｎ］とノード［ｍ］とを結ぶリンク上に見出す場合を表している。

本実施形態に係る分類割合算出部１２１０及び重要度算出部１２１１は、逐次計算により分類割合ｐ（ｎ｜ｋ）及び重要度π（ｋ）をそれぞれ算出する。分解工程では、逐次計算を開始するにあたって、ｐ_０（ｎ｜ｋ）、π_０（ｋ）、γ_０ ^（ｄ）（ｋ）を仮決めする（Ｓ３）。ここで、Σ_ｎｐ_０（ｎ｜ｋ）＝１、Σ_ｋπ_０（ｋ）＝１を満たす値を与えるものとする。ｐ_０（ｎ｜ｋ）は、ｋ＝１〜Ｋの成分について、ｎ＝１〜Ｎのノードが分類される割合を示すものであるから、仮決めではＫ×Ｎ−１個の正の実数を与えることになる。なお、−１はΣ_ｎｐ_０（ｎ｜ｋ）＝１の条件による。また、π_０（ｋ）は、ｋ＝１〜Ｋに分類されたネットワークの成分について、重要度を示すものであるから、仮決めではＫ−１個の正の実数を与えることになる。γ_０ ^（ｄ）（ｋ）は、複数の成分全体に対する成分［ｋ］が占める割合を表す係数であり、ｄ＝１〜Ｄの通過情報τ^（ｄ）に対応して定まる係数であるから、仮決めではＫ×Ｄ個の正の実数を与えることになる。

逐次計算の第１ステップでは、第ｔ回目の逐次計算による分類割合ｐ_ｔ（ｎ｜ｋ）を計算する（Ｓ４）。ここで、ｔは正の整数であり、逐次計算の回数を表す。ｐ_ｔ（ｎ｜ｋ）は、１つ前の逐次計算により得られるｐ_ｔ−１（ｎ｜ｋ）、π_ｔ−１（ｋ）、及びγ_ｔ−１ ^（ｄ）（ｋ）より算出される。例えば、仮決め（Ｓ３）の後行われる第一回目の逐次計算では、ｐ_０（ｎ｜ｋ）、π_０（ｋ）、及びγ_０ ^（ｄ）（ｋ）を用いてｐ_１（ｎ｜ｋ）を求めることになる。

本実施形態に係る分類割合算出部１２１０は、以下の数式（３）で定められる関係により第ｔ回目の逐次計算による分類割合ｐ_ｔ（ｎ｜ｋ）を算出する（Ｓ４）。

ここで、αは記憶部１０に記憶された粒度α１０１であり、正の実数である。本実施形態では、粒度α１０１は、αが０に近付くほど分解の粒度が細かくなり、αが無限大に近付くほど分解の粒度が粗くなるパラメータである。また、Ｄ_ｔ−１（ｋ）はγ_ｔ−１ ^（ｄ）（ｋ）から定まる係数であり、Ｄ_ｔ−１（ｋ）＝Σ_ｄγ_ｔ−１ ^（ｄ）（ｋ）である。

分類割合ｐ_ｔ（ｎ｜ｋ）は、ノード［ｎ］との間でリンクを有するノード（Ｔ_ｎｍ≠０であるノード［ｍ］）の成分［ｋ］に関する分類割合ｐ_ｔ−１（ｍ｜ｋ）が大きいほど大きな値となる第１の寄与（右辺第一項）と、複数の成分全体に対する成分［ｋ］が占める割合γ_ｔ−１ ^（ｄ）（ｋ）が大きいほど大きな値となる第２の寄与（右辺第二項）とから構成される値により算出される。

また、第１の寄与は、粒度α１０１を粗くすると（αを無限大に近付けると）１に近付く第１の係数α／（α＋２Ｄ_ｔ−１（ｋ））と、ノード［ｎ］との間でリンクを有するノード（Ｔ_ｎｍ≠０であるノード［ｍ］）に関して直前に算出された分類割合ｐ_ｔ−１（ｍ｜ｋ）と、から定められる。また、第２の寄与は、粒度α１０１を粗くすると（αを無限大に近付けると）０に近付く第２の係数１／（α＋２Ｄ_ｔ−１（ｋ））と、複数の通過情報τ_ｎ ^（ｄ）と、複数の成分全体に対する成分［ｋ］が占める割合γ_ｔ−１ ^（ｄ）（ｋ）と、から定められる。なお、以下に示すように、複数の成分全体に対する成分［ｋ］が占める割合γ_ｔ−１ ^（ｄ）（ｋ）は、直前に算出された分類割合ｐ_ｔ−１（ｎ｜ｋ）及び重要度π_ｔ−１（ｋ）から算出される。

次に、直前に算出された分類割合ｐ_ｔ−１（ｎ｜ｋ）及び重要度π_ｔ−１（ｋ）、並びに複数の通過情報τ_ｎ ^（ｄ）から、複数の成分全体に対する成分［ｋ］が占める割合γ_ｔ ^（ｄ）（ｋ）を算出する（Ｓ５）。本実施形態では、以下の数式（４）により割合γ_ｔ ^（ｄ）（ｋ）を算出する。割合γ_ｔ ^（ｄ）（ｋ）は、成分全体の中で重要度が相対的に大きい成分について大きな値をとる。

さらに、ネットワークの成分［ｋ］の重要度π_ｔ（ｋ）を算出する（Ｓ６）。重要度π_ｔ（ｋ）は、複数の成分全体に対する成分［ｋ］が占める割合γ_ｔ ^（ｄ）（ｋ）が大きいほど大きな値となるように算出される。本実施形態では、以下の数式（５）により成分［ｋ］の重要度π_ｔ（ｋ）を算出する。

以上の数式（３）、（４）、及び（５）により、直前に算出された分類割合ｐ_ｔ−１（ｎ｜ｋ）、重要度π_ｔ−１（ｋ）、及び割合γ_ｔ−１ ^（ｄ）（ｋ）、並びに通過情報τ_ｎ ^（ｄ）から、分類割合ｐ_ｔ（ｎ｜ｋ）、重要度π_ｔ（ｋ）、及び割合γ_ｔ ^（ｄ）（ｋ）が算出される。

分解工程では、逐次計算の前後における評価値Ｑ_ｔの差の絶対値｜Ｑ_ｔ−Ｑ_ｔ−１｜が予め定められた基準値εより小さいか否かを算出部１２１により判定し、逐次計算を終了するか否かを決定する（Ｓ７）。本実施形態において、評価値Ｑ_ｔは以下の数式（６）で定められる量である。

｜Ｑ_ｔ−Ｑ_ｔ−１｜＜εが成立しない場合、最新の分類割合ｐ_ｔ（ｎ｜ｋ）、重要度π_ｔ（ｋ）、及び割合γ_ｔ ^（ｄ）（ｋ）を直前の分類割合、重要度、及び割合であるとして更新する（Ｓ８）。その後、分類割合ｐ_ｔ＋１（ｎ｜ｋ）を算出する工程（Ｓ４）、割合γ_ｔ＋１ ^（ｄ）（ｋ）を算出する工程（Ｓ５）、重要度π_ｔ＋１（ｋ）を算出する工程（Ｓ６）を行い、｜Ｑ_ｔ＋１−Ｑ_ｔ｜＜εが成立するか否かを判定する（Ｓ７）、という一連の工程を繰り返す。本実施形態に係る分類割合算出部１２１０及び重要度算出部１２１１は、評価値の差の絶対値が予め定められた値より小さくなるまで、以上の工程を繰り返し、逐次計算により分類割合、及び重要度を算出する。これにより、ネットワーク情報１００のソフトクラスタリングが漸近的に行われる。

一方、｜Ｑ_ｔ−Ｑ_ｔ−１｜＜εが成立する場合、ノード［ｎ］が成分［ｋ］に分類される分類割合をｐ（ｎ｜ｋ）＝ｐ_ｔ（ｎ｜ｋ）により定め、成分［ｋ］の重要度をπ（ｋ）＝π_ｔ（ｋ）により定める（Ｓ９）。本実施形態に係る情報処理装置１によれば、予め定められた値εを調整することで、任意の精度で分類割合ｐ（ｎ｜ｋ）、及び重要度π（ｋ）を求めることができ、ネットワークのソフトクラスタリングを任意の精度で行うことができる。なお、逐次計算の回数を予め定めておき、定められた回数だけ逐次計算を行った場合におけるｐ_ｔ（ｎ｜ｋ）及びπ_ｔ（ｋ）の値を、それぞれ分類割合ｐ（ｎ｜ｋ）及び重要度π（ｋ）と決定することとしてもよい。

図４は、本発明の実施形態に係る情報処理装置１において算出された分類割合及び重要度を示す図である。図４では、図２に示したネットワーク情報１００、及び粒度α１０１を入力として、本実施形態に係る分類割合算出部１２１０及び重要度算出部１２１１によって算出された分類割合及び重要度を示している。本実施形態に係るネットワーク情報１００のノード数はＮ＝７であり、算出された成分数はＫ＝２である。ここで、成分数Ｋはユーザが予め仮決めすることのできるパラメータであるが、十分に大きな値を設定する場合、π（ｋ）＜εとなるｋが表れる。そして、π（ｋ）＜εとなる成分ｋは重要度が０である（当該成分は見出されない）とみなして、ネットワーク情報１００のソフトクラスタリングを行う。ここで、Ｋとして十分に大きな値とは、ノード数Ｎと同程度かそれ以上の値であることを意味する。すなわち、本実施形態の場合、Ｋを十分に大きな値に設定することは、Ｋ≧７に設定することを意味する。本実施形態に係る分類割合算出部１２１０及び重要度算出部１２１１は、例えばＫ＝７という条件で逐次計算を行うことで、５つの成分について重要度がπ（ｋ）＜εと得られ、２つの成分について重要度がπ（１）＝０．６、π（２）＝０．４と得られる。よって、本実施形態におけるネットワーク情報１００は、２つの成分にソフトクラスタリングされたといえる。後述するように、ネットワーク情報１００がいくつの成分に分類されるかは、粒度α１０１の大きさによって変化する。

分類割合ｐ（ｎ｜ｋ）は、数式（３）から読み取れるように、任意のｋについてΣ_ｎｐ（ｎ｜ｋ）＝１を満たす量である。例えば第１の成分（ｋ＝１）について、複数のノードそれぞれが成分［１］に分類される分類割合を確認すると、ｐ（１｜１）＝０．２５、ｐ（２｜１）＝０．２５、ｐ（３｜１）＝０．２５、ｐ（４｜１）＝０．１５、ｐ（５｜１）＝０．０５、ｐ（６｜１）＝０．０２５、ｐ（７｜１）＝０．０２５である。このことから、ノード［１］、［２］、［３］が成分［１］に分類される分類割合は等しく１／４であるのに対し、ノード［４］が成分［１］に分類される分類割合は０．１５と相対的にやや小さく、ノード［５］が成分［１］に分類される分類割合は０．０５、ノード［６］及び［７］が成分［１］に分類される分類割合はどちらも０．０２５と相対的に非常に小さくなっている。

一方、複数のノードそれぞれが成分［２］に分類される分類割合を確認すると、ノード［１］、［２］、［３］が成分［２］に分類される分類割合は等しく０．０３で相対的に非常に小さく、ノード［４］が成分［１］に分類される分類割合は０．１１と相対的にやや小さく、ノード［５］が成分［１］に分類される分類割合は０．２、ノード［６］及び［７］が成分［１］に分類される分類割合はどちらも０．３となっている。

図２に表されたネットワーク情報１００の構造から予想されるように、本実施形態に係る情報処理装置１によれば、ノード［１］、［２］、［３］と、ノード［５］、［６］、［７］とは異なる成分に分類される。ノード［４］は中間的なノードであり、成分［１］に分類される分類割合と、成分［２］に分類される分類割合とが同程度である。もっとも、ノード［１］、［２］、［３］が成分［２］に分類される分類割合は０ではなく、ノード［５］、［６］、［７］が成分［１］に分類される分類割合も０ではない。このように、分類割合を算出することにより、ネットワークを構成するノードを複数の成分に分類することができ、ネットワークのソフトクラスタリングが行える。

重要度π（ｋ）は、Σ_ｋπ（ｋ）＝１を満たす量である。重要度π（ｋ）は、ネットワーク全体における成分［ｋ］の相対的な重要度を表す。成分［ｋ］の重要度は、成分［ｋ］に分類されるノードの数に応じて定まる。本実施形態において得られた分類割合によれば、成分［１］については特にノード［１］、［２］、［３］の分類割合が大きく、成分［２］については特にノード［５］、［６］、［７］の分類割合が大きく、ノード［４］については成分［１］に分類される分類割合の方が成分［２］に分類される分類割合よりも大きい。そのため、成分［１］に分類されるノードが相対的に多いこととなり、π（１）＞π（２）という結果が得られている。

図５は、本発明の実施形態に係る情報処理装置１において算出された帰属度を示す図である。帰属度は、帰属度算出部１２２により算出される量であって、複数のノードそれぞれについて、ノード［ｎ］が成分［ｋ］に分類される分類割合ｐ（ｎ｜ｋ）が大きいほど、大きな値となるように算出される量である。本実施形態では、ノード［ｎ］が成分［ｋ］に帰属する帰属度ｑ（ｋ｜ｎ）は、以下の数式（７）によって求められる。

数式（７）から読み取れるように、帰属度ｑ（ｋ｜ｎ）は、Σ_ｋｑ（ｋ｜ｎ）＝１を満たす。すなわち、あるノードが各成分に帰属する帰属度の総和は１となる。帰属度ｑ（ｋ｜ｎ）は、あるノード［ｎ］が、成分［ｋ］に帰属する度合いを成分全体に関して相対的に測った量である。

図６は、本発明の実施形態に係る情報処理装置１において算出された、各ノードについての帰属度を表すグラフである。グラフは、横軸にノード番号、縦軸に帰属度を表している。例えば、ノード［１］、［２］、［３］について、成分［１］に帰属する帰属度は、ｑ（１｜１）＝ｑ（１｜２）＝ｑ（１｜３）＝０．９３であり、成分［２］に帰属する帰属度は、ｑ（２｜１）＝ｑ（２｜２）＝ｑ（２｜３）＝０．０７である。よって、ノード［１］、［２］、［３］は成分［１］に帰属する度合いが比較的大きいノードであると考えられる。ノード［４］は、成分［１］への帰属度がｑ（１｜４）＝０．６７であり、成分［２］への帰属度がｑ（２｜４）＝０．３３であるので、成分［１］に帰属する度合いが比較的大きいが、成分［２］に帰属する度合いも無視できない大きさで有するので、中間的なノードであるといえる。ノード［５］も中間的なノードであり、成分［１］への帰属度がｑ（１｜５）＝０．２７であり、成分［２］への帰属度がｑ（２｜５）＝０．７３である。一方、ノード［６］、［７］は、成分［１］への帰属度がｑ（１｜６）＝ｑ（１｜７）＝０．１１であり、成分［２］への帰属度がｑ（２｜６）＝ｑ（２｜７）＝０．８９であり、成分［２］に帰属する度合いが比較的大きいノードであると考えられる。

本実施形態に係る情報処理装置１は、算出した帰属度を各ノードに付与し、ノードのインデクシングを行う。ノード［ｎ］にインデックスとして付与される帰属度ｑ（ｋ｜ｎ）は、Ｋ次元のベクトルであり、ノード［ｎ］の特性をＫ個の実数値によって表すものである。インデックスは、ノードの内容をＫ次元のベクトルに圧縮して表したものということができる。インデックスは、以下に説明する各ノードの固有順位を算出する場合に用いられる他、ノードの検索を行う場合に用いることができる。例えば、ある種の特性を有するノードを探し出したいというユーザからの要求を受け付けた場合に、情報処理装置１はユーザの要求に含まれるネットワークの成分を１つ又は複数抽出し、当該抽出された成分に帰属する度合いの大きいノードを選出することで検索結果とすることができる。このような方法を採用することにより、ノードの内容を直接検索する場合に比べて、高速にノードを検索することができる。

図７は、本発明の実施形態に係る情報処理装置１において取得される興味ベクトルＩ１０２と、算出された固有順位とを示す図である。興味ベクトル１０２は、ノードの総数Ｎと同じ次元をもったベクトルであって、各要素は正の実数であり、Σ_ｎＩ_ｎ＝１を満たす規格化されたベクトルである。興味ベクトル１０２の各要素は、複数のノードそれぞれについて、ユーザの興味の多寡を表す数値である。数値が大きいほどユーザが関心を抱いているノードであることを表し、数値が小さいほどユーザが関心を寄せていないノードであることを意味する。例えば、複数のノードが文書データである場合には、ユーザが入力した単語を受けて、興味ベクトル１０２の要素を、Ｉ_ｎ＝（ノード［ｎ］が含む当該単語の数）／Σ_ｍ（ノード［ｍ］が含む当該単語の数）として定めることとしてもよい。

図７では、本実施形態に係る情報処理装置１に記憶されている興味ベクトル１０２の例を示している。興味ベクトル１０２は、ｎ＝０〜５ではＩ_ｎ＝０であり、Ｉ_６＝０．８、Ｉ_７＝０．２である。本実施形態における興味ベクトル１０２の例は、ユーザがノード［６］に特に強い興味を持ち、ノード［７］についても僅かに興味を持っている状態を表している。

固有順位算出部１２３は、分類割合算出部１２１０、重要度算出部１２１１、及び帰属度算出部１２２でそれぞれ算出された分類割合ｐ（ｎ｜ｋ）、重要度π（ｋ）、及び帰属度ｑ（ｋ｜ｎ）、並びに興味ベクトルＩ１０２を用いて、複数のノードそれぞれについて固有順位を算出する。固有順位算出部１２３は、興味ベクトル１０２に基づく固有順位を、興味ベクトル１０２が相対的に大きいノード［ｎ］についての帰属度ｑ（ｋ｜ｎ）が相対的に大きい成分［ｋ］について、当該成分［ｋ］に帰属する帰属度が大きいノードほど上位となるように算出する。本実施形態の場合に当てはめて考えると、興味ベクトル１０２の要素Ｉ_ｎが相対的に大きいノードはノード［６］であり、ノード［６］についての帰属度が相対的に大きい成分は成分［２］である。そして、成分［２］に帰属する度合いが大きいノードは、ノード［６］及び［７］であり、次いでノード［５］である。

本実施形態では、以下の数式（８）によって、興味ベクトルＩ１０２に基づいたノード［ｎ］の固有順位ｐ（ｎ｜Ｉ）を求める。

図８は、本発明の実施形態に係る情報処理装置１において算出された、各ノードについての固有順位を表すグラフである。図８に示すグラフの横軸はノード番号を表し、縦軸は固有順位ｐ（ｎ｜Ｉ）を表す。固有順位は、ノード［６］及び［７］について０．２８であり、全ノード中最も大きな値となっている。ノード［５］の固有順位はｐ（５｜Ｉ）＝０．１８、ノード［４］の固有順位はｐ（４｜Ｉ）＝０．１１であり、中間的な順位となっている。ノード［１］〜［３］の固有順位は低く、各々０．０５である。これらの数値は足して１となる（Σ_ｎｐ（ｎ｜Ｉ）＝１）ものであり、固有順位は複数のノード間における相対的な順位である。

本実施形態に係る情報処理装置１は、興味ベクトル１０２が特定されているユーザからの要求に応じて、ノードの固有順位、いわゆるパーソナライズドランキングをリアルタイムで出力することができる。例えば、各ノードが文書データを表す場合に、興味ベクトル１０２が特定されているユーザによって検索ワードが入力されると、インデックスｑ（ｋ｜ｎ）に基づく検索を行うとともに、固有順位ｐ（ｎ｜Ｉ）が高いノードを優先的に提示するように処理することで、ユーザの興味を反映したノード検索を行うことができる。本実施形態に係る情報処理装置１によれば、ノードの固有順位を予め算出しておく必要はなく、ユーザからの要求を受け付けた後に算出することができる。そのため、固有順位を予め算出しておく場合に比べて、より状況変化を反映した固有順位を提供することができる。

図９は、本発明の実施形態に係る情報処理装置１において取得される粒度１０１と、成分数Ｋの関係を示す図である。本実施形態に係る情報処理装置１では、ネットワークを幾つかの成分に分類する場合における粒度１０１は、正の実数αでパラメータ付けられる。本実施形態におけるパラメータ付けでは、αが大きいほど分類の粒度は粗く、αが小さいほど分類の粒度は細かい。図９は、ネットワークのソフトクラスタリングの様子を正確に表す図ではなく、もっぱら粒度１０１と成分数Ｋとの関係を示すための図である。図９において、楕円形の破線はネットワークの成分を表し、破線が囲むノードは、当該成分に関する帰属度が相対的に大きいノードを表す。

第１の例における成分２は、粒度１０１が比較的粗い場合の例における成分を示している。第１の例の場合、粒度１０１が比較的粗いため、ネットワークを構成する全ノードが単一の成分に帰属すると算出される。この場合、重要度が０でない（重要度が予め定められた基準値ε以下でない）成分の数は１であり、成分の総数は１である。

第２の例における成分３ａ、３ｂは、粒度１０１が第１の例よりも細かい第２の例の場合において、算出される成分をそれぞれ破線で表したものである。第２の例における成分３ａには４つのノードが帰属し、第２の例における成分３ｂには３つのノードが帰属している。ノード［１］〜［４］は、第２の例における成分３ａに関する帰属度が相対的に大きく、ノード［５］〜［７］は、第２の例における成分３ｂに関する帰属度が相対的に大きい。もっとも、いずれのノードも複数の成分について０でない帰属度を有する場合がある。特に、ノード［４］及び［５］等は、２つの成分に対して同程度の帰属度を有する場合がある。第２の例の場合、ネットワークの各ノードは２つの成分に帰属すると算出される。この場合、重要度が０でない成分の数は２であり、成分の総数は２である。

第３の例における成分４ａ、４ｂ、４ｃは、粒度１０１が第２の例よりも細かい第３の例の場合において、算出される成分をそれぞれ破線で表したものである。第３の例における成分４ａ、４ｂには２つのノードが帰属し、第３の例における成分４ｃには３つのノードが帰属している。ノード［２］及び［３］は、第３の例における成分４ａに関する帰属度が相対的に大きく、ノード［１］及び［４］は、第３の例における成分４ｂに関する帰属度が相対的に大きく、ノード［５］〜［７］は、第３の例における成分４ｃに関する帰属度が相対的に大きい。第３の例の場合、１つの成分に含まれるノードの数が少なく、成分間の重なりが生じやすいため、いずれのノードも複数の成分について同程度の帰属度を有する場合がある。第３の例の場合、ネットワークの各ノードは３つの成分に帰属すると算出される。この場合、重要度が０でない成分の数は３であり、成分の総数は３である。

以上のように、本実施形態に係る情報処理装置１では、粒度α１０１を大きくするに従って、見出される成分の数は少なくなる。情報処理装置１のユーザは、同一のネットワーク情報１００について、異なる粒度α１０１を用いてネットワークのソフトクラスタリングを行うことができ、ネットワークを様々な階層に分解することができる。

以下では、本実施形態における分類割合、重要度、粒度α、帰属度、及び固有順位の意味を理論的背景に基づいて説明する。ネットワーク情報１００が表すネットワーク上を仮想エージェントがランダムに遷移する状況を考え、ノード［ｎ］に仮想エージェントが見出される確率をｐ（ｎ）とするとき、ｐ（ｎ）は、任意の確率ｐ（ｋ）及び条件付き確率ｐ（ｎ｜ｋ）を用いて、ｐ（ｎ）＝Σ_ｋｐ（ｎ｜ｋ）ｐ（ｋ）と表すことができる。本実施形態では、条件付き確率ｐ（ｎ｜ｋ）を、成分［ｋ］にノード［ｎ］が分類される分類割合ｐ（ｎ｜ｋ）と捉え、確率ｐ（ｋ）を、成分［ｋ］の重要度π（ｋ）と捉えて、それぞれを定めるべきパラメータθと捉える。パラメータθは、（Ｎ＋１）×Ｋ−２個の実数値である。分類割合ｐ（ｎ｜ｋ）は、仮想エージェントを成分［ｋ］に見出した場合に、仮想エージェントがノード［ｎ］に見出される確率である。また、重要度π（ｋ）は、仮想エージェントを成分［ｋ］に見出す確率である。

パラメータθは、ネットワークを観測することによりデータｘが得られたという条件の下で決定される。本実施形態において、データｘとは、通過情報τ_ｎ ^（ｄ）である。通過情報τ_ｎ ^（ｄ）は、ｄ回目の観測において、仮想エージェントがどのリンクを通過しているかを表す情報である。データｘは、Ｎ×Ｄ個の０又は１の値である。

本実施形態では、パラメータθ（分類割合及び重要度）について仮定をした場合において、データｘ（通過情報）が得られる尤もらしさｐ（ｘ｜θ）を最大化することにより、パラメータθを決定する。すなわち、尤度関数ｐ（ｘ｜θ）を最大化することによりパラメータθを推定するという最尤推定法を用いる。

本実施形態では、ＥＭアルゴリズム（Expectation-Maximization algorithm）を用いてパラメータθの最尤推定を行う。そのため、ｐ（ｘ｜θ）＝Σ_ｚｐ（ｘ、ｚ｜θ）となる潜在変数ｚ_ｋ ^（ｄ）を導入する。本実施形態において、潜在変数ｚ_ｋ ^（ｄ）は成分の総数Ｋと同じ次元を有するベクトルであり、仮想エージェントが滞在する成分が成分［ｋ］である場合にｚ_ｋ＝１、それ意外の要素は０である単位ベクトルである。潜在変数ｚ_ｋ ^（ｄ）は、ｄ回目の試行により得られた潜在変数を表す。潜在変数ｚは、Ｋ×Ｄ個の０又は１の値である。

ＥＭアルゴリズムでは、尤度関数ｐ（ｘ｜θ）を直接最大化するのではなく、より計算が簡明となる評価値Ｑ＝Σ_ｚｐ（ｚ｜ｘ、θ）ｌｏｇ（Ｐ（ｘ、ｚ｜θ））を最大化することによりパラメータθを決定する。尤度関数ｐ（ｘ｜θ）ではなく評価値Ｑを最大化する場合であっても、尤度関数ｐ（ｘ｜θ）を最大化するのと同じ結果が得られる。

本実施形態では、パラメータθ（分類割合及び重要度）についての仮定として、以下の数式（９）を与える。すなわち、パラメータθは数式（９）で表される確率分布に従うことを仮定する。これは、パラメータθの事前確率分布はディリクレ分布であると仮定することを意味する。

ここで、ｐ_ｔ（ｎ｜ｋ）、ｐ_ｔ−１（ｍ｜ｋ）は分解工程の逐次計算における分類割合であり、αは粒度１０１であり、Ｔ_ｎｍはネットワーク情報１００の構造から定まる遷移確率である。

パラメータθの従う確率分布Ｐ（θ）は、ｐ_ｔ−１（ｎ｜ｋ）からｐ_ｔ（ｎ｜ｋ）に遷移する確率Ｐ（ｐ_ｔ（ｎ｜ｋ）｜ｐ_ｔ−１（ｎ｜ｋ））を表すと捉えることもできる。ここで、α→∞の極限で、Ｐ（ｐ_ｔ（ｎ｜ｋ）｜ｐ_ｔ−１（ｎ｜ｋ））→δ（ｐ_ｔ（ｎ｜ｋ）−Σ_ｍＴ_ｎｍｐ_ｔ−１（ｍ｜ｋ））となる。ここで、δは、いわゆるデルタ関数を表す。すなわち、粒度１０１を粗くするに従って、逐次計算におけるｐ_ｔ（ｎ｜ｋ）の発展を与える関係式は、ネットワーク上をランダムに遷移する場合に成立するｐ_ｔ（ｎ｜ｋ）＝Σ_ｍＴ_ｎｍｐ_ｔ−１（ｍ｜ｋ）という関係に漸近していく。本実施形態において、αは、ｐ_ｔ（ｎ｜ｋ）＝Σ_ｍＴ_ｎｍｐ_ｔ−１（ｍ｜ｋ）という関係からのずれを表すパラメータということもできる。αが０に近付くほど、決定論的な関係ｐ_ｔ（ｎ｜ｋ）＝Σ_ｍＴ_ｎｍｐ_ｔ−１（ｍ｜ｋ）からのずれが大きくなる。

ＥＭアルゴリズムでは、数式（６）に表した評価値Ｑ_ｔをパラメータθであるｐ_ｔ（ｎ｜ｋ）及びπ_ｔ（ｋ）により偏微分し、評価値Ｑ_ｔの最大値を与えるパラメータθを決定する。その結果は、分類割合ｐ_ｔ（ｎ｜ｋ）について数式（３）となり、重要度π_ｔ（ｋ）について数式（５）となる。その後、評価値Ｑ_ｔの最大値と、評価値Ｑ_ｔ−１の最大値との差の絶対値が予め定められた基準値ε以下となった場合に逐次計算を終了し、ｐ（ｎ｜ｋ）及びπ（ｋ）が決定される。

ここで、評価値を最大化する場合に拘束条件Σ_ｎｐ_ｔ（ｎ｜ｋ）＝１、及びΣ_ｋπ_ｔ（ｋ）＝１を考慮しなくてはならない。これらの拘束条件を評価値Ｑの表式中にラグランジュ未定乗数の方法で取り込むこととしてもよいし、拘束条件を解いた状態で計算を行うこととしてもよい。拘束条件を解いた状態とは、例えば、ｐ_ｔ（ｎ＝Ｎ｜ｋ）＝１−ｐ_ｔ（ｎ＝１｜ｋ）−ｐ_ｔ（ｎ＝２｜ｋ）…−ｐ_ｔ（ｎ＝Ｎ−１｜ｋ）と定めた状態である。

帰属度ｑ（ｋ｜ｎ）は、数式（７）により求められる。数式（７）はベイズの定理として知られる関係式であり、帰属度ｑ（ｋ｜ｎ）は条件付き確率ｐ（ｋ｜ｎ）に等しい。帰属度ｑ（ｋ｜ｎ）は、仮想エージェントをノード［ｎ］に見出した場合に、仮想エージェントが成分［ｋ］に帰属する確率を表すものである。

固有順位ｐ（ｎ｜Ｉ）は、条件付き確率であって、数式（８）により求められる。固有順位ｐ（ｎ｜Ｉ）は、ユーザの興味ベクトルＩが与えられた条件の下で、仮想エージェントをノード［ｎ］に見出す確率を表す。

１情報処理装置、２第１の例における成分、３ａ，３ｂ第２の例における成分、４ａ，４ｂ，４ｃ第３の例における成分、１０記憶部、１１入力部、１２制御部、１３表示部、１００ネットワーク情報、１０１粒度、１０２興味ベクトル、１２０取得部、１２１算出部、１２２帰属度算出部、１２３固有順位算出部、１２１０分類割合算出部、１２１１重要度算出部。

Claims

複数のノード及び前記複数のノードを結ぶ複数のリンクを含むネットワークの情報と、前記複数のノードを複数の成分に分類する粒度とを取得する取得手段と、
前記複数の成分それぞれについて、前記複数のノードそれぞれが当該成分に分類される分類割合を、当該ノードとの間でリンクを有するノードの当該成分に関する前記分類割合が大きいほど大きな値となる第１の寄与と、前記複数の成分全体に対する当該成分が占める割合が大きいほど大きな値となる第２の寄与と、から構成される値により算出する分類割合算出手段と、
を備えることを特徴とする情報処理装置。
前記複数のノードそれぞれについて、前記複数の成分に帰属する帰属度を、当該ノードが当該成分に分類される前記分類割合が大きいほど、大きな値となるように算出する帰属度算出手段をさらに備える
ことを特徴とする請求項１に記載の情報処理装置。
前記複数の成分それぞれについて、前記複数の成分の重要度を、前記複数の成分全体に対する当該成分が占める割合が大きいほど大きな値となるように算出する重要度算出手段をさらに備え、
前記帰属度算出手段は、前記複数のノードそれぞれについて、前記複数の成分に帰属する帰属度を、当該成分の前記重要度が大きいほど、大きな値となるように算出する
ことを特徴とする請求項２に記載の情報処理装置。
前記取得手段は、
前記複数のノードそれぞれについて、ユーザの興味の多寡を表す数値をさらに取得し、
前記複数のノードそれぞれについて、前記数値に基づく固有順位を、前記数値が相対的に大きいノードについての前記帰属度が相対的に大きい成分について、当該成分に帰属する前記帰属度が大きいノードほど上位となるように算出する固有順位算出手段をさらに備える
ことを特徴とする請求項３に記載の情報処理装置。
前記分類割合算出手段及び前記重要度算出手段は、逐次計算により前記分類割合及び前記重要度をそれぞれ算出し、
前記第１の寄与は、前記粒度を粗くすると１に近付く第１の係数と、当該ノードとの間でリンクを有するノードに関して直前に算出された前記分類割合と、から定められ、
前記第２の寄与は、前記粒度を粗くすると０に近付く第２の係数と、前記複数のノード間を前記複数のリンクに沿ってランダムに遷移する場合に通過するノードを示す複数の通過情報と、直前に算出された前記分類割合及び前記重要度から算出される前記複数の成分全体に対する当該成分が占める割合と、から定められる
ことを特徴とする請求項１乃至４のいずれか一項に記載の情報処理装置。
前記複数のノードの１つをｎと表し、前記複数の成分の１つをｋと表し、ノードｎが成分ｋに分類される前記分類割合のうち直前に算出された前記分類割合をｐ_ｔ−１（ｎ｜ｋ）と表し、前記粒度をαと表し、ノードｎとノードｍとを結ぶリンクの情報をＴ_ｎｍと表し、ノードｎの通過を示す前記複数の通過情報をτ_ｎ ^（ｄ）と表し、成分ｋの前記重要度のうち直前に算出された前記重要度をπ_ｔ−１（ｋ）と表し、
直前に算出された前記分類割合ｐ_ｔ−１（ｎ｜ｋ）及び前記重要度π_ｔ−１（ｋ）、並びに前記複数の通過情報τ_ｎ ^（ｄ）から算出される前記複数の成分全体に対する成分ｋが占める割合γ_ｔ ^（ｄ）（ｋ）を
γ_ｔ ^（ｄ）（ｋ）＝π_ｔ−１（ｋ）Π_ｎ（ｐ_ｔ−１（ｎ｜ｋ））^{τｎ（ｄ）}／Σ_ｊ（π_ｔ−１（ｊ）Π_ｍ（ｐ_ｔ−１（ｍ｜ｊ））^{τｍ（ｄ）}）
と定め、
Ｄ_ｔ−１（ｋ）＝Σ_ｄγ_ｔ−１ ^（ｄ）（ｋ）
と定める場合に、
前記分類割合算出手段は、
ｐ_ｔ（ｎ｜ｋ）＝αΣ_ｍＴ_ｎｍｐ_ｔ−１（ｍ｜ｋ）／（α＋２Ｄ_ｔ−１（ｋ））＋Σ_ｄγ_ｔ−１ ^（ｄ）（ｋ）τ_ｎ ^（ｄ）／（α＋２Ｄ_ｔ−１（ｋ））
の関係により前記分類割合を逐次計算し、
前記重要度算出手段は、
π_ｔ（ｋ）＝Ｄ_ｔ−１（ｋ）／Σ_ｊＤ_ｔ−１（ｊ）
の関係により前記重要度を逐次計算し、
Ｑ_ｔ＝Σ_ｋΣ_ｄγ_ｔ ^（ｄ）（ｋ）ｌｏｇ（π_ｔ（ｋ））＋Σ_ｋΣ_ｎ（Σ_ｄγ_ｔ ^（ｄ）（ｋ）τ_ｎ ^（ｄ）＋αΣ_ｍＴ_ｎｍｐ_ｔ（ｍ｜ｋ））ｌｏｇ（ｐ_ｔ（ｎ｜ｋ））
で定められる判定値Ｑ_ｔが、予め定められた数値εとの間で、
｜Ｑ_ｔ−Ｑ_ｔ−１｜＜ε
の関係を満たす場合に、ノードｎが成分ｋに分類される前記分類割合をｐ（ｎ｜ｋ）＝ｐ_ｔ（ｎ｜ｋ）、成分ｋの前記重要度をπ（ｋ）＝π_ｔ（ｋ）、と定める
ことを特徴とする請求項５に記載の情報処理装置。
ノードｎが成分ｋに帰属する前記帰属度をｑ（ｋ｜ｎ）と表す場合に、
前記帰属度算出手段は、
ｑ（ｋ｜ｎ）＝π（ｋ）ｐ（ｎ｜ｋ）／（Σ_ｊπ（ｊ）ｐ（ｎ｜ｊ））
の関係により前記帰属度を算出する
ことを特徴とする請求項６に記載の情報処理装置。
ノードｎについての、前記ユーザの興味の多寡を表す数値をＩ_ｎと表し、ノードｎについての前記ユーザの前記固有順位をｐ（ｎ｜Ｉ）と表す場合に、
前記固有順位算出手段は、
ｐ（ｎ｜Ｉ）＝Σ_ｋｐ（ｎ｜ｋ）Π_ｍ（ｑ（ｋ｜ｍ））^Ｉｍ／（Σ_ｊΠ_ｒ（ｑ（ｊ｜ｒ））^Ｉｒ）
の関係により前記固有順位を算出する
ことを特徴とする請求項７に記載の情報処理装置。
情報処理装置に備えられたコンピュータを、
複数のノード及び前記複数のノードを結ぶ複数のリンクを含むネットワークの情報と、前記複数のノードを複数の成分に分類する粒度とを取得する取得手段、
前記複数の成分それぞれについて、前記複数のノードそれぞれが当該成分に分類される分類割合を、当該ノードとの間でリンクを有するノードの当該成分に関する前記分類割合が大きいほど大きな値となる第１の寄与と、前記複数の成分全体に対する当該成分が占める割合が大きいほど大きな値となる第２の寄与と、から構成される値により算出する分類割合算出手段、
として機能させることを特徴とするプログラム。