WO2009107416A1

WO2009107416A1 - グラフ構造変化検出装置、グラフ構造変化検出方法およびプログラム

Info

Publication number: WO2009107416A1
Application number: PCT/JP2009/050475
Authority: WO
Inventors: 遼平藤巻; 健司山西
Original assignee: 日本電気株式会社
Priority date: 2008-02-27
Filing date: 2009-01-15
Publication date: 2009-09-03

Abstract

　ノードの活性度つまり重要度に基づいてグラフ構造の変化を検出可能なグラフ構造変化検出装置、グラフ構造変化検出方法およびプログラムを提供する。　グラフ構造変化検出装置１００は、複数のノードと、複数のノードのうちの各ノード間の関係の程度を示すリンクと、によって表されるグラフデータを受け付けた場合に、グラフデータに基づいて、ノードごとに、ノードの重要性の程度を示す重要度情報を計算する計算手段１１０と、ノードのそれぞれを、ノードの重要度情報に基づいて、複数のグループのいずれかに分け、ノードのグループ分けの結果を、グラフデータのグラフ構造情報として出力する推定手段１２０と、グラフデータのグラフ構造情報と構造変化検出用の基準グラフ構造情報とを比較して、グラフデータの構造変化を検出し、グラフデータの構造変化の検出結果を出力する検出手段１０１と、を含む。

Description

グラフ構造変化検出装置、グラフ構造変化検出方法およびプログラム

　本発明は、グラフ構造変化検出装置、グラフ構造変化検出方法およびプログラムに関し、例えば、点（ノード）と辺（リンク）によって構成されるグラフの構造の変化を、各ノードの重要度を用いて検出するグラフ構造変化検出装置、グラフ構造変化検出方法およびプログラムに関する。

　グラフデータとは、ノード集合、および、ノード間の関係を表現するリンク、によって表されるデータである。

　グラフデータとしては、例えば、Ｗｅｂ（ウェブ）ページとハイパーリンクとを表すデータ、ＳＮＳ（ソーシャルネットワーキングサイト）のユーザーと友人関係とを表すデータ、ネットワーク機器とトラフィックとを表すデータ、タンパク質構造における塩基とその間のインタラクション（相互作用）とを表すデータなどが挙げられる。

　上記の例では、Ｗｅｂページとユーザーとネットワーク機器と塩基のそれぞれが「ノード集合」に該当し、ハイパーリンクと友人関係とトラフィックと塩基間のインタラクションのそれぞれが「リンク」に該当する。

　近年の研究から、グラフデータにて構成される多くのグラフ（ネットワーク）の構造には、スケールフリー性と呼ばれる性質が存在する事が確認されている（非特許文献１参照）。

　スケールフリー性を持つグラフの性質の１つとして、大多数のノードの重要度は低いが、グラフ中で「ハブ」として機能する重要度の高いノードが、少数（低い確率で）存在するという性質がある。これは、ノードに対する重要度に関する確率分布が裾の長い分布をしていると言い換える事が可能である（分布の裾はつまり重要度が高いノードに相当し、裾が長いため重要度の高いノードも低い確率で存在しうる）。

　このような性質は、ノードの持つリンク数やページランク（非特許文献２）などさまざまなノードの重要度に関して観測されている。例えば、スケールフリー性を持つグラフにおいて、ノードの持つリンク数は冪分布に従うという性質があり（図１参照）、ページランクは冪分布あるいは対数正規分布に従う性質がある。

　このようなグラフの構造は、一般にさまざまな要因によって経時変化し、その変化を監視することは重要である。

　例えば、あるコミュニティに対して広告をうつ場合には、そのコミュニティにおけるオピニオンリーダーに広告を出す事が効果的である。このため、重要ノードすなわちオピニオンリーダーに関する構造の変動をいち早く検出することは、効果的な広告を提供するために重要である。

　これらのグラフデータを、ノードの部分集合（クラスタ）に分割する事で特徴付け、そのグラフの構造の変化点を検出する方法が、幾つか提案されている。これらの方法は、例えば、Ｗｅｂコミュニティ構造の変化検出など、種々の利用分野で幅広く応用可能である。

　非特許文献３には、グラフまたは時系列的に得られるグラフを符号化する場合の記述長を基準としてグラフ分割の変化点を検出する技術が記載されている。

　この技術では、時間的に隣接するグラフの分割構造はグラフ構造に変化が起こらない限り同じであるという仮定のもとで、グラフ列の記述長と分割方法の記述長との和が最小となるようにグラフの分割が行われ、個々のグラフの分割方法が比較され、その比較の結果、分割方法の変化する点が検出される（GraphScope：グラフスコープ）。

　また、時間的に連続したグラフの列の、固定されたコミュニティの構造に対する、時間経過に伴う差分（変動）を推定する技術がある（非特許文献４参照）。

　非特許文献５には、ヒストグラムによる近似方法に関して、最小記述長原理に従った方法が記載されている。非特許文献６には、ヒストグラムによる近似方法に関して、赤池情報量基準に従った方法が記載されている。非特許文献７には、HITS（Hyperlink-Induced　Topic　Search）アルゴリズムによって、各ノードに対するハブ指標またはオーソリティ指標を計算する手法が記載されている。非特許文献８には、動的モデル選択の枠組みに関する技術が記載されている。
A.　L.　Barabasi　and　R.　Albert.　Emergence　of　scaling　in　random　networks.　Science,　286:509-512,　1999. L.　Page,　S.　Brin,　R.　Motwanim　and　T.　Winograd.　The　PageRank　Citation　Ranking:　Bringing　Order　to　the　Web.　Technical　Report,　Stanford　Digital　Library　Technologies　Project,　1998. J.　Sun,　P.　S.　Yu,　S.　Papadimitriou,　and　C.　Faloutsos.　Graphscope:　Parameter-free　mining　of　large　time-evolving　graphs.　In　Proceedings　of　the　13th　ACM　SIGKDD　international　conference　on　Knowledge　discovery　and　data　mining,　2007. Yun　Chi,　Shenghuo　Zhu,　Xiaodan　Song,　Jun'ichi　Tatemura,　Belle　L.　Tseng:　Structural　and　temporal　analysis　of　the　blogosphere　through　community　factorization.　KDD　2007:　163-172 J.　Rissanen,　T.　P.　Speed,　and　B.　Yu.　Density　estimation　by　stochastic　complexity.　IEEE　Transactions　on　Information　Theory,　38(2):315-323,　1992. C.　C.　Taylor.　Akaike's　information　criterion　and　the　histogram.　Biometrika　74(3):636-639,　1987 J.　M.　Kleinberg.　Authoritative　sources　in　a　hyperlinked　environment.　Journal　of　the　ACM,　46:604-632,　2003. K.　Yamanishi　and　Y.　Maruyama.　Dynamic　model　selection　with　its　applications　to　novelty　detection.　IEEE　Transactions　on　Information　Theory,　53(6):2180-2189,　2007.

　上述したグラフ構造の変化点検出技術は、ノードの重要度に従ってグラフ構造の変化点を検出する事ができないという課題がある。

　その理由は、上述した技術には、ノードの重要度によってグラフの構造を特徴付けるという思想が無く、グラフの分割を計算する際に、ノードの重要度の情報が考慮されていないためである。

　本発明の目的は、上述した課題を解決することが可能なグラフ構造変化検出装置、グラフ構造変化検出方法およびプログラムを提供することである。

　本発明のグラフ構造変化検出装置は、複数のノードと、当該複数のノードのうちの各ノード間の関係の程度を示すリンクと、によって表されるグラフデータを受け付けた場合に、当該グラフデータに基づいて、前記ノードごとに、当該ノードの重要性の程度を示す重要度情報を計算する計算手段と、前記ノードのそれぞれを、当該ノードの重要度情報に基づいて、複数のグループのいずれかに分け、前記ノードのグループ分けの結果を、前記グラフデータのグラフ構造情報として出力する推定手段と、前記グラフデータのグラフ構造情報と、構造変化検出用の基準グラフ構造情報と、を比較して、前記グラフデータの構造変化を検出し、当該グラフデータの構造変化の検出結果を出力する検出手段と、を含む。

　本発明のグラフ構造変化検出方法は、複数のノードと、当該複数のノードのうちの各ノード間の関係の程度を示すリンクと、によって表されるグラフデータを受け付けた場合に、当該グラフデータに基づいて、前記ノードごとに、当該ノードの重要性の程度を示す重要度情報を計算する計算ステップと、前記ノードのそれぞれを、当該ノードの重要度情報に基づいて、複数のグループのいずれかに分け、前記ノードのグループ分けの結果を、前記グラフデータのグラフ構造情報として出力する推定ステップと、前記グラフデータのグラフ構造情報と、構造変化検出用の基準グラフ構造情報と、を比較して、前記グラフデータの構造変化を検出し、当該グラフデータの構造変化の検出結果を出力する検出ステップと、を含む。

　本発明のプログラムは、コンピュータを、複数のノードと、当該複数のノードのうちの各ノード間の関係の程度を示すリンクと、によって表されるグラフデータを受け付けた場合に、当該グラフデータに基づいて、前記ノードごとに、当該ノードの重要性の程度を示す重要度情報を計算する計算手段、前記ノードのそれぞれを、当該ノードの重要度情報に基づいて、複数のグループのいずれかに分け、前記ノードのグループ分けの結果を、前記グラフデータのグラフ構造情報として出力する推定手段、および、前記グラフデータのグラフ構造情報と、構造変化検出用の基準グラフ構造情報と、を比較して、前記グラフデータの構造変化を検出し、当該グラフデータの構造変化の検出結果を出力する検出手段、として機能させる。

　本発明によれば、ノードの活性度つまり重要度に基づいてグラフ構造の変化を検出することが可能になる。

入力データ関する、リンク数に対するノード頻度の冪分布の一例を示した図である。本発明の第１の実施の形態に関わるグラフ構造変化点検出装置１００を示したブロック図である。無向グラフデータの一例を示す図である。有向グラフデータの一例を示す図である。グラフ構造推定装置１２０Ａを示したブロック図である。ノード重要度に対するノード重要度の冪分布の領域分割の一例を示す図である。分割ルールに従って冪分布を分割した場合の、冪分布の分割に従ってグラフがどのように分割されるかを表す一例を示す図である。グラフ構造推定装置１２０Ｂを示したブロック図である。ノード重要度分布をヒストグラム近似によって分割する一例を示す図である。グラフ構造推定装置１２０Ｃを示したブロック図である。グラフの分割と各部分グラフに対する確率分布の割り当ての一例を示す図である。本グラフ構造推定装置１２０Ｄを示したブロック図である。ノード重要度分布に従った分割と、各部分グラフの分割の一例を示す図である。グラフ構造変化点検出装置１００の動作を説明するためのフローチャートである。本発明の第２の実施の形態に関わるグラフ構造変化点検出装置２００を示したブロック図である。グラフ構造推定装置２２０の一例を示したブロック図である。グラフ構造変化点検出装置２００の動作を説明するためのフローチャートである。本発明の第３の実施の形態に関わるグラフ構造変化点検出装置３００を示したブロック図である。

符号の説明

　　　１００、２００、３００　グラフ構造変化点検出装置
　　　１０１、２０１、３０１　検出部
　　　１１０、２１０　ノード重要度計算装置
　　　１２０、１２０Ａ～１２０Ｄ、２２０、３１０　グラフ構造推定装置
　　　１２０ａ　　分割用データ記憶部
　　　１２０ｂ　　グラフ分割計算部
　　　１２０ｃ　　分割最適化用データ記憶部
　　　１２０ｄ　　ノード重要度分割最適化部
　　　１３０、３２０　グラフ構造記憶装置
　　　１４０、２３０、３３０　構造変化点検出装置
　　　１５０　　　構造変化点出力装置
　　　３１１、４１１　符号長計算部記憶装置
　　　３１２　　　グラフ符号長計算部
　　　３１３　　　ノード重要度分割符号長計算部
　　　３１４、４１３、５１３　最適パラメータ計算装置
　　　４１２　　　部分グラフ分割符号長計算部
　　　５１１　　　グラフ列符号長計算部記憶装置
　　　５１２　　　モデル列符号長計算部記憶装置

　次に、本発明の実施の形態について、図面を参照して詳細に説明する。

　［第１の実施の形態］
　図２は、本発明の第１の実施の形態に関わるグラフ構造変化点検出装置１００を示したブロック図である。なお、グラフ構造変化点検出装置１００は、一般的にグラフ構造変化検出装置と呼ぶことができる。

　図２を参照すると、グラフ構造変化点検出装置１００は、ノード重要度計算装置１１０と、グラフ構造推定装置１２０と、グラフ構造記憶装置１３０と、構造変化点検出装置１４０と、構造変化点出力装置１５０とを備えている。グラフ構造記憶装置１３０と構造変化点検出装置１４０と構造変化点出力装置１５０は、検出部１０１に含まれる。

　グラフ構造変化点検出装置１００は、例えば、ＣＰＵ、メモリおよび入出力装置を含むコンピュータである。グラフ構造推定装置１００は、ハードディスクまたはメモリに記録されたプログラムに従って動作する。ハードディスクまたはメモリは、一般的に、コンピュータにて読み取り可能な記録媒体と呼ぶことができる。

　グラフ構造変化点検出装置１００は、プログラムを記録媒体から読み取り実行することによって、ノード重要度計算装置１１０、グラフ構造推定装置１２０、グラフ構造記憶装置１３０、構造変化点検出装置１４０、および、構造変化点出力装置１５０として機能する。

　グラフ構造変化点検出装置１００は、グラフデータ１６０を受け付け、グラフデータ１６０にて形成されるグラフの構造を推定する。グラフ構造変化点検出装置１００は、その推定結果を、構造変化検出用の基準グラフ構造情報と比較し、その比較結果を、構造変化点検出結果１７０として出力する。

　グラフデータ１６０は、複数のノードと、複数のノードのうちの各ノード間の関係の程度（度合い）を示すリンクと、によって表される。以下では、リンクは、各ノード間の関係の程度（度合い）を数値で示すこととする。

　ここで、グラフデータ１６０について説明する。

　グラフデータ１６０としては、一般に、無向グラフデータと有向グラフデータが存在する。

　図３は、無向グラフデータの一例を示した図である。

　図３において、無効グラフデータは、複数のノード２ａと、リンク２ｂと、を含む。

　リンク２ｂ内の数値「１」は、図３に示した表中で対応するノード間にリンクがある事を表す。例えば、ノード１とノード２の間の数値は「１」なので、ノード１とノード２の間にリンクがあることが表される。

　リンク２ｂ内の数値「０」は、図３に示した表中で対応するノード間にリンクがない事を表す。例えば、ノード１とノードｎの間の数値は「０」なので、ノード１とノードｎの間にリンクがないことが表される。

　無向グラフでは、ノード１からノード２へのリンクと、ノード２からノード１へのリンクの間に、区別はない。このため、無向グラフデータの表内（図３）のリンクにて表現される値は、ノード間のインデックス（ノード番号）が入れ替わっても同じ値となり、行の数（ｎ）と列の数（ｎ）は等しい。

　この例では、リンクは「１」または「０」の２値をとるが、リンクが示す数値として、リンクの強さを表す実数値が用いられてもよい。

　図４は、有向グラフデータの一例を示した図である。

　有向グラフでは、行と列が同じノードを表す必要はない。図４は、例えば、行ノード１から列ノード２へのリンクの強さが「０．５」である事を表している。これに付随し、行の数（ｎｒ）と列の数（ｎｃ）も等しい必要はない。

　グラフデータの具体的な例を挙げると、Ｗｅｂページのハイパーリンクを分析する場合、ノードは各Ｗｅｂページであり、リンクはＷｅｂページ間のハイパーリンクの有無とする事が考えられる。

　また、ＳＮＳネットワークの分析をする場合には、ノードは各ユーザーであり、リンクはユーザー間の友人登録の有無とする事が考えられる。

　また、ＬＡＮの解析をする場合には、ノードは各ネットワーク機器であり、リンクは機器間のトラフィック量などとする事が考えられる。

　以降では、グラフデータはＧと表記し、（行）ノードｉから（列）ノードｊへのリンクをｇ_ｉｊと表記する。

　また、|Ｇ|は、グラフの疎密の度合いを表す量で、例えば（１）式で定義可能である。

　（１）式では、ｇ_ｉｊが「１」または「０」をとる場合には、|Ｇ|は、グラフ中のリンクの総数を意味する。

　図２に戻って、ノード重要度計算装置１１０は、一般的に計算手段と呼ぶことができる。

　ノード重要度計算装置１１０は、グラフデータ１６０を受け付けると、グラフデータ１６０に基づいて、グラフデータ１６０に示されたノードごとに、ノードのグラフにおける重要性あるいは活性の程度（度合い）を示すノード重要度を計算する。

　例えば、ノード重要度計算装置１１０は、グラフデータ１６０を時系列で受け付け、グラフデータ１６０を受け付けるたびに、受け付けられたグラフデータ１６０に基づいて、そのグラフデータ１６０に表されたノードごとにノード重要度を計算する。なお、ノード重要度は、重要度情報の一例である。

　ノード重要度計算装置１１０は、予め、各ノードのノード重要度を計算するためのルールを記憶し、そのルールにしたがって、各ノードのノード重要度を計算してもよい。

　ノード重要度としては、ノードのグラフにおける重要性あるいは活性の程度（度合い）を計算するための任意の指標を利用することが可能である。

　例えば、ノード重要度として各ノードの持つリンクの頻度を利用する場合を説明すると、ノード重要度計算装置１１０は、リンクが示す数値のうち、同一のノードに関連する数値の総和を、ノードごとに計算する。ノード重要度計算装置１１０は、ノードごとに計算された総和を、各ノードのノード重要度として用いる。

　また例えば、ノード重要度として各ノードに対するページランクを利用する場合を説明すると、ノード重要度計算装置１１０は、非特許文献２に示されるページランクアルゴリズムによって、各ノードに対するページランクを計算する。ノード重要度計算装置１１０は、ノードごとに計算されたページランクを、各ノードのノード重要度として用いる。

　また例えば、ノード重要度として各ノードに対するハブ指標またはオーソリィテ指標（非特許文献７参照）を利用する場合を説明すると、ノード重要度計算装置１１０は、非特許文献７に示されるHITS（Hyperlink-Induced　Topic　Search）アルゴリズムによって、各ノードに対するハブ指標またはオーソリティ指標を計算する。ノード重要度計算装置１１０は、ノードごとに計算されたハブ指標またはオーソリティ指標を、各ノードのノード重要度として用いる。

　以下、具体的にノード重要度の計算方法の例を説明する。

　なお、ノード重要度の計算方法として、任意の方法を利用する事が可能である。

　例えば、ノード重要度として各ノードの持つリンクの頻度を利用する場合を説明すると、ノード重要度計算装置１１０は、行ノードｉに対するノード重要度ｘ_ｒ，ｉを、（２）式にしたがって求められる絶対リンク頻度、または、（３）式にしたがって求められる相対リンク頻度として計算する事が可能である。

　なお、ノード重要度計算装置１１０は、例えば、（１）式と（２）式と（３）式を記憶している。

　また例えば、ノード重要度としては、非特許文献２に示されるページランク、または、非特許文献７に示されるハブ指標またはオーソリティ指標などを利用することが可能である。その場合には、ノード重要度計算装置１１０は、ページランクの計算式、ハブ指標またはオーソリティ指標の計算式を記憶している。

　同様の手順で計算される列ノードｊに対するノード重要度をｘ_ｃ，ｊと表記する事にする。無向グラフの場合には、行と列の区別がないため、ノードｉのリンク頻度を単にｘ_ｉと表記する。

　ノード重要度計算装置１１０は、各ノードのノード重要度を示す重要度情報と、グラフデータ１６０とを、グラフ構造推定装置１２０に提供する。

　グラフ構造推定装置１２０は、一般的に推定手段と呼ぶことができる。

　グラフ構造推定装置１２０は、重要度情報（各ノードのノード重要度）に基づいて、各ノードを複数のグループのいずれかに分ける。ノードのグループ分けは、グラフデータ１６０にて構成されるグラフを、各グループに分割することを意味する。グラフ構造推定装置１２０は、各ノードのグループ分けの結果を、グラフデータ１６０のグラフ構造情報として出力する。

　例えば、グラフ構造推定装置１２０は、ノード重要度の値域（ノード重要度の取りうる最小値から最大値まで）を、１つまたは複数の分割用ノード重要度（分割用ノード重要度）を用いて分割することによって、複数のグループ（この場合、ノード重要度の各分割領域）、および、分割領域に含まれるノードを決定する。なお、分割領域に含まれるノードを決定することは、各ノードを複数のグループに分けることを意味する。

　また、グラフ構造推定装置１２０は、グラフデータ１６０ごとに各ノードの重要度情報が計算されるたびに、同一グラフデータ内の各ノードを、そのノードの重要度情報に基づいて、複数のグループのいずれかに分け、ノードのグループ分けの結果を、グラフデータのグラフ構造情報として出力する。

　なお、グラフ構造推定装置１２０は、予め、分割用のルールを記憶し、その分割用のルールにしたがって、ノード重要度と、グラフデータ１６０と、に基づいて、各ノードを複数のグループに分けてもよい。

　グラフ構造推定装置１２０は、グラフの分割結果に関する情報（例えば、グラフの分割数、分割方法、および、各ノードが属している分割領域を示す情報）、つまり、グラフデータ１６０のグラフ構造情報と、重要度情報とを、グラフ構造記憶装置１３０あるいは構造変化点検出装置１４０に提供する。

　以下、具体的にグラフの構造の推定方法の例を幾つか説明する。

　（グラフ構造推定装置１２０の第１実施形態）
　図５は、グラフ構造推定装置１２０の第１実施形態であるグラフ構造推定装置１２０Ａを示したブロック図である。グラフ構造推定装置１２０Ａは、一般的に推定手段と呼ぶことができる。グラフ構造推定装置１２０Ａは、分割用データ記憶部１２０ａと、グラフ分割計算部１２０ｂとを含む。

　分割用データ記憶部１２０ａは、一般的に分割用データ記憶手段と呼ぶことができる。分割用データ記憶部１２０ａは、ノード重要度計算装置１１０で計算されたノード重要度を用いて、グラフデータ１６０にて形成されるグラフを分割するためのルール（例えば、ノードの分類条件）を記憶する。

　グラフ分割計算部１２０ｂは、一般的にグラフ分割計算手段と呼ぶことができる。グラフ分割計算部１２０ｂは、分割用データ記憶部１２０ａ内のルールと、ノード重要度と、グラフデータ１６０とを用いて、グラフデータ１６０にて形成されるグラフを分割する。

　グラフ分割計算部１２０ｂは、分割用データ記憶部１２０ａ内のルールにしたがって、１つまたは複数の分割用ノード重要度を設定し、ノード重要度を、分割用ノード重要度を用いて分割する。

　グラフを分割するためのルールとしては、例えば、ノード重要度が、ノードの持つリンク数を表す場合、「リンク数が１００以上→領域１、リンク数が５０以上１００未満→領域２、リンク数が５０未満→領域３」などのように、ノードの分類先（領域；グループ）をリンク数に応じて絶対的に決めるルールも考えられる。この場合、リンク数＝１００、および、リンク数＝５０が、分割用ノード重要度となる。

　また、グラフを分割するためのルールとしては、例えば、ノード重要度が、ノードの持つリンク数を表す場合、「リンク数が上位３０％に入る→領域１、リンク数が上位５０％未満→領域２」などと、ノードの分類先（領域；グループ）をリンク数に応じて相対的に決めるルールも考えられる。この場合、上位３０％に相当するリンク数、および、上位５０％に相当するリンク数が、分割用ノード重要度となる。

　図６は、ノード重要度を２つの分割用ノード重要度を用いて、３分割する一例を模式的に示した図である。縦軸は、横軸のノード重要度に対応するノードの数を表している。

　この場合には、領域１に属するノードは、リンクを少数のみ持つ通常のノード、領域３に属するノードは、リンクを多数持つハブ的なノード、領域２に属するノードは、その中間のノードと解釈可能である。

　また、図７は、有向グラフの行方向と列方向のそれぞれを、分割用ノード重要度を用いて分割した場合に、グラフがどのように分割されるのかを表した図である。

　図７では、便宜的に、各行および列がノード重要度に従って整列されている事に注意する。

　図５に戻って、グラフ分割計算部１２０ｂは、重要度情報と、グラフの分割結果に関する情報（グラフ構造情報）を、例えば、グラフ構造記憶装置１３０と構造変化点検出装置１４０に提供する。

　（グラフ構造推定装置１２０の第２実施形態）
　図８は、グラフ構造推定装置１２０の第２実施形態であるグラフ構造推定装置１２０Ｂを示したブロック図である。グラフ構造推定装置１２０Ｂは、一般的に推定手段、分割符号長計算手段および分割制御手段と呼ぶことができる。グラフ構造推定装置１２０Ｂは、分割最適化用データ記憶部１２０ｃと、ノード重要度分割最適化部１２０ｄとを含む。

　分割最適化用データ記憶部１２０ｃは、一般的に分割最適化用データ記憶手段と呼ぶことができる。ノード重要度分割最適化部１２０ｄは、一般的にノード重要度分割最適化手段と呼ぶことができる。

　分割最適化用データ記憶部１２０ｃは、グラフを分割するための単純なルールではなく、入力データ（グラフデータ）に対してグラフの分割を最適化するための計算手順を記憶している。

　グラフ構造推定装置１２０Ｂ（具体的には、ノード重要度分割最適化部１２０ｄ）は、分割最適化用データ記憶部１２０ｃ内の計算手順に従って、グラフの最適な分割モデルを計算する。

　最適化の対象となるパラメータとしては、例えば、分割数、および、各領域の大きさなどがある。このパラメータによって、分割用ノード重要度が決定される。

　グラフ構造推定装置１２０Ｂは、図６であらわされるような、ノード重要度の値域の分割モデル（分割用ノード重要度の設定）を、任意の最適化方法（最適化基準）、例えば、最小記述長原理、赤池情報量基準、または、ベイズ情報量基準を利用して、グラフデータに基づき計算する事が可能である。

　分割モデルを決める方法としては、例えば、図９に示されるように、ノード重要度の値域におけるノード重要度の分布（ノード重要度分布）をヒストグラムによって近似し、ヒストグラムの各領域にグラフの分割領域（グループ）を対応させる方法が考えられる。

　ノード重要度分布をヒストグラムによって近似する方法に関しては、例えば、最小記述長原理に従った方法（例えば非特許文献５）、または、赤池情報量基準に従った方法（例えば非特許文献６）などを利用する事が可能である。

　例えば、グラフ構造推定装置１２０Ｂは、分割用ノード重要度の個数および各分割用ノード重要度の値（ノード重要度の値域の分割結果）を分割モデルとし、互いに異なる分割モデルごとに、ノード重要度および分割モデルを符号化するために必要な分割記述長を算出する。この際、分割記述長の中には、分割モデル自身の記述長も含まれていることに注意が必要である。

　グラフ構造推定装置１２０Ｂは、互いに異なる分割モデルの中から、分割記述長が最小になる最適化分割モデルを特定し、ノードのそれぞれを、重要度情報に基づいて、最適化分割モデルにて特定される複数のグループのいずれかに分ける。

　なお、入力されたグラフデータ１６０が有向グラフデータの場合には、グラフ構造推定装置１２０Ｂは、行方向と列方向のノード重要度の分布のそれぞれをヒストグラムによって近似して分割を最適化する事が可能である。

　この実施形態の場合、グラフ構造推定装置１２０Ｂは、互いに異なる分割モデルごとに、ノード重要度および分割モデルを符号化するために必要な分割記述長を算出する。グラフ構造推定装置１２０Ｂは、互いに異なる分割モデルの中から、分割記述長が最小になる最適化分割モデルを特定し、ノードのそれぞれを、ノードの重要度情報に基づいて、最適化分割モデルにて特定される複数のグループのいずれかに分ける。

　この場合、分割モデルの最適化が可能になる。

　なお、グラフ構造推定装置１２０Ｂは、動的計画法を用いて、最適化分割モデルを特定することが望ましい。

　また、グラフ構造推定装置１２０Ｂは、分割記述長を小さくする方向へ、分割結果を更新することを繰り返すことによって、最適化分割モデルを特定してもよい。

　また、グラフ構造推定装置１２０Ｂは、動的計画法を用いて計算された分割結果を初期値とし、初期値から分割記述長を小さくする方向へ分割結果を更新することを繰り返すことによって、最適化分割モデルを特定してもよい。

　なお、これらの特定方法については、後述するグラフ構造推定装置１２０の第３実施形態の説明内の「グラフ符号長とノード重要度分割の符号長の和」を「ノード重要度分割の符号長（分割記述長）」と読み代えることにより説明可能である。

　（グラフ構造推定装置１２０の第３実施形態）
　図１０は、グラフ構造推定装置１２０の第３実施形態であるグラフ構造推定装置１２０Ｃを示したブロック図である。グラフ構造推定装置１２０Ｃは、一般的に推定手段と呼ぶことができる。グラフ構造推定装置１２０Ｃは、符号長計算部記憶装置３１１と、最適パラメータ計算装置３１４とを備えている。符号長計算部記憶装置３１１は、グラフ符号長計算部３１２およびノード重要度分割符号長計算部３１３を記憶している。

　グラフ構造推定装置１２０Ｃは、グラフデータ１６０と、ノード重要度計算装置１１０で計算されたノード重要度情報３１５とを入力とし、グラフ構造情報１８０を出力する。

　符号長計算部記憶装置３１１は、一般的に符号長計算手段と呼ぶことができる。

　ノード重要度分割符号長計算部３１３は、一般的に分割符号長計算手段と呼ぶことができる。また、グラフ符号長計算部３１２は、一般的にグラフ符号長計算手段と呼ぶことができる。

　なお、ノード重要度分割符号長計算部３１３とグラフ符号長計算部３１２は、例えば、コンピュータにて実行されたときに所定の計算を実行するプログラムである。

　ノード重要度分割符号長計算部３１３とグラフ符号長計算部３１２は、あるパラメータにおける、ノード重要度情報およびノード重要度の分割モデルを符号化するために必要な記述長と、その分割の元でグラフを符号化するための記述長を計算するための手順を示す。

　例えば、ノード重要度分割符号長計算部３１３は、分割用ノード重要度を用いたノード重要度の値域の分割結果を分割モデルとし、互いに異なる分割モデルごとに、ノード重要度情報および分割モデルを符号化するために必要な分割記述長を算出する。この際、分割記述長の中には、分割モデル自身の記述長も含まれていることに注意が必要である。

　また、グラフ符号長計算部３１２は、ノードのそれぞれを、ノード重要度情報に基づいて、分割モデルにて特定される複数のグループのいずれかに分けた際に、ノードのグループ分けによって分割されたグラフを符号化するためのグラフ記述長を、分割モデルごとに算出する。

　ノード重要度の分割結果を符号化するために必要な記述長は、グラフ構造推定装置１２０Ｂが行う方法と同様の方法で計算可能である。

　分割モデルが与えられると、グラフＧは、図１１で示されるように、幾つかの部分グラフへ分割される（図１１では、Ｇ_１，１からＧ_２，３まで）。

　このとき、グラフ構造推定装置１２０Ｃは、各部分グラフに対して、リンクの発生する確率分布をそれぞれ割り当てる（図１１ではｐ_１，１からｐ_２，３まで）。

　リンクが「１」または「０」の２値の場合には、リンクの発生する確率分布は、ベルヌーイ分布とする事ができる。

　また、リンクが「０」から「１」の間の値をとる場合には、リンクの発生する確率分布は、ベータ分布とする事が可能である。

　また、リンクが「０」以上の値をとる場合には、指数分布やガンマ分布とする事が可能である。

　このように、グラフ構造推定装置１２０Ｃは、リンクの定義によって、それぞれ適切な確率分布を割り当てる事ができる。

　グラフ符号長とは、各部分グラフのリンクを、割り当てられた確率（分布）によって生成した場合の符号長を指す。

　各分割領域はノードとしての性質が異なるため、各領域内および各領域間のインタラクションは異なるモデルで表現する事が自然である。

　ノード重要度情報だけでなく、グラフの符号化を考える事によって、それらのインタラクションを考慮した領域の分割を行なう事が可能となる。

　最適パラメータ計算装置３１４は、一般的に分割制御手段と呼ぶことができる。

　最適パラメータ計算装置３１４は、グラフデータ１６０とノード重要度情報３１５を読み込むと、符号長計算部記憶装置３１１に記憶されている計算部３１２および３１３を読み込み、計算部３１２および３１３を用いて、グラフ符号長とノード重要度分割の符号長の和を最小とするパラメータ（分割モデル）を計算する。

　以下で、具体的な計算手順に関する一例を無向グラフと有向グラフの場合に関してそれぞれ説明する。
[無向グラフの場合の一例]　
　本実施形態では、無向グラフに関し、リンクが「１」または「０」の２値をとり、分割数および各領域の大きさ（分割モデル）を最適化する場合を説明する。

　今、ノードはノード重要度に従ってソートされている、すなわちｘ_１≦…≦ｘ_ｎとする。ただし、ｎはノード数をあらわす。

　また、ｘ^ｎ＝ｘ_１，…，ｘ_ｎとし、ｘ_ｉの値域は［０，Ｒ］とする。

　ノード重要度の分布をヒストグラムによって近似する場合には（グラフ構造推定装置１２０Ｂにも対応）、横軸（ノード重要度）を離散化する必要がある。このため、その最小刻み幅をｄとする。この時、各領域の切れ目をａ＝ｋｄと表す。ただし、ａ＝（ａ_１，…，ａ_ｍ－１）とし、ｋ＝（ｋ_１，…，ｋ_ｍ－１）。

　この時、各領域は［０，ａ_１］，（ａ_１，ａ_２］，…，（ａ_ｍ－１，Ｒ］と指定される。いま、ａ_０＝０、ａ_ｍ＝Ｒと定義し、Ｒ_ｉ＝ａ_ｉ－ａ_ｉ－１とする。また、各領域に属するデータの個数をｎ_ｉとする。また、領域の大きさの最小値をｄκとし、ｒ＝Ｒ／ｄと定義する。

　ノード重要度の分割に必要な記述長は、（４）式から（９）式で定義する事が可能である。ただし、ｌｏｇ*ｄは、ｌｏｇ　ｄ＋ｌｏｇｌｏｇ　ｄ＋・・・として正のｌｏｇｌｏｇ・・・ｌｏｇ　ｄを足した量で、ｄの分布が未知の場合に最小の記述長を与える量であることが知られている。

（５）式は、ｘ^ｎを符合化するための記述長を表し、（８）式および（９）式がモデルを記述するために必要な記述長を表している。ここで言うモデルとは、分割の数（ｍ）および分割方法（ｋ，ｒ，ｄ，κ）を指す。

　ｍ，ｒ，ｄ，κが与えられると，グラフ符号長は（１０）式、（１１）式で定義する事が可能である。ただし、|Ｇ_ｉ，ｊ|は、部分グラフＧ_ｉ，ｊに含まれるリンクの総数、θ_ｉ，ｊは、部分グラフＧ_ｉ，ｊに割り当てられたベルヌーイ分布ｐ_ｉ，ｊに関する１の確率を表す。

　また、グラフを符合化するためには、ｎ_ｉおよびｎ_ｊも符合化する必要があるが、ｎ_ｉおよびｎ_ｊの符号長は（５）式に含まれているため、Ｌ_Ｇには含めていない。

　最適パラメータ計算装置３１４は、（１２）式の最適化問題を解く事によって最適な分割パラメータ（分割モデル）を決定する。

　（１２）式の最適化方法は、ｍ_ｍｉｎ≦ｍ≦ｍ_ｍａｘ、ｄ_ｍｉｎ≦ｄ≦ｄ_ｍａｘ、κ_ｍｉｎ≦κ≦κ_ｍａｘとパラメータの範囲を指定し、パラメータの組み合わせに対して網羅的に（１２）式を計算して最適なパラメータを計算する方法が考えられる。

　また例えば、効率的な局所最小化解を探索するために、以下の勾配法による手順に従って、L_h+L_Gを小さくする方向へパラメータを動かしながら解を探索する方法が考えられる。

　まず、分割ノード重要度kをk=k⁰と初期化する。

　次に、p回目の繰り返しにおける分割ノード重要度をk^pとすると、k^p=min{k^p-1 _q+,　k^p-1 _q-}　としてk^pを計算する。ただし、k^p _q+=(k^p ₁,　k^p ₂,　…,　k^p _q　+　1,　…,　k^p _m-1)　およびk^p _q-=(k^p ₁,　k^p ₂,　…,　k^p _q　-　1,　…,　k^p _m-1)であり、これはp回目の繰り返しにおけるq番目の分割ノード重要度を正または負の方向へ一つずらした分割ノード重要度を表す。このように探索を行なうと、（８）式から計算されるkの符号長はL(k^p)　<=　L(k^p-1)である。

　以上の繰り返しを、L(k^p)　=　L(k^p-1)が満たされるまで探索を行う事で、L_h+L_Gを局所的に最小する解を効率よく計算する事が可能である。

　以上の探索を、ｍ_ｍｉｎ≦ｍ≦ｍ_ｍａｘ、ｄ_ｍｉｎ≦ｄ≦ｄ_ｍａｘ、κ_ｍｉｎ≦κ≦κ_ｍａｘで指定された範囲のパラメータの組み合わせに対して行い、（１２）式を近似的に計算する。

　この場合、最適パラメータ計算装置３１４は、分割記述長とグラフ記述長の和を小さくする方向へ分割結果を更新することを繰り返すことによって、最適化分割モデルを特定することになる。

　また例えば、以下の手順に従って動的計画問題として再帰的に最適パラメータを近似計算する方法が考えられる。

　まず、ａ’＝（ａ,τ）とすると、（５）式および（１０）式は、（１３）式および（１４）式のように分解できる。ただし、ｎ（Ｒ）はノード重要度が［０，Ｒ］区間に含まれるノードの数とする。

　この時、Ｌ_ｍ（Ｒ）を（１５）式によって定義すると、（１３）式と（１４）式の和は（１６）式の動的計画問題を解く事によって最小化可能である。この動的計画問題は、G_m+1,jがa’に依存するため、（１３）式と（１４）式の和を厳密に最小化する事はできないが、近似解を得る事が可能である。

　（１２）式の最小化の対象は、（１３）式と（１４）式の和に、Ｌ（ｋ）とＬ（ｍ，ｒ，ｄ，κ）を加えたものなので、動的計画法によって（１２）式の最小化問題の探索空間を狭める事が可能である。

　さらに、前記勾配法による探索と動的計画法による探索を組み合わせる事も考えられる。これは、前述の動的計画問題を解いて得られた解を、勾配法による探索の初期値として利用する。これによって、初期値をランダムに決定するよりもよい初期値が得られ、よりよい局所解を得る事が可能となる。

　この場合、最適パラメータ計算装置３１４は、動的計画法を用いて計算された分割結果を初期値とし、初期値から分割記述長とグラフ記述長の和を小さくする方向へ分割結果を更新することを繰り返すことによって、最適化分割モデルを特定することになる。
［有向グラフの場合の一例]　
　本実施形態では、有向グラフに関し、リンクが「１」または「０」の２値をとり、分割数および各領域の大きさを最適化する場合を説明する。

　この例の説明では、無向グラフの場合の例と同様の表記を用い、rおよびcは、行および列に対する変数である事を表すとする。

　有向グラフの場合、ノード重要度、グラフ、モデルの符号長の総和は、（１７）式で与えられる。

　（１７）式の右辺の初項および第２項は、（５）式と同様に計算される行及び列のノード頻度分布符号長であり、第２項は（１８）式で与えられるグラフの符号長であり、第４項から第７項は（８）式および（９）式と同様に計算されるモデルの符号長を表している。

　最適パラメータ計算装置３１４は、（１７）式のＬを最小化するパラメータm_r,r_r,d_r,κ_r,　m_c,r_c,d_c,κ_c,を計算する事で、最適なグラフ分割を計算可能である。

　最適化の方法は、パラメータの組み合わせに対して網羅的に（１７）式を計算して、Ｌを最小とするパラメータの組み合わせを選択する方法が考えられる。

　また例えば、無向グラフと同様にして、列方向および行方向の分割に対して勾配法による探索を繰り返す事によって局所的な解を計算する事も可能である。

　また例えば、無向グラフと同様にして、（１７）式を最小化する問題は動的計画問題に帰着させる事が可能であり、最適パラメータ計算装置３１４は、動的計画法を用いて最適パラメータを計算する事も可能である。

　最適パラメータ計算装置３１４は、最小記述長原理に基づき、ノード重要度の値域の分割を符号化するために必要な記述長と、その分割の元でグラフを符号化するための記述長の和を最小とする分割パラメータ（分割数や各領域の大きさなど）を最適化する。

　本実施の形態では、最適化の基準として、最小記述長原理を用いた例を説明しているが、最適化の基準として、赤池情報量基準やベイズ情報量基準など、その他の類似の基準を用いる事も可能である。

　本実施形態によれば、ノード重要度分割符号長計算部３１３は、ノード重要度の値域の分割結果を分割モデルとし、互いに異なる分割モデルごとに、ノード重要度情報および分割モデルを符号化するために必要な分割記述長を算出する。

　グラフ符号長計算部３１２は、ノードのそれぞれを、ノード重要度情報に基づいて、分割モデルにて特定される複数のグループのいずれかに分けた際に、ノードのグループ分けによって分割されたグラフを符号化するためのグラフ記述長を、分割モデルごとに算出する。

　最適パラメータ計算装置３１４は、互いに異なる分割モデルの中から、分割記述長とグラフ記述長の和が最小になる最適化分割モデルを特定し、ノードのそれぞれを、ノード重要度情報に基づいて、最適化分割モデルにて特定される複数のグループのいずれかに分ける。

　このため、グラフ符号長を考慮しながら、最適な分割モデルを特定することが可能になる。

　（グラフ構造推定装置１２０の第４実施形態）
　図１２は、グラフ構造推定装置１２０の第４実施形態であるグラフ構造推定装置１２０Ｄを示したブロック図である。グラフ構造推定装置１２０Ｄは、一般的に推定手段と呼ぶことができる。グラフ構造推定装置１２０Ｄは、符号長計算部記憶装置４１１と、最適パラメータ計算装置４１３とを備えている。符号長計算部記憶装置４１１は、ノード重要度分割符号長計算部３１３および部分グラフ分割符号長計算部４１２を記憶している。

　グラフ構造推定装置１２０Ｄは、グラフデータ１６０と、ノード重要度計算装置１１０で計算されたノード重要度情報３１５とを入力とし、グラフ構造情報１８０を出力する。

　図１０に示したグラフ構造推定装置１２０Ｃとの機能的な相違点は、グラフ構造推定装置１２０Ｄでは、グラフをノード重要度に従った分割をして得られる部分グラフを、さらに部分グラフへ分割する点である。

　グラフ構造推定装置１２０Ｄは、ノード重要度の値域の分割モデル（分割用ノード重要度の設定）を、任意の最適化方法（最適化基準）、例えば、最小記述長原理、赤池情報量基準、または、ベイズ情報量基準を利用して、グラフデータに基づき計算する事が可能である。

　図１３は、本実施の形態のグラフ分割の一例を示している。図１３の左図は、入力されたグラフをノード重要度に従って分割する例であり、右図は、部分グラフＧ_２，２がさらにその内部で分割されている事を示している。

　符号長計算部記憶装置４１１は、一般的に符号長計算部記憶手段と呼ぶことができる。

　部分グラフ分割符号長計算部４１２は、一般的に部分グラフ分割符号長計算手段と呼ぶことができる。

　なお、ノード重要度分割符号長計算部３１３と部分グラフ分割符号長計算部４１２は、例えば、コンピュータにて実行されたときに所定の計算を実行するプログラムでもよい。

　ノード重要度分割符号長計算部３１３と部分グラフ分割符号長計算部４１２は、あるパラメータにおける、ノード重要度の値域の分割を符号化するために必要な記述長と、その分割の元で各部分グラフをさらに分割し、それを符号化するための記述長を計算するための手順を示す。

　例えば、部分グラフ分割符号長計算部４１２は、ノードのそれぞれを、ノードの重要度情報に基づいて、分割モデルにて特定される複数のグループのいずれかに分けた際に生じる各グループを、グループ内のノード間の関係に基づいて再分割した際に、各グループでの再分割の状態を符号化するために必要な再分割符号長を、分割モデルごとに算出する。

　ノード重要度の値域の分割を符号化するために必要な記述長は、図８に示したグラフ構造推定装置１２０Ｂが行う方法と同様の方法で計算可能である。

　部分グラフの分割とその符合化方法は、例えば非特許文献１で提案された分割手法とその記述長の計算手段や、公知技術である木構造を用いた分割手法とその記述長の計算手段などを利用する事が可能である。

　最適パラメータ計算装置４１３は、一般的に分割制御手段と呼ぶことができる。

　最適パラメータ計算装置４１３は、グラフデータ１６０とノード重要度情報３１５を読み込むと、符号長計算部記憶装置４１１に記憶されている計算部３１３および４１２を読み込み、計算部３１３および４１２を用いて、部分グラフ分割の符号長とノード重要度の値域の分割の符号長の和を最小とするパラメータを計算する。

　例えば、最適パラメータ計算装置４１３は、互いに異なる分割モデルの中から、分割記述長と再分割符号長の和が最小になる最適化分割モデルを特定し、ノードのそれぞれを、ノードの重要度情報に基づいて、最適化分割モデルにて特定される複数のグループのいずれかに分ける。

　本実施形態によれば、ノード重要度分割符号長計算部３１３は、分割用ノード重要度を用いたノード重要度の値域の分割結果を分割モデルとし、互いに異なる分割モデルごとに、ノード重要性および分割モデルを符号化するために必要な分割記述長を算出する。

　部分グラフ分割符号長計算部４１２は、ノードのそれぞれを、ノードのノード重要度情報に基づいて、分割モデルにて特定される複数のグループのいずれかに分けた際に生じる各グループを、グループ内のノード間の関係に基づいて再分割した際に、各グループでの再分割の状態を符号化するために必要な再分割符号長を、分割モデルごとに算出する。

　最適パラメータ計算装置４１３は、互いに異なる分割モデルの中から、分割記述長と再分割符号長の和が最小になる最適化分割モデルを特定し、ノードのそれぞれを、ノード重要度情報に基づいて、最適化分割モデルにて特定される複数のグループのいずれかに分ける。

　このため、部分グラフの再分割を考慮しながら、最適な分割モデルを特定することが可能になる。

　図２に戻って、検出部１０１は、一般的に検出手段と呼ぶことができる。

　検出部１０１は、グラフ構造推定装置１２０からのグラフ構造情報と、予め指定された基準グラフ構造情報と、を用いて、グラフデータの構造変化を検出する。なお、基準グラフ構造情報は、グラフ構造の変化点検出の基準となる。また、検出部１０１は、過去にグラフ構造推定装置１２０から出力されたグラフ構造情報を、基準グラフ構造情報として用いてもよい。検出部１０１は、そのグラフデータの構造変化の検出結果を出力する。

　グラフ構造記憶装置１３０は、一般的に記憶手段と呼ぶことができる。

　グラフ構造記憶装置１３０は、構造変化検出用の基準グラフ構造情報を記憶する。なお、グラフ構造推定装置１２０からのグラフ構造情報が、グラフ構造記憶装置１３０内に記憶されてもよい。

　基準グラフ構造情報は、例えば、事前に指定されたグラフ構造とすることも可能である。また、基準グラフ構造情報は、例えば、ある時刻（検出対象時刻）からみて、過去側、または、未来側、または過去側および未来側の時刻でグラフ構造推定装置１２０が出力したグラフ構造情報とすることも可能である。

　時間の経過に伴うグラフ構造の変化を検出する場合、グラフ構造記憶装置１３０は、しばらくの間、グラフ構造推定装置１２０が順次出力するグラフ構造情報１８０を記憶していく。

　例えば、ある時刻（検出対象時刻）におけるグラフ構造の変化を検出するために、その時刻より未来の時刻で得られたグラフ構造情報を利用する場合には、グラフ構造記憶装置１３０は、その時刻（検出対象時刻）にグラフ構造推定装置１２０が出力したグラフ構造情報と、その時刻以降にグラフ構造推定装置１２０が出力するグラフ構造情報と、を記憶していく。その後、グラフ構造記憶装置１３０内のグラフ構造情報（検出対象時刻のグラフ構造情報と、検出対象時刻より未来の時刻で得られたグラフ構造情報）を用いて、検出対象時刻でのグラフ構造の変化が検出される。

　構造変化点検出装置１４０は、一般的に構造変化点検出手段と呼ぶことができる。

　構造変化点検出装置１４０は、グラフ構造記憶装置１３０から基準グラフ構造情報を読み込み、また、グラフ構造推定装置１２０で推定されたグラフ構造情報１８０を読み込む。構造変化点検出装置１４０は、基準グラフ構造情報とグラフ構造情報１８０とを比較する事によって、グラフ構造の変化を検出する。

　なお、構造変化点検出装置１４０は、グラフ構造の変化を検出するために事前に設定されたルールに従って動作する。

　グラフ構造の変化を検出するためのルールは、例えば検出対象時刻前の時刻のグラフの分割数と検出対象時刻のグラフの分割数を比較し、分割数に変動があれば、変化を検出し、分割数に変動がなければ、変化なしを検出する（つまり、変化を検出しない）というルールであってもよい。

　なお、検出対象時刻のグラフ構造情報と、その前の時刻のグラフ構造情報だけを比較すると、ノイズなどに起因する外れ値を変化として検出してしまう場合がある。そのような誤検出を避けるために、検出対象時刻よりも過去側の任意の期間のグラフの分割数の平均と、未来側の任意の期間のグラフの分割数の平均を比較することなどもルールとして使用可能である。

　検出対象時刻のグラフ構造情報と、検出対象時刻の未来側の時刻で得られたグラフ構造情報と、を利用して変化点検出を行なう場合には、例えばグラフ構造推定装置１２０で推定されたグラフ構造情報は、直接、構造変化点検出装置１４０へ出力されるのではなく、グラフ構造記憶装置１３０へ記憶される。

　その後、構造変化点検出装置１４０は、グラフ構造記憶装置１３０に記憶された、検出対象時刻のグラフ構造情報、および、検出対象時刻の未来側の時刻で得られたグラフ構造情報、を利用して、変化点検出を行なう。

　構造変化点出力装置１５０は、一般的に構造変化点出力手段と呼ぶことができる。

　構造変化点出力装置１５０は、構造変化点検出装置１４０にて変化が検出された場合には、変化が起こった事、および、その変化の種類などを、グラフデータの構造変化の検出結果として出力する。なお、変化が検出されていない場合にも、構造変化点出力装置１５０は、その時のグラフ構造情報などを出力することが可能である。

　グラフデータの構造変化の検出結果の出力先は、グラフ構造変化点検出装置１００に接続されたディスプレイなどの出力装置であってもよいし、ネットワークを介して接続された出力装置または端末装置であってもよい。

　図１４は、グラフ構造変化点検出装置１００の動作を説明するためのフローチャートである。

　図１４を参照すると、ノード重要度計算装置１１０は、グラフデータ１６０を入力する（Ｓ１００）。

　次に、ノード重要度計算装置１１０は、入力されたグラフデータが示す各ノードのノード重要度を計算する（Ｓ１０１）。

　次に、グラフ構造推定装置１２０は、計算されたノード重要度を利用して、グラフのノードの分割（ノードのグループ分け）を計算する（Ｓ１０２）。このノードのグループ分けの結果は、グラフデータ１６０のグラフ構造情報として用いられる。

　次に、各時刻におけるグラフ構造情報を変化検出の基準として用いる場合には、グラフ構造推定装置１２０は、計算されたグラフ構造情報（分割など）を、グラフ構造記憶装置１３０へ記憶する（Ｓ１０３）。

　次に、構造変化点検出装置１４０は、変化の検出を行うかどうかを判断する（Ｓ１０４）。例えば、グラフ構造の変化の検出に未来側のグラフ構造情報を利用する場合には、この時点では、変化の検出は行わず、処理がＳ１００へもどり、さらにグラフデータが入力される。

　また、変化の検出は、この時刻に得られたグラフに関してだけでなく、過去の時刻に関する変化の検出を実行することも可能である。

　変化の検出を行う場合には、構造変化点検出装置１４０は、グラフ構造記憶装置１３０から、変化点検出の基準グラフ構造情報を読み込み（Ｓ１０５）、この基準グラフ構造情報と、グラフ構造推定装置１２０からのグラフ構造情報と、を比較して、グラフ構造の変化点検出を実施する（Ｓ１０６）。

　なお、グラフ構造推定装置１２０からのグラフ構造情報のうち、基準グラフ構造情報として使用されないグラフ構造情報（具体的には、基準グラフ構造情報と比較されるグラフ構造情報）も、グラフ構造記憶装置１３０が記憶している場合には、構造変化点検出装置１４０は、基準グラフ構造情報と比較されるグラフ構造情報も、グラフ構造記憶装置１３０から読み込み、基準グラフ構造情報と比較されるグラフ構造情報と、基準グラフ構造情報と、を比較して、グラフ構造の変化点検出を実施する。

　構造変化点検出装置１４０は、変化点検出の結果を、構造変化点出力装置１５０に提供する。

　次に、構造変化点出力装置１５０は、変化点検出結果を出力する（Ｓ１０７）。

　本実施形態によれば、ノード重要度計算装置１１０は、ノードごとに重要度情報を計算する。グラフ構造推定装置１２０は、ノードのそれぞれを、そのノードの重要度情報に基づいて、複数のグループのいずれかに分け、ノードのグループ分けの結果を、グラフデータのグラフ構造情報として出力する。検出部１０１は、グラフ構造推定装置１２０からのグラフ構造情報と、基準グラフ構造情報と、を用いて、グラフデータの構造変化を検出する。

　このため、ノードの活性度つまり重要度に基づいて、グラフ構造の変化を検出することが可能になる。

　なお、検出部１０１によって検出されるグラフデータの構造変化は、ノードの重要度に基づいて特定されるグラフ構造に変動が生じたことを意味する。つまり、検出部１０１によって検出されるグラフデータの構造変化は、スケールフリーネットワークの特徴である分布に何らかの変化が起こったことを意味する。

　この構造変化は、例えば、「幾つかのノードへ急激にトラフィックが集中するようになった場合」、つまり、「ネットワーク攻撃が開始された場合」に生じる。このため、本実施形態によれば、ネットワーク攻撃の検出が可能になる。

　また、この構造変化は、例えば、「ブログ、ニュース、学術論文などの単語ネットワークが変化した場合」、つまり、「話題の大きな変動が生じた場合」に生じる。このため、本実施形態によれば、話題の大きな変動の検出が可能になる。

　また、本実施形態では、ノード重要度計算装置１１０は、グラフデータ１６０を時系列で受け付け、グラフデータ１６０を受け付けるたびに、そのグラフデータに基づいて、そのグラフデータに表されたノードごとに重要度情報を計算する。

　グラフ構造推定装置１２０は、グラフデータごとに各ノードの重要度情報が計算されるたびに、同一グラフデータに示された各ノードを、そのノードの重要度情報に基づいて、複数のグループのいずれかに分け、ノードのグループ分けの結果を、グラフデータのグラフ構造情報として出力する。

　検出部１０１は、過去にグラフ構造推定装置１２０から出力されたグラフ構造情報を、基準グラフ構造情報として用いる。

　この場合、時間経過に伴うグラフ構造の変化を検出することが容易になる。また、基準グラフ構造情報の作成が容易になる。

　また、本実施形態では、グラフ構造推定装置１２０は、ノード重要度情報の取りうる最小値から最大値までを表すノード重要度の値域を、１つまたは複数の分割用ノード重要度を用いて分割して得られた複数の分割領域を、複数のグループとする。

　この場合、分割用ノード重要度を用いて複数のグループを設定することが可能になる。

　［第２の実施の形態］
　図１５は、本発明の第２の実施の形態に関わるグラフ構造変化点検出装置２００を示したブロック図である。なお、グラフ構造変化点検出装置２００は、一般的にグラフ構造変化検出装置と呼ぶことができる。

　図１５を参照すると、グラフ構造変化点検出装置２００は、図２に示した第１の実施の形態に関わるグラフ構造変化点検出装置１００と比較して、ノード重要度計算装置１１０およびグラフ構造推定装置１２０およびグラフ構造記憶装置１３０および構造変化点検出装置１４０に代えて、ノード重要度計算装置２１０およびグラフ構造推定装置２２０および構造変化点検出装置２３０を有する点、および、グラフデータ１６０に代えてグラフデータ２４０が入力される点、および、構造変化点検出結果１７０に代えて構造変化点検出結果２５０を出力する点で相違する。

　グラフ構造変化点検出装置２００は、例えば、ＣＰＵ、メモリおよび入出力装置を含むコンピュータである。グラフ構造変化点検出装置２００は、ハードディスクまたはメモリに記録されたプログラムに従って動作する。

　グラフ構造変化点検出装置２００は、プログラムを記録媒体から読み取り実行することによって、ノード重要度計算装置２１０、グラフ構造推定装置２２０、構造変化点検出装置２３０、および、構造変化点出力装置１５０として機能する。

　グラフデータ２４０は、時系列など順序をもって得られたグラフ列であり、Ｇ^ｔ＝Ｇ_１，Ｇ_２，・・・，Ｇ_ｔとする。

　構造変化点検出結果２５０は、グラフデータ２４０に対応する各時刻において、変化の発生の有無あるいは変化の種類、また推定された各時刻におけるグラフの構造などを表す。ここで、変化の種類とは、例えばグラフの分割数が幾つから幾つに変わったという情報、および、グラフの分割位置がどのように変化したかという情報などのことである。

　ノード重要度計算装置２１０は、一般的に計算手段と呼ぶことができる。

　ノード重要度計算装置２１０は、入力されたグラフ列Ｇ^ｔに対して、各時刻におけるノード重要度の列ｘ^ｔ，ｎ＝ｘ_１ ^ｎ，ｘ_２ ^ｎ，・・・，ｘ_ｔ ^ｎを計算する。例えば、ノード重要度計算装置２１０は、グラフデータを時系列で受け付け、グラフデータを受け付けるたびに、グラフデータに基づいて、グラフデータに表されたノードごとにノード重要度を計算する。

　なお、ノード重要度計算装置２１０は、ノード重要度として、第１の実施形態で説明したように、任意の指標（例えば、各ノードの持つリンクの頻度、ページランク、ハブ指標、または、オーソリィテ指標）を利用することが可能である。

　グラフ構造推定装置２２０は、一般的に推定手段と呼ぶことができる。

　グラフ構造推定装置２２０は、入力されたグラフ列に対して、各時刻におけるグラフ分割の構造を推定する。

　グラフ構造推定装置２２０は、ノード重要度の値域の分割モデル（分割用ノード重要度の設定）を、任意の最適化方法（最適化基準）、例えば、最小記述長原理、赤池情報量基準、または、ベイズ情報量基準を利用して、グラフデータに基づき計算する事が可能である。

　例えば、グラフ構造推定装置２２０は、グラフデータが受け付けられるたびに、ノード重要度の値域の分割結果を、任意の最適化基準にしたがって、時系列で受け付けられた各グラフデータのノード重要度情報に基づいて最適化する。そして、グラフ構造推定装置２２０は、最適化されたノード重要度の値域の分割結果にて特定される複数のグループのいずれかに、各ノードを、そのノードの重要度情報に基づいて、複数のグループのいずれかに分け、そのノードのグループ分けの結果を、グラフデータのグラフ構造情報として出力する。

　図１６は、グラフ構造推定装置２２０の一例を示したブロック図である。

　図１６において、グラフ構造推定装置２２０は、グラフ列符号長計算部記憶装置５１１と、モデル列符号長計算部記憶装置５１２と、最適パラメータ計算装置５１３とを備えている。

　グラフ構造推定装置２２０は、グラフデータ２４０と、ノード重要度計算装置２１０で計算されたノード重要度情報５１４とを入力とし、構造変化点検出結果２５０を出力する。

　最適パラメータ計算装置５１３は、一般的に分割制御手段と呼ぶことができる。

　最適パラメータ計算装置５１３は、入力されたグラフデータ２４０およびノード重要度情報５１４に対して、グラフ列符号長計算部記憶装置５１１およびモデル列符号長計算部記憶装置５１２から読み込まれた計算部を利用して計算されるグラフ列およびモデル列の符号長の和を最小とするモデル（分割モデル）を選択する。

　最適パラメータ計算装置５１３は、例えば非特許文献８で提案されている動的モデル選択の枠組みを利用する事によって実現可能である。

　今、時刻ｔにおけるモデルをＭ_ｔとし、モデルの列をＭ^ｔ＝Ｍ_１，Ｍ_２，・・・，Ｍ_ｔとする。

　ここでいうモデルとは、グラフの分割構造の事を指す。

　動的モデル選択では、最適パラメータ計算装置５１３は、データ列（本実施形態では、グラフシーケンスＧ^ｔおよびノード重要度列ｘ^ｔ，ｎ）とモデル列Ｍ^ｔを符号化するための符号長を表す（１９）式を最小化するモデルを選択する。

　グラフ列符号長計算部５１１で計算されるグラフ列の符号長とは、（１９）式の右辺第１項である。例えば、グラフデータ２４０が無向グラフの場合には、（５）式および（１０）式、グラフデータ２４０が有向グラフの場合には、（５）式および（１８）式などを利用することが可能である。

　また、グラフ列符号長計算部５１１は、非特許文献８に示されるように、予測的確率的コンプレキシティを利用して（１９）式の右辺第１項を定義し計算する事も可能である。

　その場合には、θ_Ｍｔを、時刻ｔにおいてモデルＭ_ｔを仮定した場合のデータの分布のパラメータとし、θ_Ｍｔ ^ｔ－１＝θ_Ｍ１，θ_Ｍ２，…，θ_Ｍｔ－１とすると、（１９）式の右辺第１項は（２０）式で与えられる。

　モデル列符号長計算部記憶装置５１２で計算されるモデル列の符号長とは、（１９）式の右辺第２項であり、例えば（８）式および（９）式を用いて計算することが可能である。

　また例えば、非特許文献８に示されるように、モデルの時間遷移モデルを考慮し、モデルに対する予測的確率的コンプレキシティを利用して（１９）式の右辺第２項を定義し計算する事も可能である。

　その場合には、時刻ｔにおけるモデル遷移のパラメータをα_ｔとし、α^ｔ=α_１，α_２，…，α_ｔとすると、（１９）式の右辺第２項は、（２１）式で与えられる。

　最適パラメータ計算装置５１３は、（１９）式を最小化するモデル列およびパラメータを計算する方法として、候補となるモデル列およびパラメータの組み合わせを事前に設定し、それぞれに対して（１９）式を計算し、最小となるモデル列およびパラメータを選択する方法が考えられる。

　また、非特許文献８に示されるように、（１９）式を最小化するためのモデル列を、動的計画法を利用して計算する事も可能である。

　図１５に戻って、検出部２０１は、一般的に検出手段と呼ぶことができる。検出部２０１は、構造変化点検出装置２３０と構造変化点出力装置１５０を含む。検出部２０１は、グラフデータのグラフ構造情報と、基準グラフ構造情報と、を比較して、グラフデータの構造変化を検出し、グラフデータの構造変化の検出結果を出力する。

　なお、本実施形態では、検出部２０１は、グラフ構造推定装置２２０から提供される各時刻におけるグラフ分割の構造（グラフ構造情報）のうち、任意の時刻（例えば、過去の時刻）におけるグラフ分割の構造（グラフ構造情報）を、基準グラフ構造情報として用いる。

　構造変化点検出装置２３０は、一般的に構造変化点検出手段と呼ぶことができる。

　構造変化点検出装置２３０は、グラフ構造推定装置２２０から、モデル列およびモデルパラメータ列を含むグラフ構造情報と、グラフ列とを入力し、各時刻にグラフ構造の変化が起こっているかどうか、あるいはどのような変化が起こったかという情報を計算するための手順あるいはルールに従って動作する。

　グラフ構造の変化を検出するためのルールは、例えば各検出対象時刻において前の時刻の分割数と検出対象時刻の分割数を比較し、分割数に変動があれば、変化を検出し、分割数に変動がなければ、変化なしを検出する（つまり、変化を検出しない）というルールであってもよい。

　また、グラフ構造の変化を検出するためのルールは、例えば、（２０）式の右辺の和の中身である、各時刻において得られる-logP(Gj,xⁿ _i|θ^i-1 _Mj)の値（グラフ構造情報の一例）を監視し、事前に設定された閾値（基準グラフ構造情報に対応）を超えた場合に、変化を検出するというルールでもよい。

　また、グラフ構造の変化を検出するためのルールは、例えば、各時刻において得られる-logP　(Gj,xⁿ _i|θ^i-1 _Mj)の値を用いた時系列の変化点検出技術（公知技術）を適用して変化を検出するというルールでもよい。

　-logP　(Gj,xⁿ _i|θ^i-1 _Mj)を監視することは、ある時刻までに推定されたモデル列のもとで、次の時刻に得られたグラフデータがどの程度得られやすいかを監視している事になる。変化が起こった場合には、前の時刻までに推定されたモデルでは説明のできないグラフが得られることになるため、この値、つまり-logP　(Gj,xⁿ _i|θ^i-1 _Mj)が大きくなる。

　図１７は、グラフ構造変化点検出装置２００の動作を説明するためのフローチャートである。

　図１７を参照すると、ノード重要度計算装置２１０は、グラフ列のデータを入力する（Ｓ２００）。

　次に、ノード重要度計算装置２１０は、入力されたグラフデータが示す各ノードのノード重要度列を計算する（Ｓ２０１）。

　次に、グラフ構造推定装置２２０は、計算されたノード重要度列を利用して、グラフ構造列およびそのパラメータ列を計算する（Ｓ２０２）。

　次に、構造変化点検出装置２３０は、変化点検出を実施する（Ｓ２０３）。

　次に、構造変化点出力装置１５０は、変化点検出結果を出力する（Ｓ２０４）。

　本実施形態によれば、グラフデータ２４０として、時系列など順序をもつグラフ列であるグラフデータを用いても、ノードの活性度つまり重要度に基づいて、グラフ構造の変化を検出することが可能になる。

　［第３の実施の形態］
　図１８は、本発明の第３の実施の形態に関わるグラフ構造変化点検出装置３００を示したブロック図である。なお、グラフ構造変化点検出装置３００は、一般的にグラフ構造変化検出装置と呼ぶことができる。

　図１８を参照すると、グラフ構造推定装置３００は、図２に示した第１の実施の形態に関わるグラフ構造変化点検出装置１００と比較して、グラフ構造推定装置１２０およびグラフ構造記憶装置１３０および構造変化点検出装置１４０に代えて、グラフ構造推定装置３１０およびグラフ構造記憶装置３２０および構造変化点検出装置３３０を有する点で相違する。

　グラフ構造変化点検出装置３００は、例えば、ＣＰＵ、メモリおよび入出力装置を含むコンピュータである。グラフ構造変化点検出装置３００は、ハードディスクまたはメモリに記録されたプログラムに従って動作する。

　グラフ構造変化点検出装置３００は、プログラムを記録媒体から読み取り実行することによって、ノード重要度計算装置１１０、グラフ構造推定装置２２０、構造変化点検出装置２３０、および、構造変化点出力装置１５０として機能する。

　グラフ構造記憶装置３２０は、一般的に格納手段と呼ぶことができる。

　グラフ構造記憶装置３２０には、グラフ構造推定装置３１０で推定されたグラフの分割結果と共に、前の時刻までに計算された時間遷移モデルのパラメータ（このパラメータは、過去の最適化されたノード分布（ノード重要度の値域）の分割結果を示すことになる）が記憶されている。ここで言う、グラフの分割と時間遷移モデルのパラメータとは、例えば第２の実施の形態で言うところの、Ｍ^ｔ，θ_Ｍｔ ^ｔ，α^ｔなどが相当する。

　グラフ構造推定装置３１０は、グラフデータ１６０、ノード重要度計算装置１１０で計算されたノード重要度情報、および、グラフ構造記憶装置３２０に記憶されているパラメータを読み込み、その時刻におけるグラフのノード重要度情報に従った分割を計算する。この計算には、例えば非特許文献４で提案されている逐次的動的選択アルゴリズムを適用する事が可能である。

　例えば、グラフ構造推定装置３１０は、グラフデータが受け付けられるたびに、グラフ構造記憶装置３２０に格納された過去の最適化されたノード重要度の値域の分割結果と、ノードごとのノード重要度情報と、に基づいて、ノード重要度の値域の分割モデルを、任意の最適化基準（例えば、最小記述長原理、赤池情報量基準、または、ベイズ情報量基準）にしたがって最適化する。

　この例では、各時刻においてグラフデータおよびノード重要度情報が入力されるごとに、グラフ構造推定装置３１０は、候補となる全てのモデルに関して（２０）式で表される予測的確率的コンプレキシティを計算する。そして、グラフ構造推定装置３１０は、その最小値に対応するモデルを、各時刻に対する最適なモデルとして選択し出力する。

　本実施形態によれば、逐次的に、分割モデルを最適化できる。

　なお、上記各実施形態で検出されるグラフデータの構造変化は、第１の実施形態に関して説明したように、ノードの重要度に基づいて特定されるグラフ構造に変動が生じたことを意味する。つまり、検出されるグラフデータの構造変化は、スケールフリーネットワークの特徴である分布に何らかの変化が起こったことを意味する。よって、ネットワーク攻撃の検出、または、話題の大きな変動の検出が可能になる。

　以上、各実施形態を参照して本願発明を説明したが、本願発明は上記各実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　この出願は、２００８年２月２７日に出願された日本出願特願２００８－４６０９９を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims

　複数のノードと、当該複数のノードのうちの各ノード間の関係の程度を示すリンクと、によって表されるグラフデータを受け付けた場合に、当該グラフデータに基づいて、前記ノードごとに、当該ノードの重要性の程度を示す重要度情報を計算する計算手段と、
　前記ノードのそれぞれを、当該ノードの重要度情報に基づいて、複数のグループのいずれかに分け、前記ノードのグループ分けの結果を、前記グラフデータのグラフ構造情報として出力する推定手段と、
　前記グラフデータのグラフ構造情報と、構造変化検出用の基準グラフ構造情報と、を比較して、前記グラフデータの構造変化を検出し、当該グラフデータの構造変化の検出結果を出力する検出手段と、を含むグラフ構造変化検出装置。
　前記計算手段は、前記グラフデータを時系列で受け付け、当該グラフデータを受け付けるたびに、当該グラフデータに基づいて、当該グラフデータに表されたノードごとに前記重要度情報を計算し、
　前記推定手段は、前記グラフデータごとに各ノードの重要度情報が計算されるたびに、前記各ノードを、当該ノードの重要度情報に基づいて、前記複数のグループのいずれかに分け、前記ノードのグループ分けの結果を、前記グラフデータのグラフ構造情報として出力し、
　前記検出手段は、過去に出力された前記グラフデータのグラフ構造情報を、前記基準グラフ構造情報として用いる、請求の範囲第１項に記載のグラフ構造変化検出装置。
　前記リンクは、前記各ノード間の関係の程度を数値で示し、
　前記計算手段は、前記リンクが示す数値のうち同一のノードに関係する数値の総和を、前記ノードごとに計算し、当該総和を、当該ノードの重要度情報として用いる、請求の範囲第１項または第２項に記載のグラフ構造変化検出装置。
　前記計算手段は、ページランクアルゴリズムにしたがって、前記グラフデータに基づいて、前記ノードごとに、当該ノードのページランクを計算し、当該ページランクを、当該ノードの重要度情報として用いる、請求の範囲第１項または第２項に記載のグラフ構造変化検出装置。
　前記計算手段は、ＨＩＴＳアルゴリズムにしたがって、前記グラフデータに基づいて、前記ノードごとに、当該ノードのハブ指標を計算し、当該ハブ指標を、当該ノードの重要度情報として用いる、請求の範囲第１項または第２項に記載のグラフ構造変化検出装置。
　前記計算手段は、ＨＩＴＳアルゴリズムにしたがって、前記グラフデータに基づいて、前記ノードごとに、当該ノードのオーソリティ指標を計算し、当該オーソリティ指標を、当該ノードの重要度情報として用いる、請求の範囲第１項または第２項に記載のグラフ構造変化検出装置。
　前記推定手段は、さらに、前記ノード重要度情報の取りうる最小値から最大値までを表すノード重要度の値域を、１つまたは複数の分割用ノード重要度を用いて分割して得られた複数の分割領域を、前記複数のグループとする、請求の範囲第１項から第６項のいずれか１項に記載のグラフ構造変化検出装置。
　前記推定手段は、前記ノード重要度の値域の分割結果を、任意の最適化基準にしたがって、前記グラフデータに基づき最適化する、請求の範囲第７項に記載のグラフ構造変化検出装置。
　前記推定手段は、前記任意の最適化基準として、最小記述長原理、赤池情報量基準、または、ベイズ情報量基準を用いる、請求の範囲第８項に記載のグラフ構造変化検出装置。
　前記推定手段は、
　前記ノード重要度の値域の分割結果を分割モデルとし、互いに異なる分割モデルごとに、前記ノード重要度情報および前記分割モデルを符号化するために必要な分割記述長を算出する分割符号長計算手段と、
　前記互いに異なる分割モデルの中から、前記分割記述長が最小になる最適化分割モデルを特定し、前記ノードのそれぞれを、当該ノードの重要度情報に基づいて、当該最適化分割モデルにて特定される前記複数のグループのいずれかに分け、前記ノードのグループ分けの結果を、前記グラフデータのグラフ構造情報として出力する分割制御手段と、を含む、請求の範囲第８項または第９項に記載のグラフ構造変化検出装置。
　前記推定手段は、
　前記ノード重要度の値域の分割結果を分割モデルとし、互いに異なる分割モデルごとに、前記ノード重要度情報および前記分割モデルを符号化するために必要な分割記述長を算出する分割符号長計算手段と、
　前記ノードのそれぞれを、当該ノードの重要度情報に基づいて、前記分割モデルにて特定される前記複数のグループのいずれかに分けた際に、前記ノードのグループ分けによって分割されたグラフを符号化するためのグラフ記述長を、前記分割モデルごとに算出するグラフ符号長計算手段と、
　前記互いに異なる分割モデルの中から、前記分割記述長と前記グラフ記述長の和が最小になる最適化分割モデルを特定し、前記ノードのそれぞれを、当該ノードの重要度情報に基づいて、当該最適化分割モデルにて特定される前記複数のグループのいずれかに分け、前記ノードのグループ分けの結果を、前記グラフデータのグラフ構造情報として出力する分割制御手段と、を含む、請求の範囲第８項または第９項に記載のグラフ構造変化検出装置。
　前記分割制御手段は、動的計画法を用いて、前記最適化分割モデルを特定する、請求の範囲第１０項または第１１項に記載のグラフ構造変化検出装置。
　前記分割制御手段は、前記分割記述長を小さくする方向へ前記分割結果を更新することを繰り返すことによって、前記最適化分割モデルを特定する、請求の範囲第１０項に記載のグラフ構造変化検出装置。
　前記分割制御手段は、動的計画法を用いて計算された前記分割結果を初期値とし、前記初期値から前記分割記述長を小さくする方向へ前記分割結果を更新することを繰り返すことによって、前記最適化分割モデルを特定する、請求の範囲第１０項に記載のグラフ構造変化検出装置。
　前記分割制御手段は、前記分割記述長と前記グラフ記述長の和を小さくする方向へ前記分割結果を更新することを繰り返すことによって、前記最適化分割モデルを特定する、請求の範囲第１１項に記載のグラフ構造変化検出装置。
　前記分割制御手段は、動的計画法を用いて計算された前記分割結果を初期値とし、前記初期値から前記分割記述長と前記グラフ記述長の和を小さくする方向へ前記分割結果を更新することを繰り返すことによって、前記最適化分割モデルを特定する、請求の範囲第１１項に記載のグラフ構造変化検出装置。
　前記推定手段は、
　前記ノード重要度の値域の分割結果を分割モデルとし、互いに異なる分割モデルごとに、前記ノード重要度情報および前記分割モデルを符号化するために必要な分割記述長を算出する分割符号長計算手段と、
　前記ノードのそれぞれを、当該ノードの重要度情報に基づいて、前記分割モデルにて特定される前記複数のグループのいずれかに分けた際に生じる各グループを、当該グループ内のノード間の関係に基づいて再分割した際に、前記各グループでの再分割の状態を符号化するために必要な再分割符号長を、前記分割モデルごとに算出する部分グラフ分割符号長計算手段と、
　前記互いに異なる分割モデルの中から、前記分割記述長と前記再分割符号長の和が最小になる最適化分割モデルを特定し、前記ノードのそれぞれを、当該ノードの重要度情報に基づいて、当該最適化分割モデルにて特定される前記複数のグループのいずれかに分け、前記ノードのグループ分けの結果を、前記グラフデータのグラフ構造情報として出力する分割制御手段と、を含む、請求の範囲第８項または第９項に記載のグラフ構造変化検出装置。
　前記計算手段は、前記グラフデータを時系列で受け付け、当該グラフデータを受け付けるたびに、当該グラフデータに基づいて、当該グラフデータに表されたノードごとに前記重要度情報を計算し、
　前記推定手段は、前記グラフデータが受け付けられるたびに、前記ノード重要度の値域の分割結果を、前記任意の最適化基準にしたがって、時系列で受け付けられた各グラフデータのノード重要度情報に基づいて最適化する、請求の範囲第８項または第９項に記載のグラフ構造変化検出装置。
　前記計算手段は、前記グラフデータを時系列で受け付け、当該グラフデータを受け付けるたびに、当該グラフデータに基づいて、当該グラフデータに表されたノードごとに前記重要度情報を計算し、
　前記推定手段は、
　過去の最適化された前記ノード重要度の値域の分割結果を格納する格納手段と、
　前記グラフデータが受け付けられるたびに、前記ノード重要度の値域の分割結果を、前記格納手段に格納された前記過去の最適化されたノード重要度の値域の分割結果と、前記ノードごとの重要度情報と、に基づいて、前記任意の最適化基準にしたがって最適化する、分割制御手段と、を含む、請求の範囲第８項または第９項に記載のグラフ構造変化検出装置。
　複数のノードと、当該複数のノードのうちの各ノード間の関係の程度を示すリンクと、によって表されるグラフデータを受け付けた場合に、当該グラフデータに基づいて、前記ノードごとに、当該ノードの重要性の程度を示す重要度情報を計算し、
　前記ノードのそれぞれを、当該ノードの重要度情報に基づいて、複数のグループのいずれかに分け、前記ノードのグループ分けの結果を、前記グラフデータのグラフ構造情報として出力し、
　前記グラフデータのグラフ構造情報と、構造変化検出用の基準グラフ構造情報と、を比較して、前記グラフデータの構造変化を検出し、当該グラフデータの構造変化の検出結果を出力する、グラフ構造変化検出方法。
　前記計算することでは、前記グラフデータを時系列で受け付け、当該グラフデータを受け付けるたびに、当該グラフデータに基づいて、当該グラフデータに表されたノードごとに前記重要度情報を計算し、
　前記ノードのグループ分けの結果を出力することでは、前記グラフデータごとに各ノードの重要度情報が計算されるたびに、前記各ノードを、当該ノードの重要度情報に基づいて、前記複数のグループのいずれかに分け、前記ノードのグループ分けの結果を、前記グラフデータのグラフ構造情報として出力し、
　前記検出結果を出力することでは、過去に出力された前記グラフデータのグラフ構造情報を、前記基準グラフ構造情報として用いる、請求の範囲第２０項に記載のグラフ構造変化検出方法。
　前記リンクは、前記各ノード間の関係の程度を数値で示し、
　前記計算することでは、前記リンクが示す数値のうち同一のノードに関係する数値の総和を、前記ノードごとに計算し、当該総和を、当該ノードの重要度情報として用いる、請求の範囲第２０項または第２１項に記載のグラフ構造変化検出方法。
　前記計算することでは、ページランクアルゴリズムにしたがって、前記グラフデータに基づいて、前記ノードごとに、当該ノードのページランクを計算し、当該ページランクを、当該ノードの重要度情報として用いる、請求の範囲第２０項または第２１項に記載のグラフ構造変化検出方法。
　前記計算することでは、ＨＩＴＳアルゴリズムにしたがって、前記グラフデータに基づいて、前記ノードごとに、当該ノードのハブ指標を計算し、当該ハブ指標を、当該ノードの重要度情報として用いる、請求の範囲第２０項または第２１項に記載のグラフ構造変化検出方法。
　前記計算することでは、ＨＩＴＳアルゴリズムにしたがって、前記グラフデータに基づいて、前記ノードごとに、当該ノードのオーソリティ指標を計算し、当該オーソリティ指標を、当該ノードの重要度情報として用いる、請求の範囲第２０項または第２１項に記載のグラフ構造変化検出方法。
　前記ノードのグループ分けの結果を出力することでは、さらに、前記ノード重要度情報の取りうる最小値から最大値までを表すノード重要度の値域を、１つまたは複数の分割用ノード重要度を用いて分割して得られた複数の分割領域を、前記複数のグループとする、請求の範囲第２０項から第２５項のいずれか１項に記載のグラフ構造変化検出方法。
　前記ノードのグループ分けの結果を出力することでは、前記ノード重要度の値域の分割結果を、任意の最適化基準にしたがって、前記グラフデータに基づき最適化する、請求の範囲第２６項に記載のグラフ構造変化検出方法。
　前記ノードのグループ分けの結果を出力することでは、前記任意の最適化基準として、最小記述長原理、赤池情報量基準、または、ベイズ情報量基準を用いる、請求の範囲第２７項に記載のグラフ構造変化検出方法。
　前記ノードのグループ分けの結果を出力することは、
　前記ノード重要度の値域の分割結果を分割モデルとし、互いに異なる分割モデルごとに、前記ノード重要度情報および前記分割モデルを符号化するために必要な分割記述長を算出することと、
　前記互いに異なる分割モデルの中から、前記分割記述長が最小になる最適化分割モデルを特定し、前記ノードのそれぞれを、当該ノードの重要度情報に基づいて、当該最適化分割モデルにて特定される前記複数のグループのいずれかに分け、前記ノードのグループ分けの結果を、前記グラフデータのグラフ構造情報として出力することと、を含む、請求の範囲第２７項または第２８項に記載のグラフ構造変化検出方法。
　前記ノードのグループ分けの結果を出力することは、
　前記ノード重要度の値域の分割結果を分割モデルとし、互いに異なる分割モデルごとに、前記ノード重要度情報および前記分割モデルを符号化するために必要な分割記述長を算出することと、
　前記ノードのそれぞれを、当該ノードの重要度情報に基づいて、前記分割モデルにて特定される前記複数のグループのいずれかに分けた際に、前記ノードのグループ分けによって分割されたグラフを符号化するためのグラフ記述長を、前記分割モデルごとに算出することと、
　前記互いに異なる分割モデルの中から、前記分割記述長と前記グラフ記述長の和が最小になる最適化分割モデルを特定し、前記ノードのそれぞれを、当該ノードの重要度情報に基づいて、当該最適化分割モデルにて特定される前記複数のグループのいずれかに分け、前記ノードのグループ分けの結果を、前記グラフデータのグラフ構造情報として出力することと、を含む、請求の範囲第２７項または第２８項に記載のグラフ構造変化検出方法。
　前記ノードのグループ分けの結果を出力することでは、動的計画法を用いて、前記最適化分割モデルを特定する、請求の範囲第２９項または第３０項に記載のグラフ構造変化検出方法。
　前記ノードのグループ分けの結果を出力することでは、前記分割記述長を小さくする方向へ前記分割結果を更新することを繰り返すことによって、前記最適化分割モデルを特定する、請求の範囲第２９項に記載のグラフ構造変化検出方法。
　前記ノードのグループ分けの結果を出力することでは、動的計画法を用いて計算された前記分割結果を初期値とし、前記初期値から前記分割記述長を小さくする方向へ前記分割結果を更新することを繰り返すことによって、前記最適化分割モデルを特定する、請求の範囲第２９項に記載のグラフ構造変化検出方法。
　前記ノードのグループ分けの結果を出力することでは、前記分割記述長と前記グラフ記述長の和を小さくする方向へ前記分割結果を更新することを繰り返すことによって、前記最適化分割モデルを特定する、請求の範囲第３０項に記載のグラフ構造変化検出方法。
　前記ノードのグループ分けの結果を出力することでは、動的計画法を用いて計算された前記分割結果を初期値とし、前記初期値から前記分割記述長と前記グラフ記述長の和を小さくする方向へ前記分割結果を更新することを繰り返すことによって、前記最適化分割モデルを特定する、請求の範囲第３０項に記載のグラフ構造変化検出方法。
　前記ノードのグループ分けの結果を出力することは、
　前記ノード重要度の値域の分割結果を分割モデルとし、互いに異なる分割モデルごとに、前記ノード重要度情報および前記分割モデルを符号化するために必要な分割記述長を算出することと、
　前記ノードのそれぞれを、当該ノードの重要度情報に基づいて、前記分割モデルにて特定される前記複数のグループのいずれかに分けた際に生じる各グループを、当該グループ内のノード間の関係に基づいて再分割した際に、前記各グループでの再分割の状態を符号化するために必要な再分割符号長を、前記分割モデルごとに算出することと、
　前記互いに異なる分割モデルの中から、前記分割記述長と前記再分割符号長の和が最小になる最適化分割モデルを特定し、前記ノードのそれぞれを、当該ノードの重要度情報に基づいて、当該最適化分割モデルにて特定される前記複数のグループのいずれかに分け、前記ノードのグループ分けの結果を、前記グラフデータのグラフ構造情報として出力することと、を含む、請求の範囲第２７項または第２８項に記載のグラフ構造変化検出方法。
　前記計算することでは、前記グラフデータを時系列で受け付け、当該グラフデータを受け付けるたびに、当該グラフデータに基づいて、当該グラフデータに表されたノードごとに前記重要度情報を計算し、
　前記ノードのグループ分けの結果を出力することでは、前記グラフデータが受け付けられるたびに、前記ノード重要度の値域の分割結果を、前記任意の最適化基準にしたがって、時系列で受け付けられた各グラフデータのノード重要度情報に基づいて最適化する、請求の範囲第２７項または第２８項に記載のグラフ構造変化検出方法。
　前記計算することでは、前記グラフデータを時系列で受け付け、当該グラフデータを受け付けるたびに、当該グラフデータに基づいて、当該グラフデータに表されたノードごとに前記重要度情報を計算し、
　前記ノードのグループ分けの結果を出力することは、
　過去の最適化された前記ノード重要度の値域の分割結果を格納手段に格納することと、
　前記グラフデータが受け付けられるたびに、前記ノード重要度の値域の分割結果を、前記格納手段に格納された前記過去の最適化されたノード重要度の値域の分割結果と、前記ノードごとの重要度情報と、に基づいて、前記任意の最適化基準にしたがって最適化することと、を含む、請求の範囲第２７項または第２８項に記載のグラフ構造変化検出方法。
　コンピュータを、
　複数のノードと、当該複数のノードのうちの各ノード間の関係の程度を示すリンクと、によって表されるグラフデータを受け付けた場合に、当該グラフデータに基づいて、前記ノードごとに、当該ノードの重要性の程度を示す重要度情報を計算する計算手段、
　前記ノードのそれぞれを、当該ノードの重要度情報に基づいて、複数のグループのいずれかに分け、前記ノードのグループ分けの結果を、前記グラフデータのグラフ構造情報として出力する推定手段、および、
　前記グラフデータのグラフ構造情報と、構造変化検出用の基準グラフ構造情報と、を比較して、前記グラフデータの構造変化を検出し、当該グラフデータの構造変化の検出結果を出力する検出手段、として機能させるためのプログラム。
　前記計算手段は、前記グラフデータを時系列で受け付け、当該グラフデータを受け付けるたびに、当該グラフデータに基づいて、当該グラフデータに表されたノードごとに前記重要度情報を計算し、
　前記推定手段は、前記グラフデータごとに各ノードの重要度情報が計算されるたびに、前記各ノードを、当該ノードの重要度情報に基づいて、前記複数のグループのいずれかに分け、前記ノードのグループ分けの結果を、前記グラフデータのグラフ構造情報として出力し、
　前記検出手段は、過去に出力された前記グラフデータのグラフ構造情報を、前記基準グラフ構造情報として用いる、請求の範囲第３９項に記載のプログラム。