JP2004118363A

JP2004118363A - Ｗｗｗにおけるハブとオーソリティ予測方法及び装置及び予測プログラム及び予測プログラムを格納した記憶媒体

Info

Publication number: JP2004118363A
Application number: JP2002278180A
Authority: JP
Inventors: Masahiro Kimura; 木村　昌弘; Kazumi Saito; 斉藤　和巳; Shuko Ueda; 上田　修功
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2002-09-24
Filing date: 2002-09-24
Publication date: 2004-04-15

Abstract

【課題】ＷＷＷネットワークの将来の中心的ページと権威的ページを予測することを可能にする。
【解決手段】本発明は、Ｗｅｂページのリンク関係の時系列変化を表すネットワーク時系列系情報を用いて成長予測モデルにより確率的に予測を行い、ＷＷＷネットワークにおける、あるトピックに対しての中心的なページ及び権威的なページの移り変わる変化を予測する。
【選択図】　　　図１

Description

【０００１】
【発明の属する技術分野】
本発明は、ＷＷＷにおけるハブとオーソリティ予測方法及び装置及び予測プログラム及び予測プログラムを格納した記憶媒体に係り、特に、与えられたトピックに対する将来のＷＷＷネットワークの中心的ページと権威的ページの予測方法において、トピックが指定されたとき、そのトピックに関わるＷＷＷネットワークの時系列を収集し、このＷＷＷネットワークの時系列に基づいて、そのトピックに関わるＷＷＷネットワークの成長を予測することにより、そのトピックに関わるネットワークの将来の中心的ページと権威的ページを予測するためのＷＷＷにおけるハブとオーソリティ予測方法及び装置及び予測プログラム及び予測プログラムを格納した記憶媒体に関する。
【０００２】
【従来の技術】
従来、トピックが指定されたとき、現在での当該トピックに関わるＷｅｂページを収集する方法がある（例えば、非特許文献１参照）。
また、収集されたＷＷＷネットワークに基づいて、当該トピックに関わるＷＷＷネットワークの現在の中心的ページと権威的ページを見つける方法が確立されている。
【０００３】
【非特許文献１】
“Ｊ．Ｋｌｅｉｎｂｅｒｇ，　Ａｕｔｈｏｒｉｔａｔｉｖｅ　ｓｏｕｒｃｅｓ　ｉｎ　ａ　ｈｙｐｅｒｌｉｎｋｅｄ　ｅｎｖｉｒｏｎｍｅｎｔ，　Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　９ｔｈ　ＡＣＭ−ＳＩＡＭ　Ｓｙｍｐｏｓｉｕｍ　ｏｎ　Ｄｉｓｃｒｅｔｅ　Ａｌｇｏｒｉｔｈｍ，　６６８−６７７，　１９９８．”。
【０００４】
【発明が解決しようとする課題】
しかしながら、ＷＷＷは、時々刻々とページやハイパーリンクが生成または、消滅する動的なネットワークであるので、与えられたトピックに関わるＷＷＷネットワークの中心的ページと権威的ページも動的に変化する。実際、与えられたトピックに関わる現在のＷＷＷネットワークの中心的ページと権威あるページが、近い将来において他のページにとって代わられることは十分にあり得る。従って、与えられたトピックに関わる将来のＷＷＷネットワークの中心的ページと権威的ページを予測する方法の確立が重要な課題となっている。
【０００５】
本発明は、上記の点に鑑みなされたもので、トピックが指定されたとき、当該トピックに関わるＷＷＷネットワークの時系列を収集し、これに基づいて当該トピックに関わるＷＷＷネットワークの将来の中心的ページと権威的ページを予測することが可能なＷＷＷにおけるハブとオーソリティ予測方法及び装置及び予測プログラム及び予測プログラムを格納した記憶媒体を提供することを目的とする。
【０００６】
【課題を解決するための手段】
図１は、本発明の原理を説明するための図である。
【０００７】
本発明は、コンピュータ上で入力されたトピックに対する将来のＷＷＷネットワークの中心的ページと権威的ページを予測するためのＷＷＷにおけるハブとオーソリティ予測方法において、
与えられたトピックに対して、該トピックに基づいてＷＷＷ検索エンジンにアクセスして、該トピックに関わるＷＷＷネットワークの隣接行列の時系列データを獲得し（ステップ１）、
獲得されたトピックに関わるＷＷＷネットワークの隣接行列の時系列データを訓練データとして、パラメータをもつネットワーク成長予測モデルを学習させることにより、該トピックに関わるＷＷＷネットワークの成長予測モデルを獲得し（ステップ２）、
獲得されたトピックに関わるＷＷＷネットワークの成長予測モデルの動的確率行列から動的ハブベクトルと動的オーソリティベクトルを計算することにより、各Ｗｅｂページの動的ハブ度と動的オーソリティ度を獲得し（ステップ３）、
出力数ｎが指定されたとき、Ｗｅｂページの動的ハブ度と動的オーソリティ度に基づいて、トピックに関わるＷＷＷネットワークの将来の中心的ページと権威的ページの候補の上位ｎページをそれぞれ出力する（ステップ４）。
【０００８】
図２は、本発明の原理構成図である。
【０００９】
本発明は、コンピュータ上で入力されたトピックに対する将来のＷＷＷネットワークの中心的ページと権威的ページを予測するためのＷＷＷにおけるハブとオーソリティ予測装置であって、
与えられたトピックに対して、該トピックに基づいてＷＷＷ検索エンジンにアクセスして、該トピックに関わるＷＷＷネットワークの隣接行列の時系列データを収集する隣接行列時系列データ獲得手段１０と、
隣接行列時系列データ獲得手段１０で獲得されたトピックに関わるＷＷＷネットワークの隣接行列の時系列データを訓練データとして、パラメータをもつネットワーク成長予測モデルを学習させることにより、該トピックに関わるＷＷＷネットワークの成長予測モデルを作成するネットワーク成長モデル獲得手段２０と、
ネットワーク成長モデル獲得手段２０で作成されたトピックに関わるＷＷＷネットワークの成長予測モデルの動的確率行列から動的ハブベクトルと動的オーソリティベクトルを計算することにより、各Ｗｅｂページの動的ハブ度と動的オーソリティ度を取得する動的ハブ・動的オーソリティ獲得手段３０と、
出力数ｎが指定されたとき、動的ハブ・動的オーソリティ獲得手段３０で計算されたＷｅｂページの動的ハブ度と動的オーソリティ度に基づいて、トピックに関わるＷＷＷネットワークの将来の中心的ページと権威的ページの候補の上位ｎページをそれぞれ出力する有望ハブ・有望オーソリティ獲得手段４０と、を有する。
【００１０】
本発明は、コンピュータ上で入力されたトピックに対する将来のＷＷＷネットワークの中心的ページと権威的ページを予測するための予測プログラムであって、
与えられたトピックに対して、該トピックに基づいてＷＷＷ検索エンジンにアクセスして、該トピックに関わるＷＷＷネットワークの隣接行列の時系列データを収集する隣接行列時系列データ獲得ステップと、
隣接行列時系列データ獲得ステップで獲得されたトピックに関わるＷＷＷネットワークの隣接行列の時系列データを訓練データとして、パラメータをもつネットワーク成長予測モデルを学習させることにより、該トピックに関わるＷＷＷネットワークの成長予測モデルを作成するネットワーク成長モデル獲得ステップと、
ネットワーク成長モデル獲得ステップで作成されたトピックに関わるＷＷＷネットワークの成長予測モデルの動的確率行列から動的ハブベクトルと動的オーソリティベクトルを計算することにより、各Ｗｅｂページの動的ハブ度と動的オーソリティ度を取得する動的ハブ・動的オーソリティ獲得ステップと、
出力数ｎが指定されたとき、動的ハブ・動的オーソリティ獲得ステップで計算されたＷｅｂページの動的ハブ度と動的オーソリティ度に基づいて、トピックに関わるＷＷＷネットワークの将来の中心的ページと権威的ページの候補の上位ｎページをそれぞれ出力する有望ハブ・有望オーソリティ獲得ステップと、を実行する。
【００１１】
本発明は、コンピュータ上で入力されたトピックに対する将来のＷＷＷネットワークの中心的ページと権威的ページを予測するための予測プログラムを格納した記憶媒体であって、
与えられたトピックに対して、該トピックに基づいてＷＷＷ検索エンジンにアクセスして、該トピックに関わるＷＷＷネットワークの隣接行列の時系列データを収集する隣接行列時系列データ獲得ステップと、
隣接行列時系列データ獲得ステップで獲得されたトピックに関わるＷＷＷネットワークの隣接行列の時系列データを訓練データとして、パラメータをもつネットワーク成長予測モデルを学習させることにより、該トピックに関わるＷＷＷネットワークの成長予測モデルを作成するネットワーク成長モデル獲得ステップと、
ネットワーク成長モデル獲得ステップで作成されたトピックに関わるＷＷＷネットワークの成長予測モデルの動的確率行列から動的ハブベクトルと動的オーソリティベクトルを計算することにより、各Ｗｅｂページの動的ハブ度と動的オーソリティ度を取得する動的ハブ・動的オーソリティ獲得ステップと、
出力数ｎが指定されたとき、動的ハブ・動的オーソリティ獲得ステップで計算されたＷｅｂページの動的ハブ度と動的オーソリティ度に基づいて、トピックに関わるＷＷＷネットワークの将来の中心的ページと権威的ページの候補の上位ｎページをそれぞれ出力する有望ハブ・有望オーソリティ獲得ステップと、を有する。
【００１２】
上記のように、本発明では、隣接行列時系列データ獲得時において、一定期間においてある時間単位で、従来技術を利用して、各時刻での当該トピックに関わるＷｅｂページを収集し、それらをうまく結合して、当該トピックに関わるＷＷＷネットワークの隣接行列の時系列データを獲得をしている。従って、当該トピックに関わるＷＷＷネットワークの成長の様子を記録したデータの獲得が可能となる。
【００１３】
次に、ネットワーク成長モデル獲得時に、隣接行列時系列データ獲得時に作成された当該トピックに関わるＷＷＷネットワークの成長の様子が記録されている、隣接行列の時系列データを訓練データとし、パラメータをもつネットワーク成長予測モデルを“ｍａｘｉｍａｌ　ｌｉｋｅｌｉｈｏｏｄ　ｅｓｔｉｍａｔｅ　”に基づいて学習させている。従って、当該トピックに関わるＷＷＷネットワークの成長予測モデルの獲得が可能になる。
【００１４】
また、動的ハブ・動的オーソリティ獲得時に、ネットワーク成長モデル獲得時に生成された、当該トピックに関わるＷＷＷネットワークの成長モデルに対して、その動的確率行列から動的ハブベクトルと動的オーソリティベクトルを計算している。従って、各Ｗｅｂページに対して、その将来のハブ度とオーソリティ度の予測値である、動的ハブ度と動的オーソリティ度の獲得が可能となる。
【００１５】
さらに、出力数ｎが指定されたとき、動的ハブ・動的オーソリティ獲得時に作成された、各Ｗｅｂページの動的ハブ度と動的オーソリティ度に基づいて、その上位ｎページをそれぞれ出力している。従って、本発明の目的である、当該トピックに関わるＷＷＷネットワークの将来の中心的ページと権威的ページの候補を予測することが実現できる。
【００１６】
【発明の実施の形態】
以下、図面と共に本発明の実施の形態を説明する。
【００１７】
図３は、本発明の一実施の形態における予測装置の構成を示す。
【００１８】
同図に示す予測装置は、隣接行列時系列データ獲得部１０、ネットワーク成長モデル獲得部２０、動的ハブ・動的オーソリティ獲得部３０、有望ハブ・有望オーソリティ獲得部４０から構成される。
【００１９】
隣接行列時系列データ獲得部１０は、トピックが与えられたとき、それを質問としてテキストベースのＷＷＷ検索エンジン５０へある時間単位で一定期間投げかけることにより、当該トピックに関わるＷＷＷネットワークの成長の様子が記録されている、隣接行列の時系列データを獲得するものである。
【００２０】
以下に具体的に隣接行列時系列データ獲得部１０について説明する。
【００２１】
トピックσが指定されたとする。予め、サンプルする時間間隔と、サンプル回数及び、一度の保存する該当Ｗｅｂページ数を決めておく。
【００２２】
まず、時刻ｔ＝０において、トピックσを質問として、インターネット経由ででテキストベースのＷＷＷ検索エンジン５０へ投げかけ、その回答から上位２００のＷｅｂページを保存する。この各ページに対して、そのフォワードリンクを適当に５０本まで辿ることにより、新たな５０個までのＷｅｂページを保存する。さらに、そのバックワードリンクをＷＷＷ検索エンジン５０を用いて調べ、それらを５０本まで辿ることにより、新たな５０個までのＷｅｂページを保存する。このようにしてできたＷｅｂページ全体の集合を、時刻ｔ＝０におけるトピックσの基本集合と呼び、Ｓ０　（σ）と記述する。このような、ある時刻でのあるトピックに関わるＷＷＷページを収集する方法は、従来技術として知られている。同様にして任意の時刻ｔにおけるトピックσの基本集合Ｓｔ　（σ）が獲得される。　各時刻ｔに対して、Ｗｅｂページの集合
【００２３】
【数１】

が定義するネットワークＧｔ　（σ）を構成する。但し、自己リンク（あるノードからそのノード自身へのリンク）は取り除く。これにより、トピックσに関わるＷＷＷネットワークの成長の様子を記録したネットワーク時系列｛Ｇｔ　（σ）；ｔ＝０，１，…，Ｔ｝が獲得される。
【００２４】
一般に、ネットワークＧのリンク構造は、その隣接行列Ａにより実現できる。ここに、Ｇをノード数Ｎのネットワークとするとき、その隣接行列Ａは、その（ｉ，ｊ）成分Ａ（ｉ，ｊ）がノードｉからノードｊへのリンク数であるような、Ｎ×Ｎ行列である。
【００２５】
出現時刻に対応したノードの番号付けを行い、各時刻ｔに対して、ネットワークＧｔ　（σ）の隣接行列Ａｔ　を計算し、保存する。これにより、トピックσに関わるＷＷＷネットワークの成長の様子が記録されている、隣接行列の時系列データ｛Ａｔ　；ｔ＝０，１，…，Ｔ｝が獲得される。
【００２６】
次に、ネットワーク成長モデル獲得部２０について説明する。
【００２７】
ネットワーク成長モデル獲得部２０は、隣接行列時系列データ獲得部１０で作成された、隣接行列の時系列データ｛Ａｔ　；ｔ＝０，１，…，Ｔ｝を訓練データとし、パラメータを持つネットワーク成長予測モデルを“ｍａｘｉｍａｌ　ｌｉｋｅｌｉｈｏｏｄ　ｅｓｔｉｍａｔｅ　”に基づいて学習させることにより、トピックσに関わるＷＷＷネットワークの成長予測モデルを獲得する。
【００２８】
以下では、まず、パラメータを持つネットワーク成長予測モデルを説明し、次に、その学習法を説明する。
【００２９】
成長予測モデルとしては、未来の時刻ｔ（＞Ｔ）において予測される、トピックσに関わるＷＷＷネットワークＧｔ　（σ）の隣接行列がＡｔ　であるという確率は、Ｐ（Ａｔ　｜ＡＴ　，θ）という形のパラメータθを持つ予測モデルで次のように記述されるとする。パラメータθは、
【００３０】
【数２】

であり、
【００３１】
【数３】

であり、
【００３２】
【数４】

である。ネットワークＧＴ　（σ）からネットワークＧｔ　（σ）へ増加したリンクの全体
【００３３】
【数５】

とする。ここに、［ｕｔ　^ｉ，ｖｔ　^ｉ］は始点がｕｔ　^ｉで終点がｖｔ　^ｉであるリンクを表しており、
【００３４】
【数６】

はリンク［ｕｔ　^ｉ，ｖｔ　^ｉ］が
【００３５】
【数７】

本加えられたことを表している。
【００３６】
ネットワークＧＴ　（σ）のノード全体の集合をＮＴ　と記述する。このとき、
【００３７】
【数８】

であり、
【００３８】
【数９】

【００３９】
【数１０】

であり、
【００４０】
【数１１】

であり、
【００４１】
【数１２】

である。
【００４２】
次に、学習法について説明する。
【００４３】
まず、コミュニティ数Ｋを設定し、時刻Ｔにおけるノード全体の集合ＮＴ　＝｛１，…，ＮＴ　｝を、隣接行列ＡＴ　を用いてＫ個の互いに交わらない部分集合（コミュニティ）ｚ^１，…，ｚ^Ｋに以下のようにして分割する。ｉ，ｊ∈ＮＴ　に対して、
ＢＴ　（ｉ，ｊ）＝ＡＴ　（ｉ，ｊ）＋ＡＴ　（ｊ，ｉ）
とし、
ＢＴ　（ｉ，ｉ）＝ｍａｘ　｛ＢＴ　（ｉ，ｊ）；ｊ∈ＮＴ　｝
とし、ａｉ　をその第ｈ成分ａｉ　（ｈ）が、
【００４４】
【数１３】

であるＮＴ　次元ベクトルとする。また、ノードｉからノードｊへの距離ｄを
【００４５】
【数１４】

で定義する。このとき、集合ＮＴ　と距離ｄに対して、よく知られているＫ−ｍｅａｎｓクラスタリングアルゴリズム（例えば、Ｃ．Ｂｉｓｈｏｐ，　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋｓ　ｆｏｒ　Ｐａｔｔｅｒｎ　Ｒｅｃｏｇｎｉｔｉｏｎ，　Ｏｘｆｏｒｄ　Ｕｎｉｖｅｒｓｉｔｙ　Ｐｒｅｓｓ，　１９９５，　の５．９．３　節を参照）を適用することにより、集合ＮＴ　をＫ個の互いに交わらない部分集合ｚ^１，…，ｚ^Ｋに分割する。
【００４６】
次に、このクラスタリングの結果に基づいて、パラメータ
【００４７】
【数１５】

を推定する。時刻ｔ＝０での隣接行列Ａ０　と時刻ｔ＝Ｔでの隣接行列ＡＴ　からこの期間に増加したリンクを調べることにより、この期間に増加したリンクの総数ｍ、この期間に増加したリンクで始点がｚ^ｋに属するものの数ｎ１　^ｋ、この期間に増加したリンクで始点がｚ^ｋに属し、終点が
【００４８】
【数１６】

に属するものの数
【００４９】
【数１７】

この期間に増加したリンクで始点がｚ^ｋに属し、終点が
【００５０】
【数１８】

に属し、始点も終点も旧ノードであったものの数
【００５１】
【数１９】

この期間に増加したリンクで始点がｚ^ｋに属し、終点が
【００５２】
【数２０】

に属し、始点が旧ノードで終点が新ノードであったものの数
【００５３】
【数２１】

この期間に増加したリンクの始点がｚ^ｋに属し、終点が
【００５４】
【数２２】

に属し、始点が新ノードで終点が旧ノードであったものの数
【００５５】
【数２３】

この期間に増加したリンクで始点がｚ^ｋに属し、終点が
【００５６】
【数２４】

に属し、始点も終点も新ノードであったものの数
【００５７】
【数２５】

を、それぞれ計算する。このとき、
【００５８】
【数２６】

と推定する。
【００５９】
最後に、残りのパラメータ
【００６０】
【数２７】

と
【００６１】
【数２８】

をｍａｘｉｍａｌ　ｌｉｋｅｌｉｈｏｏｄ　ｅｓｔｉｍａｔｅ　に基づいて次のような逐次的な手法で推定する。ψ＝｛α，β｝とおく。
【００６２】
【数２９】

をψの現在の推定値とする。このとき、ψの次のステップの推定値は、
【００６３】
【数３０】

を最大化するψである。ここに、
【００６４】
【数３１】

である。ψの次のステップの推定値は、次のような逐次的な手法で、αとβ別々に推定される。
【００６５】
【数３２】

をαの現在の推定値とする。このとき、αの次のステップ推定値は、
【００６６】
【数３３】

で与えられる。ここに、
【００６７】
【数３４】

である。また、
【００６８】
【数３５】

は、
【００６９】
【数３６】

が隣接行列がＡｔ−１　であるネットワークのノードであるならば１で、そうでないならば０である。βの次のステップ推定値もまた同様に与えられる。従って、パラメータ
【００７０】
【数３７】

が推定される。
【００７１】
以上より、隣接行列の時系列データ｛Ａｔ　；ｔ＝０，１，…，Ｔ｝からトピックσに関わるＷＷＷネットワークの成長予測モデル
Ｐ（Ａｔ　｜ＡＴ　，θ），　ｔ＞Ｔ
が構成された。
【００７２】
次に、動的ハブ・動的オーソリティ獲得部３０について説明する。
【００７３】
動的ハブ・動的オーソリティ獲得部３０は、ネットワーク成長モデル獲得部２０で作成されたトピックσに関わるＷＷＷネットワークの成長予測モデルＰ（Ａｔ　｜ＡＴ　，θ）に対して、その動的確率行列から動的ハブベクトルと動的オーソリティベクトルを計算することにより、各Ｗｅｂページの動的ハブ度と動的オーソリティ度を獲得する。
【００７４】
以下に、動的ハブ・動的オーソリティ獲得部３０の動作の詳細を説明する。
【００７５】
まず、ＮＴ　×ＮＴ　行列Γを、ｉ，ｊ∈ＮＴ　に対して、
Γ（ｉ，ｊ）＝Ｐ（［ｉ，ｊ］｜ＡＴ　，θ）
により定義する。これをトピックσに関わるＷＷＷネットワークの成長予測モデルの動的確率行列と呼ぶ。この動的確率行列Γに対して、行列の主固有ベクトルを求めるよく知られた巾法（例えば、Ｊ．Ｋｌｅｉｎｂｅｒｇ，　Ａｕｔｈｏｒｉｔａｔｉｖｅ　ｓｏｕｒｃｅｓ　ｉｎ　ａ　ｈｙｐｅｒｌｉｎｋｅｄ　ｅｎｖｉｒｏｎｍｅｎｔ，　Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　９ｔｈ　ＡＣＭ−ＳＩＡＭ　Ｓｙｍｐｏｓｉｕｍ　ｏｎ　Ｄｉｓｃｒｅｔｅ　Ａｌｇｏｒｉｔｈｍ，　６６８−６７７，　１９９８．を参照）を、行列ΓΓ^Ｔと行列Γ^ＴΓに適用することにより、ＮＴ　次元のベクトルｙとベクトルｘをそれぞれ求める。ここに、Γ^Ｔは、行列Γの転置行列を表している。ベクトルｙを動的ハブベクトル、ベクトルｘを動的オーソリティベクトルを呼ぶ。ベクトルｙの第ｉ成分ｙ（ｉ）とベクトルｘの第ｉ成分ｘ（ｉ）は、トピックσに関わるＷＷＷネットワークにおいて、それぞれ、将来のハブ度とオーソティ度を予測するものであり、Ｗｅｂページｉの動的ハブ度と動的オーソリティ度と呼ぶ。
【００７６】
従って、トピックσに関わるＷＷＷネットワークの成長予測モデルから、各Ｗｅｂページの動的ハブ度と動的オーソリティ度が作成された。
【００７７】
次に、有望ハブ・有望オーソリティ獲得部４０について説明する。
【００７８】
有望ハブ・有望オーソリティ獲得部４０は、出力数ｎが指定されたとき、動的ハブ・動的オーソリティ獲得部３０で作成された、トピックσに関わるＷＷＷネットワークにおける、時刻Ｔでの各Ｗｅｂページの動的ハブ度と動的オーソリティ度に基づいて、その上位ｎページをそれぞれ出力する。即ち、出力数ｎが指定されたならば、まず、
【００７９】
【数３８】

であるｊ１　，…，ｊｎ　∈ＮＴ　を計算し、
【００８０】
【数３９】

であるｉ１　，…，ｉｎ　∈ＮＴ　を計算する。その結果、当該トピックに関わるＷＷＷネットワークの将来の中心的ページの候補として、ｎ個のＷｅｂページｊ１　，…，ｊｎ　を、その将来の権威的ページの候補としてｎ個のＷｅｂページｉ１　，…，ｉｎ　を、それぞれ出力する。
【００８１】
次に、上記の構成における一連の動作を説明する。
【００８２】
図４は、本発明の一実施の形態におけるＷＷＷにおけるハブとオーソリティ予測方法のフローチャートである。
【００８３】
ステップ１０１）　隣接行列時系列データ獲得部１０にトッピックが与えられると、隣接行列時系列データ獲得部１０は、トピックに対して、当該トピックを質問として、ＷＷＷ検索エンジン５０にアクセスすることにより、当該トピックに関わるＷＷＷネットワークの隣接行列の時系列データを獲得し、ネットワーク成長モデル獲得部２０に渡す。
【００８４】
ステップ１０２）　ネットワーク成長モデル獲得部２０は、隣接行列時系列データ獲得部１０から取得した当該トピックに関わるＷＷＷネットワークの隣接行列の時系列データを訓練データとして、パラメータを持つネットワーク成長予測モデルを学習させることにより、当該トピックに関わるＷＷＷネットワークの成長予測モデルを獲得し、動的ハブ・動的オーソリティ獲得部３０に渡す。
【００８５】
ステップ１０３）　動的ハブ・動的オーソリティ獲得部３０は、ネットワーク成長モデル獲得部２０から取得した、当該トピックに関わるＷＷＷネットワークの成長モデルに対して、その動的確率行列から動的ハブベクトルと動的オーソリティベクトルを計算することにより、各Ｗｅｂページの動的ハブ度と動的オーソリティ度を獲得し、有望ハブ・有望オーソリティ獲得部４０に渡す。
【００８６】
ステップ１０４）　有望ハブ・有望オーソリティ獲得部４０は、出力数ｎが指定されると、動的ハブ・動的オーソリティ獲得部３０から取得した各Ｗｅｂページの動的ハブ度と動的オーソリティ度に基づいて、当該トピックに関わるＷＷＷネットワークの将来の中心的ページと権威的ページの候補の上位ｎページをそれぞれ出力する。
【００８７】
【実施例】
以下、図面と共に、本発明の実施例を説明する。
【００８８】
以下では、トピックとして“ｍｐ３”を与え、Ｔ＝１として行った例を用いて説明する。
【００８９】
図５は、本発明の一実施例のトピックｍｐ３に関わるＷＷＷネットワークの将来の中心的Ｗｅｂページを予測した例を示す。
【００９０】
図５（ａ）では、時刻Ｔでのｍｐ３に関わるＷＷＷネットワークに対するハブ度の上位２０ページを横軸にとり、縦軸に、時刻Ｔでのハブ度と、時刻Ｔ＋Δｔでのハブ度、Ｋ＝１としたネットワーク成長予測モデルを用いて学習した場合の時刻Ｔでの動的ハブ度、Ｋ＝２としたネットワーク成長予測モデルを用いて学習した場合の時刻Ｔでの動的ハブ度を、それぞれとり、それらの値がプロットされている。
【００９１】
図５（ｂ）と図５（ｃ）は、Ｋ＝２としたネットワークの成長予測モデルを用いて学習した場合について、予測結果をより細かく見た図である。
【００９２】
図５（ｂ）では、時刻Ｔでのコミュニティｚ^１に属するノードの中で、時刻Ｔでのｍｐ３に関わるＷＷＷネットワークに対するハブ度の上位２０ページを横軸にとり、縦軸に時刻Ｔでのハブ度と、時刻Ｔ＋Δｔでのハブ度、時刻Ｔでの動的ハブ度を、それぞれとり、それらの値がプロットされている。
【００９３】
図５（ｃ）では、時刻Ｔでのコミュニティｚ^２に属するノードの中で、時刻Ｔでのｍｐ３に関わるＷＷＷネットワークに対するハブ度の上位２０ページを横軸にとり、縦軸に、時刻Ｔでのハブ度と、時刻Ｔ＋Δｔでのハブ度、時刻Ｔでの動的ハブ度を、それぞれとり、それらの値がプロットされている。
【００９４】
図５において、菱形の記号は、時刻Ｔでのｍｐ３に関わるＷＷＷネットワークに対するハブ度を、三角の記号は、時刻Ｔ＋Δｔでのｍｐ３に関わるＷＷＷネットワークに対するハブ度を、丸の記号は、Ｋ＝１としたネットワーク成長予測モデルを用いて学習した場合の時刻Ｔでの動的ハブ度、四角の記号は、Ｋ＝２としたネットワーク成長予測モデルを用いて学習した場合の時刻Ｔでの動的ハブ度を、それぞれ表している。
【００９５】
図５を用いて本実施例を説明する。
【００９６】
コミュニティ数Ｋに対しては、Ｋ＝１とした（コミュニティ構造を組み込まない）ネットワーク成長予測モデルと、Ｋ＝２とした（コミュニティ構造を組み込んだ）ネットワーク成長モデルとを比較する。図５（ａ）に示されているように、ｍｐ３に関わるＷＷＷネットワークにおいて、時刻Ｔから見た未来の時刻Ｔ＋Δｔでの中心的ページは、時刻Ｔでの中心的ページと変化している。図５から、ｍｐ３に関わるＷＷＷネットワークの時刻Ｔ＋Δｔでのハブ度の変動は、Ｋ＝２としたネットワーク成長予測モデルを用いて学習した場合の時刻Ｔでの動的ハブ度の変動により、高精度に予測できることがわかる。即ち、ｍｐ３に関わるＷＷＷネットワークの時刻Ｔ＋Δｔでの中心的ページは、本発明の方法を用いることで、高精度に予測できることがわかる。また、図５（ａ）から、ｍｐ３に関わるＷＷＷネットワークの時刻Ｔ＋Δｔでの中心的ページの予測に関しては、Ｋ＝２としたネットワーク成長予測モデルを用いて学習した場合の方が、Ｋ＝１としてネットワーク成長予測モデルを用いて学習した場合よりも、精度が高いことがわかる。即ち、コミュニティ数Ｋを適切に設定することにより、将来の中心的ページの高精度な予測が可能なことがわかる。
【００９７】
以上より、ｍｐ３に関わるＷＷＷネットワークの時刻Ｔ＋Δｔでの中心的ページは、時刻Ｔまでの精度を基に本発明を利用することにより、高精度に予測できることが示される。
【００９８】
また、上記の実施の形態における図３に示す構成要素をプログラムとして構築し、予測装置として利用されるコンピュータにインストールする、または、ネットワークを介して流通させることが可能である。
【００９９】
また、構築されたプログラムを予測装置として利用されるコンピュータに接続されるハードディスク装置や、フレキシブルディスク、ＣＤ−ＲＯＭ等の可搬記憶媒体に格納しておき、本発明を実施する際にインストールすることにより、本発明を実現できる。
【０１００】
なお、本発明は、上記の実施の形態及び実施例に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
【０１０１】
【発明の効果】
上述のように、本発明によれば、与えられたトピックに対して、当該トピックに関わるＷＷＷネットワークの隣接行列の時系列データを獲得でき、このトピックに関わるＷＷＷネットワークの隣接行列の時系列データに基づいて、当該トピックに関わるＷＷＷネットワークの成長予測モデルを獲得でき、このトピックに関わるＷＷＷネットワークの成長予測モデルに基づいて、各Ｗｅｂページの動的ハブ度と動的オーソリティ度とを獲得でき、さらに出力数ｎが指定されたとき、この各Ｗｅｂページの動的ハブ度と動的オーソリティ度に基づいて、当該トピックに関わるＷＷＷネットワークの将来の中心的ページと権威的ページの候補の上位ｎページをそれぞれ出力できるので、与えられたトピックに対する将来のＷＷＷネットワークの中心的ページと権威的ページの予測が実現できるという効果を奏する。
【図面の簡単な説明】
【図１】本発明の原理を説明するための図である。
【図２】本発明の原理構成図である。
【図３】本発明の一実施の形態における予測装置の構成図である。
【図４】本発明の一実施の形態におけるハブとオーソリティ予測方法のフローチャートである。
【図５】本発明の一実施例のトピックｍｐ３に関わるＷＷＷネットワークの将来の中心的Ｗｅｂページを予測した例である。
【符号の説明】
１０　隣接行列時系列データ獲得手段、隣接行列時系列データ獲得部
２０　ネットワーク成長モデル獲得手段、ネットワーク成長モデル獲得部
３０　動的ハブ・動的オーソリティ獲得手段、動的ハブ・動的オーソリティ獲得部
４０　有望ハブ・有望オーソリティ獲得手段、有望ハブ・有望オーソリティ獲得部
５０　ＷＷＷ検索エンジン

Claims

コンピュータ上で入力されたトピックに対する将来のＷＷＷ（Ｗｏｒｌｄ　Ｗｉｄｅ　Ｗｅｂ）　ネットワークの中心的ページと権威的ページを予測するためのＷＷＷにおけるハブとオーソリティ予測方法において、
前記与えられたトピックに対して、該トピックに基づいてＷＷＷ検索エンジンにアクセスして、該トピックに関わるＷＷＷネットワークの隣接行列の時系列データを獲得し、
獲得された前記トピックに関わるＷＷＷネットワークの隣接行列の時系列データを訓練データとして、パラメータをもつネットワーク成長予測モデルを学習させることにより、該トピックに関わるＷＷＷネットワークの成長予測モデルを獲得し、
獲得された前記トピックに関わるＷＷＷネットワークの成長予測モデルの動的確率行列から動的ハブベクトルと動的オーソリティベクトルを計算することにより、各Ｗｅｂページの動的ハブ度と動的オーソリティ度を獲得し、
出力数ｎが指定されたとき、前記Ｗｅｂページの動的ハブ度と動的オーソリティ度に基づいて、前記トピックに関わるＷＷＷネットワークの将来の中心的ページと権威的ページの候補の上位ｎページをそれぞれ出力することを特徴とするＷＷＷにおけるハブとオーソリティ予測方法。
コンピュータ上で入力されたトピックに対する将来のＷＷＷネットワークの中心的ページと権威的ページを予測するためのＷＷＷにおけるハブとオーソリティ予測装置であって、
前記与えられたトピックに対して、該トピックに基づいてＷＷＷ検索エンジンにアクセスして、該トピックに関わるＷＷＷネットワークの隣接行列の時系列データを収集する隣接行列時系列データ獲得手段と、
前記隣接行列時系列データ獲得手段で獲得された前記トピックに関わるＷＷＷネットワークの隣接行列の時系列データを訓練データとして、パラメータをもつネットワーク成長予測モデルを学習させることにより、該トピックに関わるＷＷＷネットワークの成長予測モデルを作成するネットワーク成長モデル獲得手段と、
前記ネットワーク成長モデル獲得手段で作成された前記トピックに関わるＷＷＷネットワークの成長予測モデルの動的確率行列から動的ハブベクトルと動的オーソリティベクトルを計算することにより、各Ｗｅｂページの動的ハブ度と動的オーソリティ度を取得する動的ハブ・動的オーソリティ獲得手段と、
出力数ｎが指定されたとき、前記動的ハブ・動的オーソリティ獲得手段で計算された前記Ｗｅｂページの動的ハブ度と動的オーソリティ度に基づいて、前記トピックに関わるＷＷＷネットワークの将来の中心的ページと権威的ページの候補の上位ｎページをそれぞれ出力する有望ハブ・有望オーソリティ獲得手段と、を有することを特徴とするＷＷＷにおけるハブとオーソリティ予測装置。
コンピュータ上で入力されたトピックに対する将来のＷＷＷネットワークの中心的ページと権威的ページを予測するための予測プログラムであって、
前記与えられたトピックに対して、該トピックに基づいてＷＷＷ検索エンジンにアクセスして、該トピックに関わるＷＷＷネットワークの隣接行列の時系列データを収集する隣接行列時系列データ獲得ステップと、
前記隣接行列時系列データ獲得ステップで獲得された前記トピックに関わるＷＷＷネットワークの隣接行列の時系列データを訓練データとして、パラメータをもつネットワーク成長予測モデルを学習させることにより、該トピックに関わるＷＷＷネットワークの成長予測モデルを作成するネットワーク成長モデル獲得ステップと、
前記ネットワーク成長モデル獲得ステップで作成された前記トピックに関わるＷＷＷネットワークの成長予測モデルの動的確率行列から動的ハブベクトルと動的オーソリティベクトルを計算することにより、各Ｗｅｂページの動的ハブ度と動的オーソリティ度を取得する動的ハブ・動的オーソリティ獲得ステップと、
出力数ｎが指定されたとき、前記動的ハブ・動的オーソリティ獲得ステップで計算された前記Ｗｅｂページの動的ハブ度と動的オーソリティ度に基づいて、前記トピックに関わるＷＷＷネットワークの将来の中心的ページと権威的ページの候補の上位ｎページをそれぞれ出力する有望ハブ・有望オーソリティ獲得ステップと、を実行することを特徴とする予測プログラム。
コンピュータ上で入力されたトピックに対する将来のＷＷＷネットワークの中心的ページと権威的ページを予測するための予測プログラムを格納した記憶媒体であって、
前記与えられたトピックに対して、該トピックに基づいてＷＷＷ検索エンジンにアクセスして、該トピックに関わるＷＷＷネットワークの隣接行列の時系列データを収集する隣接行列時系列データ獲得ステップと、
前記隣接行列時系列データ獲得ステップで獲得された前記トピックに関わるＷＷＷネットワークの隣接行列の時系列データを訓練データとして、パラメータをもつネットワーク成長予測モデルを学習させることにより、該トピックに関わるＷＷＷネットワークの成長予測モデルを作成するネットワーク成長モデル獲得ステップと、
前記ネットワーク成長モデル獲得ステップで作成された前記トピックに関わるＷＷＷネットワークの成長予測モデルの動的確率行列から動的ハブベクトルと動的オーソリティベクトルを計算することにより、各Ｗｅｂページの動的ハブ度と動的オーソリティ度を取得する動的ハブ・動的オーソリティ獲得ステップと、
出力数ｎが指定されたとき、前記動的ハブ・動的オーソリティ獲得ステップで計算された前記Ｗｅｂページの動的ハブ度と動的オーソリティ度に基づいて、前記トピックに関わるＷＷＷネットワークの将来の中心的ページと権威的ページの候補の上位ｎページをそれぞれ出力する有望ハブ・有望オーソリティ獲得ステップと、を有することを特徴とする予測プログラムを格納した記憶媒体。