JP4965086B2 - タイプ内およびタイプ間の関係に基づいてオブジェクトを格付けする方法およびシステム - Google Patents

タイプ内およびタイプ間の関係に基づいてオブジェクトを格付けする方法およびシステム Download PDF

Info

Publication number
JP4965086B2
JP4965086B2 JP2005141125A JP2005141125A JP4965086B2 JP 4965086 B2 JP4965086 B2 JP 4965086B2 JP 2005141125 A JP2005141125 A JP 2005141125A JP 2005141125 A JP2005141125 A JP 2005141125A JP 4965086 B2 JP4965086 B2 JP 4965086B2
Authority
JP
Japan
Prior art keywords
type
data object
relationship
data
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005141125A
Other languages
English (en)
Other versions
JP2005327293A (ja
JP2005327293A5 (ja
Inventor
チャン ベンユー
チェン ホア−ジュン
マ ウェイ−イン
シー ウェンシー
チェン ツェン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2005327293A publication Critical patent/JP2005327293A/ja
Publication of JP2005327293A5 publication Critical patent/JP2005327293A5/ja
Application granted granted Critical
Publication of JP4965086B2 publication Critical patent/JP4965086B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/954Relational
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/955Object-oriented
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/962Entity-attribute-value
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Description

本発明は、一般には、オブジェクトの格付けに関し、より詳細には、オブジェクト関係に基づく格付けに関する。
GoogleおよびOvertureなど多くの検索エンジンサービスは、インターネットを介してアクセス可能な情報の検索を提供する。これらの検索エンジンサービスによりユーザは、Webページなど、ユーザにとって興味深いと思われる表示ページを検索することができる。検索語を含む検索要求(「クエリ」とも呼ばれる)をユーザが送信した後、検索エンジンサービスは、これらの検索語に関連していると思われるWebページを識別する。関連するWebページを迅速に識別するために、検索エンジンサービスは、Webページへのキーワードのマッピングを保持することができる。検索エンジンサービスは、Web(すなわちワールドワイドウェブ)を「クローリング」することによりこのマッピングを生成して、各Webページのキーワードを抽出することができる。Webをクロールするために、検索エンジンサービスは、ルートのWebページのリストを使用し、これらのルートのWebページを通じてアクセス可能なすべてのWebページを識別することができる。特定のWebページのキーワードは、見出し語、Webページのメタデータで供給された語、ハイライト表示された語などを識別するような、様々な周知の情報検索技術を使用して抽出することができる。検索エンジンサービスにより、各々の合致の近さ、Webページの人気(例えばGoogleのPageRank)などに基づいて各Webページが検索要求にどの程度関連しているかを示す適合性の評点(score)を計算することができる。次に、検索エンジンサービスにより、これらのWebページへのリンクを適合性に基づいた順序でユーザに表示する。検索エンジンにより、さらに一般的に、あらゆる文書の集まりで情報の検索を提供することができる。例えば、文書の集まりには、すべての米国特許、すべての連邦の法廷意見、企業のすべての保管文書などを含めることもできる。
Webページを格付けするための2つの周知の技術は、PageRankおよびHITS(「Hyperlinked−Induced Topic Search」)である。PageRankは、Webページが重要なWebページへのリンク(つまり「外向きのリンク」)を持つという原則に基づく。したがって、Webページの重要度は、そのWebページにリンク(つまり「内向きのリンク」)する他のWebページの数および重要度に基づく。簡単な形式では、Webページの間のリンクは行列Aによって表すことができ、ここでAijはWebページiからWebページjへの外向きのリンクの数を表す。Webページjの重要度の評点wは、以下の式で表すことができる。
=Σij
この式は、以下の式に基づく反復計算によって解くことができる。
w=w
ただし、wはWebページの重要度の評点のベクトルであり、Aの優固有ベクトル(principal eigenvector)である。
HITS技術はさらに、他の重要なWebページへのリンクを数多く持つWebページはそれ自体が重要であるという原則に基づく。したがって、HITSは、Webページの「重要度」を、「ハブ」および「オーソリティー(authority)」という2つの関連する属性に分割する。「ハブ」は、WebページがリンクするWebページの「オーソリティー」の評点によって評価され、「オーソリティー」は、WebページにリンクするWebページの「ハブ」の評点によって評価される。Webページの重要度をクエリからは独立して計算するPageRankとは対照的に、HITSでは、内向きおよび外向きのリンクをたどることによって結果のWebページおよび結果のWebページに関連するWebページに基づいて重要度を計算する。HITSは、検索エンジンサービスにクエリを送信し、結果のWebページをWebページの初期セットとして使用する。HITSは、内向きのリンクの宛先であるWebページおよび結果のWebページの外向きのリンクのソースであるWebページをセットに追加する。次にHITSは、反復アルゴリズムを使用して各Webページのオーソリティーおよびハブの評点を計算する。オーソリティーおよびハブの評点は、以下の式で表すことができる。
Figure 0004965086
ただし、a(p)はWebページpのオーソリティーの評点を表し、h(p)はWebページpのハブの評点を表す。HITSでは、隣接行列Aを使用してリンクを表す。隣接行列は、以下の式で表すことができる。
Figure 0004965086
ベクトルaおよびhはそれぞれ、セット内のすべてのWebページのオーソリティーおよびハブの評点に対応し、以下の式で表すことができる。
a=Ahおよびh=Aa
したがって、aおよびhは、行列AAおよびAAの固有ベクトルである。HITSはまた、アクセス数によって評価されるWebページの人気を計算に入れるように変更することもできる。Webログの分析に基づいて、隣接行列のbijは、ユーザがWebページiからWebページjに移動するときに増分することができる。
上述のWebページ格付け技術では、Webページの格付けを主としてWebページ自体の属性に基づいて行う。Webページ自体の属性は、一方のWebページから別のWebページへのリンク、および一方のWebページから別のWebページへの移動を含む。格付け技術では、Webページに直接関連がない属性を計算に入れることができない。例えば、Webページの重要度は、Webページにアクセスするユーザの専門知識が計算に入れられる場合、より正確に決定することができる。Webページに直接関連がない属性に基づいてWebページの重要度を計算するための技術を有することが望ましい。より一般的には、一方のタイプのオブジェクト(例えば、Webページ)の評点を、別のタイプのオブジェクト(例えば、ユーザ)との関係に基づいて生成することが望ましい。
異なるオブジェクトタイプのオブジェクトとの関係に基づいてオブジェクトを格付けするための方法およびシステムを提供する。格付けシステムにより、オブジェクトの各タイプの属性ごとに式を定義する。式は、属性値を定義し、属性と、同じタイプのオブジェクトおよび異なるタイプのオブジェクトに関連付けられる属性との間の関係に基づく。属性値は、一方の属性が別の属性に関して定義され、逆の場合も同じであるように相互依存することができるので、式は属性の再帰的定義を表す。格付けシステムにより、属性値が解に収束するまで式を使用して、オブジェクトの属性値を繰り返し計算する。次に、格付けシステムにより、属性値に基づいてオブジェクトの格付けを行う。
同じまたは別のデータオブジェクトタイプのデータオブジェクトとの関係に基づいてあるデータオブジェクトタイプのデータオブジェクトを格付けするための方法およびシステムを提供する。一実施形態において、格付けシステムにより、様々なデータオブジェクトタイプのデータオブジェクトを識別する。例えば、一方のデータオブジェクトタイプがWebページであり、別のデータオブジェクトタイプがクエリであり、および別のデータオブジェクトタイプがユーザである場合がある。各データオブジェクトタイプは、様々なタイプ固有の属性を有することができる。例えば、Webページがオーソリティー属性を有し、およびユーザが専門知識属性を有する場合がある。Webページのオーソリティー属性は、Webページの内向きのリンクの数に基づくことができる。ユーザの専門知識属性は、ユーザが高いオーソリティー属性値を持つWebページにアクセスする場合に増加される。格付けシステムにより、データオブジェクトの属性値を計算し、およびデータオブジェクトの属性値に基づいてデータオブジェクトを格付けすることができる。
格付けシステムにより、各オブジェクトが単一の属性を含むように、オブジェクトの「タイプ」を定義する。例えば、格付けシステムにより、Webページのオーソリティー属性に対応するタイプ、およびWebページのハブ属性に対応する別のタイプを定義することができる。したがって、2つのタイプは、同じ基礎をなすデータオブジェクト(例えばWebページ)を表すことができる。格付けシステムにより、タイプ内の関係と呼ばれる同じタイプのオブジェクトの様々な関係、およびタイプ間の関係と呼ばれる異なるタイプのオブジェクトの様々な関係を決定する。例えば、クエリが送信される場合、格付けシステムにより、その結果をオーソリティータイプのオブジェクトとして使用し、およびWebログを使用して、これらのWebページにアクセスしたユーザを専門知識タイプのオブジェクトとして識別することができる。オーソリティータイプのタイプ内の関係のオブジェクトは、Webページの内向きのリンクおよび外向きのリンク関係を含むことができる。例えば、Webページが別のWebページへのリンクを有する場合、Webページはその他のWebページへの外向きのリンクの関係を有し、およびその他のWebページはWebページへの内向きのリンクの関係を有する。オーソリティータイプおよび専門知識タイプオブジェクトのタイプ間の関係は、Webページへのユーザアクセスに基づく。例えば、ユーザがWebページにアクセスする場合、Webページおよびユーザはアクセスの関係を有する。格付けシステムにより、タイプ内の関係および他のタイプのオブジェクトの属性値と組み合わされたタイプ間の関係を使用して、所定のタイプのオブジェクトに対する属性の値を導き出す。例えば、格付けシステムにより、内向きのリンクおよび外向きのリンクの関係およびユーザアクセスの関係を使用して、Webページのオーソリティー属性およびハブ属性ならびにユーザの専門知識属性を導き出すことができる。
一実施形態において、格付けシステムにより、一次方程式など一連の式を使用して関係および属性を表す。格付けシステムにより、別のタイプの属性値に基づいて再帰的に定義される一次方程式を使用して、各タイプの属性値を表す。例えば、オーソリティー属性の一次方程式が専門知識属性の属性値に基づいて定義されることも、またその逆の場合もある。一次方程式は再帰的に定義することができるので、格付けシステムにより、属性値が解に収束するまで、各一次方程式の属性値を繰り返し計算することによって一次方程式を解く。一次方程式を解いた後、格付けシステムにより、属性値に基づいてデータオブジェクトを格付けすることができる。例えば、格付けシステムにより、Webページのオーソリティー属性値に基づいてWebページを格付けすることができる。
格付けシステムにより、オブジェクトのタイプ内の関係およびタイプ間の関係に基づいて、オブジェクトの属性値を表す。属性の値は、以下の数式によって表すことができる。
=F+Σj≠iji
ただし、Fはオブジェクトiに関連付けられる属性値を表し、Rはオブジェクトiのタイプのオブジェクトのタイプ内関係を表し、Rjiはオブジェクトiのタイプと他のオブジェクトjのタイプとのオブジェクトのタイプ間の関係を表す。x={x、x、・・・x}およびy={y、y、・・・y}の2つのオブジェクトのタイプがある場合、これらのタイプ内の関係はRおよびRとして表すことができ、タイプ間の関係はRXYおよびRYXによって表すことができる。格付けシステムでは、隣接行列を使用して関係情報を表す。LおよびLは、それぞれ集合XおよびYのタイプ内の関係の隣接行列を表す。LXYおよびLYXは、それぞれ、XのオブジェクトからYのオブジェクトへのタイプ間の関係の隣接行列およびYのオブジェクトからXのオブジェクトへのタイプ間の関係の隣接行列を表す。格付けシステムでは、以下のように隣接行列を表す。
Figure 0004965086
ただし、LXY(i,j)は、集合Xのオブジェクトiから集合Yのオブジェクトjへの関係(「リンク」とも呼ばれる)が存在するかどうかを示す。属性値の一次方程式は、以下の式のように表すことができる。
Figure 0004965086
ただし、wは、Xのオブジェクトの属性ベクトルであり、wはYのオブジェクトの属性ベクトルである。式1は、以下の形式に一般化することができる。
Figure 0004965086
ただし、Mは属性ベクトルの行列を表す。
オブジェクトの間の相互に補強し合う関係がオブジェクトに過度の属性値をもたらすことがあるので、格付けシステムにより、オブジェクトが1つの隣接行列内のn個の他のオブジェクトに関連する場合、各関連するオブジェクトはその1/n番目の属性値を受け取るような方法で、バイナリの隣接行列を正規化することができる。格付けシステムにより、PageRankのランダムサーファーモデルを導入して、ランダムな関係をシミュレートし、したがって、以下に説明する計算時のシンクノードを回避することができる。さらに、異なるタイプからの属性が各々他の属性に対して異なる重要度を有する可能性があるので、格付けシステムにより、タイプの各々の組み合わせに重み付けを使用することができる。したがって、格付けシステムにより、正規化、ランダムサーファーモデル、および重み付けを計算に入れて、以下の式によって属性値を表すことができる。
Figure 0004965086
ただし、Uは一様な推移確率の推移行列であり(すべてのi、jについてUij=1/n、ただし、nはデータ空間Nのオブジェクトの合計数)、LおよびLNMは正規化された隣接行列であり、δおよびεは行列LおよびLNM内のランダムな関係をシミュレートするために使用される平滑化因数であり、αおよびβNMは関係の重み付けを表す。格付けシステムにより、収束するまで式3を繰り返し計算する。式3は、以下の式で表される統合された正方行列Aによって表すことができる。
Figure 0004965086
行列Aは、対角線上に
Figure 0004965086
、統合された行列の他の部分に
Figure 0004965086
を有する。格付けシステムにより、行列Aを使用して、異なるデータ空間にあるすべてのデータオブジェクトの属性ベクトルである、ベクトルwを変換するために反復アプローチを使用する(例えば、w=Aw)。反復が収束する場合、ベクトルwは行列Aの優固有ベクトルである。
MおよびNが異質のデータ空間である場合、格付けシステムでは、ランダムな関係を使用して無関係を表す。MのオブジェクトがNのオブジェクトにリンクの関係を持たない場合、部分行列
Figure 0004965086
はゼロであり、「シンクノード」を表す。計算では、シンクノードにすべての属性値を割り当てることがある。これを防ぐために、格付けシステムにより、部分行列
Figure 0004965086
の対応する行のすべての要素を1/nに設定する。ただし、nはデータ空間Nのオブジェクトの合計数である。代替として、格付けシステムにより、望ましくないタイプ内およびタイプ間の関係に対して、対応する重み付けを0に設定することができる。しかし、βMNが0よりも大きい場合、反復計算が収束するのであればβNMは0よりも大きい必要がある。したがって、
Figure 0004965086
の関係が望ましくない場合、格付けシステムにより、βNMを非常に小さい正の重みに設定して
Figure 0004965086
の影響を低減する。
すべての隣接行列を使用して統合された行列を構築することにより、格付けシステムでは、異なるオブジェクトのタイプを含む、統合されたデータ空間を構築する。したがって、以前のタイプ間の関係は、統合された空間のタイプ間の関係と見なすことができ、格付けシステムにより、効率的に単一のデータ空間のリンク解析を行う。
図1は、一実施形態における格付けシステムのコンポーネントを例示するフロー図である。格付けシステム110は、通信リンク102を介して様々なWebサイト101に接続されている。格付けシステムには、オブジェクト収集コンポーネント112、関係確立コンポーネント113、評点計算コンポーネント114、およびオブジェクト順序付けコンポーネント115を呼び出してオブジェクトを格付けするオブジェクト格付けコンポーネント111を含む。オブジェクト格付けコンポーネント111は、Webページのセットを受け取り、タイプ内およびタイプ間の関係に基づいてWebページを格付けすることができる。オブジェクト収集コンポーネント112は、様々なタイプのオブジェクトに関連する関係情報を取り出す。例えば、オブジェクト収集コンポーネント112は、WebサイトのWebログにアクセスして、どのユーザがどのWebページにアクセスするのかを識別することができる。関係確立コンポーネント113は、タイプ内およびタイプ間の関係の行列を作成する。例えば、関係の行列は、ユーザがアクセスするWebページにユーザをマッピングすることができる。評点計算コンポーネント114は、属性値が解に収束するまで、式3を使用して属性値を再帰的に計算する。オブジェクト順序付けコンポーネント115は、属性値に基づいてデータオブジェクトをソートする。例えば、オブジェクト順序付けコンポーネント115は、Webページのオーソリティー属性の値を使用して、Webページをソートすることができる。
格付けシステムが実装されるコンピューティング装置には、中央処理装置、メモリ、入力装置(例えば、キーボードおよびポインティングデバイスなど)、出力装置(例えば、ディスプレイ装置など)、および記憶装置(例えば、ディスクドライブなど)を含めることができる。メモリおよび記憶装置は、格付けシステムを実装する命令を含めることができるコンピュータ読取可能な媒体である。さらに、データ構造およびメッセージ構造を、通信リンク上の信号などのデータ伝送媒体を介して格納または送信することができる。インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、またはポイントツーポイントのダイヤルアップ接続など、様々な通信リンクを使用することができる。
格付けシステムを、様々なオペレーティング環境において実装することができる。使用に最適な様々な周知のコンピューティングシステム、環境、および構成には、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドまたはラップトップ装置、マルチプロセッサシステム、マイクロプロセッサに基づくシステム、プログラム可能な家庭用電化製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記のシステムまたは装置のいずれかを含む分散コンピューティング環境などが含まれる。
格付けシステムにより、1つまたは複数のコンピュータまたは他の装置によって実行されるプログラムモジュールなど、コンピュータ実行可能命令の一般的なコンテキストにおいて説明することができる。一般に、プログラムモジュールには、特定のタスクを実行するかまたは特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などが含まれる。通常、プログラムモジュールの機能を、様々な実施形態において望ましいように組み合わせまたは分散することができる。
図2は、一実施形態におけるオブジェクト格付けコンポーネントの処理を例示するフロー図である。コンポーネントは、オブジェクト情報を収集し、オブジェクトの間の関係を確立し、オブジェクトの属性値を計算し、属性に基づいてオブジェクトを順序付ける。ブロック201において、コンポーネントは、様々なオブジェクトに関連する情報を収集する。ブロック202において、コンポーネントは、関係確立コンポーネントを呼び出して、隣接行列を生成する。関係確立コンポーネントはまた、αおよびβの重みを取り出して調整することもできる。ブロック203において、コンポーネントは、評点計算コンポーネントを呼び出して、属性値が解に収束するまで属性値を繰り返し計算する。ブロック204において、コンポーネントは、属性の値に基づいてデータオブジェクトを順序付ける。例えば、コンポーネントは、オーソリティー属性に基づいてWebページを順序付けすることができる。
図3は、一実施形態における関係確立コンポーネントの処理を例示するフロー図である。ブロック301から303において、コンポーネントは、各タイプに対する隣接行列を確立するループを行う。ブロック301において、コンポーネントは次のタイプを選択する。判断ブロック302において、すべてのタイプがすでに選択されている場合、コンポーネントは戻り、別の場合、コンポーネントはブロック303において続行する。ブロック303において、コンポーネントは、選択されたタイプのオブジェクトとすべてのタイプのオブジェクトとの間の関係を確立する。例えば、コンポーネントは、オーソリティータイプとハブタイプとの間の関係、およびオーソリティータイプと専門知識タイプとの間の関係を確立する。次に、コンポーネントはブロック301へのループを行い、次のタイプを選択する。
図4は、一実施形態における評点計算コンポーネントの処理を例示するフロー図である。コンポーネントは、属性値が収束するまで式を繰り返し計算する。ブロック401において、コンポーネントは、隣接行列によって表されたオブジェクトの関係を取り出す。ブロック402において、コンポーネントは、タイプ内およびタイプ間の関係に対する重みαおよびβを取り出す。ブロック403において、コンポーネントは、各タイプのベクトルwを初期化して、そのタイプの各オブジェクトに対し等しい属性値を持つようにする。コンポーネントは、各値を1/mに設定することができる。ただし、mはタイプのオブジェクトの数である。例えば、10のユーザがある場合、コンポーネントは専門知識タイプの初期の属性値を1/10に設定する。コンポーネントはまた、判断ブロック405の検査を最初に通過するように、各タイプの差異変数を大きい値に初期化する。コンポーネントは、計算が解に収束しているかどうかを決定するために、各反復の最後において各差異変数に新しい値を計算する。ブロック404から409において、コンポーネントは、計算が解に収束するまで式3の計算を実行する。ブロック404において、コンポーネントは次の反復を開始する。判断ブロック405において、前回の反復中に計算された差異の合計が差異のしきい値よりも小さい場合、計算は解に収束しており、コンポーネントは戻り、別の場合、コンポーネントはブロック406において続行する。ブロック406において、コンポーネントは次のタイプを選択する。判断ブロック407において、すべてのタイプがすでに選択されている場合、コンポーネントはブロック404にループを行い、次の反復を開始し、別の場合、コンポーネントはブロック408において続行する。ブロック408において、コンポーネントは、以前の反復において計算された値に基づいて、選択されたタイプの値を計算する。ブロック409において、コンポーネントは、この反復の値と選択されたタイプの以前の反復の値との間の差異を計算する。次に、コンポーネントはブロック406にループを行い、次のタイプを選択する。
本明細書において格付けシステムの特定の実施形態について例示のために説明しているが、本発明の精神および範囲を逸脱することなく、様々な変更を行うことができることを、当事業者であれば理解するであろう。例えば、当事業者であれば、属性値を表すために非線形方程式を使用することができることを理解するであろう。また、格付けシステムは、相互に何らかの関係を有するすべてのタイプのオブジェクトに使用することができる。例えば、格付けシステムにより、学生または志願者と教授との関係を使用する「重要度」に基づいて大学を格付けするために使用することもできる。ここで、大学、学生、および教授は異なるタイプのオブジェクトを表す。したがって、本発明は、添付の請求の範囲による場合を除き、限定されることはない。
一実施形態における格付けシステムのコンポーネントを例示するフロー図である。 一実施形態におけるオブジェクト格付けコンポーネントの処理を例示するフロー図である。 一実施形態における関係確立コンポーネントの処理を例示するフロー図である。 一実施形態における評点計算コンポーネントの処理を例示するフロー図である。

Claims (11)

  1. プロセッサを備えたコンピュータが検索対象としての複数のデータオブジェクトの属性の属性値を決定する方法であって、
    各データオブジェクトは一つのタイプに関連付けられ、該データオブジェクトのタイプは該タイプに固有の属性を有し、該属性は、該データオブジェクトの内向きリンクおよび外向きリンク、並びにWebログに基づいて決定され、
    前記方法は、
    前記プロセッサが複数のデータオブジェクトを識別するステップ
    前記識別されたデータオブジェクトに関連付けられた前記タイプの各々に対して、前記プロセッサが、該タイプに関連付けられる複数のデータオブジェクト間のタイプ内関係を識別し、および該タイプに関連付けられる一つのデータオブジェクトと他のタイプに関連付けられる他のデータオブジェクトとの間のタイプ間関係を識別するステップと、
    前記識別されたデータオブジェクトに関連付けられた前記タイプの各々に対して、前記プロセッサが、該タイプの属性の属性値を計算する各タイプについての関数を使用して前記識別されたタイプ内関係およびタイプ間関係に基づいて前記データオブジェクトの属性の属性値を計算するステップであって、前記関数は、Fがデータオブジェクトiに関連付けられた属性値を表し、Rはデータオブジェクトiのタイプを持つ複数のデータオブジェクト間のタイプ内の関係を表し、およびRjiはデータオブジェクトiのタイプを持つデータオブジェクトと他のデータオブジェクトjのタイプを持つデータオブジェクトとの間のタイプ間の関係を表す、
    =F+Σj≠iji
    として定義されるステップと
    前記プロセッサが、前記計算された属性値を格納するステップと
    を含み、
    前記タイプ内関係は、同じタイプのデータオブジェクト間の関係であり、
    前記タイプ間関係は、異なるタイプのデータオブジェクト間の関係であることを特徴とする方法。
  2. プロセッサを備えたコンピュータが検索対象としての複数のデータオブジェクトの属性の属性値を決定する方法であって、
    各データオブジェクトは一つのタイプに関連付けられ、該データオブジェクトのタイプは該タイプに固有の属性を有し、該属性は、該データオブジェクトの内向きリンクおよび外向きリンク、並びにWebログに基づいて決定され、
    前記方法は、
    前記プロセッサが複数のデータオブジェクトを識別するステップと
    前記識別されたデータオブジェクトに関連付けられた前記タイプの各々に対して、前記プロセッサが、該タイプに関連付けられる複数のデータオブジェクト間のタイプ内関係を識別し、および該タイプに関連付けられる一つのデータオブジェクトと他のタイプに関連付けられる他のデータオブジェクトとの間のタイプ間関係を識別するステップと、
    前記識別されたデータオブジェクトに関連付けられた前記タイプの各々に対して、前記プロセッサが、該タイプの属性の属性値を計算する各タイプについての関数を使用して前記識別されたタイプ内関係およびタイプ間関係に基づいて前記データオブジェクトの属性の属性値を計算するステップであって、前記関数は、
    Figure 0004965086
    であるステップと、
    前記プロセッサが、前記計算された属性値を格納するステップと
    を含み、
    前記タイプ内関係は、同じタイプのデータオブジェクト間の関係であり、
    前記タイプ間関係は、異なるタイプのデータオブジェクト間の関係であることを特徴とする方法。
  3. 前記データオブジェクトのタイプは、オーソリティータイプ、ハブタイプ及び専門知識タイプを含むことを特徴とする請求項1または請求項2に記載の方法。
  4. 前記オーソリティータイプの複数のデータオブジェクト間の関係は、Webページが別のWebページからのリンクを有するかどうかに基づいて定まることを特徴とする請求項3に記載の方法。
  5. 前記オーソリティータイプのデータオブジェクトと前記専門知識タイプのデータオブジェクトとの間の関係は、ユーザによるWebページへのアクセスに基づいて定まることを特徴とする請求項4に記載の方法。
  6. 前記ハブタイプの複数のデータオブジェクト間の関係は、Webページが別のWebページへのリンクを有するかどうかに基づいて定まることを特徴とする請求項3に記載の方法。
  7. 前記プロセッサが、あるタイプのデータオブジェクトを該オブジェクトの属性値に基づいて格付けするステップをさらに含むことを特徴とする請求項1または請求項2に記載の方法。
  8. 前記データオブジェクトのタイプの属性値を定義する各データオブジェクトのタイプについての式が規定されることを特徴とする請求項1または請求項2に記載の方法。
  9. 前記計算するステップは、前記式を繰り返し解くステップを含むことを特徴とする請求項に記載の方法。
  10. プロセッサを備えたコンピュータが検索対象としてのデータオブジェクトの属性の属性値を決定する方法であって、
    各データオブジェクトは一つのタイプに関連付けられ、該データオブジェクトのタイプは該タイプに固有の属性を有し、該属性は、該データオブジェクトの内向きリンクおよび外向きリンク、並びにWebログに基づいて決定され、
    所定の関数は、あるタイプのデータオブジェクトについてのタイプに固有の属性の属性値を、該タイプのデータオブジェクトと、別のタイプに固有の属性を有する別のタイプのデータオブジェクトとの間の関係に基づいて計算するための関数であり
    前記所定の関数は、該タイプの複数のデータオブジェクト間の関係にも基づいて計算するための関数であり
    前記関数は、Fがデータオブジェクトiに関連付けられた属性値を表し、Rはデータオブジェクトiのタイプを持つ複数のデータオブジェクト間のタイプ内関係を表し、およびRjiはデータオブジェクトiのタイプを持つデータオブジェクトと他のデータオブジェクトjのタイプを持つデータオブジェクトとの間のタイプ間関係を表す、
    =F+Σj≠iji
    として定義され
    前記方法は、
    前記プロセッサが、前記あるタイプの複数のデータオブジェクト間のタイプ内関係を特定する第1のデータを受け取るステップと、
    前記プロセッサが、前記あるタイプのデータオブジェクトと前記別のタイプのデータオブジェクトとの間のタイプ間関係を特定する第2のデータを受け取るステップと、
    前記第1のデータおよび前記第2のデータを受け取ったことに応答して、前記プロセッサが、前記所定の関数を計算して、前記あるタイプデータオブジェクトの属性値を決定するステップと、
    前記プロセッサが、前記決定された属性値を格納するステップと
    を含み、
    前記タイプ内関係は、同じタイプのデータオブジェクト間の関係であり、
    前記タイプ間関係は、異なるタイプのデータオブジェクト間の関係であることを特徴とする方法。
  11. プロセッサを備えたコンピュータが検索対象としての複数のデータオブジェクトの属性の属性値を決定するためのコンピュータ実行可能命令を含むコンピュータ読み取り可能な記録媒体であって、
    各データオブジェクトは一つのタイプに関連付けられ、該データオブジェクトのタイプは該タイプに固有の属性を有し、該属性は、該データオブジェクトの内向きリンクおよび外向きリンク、並びにWebログに基づいて決定され、
    前記コンピュータ実行可能命令は、前記プロセッサによって実行される時、前記プロセッサに、
    複数のデータオブジェクトを識別するステップと、
    前記識別されたデータオブジェクトに関連付けられた前記タイプの各々に対して、該タイプに関連付けられる複数のデータオブジェクト間のタイプ内関係を識別し、および該タイプに関連付けられる一つのデータオブジェクトと他のタイプに関連付けられる他のデータオブジェクトとの間のタイプ間関係を識別するステップと、
    前記識別されたデータオブジェクトに関連付けられた前記タイプの各々に対して、該タイプの属性の属性値を計算する各タイプについての関数を使用して前記識別されたタイプ内関係およびタイプ間関係に基づいて前記データオブジェクトの属性の属性値を計算するステップであって、前記関数は、がデータオブジェクトiに関連付けられた属性値を表し、Rはデータオブジェクトiのタイプを持つ複数のデータオブジェクト間のタイプ内の関係を表し、およびRjiはデータオブジェクトiのタイプを持つデータオブジェクトと他のデータオブジェクトjのタイプを持つデータオブジェクトとの間のタイプ間の関係を表す、
    =F+Σj≠iji
    として定義されるステップと
    前記計算された属性値を格納するステップと
    を含む方法を実行させ
    前記タイプ内関係は、同じタイプのデータオブジェクト間の関係であり、
    前記タイプ間関係は、異なるタイプのデータオブジェクト間の関係であることを特徴とするコンピュータ読み取り可能な記録媒体。
JP2005141125A 2004-05-14 2005-05-13 タイプ内およびタイプ間の関係に基づいてオブジェクトを格付けする方法およびシステム Expired - Fee Related JP4965086B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/846,835 US7346621B2 (en) 2004-05-14 2004-05-14 Method and system for ranking objects based on intra-type and inter-type relationships
US10/846,835 2004-05-14

Publications (3)

Publication Number Publication Date
JP2005327293A JP2005327293A (ja) 2005-11-24
JP2005327293A5 JP2005327293A5 (ja) 2008-06-26
JP4965086B2 true JP4965086B2 (ja) 2012-07-04

Family

ID=34939836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005141125A Expired - Fee Related JP4965086B2 (ja) 2004-05-14 2005-05-13 タイプ内およびタイプ間の関係に基づいてオブジェクトを格付けする方法およびシステム

Country Status (10)

Country Link
US (1) US7346621B2 (ja)
EP (1) EP1596315A1 (ja)
JP (1) JP4965086B2 (ja)
KR (1) KR101130374B1 (ja)
CN (1) CN1716259B (ja)
AU (1) AU2005202017A1 (ja)
BR (1) BRPI0503929A (ja)
CA (1) CA2507337C (ja)
MX (1) MXPA05005208A (ja)
RU (1) RU2387005C2 (ja)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005022403A1 (en) * 2003-08-27 2005-03-10 Sox Limited Method of building persistent polyhierarchical classifications based on polyhierarchies of classification criteria
US7346621B2 (en) 2004-05-14 2008-03-18 Microsoft Corporation Method and system for ranking objects based on intra-type and inter-type relationships
US7437382B2 (en) * 2004-05-14 2008-10-14 Microsoft Corporation Method and system for ranking messages of discussion threads
US9286387B1 (en) 2005-01-14 2016-03-15 Wal-Mart Stores, Inc. Double iterative flavored rank
EP1691277B1 (en) * 2005-02-11 2009-06-24 Sap Ag Context menu providing dependency relationships for objects of different type
JP4421502B2 (ja) * 2005-03-25 2010-02-24 株式会社東芝 文書管理システム
US7921106B2 (en) * 2006-08-03 2011-04-05 Microsoft Corporation Group-by attribute value in search results
US8195734B1 (en) 2006-11-27 2012-06-05 The Research Foundation Of State University Of New York Combining multiple clusterings by soft correspondence
US7849104B2 (en) * 2007-03-01 2010-12-07 Microsoft Corporation Searching heterogeneous interrelated entities
US7552131B2 (en) 2007-03-05 2009-06-23 International Business Machines Corporation Autonomic retention classes
WO2008126184A1 (ja) * 2007-03-16 2008-10-23 Fujitsu Limited 文書重要度算出プログラム
US7636715B2 (en) * 2007-03-23 2009-12-22 Microsoft Corporation Method for fast large scale data mining using logistic regression
US8122016B1 (en) 2007-04-24 2012-02-21 Wal-Mart Stores, Inc. Determining concepts associated with a query
US7953724B2 (en) * 2007-05-02 2011-05-31 Thomson Reuters (Scientific) Inc. Method and system for disambiguating informational objects
US9183290B2 (en) * 2007-05-02 2015-11-10 Thomas Reuters Global Resources Method and system for disambiguating informational objects
US20090083048A1 (en) * 2007-09-21 2009-03-26 Mandelbaum Steven J System and method for providing an application service
US8862608B2 (en) * 2007-11-13 2014-10-14 Wal-Mart Stores, Inc. Information retrieval using category as a consideration
KR100975502B1 (ko) * 2008-01-30 2010-08-11 엔에이치엔(주) 블로그 포스트의 랭킹 판단 방법 및 시스템
WO2009107416A1 (ja) * 2008-02-27 2009-09-03 日本電気株式会社 グラフ構造変化検出装置、グラフ構造変化検出方法およびプログラム
WO2009107412A1 (ja) * 2008-02-27 2009-09-03 日本電気株式会社 グラフ構造推定装置、グラフ構造推定方法およびプログラム
US8140550B2 (en) * 2008-08-20 2012-03-20 Satyam Computer Services Limited Of Mayfair Centre System and method for bounded analysis of multimedia using multiple correlations
US8650195B2 (en) * 2010-03-26 2014-02-11 Palle M Pedersen Region based information retrieval system
US8490056B2 (en) * 2010-04-28 2013-07-16 International Business Machines Corporation Automatic identification of subroutines from test scripts
US8533319B2 (en) * 2010-06-02 2013-09-10 Lockheed Martin Corporation Methods and systems for prioritizing network assets
US8538949B2 (en) 2011-06-17 2013-09-17 Microsoft Corporation Interactive web crawler
CN103425711B (zh) * 2012-05-25 2017-08-25 株式会社理光 基于多对象实例的对象值对齐方法
JP5928248B2 (ja) * 2012-08-27 2016-06-01 富士通株式会社 評価方法、情報処理装置およびプログラム
US9501503B2 (en) * 2013-05-09 2016-11-22 Microsoft Technology Licensing, Llc Inferring entity attribute values
KR101761999B1 (ko) 2014-06-12 2017-07-28 경희대학교 산학협력단 관계 유형을 고려한 코칭 방법 및 시스템
CN112114941A (zh) * 2019-06-19 2020-12-22 中国移动通信集团浙江有限公司 数据作业的评价方法、装置及电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2799023B1 (fr) * 1999-09-24 2003-04-18 France Telecom Procede de classification thematique de documents, module de classification thematique et moteur de recherche incorporant un tel module
US6601075B1 (en) * 2000-07-27 2003-07-29 International Business Machines Corporation System and method of ranking and retrieving documents based on authority scores of schemas and documents
US7346621B2 (en) 2004-05-14 2008-03-18 Microsoft Corporation Method and system for ranking objects based on intra-type and inter-type relationships

Also Published As

Publication number Publication date
CN1716259A (zh) 2006-01-04
EP1596315A1 (en) 2005-11-16
RU2005114665A (ru) 2006-11-20
JP2005327293A (ja) 2005-11-24
CN1716259B (zh) 2012-05-23
KR20060047856A (ko) 2006-05-18
RU2387005C2 (ru) 2010-04-20
KR101130374B1 (ko) 2012-04-12
BRPI0503929A (pt) 2007-01-23
AU2005202017A1 (en) 2005-12-01
MXPA05005208A (es) 2005-12-06
CA2507337C (en) 2013-04-23
US20050256832A1 (en) 2005-11-17
US7346621B2 (en) 2008-03-18
CA2507337A1 (en) 2005-11-14

Similar Documents

Publication Publication Date Title
JP4965086B2 (ja) タイプ内およびタイプ間の関係に基づいてオブジェクトを格付けする方法およびシステム
JP2005327293A5 (ja)
JP5147162B2 (ja) オブジェクトの類似性を異種の関係に基づいて判定するための方法およびシステム
US7577650B2 (en) Method and system for ranking objects of different object types
US7437382B2 (en) Method and system for ranking messages of discussion threads
US7634476B2 (en) Ranking of web sites by aggregating web page ranks
KR100963623B1 (ko) 시맨틱 웹 자원의 랭킹처리방법
JP4950444B2 (ja) クリックディスタンスを用いて検索結果をランク付けするシステムおよび方法
US20070005588A1 (en) Determining relevance using queries as surrogate content
US9953049B1 (en) Producing a ranking for pages using distances in a web-link graph
JP2009528627A (ja) 伝搬されるドキュメントの関連性を用いたランキング機能のトレーニング
Du et al. Semantic ranking of web pages based on formal concept analysis
KR20080106192A (ko) 라벨링된 다튜먼트로부터 언라벨링된 다큐먼트로의 관련성 전파 시스템, 및 컴퓨터 판독가능 매체
US20100268701A1 (en) Navigational ranking for focused crawling
US20110161330A1 (en) Calculating global importance of documents based on global hitting times
US7668822B2 (en) Method for assigning quality scores to documents in a linked database
US20110106793A1 (en) System for User Driven Ranking of Web Pages
Pavani et al. A novel web crawling method for vertical search engines
Bidoni et al. A generalization of the pagerank algorithm
US20060004809A1 (en) Method and system for calculating document importance using document classifications
Xiao et al. Clustering web-search results using transduction-based relevance model
Kumar et al. Nascent Weighted Page Rank Algorithm
Jain et al. Web Structure Mining using Link Analysis Algorithms
Raeesi et al. Trust Evaluation Using an Improved Context Similarity Measurement
Rawat et al. Study of Web Page Rank algorithms

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080513

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080513

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110225

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110525

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120323

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120329

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150406

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350