JP2005327293A - 型内および型間の関係に基づいてオブジェクトを格付けする方法およびシステム - Google Patents

型内および型間の関係に基づいてオブジェクトを格付けする方法およびシステム Download PDF

Info

Publication number
JP2005327293A
JP2005327293A JP2005141125A JP2005141125A JP2005327293A JP 2005327293 A JP2005327293 A JP 2005327293A JP 2005141125 A JP2005141125 A JP 2005141125A JP 2005141125 A JP2005141125 A JP 2005141125A JP 2005327293 A JP2005327293 A JP 2005327293A
Authority
JP
Japan
Prior art keywords
type
relationship
attribute value
function
objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005141125A
Other languages
English (en)
Other versions
JP2005327293A5 (ja
JP4965086B2 (ja
Inventor
Benyu Zhang
チャン ベンユー
Hua-Jun Zeng
チェン ホア−ジュン
Wei-Ying Ma
マ ウェイ−イン
Wensi Xi
シー ウェンシー
Chen Tsuen
チェン ツェン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2005327293A publication Critical patent/JP2005327293A/ja
Publication of JP2005327293A5 publication Critical patent/JP2005327293A5/ja
Application granted granted Critical
Publication of JP4965086B2 publication Critical patent/JP4965086B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/954Relational
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/955Object-oriented
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/962Entity-attribute-value
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface

Abstract

【課題】 異なるオブジェクト型のオブジェクトの関係に基づいてオブジェクトに格付けを行う方法およびシステムを提供すること。
【解決手段】 格付けシステムにより、オブジェクトの各型の属性ごとに式を定義する。式は、属性値を定義し、属性と、同一の型のオブジェクトおよび異なる型のオブジェクトに関連付けられる属性との間の関係に基づく。格付けシステムにより、属性値が解に収束するまで、式を使用してオブジェクトの属性値を繰り返し計算する。そして、格付けシステムにより、属性値に基づいてオブジェクトに格付けを行う。
【選択図】 図1

Description

本発明は、一般には、オブジェクトの格付けに関し、より詳細には、オブジェクト関係に基づく格付けに関する。
GoogleおよびOvertureなど多くの検索エンジンサービスは、インターネットを介してアクセス可能な情報の検索を提供する。これらの検索エンジンサービスによりユーザは、Webページなど、ユーザにとって興味深いと思われる表示ページを検索することができる。検索語を含む検索要求(「クエリ」とも呼ばれる)をユーザが送信した後、検索エンジンサービスは、これらの検索語に関連していると思われるWebページを識別する。関連するWebページを迅速に識別するために、検索エンジンサービスは、Webページへのキーワードのマッピングを保持することができる。検索エンジンサービスは、Web(すなわちワールドワイドウェブ)を「クローリング」することによりこのマッピングを生成して、各Webページのキーワードを抽出することができる。Webをクロールするために、検索エンジンサービスは、ルートのWebページのリストを使用し、これらのルートのWebページを通じてアクセス可能なすべてのWebページを識別することができる。特定のWebページのキーワードは、見出し語、Webページのメタデータで供給された語、ハイライト表示された語などを識別するような、様々な周知の情報検索技術を使用して抽出することができる。検索エンジンサービスにより、各々の合致の近さ、Webページの人気(例えばGoogleのPageRank)などに基づいて各Webページが検索要求にどの程度関連しているかを示す適合性の評点(score)を計算することができる。次に、検索エンジンサービスにより、これらのWebページへのリンクを適合性に基づいた順序でユーザに表示する。検索エンジンにより、さらに一般的に、あらゆる文書の集まりで情報の検索を提供することができる。例えば、文書の集まりには、すべての米国特許、すべての連邦の法廷意見、企業のすべての保管文書などを含めることもできる。
Webページを格付けするための2つの周知の技術は、PageRankおよびHITS(「Hyperlinked−Induced Topic Search」)である。PageRankは、Webページが重要なWebページへのリンク(つまり「外向きのリンク」)を持つという原則に基づく。したがって、Webページの重要度は、そのWebページにリンク(つまり「内向きのリンク」)する他のWebページの数および重要度に基づく。簡単な形式では、Webページの間のリンクは行列Aによって表すことができ、ここでAijはWebページiからWebページjへの外向きのリンクの数を表す。Webページjの重要度の評点wは、以下の式で表すことができる。
=Σij
この式は、以下の式に基づく反復計算によって解くことができる。
w=w
ただし、wはWebページの重要度の評点のベクトルであり、Aの優固有ベクトル(principal eigenvector)である。
HITS技術はさらに、他の重要なWebページへのリンクを数多く持つWebページはそれ自体が重要であるという原則に基づく。したがって、HITSは、Webページの「重要度」を、「ハブ」および「権威」という2つの関連する属性に分割する。「ハブ」は、WebページがリンクするWebページの「権威」の評点によって測定され、「権威」は、WebページにリンクするWebページの「ハブ」の評点によって測定される。Webページの重要度をクエリからは独立して計算するPageRankとは対照的に、HITSでは、内向きおよび外向きのリンクをたどることによって結果のWebページおよび結果のWebページに関連するWebページに基づいて重要度を計算する。HITSは、検索エンジンサービスにクエリを送信し、結果のWebページをWebページの初期セットとして使用する。HITSは、内向きのリンクの宛先であるWebページおよび結果のWebページの外向きのリンクのソースであるWebページをセットに追加する。次にHITSは、反復アルゴリズムを使用して各Webページの権威およびハブの評点を計算する。権威およびハブの評点は、以下の式で表すことができる。
Figure 2005327293
ただし、a(p)はWebページpの権威の評点を表し、h(p)はWebページpのハブの評点を表す。HITSでは、隣接行列Aを使用してリンクを表す。隣接行列は、以下の式で表すことができる。
Figure 2005327293
ベクトルaおよびhはそれぞれ、セット内のすべてのWebページの権威およびハブの評点に対応し、以下の式で表すことができる。
a=Ahおよびh=Aa
したがって、aおよびhは、行列AAおよびAAの固有ベクトルである。HITSはまた、アクセス数によって測定されるWebページの人気を計算に入れるように変更することもできる。Webログの分析に基づいて、隣接行列のbijは、ユーザがWebページiからWebページjに移動するときに増分することができる。
上述のWebページ格付け技術では、Webページの格付けを主としてWebページ自体の属性に基づく。Webページ自体の属性は、一方のWebページから別のWebページへのリンクを含み、一方のWebページから別のWebページへ伝わる。格付け技術では、Webページに直接関連がない属性を計算に入れることができない。例えば、Webページの重要度は、Webページにアクセスするユーザの専門知識が計算に入れられる場合、より正確に決定することができる。Webページに直接関連がない属性に基づいてWebページの重要度を計算するための技術を有することが望ましい。より一般的には、一方の型のオブジェクト(例えば、Webページ)の評点を、別の型のオブジェクト(例えば、ユーザ)との関係に基づいて生成することが望ましい。
異なるオブジェクト型のオブジェクトとの関係に基づいてオブジェクトを格付けするための方法およびシステムを提供する。格付けシステムにより、オブジェクトの各型の属性ごとに式を定義する。式は、属性値を定義し、属性と、同じ型のオブジェクトおよび異なる型のオブジェクトに関連付けられる属性との間の関係に基づく。属性値は、一方の属性が別の属性に関して定義され、逆の場合も同じであるように相互依存することができるので、式は属性の再帰的定義を表す。格付けシステムにより、属性値が解に収束するまで式を使用して、オブジェクトの属性値を繰り返し計算する。次に、格付けシステムにより、属性値に基づいてオブジェクトの格付けを行う。
同じまたは別のデータオブジェクト型のデータオブジェクトとの関係に基づいてデータオブジェクト型のデータオブジェクトを格付けするための方法およびシステムを提供する。一実施形態において、格付けシステムにより、様々なデータオブジェクト型のデータオブジェクトを識別する。例えば、一方のデータオブジェクト型がWebページであり、別のデータオブジェクト型がクエリであり、および別のデータオブジェクト型がユーザである場合がある。各データオブジェクト型は、様々な型固有の属性を有することができる。例えば、Webページが権威属性を有し、およびユーザが専門知識属性を有する場合がある。Webページの権威属性は、Webページの内向きのリンクの数に基づくことができる。ユーザの専門知識属性は、ユーザが高い権威属性値を持つWebページにアクセスする場合に増加される。格付けシステムにより、データオブジェクトの属性値を計算し、およびデータオブジェクトの属性値に基づいてデータオブジェクトを格付けすることができる。
格付けシステムにより、各オブジェクトが単一の属性を含むように、オブジェクトの「型」を定義する。例えば、格付けシステムにより、Webページの権威属性に対応する型、およびWebページのハブ属性に対応する別の型を定義することができる。したがって、2つの型は、同じ基礎をなすデータオブジェクト(例えばWebページ)を表すことができる。格付けシステムにより、型内の関係と呼ばれる同じ型のオブジェクトの間の様々な関係、および型間の関係と呼ばれる異なる型のオブジェクトの間の様々な関係を決定する。例えば、クエリが送信される場合、格付けシステムにより、結果を権威型のオブジェクトとして使用し、およびWebログを使用して、これらのWebページにアクセスしたユーザを専門知識型のオブジェクトとして識別することができる。権威型の型内の関係のオブジェクトは、Webページの内向きのリンクと外向きのリンクとの関係を含むことができる。例えば、Webページが別のWebページへのリンクを有する場合、Webページはその他のWebページへの外向きのリンクの関係を有し、およびその他のWebページはWebページへの内向きのリンクの関係を有する。権威型と専門知識型とのオブジェクトの間の型間の関係は、Webページへのユーザアクセスに基づく。例えば、ユーザがWebページにアクセスする場合、Webページおよびユーザはアクセスの関係を有する。格付けシステムにより、他の型のオブジェクトの属性値と組み合わされた型内の関係および型間の関係を使用して、所定の型のオブジェクトに対する属性の値を導き出す。例えば、格付けシステムにより、内向きと外向きとのリンクの関係およびユーザアクセスの関係を使用して、Webページの権威およびハブ属性ならびにユーザの専門知識属性を導き出すことができる。
一実施形態において、格付けシステムにより、一次方程式など一連の式を使用して関係および属性を表す。格付けシステムにより、別の型の属性値に基づいて再帰的に定義される一次方程式を使用して、各型の属性値を表す。例えば、権威属性の一次方程式が専門知識属性の属性値に基づいて定義されることも、またその逆の場合もある。一次方程式は再帰的に定義することができるので、格付けシステムにより、属性値が解に収束するまで、各一次方程式の属性値を繰り返し計算することによって一次方程式を解く。一次方程式を解いた後、格付けシステムにより、属性値に基づいてデータオブジェクトを格付けすることができる。例えば、格付けシステムにより、Webページの権威属性値に基づいてWebページを格付けすることができる。
格付けシステムにより、オブジェクトの型内と型間との関係に基づいて、オブジェクトの属性値を表す。属性の値は、以下の数式によって表すことができる。
=F+Σj≠iji
ただし、Fはオブジェクトiに関連付けられる属性値を表し、Rはオブジェクトiの型のオブジェクトの間の型内関係を表し、Rjiはオブジェクトiの型と他のオブジェクトjの型とのオブジェクトの間の型間の関係を表す。x={x、x、・・・x}およびy={y、y、・・・y}の2つのオブジェクトの型がある場合、これらの型内の関係はRおよびRとして表すことができ、型間の関係はRXYおよびRYXによって表すことができる。格付けシステムでは、隣接行列を使用して関係情報を表す。LおよびLは、それぞれ集合XおよびYの型内の関係の隣接行列を表す。LXYおよびLYXは、それぞれ、XのオブジェクトからYのオブジェクトへの型間の関係の隣接行列およびYのオブジェクトからXのオブジェクトへの型間の関係の隣接行列を表す。格付けシステムでは、以下のように隣接行列を表す。
Figure 2005327293
ただし、LXY(i,j)は、集合Xのオブジェクトiから集合Yのオブジェクトjへの関係(「リンク」とも呼ばれる)が存在するかどうかを示す。属性値の一次方程式は、以下の式のように表すことができる。
Figure 2005327293
ただし、wは、Xのオブジェクトの属性ベクトルであり、wはYのオブジェクトの属性ベクトルである。式1は、以下の形式に一般化することができる。
Figure 2005327293
ただし、Mは属性ベクトルの行列を表す。
オブジェクトの間の相互に補強し合う関係がオブジェクトに過度の属性値をもたらすことがあるので、格付けシステムにより、オブジェクトが1つの隣接行列内のn個の他のオブジェクトに関連する場合、各関連するオブジェクトはその1/n番目の属性値を受け取るような方法で、バイナリの隣接行列を正規化することができる。格付けシステムにより、PageRankのランダムサーファーモデルを導入して、ランダムな関係をシミュレートし、したがって、以下に説明する計算時のシンクノードを回避することができる。さらに、異なる型からの属性が各々他の属性に対して異なる重要度を有する可能性があるので、格付けシステムにより、型の各々の組み合わせに重み付けを使用することができる。したがって、格付けシステムにより、正規化、ランダムサーファーモデル、および重み付けを計算に入れて、以下の式によって属性値を表すことができる。
Figure 2005327293
ただし、Uは一様な推移確率の推移行列であり(すべてのi、jについてUij=1/n、ただし、nはデータ空間Nのオブジェクトの合計数)、LおよびLNMは正規化された隣接行列であり、δおよびεは行列LおよびLNM内のランダムな関係をシミュレートするために使用される平滑化因数であり、αおよびβNMは関係の重み付けを表す。格付けシステムにより、収束するまで式3を繰り返し計算する。式3は、以下の式で表される統合された正方行列Aによって表すことができる。
Figure 2005327293
行列Aは、対角線上に
Figure 2005327293
、統合された行列の他の部分に
Figure 2005327293
を有する。格付けシステムにより、行列Aを使用して、異なるデータ空間にあるすべてのデータオブジェクトの属性ベクトルである、ベクトルwを変換するために反復アプローチを使用する(例えば、w=Aw)。反復が収束する場合、ベクトルwは行列Aの優固有ベクトルである。
MおよびNが異質のデータ空間である場合、格付けシステムでは、ランダムな関係を使用して無関係を表す。MのオブジェクトがNのオブジェクトにリンクの関係を持たない場合、部分行列
Figure 2005327293
はゼロであり、「シンクノード」を表す。計算では、シンクノードにすべての属性値を割り当てることがある。これを防ぐために、格付けシステムにより、部分行列
Figure 2005327293
の対応する行のすべての要素を1/nに設定する。ただし、nはデータ空間Nのオブジェクトの合計数である。代替として、格付けシステムにより、望ましくない型内および型間の関係に対して、対応する重み付けを0に設定することができる。しかし、βMNが0よりも大きい場合、反復計算が収束するのであればβNMは0よりも大きい必要がある。したがって、
Figure 2005327293
の関係が望ましくない場合、格付けシステムにより、βNMを非常に小さい正の重みに設定して
Figure 2005327293
の影響を低減する。
すべての隣接行列を使用して統合された行列を構築することにより、格付けシステムでは、異なるオブジェクトの型を含む、統合されたデータ空間を構築する。したがって、以前の型間の関係は、統合された空間の型間の関係と見なすことができ、格付けシステムにより、効率的に単一のデータ空間のリンク解析を行う。
図1は、一実施形態における格付けシステムのコンポーネントを例示するフロー図である。格付けシステム110は、通信リンク102を介して様々なWebサイト101に接続されている。格付けシステムには、オブジェクト収集コンポーネント112、関係確立コンポーネント113、評点計算コンポーネント114、およびオブジェクト順序付けコンポーネント115を呼び出してオブジェクトを格付けするオブジェクト格付けコンポーネント111を含む。オブジェクト格付けコンポーネントは、Webページのセットを受け取り、型内および型間の関係に基づいてWebページを格付けすることができる。オブジェクト収集コンポーネントは、様々な型のオブジェクトに関連する関係情報を取り出す。例えば、オブジェクト収集コンポーネントは、WebサイトのWebログにアクセスして、どのユーザがどのWebページにアクセスするのかを識別することができる。関係確立コンポーネントは、型内および型間の関係の行列を作成する。例えば、関係の行列は、ユーザがアクセスするWebページにユーザをマッピングすることができる。評点計算コンポーネントは、属性値が解に収束するまで、式3を使用して属性値を再帰的に計算する。オブジェクト順序付けコンポーネントは、属性値に基づいてデータオブジェクトをソートする。例えば、オブジェクト順序付けコンポーネントは、Webページの権威属性の値を使用して、Webページをソートすることができる。
格付けシステムが実装されるコンピューティング装置には、中央処理装置、メモリ、入力装置(例えば、キーボードおよびポインティングデバイスなど)、出力装置(例えば、ディスプレイ装置など)、および記憶装置(例えば、ディスクドライブなど)を含めることができる。メモリおよび記憶装置は、格付けシステムを実装する命令を含めることができるコンピュータ読取可能な媒体である。さらに、データ構造およびメッセージ構造を、通信リンク上の信号などのデータ伝送媒体を介して格納または送信することができる。インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、またはポイントツーポイントのダイヤルアップ接続など、様々な通信リンクを使用することができる。
格付けシステムを、様々なオペレーティング環境において実装することができる。使用に最適な様々な周知のコンピューティングシステム、環境、および構成には、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドまたはラップトップ装置、マルチプロセッサシステム、マイクロプロセッサに基づくシステム、プログラム可能な家庭用電化製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記のシステムまたは装置のいずれかを含む分散コンピューティング環境などが含まれる。
格付けシステムにより、1つまたは複数のコンピュータまたは他の装置によって実行されるプログラムモジュールなど、コンピュータ実行可能命令の一般的なコンテキストにおいて説明することができる。一般に、プログラムモジュールには、特定のタスクを実行するかまたは特定の抽象データ型を実装するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などが含まれる。通常、プログラムモジュールの機能を、様々な実施形態において望ましいように組み合わせまたは分散することができる。
図2は、一実施形態におけるオブジェクト格付けコンポーネントの処理を例示するフロー図である。コンポーネントは、オブジェクト情報を収集し、オブジェクトの間の関係を確立し、オブジェクトの属性値を計算し、属性に基づいてオブジェクトを順序付ける。ブロック201において、コンポーネントは、様々なオブジェクトに関連する情報を収集する。ブロック202において、コンポーネントは、関係確立コンポーネントを呼び出して、隣接行列を生成する。関係確立コンポーネントはまた、αおよびβの重みを取り出して調整することもできる。ブロック203において、コンポーネントは、評点計算コンポーネントを呼び出して、属性値が解に収束するまで属性値を繰り返し計算する。ブロック204において、コンポーネントは、属性の値に基づいてデータオブジェクトを順序付ける。例えば、コンポーネントは、権威属性に基づいてWebページを順序付けすることができる。
図3は、一実施形態における関係確立コンポーネントの処理を例示するフロー図である。ブロック301から303において、コンポーネントは、各型に対する隣接行列を確立するループを行う。ブロック301において、コンポーネントは次の型を選択する。判断ブロック302において、すべての型がすでに選択されている場合、コンポーネントは戻り、別の場合、コンポーネントはブロック303において続行する。ブロック303において、コンポーネントは、選択された型のオブジェクトとすべての型のオブジェクトとの間の関係を確立する。例えば、コンポーネントは、権威型とハブ型との間の関係、および権威型と専門知識型との間の関係を確立する。次に、コンポーネントはブロック301へのループを行い、次の型を選択する。
図4は、一実施形態における評点計算コンポーネントの処理を例示するフロー図である。コンポーネントは、属性値が収束するまで式を繰り返し計算する。ブロック401において、コンポーネントは、隣接行列によって表されたオブジェクトの関係を取り出す。ブロック402において、コンポーネントは、型内および型間の関係に対する重みαおよびβを取り出す。ブロック403において、コンポーネントは、各型のベクトルwを初期化して、その型の各オブジェクトに対し等しい属性値を持つようにする。コンポーネントは、各値を1/mに設定することができる。ただし、mは型のオブジェクトの数である。例えば、10のユーザがある場合、コンポーネントは専門知識型の初期の属性値を1/10に設定する。コンポーネントはまた、判断ブロック405の検査を最初に通過するように、各型の差異変数を大きい値に初期化する。コンポーネントは、計算が解に収束しているかどうかを決定するために、各反復の最後において各差異変数に新しい値を計算する。ブロック404から409において、コンポーネントは、計算が解に収束するまで式3の計算を実行する。ブロック404において、コンポーネントは次の反復を開始する。判断ブロック405において、前回の反復中に計算された差異の合計が差異のしきい値よりも小さい場合、計算は解に収束しており、コンポーネントは戻り、別の場合、コンポーネントはブロック406において続行する。ブロック406において、コンポーネントは次の型を選択する。判断ブロック407において、すべての型がすでに選択されている場合、コンポーネントはブロック404にループを行い、次の反復を開始し、別の場合、コンポーネントはブロック408において続行する。ブロック408において、コンポーネントは、以前の反復において計算された値に基づいて、選択された型の値を計算する。ブロック409において、コンポーネントは、この反復の値と選択された型の以前の反復の値との間の差異を計算する。次に、コンポーネントはブロック406にループを行い、次の型を選択する。
本明細書において格付けシステムの特定の実施形態について例示のために説明しているが、本発明の精神および範囲を逸脱することなく、様々な変更を行うことができることを、当事業者であれば理解するであろう。例えば、当事業者であれば、属性値を表すために非線形方程式を使用することができることを理解するであろう。また、格付けシステムは、相互に何らかの関係を有するすべての型のオブジェクトに使用することができる。例えば、格付けシステムにより、学生または志願者と教授との関係を使用する「重要度」に基づいて大学を格付けするために使用することもできる。ここで、大学、学生、および教授は異なる型のオブジェクトを表す。したがって、本発明は、添付の請求の範囲による場合を除き、限定されることはない。
一実施形態における格付けシステムのコンポーネントを例示するフロー図である。 一実施形態におけるオブジェクト格付けコンポーネントの処理を例示するフロー図である。 一実施形態における関係確立コンポーネントの処理を例示するフロー図である。 一実施形態における評点計算コンポーネントの処理を例示するフロー図である。

Claims (35)

  1. オブジェクトの属性の属性値を決定するためのコンピュータシステムにおける方法であって、
    各型が型に固有の属性を有する型を提供するステップと、
    各々が所定の型に関連付けられるオブジェクトを識別するステップと、
    前記型の各々に対して、
    該型に関連付けられるオブジェクト間の該型についての関係を識別し、
    該型に関連付けられるオブジェクトと他の型に関連付けられるオブジェクトとの間の該型についての関係を識別するステップと、
    前記型の各々に対して、前記識別された関係に基づいて前記オブジェクトの前記属性の評点を計算するステップと
    を備えたことを特徴とする方法。
  2. 前記型は、権威型、ハブ型、および専門知識型を含むことを特徴とする請求項1に記載の方法。
  3. 前記権威型のオブジェクトの前記関係は、Webページが別のWebページへのリンクを有するかどうかに基づくことを特徴とする請求項2に記載の方法。
  4. 前記権威型のオブジェクトと前記専門知識型のオブジェクトとの間の前記関係は、ユーザによるWebページへのアクセスに基づくことを特徴とする請求項3に記載の方法。
  5. 前記ハブ型のオブジェクトの前記関係は、Webページが別のWebページへのリンクを有するかどうかに基づくことを特徴とする請求項2に記載の方法。
  6. 前記ハブ型のオブジェクトと前記専門知識型のオブジェクトとの間の前記関係は、ユーザによるWebページへのアクセスに基づくことを特徴とする請求項5に記載の方法。
  7. 同じ型のオブジェクト間の前記関係は、型内の関係であることを特徴とする請求項1に記載の方法。
  8. 異なる型のオブジェクト間の前記関係は、型間の関係であることを特徴とする請求項1に記載の方法。
  9. 型のオブジェクトを該属性値に基づいて格付けするステップをさらに備えたことを特徴とする請求項1に記載の方法。
  10. 前記型の前記属性値を定義する各型の式を提供するステップをさらに備えたことを特徴とする請求項1に記載の方法。
  11. 前記計算するステップは、前記式を繰り返し解くステップを含むことを特徴とする請求項10に記載の方法。
  12. 前記式は、他の式の属性値に基づいて再帰的に定義されることを特徴とする請求項10に記載の方法。
  13. 各型の関数が該型の前記属性値を計算するよう定義するステップをさらに備えたことを特徴とする請求項1に記載の方法。
  14. 前記関数は、
    =F+Σj≠iji
    であり、ただし、Fはオブジェクトiに関連付けられた前記属性値を表し、Rは前記オブジェクトiの前記型のオブジェクト間の型内の関係を表し、およびRjiは前記オブジェクトiの前記型のオブジェクトと他のオブジェクトjの型のオブジェクトとの間の型間の関係を表すことを特徴とする請求項13に記載の方法。
  15. 前記関数は、
    Figure 2005327293
    であることを特徴とする請求項13に記載の方法。
  16. オブジェクトの属性値を決定するコンピュータシステムにおける方法であって、
    型のオブジェクトに対する型に固有の属性の属性値を、該型のオブジェクトと、別の型に固有の属性を有する別の型のオブジェクトとの間の関係に基づいて計算する関数を提供するステップと、
    該型の前記オブジェクトともう一方の型のオブジェクトとの間の関係を指定するデータを受け取るステップと、
    前記提供された関数を計算して、該型の前記オブジェクトの前記属性値を決定するステップと
    を備えたことを特徴とする方法。
  17. もう一方の型のオブジェクトの前記型に固有の属性の前記属性値を計算する関数を提供するステップをさらに備えたことを特徴とする請求項16に記載の方法。
  18. 前記関数は、再帰的に定義されることを特徴とする請求項17に記載の方法。
  19. 前記計算するステップは、前記属性値が解に収束するまで各関数を繰り返し計算するステップを含むことを特徴とする請求項18に記載の方法。
  20. 前記関数は、一次方程式を表すことを特徴とする請求項18に記載の方法。
  21. 前記提供された関数は、該型のオブジェクト間の関係に基づいて前記属性値を計算することを特徴とする請求項16に記載の方法。
  22. 前記関数は、
    =F+Σj≠iji
    として定義され、ただし、Fはオブジェクトiに関連付けられる前記属性値を表し、Rは前記オブジェクトiの前記型のオブジェクト間の型内の関係を表し、およびRjiは前記オブジェクトiの前記型のオブジェクトと他のオブジェクトjの型のオブジェクトとの間の型間の関係を表すことを特徴とする請求項21に記載の方法。
  23. オブジェクトの属性値を決定するコンピュータシステムを制御するための命令を含むコンピュータ読取可能な媒体であって、
    第1の型のオブジェクトに対する第1の型に固有の属性の属性値を、前記第1の型のオブジェクトと、第2の型に固有の属性を有する第2の型のオブジェクトとの間の関係に基づいて計算する第1の関数を提供するステップと、
    前記第2の型のオブジェクトに対する前記第2の型に固有の属性の属性値を計算するための第2の関数を提供するステップと、
    前記第1の型の前記オブジェクトと前記第2の型のオブジェクトとの間の関係を指定するデータを受け取るステップと、
    前記提供された関数の計算を行って、前記第1の型および前記第2の型の前記オブジェクトの前記属性値を決定するステップと
    を備えた方法によって、前記オブジェクトの属性値を決定することを特徴とするコンピュータ読取可能な媒体。
  24. 前記第2の関数は、前記第2の型のオブジェクト間の関係に基づいて前記属性値を計算することを特徴とする請求項23に記載のコンピュータ読取可能な媒体。
  25. 前記第1の関数は、前記第1の型のオブジェクト間の関係に基づいて前記属性値をさらに計算することを特徴とする請求項23に記載のコンピュータ読取可能な媒体。
  26. 前記第2の関数は、前記第1の型の前記オブジェクトの前記属性値に基づいて前記属性値を計算することを特徴とする請求項23に記載のコンピュータ読取可能な媒体。
  27. 前記関数は再帰的に定義されることを特徴とする請求項23に記載のコンピュータ読取可能な媒体。
  28. 前記計算するステップは、前記属性値が解に収束するまで各関数を繰り返し計算するステップを含むことを特徴とする請求項27に記載のコンピュータ読取可能な媒体。
  29. 前記関数は、一次方程式を表すことを特徴とする請求項23に記載のコンピュータ読取可能な媒体。
  30. 前記関数は、
    =F+Σj≠iji
    として定義され、ただし、Fはオブジェクトiに関連付けられる前記属性値を表し、Rは前記オブジェクトiの前記型のオブジェクト間の型内の関係を表し、およびRjiは前記オブジェクトiの前記型のオブジェクトと他のオブジェクトjの型のオブジェクトとの間の型間の関係を表すことを特徴とする請求項23に記載のコンピュータ読取可能な媒体。
  31. オブジェクトの属性値を決定するためのコンピュータシステムであって、
    第1の型のオブジェクトに対する第1の型に固有の属性の属性値を、前記第1の型のオブジェクトと、第2の型に固有の属性を有する第2の型のオブジェクトとの間の関係に基づいて計算する第1の関数を実装する第1のコンポーネントと、
    前記第2の型のオブジェクトに対する前記第2の型に固有の属性の属性値を計算するための第2の関数を実装し、第1および第2の関数が再帰的に定義される第2のコンポーネントと、
    前記第1の型の前記オブジェクトと前記第2の型のオブジェクトとの間の関係を指定するデータを含むデータストアと、
    前記第1および第2のコンポーネントを繰り返し呼び出すことによって、前記第1の型および前記第2の型の前記オブジェクトの前記属性値を決定するコンポーネントと
    を備えたことを特徴とするコンピュータシステム。
  32. 前記第2の関数は、前記第2の型のオブジェクト間の関係に基づいて前記属性値を計算することを特徴とする請求項31に記載のコンピュータシステム。
  33. 前記第1の関数は、前記第1の型のオブジェクト間の関係に基づいて前記属性値をさらに計算することを特徴とする請求項31に記載のコンピュータシステム。
  34. 前記第2の関数は、前記第1の型の前記オブジェクトの前記属性値に基づいて属性値を計算することを特徴とする請求項31に記載のコンピュータシステム。
  35. 前記第1および第2のコンポーネントは、前記属性値が解に収束するまで呼び出されることを特徴とする請求項31に記載のコンピュータシステム。
JP2005141125A 2004-05-14 2005-05-13 タイプ内およびタイプ間の関係に基づいてオブジェクトを格付けする方法およびシステム Expired - Fee Related JP4965086B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/846,835 2004-05-14
US10/846,835 US7346621B2 (en) 2004-05-14 2004-05-14 Method and system for ranking objects based on intra-type and inter-type relationships

Publications (3)

Publication Number Publication Date
JP2005327293A true JP2005327293A (ja) 2005-11-24
JP2005327293A5 JP2005327293A5 (ja) 2008-06-26
JP4965086B2 JP4965086B2 (ja) 2012-07-04

Family

ID=34939836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005141125A Expired - Fee Related JP4965086B2 (ja) 2004-05-14 2005-05-13 タイプ内およびタイプ間の関係に基づいてオブジェクトを格付けする方法およびシステム

Country Status (10)

Country Link
US (1) US7346621B2 (ja)
EP (1) EP1596315A1 (ja)
JP (1) JP4965086B2 (ja)
KR (1) KR101130374B1 (ja)
CN (1) CN1716259B (ja)
AU (1) AU2005202017A1 (ja)
BR (1) BRPI0503929A (ja)
CA (1) CA2507337C (ja)
MX (1) MXPA05005208A (ja)
RU (1) RU2387005C2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009107412A1 (ja) * 2008-02-27 2009-09-03 日本電気株式会社 グラフ構造推定装置、グラフ構造推定方法およびプログラム
WO2009107416A1 (ja) * 2008-02-27 2009-09-03 日本電気株式会社 グラフ構造変化検出装置、グラフ構造変化検出方法およびプログラム

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1658571A4 (en) * 2003-08-27 2009-04-08 Sox Ltd PROCESS FOR BUILDING PERSISTENT POLYHIERARCHIC CLASSIFICATIONS BASED ON POLYHIERARCHIA CLASSIFICATION CRITERIA
US7437382B2 (en) * 2004-05-14 2008-10-14 Microsoft Corporation Method and system for ranking messages of discussion threads
US7346621B2 (en) 2004-05-14 2008-03-18 Microsoft Corporation Method and system for ranking objects based on intra-type and inter-type relationships
US9286387B1 (en) * 2005-01-14 2016-03-15 Wal-Mart Stores, Inc. Double iterative flavored rank
ATE434787T1 (de) * 2005-02-11 2009-07-15 Sap Ag Kontext-menü, das abhängigkeits-beziehungen für gegenstände unterschiedlicher art bereitstellt
JP4421502B2 (ja) * 2005-03-25 2010-02-24 株式会社東芝 文書管理システム
US7921106B2 (en) * 2006-08-03 2011-04-05 Microsoft Corporation Group-by attribute value in search results
US8195734B1 (en) 2006-11-27 2012-06-05 The Research Foundation Of State University Of New York Combining multiple clusterings by soft correspondence
US7849104B2 (en) * 2007-03-01 2010-12-07 Microsoft Corporation Searching heterogeneous interrelated entities
US7552131B2 (en) * 2007-03-05 2009-06-23 International Business Machines Corporation Autonomic retention classes
JP4781466B2 (ja) * 2007-03-16 2011-09-28 富士通株式会社 文書重要度算出プログラム
US7636715B2 (en) * 2007-03-23 2009-12-22 Microsoft Corporation Method for fast large scale data mining using logistic regression
US8122016B1 (en) 2007-04-24 2012-02-21 Wal-Mart Stores, Inc. Determining concepts associated with a query
US7953724B2 (en) * 2007-05-02 2011-05-31 Thomson Reuters (Scientific) Inc. Method and system for disambiguating informational objects
US9183290B2 (en) * 2007-05-02 2015-11-10 Thomas Reuters Global Resources Method and system for disambiguating informational objects
US20090083048A1 (en) * 2007-09-21 2009-03-26 Mandelbaum Steven J System and method for providing an application service
US8862608B2 (en) * 2007-11-13 2014-10-14 Wal-Mart Stores, Inc. Information retrieval using category as a consideration
KR100975502B1 (ko) * 2008-01-30 2010-08-11 엔에이치엔(주) 블로그 포스트의 랭킹 판단 방법 및 시스템
US8140550B2 (en) * 2008-08-20 2012-03-20 Satyam Computer Services Limited Of Mayfair Centre System and method for bounded analysis of multimedia using multiple correlations
US8650195B2 (en) * 2010-03-26 2014-02-11 Palle M Pedersen Region based information retrieval system
US8490056B2 (en) * 2010-04-28 2013-07-16 International Business Machines Corporation Automatic identification of subroutines from test scripts
US8533319B2 (en) * 2010-06-02 2013-09-10 Lockheed Martin Corporation Methods and systems for prioritizing network assets
US8538949B2 (en) * 2011-06-17 2013-09-17 Microsoft Corporation Interactive web crawler
CN103425711B (zh) * 2012-05-25 2017-08-25 株式会社理光 基于多对象实例的对象值对齐方法
JP5928248B2 (ja) * 2012-08-27 2016-06-01 富士通株式会社 評価方法、情報処理装置およびプログラム
US9501503B2 (en) * 2013-05-09 2016-11-22 Microsoft Technology Licensing, Llc Inferring entity attribute values
KR101761999B1 (ko) 2014-06-12 2017-07-28 경희대학교 산학협력단 관계 유형을 고려한 코칭 방법 및 시스템
CN112114941A (zh) * 2019-06-19 2020-12-22 中国移动通信集团浙江有限公司 数据作业的评价方法、装置及电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2799023B1 (fr) * 1999-09-24 2003-04-18 France Telecom Procede de classification thematique de documents, module de classification thematique et moteur de recherche incorporant un tel module
US6601075B1 (en) * 2000-07-27 2003-07-29 International Business Machines Corporation System and method of ranking and retrieving documents based on authority scores of schemas and documents
US7346621B2 (en) 2004-05-14 2008-03-18 Microsoft Corporation Method and system for ranking objects based on intra-type and inter-type relationships

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009107412A1 (ja) * 2008-02-27 2009-09-03 日本電気株式会社 グラフ構造推定装置、グラフ構造推定方法およびプログラム
WO2009107416A1 (ja) * 2008-02-27 2009-09-03 日本電気株式会社 グラフ構造変化検出装置、グラフ構造変化検出方法およびプログラム

Also Published As

Publication number Publication date
KR20060047856A (ko) 2006-05-18
CN1716259B (zh) 2012-05-23
BRPI0503929A (pt) 2007-01-23
KR101130374B1 (ko) 2012-04-12
EP1596315A1 (en) 2005-11-16
US20050256832A1 (en) 2005-11-17
CA2507337C (en) 2013-04-23
RU2005114665A (ru) 2006-11-20
CN1716259A (zh) 2006-01-04
US7346621B2 (en) 2008-03-18
JP4965086B2 (ja) 2012-07-04
CA2507337A1 (en) 2005-11-14
RU2387005C2 (ru) 2010-04-20
AU2005202017A1 (en) 2005-12-01
MXPA05005208A (es) 2005-12-06

Similar Documents

Publication Publication Date Title
JP4965086B2 (ja) タイプ内およびタイプ間の関係に基づいてオブジェクトを格付けする方法およびシステム
JP2005327293A5 (ja)
JP5147162B2 (ja) オブジェクトの類似性を異種の関係に基づいて判定するための方法およびシステム
US7634476B2 (en) Ranking of web sites by aggregating web page ranks
Tomlin A new paradigm for ranking pages on the world wide web
US7577650B2 (en) Method and system for ranking objects of different object types
US8250114B2 (en) Method for detecting link spam in hyperlinked databases
US20070005588A1 (en) Determining relevance using queries as surrogate content
US9953049B1 (en) Producing a ranking for pages using distances in a web-link graph
Bar-Yossef et al. Local approximation of pagerank and reverse pagerank
US20060259480A1 (en) Method and system for adapting search results to personal information needs
US20060112392A1 (en) Method and system for ranking messages of discussion threads
US20100268701A1 (en) Navigational ranking for focused crawling
JP2006107432A (ja) クリックディスタンスを用いて検索結果をランク付けするシステムおよび方法
US20110295845A1 (en) Semi-Supervised Page Importance Ranking
KR20080106192A (ko) 라벨링된 다튜먼트로부터 언라벨링된 다큐먼트로의 관련성 전파 시스템, 및 컴퓨터 판독가능 매체
US20110161330A1 (en) Calculating global importance of documents based on global hitting times
US20070198504A1 (en) Calculating level-based importance of a web page
Bidoni et al. A generalization of the pagerank algorithm
Jaganathan et al. Weighted page rank algorithm based on in-out weight of webpages
Rodrigues et al. An Efficient Page Ranking Approach Based on Hybrid Model
Xiao et al. Clustering web-search results using transduction-based relevance model
Lempel et al. Rank-stability and rank-similarity of web link-based ranking algorithms
Kumar et al. Review of link structure based ranking algorithms and hanging pages
Kumar et al. Nascent Weighted Page Rank Algorithm

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080513

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080513

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110225

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110525

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120323

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120329

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150406

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350