JP2006107432A - クリックディスタンスを用いて検索結果をランク付けするシステムおよび方法 - Google Patents

クリックディスタンスを用いて検索結果をランク付けするシステムおよび方法 Download PDF

Info

Publication number
JP2006107432A
JP2006107432A JP2005175172A JP2005175172A JP2006107432A JP 2006107432 A JP2006107432 A JP 2006107432A JP 2005175172 A JP2005175172 A JP 2005175172A JP 2005175172 A JP2005175172 A JP 2005175172A JP 2006107432 A JP2006107432 A JP 2006107432A
Authority
JP
Japan
Prior art keywords
click distance
document
network
score
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005175172A
Other languages
English (en)
Other versions
JP4950444B2 (ja
Inventor
Dmitriy Meyerzon
マイヤーゾン ドミトリー
Hugo Zaragoza
サラゴサ ヒューゴー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2006107432A publication Critical patent/JP2006107432A/ja
Application granted granted Critical
Publication of JP4950444B2 publication Critical patent/JP4950444B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation

Abstract

【課題】 検索結果をクリックディスタンスという新しい機能に従ってランク付けする。
【解決手段】 ネットワーク上の検索クエリの検索結果をネットワーク上の各文書に接続した付加的なクリックディスタンス特性に従ってランク付けする。クリックディスタンスはあるページあるいはネットワーク上の最高権威あるいは根ページと指定されたネットワーク上のページからのクリック回数あるいはユーザナビゲーションの測定値である。結果の精度は、検索クエリが起こるサイトあるいはイントラネットが階層的に構成されているとき、クリックディスタンス項目の追加により向上する。
【選択図】 図2

Description

本発明は、検索結果をクリックディスタンスという新しい機能に従ってランク付けするシステムおよび方法に関する。
文書の検索において一般にユーザは検索エンジンにクエリ内容を入力する。検索エンジンはインデックス化した文書のデータベースに対してクエリ内容を評価し、クエリ内容に最も良く合致する文書のランク付けしたリストを返す。文書がクエリ内容にどれくらい良く合致するかという尺度を表すスコアは、検索エンジンがアルゴリズムを用いて生成する。一般に用いられているスコアアルゴリズムは、クエリ内容を検索項目に分解し、検索する文書本体において各項目の出現に関する統計的情報を使用する。文章はそれぞれのスコアに従ってランクによりリストアップされ、これにより検索結果リストの最上段に最もよく合致する検索結果が表示される。
検索結果の特性を活用するためにいくつかの検索エンジンで用いている別の評価方法として、結果のランクを選択したランク付け機能により修正するものがある。1つの従来技術のある例のランク付け機能は、1つのページが他のページにリンクしている場合、他のページに効果的に一票を投じると決める。あるページに投じられる票が多いほどそのページは重要性を増す。ランク付け機能はまた誰が票を投じたかを考慮する。そのページが重要であればあるほど票も重要である。これらの票は集められてネットワーク上のページの格付けの要素として使用される。
ランク付け機能はランク付けの質を向上するために用いられる。しかしランク付け機能の効果はネットワークのトポロジーに影響される。例えば前記の投票を用いたランク付け機能はイントラネット環境においては効果が減少する。イントラネットとはインターネットと同じプロトコルをいくつか使用するが、アクセスできるのは会社の従業員のようなユーザの部分集合である。イントラネットのページは構造化されていないか、あるいはインターネットのようにきちんと接続されておらず、したがってランク付け機能により生成する結果の関連性をインターネット環境ほど減少させることができない。
本発明の実施例は、検索結果をクリックディスタンスという新しい機能に従ってランク付けするシステムおよび方法に関する。クリックディスタンス機能はイントラネットの階層構造を利用する。通常イントラネットは根ノードと根から他のノードへ伸びる枝からなるツリー構造になっている。イントラネットの根ノードはしばしばそのホームページと呼ばれる。イントラネット環境の外部のサイトもまた階層構造に基づいていることがあり、これらのサイトに対するクリックディスタンスもまたそのサイトのページのランク付けに大いに適用することができる。
クリックディスタンスはクエリに独立な検索能力尺度で、サイトの特定のページに到達するために必要な「クリック」の回数である。ツリー構造においてクリック数は、根ノードからの経路を辿る際の、枝の数で表される。あるページに対するクリックディスタンスが判定されると、そのクリックディスタンスはそのページのスコアに組み込まれる。クリックディスタンスを組み込んだそのページのスコアは検索結果内のその他のページとの間のページランクを判定する。
本発明の1つのある側面では、ネットワークのリンクとページに接続する特性テーブルを作成するためにネットワークをまず「這い回る(crawled)」。「這い回る(crawling)」とはインデックスと呼ぶデータベースに自動的にいくつかの文書(あるいは類似の情報の個別単位)を収集することである。這い回りはある文書内の文書参照リンクに従ってネットワーク上の複数の文書について行い、それから見つかった各文書について処理を行う。文書の処理は文書内でキーワードか一般テキストかを識別し、インデックスを作成する。
典型的なインデックスは、語の欄とどの文書にこれらの語があるかを示す欄を有する引用リストである。ユーザが1個あるいは複数の検索項目を入力すると、得られた結果に本発明によるクリックディスタンス機能を含むランク付けアルゴリズムが適用される。クリックディスタンス機能はそのページのスコアについてプラスあるいはマイナスに作用し、ユーザに返される結果を改善する。
本発明の別の側面では、結果をさらに改善するためにURL(Uniform Resource Locator)の深さプロパティをランク付けアルゴリズムに付加する。URL深さプロパティはクリックディスタンス機能に対するチェックを行うためにURLのレベル数を測定し、それによってそのページのスコアを調整する。
本発明の一部であり本発明の典型的な実施例を示す図面を用いて、本発明についてさらに詳細に説明する。しかし本発明は多様な形で実施可能であり、ここに示す実施例に限定されると解釈してはならない。これらの実施例は本発明を完全に漏れなく公開するためのものであり、本発明の範囲をこの技術に詳しい人に完全に伝えることを目的としたものである。特に本発明は方法としても装置としても実施できる。したがって本発明は全部がハードウエアで実施することも、全部がソフトウエアの形で実施することも、またソフトウエアとハードウエアの組合せでも実施できる。以下の詳細な説明はしたがってどちらかに限定すると解釈してはならない。
(動作環境の説明)
図1にコンピューティングデバイス100のようなコンピューティングデバイスを含む、本発明の実施のための典型的なシステムを示す。コンピューティングデバイス100はクライアント、サーバ、可搬装置あるいはどのような形のコンピューティングデバイスで構成されていてもよい。もっとも基本的な構成では、コンピューティングデバイス100は通常少なくとも1個の処理ユニット102とシステムメモリユニット104とを含む。コンピューティングデバイスのそれぞれの構成とタイプによってシステムメモリ104は揮発性(例えばRAM)、不揮発性(例えばROM、フラッシュメモリ)、あるいはこの2つの組合せでもよい。システムメモリ104は一般にオペレーティングシステム105、1個あるいは複数のアプリケーション106を含み、またプログラムデータ107を含んでいてもよい。ある実施例においては、アプリケーション106が本発明の機能性を実現するための検索ランク付けアプリケーション120を含む。図1にこの基本構成を点線108の中に部品として図示している。
コンピューティングデバイス100はその他の特性あるいは機能を持っていてもよい。例えばコンピューティングデバイス100は磁気ディスク、光ディスク、あるいはテープのような追加のデータ格納装置(取り外し可能あるいは不可能な)を有していてもよい。図1ではこのような付加的な格納装置は取り外し可能な格納装置109,取り外し不可能な格納装置110として図示している。コンピュータの格納媒体にはコンピュータ読取り可能命令、データ構造、プログラムモジュール、その他のデータのような情報を格納するために、いろいろな方法あるいは技術で実現された揮発性および不揮発性、取り外し可能および取り外し不可能の媒体がある。システムメモリ104,取り外し可能格納装置109および取り外し不可能な格納装置110はすべてコンピュータ格納媒体の例である。コンピュータ格納媒体にはRAM、ROM、EEPROM、フラッシュメモリあるいはその他のメモリ技術、CD−ROM、ディジタル多目的ディスク(DVD)あるいはその他の光学的格納装置、磁気カセット、磁気テープ、磁気ディスクあるいはその他の磁気格納装置、あるいは所望の情報を格納できまたコンピュータデバイス100がアクセス可能なその他の媒体があるが、これに限定されない。このようなコンピュータ格納媒体は装置100の一部分であっても構わない。コンピュータデバイス100はまたキーボード、マウス、ペン、音声入力デバイス、タッチ入力デバイスなどの入力デバイス112を有することができる。ディスプレイ、スピーカ、プリンタなどの出力デバイスが含まれてもよい。
コンピュータデバイス100はまたネットワークなどを経由して他のコンピュータデバイス装置118と通信できるように、通信接続116も備えている。通信接続116は通信媒体の一例である。通信媒体は一般に搬送波あるいはその他の伝送機構のような変調データ信号に含まれるコンピュータ読取り可能命令、データ構造、プログラムモジュールあるいはその他のデータによって具現化され、どのような情報供給媒体を含んでいてもよい。「変調データ信号」とはその1つあるいは複数のプロパティが情報をエンコードするようなやり方で信号中に設定あるいは変化された信号を意味する。例えば通信媒体には有線ネットワークあるいはその他の直結接続のような有線媒体、および音響、高周波、赤外線その他の無線媒体のような無線媒体を含むが、これに限定されない。ここでいうコンピュータ読取り可能媒体には格納媒体および通信媒体の両方を含む。
(クリックディスタンスによる検索結果ランク付けの実施例)
本発明の実施例は検索エンジンに対するランク付け機能に関するものである。検索エンジンの質は一般にランク付け機能によって割り当てられるランクに従う文書の接続によって決まる。ランク付け機能は複数の特徴に準拠できる。これらの特徴のあるものはクエリ内容に依存するものでもよいし、あるものはクエリ内容とは無関係でもよい。本発明においてはクリックディスタンスと呼ぶ、クエリに独立な検索能力尺度を用いる。クリックディスタンスとはユーザがイントラネットのホームページ(イントラネット上のもっとも権威あるURL、あるいはもっとも権威あるURLのうちの1つ)から当該ページまでに行う必要のある「クリック」の回数である。ウエブグラフ上ではクリックディスタンスをホームページと当該ページとの最短パスとして表すことができる。ある実施例においてはアリゴリズムがまず全幅を辿り、所定のノードとグラフにあるすべての他のノードとの距離を計算する。イントラネットに対するクリックディスタンスの計算を完了するのに、N回反復して辿る必要がある可能性がある。ここでNはグラフの直径(最大最短距離)である。この場合の変数Nはグラフ上のノードの総数よりずっと小さい。例えば、本発明に対するNはネットワークによって5と60の間であるとする。他のランク付け機能ではこのグラフ全体をカバーするのに40−50回の反復を要する(例えばページランク)可能性があり、このような他のランク付け機能はクリックディスタンスを使用するよりも数倍遅い。
図2は本発明に従ってクリックディスタンスにより検索結果をランク付けするしシステムを示す。検索エンジン200は複数のクエリ項目を含むクエリを受け取る。各クエリ項目は、クエリ項目がフレーズの場合、複数の要素項目を含む(例えば「ドキュメントマネージメントシステム」というフレーズは1個のクエリ項目と見なされる)。さらにクエリは1個あるいは複数の、ブール演算子、制約条件などの演算子を含んでもよく、これらは通常従来の検索エンジンでサポートされている。
文書210,212,214,216で表されている分布ネットワーク上の複数の文書に検索を適用する。実際には検索エンジンはどのような数の文書でも検索でき、一般に多数の(例えば数百万の)文書を含む集合を検索する。文書の数はインターネット環境からイントラネット環境になれば減少するが、それは通常数十億から数百万への減少で、相対的な文書数は依然として極めて多い。インデックス化モジュール(図示されていない)は各文書について個々の文書統計を生成する(例えば218,220,222,224)。この文書統計はインデックス226に格納される。
検索エンジン200はインデックス226を参照して、クエリおよびそれに対応する文書統計に基づいて各文書に対する検索スコア228を判定する。本発明においては使用する文書統計の1つがその文書のクリックディスタンスである。他の実施例において使用する文書統計の1つがその文書に接続するURLの深さである。それからクリックディスタンスおよびURLの深さはクエリに関係する統計と結合され、文書の最終スコアを作る。文書スコア228は通常それから降順にランク付けされて、検索アルゴリズムがクエリにもっとも関連があると考える文書リストをユーザに提供する。
図示のシステムにおいて検索エンジン200はクリックディスタンスを文書の検索スコアの判定に用いるクリックディスタンス検索エンジンを表す。文書のクリックディスタンス採点はサイトのホームページからその文書までの距離を測定して階層構造サイト(図3参照)において文書を位置づけする。例えば、ホームページからのクリックディスタンスはそのページの重要性の尺度であり、階層においてホームページに近いページは階層において低いページより重要であると考えられる。しかし、階層の低い文書が階層の高いページよりも重要であるという、反対の場合が正しいということもあり得る。したがってクリックディスタンスはクエリによる(例えばクエリに関係するある機能は文書中に検索項目が表れる回数を計数するというような)よりは全体的な重要性を採点するので、クエリに独立な検索能力尺度であると考えられる。
図3は本発明に従った典型的なネットワークグラフを示す。このネットワークグラフはノード(例えば310)およびエッジあるいはリンク(例えば320)から成る。ノード(例えば310)は、検索クエリへの結果として返されることになる、ネットワーク上のページおよびその他のリソースを表す。リンク(例えば320)はページに記載されているナビゲーションに従ってこれらのページのそれぞれを結合する。各ページについてリンク情報の組を集めることにより特定のページに対するクリックディスタンスを計算できる。
ある実施例において、ノード330は一群の文書に対してネットワーク上の最も権威あるページあるいは根ノードを表す。ネットワークの残りのページに対するクリックディスタンスはノード330から計算できる。例えば、ノード340はノード330から2回の「クリック」のクリックディスタンスである。前記のように「クリック」とは最高権威ノードから最短のパスを通って辿る枝の数である。ノード330からノード340に到達する他のパスも選択できるが、クリックディスタンスは最短パスに関するものである。
ネットワークグラフ300は特定の順序に従っていないノードを示し、この点でインターネットに類似している。順序が無いのでページのランク付けにクリックディスタンスを適用することを概念化するのが困難かもしれない。しかしページおよびリソースのネットワークは次の図4に示すような順序に適合することもしばしばある。
図4は本発明に従った典型的な階層ネットワークを示す。階層ネットワークグラフ400はノード(例えば410)およびリンク(例えば420)を含む点で図3に示すネットワークグラフ300に似ている。しかし階層ネットワークグラフ400は構造化サイトあるいはイントラネットの固有階層に基づいている。したがって、階層ネットワークグラフ400は根ノードから枝が広がっているツリー構造として概念化できよう。
階層ネットワークグラフ400に対するクリックディスタンスの適用性および計算はもっと判りやすい。例えばノード330は最高権威ノードあるいはツリーの根ノードに対応する。したがってノード340は、根ノードから3クリックあるいは3回のユーザナビゲーションなので、関連クリックディスタンスは3である。言い方を変えれば、ユーザはノード330からノード340に移行するのにツリーの枝を3本通過する必要があるので、クリックディスタンスも3である。
図3および図4に表されるネットワークグラフは、クリックディスタンスを計算するために文書のインデックス化をする間メモリに構成されるグラフの例である。インデックス化する間グラフを構成することにより、クリックディスタンスをインデックスに保存される文書統計に含めることができ、またページのランク付けに使用することができる。クリックディスタンスプロパティの生成プロセスおよびクリックディスタンスプロパティを文書のランク付けに使用する例を以下に図5および図6に関連して説明する。
図5は本発明に従ってクリックディスタンス(CD)を計算するための処理例の論理フロー図を示す。処理500は分布ネットワーク上の文書がインデックス化され、ネットワークグラフが生成されているブロック502で始まる。ある実施例において、ネットワークグラフがデータから生成されるが、そのデータはリンクおよびアンカーテキスト情報を集める処理によって集められ、アンカーの特定のターゲット文書に帰せられたデータである。この処理およびアンカーテキストの概念はさらに詳しくは、本願と同時に申請した出願「System and Method for Incorporating Anchor Text into Ranking Search Results」で説明されている。処理はブロック504で継続する。
ブロック504においてネットワークグラフがメモリにロードされる。このネットワークグラフは文書の識別表示(例えば文書ID)の構造的表示であり、ネットワークから集めたリンク情報である。ネットワークグラフの例を図3および図4に示す。ネットワークグラフはサイトあるいはイントラネットのノードあるいはページを表している。各ノードは、値あるいは重みを持ち、接続するクリックディスタンスプロパティを有する。ある実施例においては、このクリックディスタンスプロパティは文書IDの最後に集中している。処理はブロック506で継続する。
ブロック506においてクリックディスタンス(CD)値を各ノードについて初期化する。最高権威ノードを割り当てノードとして指定する。これらのノードにはクリックディスタンス値が0(ゼロ)に割り当てられる。1個のネットワークグラフに対して複数の高権威ノードが指定されることもある。例えば管理者が100ノードの組を手動でランク付けし、これらのすべてを高権威ノードに指定することもできる。さらに高権威ノードは必ずしも0(ゼロ)のクリックディスタンスを有する必要はなく、管理者がどのような値でも割り当てることができる。高権威ノードのクリックディスタンスを変更することが残りのアルゴリズムを変更することはなく、それは単にノードの重要度を手動で指定する方法を提供するだけである。例えば管理者はいくつかのノードのクリックディスタンススコアを増やすことができる。別の場合には管理者がクリックディスタンススコアを減らすことができる(初期設定でアルゴリズムが計算した値よりもクリックディスタンスを強制的に大きくする)。割り当てのない各ノードのクリックディスタンスは最大値に初期化される。ある実施例においては、基本的にクリックディスタンスの最大値を無限大に設定する。ノードに無限大値を割り当てることにより、そのノードについてまだクリックディスタンスが計算されていないことが容易に認識できる。クリックディスタンス値の初期化が終わると処理はブロック508に移る。
ブロック508において最大値以外の接続クリックディスタンスを持つノードは待ち行列に挿入される。ある例においては、この段階は最初の反復のみで生成する。待ち行列に挿入されたノードのクリックディスタンスは最大値以外の値、0(ゼロ)に設定されるので、これらのノードは最高権威ノードに相当する。最大値以外のクリックディスタンスを持つノードが待ち行列に加えられるとブロック510で判定処理を行う。
判定ブロック510では待ち行列が空かどうかを決める。待ち行列が空であればターゲットノードのクリックディスタンスを計算する必要のあるノードがもう無いということを意味する。待ち行列が空の場合、処理はブロック512に移動し、そこで処理500は終了する。しかし待ち行列が空でない場合は、処理はブロック514で継続する。
ブロック514ではノードが待ち行列から除去される。ノードを待ち行列から除去するとその文書に接続するターゲットノードについてクリックディスタンスの計算を開始する。ターゲットノードは元の文書からリンクのある文書に対応している。この場合、元の文書は待ち行列から除去したノードに対応する文書である。このノードが除去されると処理はブロック516に移る。
ブロック516では次のターゲットノードを持ってくる。次のターゲットノードとは元の文書によりリンクされている文書中の次の文書に関するものである。次のターゲットノードを持ってくると処理を判定ブロック518で継続する。
判定ブロック518において、ターゲットノードに接続するクリックディスタンスが現在のページプラス1(CD+1)のクリックディスタンスより大きいかどうかを判定する。ある実施例においては、ブロック518における条件を満たす方法はターゲットノードが無限大のクリックディスタンスを有するときである(高権威ノードがゼロに設定されており、管理者がクリックディスタンスを手動で設定していないと想定)。例えば、現在のクリックディスタンスが1の場合、CD+1=2である。クリックディスタンス2はしたがって無限大より小さく、条件が満たされる。ターゲットクリックディスタンスがそのクリックディスタンスプラス1より大きいかの判定により、それより小さいクリックディスタンスを持つターゲット文書が変更されるのを防止する。前の例を用いれば、ターゲットノードのクリックディスタンスが1で現在のクリックディスタンスも1の場合、ターゲットクリックディスタンスはCD+1=2より大きくない。この場合ターゲットノードへの最短パスが既に記録されており、したがって更新の必要がない。したがってターゲットクリックディスタンスが現在のクリックディスタンスプラス1より大きくないときは、処理は判定ブロック522へと進む。しかしターゲットクリックディスタンスが現在のクリックディスタンスプラス1よりも大きい場合は、処理はブロック520に移る。
ブロック520において、ターゲットノードのクリックディスタンス値は更新され、ターゲットノードがそのターゲットノードのクリックディスタンスを計算する必要のあるノードとして待ち行列に加えられる。ターゲットノードは無限大値を除去して新しいクリックディスタンス値で更新され、ノードに計算したクリックディスタンス値を設定する。ある実施例においては、そのノードのクリックディスタンス値は現在のクリックディスタンス値プラス1(CD+1)に設定される。処理は判定ブロック522で継続する。
判定ブロック522において、待ち行列から除去する現在のノードについてすべてのターゲットノードが持って来たかを判定する。現在のノードについてまだ持ってくるターゲットノードが残っている場合は、処理はブロック516に戻り、次のターゲットノードを持ってくる。しかし、現在のノードについてすべてのターゲットノードを持って来た場合、処理は判定ブロック510に戻り、待ち行列がいま空かどうかを再チェックする。待ち行列か空であれば処理はブロック512に移り、ここで処理500は終了する。
ネットワーク中のすべてのノードが最初の高権威ノードに接続されていないこともあり得る。したがって、本発明の他の実施例においては高権威ノードに接続されていないノードは重要度が低いと見なされ、ネットワークグラフに対する平均よりも低いクリックディスタンスが割り当てられる。
図6は本発明に従って検索結果のランク付けにクリックディスタンスを用いるための典型的な処理の論理フロー図を示す。処理600はクエリが要求され、ネットワーク上の各文書に対するクリックディスタンスが計算されているブロック602で始まる。処理はブロック604で継続する。
ブロック604において各文書に対するクリックディスタンスはインデックス中の他の文書統計(図2参照)と結合される。クリックディスタンスを他の文書統計と結合することにより、ランク付けに関するすべての情報が一箇所に集められるので、クエリへの応答が速くなる。したがってインデックス中のリストにある各文書は結合後の接続クリックディスタンス値を持つ。結合が完了すると処理はブロック606に移る。
ブロック606において、スコア機能を、クリックディスタンスを含む文書統計の組に適用して、特定の文書についてスコアを計算する。クリックディスタンスはクエリに独立な検索能力要素をスコア機能に提供する。スコア機能のその他の部分はクエリに接続するか、あるいはスコア機能の内容に接続する部分である。ある実施例においては、スコア機能はクエリに接続する(QD)スコアとクエリに独立な検索能力(QID)スコアの和である。すなわち、
Score = QD(doc, query) + QID(doc) (1)
QD機能はどのような文書スコア機能であってもよい。ある実施例においては、QDスコア機能は、2004年3月18日に申請した「Field Weighting in Text Document Searching」と題する米国特許出願10/804,326号の明細書に説明しているフィールド重み付けスコア機能に相当する。米国特許出願10/804,326号明細書に述べているように次式がフィールド重み付けスコア機能の式である。
Figure 2006107432
ここで各項は以下のように定義される。wtfは重み付けした項目の頻度あるいは全プロパティにわたって重みを乗じた所定の項目の頻度の和である。wdlは重み付けした文書の長さである。avwdlは重み付けした文書の平均長である。Nはネットワーク上の文書の数(すなわち辿る文書の数)である。nは所定のクエリ項目を含む文書の数である。klおよびbは定数である。これらの項目および等式については米国特許出願10/804,326号明細書に詳しく述べている。
QID機能はクリックディスタンスおよび他の文書統計(URL深さのような)のどのような変換式であってもよい。ある実施例においてはこの機能は次のようなものである。
Figure 2006107432
ここにこの機能の項目は以下のように定義される。wcdはクエリに独立な検索能力要素の重みである。bcdはクリックディスタンスの重みである。budはURL深さの重みである。CDはクリックディスタンスである。UDはURL深さである。Kcdはクリックディスタンスの飽和定数である。重み付け項目(wcd、bcd、bud)はこれらに接続する各項目の重要度を定義するのを支援し、最終的にスコア機能を形成する。URL深さ(UD)は、スコア機能へのクリックディスタンスの影響を滑らかにするための、クエリに独立な検索能力の付加的要素である。ある場合にはあまり重要でない(すなわちURL深さが大きい)文書が短いクリックディスタンスを持つことがある。URLの深さは文書のURLにおけるスラッシュの数を数える。例えば、www.example.com/d1/d2/d3/d4.htmには4個のスラッシュがあり、したがってURL深さは4である。しかしこの文書はメインページwww.example.comから直接つながっており、クリックディスタンスが1かもしれない。機能(3)にURL深さ項目を含み、それをクリックディスタンスに対して重み付けすると、クリックディスタンスの高スコアが補正されて階層におけるそのページのより正確なランクを反映する。ネットワークによっては、3あるいはそれ以上のURL深さは深いリンクと見なされることがある。この実施例に対して、本発明では(2)と(3)の2つの機能を加えてスコア機能(Score)を作り、したがってこの新しいスコア機能は次のようになる。
Figure 2006107432
他の実施例では、クエリに接続する要素あるいはクエリに独立な検索能力の精度を向上するために、URL深さをスコア機能から取り除き、あるいは他の要素をスコア機能に加えてもよい。さらに本発明の趣旨あるいは範囲を離れずに、ランク付け結果を向上するためにクエリに独立な検索能力要素をここに示されていない他のランク付け機能に組み込んでもよい。スコア機能(4)に特定の文書の文書統計がポピュレートされると処理はブロック608に進む。
ブロック608においてスコア機能を実行し、文書の検索能力スコアを計算する。検索能力スコアの計算が完了するとメモリにそれを格納し、その特定の文書と接続する。それから処理は判定ブロック610に移る。
判定ブロック610においてスコア機能(4)に従ってすべての文書について検索能力スコアを計算したかどうかを判定する。スコアは図示のように直列に計算しても、並列に計算してもよい。全てのスコアが計算されていない場合、処理はブロック606に戻り、スコア機能に次の文書統計の組がポピュレートされる。しかし、すべてのスコアが計算された場合、処理はブロック612で継続する。
ブロック612においてクエリの検索結果をその検索能力スコアに従ってランク付けする。このスコアにはすでに各文書のクリックディスタンスとURL深さが考慮されている。したがって文書のランク付けは改善されており、他の要素がすべて同じ場合、イントラネットあるいはサイトの階層の高い文書が他の文書よりも高いランクにある。検索結果のランク付けが終わると、処理はブロック614に進み、ここで処理600は終了する。
処理600が完了すると検索エンジンによる結果の伝送および表示に関連するさまざまな操作によりランク付けした文書をユーザに返すことができる。これによりユーザは高い精度の結果に対応する文書がユーザの裁量により選択、閲覧できる。
上記の仕様、例およびデータは本発明の構成の製作および使用を完全に説明するためのものである。本発明の趣旨と範囲を離れることなく多くの実施例が可能であるから、本発明は以下に付する請求項に存する。
本発明の典型的な実施例に用いることができる典型的なコンピューティングデバイスを示す図である。 検索結果を本発明に従ってクリックディスタンスによりランク付けするシステムを示す図である。 本発明に従う典型的なネットワークグラフを示す図である。 本発明に従う典型的な階層ネットワークグラフを示す図である。 本発明に従ってクリックディスタンスを計算する典型的な処理を示す論理フロー図である。 本発明に従ってクリックディスタンスを用いて検索結果のランク付けをする典型的な処理を示す論理フロー図である。
符号の説明
200 検索エンジン
210,212,214,216 文書
218,220,222,224 文書統計
226 インデックス
228 検索スコア

Claims (29)

  1. 検索結果をランク付けするコンピュータ実施方法であって、
    文書およびネットワーク上の文書のリンク情報を格納すること、
    記録された文書およびリンク情報からネットワークの表記を生成することであって、前記ネットワークの表記は、文書を表記するノードを含むこと、
    前記ネットワークの表記における各ノードについてクリックディスタンスを計算することであって、前記クリックディスタンスは、最高権威ノードとして指定した第1ノードから、計算されたクリックディスタンスに関する第2のノード迄を測定すること、および、
    各々の前記文書に関連付けられた前記計算されたクリックディスタンスを文書のランク付けにおけるクエリに独立な検索能力尺度として用いて、ランク付けされた検索結果を作成すること
    を備えたことを特徴とする方法。
  2. 請求項1のコンピュータ実施方法であって、前記ネットワークの表記を生成することは、ネットワークグラフを生成すること、およびネットワークグラフをメモリに格納することをさらに備えたことを特徴とする方法。
  3. 請求項1のコンピュータ実施方法であって、前記クリックディスタンスを計算することは、最高権威ノードに対応する文書を除いて各文書に接続するクリックディスタンスを最大値に初期化することをさらに備えたことを特徴とする方法。
  4. 請求項1のコンピュータ実施方法であって、現在のノードに関するターゲットノードのクリックディスタンスを計算するまで、ネットワークの表記の現在のノードをノードの待ち行列に格納することをさらに備えたことを特徴とする方法。
  5. 請求項4のコンピュータ実施方法であって、ターゲットノードの1つのクリックディスタンスは、現在のノードのクリックディスタンスプラス変数よりも大きいとき、そのターゲットノードのクリックディスタンスを現在のノードのクリックディスタンスプラス変数に設定することを特徴とする方法。
  6. 請求項1のコンピュータ実施方法であって、各々の前記計算された文書に関連付けられた前記クリックディスタンスを、各々の前記文書に対応する他の統計を含むインデックスに結合することを特徴とする方法。
  7. 請求項6のコンピュータ実施方法であって、スコア機能を、前記計算されたクリックディスタンスおよび前記他の統計に適用して、前記文書をランク付けするためのスコアを作成することを特徴とする方法。
  8. 請求項1のコンピュータ実施方法であって、各々の前記文書に関連付けられた前記計算されたクリックディスタンスをクエリに独立な検索能力尺度として用いることは、各々の前記文書に対する検索能力スコアを判定するためのスコア機能にクリックディスタンスに対応する要素を用いることをさらに備えたことを特徴とする方法。
  9. 請求項8のコンピュータ実施方法であって、前記検索能力スコアを、前記クリックディスタンスの前記検索能力スコアへの影響を滑らかにするURL深さプロパティによりオフセットすることを特徴とする方法。
  10. 請求項1のコンピュータ実施方法であって、前記ネットワークの表記を生成することは、前記ネットワークの表記内の複数のノードを高権威ノードとして指定するようなネットワークの表記を生成することをさらに備えたことを特徴とする方法。
  11. 請求項1のコンピュータ実施方法であって、クリックディスタンスを計算したあとに、前記クリックディスタンスを手動で変更することができることをさらに備えたことを特徴とする方法。
  12. 請求項1のコンピュータ実施方法であって、計算されたクリックディスタンス(CD)、クエリに独立な検索能力要素の重み(wcd)、クリックディスタンスの重み(bcd)、URL深さの重み(bud)、URL深さ(UD)、およびクリックディスタンス飽和定数(Kcd)によって判定されるスコア(Score)に従って、前記文書をランク付けすることをさらに備えたことを特徴とする方法。
  13. 請求項1のコンピュータ実施方法であって、計算されたクリックディスタンス(CD)、重み付けした項目頻度(wtf)、重み付けした文書長さ(wdl)、重み付けした文書の平均長(avwdl)、ネットワーク上の文書数(N)、クエリ項目を含む文書の数(n)、クエリに独立な検索能力要素の重み(wcd)、クリックディスタンスの重み(bcd)、URL深さの重み(bud)、URL深さ(UD)、クリックディスタンス飽和定数(Kcd)およびその他の定数(kl、b)によって判定されるスコア(Score)に従って、前記文書をランク付けすることをさらに備えたことを特徴とする方法。
  14. 請求項13のコンピュータ実施方法であって、スコア(Score)は、
    Figure 2006107432
    で与えられることを特徴とする方法。
  15. 検索結果のランク付けをするシステムであって、
    コンピューティングデバイスに含まれ、コンピュータ実行命令を実行するように構成された検索エンジンを備え、前記コンピュータ実行命令は、
    ネットワーク上の文書を発見すること
    前記ネットワーク上の各々の前記文書に対する文書とリンク情報とを記録すること、
    記録された文書およびリンク情報からネットワークの表記を生成することであって、前記ネットワークの表記は、文書を表記するノードを含むこと、
    最高権威ノードから前記ネットワークの表記中の各ノードまでのクリックディスタンスを計算すること、
    各ノードについて計算されたクリックディスタンスをそのノ―ドに対応する文書に関連つけること、および、
    各々の前記文書に関連付けられた前記計算されたクリックディスタンスを文書のランク付けにおけるクエリに独立な検索能力尺度として用いて、ランク付けされた検索結果を作成すること
    を備えたことを特徴とするシステム。
  16. 請求項15のシステムであって、前記ネットワークの表記を生成することは、ネットワークグラフを生成し、前記ネットワークグラフをメモリに格納することをさらに備えたことを特徴とするシステム。
  17. 請求項15のシステムであって、各ノードについて計算されたクリックディスタンスをそのノ―ドに対応する文書に関連つけることは、各々の前記文書に関連付けられた前記計算されたクリックディスタンスを各々の前記文書に対応する他のランク付けの値を含むインデックスに結合することをさらに備えたことを特徴とするシステム。
  18. 請求項17のシステムであって、スコア機能を、前記計算されたクリックディスタンスおよび前記他のランク付け値に適用して、前記文書をランク付けするためのスコアを生成することを特徴とするシステム。
  19. 請求項15のシステムであって、各々の前記文書に関連付けられた前記計算されたクリックディスタンスを文書のランク付けにおけるクエリに独立な検索能力尺度として用いることは、各々の前記文書に対する検索能力スコアを判定するためのスコア機能にクリックディスタンスに対応する要素を用いることをさらに備えたことを特徴とするシステム。
  20. 請求項19のシステムであって、あるノードに対するクリックディスタンスが、前記ネットワークの表記におけるノードの深さと不釣り合いのとき、前記検索能力スコアを、前記クリックディスタンスの前記検索能力スコアへの影響を滑らかにするURL深さプロパティによりオフセットすることを特徴とするシステム。
  21. 請求項15のシステムであって、計算されたクリックディスタンス(CD)、クエリに独立な検索能力要素の重み(wcd)、クリックディスタンスの重み(bcd)、URL深さの重み(bud)、URL深さ(UD)、およびクリックディスタンス飽和定数(Kcd)によって判定されるスコア(Score)に従って、前記文書をランク付けすることをさらに備えたことを特徴とするシステム。
  22. 請求項15のシステムであって、計算されたクリックディスタンス(CD)、重み付けした項目頻度(wtf)、重み付けした文書長さ(wdl)、重み付けした文書の平均長(avwdl)、ネットワーク上の文書数(N)、クエリ項目を含む文書の数(n)、クエリに独立な検索能力要素の重み(wcd)、クリックディスタンスの重み(bcd)、URL深さの重み(bud)、URL深さ(UD)、クリックディスタンス飽和定数(Kcd)およびその他の定数(kl、b)によって判定されるスコア(Score)に従って、前記文書をランク付けすることをさらに備えたことを特徴とする方法。
  23. 請求項13のコンピュータ実施方法であって、スコア(Score)は、
    Figure 2006107432
    で与えられることを特徴とするシステム。
  24. 請求項15のシステムであって、前記ネットワークの表記を生成することは、前記ネットワークの表記内の複数のノードを高権威ノードとして指定するネットワークの表記を生成することをさらに備えたことを特徴とするシステム。
  25. 請求項15のシステムであって、クリックディスタンスを計算したあとに、前記クリックディスタンスを手動で変更することができることをさらに備えたことを特徴とするシステム。
  26. 検索結果をランク付けするためのコンピュータ実行命令を含むコンピュータ読取り可能媒体であって、前記命令は、
    ネットワーク上の文書について文書およびリンク情報を格納し、前記ネットワークを表記するネットワークグラフをメモリ中に生成すること、
    前記文書が第1のクリックディスタンス値と異なるクリックディスタンスを有するとき、前記ネットワークグラフに表記される各文書を待ち行列に格納すること、
    待ち行列が空でないときは、
    文書を前記待ち行列から除去し、
    除去された文書に関連付けられたターゲット文書の各々についてクリックディスタンスを計算することであって、各ターゲット文書のクリックディスタンスが、前記除去された文書に関連付けられたクリックディスタンスに変数を加えたよりも大きいとき、各ターゲット文書を、第1のクリックディスタンス値以外の新しいクリックディスタンス値で更新し、
    前記各ターゲット文書を更新された待ち行列に付加すること、および
    各々の前記文書に関連付けられた前記計算されたクリックディスタンスを文書のランク付けにおけるクエリに独立な検索能力尺度として用いて、ランク付けされた検索結果を作成すること
    を備えたことを特徴とする媒体。
  27. 請求項26によるコンピュータ読取り可能媒体であって、各々の前記文書に関連付けられた前記計算されたクリックディスタンスを文書のランク付けにおけるクエリに独立な検索能力尺度として用いることは、各々の前記文書に対する検索能力スコアを判定するためのスコア機能にクリックディスタンスに対応する要素を用いることをさらに備えたことを特徴とする媒体。
  28. 請求項26によるコンピュータ読取り可能媒体であって、前記ネットワークの表記を生成することは、前記ネットワークの表記内の複数のノードを高権威ノードとして指定するネットワークの表記を生成することをさらに備えたことを特徴とする媒体。
  29. 請求項26によるコンピュータ読取り可能媒体であって、クリックディスタンスを計算したあとに、前記クリックディスタンスを手動で変更することができることをさらに備えたことを特徴とする媒体。
JP2005175172A 2004-09-30 2005-06-15 クリックディスタンスを用いて検索結果をランク付けするシステムおよび方法 Expired - Fee Related JP4950444B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/955,983 US7761448B2 (en) 2004-09-30 2004-09-30 System and method for ranking search results using click distance
US10/955,983 2004-09-30

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011194741A Division JP5369154B2 (ja) 2004-09-30 2011-09-07 クリックディスタンスを用いて検索結果をランク付けするシステムおよび方法

Publications (2)

Publication Number Publication Date
JP2006107432A true JP2006107432A (ja) 2006-04-20
JP4950444B2 JP4950444B2 (ja) 2012-06-13

Family

ID=35561746

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2005175172A Expired - Fee Related JP4950444B2 (ja) 2004-09-30 2005-06-15 クリックディスタンスを用いて検索結果をランク付けするシステムおよび方法
JP2011194741A Expired - Fee Related JP5369154B2 (ja) 2004-09-30 2011-09-07 クリックディスタンスを用いて検索結果をランク付けするシステムおよび方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2011194741A Expired - Fee Related JP5369154B2 (ja) 2004-09-30 2011-09-07 クリックディスタンスを用いて検索結果をランク付けするシステムおよび方法

Country Status (6)

Country Link
US (2) US7761448B2 (ja)
EP (1) EP1643385B1 (ja)
JP (2) JP4950444B2 (ja)
KR (1) KR101203312B1 (ja)
CN (1) CN100565509C (ja)
ES (1) ES2613385T3 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217764A (ja) * 2006-12-22 2008-09-18 Fujitsu Ltd セッションベースクエリのためのノードのランク付け
JP2011154638A (ja) * 2010-01-28 2011-08-11 Yahoo Japan Corp 検索スコア算出装置
JP2015201184A (ja) * 2014-04-04 2015-11-12 富士通株式会社 インフォーマル学習のための学習教材を収集する方法及び非一時的なコンピュータ可読媒体

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7606793B2 (en) 2004-09-27 2009-10-20 Microsoft Corporation System and method for scoping searches using index keys
US7761448B2 (en) * 2004-09-30 2010-07-20 Microsoft Corporation System and method for ranking search results using click distance
US7827181B2 (en) * 2004-09-30 2010-11-02 Microsoft Corporation Click distance determination
US8595223B2 (en) * 2004-10-15 2013-11-26 Microsoft Corporation Method and apparatus for intranet searching
US7991755B2 (en) * 2004-12-17 2011-08-02 International Business Machines Corporation Dynamically ranking nodes and labels in a hyperlinked database
EP1866738A4 (en) * 2005-03-18 2010-09-15 Search Engine Technologies Llc USER FEEDBACK RESEARCH ENGINE FOR IMPROVING RESEARCH RESULTS
US8244722B1 (en) 2005-06-30 2012-08-14 Google Inc. Ranking documents
US7599917B2 (en) * 2005-08-15 2009-10-06 Microsoft Corporation Ranking search results using biased click distance
CN101501688B (zh) * 2006-06-12 2013-07-24 沙力股份有限公司 搜索内容的方法和装置
US8140511B2 (en) * 2006-06-12 2012-03-20 Zalag Corporation Methods and apparatuses for searching content
US20160012131A1 (en) * 2006-06-12 2016-01-14 Zalag Corporation Methods and apparatuses for searching content
US9047379B2 (en) * 2006-06-12 2015-06-02 Zalag Corporation Methods and apparatuses for searching content
US8489574B2 (en) * 2006-06-12 2013-07-16 Zalag Corporation Methods and apparatuses for searching content
US7987169B2 (en) * 2006-06-12 2011-07-26 Zalag Corporation Methods and apparatuses for searching content
US20080126331A1 (en) * 2006-08-25 2008-05-29 Xerox Corporation System and method for ranking reference documents
US9165040B1 (en) 2006-10-12 2015-10-20 Google Inc. Producing a ranking for pages using distances in a web-link graph
CN101589360A (zh) 2006-10-18 2009-11-25 谷歌公司 适合于联合的通用在线排名系统和方法
US8661029B1 (en) 2006-11-02 2014-02-25 Google Inc. Modifying search result ranking based on implicit user feedback
US9110975B1 (en) * 2006-11-02 2015-08-18 Google Inc. Search result inputs using variant generalized queries
US8156112B2 (en) 2006-11-07 2012-04-10 At&T Intellectual Property I, L.P. Determining sort order by distance
CN100557608C (zh) * 2006-11-14 2009-11-04 株式会社理光 基于文档非内容特征的查询结果优化方法及装置
KR100859710B1 (ko) * 2006-12-07 2008-09-23 한국전자통신연구원 데이터에 대한 검색을 수행하기 위한 자료구조를 이용하여 데이터를 검색, 저장, 삭제하는 방법
US7657507B2 (en) * 2007-03-02 2010-02-02 Microsoft Corporation Pseudo-anchor text extraction for vertical search
US9092510B1 (en) 2007-04-30 2015-07-28 Google Inc. Modifying search result ranking based on a temporal element of user feedback
KR100898462B1 (ko) * 2007-05-16 2009-05-21 엔에이치엔(주) 문서 순위 결정 방법 및 이를 이용한 문서 순위 결정시스템
US20090063466A1 (en) * 2007-08-31 2009-03-05 Microsoft Corporation Resource selector, including for use in handheld devices
US8909655B1 (en) 2007-10-11 2014-12-09 Google Inc. Time based ranking
US9224149B2 (en) * 2007-10-15 2015-12-29 Google Inc. External referencing by portable program modules
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US7840569B2 (en) * 2007-10-18 2010-11-23 Microsoft Corporation Enterprise relevancy ranking using a neural network
US8823709B2 (en) * 2007-11-01 2014-09-02 Ebay Inc. User interface framework for viewing large scale graphs on the web
US8099417B2 (en) * 2007-12-12 2012-01-17 Microsoft Corporation Semi-supervised part-of-speech tagging
US8812493B2 (en) 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
US8825646B1 (en) * 2008-08-08 2014-09-02 Google Inc. Scalable system for determining short paths within web link network
US8396865B1 (en) 2008-12-10 2013-03-12 Google Inc. Sharing search engine relevance data between corpora
EP2380102A4 (en) * 2009-01-16 2013-02-13 Google Inc VISUALIZATION OF SITE STRUCTURE AND ON-SITE NAVIGATION ACTIVATION FOR SEARCH RESULT OR RELATED PAGE
US9009146B1 (en) 2009-04-08 2015-04-14 Google Inc. Ranking search results based on similar queries
US20100287174A1 (en) * 2009-05-11 2010-11-11 Yahoo! Inc. Identifying a level of desirability of hyperlinked information or other user selectable information
US8447760B1 (en) 2009-07-20 2013-05-21 Google Inc. Generating a related set of documents for an initial set of documents
US8060497B1 (en) 2009-07-23 2011-11-15 Google Inc. Framework for evaluating web search scoring functions
US8365064B2 (en) * 2009-08-19 2013-01-29 Yahoo! Inc. Hyperlinking web content
US8498974B1 (en) 2009-08-31 2013-07-30 Google Inc. Refining search results
US8972391B1 (en) 2009-10-02 2015-03-03 Google Inc. Recent interest based relevance scoring
US8874555B1 (en) 2009-11-20 2014-10-28 Google Inc. Modifying scoring data based on historical changes
US8924379B1 (en) 2010-03-05 2014-12-30 Google Inc. Temporal-based score adjustments
US8959093B1 (en) 2010-03-15 2015-02-17 Google Inc. Ranking search results based on anchors
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
US9623119B1 (en) 2010-06-29 2017-04-18 Google Inc. Accentuating search results
US8832083B1 (en) 2010-07-23 2014-09-09 Google Inc. Combining user feedback
US8606793B1 (en) * 2010-11-19 2013-12-10 Conductor, Inc. Business metric score for web pages
US9183299B2 (en) * 2010-11-19 2015-11-10 International Business Machines Corporation Search engine for ranking a set of pages returned as search results from a search query
US9002867B1 (en) 2010-12-30 2015-04-07 Google Inc. Modifying ranking data based on document changes
US8868567B2 (en) * 2011-02-02 2014-10-21 Microsoft Corporation Information retrieval using subject-aware document ranker
US8572096B1 (en) * 2011-08-05 2013-10-29 Google Inc. Selecting keywords using co-visitation information
US9244931B2 (en) * 2011-10-11 2016-01-26 Microsoft Technology Licensing, Llc Time-aware ranking adapted to a search engine application
US9208218B2 (en) * 2011-10-19 2015-12-08 Zalag Corporation Methods and apparatuses for generating search expressions from content, for applying search expressions to content collections, and/or for analyzing corresponding search results
US9600587B2 (en) 2011-10-19 2017-03-21 Zalag Corporation Methods and apparatuses for generating search expressions from content, for applying search expressions to content collections, and/or for analyzing corresponding search results
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results
US9348846B2 (en) 2012-07-02 2016-05-24 Google Inc. User-navigable resource representations
US9336302B1 (en) 2012-07-20 2016-05-10 Zuci Realty Llc Insight and algorithmic clustering for automated synthesis
US8949216B2 (en) 2012-12-07 2015-02-03 International Business Machines Corporation Determining characteristic parameters for web pages
US9576053B2 (en) 2012-12-31 2017-02-21 Charles J. Reed Method and system for ranking content of objects for search results
US8621062B1 (en) * 2013-03-15 2013-12-31 Opscode, Inc. Push signaling to run jobs on available servers
US9852230B2 (en) 2013-06-29 2017-12-26 Google Llc Asynchronous message passing for large graph clustering
US9596295B2 (en) 2013-06-29 2017-03-14 Google Inc. Computing connected components in large graphs
EP3131019A4 (en) * 2014-04-07 2017-02-15 Rakuten, Inc. Information processing device, information processing method, program, and storage medium
US9886507B2 (en) 2014-04-30 2018-02-06 International Business Machines Corporation Reranking search results using download time tolerance
US9767159B2 (en) * 2014-06-13 2017-09-19 Google Inc. Ranking search results
US10013496B2 (en) 2014-06-24 2018-07-03 Google Llc Indexing actions for resources
CN104484478B (zh) * 2014-12-31 2018-05-29 中国农业银行股份有限公司 一种关联聚类数据瘦身方法及系统
CN106933895B (zh) * 2015-12-31 2020-02-07 北京国双科技有限公司 最短访问路径识别方法及装置
CN106933910A (zh) * 2015-12-31 2017-07-07 北京国双科技有限公司 最短路径识别方法及装置
CN106933896B (zh) * 2015-12-31 2021-06-22 北京国双科技有限公司 最短访问路径识别方法及装置
US11226969B2 (en) * 2016-02-27 2022-01-18 Microsoft Technology Licensing, Llc Dynamic deeplinks for navigational queries
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
US11366872B1 (en) * 2017-07-19 2022-06-21 Amazon Technologies, Inc. Digital navigation menus with dynamic content placement
CN108008941B (zh) * 2017-11-16 2019-06-21 北京大学 一种安卓应用的深链接口自动生成方法及深链执行方法
CN110020206B (zh) * 2019-04-12 2021-10-15 北京搜狗科技发展有限公司 一种搜索结果排序方法及装置
US11175914B2 (en) * 2019-06-28 2021-11-16 Aras Corporation Calculation engine for performing calculations based on dependencies in a self-describing data system

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002132769A (ja) * 2000-10-25 2002-05-10 Nippon Telegr & Teleph Corp <Ntt> 多角的検索サービス方法および装置、ならびにそのプログラムを記録した記録媒体
JP2004054588A (ja) * 2002-07-19 2004-02-19 Just Syst Corp 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム

Family Cites Families (220)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10781A (en) * 1854-04-18 Matthias p
US186827A (en) * 1877-01-30 Improvement in mail-bags
US49766A (en) * 1865-09-05 Gboege w
US117351A (en) * 1871-07-25 Improvement in reclining-chairs
US5222236A (en) * 1988-04-29 1993-06-22 Overdrive Systems, Inc. Multiple integrated document assembly data processing system
US5257577A (en) 1991-04-01 1993-11-02 Clark Melvin D Apparatus for assist in recycling of refuse
US6202058B1 (en) 1994-04-25 2001-03-13 Apple Computer, Inc. System for ranking the relevance of information objects accessed by computer users
US5606609A (en) * 1994-09-19 1997-02-25 Scientific-Atlanta Electronic document verification system and method
US5594660A (en) * 1994-09-30 1997-01-14 Cirrus Logic, Inc. Programmable audio-video synchronization method and apparatus for multimedia systems
US5642502A (en) * 1994-12-06 1997-06-24 University Of Central Florida Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text
US5933851A (en) * 1995-09-29 1999-08-03 Sony Corporation Time-stamp and hash-based file modification monitor with multi-user notification and method thereof
US5974455A (en) * 1995-12-13 1999-10-26 Digital Equipment Corporation System for adding new entry to web page table upon receiving web page including link to another web page not having corresponding entry in web page table
US6314420B1 (en) 1996-04-04 2001-11-06 Lycos, Inc. Collaborative/adaptive search engine
JP3113814B2 (ja) * 1996-04-17 2000-12-04 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 情報検索方法及び情報検索装置
US5920859A (en) 1997-02-05 1999-07-06 Idd Enterprises, L.P. Hypertext document retrieval system and method
US5745890A (en) 1996-08-09 1998-04-28 Digital Equipment Corporation Sequential searching of a database index using constraints on word-location pairs
US5920854A (en) 1996-08-14 1999-07-06 Infoseek Corporation Real-time document collection search engine with phrase indexing
WO1998014906A1 (fr) 1996-10-02 1998-04-09 Nippon Telegraph And Telephone Corporation Procede et appareil d'affichage graphique de structure hierarchique
US6285999B1 (en) 1997-01-10 2001-09-04 The Board Of Trustees Of The Leland Stanford Junior University Method for node ranking in a linked database
US5960383A (en) * 1997-02-25 1999-09-28 Digital Equipment Corporation Extraction of key sections from texts using automatic indexing techniques
US5848404A (en) * 1997-03-24 1998-12-08 International Business Machines Corporation Fast query search in large dimension database
US6256675B1 (en) * 1997-05-06 2001-07-03 At&T Corp. System and method for allocating requests for objects and managing replicas of objects on a network
US6012053A (en) * 1997-06-23 2000-01-04 Lycos, Inc. Computer system with user-controlled relevance ranking of search results
JPH1125119A (ja) 1997-06-30 1999-01-29 Canon Inc ハイパーテキスト閲覧システム
JPH1125104A (ja) 1997-06-30 1999-01-29 Canon Inc 情報処理装置および方法
US5983216A (en) 1997-09-12 1999-11-09 Infoseek Corporation Performing automated document collection and selection by providing a meta-index with meta-index values indentifying corresponding document collections
US6182113B1 (en) 1997-09-16 2001-01-30 International Business Machines Corporation Dynamic multiplexing of hyperlinks and bookmarks
US6070191A (en) * 1997-10-17 2000-05-30 Lucent Technologies Inc. Data distribution techniques for load-balanced fault-tolerant web access
US6351467B1 (en) * 1997-10-27 2002-02-26 Hughes Electronics Corporation System and method for multicasting multimedia content
US6594682B2 (en) * 1997-10-28 2003-07-15 Microsoft Corporation Client-side system for scheduling delivery of web content and locally managing the web content
US6128701A (en) 1997-10-28 2000-10-03 Cache Flow, Inc. Adaptive and predictive cache refresh policy
US5991756A (en) * 1997-11-03 1999-11-23 Yahoo, Inc. Information retrieval from hierarchical compound documents
US5987457A (en) 1997-11-25 1999-11-16 Acceleration Software International Corporation Query refinement method for searching documents
US6473752B1 (en) 1997-12-04 2002-10-29 Micron Technology, Inc. Method and system for locating documents based on previously accessed documents
US6389436B1 (en) * 1997-12-15 2002-05-14 International Business Machines Corporation Enhanced hypertext categorization using hyperlinks
US6145003A (en) 1997-12-17 2000-11-07 Microsoft Corporation Method of web crawling utilizing address mapping
US6151624A (en) 1998-02-03 2000-11-21 Realnames Corporation Navigating network resources based on metadata
KR100285265B1 (ko) 1998-02-25 2001-04-02 윤덕용 데이터 베이스 관리 시스템과 정보 검색의 밀결합을 위하여 서브 인덱스와 대용량 객체를 이용한 역 인덱스 저장 구조
US6185558B1 (en) * 1998-03-03 2001-02-06 Amazon.Com, Inc. Identifying the items most relevant to a current query based on items selected in connection with similar queries
US6125361A (en) 1998-04-10 2000-09-26 International Business Machines Corporation Feature diffusion across hyperlinks
US6151595A (en) 1998-04-17 2000-11-21 Xerox Corporation Methods for interactive visualization of spreading activation using time tubes and disk trees
US6240407B1 (en) * 1998-04-29 2001-05-29 International Business Machines Corp. Method and apparatus for creating an index in a database system
US6098064A (en) * 1998-05-22 2000-08-01 Xerox Corporation Prefetching and caching documents according to probability ranked need S list
US6285367B1 (en) 1998-05-26 2001-09-04 International Business Machines Corporation Method and apparatus for displaying and navigating a graph
US6182085B1 (en) * 1998-05-28 2001-01-30 International Business Machines Corporation Collaborative team crawling:Large scale information gathering over the internet
US6208988B1 (en) 1998-06-01 2001-03-27 Bigchalk.Com, Inc. Method for identifying themes associated with a search query using metadata and for organizing documents responsive to the search query in accordance with the themes
ATE263988T1 (de) 1998-06-08 2004-04-15 Kcsl Inc Methode und verfahren um relevante dokumente in einer datenbank zu finden
US6006225A (en) 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
US6216123B1 (en) * 1998-06-24 2001-04-10 Novell, Inc. Method and system for rapid retrieval in a full text indexing system
US6638314B1 (en) 1998-06-26 2003-10-28 Microsoft Corporation Method of web crawling utilizing crawl numbers
CN1324464A (zh) 1998-08-26 2001-11-28 西姆泰克有限公司 映射数据文件的方法和设备
RU2138076C1 (ru) 1998-09-14 1999-09-20 Закрытое акционерное общество "МедиаЛингва" Система поиска информации в компьютерной сети
US6549897B1 (en) * 1998-10-09 2003-04-15 Microsoft Corporation Method and system for calculating phrase-document importance
US6360215B1 (en) * 1998-11-03 2002-03-19 Inktomi Corporation Method and apparatus for retrieving documents based on information other than document content
US6385602B1 (en) * 1998-11-03 2002-05-07 E-Centives, Inc. Presentation of search results using dynamic categorization
US6574632B2 (en) 1998-11-18 2003-06-03 Harris Corporation Multiple engine information retrieval and visualization system
US6628304B2 (en) 1998-12-09 2003-09-30 Cisco Technology, Inc. Method and apparatus providing a graphical user interface for representing and navigating hierarchical networks
US6167369A (en) 1998-12-23 2000-12-26 Xerox Company Automatic language identification using both N-gram and word information
US6922699B2 (en) * 1999-01-26 2005-07-26 Xerox Corporation System and method for quantitatively representing data objects in vector space
US6418433B1 (en) * 1999-01-28 2002-07-09 International Business Machines Corporation System and method for focussed web crawling
US6862710B1 (en) 1999-03-23 2005-03-01 Insightful Corporation Internet navigation using soft hyperlinks
US6510406B1 (en) 1999-03-23 2003-01-21 Mathsoft, Inc. Inverse inference engine for high performance web search
US6763496B1 (en) 1999-03-31 2004-07-13 Microsoft Corporation Method for promoting contextual information to display pages containing hyperlinks
US6304864B1 (en) 1999-04-20 2001-10-16 Textwise Llc System for retrieving multimedia information from the internet using multiple evolving intelligent agents
US6327590B1 (en) 1999-05-05 2001-12-04 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis
US7835943B2 (en) 1999-05-28 2010-11-16 Yahoo! Inc. System and method for providing place and price protection in a search result list generated by a computer network search engine
US6990628B1 (en) 1999-06-14 2006-01-24 Yahoo! Inc. Method and apparatus for measuring similarity among electronic documents
US7072888B1 (en) 1999-06-16 2006-07-04 Triogo, Inc. Process for improving search engine efficiency using feedback
US6973490B1 (en) 1999-06-23 2005-12-06 Savvis Communications Corp. Method and system for object-level web performance and analysis
US6547829B1 (en) * 1999-06-30 2003-04-15 Microsoft Corporation Method and system for detecting duplicate documents in web crawls
US7181438B1 (en) * 1999-07-21 2007-02-20 Alberti Anemometer, Llc Database access system
US6598047B1 (en) 1999-07-26 2003-07-22 David W. Russell Method and system for searching text
JP3931496B2 (ja) * 1999-08-11 2007-06-13 富士ゼロックス株式会社 ハイパーテキスト解析装置
US6442606B1 (en) * 1999-08-12 2002-08-27 Inktomi Corporation Method and apparatus for identifying spoof documents
US6636853B1 (en) * 1999-08-30 2003-10-21 Morphism, Llc Method and apparatus for representing and navigating search results
US7346604B1 (en) * 1999-10-15 2008-03-18 Hewlett-Packard Development Company, L.P. Method for ranking hypertext search results by analysis of hyperlinks from expert documents and keyword scope
EP1226521A1 (en) 1999-10-29 2002-07-31 BRITISH TELECOMMUNICATIONS public limited company Method and apparatus for processing queries
US6351755B1 (en) * 1999-11-02 2002-02-26 Alta Vista Company System and method for associating an extensible set of data with documents downloaded by a web crawler
US6263364B1 (en) * 1999-11-02 2001-07-17 Alta Vista Company Web crawler system using plurality of parallel priority level queues having distinct associated download priority levels for prioritizing document downloading and maintaining document freshness
US6418453B1 (en) * 1999-11-03 2002-07-09 International Business Machines Corporation Network repository service for efficient web crawling
US6418452B1 (en) * 1999-11-03 2002-07-09 International Business Machines Corporation Network repository service directory for efficient web crawling
US6539376B1 (en) * 1999-11-15 2003-03-25 International Business Machines Corporation System and method for the automatic mining of new relationships
US6886129B1 (en) 1999-11-24 2005-04-26 International Business Machines Corporation Method and system for trawling the World-wide Web to identify implicitly-defined communities of web pages
US7016540B1 (en) * 1999-11-24 2006-03-21 Nec Corporation Method and system for segmentation, classification, and summarization of video images
US6546388B1 (en) 2000-01-14 2003-04-08 International Business Machines Corporation Metadata search results ranking system
US6883135B1 (en) * 2000-01-28 2005-04-19 Microsoft Corporation Proxy server using a statistical model
US7240067B2 (en) 2000-02-08 2007-07-03 Sybase, Inc. System and methodology for extraction and aggregation of data from dynamic content
US6931397B1 (en) * 2000-02-11 2005-08-16 International Business Machines Corporation System and method for automatic generation of dynamic search abstracts contain metadata by crawler
US6910029B1 (en) 2000-02-22 2005-06-21 International Business Machines Corporation System for weighted indexing of hierarchical documents
JP2001265774A (ja) 2000-03-16 2001-09-28 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム
US6516312B1 (en) * 2000-04-04 2003-02-04 International Business Machine Corporation System and method for dynamically associating keywords with domain-specific search engine queries
US6633867B1 (en) 2000-04-05 2003-10-14 International Business Machines Corporation System and method for providing a session query within the context of a dynamic search result set
US6549896B1 (en) * 2000-04-07 2003-04-15 Nec Usa, Inc. System and method employing random walks for mining web page associations and usage to optimize user-oriented web page refresh and pre-fetch scheduling
US6718365B1 (en) * 2000-04-13 2004-04-06 International Business Machines Corporation Method, system, and program for ordering search results using an importance weighting
US6859800B1 (en) * 2000-04-26 2005-02-22 Global Information Research And Technologies Llc System for fulfilling an information need
US6741986B2 (en) * 2000-12-08 2004-05-25 Ingenuity Systems, Inc. Method and system for performing information extraction and quality control for a knowledgebase
US6772160B2 (en) * 2000-06-08 2004-08-03 Ingenuity Systems, Inc. Techniques for facilitating information acquisition and storage
DE10029644B4 (de) 2000-06-16 2008-02-07 Deutsche Telekom Ag Verfahren zur Relevanzbewertung bei der Indexierung von Hypertext-Dokumenten mittels Suchmaschine
JP3573688B2 (ja) 2000-06-28 2004-10-06 松下電器産業株式会社 類似文書検索装置及び関連キーワード抽出装置
US6678692B1 (en) * 2000-07-10 2004-01-13 Northrop Grumman Corporation Hierarchy statistical analysis system and method
US6601075B1 (en) * 2000-07-27 2003-07-29 International Business Machines Corporation System and method of ranking and retrieving documents based on authority scores of schemas and documents
US6633868B1 (en) 2000-07-28 2003-10-14 Shermann Loyall Min System and method for context-based document retrieval
US7080073B1 (en) * 2000-08-18 2006-07-18 Firstrain, Inc. Method and apparatus for focused crawling
US20030217052A1 (en) 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
US6959326B1 (en) 2000-08-24 2005-10-25 International Business Machines Corporation Method, system, and program for gathering indexable metadata on content at a data repository
JP3472540B2 (ja) 2000-09-11 2003-12-02 日本電信電話株式会社 サーバ選択装置、サーバ選択方法、及びサーバ選択プログラムを記録した記録媒体
US6598051B1 (en) * 2000-09-19 2003-07-22 Altavista Company Web page connectivity server
US6560600B1 (en) * 2000-10-25 2003-05-06 Alta Vista Company Method and apparatus for ranking Web page search results
US7200606B2 (en) 2000-11-07 2007-04-03 The Regents Of The University Of California Method and system for selecting documents by measuring document quality
US6622140B1 (en) 2000-11-15 2003-09-16 Justsystem Corporation Method and apparatus for analyzing affect and emotion in text
JP2002157271A (ja) * 2000-11-20 2002-05-31 Yozan Inc ブラウザ装置、サーバ装置、記録媒体、検索システムおよび検索方法
US6785688B2 (en) * 2000-11-21 2004-08-31 America Online, Inc. Internet streaming media workflow architecture
US8402068B2 (en) 2000-12-07 2013-03-19 Half.Com, Inc. System and method for collecting, associating, normalizing and presenting product and vendor information on a distributed network
US20020078045A1 (en) * 2000-12-14 2002-06-20 Rabindranath Dutta System, method, and program for ranking search results using user category weighting
US6778997B2 (en) * 2001-01-05 2004-08-17 International Business Machines Corporation XML: finding authoritative pages for mining communities based on page structure criteria
US7356530B2 (en) 2001-01-10 2008-04-08 Looksmart, Ltd. Systems and methods of retrieving relevant information
US6766316B2 (en) * 2001-01-18 2004-07-20 Science Applications International Corporation Method and system of ranking and clustering for document indexing and retrieval
US6417054B1 (en) * 2001-01-26 2002-07-09 Chartered Semiconductor Manufacturing Ltd. Method for fabricating a self aligned S/D CMOS device on insulated layer by forming a trench along the STI and fill with oxide
US20020103798A1 (en) * 2001-02-01 2002-08-01 Abrol Mani S. Adaptive document ranking method based on user behavior
US20020107886A1 (en) * 2001-02-07 2002-08-08 Gentner Donald R. Method and apparatus for automatic document electronic versioning system
US7571177B2 (en) * 2001-02-08 2009-08-04 2028, Inc. Methods and systems for automated semantic knowledge leveraging graph theoretic analysis and the inherent structure of communication
US20040003028A1 (en) * 2002-05-08 2004-01-01 David Emmett Automatic display of web content to smaller display devices: improved summarization and navigation
US7627596B2 (en) * 2001-02-22 2009-12-01 International Business Machines Corporation Retrieving handwritten documents using multiple document recognizers and techniques allowing both typed and handwritten queries
US7269545B2 (en) 2001-03-30 2007-09-11 Nec Laboratories America, Inc. Method for retrieving answers from an information retrieval system
US20020169770A1 (en) 2001-04-27 2002-11-14 Kim Brian Seong-Gon Apparatus and method that categorize a collection of documents into a hierarchy of categories that are defined by the collection of documents
US7188106B2 (en) * 2001-05-01 2007-03-06 International Business Machines Corporation System and method for aggregating ranking results from various sources to improve the results of web searching
US6738764B2 (en) * 2001-05-08 2004-05-18 Verity, Inc. Apparatus and method for adaptively ranking search results
CA2445925C (en) * 2001-05-10 2010-01-05 Changingworlds Limited Intelligent internet website with hierarchical menu
US6782383B2 (en) * 2001-06-18 2004-08-24 Siebel Systems, Inc. System and method to implement a persistent and dismissible search center frame
US7519529B1 (en) * 2001-06-29 2009-04-14 Microsoft Corporation System and methods for inferring informational goals and preferred level of detail of results in response to questions posed to an automated information-retrieval or question-answering service
US7039234B2 (en) * 2001-07-19 2006-05-02 Microsoft Corporation Electronic ink as a software object
US6928425B2 (en) 2001-08-13 2005-08-09 Xerox Corporation System for propagating enrichment between documents
US6868411B2 (en) * 2001-08-13 2005-03-15 Xerox Corporation Fuzzy text categorizer
US7076483B2 (en) * 2001-08-27 2006-07-11 Xyleme Sa Ranking nodes in a graph
US6970863B2 (en) * 2001-09-18 2005-11-29 International Business Machines Corporation Front-end weight factor search criteria
US6766422B2 (en) * 2001-09-27 2004-07-20 Siemens Information And Communication Networks, Inc. Method and system for web caching based on predictive usage
US6944609B2 (en) 2001-10-18 2005-09-13 Lycos, Inc. Search results using editor feedback
US7428695B2 (en) 2001-10-22 2008-09-23 Hewlett-Packard Development Company, L.P. System for automatic generation of arbitrarily indexed hyperlinked text
US6763362B2 (en) * 2001-11-30 2004-07-13 Micron Technology, Inc. Method and system for updating a search engine
US7565367B2 (en) 2002-01-15 2009-07-21 Iac Search & Media, Inc. Enhanced popularity ranking
JP3871201B2 (ja) 2002-01-29 2007-01-24 ソニー株式会社 コンテンツ提供取得システム
US6829606B2 (en) 2002-02-14 2004-12-07 Infoglide Software Corporation Similarity search engine for use with relational databases
JP4021681B2 (ja) 2002-02-22 2007-12-12 日本電信電話株式会社 ページレイティング/フィルタリング方法および装置とページレイティング/フィルタリングプログラムおよび該プログラムを記録したコンピュータ読取り可能な記録媒体
US6934714B2 (en) * 2002-03-04 2005-08-23 Intelesis Engineering, Inc. Method and system for identification and maintenance of families of data records
US7693830B2 (en) * 2005-08-10 2010-04-06 Google Inc. Programmable search engine
US20040006559A1 (en) * 2002-05-29 2004-01-08 Gange David M. System, apparatus, and method for user tunable and selectable searching of a database using a weigthted quantized feature vector
CA2489236C (en) * 2002-06-12 2014-01-14 Jena Jordahl Data storage, retrieval, manipulation and display tools enabling multiple hierarchical points of view
CA2395905A1 (en) 2002-07-26 2004-01-26 Teraxion Inc. Multi-grating tunable chromatic dispersion compensator
US7152059B2 (en) 2002-08-30 2006-12-19 Emergency24, Inc. System and method for predicting additional search results of a computerized database search user based on an initial search query
US7013458B2 (en) 2002-09-09 2006-03-14 Sun Microsystems, Inc. Method and apparatus for associating metadata attributes with program elements
US6886010B2 (en) * 2002-09-30 2005-04-26 The United States Of America As Represented By The Secretary Of The Navy Method for data and text mining and literature-based discovery
US7231379B2 (en) * 2002-11-19 2007-06-12 Noema, Inc. Navigation in a hierarchical structured transaction processing system
US7386527B2 (en) * 2002-12-06 2008-06-10 Kofax, Inc. Effective multi-class support vector machine classification
US7020648B2 (en) 2002-12-14 2006-03-28 International Business Machines Corporation System and method for identifying and utilizing a secondary index to access a database using a management system without an internal catalogue of online metadata
US20040148278A1 (en) 2003-01-22 2004-07-29 Amir Milo System and method for providing content warehouse
US20040181515A1 (en) 2003-03-13 2004-09-16 International Business Machines Corporation Group administration of universal resource identifiers with members identified in search result
US6947930B2 (en) 2003-03-21 2005-09-20 Overture Services, Inc. Systems and methods for interactive search query refinement
US7216123B2 (en) * 2003-03-28 2007-05-08 Board Of Trustees Of The Leland Stanford Junior University Methods for ranking nodes in large directed graphs
US7028029B2 (en) * 2003-03-28 2006-04-11 Google Inc. Adaptive computation of ranking
US7451129B2 (en) 2003-03-31 2008-11-11 Google Inc. System and method for providing preferred language ordering of search results
US7451130B2 (en) 2003-06-16 2008-11-11 Google Inc. System and method for providing preferred country biasing of search results
US7051023B2 (en) 2003-04-04 2006-05-23 Yahoo! Inc. Systems and methods for generating concept units from search queries
US7197497B2 (en) * 2003-04-25 2007-03-27 Overture Services, Inc. Method and apparatus for machine learning a document relevance function
US7228301B2 (en) * 2003-06-27 2007-06-05 Microsoft Corporation Method for normalizing document metadata to improve search results using an alias relationship directory service
US7308643B1 (en) 2003-07-03 2007-12-11 Google Inc. Anchor tag indexing in a web crawler system
US20050060186A1 (en) * 2003-08-28 2005-03-17 Blowers Paul A. Prioritized presentation of medical device events
US7505964B2 (en) 2003-09-12 2009-03-17 Google Inc. Methods and systems for improving a search ranking using related queries
US7454417B2 (en) * 2003-09-12 2008-11-18 Google Inc. Methods and systems for improving a search ranking using population information
US7693827B2 (en) 2003-09-30 2010-04-06 Google Inc. Personalization of placed content ordering in search results
US20050071328A1 (en) * 2003-09-30 2005-03-31 Lawrence Stephen R. Personalization of web search
US7346839B2 (en) * 2003-09-30 2008-03-18 Google Inc. Information retrieval based on historical data
US7552109B2 (en) * 2003-10-15 2009-06-23 International Business Machines Corporation System, method, and service for collaborative focused crawling of documents on a network
US20050086192A1 (en) * 2003-10-16 2005-04-21 Hitach, Ltd. Method and apparatus for improving the integration between a search engine and one or more file servers
US7346208B2 (en) * 2003-10-25 2008-03-18 Hewlett-Packard Development Company, L.P. Image artifact reduction using a neural network
US7231399B1 (en) * 2003-11-14 2007-06-12 Google Inc. Ranking documents based on large data sets
US20060047649A1 (en) * 2003-12-29 2006-03-02 Ping Liang Internet and computer information retrieval and mining with intelligent conceptual filtering, visualization and automation
CN100495392C (zh) * 2003-12-29 2009-06-03 西安迪戈科技有限责任公司 一种智能搜索方法
US7483891B2 (en) * 2004-01-09 2009-01-27 Yahoo, Inc. Content presentation and management system associating base content and relevant additional content
US7392278B2 (en) 2004-01-23 2008-06-24 Microsoft Corporation Building and using subwebs for focused search
US7499913B2 (en) * 2004-01-26 2009-03-03 International Business Machines Corporation Method for handling anchor text
US7310632B2 (en) 2004-02-12 2007-12-18 Microsoft Corporation Decision-theoretic web-crawling and predicting web-page change
US7281002B2 (en) * 2004-03-01 2007-10-09 International Business Machine Corporation Organizing related search results
US7584221B2 (en) 2004-03-18 2009-09-01 Microsoft Corporation Field weighting in text searching
US7343374B2 (en) 2004-03-29 2008-03-11 Yahoo! Inc. Computation of page authority weights using personalized bookmarks
US7580568B1 (en) * 2004-03-31 2009-08-25 Google Inc. Methods and systems for identifying an image as a representative image for an article
US7693825B2 (en) 2004-03-31 2010-04-06 Google Inc. Systems and methods for ranking implicit search results
US20050251499A1 (en) 2004-05-04 2005-11-10 Zezhen Huang Method and system for searching documents using readers valuation
US7257577B2 (en) * 2004-05-07 2007-08-14 International Business Machines Corporation System, method and service for ranking search results using a modular scoring system
US7260573B1 (en) * 2004-05-17 2007-08-21 Google Inc. Personalizing anchor text scores in a search engine
US20050283473A1 (en) 2004-06-17 2005-12-22 Armand Rousso Apparatus, method and system of artificial intelligence for data searching applications
US7716225B1 (en) * 2004-06-17 2010-05-11 Google Inc. Ranking documents based on user behavior and/or feature data
US7428530B2 (en) 2004-07-01 2008-09-23 Microsoft Corporation Dispersing search engine results by using page category information
US7363296B1 (en) * 2004-07-01 2008-04-22 Microsoft Corporation Generating a subindex with relevant attributes to improve querying
US20060036598A1 (en) * 2004-08-09 2006-02-16 Jie Wu Computerized method for ranking linked information items in distributed sources
US7761448B2 (en) * 2004-09-30 2010-07-20 Microsoft Corporation System and method for ranking search results using click distance
US7827181B2 (en) * 2004-09-30 2010-11-02 Microsoft Corporation Click distance determination
US7702599B2 (en) 2004-10-07 2010-04-20 Bernard Widrow System and method for cognitive memory and auto-associative neural network based pattern recognition
CN101601032A (zh) * 2005-01-18 2009-12-09 雅虎公司 结合万维网搜索技术和万维网内容的被赞助搜索条目的匹配和排名
US7689615B2 (en) 2005-02-25 2010-03-30 Microsoft Corporation Ranking results using multiple nested ranking
US20060200460A1 (en) 2005-03-03 2006-09-07 Microsoft Corporation System and method for ranking search results using file types
US7574436B2 (en) 2005-03-10 2009-08-11 Yahoo! Inc. Reranking and increasing the relevance of the results of Internet searches
US20060206460A1 (en) 2005-03-14 2006-09-14 Sanjay Gadkari Biasing search results
US8095487B2 (en) * 2005-03-16 2012-01-10 Yahoo! Inc. System and method for biasing search results based on topic familiarity
EP1866738A4 (en) 2005-03-18 2010-09-15 Search Engine Technologies Llc USER FEEDBACK RESEARCH ENGINE FOR IMPROVING RESEARCH RESULTS
CA2544324A1 (en) * 2005-06-10 2006-12-10 Unicru, Inc. Employee selection via adaptive assessment
US20060282455A1 (en) 2005-06-13 2006-12-14 It Interactive Services Inc. System and method for ranking web content
US7627564B2 (en) 2005-06-21 2009-12-01 Microsoft Corporation High scale adaptive search systems and methods
US7599917B2 (en) 2005-08-15 2009-10-06 Microsoft Corporation Ranking search results using biased click distance
US7716226B2 (en) 2005-09-27 2010-05-11 Patentratings, Llc Method and system for probabilistically quantifying and visualizing relevance between two or more citationally or contextually related data objects
US7689531B1 (en) * 2005-09-28 2010-03-30 Trend Micro Incorporated Automatic charset detection using support vector machines with charset grouping
US20070150473A1 (en) 2005-12-22 2007-06-28 Microsoft Corporation Search By Document Type And Relevance
US7685091B2 (en) * 2006-02-14 2010-03-23 Accenture Global Services Gmbh System and method for online information analysis
US20070260597A1 (en) 2006-05-02 2007-11-08 Mark Cramer Dynamic search engine results employing user behavior
US7720830B2 (en) * 2006-07-31 2010-05-18 Microsoft Corporation Hierarchical conditional random fields for web extraction
US20080140641A1 (en) * 2006-12-07 2008-06-12 Yahoo! Inc. Knowledge and interests based search term ranking for search results validation
US7685084B2 (en) * 2007-02-09 2010-03-23 Yahoo! Inc. Term expansion using associative matching of labeled term pairs
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US20090106221A1 (en) 2007-10-18 2009-04-23 Microsoft Corporation Ranking and Providing Search Results Based In Part On A Number Of Click-Through Features
US7840569B2 (en) 2007-10-18 2010-11-23 Microsoft Corporation Enterprise relevancy ranking using a neural network
US7974974B2 (en) * 2008-03-20 2011-07-05 Microsoft Corporation Techniques to perform relative ranking for search results

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002132769A (ja) * 2000-10-25 2002-05-10 Nippon Telegr & Teleph Corp <Ntt> 多角的検索サービス方法および装置、ならびにそのプログラムを記録した記録媒体
JP2004054588A (ja) * 2002-07-19 2004-02-19 Just Syst Corp 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217764A (ja) * 2006-12-22 2008-09-18 Fujitsu Ltd セッションベースクエリのためのノードのランク付け
JP2011154638A (ja) * 2010-01-28 2011-08-11 Yahoo Japan Corp 検索スコア算出装置
JP2015201184A (ja) * 2014-04-04 2015-11-12 富士通株式会社 インフォーマル学習のための学習教材を収集する方法及び非一時的なコンピュータ可読媒体

Also Published As

Publication number Publication date
CN1755682A (zh) 2006-04-05
JP5369154B2 (ja) 2013-12-18
CN100565509C (zh) 2009-12-02
US8082246B2 (en) 2011-12-20
EP1643385A3 (en) 2006-09-13
EP1643385A2 (en) 2006-04-05
ES2613385T3 (es) 2017-05-24
US7761448B2 (en) 2010-07-20
US20060074903A1 (en) 2006-04-06
JP4950444B2 (ja) 2012-06-13
JP2011258235A (ja) 2011-12-22
EP1643385B1 (en) 2016-11-02
KR101203312B1 (ko) 2012-11-20
US20100268707A1 (en) 2010-10-21
KR20060048716A (ko) 2006-05-18

Similar Documents

Publication Publication Date Title
JP5369154B2 (ja) クリックディスタンスを用いて検索結果をランク付けするシステムおよび方法
US7827181B2 (en) Click distance determination
AU2006279520B2 (en) Ranking functions using a biased click distance of a document on a network
KR101683311B1 (ko) 검색 결과 순위 지정을 위한 정적 관련성 특징으로서 문서 길이를 이용한 정보 제공 방법, 시스템 및 컴퓨터 판독가능 저장 매체
JP4996300B2 (ja) ファイルシステムの検索ランキング方法および関連の検索エンジン
JP4763354B2 (ja) 検索結果のランク付けへのアンカーテキストの組込みシステムおよび方法
JP5174931B2 (ja) ドキュメント利用統計を用いたランキング関数
JP4746712B2 (ja) 履歴重要度のファクタリングによるドキュメントの重要度の計算
JP5147162B2 (ja) オブジェクトの類似性を異種の関係に基づいて判定するための方法およびシステム
US20060200460A1 (en) System and method for ranking search results using file types
JP2009505292A5 (ja)
US20060195439A1 (en) System and method for determining initial relevance of a document with respect to a given category
JP5084796B2 (ja) 関連性判定装置、関連性判定方法およびプログラム
De Virgilio Efficient and effective ranking in top-k exploration for keyword search on RDF
FELIX et al. The Illusion in the Presentation of the Rank of a Web Page with Dangling Links
Zhang et al. PageRank Related Algorithms

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110907

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120306

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120309

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees