JP2007272888A - ファイルシステムの検索ランキング方法および関連の検索エンジン - Google Patents

ファイルシステムの検索ランキング方法および関連の検索エンジン Download PDF

Info

Publication number
JP2007272888A
JP2007272888A JP2007081061A JP2007081061A JP2007272888A JP 2007272888 A JP2007272888 A JP 2007272888A JP 2007081061 A JP2007081061 A JP 2007081061A JP 2007081061 A JP2007081061 A JP 2007081061A JP 2007272888 A JP2007272888 A JP 2007272888A
Authority
JP
Japan
Prior art keywords
file system
file
energy
node
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007081061A
Other languages
English (en)
Other versions
JP4996300B2 (ja
Inventor
Chuu Chen Wei
ウェイ、チュー、チェン
Suu Chon
チョン、スー
Chan Ri
リー、チャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2007272888A publication Critical patent/JP2007272888A/ja
Application granted granted Critical
Publication of JP4996300B2 publication Critical patent/JP4996300B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/156Query results presentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 ファイルシステムに適した検索ランキング方法を提供する。
【解決手段】 本発明の方法は、検索式(クエリ)を受け取ることと、検索式に対する個々のファイル項目の最終適合度スコアを少なくとも部分的に現在のファイルシステム・エネルギーツリー上の個々のノードのエネルギー・スコアに従い計算して、最終適合度スコアに基づき検索結果のリストを出力することと、ユーザがファイルシステムに行う操作に応答してファイルシステム・エネルギーツリーを更新することとを含む。ファイルシステム・エネルギーツリーはファイルシステムのツリー構造に対応するツリー構造をもち、その個々のノードはそれぞれファイルシステムの個々のファイル項目に対応する。ユーザが関心のあるファイルおよびファイル・フォルダは通常、ファイルシステム検索の検索結果リストの相対的に高い位置に配列される。さらに、ファイルへのユーザのクリックが増えるにつれて、検索結果リストはユーザの関心もしくは嗜好の変化に動的に適応できる。
【選択図】図1

Description

本発明は、一般的に特定の情報項目の検索ランキングに関係し、具体的にはファイルシステムの検索ランキング方法、関連の検索エンジンおよびコンピュータ・プログラムに関係する。
コンピュータ技術が絶え間なく発展するにつれて、人々はますます膨大な情報の保管をコンピュータ・システム(コンピュータ・ネットワークを含む)に頼るようになっている。現在広く使われている検索エンジンは、ユーザが役立つ情報を便利にかつ素早く取得するために大量の情報から検索しやすくすることを目的としている。情報検索の分野では、検索エンジンが大成功を収めており、数多くの有用な技術が開発され採用されている。その中でも、検索エンジンの様々な技術改良および最適化は検索ランキングに直接反映されている。
重要な検索ランキング技術は、グーグルの創設者であるセルゲイ・ブリン(Serger Brin)とローレンス・ペイジ(Lawrence Page)が1998年に提案したPageRankアルゴリズム、および同年にJ.クラインベルク(J.Kleinberg)が提案したHITSアルゴリズムなど、ウエブページ間のハイパーリンクを使ってウエブページをランク付けすることである。PageRankの基本原理は、ウエブページ間のリンク関係を利用して、ウエブページの重要性、すなわちウエブページのオーソリティ・スコアを計算することである。PageRankアルゴリズムは次の2つの基本前提に従う。何度も引用されたウエブページは非常に重要性が高いであろうということと、何度も引用されていないが、重要なウエブページに引用されたウエブページも非常に重要性が高いであろうということである。グーグルの検索エンジンはウエブページのPageRankスコアをPageRankアルゴリズムで計算し、それにしたがってウエブページが1セットの検索結果に登場する位置を判定する。ウエブページのPageRankスコアが高いほど、結果におけるこのウエブページの位置が高くなる。PageRankアルゴリズムを適用すれば、従来の検索ランキング方法を改良し、検索結果の精度を高め、ユーザが実際に求めるウエブページを探し出すのにかかる平均時間は大幅に短縮される。
しかし、リンク解析に基づいたこのような検索ランキング方法は、ファイルシステムには適していない。その主な理由は、ファイルシステムでは、ウエブ・リンクと同様の関連付けがファイル間に存在しないからである。加えて、ファイルシステムのデータセットはウエブのデータセットほど大きくないが、ファイルシステムのデータの種類はウエブのデータの種類よりもはるかに多い。
現在、ファイルシステムにおける検索ランキングは主にキーワードによる検索方法で行われている。従来のキーワードによる検索方法の基本原理は、検索エンジンがまずドキュメントのコンテンツを解析し、そのドキュメントのキーワードを抽出し、そのドキュメントで特定のキーワードが出現する頻度と位置、およびドキュメントのセット全体におけるこのキーワードを含むドキュメントの数を合計し、これら情報のインデックスを作成することである。ユーザが検索式(クエリ)を入力した後、検索エンジンはまず検索式要求を解析し、インデックスに各キーワードを含む一致ドキュメントを探し出し、さらに各ドキュメントの検索式に対する最終適合度スコアを計算し、最後に最終適合度スコアの大きさに応じてドキュメントをランク付けし、ランク付けした結果をユーザに返す。このような方法は、ほとんどの場合、ユーザの検索式要求を非常に単純なキーワードで正確に記述できない点が問題で、その検索結果の精度は自然言語の認識技術の限界と最終適合度スコアを計算する方法のために比較的低い。
従来のキーワードによる検索方法に加えて、ファイルシステムの検索ランキングの検索結果に更なる改良を施すために検索ログ解析方法も利用できる。検索語の入力およびクリックの履歴など、検索結果に対するユーザのフィードバックおよび操作に基づいて、検索ログ解析方法はユーザの検索の関心に更なる解析を行い、ユーザの検索特性を追跡して、検索効果を改善できる。
しかし、従来のキーワード検索方法および検索ログ解析方法はどちらも検索ランキングに対するファイルシステムのツリー構造の影響を無視しており、両方法では、ファイル同士の潜在的な関係がランキングに反映されない。
先行技術はユーザに対してファイルシステムの構造的な特徴に適し、ユーザのインタラクションに動的に適応できる検索ランキング手法を提供していないことが分かる。
先行技術の欠点を克服するために、本発明は、ファイルシステムの構造に基づいた、検索ランキング方法、関連の検索エンジン、およびユーザと検索エンジン・システムとのインタラクションを利用したファイルシステムを検索する方法に適応するコンピュータ・プログラムを提供する。
本発明の一側面によると、検索式を受け取ることと、少なくとも部分的に現在のファイルシステム・エネルギーツリー上の個々のノードのエネルギー・スコアに従い、検索式に対する個々のファイル項目の最終適合度スコアを計算して、最終適合度スコアに基づき検索結果のリストを出力することと、ユーザがファイルシステムに行う操作に応答して、ファイルシステム・エネルギーツリーを更新することを含む、ファイルシステムに適した検索ランキング方法であって、ファイルシステム・エネルギーツリーがファイルシステムのツリー構造に対応するツリー構造を有し、その個々のノードがそれぞれファイルシステムの個々のファイル項目に対応する、前記方法を提供する。
本発明の別の側面によると、ファイル検索モジュールと、ファイル・インデックスと、検索結果ランキング・モジュールとを含むファイルシステム検索エンジンを提供し、ファイルシステム検索エンジンは受け取った検索式に従いファイル項目を検索して、検索結果のリストを出力するようになされ、ファイルシステム検索エンジンはさらに、ファイルシステムのツリー構造に対応するツリー構造をもつファイルシステム・エネルギーツリーおよびその個々のノードのエネルギー・スコアを記録するファイルシステム・エネルギーツリー・インデックスで、個々のノードがそれぞれファイルシステムの個々のファイル項目に対応するファイルシステム・エネルギーツリー・インデックスと、ユーザがファイルシステムに行う操作に応答して、ファイルシステム・エネルギーツリー・インデックスに記録されたファイルシステム・エネルギーツリーを更新するエネルギーツリー更新モジュールとを含み、検索結果ランキング・モジュールを使って、少なくとも部分的に現在のファイルシステム・エネルギーツリー・インデックスに記録された個々のノードの各エネルギー・スコアに従い、検索式に対する個々のファイル項目の最終適合度スコアを計算して、最終適合度スコアに従い検索結果のリストにファイル項目をランク付けする。
本発明のさらに別の側面によると、本発明による方法を実施するために使われるコンピュータ・プログラム・コードを内蔵したコンピュータ・プログラムを提供する。
本発明を使って、ユーザがファイルシステムの検索を行うとき、関心のあるファイルおよびファイル・フォルダが通常検索結果のリストの相対的に高い位置に配列される。しかも、ユーザによるファイルのクリックが増えると、エネルギーツリーのエネルギー分布が更新され続けるため、ユーザのインタラクションに応答してユーザの関心もくしは嗜好を常に追跡でき、ユーザの関心または嗜好の変化に動的に適応できるように検索結果のリストを然るべく調整できる。
本発明の他の特徴および利点は、添付の図面に照らしながら本発明の実施例の詳細な説明を読めばさらに明らかになるであろう。
以下、本発明の実施例を添付の図面を参照しながら説明していく。図1は、本発明の一実施例による検索ランキングのプロセスフローを示す。図1に示されるように、ステップS100でプロセスフローが始まる。ステップS102で、ユーザが入力した検索式qが受け取られる。
ステップS104で、検索式qに従いファイル項目の検索が行われる。例えば、採用するファイルシステム検索エンジンがキーワードによる検索エンジンの場合、ファイルシステム検索エンジンは検索式qに基づき、ファイルシステム・インデックスの情報を使って検索式qに対する各ファイル項目dのコンテンツ・スコアs(q,d)を計算できる。一般的に、コンテンツ・スコアs(q,d)は、従来のファイルシステム検索エンジンの検索結果のランキングの基礎の働きをする。
当業者には、以下の説明から、ここでは例としてキーワードによる検索が挙げられているが、本発明の技術的な解決策は特定の先行技術に制限されるものではなく、この検索ステップを実施するためにその例が採用されているに過ぎないことは理解されるであろう。さらに、検索式qに従うファイル項目の検索プロセスは、あらゆる周知のアルゴリズム、プロセスおよびやり方で実施でき、プロセスをどのように実施するのかは本発明では任意に選択される。
ステップS106で、コンテンツ・スコアに基づいて、各ファイルの最終適合度スコアを現在のファイルのエネルギー・スコアに従って計算し、検索結果のリストを出力する。
本発明によると、特定の検索ランキングプロセスを開始する前に(ファイルシステム検索エンジンの初期設定中など)、ファイルシステムの構造に基づいて(ファイルシステムはディレクトリをノンリーフ・ノードとし、ファイルをリーフ・ノードとするツリー構造に対応するであろう)、ファイルシステム検索エンジンはまずファイルシステムのツリーと同じ構造をもつファイルシステム・エネルギーツリーを作成し、その各ノードのスコアが対応するファイルまたはファイル・フォルダのエネルギー・スコアを表し、エネルギー・スコアはそのファイルまたはファイル・フォルダに対するユーザの関心もしくは嗜好を示すパラメータである。この初期設定プロセス中、すべてのノードのエネルギー・スコアは互いに同じであってもよい。
ステップS104で述べたように、ファイルシステム検索エンジンは、各ファイルdに、受け取った検索式qに従うランキング用のコンテンツ・スコアs(q,d)を提供する。現在のファイルシステム・エネルギーツリーおよびランキング用のコンテンツ・スコアで提供される情報に従い、各ファイルの最終適合度スコアs’(q,d)を計算して、最終検索ランキングで使用する。例えば、ファイルdと所与の検索式qの場合、最終適合度スコアs’(q,d)、コンテンツ・スコアs(q,d)、およびエネルギー・スコアE(d)の関係を以下の式で定義できる。
(式1)
s’(q,d)=βs(q,d)+(1−β)E(d)
ここで、βは0と1の間のパラメータであり、最終適合度スコアと最終適合度スコアにおけるエネルギー・スコアの割合との釣り合いをとるために使う。
そのため、このステップで最終適合度スコアに基づいて出力した検索結果のリストは少なくとも部分的には、ファイルシステムを操作しているときのユーザの関心もしくは嗜好を反映する。
ステップS108で、ユーザがファイルシステムに行う操作(問い合わせ、ファイルまたはファイル・フォルダを開く、ファイルまたはファイル・フォルダを挿入する、あるいはファイルまたはファイル・フォルダを削除する等)に応答して、ファイルシステム・エネルギーツリーが更新されるため、ファイルシステム・エネルギーツリーはファイルシステムの現在の構造とある一定の種類のファイルまたはファイル・フォルダに対するユーザの関心もしくは嗜好を動的に反映できる。
ステップS110で、検索が終了したかどうかが判定される。判定結果が「はい」の場合、ステップS112でプロセスが終了する。判定結果が「いいえ」の場合、プロセスはステップS102に戻って、新しい検索式qを受け取って、それ以降のステップに進む。
エネルギー・スコアとは、ファイルシステムを操作しているときのユーザの関心もしくは嗜好を動的に反映するパラメータである。ランキング手法にファイルのエネルギー・スコアを導入することによって、検索結果は少なくとも部分的にはユーザの関心もしくは嗜好に基づいてランク付けされることになり、そのためユーザは所望するファイルまたはファイル・フォルダをより便利にかつ効率的に探し出せる。
以下、どのようにファイルシステム・エネルギーツリーを動的に更新して、ユーザの関心もしくは嗜好を然るべくかつ効果的に反映させるかを例示するために、詳細に説明していく。まず、以下での説明を容易にするために、いくつかの基本用語を定義する。
リーフ・ノードd:前述したように、ファイルシステムにおいてリーフ・ノードとは、html、doc、pdf等などのあらゆる形式のファイルをいう。
ノンリーフ・ノードf:前述したように、ファイルシステムにおいてノンリーフ・ノードとは、ファイル・フォルダをいう(ここでおよびこれ以降、便宜上、各ファイル・フォルダは1つのファイル(複数のファイル)を含むとみなす。実際の実施では、空のファイル・フォルダはリーフ・ノードと同等に扱うことができる)。
ノードn:これはリーフ・ノードとノンリーフ・ノードの両方を含む。
伝達深度depth:これはユーザのインタラクションに応答してプロセス中のエネルギー伝達の範囲を表し、例えば、その範囲でエネルギーが伝達される経路の最大数として表すことができる。
図2は、ファイルシステム検索エネルギーの初期設定中に作成されるファイルシステム・エネルギーツリーの一例を概略的に示す。
図2に示すように、エネルギーツリーのルート・ノードAはノンリーフ・ノードであり、ファイルシステムのルート・ディレクトリAに対応するであろう。ノードAの子ノードはノードB、C、およびDを含み、そのうちリーフ・ノードCがルート・ディレクトリAの下のファイルCに対応し、ノンリーフ・ノードBおよびDがそれぞれルート・ディレクトリAの下のファイル・フォルダBおよびDに対応する。同様に、ノードBと接続するものは、子ノードE、F、Gを含み、そのうちリーフ・ノードEおよびGはそれぞれファイル・フォルダBのファイルEおよびGに対応し、ノンリーフ・ノードFはファイル・フォルダBのファイル・フォルダFに対応する。ノードFと接続するものはリーフ・ノードJおよびKを含み、それぞれファイル・フォルダFのファイルJおよびKに対応する。ノードDと接続するものはリーフ・ノードHおよびIを含み、それぞれファイル・フォルダDのファイルHおよびIに対応する。
図2に示すエネルギーツリーの初期設定中、すべてのノードのエネルギー・スコアは同じスコアに設定してもよい。
図3、図4、および図5は、ユーザがファイルをクリックした後、図2で示すファイルシステム・エネルギーツリーのエネルギー・スコアの更新を概略的に示す。
ひとつのファイル、例えばファイルKをユーザがクリックすると、ユーザは他のファイルよりもファイルKに関心があるとみなすことができよう。このため、図3に示すように、このクリックに応答して、対応するノードKのエネルギー・スコアが加算される。この時点で、ノードKは起点ノードになる。
検索およびランキングの状況では、ユーザがファイルKに関心がある場合、ユーザはこのファイルにだけ関心があることを意味するのではなく、ファイルKに密接な関係があるいくつかのファイルおよびファイル・フォルダにも関心がありうることを示す。ユーザは同じディレクトリの下もしくは同じファイル・フォルダ内に関連ファイルまたはカテゴリーの似たファイルを入れるのが常であるため、ファイルKと密接な関係がある当該ファイルは、ファイル・フォルダF(ツリー構造で親ノード)およびファイルKと同じファイル・フォルダF内のファイルJ(ツリー構造で兄弟ノード)を含みうる。このように、加えられたエネルギーのすべてがノードKに静的にとどまっているわけではない。
本発明の一実施例によると、エネルギーは、ファイルシステム・エネルギーツリーの構造に従いノードKと接続するリンクを介して伝達する。図4に示すように、ノードK自体のエネルギーの一部がノードFに伝達する。このため、図5に示すように、ノードFはそれ自身のエネルギーをノードFと接続するリンクを介して、その子ノードJおよびその親ノードBに一部伝達する。残りは類推によって推定できるであろう。エネルギーはファイルシステム・エネルギーツリー内で伝達する。
このエネルギー伝達アルゴリズムの効率を改善するために、エネルギーがノードに追加されたときのエネルギー伝達深度depth、すなわちエネルギーが伝達する経路の最大数を本発明の実施で指定できる。図5に示す例では、伝達深度depthが2に等しいと指定される。エネルギーはノードKすなわち起点ノードの祖父ノードとして機能するノードBに伝達し、ノードBとノードKの間の経路または距離は2である。伝達深度depthが2に等しいと指定されるため、ノードBはその親ノードAまたはその子ノードE、Gにエネルギーを伝達しない。当然、当業者には、伝達深度は特定のファイルシステムおよび検索ランキングの必要条件に基づいて選択でき、そのため伝達深度は本発明の制限要因とならないこと、またエネルギー伝達はエネルギー伝達深度を他の制限条件と組み合わせることによってさらに細かく定義できることは理解されるであろう。例えば、伝達深度depthが3に等しく、かつエネルギーは最も遠くて起点ノードの祖父ノードにしか伝達されないと指定できる。このような複合条件では、ノードBはそのエネルギーをその子ノードEおよびGに伝達できるが、そのエネルギーをその親ノードAには伝達しない。そのため、エネルギー伝達の制限条件は非常に柔軟に設定できる。
本発明による検索ランキング方法では、各ノードのエネルギー・スコアを少なくとも部分的にはノードに対応するファイルの最終適合度スコアとして採用することから、より優れたランキング効果を生むことができる。例えば、図5では、ノードKはノードBよりエネルギーが大きいため、この2つのノードが検索式qに対してそれぞれ同じスコアの場合、ノードKの最終適合度スコアがノードBのそれよりも高くなる。さらに、ファイルKは、リストの位置がはるかに高いなど、検索結果のリストのランキング位置が高くなる。このように、ユーザが関心があるファイルおよびファイル・フォルダは通常検索結果のリストで相対的に高い位置に配列されるため、ユーザが検索しやすくなる。さらに、ユーザからのファイルのクリックが増えると、クリックされた起点ノードとその隣接ノードにエネルギーが追加されるので、エネルギーツリーのエネルギー分布は継続的に更新される。そのため、ファイルシステム・エネルギーツリーに基づいた検索ランキングのプロセスはユーザの関心もしくは嗜好を常に追跡して、検索結果のリストを然るべく調整できるため、ユーザの関心もしくは嗜好の変化に動的に適応できる。
図6は、本発明の一実施例による、ユーザのクリックに応答してファイルシステム・エネルギーツリーを更新するフローを示す。図6に示すように、ステップS400でプロセスのフローが始まる。ステップS402で、ファイルdをユーザがクリックする。
ステップS404で、ファイルdに対応するノードdが事前に初期設定されているセットCに入れられ、セットCは現在のエネルギー・スコアが更新されることになるノードを入れるために使う。ステップS406で、現在の深度が0に初期設定される。
ステップS408で、セットC内の各ノードn(n∈C)の新しいエネルギー・スコアが計算され、各ノードnの新しいエネルギー・スコアE’(n)は以下の式を満たす。
(式2)
E’(n)=E(n)+pdist(n,d)
ここで、E(n)はノードnの原始エネルギー・スコアであり、pは0から1までの範囲の値のエネルギー伝達率であり、dist(n,d)はファイルシステム・エネルギーツリーの構造でツリーの経路に沿ったノードnからノードdまでの距離を表す。例えば、ユーザがクリックしたファイルのエネルギー・スコアは1増加する。ノードからその親ノードまでの距離は1であるから、その親ノードのエネルギーはpの分だけ増える。またノードからその祖父ノードおよびその兄弟ノードまでの距離は2であるから、その祖父ノードとその兄弟ノードのエネルギー・スコアはそれぞれpの分だけ増える。
ステップS410で、現在の深度は1増える。ステップS412で、現在の深度が伝達深度depth以下であるかどうかを判定する。ステップS412の判定結果が「はい」の場合、プロセスはステップS414に進む。
ステップS414で、現在のセットC内のすべての要素ノードの隣接ノードが取得され、セットC内の現在のノードが消去された後、新しく取得したすべてのノードがセットCに挿入される。あるノードの隣接ノードとは、その親ノードおよびその子ノードを含め(もしあれば)、そのノードと直接接続するノードのことをいう。
ステップS414の後、プロセスはステップS408に戻ってプロセスを続ける。ステップS412の判定結果が「いいえ」の場合、プロセスはステップS416で終了する。
当業者であればエネルギー伝達率pおよび伝達深度に異なる値を選択することができ、あるいは特定のファイルシステムおよび検索条件の特徴に適応するように他のエネルギー伝達式を設計することもできることに留意するべきである。例えば、伝達深度depthは指定しなくてもよく、またエネルギー伝達の距離をエネルギー伝達値pdist(n,d)の大きさだけで制限することができる。すなわち、エネルギー伝達閾値を予め定義できる。各関連ノードに関して、そのエネルギー伝達値pdist(n,d)が前記閾値より大きい場合、そのエネルギーをその隣接ノードに伝達し続ける。そのエネルギー伝達値pdist(n,d)が前記閾値以下の場合、その隣接ノードへのそのエネルギーの伝達が停止する。
図7は、ユーザが新しいファイルを作成したときに、図5に示すファイルシステム・エネルギーツリーのエネルギー・スコアの更新を概略的に示す。ユーザはファイル・フォルダFにノードFの子ノードMに対応する新しいファイルMを作成する。対応するエネルギー・スコアはノードMに直接割り当て得る。例えば、ノードMはエネルギー・スコアがその親ノードFと同じになるように割り当て得る。
ユーザがファイルまたはファイル・フォルダを削除した場合、対応するノードは他のノードのエネルギー・スコアを調整しなくてもファイルシステム・エネルギーツリーからただ削除され得る。
同様に、ユーザがファイルまたはファイル・フォルダを移動する操作の場合、それは作成プロセスと削除プロセスに分解され得る。
当業者には、検索ランキングのパフォーマンスを最適にするために、ユーザの特定の操作に応答してファイルシステム・エネルギーツリーのエネルギー・スコアを更新するルールを望むとおりに設計できることは理解されるであろう。そのため、特定の実施方法は本発明の制限要因とはならない。
図8は、本発明の一実施例によるファイルシステム検索エンジンの概略ブロック図を示す。この図では、参照番号600はファイルシステム検索エンジンを示す。参照番号614はファイル検索モジュールを示す。参照番号610はファイル検索モジュール614をサポートするために使うファイル・インデックスを示す。参照番号602はファイルシステム検索エンジン内の検索結果ランキング・モジュールを示す。参照番号604はファイルのクリック操作および開く操作を記録する履歴記録モジュールを示す。参照番号606はファイルシステム・エネルギーツリーを更新するエネルギーツリー更新モジュールを示す。参照番号608はファイルの作成、削除および移動など、ファイルシステムの変更をモニタするファイルシステム・モニタリング・モジュールを示す。参照番号612はファイルシステム・エネルギーツリーの構造と各ノードのエネルギー・スコアを記録するファイルシステム・エネルギーツリー・インデックスを示す。
図8に示すように、ファイルシステム・エネルギーツリー・インデックス612は、ファイルシステムに作成されたエネルギーツリー構造と各ノードのエネルギー・スコアを記録する。検索式qを受け取ると、ファイルシステム検索エンジン600のファイル検索モジュール614がファイル・インデックス610に基づいて関連ファイルを探し、各ファイルにランキング用のコンテンツ・スコアを提供する。ファイル検索モジュール614が提供するコンテンツ・スコアおよびファイルシステム・エネルギーツリー・インデックス612が提供する各ノードのエネルギー・スコアに従い、検索結果ランキング・モジュール602が各ファイルの最終適合度スコアを計算して、最終検索ランキングで使用する。履歴記録モジュール604がユーザによるファイルのクリックを記録して、記録した情報をエネルギーツリー更新モジュール606に提供する。履歴記録モジュール604が提供する情報に基づき、エネルギーツリー更新モジュール606は、例えば前述のエネルギー伝達方法を使ってエネルギーツリーで更新する必要のあるノードのエネルギー・スコアを計算し、結果をファイルシステム・エネルギーツリー・インデックス612に提供して、ファイルシステム・エネルギーツリーの情報を更新する。ファイルシステム・モニタリング・モジュール608は、ファイルまたはファイル・フォルダの作成、削除、および移動など、ファイルシステムに対するユーザの操作をモニタして、記録した情報をエネルギーツリー更新モジュール606に提供する。同様に、例えば上記所定のルールに従い、エネルギーツリー更新モジュール606は、エネルギーツリーのツリー構造および対応するノードのエネルギー・スコアに関する情報など、ファイルシステム・エネルギーツリー・インデックス612に記録される情報を更新する。
本発明によるファイルシステム検索エンジン600に適するファイル検索モジュール614とそれに対応するファイル・インデックス610は、どんな種類でもよいことに留意するべきである。例えば、ファイル検索モジュール614はキーワード、ヘッダー、日付、およびその種の他のものにしたがってファイルの重要性のスコアをつけることができ、ファイル・インデックス610は、インデックスとしてキーワードを使う一元化されたインデックス構造、または複数の分散インデックス構造のいずれでもよい。すなわち、どのように特定のファイル・インデックスを構成するか、およびファイル検索モジュールでどのようにファイル検索を行うかは本発明の制限要因とはならない。そのため、本発明によるファイルシステム検索エンジンはファイルシステム内のファイル・フォルダをファイル項目として扱い、それを出力用の検索結果のリストのファイルと一緒にランク付けすることもできる。当業者には、検索結果ランキング・モジュールがファイルで処理を行うのと同様に各ファイル・フォルダで処理を行う、すなわち、各ファイル・フォルダの現在のエネルギー・スコアに関連する最終適合度スコアを計算して検索ランキングを行うことは理解されるであろう。
図8は本発明のファイルシステム検索エンジンを実施することができる一例を示しているにすぎない。当業者には、特に各モジュールの機能をソフトウェアと合わせて実施すれば、モジュールの具体的な実施形態に様々な手法が利用できることは理解されるであろう。例えば、図示する履歴記録モジュール604とファイルシステム・モニタリング・モジュール608を同じモジュールに統合してもよく、または直接エネルギーツリー更新モジュール606に統合することもできる。
図9は、本発明の実施例を実施できるコンピュータ・システムを概略的に示す。図9に示すコンピュータ・システムは、中央処理装置(CPU)701と、ランダム・アクセス・メモリ(RAM)702と、読取専用メモリ(ROM)703と、システム・バス704と、ハードディスク(HD)コントローラ705と、キーボード・コントローラ706と、シリアル・インターフェース・コントローラ707と、パラレル・インターフェース・コントローラ708と、ディスプレイ・コントローラ709と、ハードディスク710と、キーボード711と、シリアル外部デバイス712と、パラレル外部デバイス713と、ディスプレイ714とを有する。これらコンポーネントの中で、CPU701、RAM702、ROM703、HDコントローラ705、キーボード・コントローラ706、シリアル・インターフェース・コントローラ707、パラレル・インターフェース・コントローラ708、およびディスプレイ・コントローラ709はシステム・バス704と接続する。ハードディスク710はHDコントローラ705と接続し、キーボード711はキーボード・コントローラ706と接続し、シリアル外部デバイス712はシリアル・インターフェース・コントローラ707と接続し、パラレル外部デバイス713はパラレル・インターフェース・コントローラ708と接続し、ディスプレイ714はディスプレイ・コントローラ709と接続する。
図9に示す各コンポーネントの機能は当技術分野で十分に周知であり、図示する構造も従来のものである。このような構造はパーソナル・コンピュータに適用できるだけでなく、パームPC、携帯情報端末(PDA)、および携帯電話等などの携帯機器にも適用できる。別のアプリケーションでは、図9の一部のコンポーネントを省くことができる。図9に示すシステム全体は、ハードディスク710、EPROM、またはその他不揮発性メモリに通常ソフトウェアとして格納されるコンピュータ読み取り可能命令によって制御される。ソフトウェアはネットワーク(図では図示せず)からダウンロードすることもできる。ハードディスク710に格納される、またはネットワークからダウンロードされるソフトウェアはRAM702にロードでき、CPU701がソフトウェアで決まる機能を履行するようにソフトウェアを実行できる。
図9に示すコンピュータ・システムは本発明によるファイルシステムの検索ランキングをサポートできるが、上記コンピュータ・システムはコンピュータ・システムの単なる一例にすぎない。当業者には、コンピュータ・システムに合った他の多くの設計も本発明の実施例を実施できることは理解されるであろう。
本発明は、例えば図9に示すコンピュータ・システムで使用するコンピュータ・プログラムとして実施することもでき、これは本発明によるファイルシステムに検索ランキング方法を実施するコードを内蔵する。コードは使用前に他のコンピュータ・システムのメモリに格納してもよい。例えば、コードはハードディスク、光ディスク、またはフロッピー(登録商標)などの取り外し可能なメモリに格納することができる。代わりの方法として、コードはインターネットまたは他のコンピュータ・ネットワークからダウンロードしてもよい。
本発明の実施例を添付の図面を参照しながら説明してきたが、当業者は添付の請求項で定義される範囲内で様々な変更もしくは改変を行うことができる。
本発明の一実施例による検索ランキングのプロセスフローを示す図である。 ファイルシステム検索エンジンの初期設定中に作成されるファイルシステム・エネルギーツリーの一例を概略的に示す図である。 ユーザがファイルをクリックした後、図2に示すファイルシステム・エネルギーツリーのエネルギー・スコアの更新を概略的に示す図である。 ユーザがファイルをクリックした後、図2に示すファイルシステム・エネルギーツリーのエネルギー・スコアの更新を概略的に示す図である。 ユーザがファイルをクリックした後、図2に示すファイルシステム・エネルギーツリーのエネルギー・スコアの更新を概略的に示す図である。 本発明の一実施例による、ユーザのクリックに応答してファイルシステム・エネルギーツリーを更新するフローを示す図である。 ユーザが新しいファイルを作成したときに、図5に示すファイルシステム・エネルギーツリーのエネルギー・スコアの更新を概略的に示す図である。 本発明の一実施例によるファイルシステム検索エンジンの概略ブロック図である。 本発明の実施例を実装できるコンピュータ・システムを概略的に示す図である。

Claims (12)

  1. ファイルシステムに適した検索ランキング方法であって、
    検索式を受け取ることと、
    前記検索式に対する個々のファイル項目の最終適合度スコアを少なくとも部分的に現在のファイルシステム・エネルギーツリー上の個々のノードのエネルギー・スコアに従い計算して、前記最終適合度スコアに基づき検索結果のリストを出力することと、
    ユーザがファイルシステムに行う操作に応答して、前記ファイルシステム・エネルギーツリーを更新することとを含み、
    前記ファイルシステム・エネルギーツリーが前記ファイルシステムのツリー構造に対応するツリー構造を有し、前記個々のノードがそれぞれ前記ファイルシステムの個々のファイル項目に対応する、前記方法。
  2. ユーザがファイル項目に行うクリックに応答して、前記ファイルシステム・エネルギーツリー上の前記ファイル項目に対応するノードのエネルギー・スコアを増加し、
    前記ノードの増加したエネルギー・スコアを少なくとも部分的に、前記ファイルシステム・エネルギーツリーの経路に沿って他の関連ノードに伝達する、請求項1に記載の方法。
  3. 前記ノードの増加したエネルギー・スコアを少なくとも部分的に、所定の伝達深度内のノードに伝達し、
    E’(n)=E(n)+pdist(n,d)
    ここで、dは前記クリックされたファイル項目に対応するノードを表し、nは前記所定の伝達深度内のあらゆるノードを表し、E(n)はノードnの原始エネルギー・スコアを表し、E’(n)はノードnの更新されたエネルギー・スコアを表し、pは0から1の範囲の値のエネルギー伝達率を表し、dist(n,d)は前記ファイルシステム・エネルギーツリーの構造上のツリー経路に沿ったノードnからノードdまでの距離を表し、dist(n,d)が所定の伝達深度以下である、前記式を満たす、請求項2に記載の方法。
  4. ユーザがファイル項目を作成するために行う操作に応答して、対応するノードが前記ファイルシステム・エネルギーツリーに作成され、前記作成されたノードがその親ノードのエネルギー・スコアと等しいエネルギー・スコアをもつように割り当てられる、請求項1に記載の方法。
  5. ユーザがファイル項目を削除するために行う操作に応答して、対応するノードが前記ファイルシステム・エネルギーツリーから削除される、請求項1に記載の方法。
  6. ユーザがファイル項目を第1位置から第2位置に移動するために行う操作に応答して、対応するノードを前記ファイルシステム・エネルギーツリーの第1位置から削除し、対応するノードを前記ファイルシステム・エネルギーツリーの第2位置に作成し、作成されたノードをその現在の親ノードのエネルギー・スコアと等しいエネルギー・スコアをもつように割り当てる、請求項1に記載の方法。
  7. 前記ファイルシステム・エネルギーツリーを、個々のノードが等しいエネルギー・スコアをもつように初期設定する、請求項1に記載の方法。
  8. 前記ファイル項目がファイルとファイル・フォルダを含む、請求項1から7のいずれかに記載の方法。
  9. ファイル検索モジュールと、ファイル・インデックスと、検索結果ランキング・モジュールとを含み、前記ファイル検索モジュールで受け取った検索式に従ってファイル項目を探し、検索結果のリストを前記検索結果ランキング・モジュールより出力するファイルシステム検索エンジンであって、
    ファイルシステムのツリー構造に対応するツリー構造をもつファイルシステム・エネルギーツリーおよびその個々のノードのエネルギー・スコアを記録するファイルシステム・エネルギーツリー・インデックスで、前記個々のノードがそれぞれ前記ファイルシステム内の個々のファイル項目に対応する、前記ファイルシステム・エネルギーツリー・インデックスと、
    ユーザが前記ファイルシステムに行う操作に応答して、前記ファイルシステム・エネルギーツリー・インデックスに記録される前記ファイルシステム・エネルギーツリーを更新するエネルギーツリー更新モジュールとをさらに含み、
    前記検索結果ランキング・モジュールを使って、少なくとも部分的に現在の前記ファイルシステム・エネルギーツリー・インデックスに記録される個々のノードの各エネルギー・スコアに従い前記検索式に対する個々のファイル項目の最終適合度スコアを計算して、前記最終適合度スコアに従い前記検索結果のリストの前記ファイル項目をランク付けする、前記ファイルシステム検索エンジン。
  10. ユーザがファイル項目に行うクリックを取得して、対応する情報を前記エネルギーツリー更新モジュールに提供する履歴記録モジュールをさらに含む、請求項9に記載のファイルシステム検索エンジン。
  11. ユーザがファイルシステムのファイル項目を作成、削除、および移動するために行う操作をモニタリングして、対応する情報を前記エネルギーツリー更新モジュールに提供するファイルシステム・モニタリング・モジュールをさらに含む、請求項9に記載のファイルシステム検索エンジン。
  12. ファイルシステムに適した検索ランキング用プログラムであって、 コンピュータに、
    検索式を受け取るステップと、
    ファイルシステムのツリー構造に対応するツリー構造を有し、個々のノードがそれぞれ前記ファイルシステムの個々のファイル項目に対応するファイルシステム・エネルギーツリーにより、前記検索式に対する個々の前記ファイル項目の最終適合度スコアを少なくとも部分的に現在の前記ファイルシステム・エネルギーツリー上の個々の前記ノードのエネルギー・スコアに従い計算して、前記最終適合度スコアに基づき検索結果のリストを出力するステップと、
    ユーザがファイルシステムに行う操作に対応して、前記ファイルシステム・エネルギーツリーを更新するステップと、
    を実行させるための前記プログラム。
JP2007081061A 2006-03-30 2007-03-27 ファイルシステムの検索ランキング方法および関連の検索エンジン Active JP4996300B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN200610066298.1 2006-03-30
CNB2006100662981A CN100495398C (zh) 2006-03-30 2006-03-30 文件系统中搜索排序的方法及相关搜索引擎

Publications (2)

Publication Number Publication Date
JP2007272888A true JP2007272888A (ja) 2007-10-18
JP4996300B2 JP4996300B2 (ja) 2012-08-08

Family

ID=38675578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007081061A Active JP4996300B2 (ja) 2006-03-30 2007-03-27 ファイルシステムの検索ランキング方法および関連の検索エンジン

Country Status (4)

Country Link
US (1) US7644069B2 (ja)
JP (1) JP4996300B2 (ja)
KR (1) KR100962925B1 (ja)
CN (1) CN100495398C (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013503391A (ja) * 2009-08-27 2013-01-31 アリババ グループ ホールディング リミテッド 電子商取引ウェブサイトでの情報マッチングの方法及びシステム
JP2014044552A (ja) * 2012-08-27 2014-03-13 Fujitsu Ltd 評価方法、情報処理装置およびプログラム

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7801885B1 (en) * 2007-01-25 2010-09-21 Neal Akash Verma Search engine system and method with user feedback on search results
US7783630B1 (en) * 2007-06-29 2010-08-24 Emc Corporation Tuning of relevancy ranking for federated search
US7783620B1 (en) * 2007-06-29 2010-08-24 Emc Corporation Relevancy scoring using query structure and data structure for federated search
US8522289B2 (en) 2007-09-28 2013-08-27 Yahoo! Inc. Distributed automatic recording of live event
US8250616B2 (en) * 2007-09-28 2012-08-21 Yahoo! Inc. Distributed live multimedia capture, feedback mechanism, and network
US20090089352A1 (en) * 2007-09-28 2009-04-02 Yahoo!, Inc. Distributed live multimedia switching mechanism and network
CN101169797B (zh) * 2007-11-30 2010-04-07 朱廷劭 一种用于搜索的方法
CN101520785B (zh) * 2008-02-29 2012-09-05 富士通株式会社 信息检索方法和系统
US7970760B2 (en) * 2008-03-11 2011-06-28 Yahoo! Inc. System and method for automatic detection of needy queries
US8239370B2 (en) * 2008-06-27 2012-08-07 Microsoft Corporation Basing search results on metadata of prior results
US8478748B2 (en) * 2008-09-24 2013-07-02 Microsoft Corporation Directly optimizing evaluation measures in learning to rank
US9275164B2 (en) * 2008-12-10 2016-03-01 Google Inc. Grouping and presenting search query results
CN101464897A (zh) * 2009-01-12 2009-06-24 阿里巴巴集团控股有限公司 一种词匹配及信息查询方法及装置
CN102023991A (zh) * 2009-09-21 2011-04-20 中兴通讯股份有限公司 在终端上更新索引并基于其对搜索结果排序的方法及装置
US8886650B2 (en) * 2009-11-25 2014-11-11 Yahoo! Inc. Algorithmically choosing when to use branded content versus aggregated content
US8706701B1 (en) * 2010-11-18 2014-04-22 Emc Corporation Scalable cloud file system with efficient integrity checks
CN102567408B (zh) 2010-12-31 2014-06-04 阿里巴巴集团控股有限公司 推荐搜索关键词的方法和装置
EP2472418A1 (en) * 2011-01-04 2012-07-04 Axel Springer Digital TV Guide GmbH Apparatus and method for managing a personal channel
CN102193999A (zh) * 2011-05-09 2011-09-21 北京百度网讯科技有限公司 一种对搜索结果进行排序的方法及设备
KR101259608B1 (ko) * 2011-05-25 2013-04-30 김경서 순위 정보를 디스플레이하는 방법
EP2721566A1 (en) * 2011-06-20 2014-04-23 Giulio Galliani Promotion via social currency
EP2774053A4 (en) * 2011-09-09 2015-11-18 Google Inc USER INTERFACE FOR A TRANSLATION WEB PAGE
US8843477B1 (en) * 2011-10-31 2014-09-23 Google Inc. Onsite and offsite search ranking results
US9311650B2 (en) 2012-02-22 2016-04-12 Alibaba Group Holding Limited Determining search result rankings based on trust level values associated with sellers
JP2015518210A (ja) * 2012-04-11 2015-06-25 シンガポール国立大学National University Of Singapore 製品に関連するデータを体系化する方法、装置及びコンピュータ読み取り可能な媒体
US11487707B2 (en) * 2012-04-30 2022-11-01 International Business Machines Corporation Efficient file path indexing for a content repository
US9582588B2 (en) 2012-06-07 2017-02-28 Google Inc. Methods and systems for providing custom crawl-time metadata
GB2503486A (en) * 2012-06-28 2014-01-01 Ibm Managing changes to files
US9189518B2 (en) * 2012-10-19 2015-11-17 International Business Machines Corporation Gathering index statistics using sampling
US8914356B2 (en) 2012-11-01 2014-12-16 International Business Machines Corporation Optimized queries for file path indexing in a content repository
US9323761B2 (en) 2012-12-07 2016-04-26 International Business Machines Corporation Optimized query ordering for file path indexing in a content repository
US10372794B1 (en) * 2013-08-08 2019-08-06 Teal Rainsky Rogers Three-dimensional network mapping system and method
US10795943B1 (en) * 2013-08-08 2020-10-06 Teal Rainsky Rogers Three-dimensional network mapping system and method
KR102247885B1 (ko) * 2014-05-27 2021-05-04 에스케이플래닛 주식회사 다중 정렬 색인을 이용한 아이템 정렬 장치 및 방법
KR102247890B1 (ko) * 2014-05-27 2021-05-04 에스케이플래닛 주식회사 최장 증가 부분수열을 이용한 아이템 정렬 장치 및 방법
CN104008170B (zh) * 2014-05-30 2017-03-29 广州金山网络科技有限公司 搜索结果的提供方法和装置
CN104636464B (zh) * 2015-02-09 2019-02-01 腾讯科技(深圳)有限公司 访问文件的方法和装置
US9959866B2 (en) * 2015-04-02 2018-05-01 Panasonic Intellectual Property Management Co., Ltd. Computer-implemented method for generating a response sentence by using a weight value of node
CN106557499A (zh) * 2015-09-25 2017-04-05 中兴通讯股份有限公司 HBase二级索引创建方法和装置
RU2632135C2 (ru) 2015-11-11 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Система и способ уточнения результатов поиска
CN106383860A (zh) * 2016-08-31 2017-02-08 无锡雅座在线科技发展有限公司 数据查询方法及装置
CN107145588A (zh) * 2017-05-11 2017-09-08 上海颐学网络科技有限公司 一种文件夹树形图自动创建方法和系统
CN109582698B (zh) * 2017-09-29 2021-08-13 上海宽带技术及应用工程研究中心 多个连续top-k关键词查询结果更新方法、系统、存储介质及终端
CN109710575B (zh) * 2018-12-03 2021-04-13 Oppo广东移动通信有限公司 文件夹管理方法、装置、计算机存储介质及终端设备
CN109657497B (zh) * 2018-12-21 2023-06-13 北京思源理想控股集团有限公司 安全文件系统及其方法
CN110096636A (zh) * 2019-05-08 2019-08-06 上海泰豪迈能能源科技有限公司 搜索引擎优化方法、装置和电子设备
CN111400260A (zh) * 2020-04-22 2020-07-10 Oppo广东移动通信有限公司 文件显示方法、显示装置、终端设备及可读存储介质
CN112632378B (zh) * 2020-12-21 2021-08-24 广东省信息网络有限公司 基于大数据和人工智能的信息处理方法及数据服务器
CN113742292B (zh) * 2021-09-07 2023-11-10 六棱镜(杭州)科技有限公司 基于ai技术的多线程数据检索及所检索数据的访问方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63225857A (ja) * 1987-03-14 1988-09-20 Fujitsu Ltd 類似文字列検索装置
JP2002259446A (ja) * 2000-12-21 2002-09-13 Xerox Corp 推定関心度に基づいてノード・リンク構造体をブラウジングするためのシステムおよび方法
JP2003016112A (ja) * 2001-07-03 2003-01-17 Nec Corp 情報検索システム及び情報検索方法並びに情報検索プログラム
JP2006031194A (ja) * 2004-07-13 2006-02-02 Internatl Business Mach Corp <Ibm> 検索システム、検索方法、報告システム、報告方法、及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6460036B1 (en) * 1994-11-29 2002-10-01 Pinpoint Incorporated System and method for providing customized electronic newspapers and target advertisements
JP2000207422A (ja) 1999-01-13 2000-07-28 Fujitsu Ltd 概念シソ―ラスを用いた文書の検索及び格付けシステム並びに方法
US6327590B1 (en) * 1999-05-05 2001-12-04 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis
US7281005B2 (en) * 2003-10-20 2007-10-09 Telenor Asa Backward and forward non-normalized link weight analysis method, system, and computer program product

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63225857A (ja) * 1987-03-14 1988-09-20 Fujitsu Ltd 類似文字列検索装置
JP2002259446A (ja) * 2000-12-21 2002-09-13 Xerox Corp 推定関心度に基づいてノード・リンク構造体をブラウジングするためのシステムおよび方法
JP2003016112A (ja) * 2001-07-03 2003-01-17 Nec Corp 情報検索システム及び情報検索方法並びに情報検索プログラム
JP2006031194A (ja) * 2004-07-13 2006-02-02 Internatl Business Mach Corp <Ibm> 検索システム、検索方法、報告システム、報告方法、及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013503391A (ja) * 2009-08-27 2013-01-31 アリババ グループ ホールディング リミテッド 電子商取引ウェブサイトでの情報マッチングの方法及びシステム
US8762391B2 (en) 2009-08-27 2014-06-24 Alibaba Group Holding Limited Method and system of information matching in electronic commerce website
JP2014044552A (ja) * 2012-08-27 2014-03-13 Fujitsu Ltd 評価方法、情報処理装置およびプログラム

Also Published As

Publication number Publication date
KR20070098505A (ko) 2007-10-05
US20070276807A1 (en) 2007-11-29
CN100495398C (zh) 2009-06-03
US7644069B2 (en) 2010-01-05
JP4996300B2 (ja) 2012-08-08
KR100962925B1 (ko) 2010-06-09
CN101046804A (zh) 2007-10-03

Similar Documents

Publication Publication Date Title
JP4996300B2 (ja) ファイルシステムの検索ランキング方法および関連の検索エンジン
JP4950444B2 (ja) クリックディスタンスを用いて検索結果をランク付けするシステムおよび方法
EP1934823B1 (en) Click distance determination
KR101683311B1 (ko) 검색 결과 순위 지정을 위한 정적 관련성 특징으로서 문서 길이를 이용한 정보 제공 방법, 시스템 및 컴퓨터 판독가능 저장 매체
JP5174931B2 (ja) ドキュメント利用統計を用いたランキング関数
US8244737B2 (en) Ranking documents based on a series of document graphs
CN101828185B (zh) 部分地基于多个点进特征来排名并提供搜索结果
US7917503B2 (en) Specifying relevance ranking preferences utilizing search scopes
KR20060049708A (ko) 앵커 텍스트를 랭킹 검색 결과에 통합하는 시스템 및 방법
US8949254B1 (en) Enhancing the content and structure of a corpus of content
Kaur et al. IHWC: intelligent hidden web crawler for harvesting data in urban domains
Yan et al. Research on PageRank and hyperlink-induced topic search in web structure mining
US7490082B2 (en) System and method for searching internet domains
Inkpen Information retrieval on the internet
JP5525424B2 (ja) 文書検索装置、文書検索方法及び文書検索プログラム
US7984041B1 (en) Domain specific local search
Vijayarani et al. Web crawling algorithms–a comparative study
Huang et al. Location-aware query reformulation for search engines
Wang et al. Web search services
Suganya Web Crawling Algorithms–A Comparative Study
Lu et al. The Research on Improving Algorithms for Hilltop to Improve Search Quality
Ceri et al. Search Engines

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091225

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120329

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120417

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120511

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150518

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4996300

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250