JP2007188509A - 検索結果提供方法および2段階検索システム実施方法 - Google Patents

検索結果提供方法および2段階検索システム実施方法 Download PDF

Info

Publication number
JP2007188509A
JP2007188509A JP2007004550A JP2007004550A JP2007188509A JP 2007188509 A JP2007188509 A JP 2007188509A JP 2007004550 A JP2007004550 A JP 2007004550A JP 2007004550 A JP2007004550 A JP 2007004550A JP 2007188509 A JP2007188509 A JP 2007188509A
Authority
JP
Japan
Prior art keywords
search
sub
collection
user
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007004550A
Other languages
English (en)
Inventor
Markanthony Joseph
マーカンソニー ジョセフ
Karsten Colin
カースティン コリン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Raytheon Technologies Corp
Original Assignee
United Technologies Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by United Technologies Corp filed Critical United Technologies Corp
Publication of JP2007188509A publication Critical patent/JP2007188509A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24524Access plan code generation and invalidation; Reuse of access plans

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 検索結果を最適化する改良型の検索システムを提供すること。
【解決手段】 コンピュータシステムまたはネットワーク内に保存された電子コンテンツの2段階検索を行う方法10が、第1の段階で、ユーザによって入力(ステップ12)された検索語内のパターンを認識することによって実施される(ステップ14)。検索語中の認識されたパターンに基づいて、特定のサブコレクションが検索用に選択される(ステップ20)。選択されたサブコレクションは、第2の段階で、ユーザによって与えられた検索語を用いて検索される(ステップ22)。第1の段階で検索する特定のサブコレクションを選択することにより、本発明の2段階の検索方法が、的確かつ適切な検索結果を提供する。
【選択図】図1

Description

本発明は、電子コレクションの検索結果を最適化する方法およびシステムに関する。詳細には、本発明は、2段階の検索アルゴリズムを利用する方法に関する。
標準的な検索エンジンは、関連資料を求めて、電子コンテンツの莫大なコレクションをユーザが検索することを可能にするツールを提供する。検索エンジンとは、コレクションを構成するコンテンツを「クロール」し、「索引付け(index)」るコンピュータアプリケーションである。クローリングとは、検索エンジンがコレクション中のすべてのコンテンツを検索し閲覧するプロセスである。索引付けとは、クロールされた、または閲覧されたコンテンツを検索エンジンが組織化するプロセスである。検索エンジンは、ユーザによって提供された検索語を用いて関連コンテンツを特定する。コンテンツの適切な索引付けにより、検索エンジンは、コンテンツをすぐに特定することが可能となる。
しかし、コレクション中に含まれるドキュメントの数が増えるにつれて、関連コンテンツを検索し、応答(return)させる作業は、より困難になる。しばしば、検索エンジンは、特定の検索語に関連すると考えられる数千のドキュメントを特定することになる。これにより、ユーザは、所望のコンテンツを特定するために、関連しない大量のコンテンツを調べる必要がある。
したがって、検索結果を最適化する改良型の検索システムを提供することが有益である。
本発明は、2段階の検索システムを提供する方法およびシステムである。第1の段階で、検索語またはフレーズが、規定されたパターンに合致するかどうか判定するために、検索語が分析される。検索語が規定パターンに合致する場合、合致したパターンに関連付けられたサブコレクションが、第2の段階で検索される。
2段階の検索により、検索結果を最適化する方法が提供される。第1の段階は、検索語を分析して規定パターンを検出する。合致したパターンに基づいて、パターンに関連付けられた1つまたは複数のサブコレクションが、第2の段階で検索語を用いて検索される。第1の段階で検索する特定のサブコレクションを選択することにより、2段階の検索方法が的確かつ適切な検索結果を提供する。
図1は、方法10のフローチャートであり、これは、2段階の検索を行うステップを示す。ステップ12では、ユーザが、2段階の検索システムに検索語を提供する。ステップ14では、検索語が、検索語に含まれる単語またはフレーズが規定パターンに合致するかどうか判定するために分析される。一実施形態では、検索語が、いずれかの規定パターンに合致するかどうか判定するのに、「正則表現」が使われる。正則表現とは、1組の文字列(string)を記述する表現である。正則表現は通常、1組の文字列を、すべての要素を列挙する必要なく、簡潔に記述するのに使われる。たとえば、すべてのパート番号(part number)が、2つの数字と、その後に続くダッシュおよびさらに3つの数字と、その後に続くダッシュおよびさらに2つの数字と、からなる(たとえば、12−345−67)場合、この数字およびダッシュのパターンを識別するのに、正則表現が規定され得る(すなわち、##(ダッシュ)###(ダッシュ)##)。したがって、ユーザが、「45−251−555」という検索語を含む検索語を入力すると、上記で規定された正則表現は、この語を、パート番号と同じ形式のものであると認識する。
様々なパターンを識別するために、任意の数の正則表現が規定され得る。正則表現は、コンピュータプログラミングの分野において公知であり、多数のソフトウェアアプリケーションを使って実現され得る。アプリケーションに応じて、正則表現を規定するのに使われるシンタックスが変わり得る。
検索語が規定パターンと合致しない場合、ステップ16で、コレクション全体に対して一般的な検索が実施される。一般的な検索は、与えられた検索語に基づく、コレクション全体の検索を含み、この検索では、コレクション中のどの資料が検索語に最も関連するか判定するのに、関連性アルゴリズムが使われる。ステップ18では、コレクション全体に対して行われた検索の結果が応答される。ステップ18で応答される結果は、一般的な一段階検索エンジンによって応答される結果を表す。
規定パターンと検索語とが実際に合致する場合、ステップ20で、合致したパターンに基づいて検索を行う1つまたは複数のサブコレクションが選択される。一実施形態では、検索を行うサブコレクションの選択は、特定の合致したパターンに関連付けられたサブコレクションのリストをユーザに提供することによって行われる。ユーザは、関連付けられたサブコレクションのリストから、ユーザが検索を行うことを望む特定のサブコレクションを選択する。ユーザは、検索を行う1つまたは複数のサブコレクションを選択してもよく、コレクション全体を検索することを選んでもよい。別の実施形態では、サブコレクションの選択は自動的に行われ、特定の合致したパターンに関連付けられたサブコレクションが、ユーザからの入力なしで検索される。
ステップ22では、ユーザによって選択されたか、もしくは自動的に選択されたかに関わらず、選択されたサブコレクションに対して関連性検索が行われる。関連性検索では、関連性アルゴリズムを用いて、与えられた検索語に関連する、選択されたサブコレクション内のコンテンツを突き止める。ステップ24では、関連性検索の結果が、ユーザに提供される。ステップ24で応答される結果は、選択されたサブコレクション内にあるコンテンツのみを含むので、結果は、ステップ18で提供されたもの(コレクション全体からのコンテンツを含む)よりも的確である。
図2は、2段階の検索で利用される索引付け編成の例示的な実施形態を表す階層クラス構造すなわち分類30を示す。図2に示されるような階層分類は、クローリングおよび索引付けプロセスの間に検索エンジンアプリケーションによって作成される。一般的な検索エンジンは、コレクション内のすべてのコンテンツをクロールもしくは閲覧することになる。索引付けとは、検索エンジンが検索要求に応答して特定のコンテンツを素早く検索することができるように、検索エンジンアプリケーションがコレクションをカテゴリー化する、すなわち編成するプロセスである。図2に示される実施形態において、2段階の検索エンジンによって索引付けられたコンテンツが階層分類に編成され、それによって、類似ドキュメントがサブコレクション内に一緒に索引付けられる。
図2に示されるように、階層分類30における最も広範な分類は、検索可能な資料32であり、これは、ユーザによって検索され得るすべてのコンテンツを包含する。一般的な、すなわち一段階検索エンジンは、このレベルでコンテンツの検索を行い、このレベルは、検索可能な資料32の下に示されるすべてのサブコレクションのブランチを含む。本実施形態では、検索可能な資料32は、ドキュメントサブコレクション34およびアプリケーションサブコレクション36を含む、少なくとも2つのサブコレクションに細分される。ここでの説明のため、ドキュメントサブコレクション34に関連付けられた分類のみを、より詳細に説明する。ドキュメントサブコレクション34は、ウェブページドキュメントサブコレクション38およびPDFドキュメントサブコレクション40を含む、少なくとも2つのサブコレクションに分割される。ウェブページドキュメントサブコレクション38は、複数のサブコレクションにさらに分割され、これらのサブコレクションの1つは、フィールドレポートサブコレクション42である。同様に、PDFドキュメントサブコレクション40は、複数のサブコレクションにさらに分割され、これらのサブコレクションの1つは、資料明細(material specification)サブコレクション44である。
したがって、検索エンジンが、フィールドレポートを索引付けると、フィールドレポートを階層分類中のどこに置くべきかに関する一連の判定を行う。まず、検索エンジンは、フィールドレポートをドキュメントとして分類すべきか、もしくはアプリケーションとして分類すべきかを判定する。フィールドレポートがドキュメントであると判定し、これをドキュメントサブコレクション34内に分類した後、検索エンジンは、フィールドレポートをウェブページファイルとしてさらに分類すべきか、もしくはPDFファイルとしてさらに分類すべきかを判定する。フィールドレポートがウェブページファイルであると判定し、これをウェブページサブコレクション38内に分類した後、検索エンジンは、これをフィールドレポートとしてさらに分類すべきかどうかを判定する。パート番号46やワイヤ(wire)ID48などのファイルの属性に基づいて、検索エンジンは、これが実際にフィールドレポートであると判定し、そのドキュメントを、フィールドレポートサブコレクション42内に分類する。同様のプロセスが、資料明細であると決定されるコンテンツに対して実施される。
したがって、コンテンツがクロールされ索引付けられる度に、検索エンジンは、コンテンツを分類し、階層分類中の適当な場所に置く。この階層索引付けシステムは、2段階の検索システムを実現するのに理想的な環境である。というのは、類似ドキュメントが、明確なサブコレクション中に編成されるからである。
索引付けプロセスの一部として、検索エンジンは、ユーザによる検索要求に応答して検索エンジンがコンテンツを効率的に突き止めることを可能にする、索引付けられたコンテンツ中のキーワードを識別する。本発明では、検索エンジンは、サブコレクション内のすべてのコンテンツ中で検索される属性も識別する(たとえば、フィールドレポートサブコレクション42中の各フィールドレポートは、パート番号フィールド46を含む)。属性が、正則表現によって規定され得る場合、サブコレクションは、その属性を規定する正則表現に関連付けられ得る。その後の検索で正則表現に合致すると、正則表現に関連付けられたサブコレクションが検索される。一実施形態では、サブコレクション中のコンテンツに共通する属性を識別するプロセスは、階層分類30の管理者によって手動で実施される。
たとえば、フィールドレポートサブコレクション42は、パート番号フィールド46やワイヤIDフィールド48などの属性を含む。パート番号フィールド46は、本実施形態では、##(ダッシュ)###(ダッシュ)##の正則表現によって規定される、一連の数字およびダッシュを含む。同様に、ワイヤIDフィールド48は、####(ダッシュ)##という正則表現によって規定される一連の数字およびダッシュを含む。ユーザが、パート番号フィールド46もしくはワイヤIDフィールド46のいずれかを規定する正則表現に合致する検索語を入力した場合、2段階の検索システムが、フィールドレポートサブコレクション42を、ユーザによって与えられた検索語に特に関連するコンテンツを含むサブコレクションとして識別する。
同様に、資料明細サブコレクション44中に編成されたコンテンツは、パート番号フィールド50およびスペック(spec)IDフィールド52を含めることによって識別可能である。フィールドレポートと資料明細との両方が、それぞれ正則表現##(ダッシュ)###(ダッシュ)##で表されるパート番号フィールド(フィールドレポートサブコレクション42内の符号46と、資料明細サブコレクション44内の符号50と、で示す)を含むことに留意されたい。スペックID52は、正則表現#AA#(ダッシュ)####で表される。本実施形態では、「AA」は、「AB」や「BC」など、一連の2文字を示す。ユーザによって入力された検索語がパート番号フィールド50もしくはスペックIDフィールド52のどちらかを規定する正則表現に合致すると、2段階の検索システムは、資料明細サブコレクション44を、ユーザによって検索されるコンテンツを含むサブコレクションとして指定する。
フィールドレポートサブコレクション42と資料明細サブコレクション44は、共にパート番号フィールド(それぞれ、46および50)を含むので、検索語が、パート番号フィールド(46および50)を規定する正則表現に合致すると、フィールドレポートサブコレクション42と資料明細サブコレクション44は共に、特に関連するコンテンツを含むサブコレクションとして識別される。
図3は、図2に示される階層分類において実施される2段階の検索を示すフローチャートである。ステップ60では、ユーザが、検索エンジンに検索語を入力する。ステップ62では、検索語が、認識可能なパターンを検索語が含むかどうか判定するために、正則表現と比較される。検索語の中にパターンが認識されない場合、すべての検索可能な資料32の標準的な検索がステップ63で実施される。
ステップ62でパターンが認識された場合、合致したパターンに関連付けられたサブコレクションが、ユーザに提示される。ステップ64,65,66は、ステップ62で認識される異なるパターンに基づいて提示されるサブコレクションを示す。たとえば、正則表現の合致が、検索語のパターンがパート番号であることを示す場合、ステップ64で、ユーザは、パート番号フィールドを含むサブコレクションを、フィールドレポートサブコレクション42や資料明細サブコレクション44といった、属性として提示される。正則表現の合致が、検索語のパターンがワイヤIDであることを示す場合、ステップ65で、ユーザは、ワイヤIDに関連付けられたサブコレクション、この場合はフィールドレポートサブコレクション42を提示される。正則表現の合致が、検索語のパターンがスペックIDであることを示す場合、ステップ66で、ユーザは、スペックIDに関連付けられたサブコレクション、この場合は資料明細サブコレクション44を提示される。
簡略化する目的で、ステップ68でユーザによって行われる検索が、パート番号パターンに合致するものと識別されると、ステップ67で、ユーザが、どの関連付けられたサブコレクション(フィールドレポートサブコレクション42および資料明細サブコレクション44を含む)を検索するかを判断する。たとえば、ユーザが検索しているコンテンツが、フィールドレポートサブコレクション42内にあることをユーザが認識している場合、ユーザは、ステップ68で、フィールドレポートサブコレクションのみを検索することを選ぶ。同様に、ユーザは、ステップ70で資料明細サブコレクション44のみを、あるいはステップ72で、フィールドレポートサブコレクション42と資料明細サブコレクション44との両方を検索することを選んでもよい。ユーザにより検索することを選択されたサブコレクションに応じて、ステップ74,76,78で応答される結果は異なる。たとえば、ユーザが、フィールドレポートサブコレクション42のみを検索することを選んだ場合、与えられた検索語に関連するフィールドレポートサブコレクション42内に存在するコンテンツ(具体的には、フィールドレポート)のみが、ステップ74でユーザに応答される。上記の方法によって応答される検索結果は、コレクション全体に対して実施される標準的な検索に比べ、より的確かつ適切な結果をユーザに提供する。
別の実施形態では、合致したパターンに関連付けられたサブコレクションが、ステップ67でのユーザからの選択入力なしに、自動的に検索される。たとえば、図3に示されるように、検索語が、パート番号に関連付けられたパターンに合致する場合、フィールドレポートサブコレクション42および資料明細サブコレクション44が自動的に検索され、結果がユーザに提供される。同様に、検索語が、ワイヤIDに関連付けられたパターンに合致する場合、フィールドレポートサブコレクション42が自動的に検索され、結果がユーザに提供される。
図4は、2段階の検索を実現するシステム80を示す機能ブロック図である。システム80は、サーバ82および端末84a,84b・・・84N(まとめて「端末84」)を含む。各端末84は、それぞれ双方向通信チャネル86a、86b・・・86N(まとめて「双方向通信チャネル86)に沿って、サーバ82と通信する。サーバ82は、コンピュータプロセッサ88およびデータ記憶装置90を含む。コンピュータプロセッサ88およびデータ記憶装置90は、2段階の検索アプリケーション92を実現し、アプリケーション92は、クローリングおよび索引付けアプリケーション94、パターンマッチングアプリケーション96、ならびにキーワード検索アプリケーション98など、個別のいくつかのサブプログラムもしくはアプリケーションを含む。
クローリングおよび索引付けアプリケーション94は、すべての検索可能なコンテンツを索引付ける。一実施形態では、クローリングおよび索引付けアプリケーション94は、索引付けプロセス時に階層分類30(図2について詳しく述べた)を作成し、分類30は、データ記憶装置90内に保存される。階層分類30は、検索可能な資料32、ドキュメントサブコレクション34、アプリケーションサブコレクション36、ウェブページサブコレクション38、PDFサブコレクション40、フィールドレポートサブコレクション42、ウェブページサブコレクション44を含む。クローリングおよび索引付けアプリケーション94はまた、特定のサブコレクション(たとえば、図2に示されるパート番号フィールド46)に関連付けられた属性を認識する。他の実施形態では、階層分類の管理者が、サブコレクションとして編成されたドキュメントに共通する属性を認識し、検索語が、特定のサブコレクションに関連付けられた規定パターンに合致するかどうかを判定するための正則表現を規定する。一実施形態では、正則表現は、データ記憶装置90内に保存される。
端末84の1つにおけるユーザが、サーバ82に検索語を入力する。検索の第1の段階時に、パターンマッチングアプリケーション96は、正則表現を使って、ユーザにより与えられた検索語のうち規定パターンに合致するものがあるかどうかを判定する。検索語が規定パターンに実際に合致する場合、キーワード検索アプリケーション98を使って、選択されたサブコレクションが検索される。他の実施形態では、検索語が規定パターンに合致する場合、関連付けられたサブコレクションが端末84の1つにおけるユーザに提示され、関連付けられたサブコレクションがある場合には、このうちどれを検索するかをユーザが判定することを可能にする。
ユーザによって選択されたもしくは自動的に選択されたサブコレクションに応じて、キーワード検索アプリケーション98は、階層分類(図2に示されている)を用いてユーザによって与えられた検索語に関連するコンテンツを検索する。関連コンテンツは、双方向通信チャネル86を通してユーザに提示される。
本発明の2段階検索方法を示すフローチャート。 本発明の2段階検索システムが実現される階層分類を示すフローチャート。 図2に示す階層分類の2段階の検索を示すフローチャート。 2段階検索を実現するシステムの機能ブロック図。

Claims (17)

  1. 検索結果を提供する方法であって、
    ユーザから検索語を受けるステップと、
    前記ユーザから受けた前記検索語内のパターンを認識するステップと、
    前記検索語内で認識された前記パターンに基づいて検索を行う、コレクション全体の中のサブコレクションを選択するステップと、
    前記ユーザによって与えられた前記検索語に基づいて、前記選択されたサブコレクションを検索するステップと、
    前記ユーザに、前記選択されたサブコレクション内にある関連コンテンツを提供するステップと、
    を備えてなる検索結果提供方法。
  2. 前記検索語内のパターンを認識するステップが、
    前記検索語を、特定のサブコレクションに関連付けられた特定のパターンを認識するように設定された正則表現と比較するステップを含むことを特徴とする請求項1に記載の検索結果提供方法。
  3. 検索を行うサブコレクションを選択するステップが、
    前記検索語内に認識された前記パターンに関連付けられた前記サブコレクションを前記ユーザに提供するステップと、
    前記ユーザから、検索される前記サブコレクションに関する入力を受けるステップと、
    を含むことを特徴とする請求項1に記載の検索結果提供方法。
  4. 検索を行うサブコレクションを選択するステップが、
    前記検索語内で認識されたパターンに関連付けられたすべてのサブコレクションを自動的に選択するステップを含むことを特徴とする請求項1に記載の検索結果提供方法。
  5. 前記ユーザによって与えられた前記検索語に基づいて、前記コレクション全体を検索するステップをさらに含むことを特徴とする請求項1に記載の検索結果提供方法。
  6. 前記ユーザに前記選択されたサブコレクション内にある関連コンテンツを提供するステップが、
    前記ユーザによって与えられた前記検索語を用いる前記コレクション全体に行われる検索に基づいて、関連コンテンツを前記ユーザに提供するステップを含むことを特徴とする請求項5に記載の検索結果提供方法。
  7. 前記ユーザに前記選択されたサブコレクション内にある関連コンテンツを提供するステップが、
    前記ユーザによって与えられた前記検索語に対する前記コンテンツの関連性に基づいて、前記関連コンテンツを順位付けるステップを含むことを特徴とする請求項1に記載の検索結果提供方法。
  8. プロセッサと、
    データ保存装置と、
    を備えた2段階検索を提供するコンピュータシステムであって、
    前記プロセッサおよび前記データ記憶装置が、2段階検索エンジンアプリケーションを使って検索可能なコンテンツをサブコレクションに編成し、前記2段階検索エンジンアプリケーションが、前記検索語内に認識されるパターンに基づいて検索を行う前記サブコレクションを選択し、前記ユーザによって与えられた前記検索語に基づいて前記選択されたサブコレクションの関連性検索を行うコンピュータシステム。
  9. 前記コンピュータシステムに接続された複数の端末をさらに備え、前記端末におけるユーザが、検索可能なコンテンツの2段階検索を開始するように前記コンピュータシステムに検索語を入力することが可能であることを特徴とする請求項8に記載のコンピュータシステム。
  10. 前記2段階検索エンジンアプリケーションが、
    前記検索可能なコンテンツを、前記データ保存装置内に保存される階層分類に編成する、索引付けアプリケーションを含むことを特徴とする請求項8に記載のコンピュータシステム。
  11. 前記データ保存装置が、選択されたサブコレクションに関連付けられたパターンを規定する正則表現を保存することを特徴とする請求項8に記載のコンピュータシステム。
  12. 前記2段階検索エンジンアプリケーションが、
    前記ユーザによって与えられた前記検索語内のパターンを認識するように前記データ保存装置に保存された前記正則表現を用いるパターンマッチングアプリケーションを含み、前記サブコレクションが、前記検索語内に認識された前記パターンに基づいて選択されることを特徴とする請求項11に記載のコンピュータシステム。
  13. 検索可能なコンテンツを複数のサブコレクションに編成するステップと、
    前記複数のサブコレクションの各々に関連付けられたパターンを識別するステップと、
    ユーザによって与えられた検索語が、前記複数のサブコレクションの一つに関連付けられた前記識別パターンを含むかどうかを判定するステップと、
    前記検索語内に識別された前記パターンに基づいて検索を行う前記サブコレクションを選択するステップと、
    前記ユーザによって与えられた前記検索語に基づいて、前記選択されたサブコレクションを検索するステップと、
    を備えた2段階の検索システムの実施方法であって、
    前記複数のサブコレクションの各々の内部の前記コンテンツが、共通の属性を共有する2段階検索システム実施方法。
  14. 前記複数のサブコレクションの各々に関連付けられたパターンを規定するステップが、
    前記複数のサブコレクションの各々に関連付けられた前記識別パターンに基づいて、正則表現を規定するステップを備えることを特徴とする請求項13に記載の2段階検索システム実施方法。
  15. ユーザによって与えられた検索語が、前記複数のサブコレクションの1つに関連付けられた前記識別パターンを含むかどうかを判定するステップが、
    前記規定された正則表現を、前記ユーザによって与えられた前記検索語と比較するステップを含むことを特徴とする請求項14に記載の2段階検索システム実施方法。
  16. 前記検索語内に識別された前記パターンに基づいて検索を行う前記サブコレクションを選択するステップが、
    前記ユーザに、前記検索語内に識別されたパターンに関連付けられた前記サブコレクションを提供するステップと、
    前記ユーザから、検索する前記サブコレクションに関する入力を受けるステップと、
    を含むことを特徴とする請求項13に記載の2段階検索システム実施方法。
  17. 前記検索語内に識別された前記パターンに基づいて検索を行う前記サブコレクションを選択するステップが、
    前記検索語内に識別されたパターンに関連付けられた前記サブコレクションを自動的に選択するステップを含むことを特徴とする請求項13に記載の2段階検索システム実施方法。
JP2007004550A 2006-01-13 2007-01-12 検索結果提供方法および2段階検索システム実施方法 Pending JP2007188509A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/332,438 US20070168346A1 (en) 2006-01-13 2006-01-13 Method and system for implementing two-phased searching

Publications (1)

Publication Number Publication Date
JP2007188509A true JP2007188509A (ja) 2007-07-26

Family

ID=38264443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007004550A Pending JP2007188509A (ja) 2006-01-13 2007-01-12 検索結果提供方法および2段階検索システム実施方法

Country Status (2)

Country Link
US (1) US20070168346A1 (ja)
JP (1) JP2007188509A (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7958115B2 (en) * 2004-07-29 2011-06-07 Yahoo! Inc. Search systems and methods using in-line contextual queries
US7421441B1 (en) * 2005-09-20 2008-09-02 Yahoo! Inc. Systems and methods for presenting information based on publisher-selected labels
US8972856B2 (en) * 2004-07-29 2015-03-03 Yahoo! Inc. Document modification by a client-side application
US7409402B1 (en) * 2005-09-20 2008-08-05 Yahoo! Inc. Systems and methods for presenting advertising content based on publisher-selected labels
US9128954B2 (en) * 2007-05-09 2015-09-08 Illinois Institute Of Technology Hierarchical structured data organization system
US8051080B2 (en) * 2008-04-16 2011-11-01 Yahoo! Inc. Contextual ranking of keywords using click data
US8560568B2 (en) * 2008-08-26 2013-10-15 Zeewise, Inc. Remote data collection systems and methods using read only data extraction and dynamic data handling
US9411864B2 (en) 2008-08-26 2016-08-09 Zeewise, Inc. Systems and methods for collection and consolidation of heterogeneous remote business data using dynamic data handling
US9779168B2 (en) 2010-10-04 2017-10-03 Excalibur Ip, Llc Contextual quick-picks
JP5697256B2 (ja) * 2011-11-24 2015-04-08 楽天株式会社 検索装置、検索方法、検索プログラム及び記録媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004090754A1 (en) * 2003-04-04 2004-10-21 Yahoo! Inc. A system for generating search results including searching by subdomain hints and providing sponsored results by subdomain
JP2005235149A (ja) * 2004-02-20 2005-09-02 Norio Goto 検索閲覧システム、検索閲覧プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6347313B1 (en) * 1999-03-01 2002-02-12 Hewlett-Packard Company Information embedding based on user relevance feedback for object retrieval
US6353823B1 (en) * 1999-03-08 2002-03-05 Intel Corporation Method and system for using associative metadata
US6678694B1 (en) * 2000-11-08 2004-01-13 Frank Meik Indexed, extensible, interactive document retrieval system
US6754650B2 (en) * 2001-05-08 2004-06-22 International Business Machines Corporation System and method for regular expression matching using index
JP4003468B2 (ja) * 2002-02-05 2007-11-07 株式会社日立製作所 適合性フィードバックによる類似データ検索方法および装置
US20030212663A1 (en) * 2002-05-08 2003-11-13 Doug Leno Neural network feedback for enhancing text search

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004090754A1 (en) * 2003-04-04 2004-10-21 Yahoo! Inc. A system for generating search results including searching by subdomain hints and providing sponsored results by subdomain
JP2005235149A (ja) * 2004-02-20 2005-09-02 Norio Goto 検索閲覧システム、検索閲覧プログラム

Also Published As

Publication number Publication date
US20070168346A1 (en) 2007-07-19

Similar Documents

Publication Publication Date Title
JP2007188509A (ja) 検索結果提供方法および2段階検索システム実施方法
US6363377B1 (en) Search data processor
EP1182581B1 (en) Searching tool and process for unified search using categories and keywords
US7630973B2 (en) Method for identifying related pages in a hyperlinked database
US8095539B2 (en) Taxonomy-based object classification
EP1024437B1 (en) Multi-modal information access
US9946753B2 (en) Method and system for document indexing and data querying
US20050060290A1 (en) Automatic query routing and rank configuration for search queries in an information retrieval system
US20020103809A1 (en) Combinatorial query generating system and method
US20020091661A1 (en) Method and apparatus for automatic construction of faceted terminological feedback for document retrieval
US20030135430A1 (en) Method and apparatus for classification
WO2007051397A1 (fr) Systeme d’extraction d’informations et procede d’extraction d’informations
JP2006018843A (ja) ページカテゴリ情報の使用による検索エンジン結果の分散
US9971782B2 (en) Document tagging and retrieval using entity specifiers
US20120130999A1 (en) Method and Apparatus for Searching Electronic Documents
US20050114317A1 (en) Ordering of web search results
US7979452B2 (en) System and method for retrieving task information using task-based semantic indexes
KR100671077B1 (ko) 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법및 시스템
JP2009516252A (ja) テキストの表現を取得する方法
US20090234838A1 (en) System, method, and/or apparatus for subset discovery
WO2001039008A1 (en) Method and system for collecting topically related resources
EP1993046A1 (en) Method and system for implementing two-phased searching
JP3578045B2 (ja) 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体
KR100594180B1 (ko) 온라인을 이용한 통합 검색 방법
KR100645711B1 (ko) 다수의 정보 블록으로 구분된 웹 페이지를 이용한 정보검색 서비스 제공 서버, 방법 및 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120228

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120528

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120828