JP2006529044A - 定義付けシステムおよび方法 - Google Patents

定義付けシステムおよび方法 Download PDF

Info

Publication number
JP2006529044A
JP2006529044A JP2006533349A JP2006533349A JP2006529044A JP 2006529044 A JP2006529044 A JP 2006529044A JP 2006533349 A JP2006533349 A JP 2006533349A JP 2006533349 A JP2006533349 A JP 2006533349A JP 2006529044 A JP2006529044 A JP 2006529044A
Authority
JP
Japan
Prior art keywords
phrase
definition
definitions
document
presenting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006533349A
Other languages
English (en)
Other versions
JP4621680B2 (ja
Inventor
クレイグ・ネビィル−マニング
Original Assignee
グーグル・インク
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グーグル・インク filed Critical グーグル・インク
Publication of JP2006529044A publication Critical patent/JP2006529044A/ja
Application granted granted Critical
Publication of JP4621680B2 publication Critical patent/JP4621680B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Abstract

【課題】
定義付けを行うためのシステム及び方法を提供すること。
【解決手段】
定義(44)を提供するためのシステム(10)および方法(40)について記述される。定義付けすべきフレーズ(41)が受信される。各々少なくとも一つの定義(44)を含む、一つ以上のドキュメント(42)が決定される。フレーズ(41)を、該定義(44)のうちの少なくとも一つに突き合わせる。該フレーズ(41)に対する一以上の定義(44)が提示される。
【選択図】図3

Description

本発明は、一般に、定義付けを行うことに関連し、特に、定義付けを行うためのシステムおよび方法に関連する。
定義付けを行うためのシステムと方法については文献がある。インターネットで利用可能なコンテンツは膨大な量が存在する。このコンテンツには、用語集または定義の形式で構成されるものがある。本願明細書において記載されるシステムおよび方法により、フレーズに対する定義付けを迅速かつ効率的に行えるように、これらの利用可能なリソースを活用することが可能となる。ここで「フレーズ」とは、単語、語句、または定義付けすることが可能な他の語義単位をさす。
本実施例は、定義付けを行うためのシステム及び方法を提供するものである。
定義付けすべきフレーズを受信する。各々少なくとも一つの定義を含む一つ以上のドキュメントを決定する。これらの定義のうちの少なくとも一つに対し、フレーズをマッチングさせる。該フレーズに対し一つ以上の定義が提示される。
さらに別の実施例によれば、分散情報記憶装置から定義を決定する。一つ以上のドキュメントを特定する。ドキュメントは各々、分散情報処理装置内に維持され、対応するフレーズ用の定義を含む。特定されたドキュメント各々に関する情報が格納される。定義を検索すべきフレーズを、特定したドキュメント各々に格納された情報と突き合わせる。特定したドキュメントを分散情報処理装置から取り込み、一致する一以上の定義が返される。一致する定義が各々提示される。
本発明のさらに別の実施例は、以下の詳細な説明により、直ちに当業者にとって明らかなものとなる。ここで、本発明の実施例は、本発明を実施するために考察される最良の形態を例示することにより説明される。当然のことながら、本発明については、これとは別の異なる実施例が可能であり、その詳細のいくつかは、すべて本発明の趣旨および範囲から逸脱することなく、さまざまな種類の自明な観点において変更可能である。従って、図面および詳細な説明は、本質的に例示されているとみなされるのであって制限的にみなされるものではない。
本実施例は、定義付けを行うためのシステム及び方法を提供するものである。
本特許出願は、米国特許法119条(e)項に基づき、2003年5月20日付で出願された米国仮特許出願番号60/472,445、発明の名称「定義付けシステムおよび方法」、及び米国特許法120条に基づき、2003年6月27日付で出願された米国特許出願番号10/608,270、発明の名称「定義付けシステムおよび方法」を基礎として優先権を主張し、それらの開示内容は参照としてここに引用される。
図1は、本発明に従い、定義付けを行うシステム10を示すブロック図である。当業者であれば理解できるように、複数の個別クライアント12は、例えばインターネット、または他の通信ネットワーク形態の相互接続ネットワーク13を介して、サーバ11と通信可能にインターフェースをとっている。個々のクライアント12は、それぞれのクライアント12を介してウェブコンテンツのリクエストや他の動作を行うユーザ19により操作される。
一般に、各クライアント12は、例えば相互接続ネットワーク13のようなネットワークに接続可能であり、アプリケーションプログラムと対話可能であれば、いかなる形態の演算プラットフォームでもよい。当業者であれば理解できるように、個々のクライアントの例としては、パーソナル・コンピュータ、情報端末、「スマート」フォンおよびページャ、軽量クライアント、ワークステーション、アプリケーションサーバとインターフェースをとるダム端末、そしてこれらをさまざまに配置したものや構成したものが含まれ、これらに限定されるものではない。当業者であれば理解できるように、相互接続ネットワーク13は、ネットワーク相互接続可能コンポーネントについての多様なトポロジ、構成、配置を含み、これらは、企業、広域およびローカルエリアネットワークと相互作用的に連動するよう構成されており、また、限定的ではないが、従来からある有線、無線、衛星、光学および等価ネットワーク技術を含む。
ウェブコンテンツをやりとりするため、そして特に、検索を行うために、各クライアント12はウェブ・ブラウザ18(「ウェブ・ブラウザ」)を実行する。これは、グラフィカル・ユーザ・インターフェースを実現するものであり、これを介して検索問合せが、サーバ11上で動作しているウェブサーバ20に送信される。これはさらに図2を参照して以下に説明する。各検索問合せは、潜在的にウェブサーバ20を介して読み出し可能な情報を、一般的にウェブコンテンツの形態で表現または特定するものである。さらに該検索問合せは、図3を参照して後述するように、定義を検索すべきフレーズを含めることができる。この検索問合せは、キーワード等の、通常は条件として表現される特徴、および、言語、文字コードなどの属性を提供し、これにより、サーバ11で実行されるサーチエンジン21がウェブページを特定し返送できるようにする。条件および属性はメタデータの形式であり、データ記述データを構成する。当業者であれば理解できるように、検索問合せ、検索問合せの特徴、およびメタデータを、他のスタイル、形式または定義で実現してもよい。
ウェブページは、ウェブ・ブラウザ18に返送されて表示される。これは通常、ウェブコンテンツのタイトル、ハイパーリンク、および、ウェブページから取り出したテキストの抜粋などの他の説明情報の形態をとる。ユーザは、グラフィカル・ユーザ・インターフェース上のウェブページを閲覧またはそれにアクセスすることが可能であり、タイプされたテキスト、クリック、またはその両方の形式で、選択や応答を入力できる。サーバ11は、ウェブコンテンツ22がその内部に支持されている付属の記憶装置15を保持する。ウェブコンテンツ22はまた、相互接続ネットワーク13を介して直接的または間接的に相互接続され、好ましくは各クライアント12からアクセス可能な他のウェブサーバ(図示せず)上に遠隔的に保持されるようにしてもよい。
サーチエンジン21は、高品質ウェブページを提供するために、好ましくは、検索問合せ条件に最もマッチするウェブコンテンツ22を特定する。これは例えば、S・ブランとL.ページの「ハイパーテキスト対応大規模ウェブサーチエンジンの分析(The Anatomy of a Large-Scale Hypertextual Web Search Engine)」(1988年)、およびL.ページに対して2001年9月4日付で発行された米国特許6,285, 999号に記載されており、これらの開示は参照により本明細書に引用される。図2を用いてさらに後述するように、マッチするウェブコンテンツ22を特定する場合、サーチエンジン21は、潜在的に検索可能なウェブコンテンツを表している情報特性に基づき動作する。ここで、ウェブサーバ20およびサーチエンジン21を含むサーバ20により提供される機能性は、ユニプロセッシング環境に加え、疎結合または密結合の、分散または並列演算構成によって提供されてもよい。
サーバ11およびクライアント12を含む個々のコンピュータシステムは、汎用目的の、プログラムされたデジタル演算処理装置を備え、これは中央演算処理装置(それぞれプロセッサ13および16)、ランダム・アクセス・メモリ(それぞれメモリ14および17)、ハードディスクドライブまたはCD−ROMドライブなどの不揮発性二次記憶装置15、ネットワークまたは無線インターフェース、および、キーボードやディスプレイなどのユーザ・インターフェース手段を含む周辺装置から成る。ソフトウェア・プログラムを含むプログラムコードおよびデータは、CPUによる実行および処理のためにRAM内にロードされ、表示、出力、送信または格納の対象となる結果が生成される。ウェブ・ブラウザ18は、マイクロソフト社(レドモンド、ワシントン)によりライセンスされているInternet Explorer(インターネット・エクスプローラ)、ネットスケープ社(マウンテンビュー、カリフォルニア)によりライセンスされているNavigator(ナビゲーター)などのHTTP互換のウェブ・ブラウザ、または、モジラもしくはジャバスクリプトが使用可能なブラウザであり、これらは周知技術である。
図2は、図1のシステム10において使用する、コンピュータシステム30を示すブロック図である。コンピュータシステム30は、プロセッサ31と、コンピュータ・モニタまたは液晶ダイオード(LCD)ディスプレイのようなビジュアル・ディスプレイ32を有し、これは従来技術において周知である。コンピュータシステム30は、ウェブ・ブラウザ18(図1に示す)を実行し、これにより、グラフィカル・ユーザ・インターフェース37が実現される。検索された定義を含むビジュアル・ウェブコンテンツは、グラフィカル・ユーザ・インターフェース37上に定められた表示領域内に出力され、一方、ユーザ入力は、表示領域および指定されたユーザ入力領域の両方に入力されるのが一般的である。テキストによるユーザ入力は、キーボード33を介して受信される。線形、非テキストの入力は、マウス、トラックボール、トラックパッドまたは矢印キーなどのポインティング・デバイス34を介して受信される。同様に、音声およびサウンドベースの入力は、マイクロホン35を介して受信される。ビジュアル出力は、ビジュアル・ディスプレイ32上のグラフィカル・ユーザ・インターフェース37を介して表示され、一方、音声出力はスピーカ36上で行われる。当業者であれば理解できるように、プロセッサ31、ビジュアル・ディスプレイ32、および入出力装置を含むコンピュータの構成要素については他の形態を使用してもよい。
ここで、図3を参照して本発明の一実施例を説明する。図3は、本発明に従い定義付けを行う方法を示すフロー図である。この方法は、一連の処理動作またはステップとして説明され、例えば、図1に示すシステムまたはそれに相当する構成要素により実行することが可能である。
まず、定義を検索すべきフレーズが提供される(ブロック310)。例えば、このフレーズは、ユーザリクエストまたは問合せ、あるいは他のなんらかの手段により提供される。フレーズを提供するシステムの一例としは、http://labs.google. com/glossaryにより特定されるURLに位置するもので、そのコンテンツは参照として本明細書に引用する。また、このフレーズのスペルは、より一貫した定義結果をもたらすために、一般的な原形に、必要に応じて修正または標準化することが可能である。
定義を含むドキュメントが決定される(ブロック320)。これらのドキュメントが決定するために、いくつの方法を用いてもよい。例えば、この種のドキュメントは、リアルタイムまたはバッチ処理モードのいずれかにおいて、サーチエンジンにより行われるウェブ・クローリングまたはスパイダリングの間に決定してもよい。ドキュメントが定義を含んでいると決定されると、このドキュメント(またはドキュメントのURLなど、ドキュメントに関する情報)が、将来の使用に備えて格納または記憶される。定義用の「正式な」供給元、例えば、http://www.dictionary.com等のウェブサイトに対応するドキュメントを使用することも可能である。
本発明の一実施例において、定義を含むドキュメントは、インターネットのサーチエンジンを介して問合せを行うことにより、実質的にリアルタイムで位置が特定される。他の実施例においては、例えば、問合せを受信する前にオフラインで、定義を含むドキュメントを取り込み、情報解析し、インデックス付けを行うことにより、このドキュメントの位置を実質的にバッチ処理モードで特定する。また、定義を含むドキュメントを特定するためにバッチ処理を提供し、かつ、各問合せに応答した定義を取り込み、重複を失くし、クリーンアップするためにリアルタイム処理を用いることにより、バッチ処理とリアルタイム処理の組み合わせを利用することも可能である。
この問合せは、「用語集」、「定義」、「辞書」等の定義について、その変形や標準化したものだけでなく、それらの存在を示す可能性が高いタームを検索する。この検索は、ドキュメントのテキスト全体に亘って行ってもよいし、あるいは、タイトルフィールド、他のメタデータを含むフィールド等、ドキュメント内のある部分やフィールドに限定してもよい。また、ドキュメントの構造、すなわち、HTMLドキュメントのタグ付け特性を、問合せをどのように構築するかの決定に関連させてもよい。本発明の一実施例において、ウェブページのタイトルで「用語集」、「定義」、「辞書」を検索することを利用して、関連するドキュメントを決定する。情報検索技術において、通常の知識を有する者により理解できるように、上記の方法は、定義を含むドキュメントを決定するために、さまざまなやり方や、数多くの他の方法に組み合わせてもよい。
定義を検索すべきフレーズを、このように決定されたドキュメントに対して突き合せ、定義を返してもらう(ブロック330)。このステップ(ブロック330)で決定されるドキュメントは、検索対象のフレーズと、このフレーズに対応する定義の存在を特定するために解析される。例えば、定義含有ドキュメントは、「見出し語」、または辞書形式で調べることが可能な単語で編成してもよい。見出し語を特定する、およびまたは定義を特定するための方法にはさまざまなものがある。本発明の一実施例において、別々のドキュメントを解析して、見出し語を特定し、およびまたは定義を返すために、以下の方法のうちの少なくとも一つが使用される。
・ページが、定義リストを指定するために使用するHTMLタグである、<dl>、<dt>および<dd>を使用する場合、定義を特定するためにHTMLによるマークアップに依拠する。すなわち、
定義リスト例として、
<dl>
<dt>Headword 1
<dd>This
is the definition of Headword 1
<dt>Headword 2
<dd>This
is the definition of Headword 2
<dt>Headword 3
<dd>This
is the definition of Headword 3
</dl>
となる。
・ <p>、<tr>、<li>および<br>のようなHTMLタグは、連続した定義の間でセパレータとして処理される。
・ 空白または句読点(.,:−)は定義の開始時に除去する。
・ 見出し語は、見出し語がHTMLタグ、<b>、<strong>、<em>、<code> または、<span>によって囲まれるという事実により特定される。
・ 見出し語で始まっていないラインは、削除される。
・ ドキュメントまたはページ内で、定義の数がN(例えばN=5)より少ない場合、ドキュメント内またはページ内のすべての定義は廃棄される。
構文分析ツールは、全ての見出し語および定義を特定する際に完全である必要はない。実施例の一つにおいて、定義ドキュメント決定ステップ(ブロック320)において決定される、定義含有ドキュメントは非常に数が多いので、構文分析ツールは、完全性よりは精度を重要視する。換言すれば、構文分析ツールは、正しくない可能性があるエントリを保持しておくというよりはむしろ、たとえそれが誤りであるとしても、捨てる方向へ判断するようになっている。というのは、満足な結果を供給するには十分過ぎるほどの定義があるからである。同様に、さらに別の実施例においては、構文分析ツールは、重複する、または単に他のエントリの累積に過ぎないエントリについてはその重複を取り除く。
その後、返された定義の少なくとも一つが提供される(ブロック340)。実施例の一つにおいて、上記で引用した米国特許6,285,999号で開示されている方法により、定義が検索されたドキュメントのPageRank(登録商標)に従い、返された定義がランク付けされる。この検索された定義はまた、例えば、以下のステップのうち少なくとも一つを実行することにより、処理され提示される。
・以下のものを取り除く:
- 全てのHTMLマークアップ、
- 見出し語および定義双方における最初と最後の空白、
- 見出し語におけるすべての句読点:(.: ; ! ? −)、
- 見出し語および定義内の最初の非アルファベットかつ非括弧の全て、
- 見出し語内の最後の非英数字および非括弧の全て。
・以下の場合、定義を廃棄する:
- 定義が"see"で始まる場合。
- 定義が、すでに検索されたものの複製である場合。
・定義の最初の文字は大文字にする。
実施例の一つにおいて、フレーズについて前方完全一致するフレーズの定義のみが提示される。しかし、本発明の他の実施例においては、条件の緩い一致形態でも可能である。その他の情報もまた決定され提示される。本発明の一実施例において、フレーズのスーパーストリングは、表形式にされ、問合せをさらに改善したもの、または関連するフレーズとして提示される。スーパーストリングとは、フレーズ(またはフレーズの一般変形または標準化バージョン)を含むストリングである。ワードやフレーズの一般変形または標準化バージョンを決定する方法は、例えば、2003年3月3日に出願された、係属中の米国特許出願番号10/377,117、代理人登録番号GP-091−00-US、発明者アミット・シングハル(Amit Singhal) らによる名称「クエリ意味情報に基づいて改良された検索クエリ(SEARCH QUERIES IMPROVED BASED ON QUERY SEMANTIC INFORMATION)」という発明において説明されていており、その開示内容は本明細書において引用する。例えば、トップM個のスーパーストリングをリストしてもよい。同様に、フレーズは、そのフレーズについて最も一般的な大文字化をするなど、処理済みの形式で表示してもよい。例えば、[pocket pc]または[pocket pcs]についてのユーザ問合せは、「Pocket PC」として表示される。というのは、これがこの定義において、最も一般的な形式およびまたは大文字化だからである。
当業者により理解されるように、図3を用いて説明された上述のステップは、リストされた順序で実行される必要はなく、ステップを追加してもよいし、あるいは取り除いてもよい。
本明細書において使用されているように、「ドキュメント」は、広義に解釈すべきであり、機械で読み取り可能なまたは記憶可能なワークプロダクトを含む。ドキュメントは、ファイル、ファイルの組合せ、他のファイル等への埋込みリンクを有する一つ以上のファイル等であってもよい。このファイルは、例えばテキスト、音声、画像、映像等のいかなるタイプのものであってもよい。インターネットのコンテクストにおいて一般的なドキュメントは、当業において周知のようにウェブページである。
本発明のさらに別の態様によれば、定義が全く見つからない(または、定義が、当初提供されたフレーズに適切に一致するかどうかについて疑義がある場合などに、定義が提示用に選択されない)場合、元のフレーズに関連するタームまたはフレーズ、フレーズに関連するようであると見なされるタームまたはフレーズ、関心が高いと思われる(例えば、元のフレーズを入力したユーザの強い関心を引く)タームまたはフレーズのセット、または、定義が戻されたタームまたはフレーズの「無作為な」またはさまざまな要素を含んだセットを提供してもよい。このようなタームは、例えば、定義付けされるタームの種類に関するガイドをユーザに与えるため、またはユーザが楽しめるように提供してもよい。
図4は、例えば、図3の方法により提供される定義を示す画面例400である。フレーズ「rdbms」に対する用語検索は、概ね図示されるように提供される。
図5は、例えば、図3の方法により提供される別の定義を示す画面例500である。フレーズ「pocket pc」に対する用語検索は、概ね図示されるように提供される。
図6は、例えば、図3の方法により提供されるさらに別の定義を示す画面例600である。フレーズ「pocket pcs」に対する用語検索は、概ね図示されるように提供される。
本発明については、その実施例を参照することにより特定的に示し説明がなされたが、形態および詳細における前述および他の変更は、本発明の意図と要旨の範囲から逸脱することなく、その範囲において行うことができると当業者により理解される。
本実施例は、定義付けを行うためのシステム及び方法を提供するものである。
本発明に従い、定義付けを行うシステムを示すブロック図である。 図1のシステムにおいて使用されるコンピュータシステムを示すブロック図である。 本発明に従い、定義付けを行う方法を示すフロー図である。 図3の方法により提供される定義を、一例として示す画面の写しである。 図3の方法により提供される別の定義を、一例として示す画面の写しである。 図3の方法により提供されるさらに別の定義を、一例として示す画面の写しである。
符号の説明
11 サーバ
12 クライアント
13 相互接続ネットワーク
14 メモリ
15 記憶装置
16 プロセッサ
17 メモリ
18 ブラウザ
19 ユーザ
20 ウェブサーバ
21 サーチエンジン
22 ウェブコンテンツ
40 スタート
41 定義付けすべきフレーズを決定
42 定義を有するドキュメントを決定
43 フレーズと決定されたドキュメントとをマッチング
44 検索された定義を提供

Claims (46)

  1. 定義(44)を供給するためのシステム(10)であって、
    定義付けすべきフレーズ(41)を受信し、少なくとも一つの定義(44)を各々含む一つ以上のドキュメント(42)を決定し、前記定義(44)の少なくとも一つに対し前記フレーズ(41)をマッチングするサーバ(11)と、
    前記フレーズ(41)に対する一つ以上の定義(44)を提示するためのユーザインターフェース(37)と、
    を具備することを特徴とするシステム。
  2. 請求項1に記載のシステム(10)であって、
    定義付けすべきフレーズ(41)を受信し、少なくとも一つの定義(44)を各々含む一つ以上のドキュメント(42)を決定し、前記定義(44)の少なくとも一つに対し前記フレーズ(41)をマッチングし、前記フレーズ(41)に対する一つ以上の定義(44)を提示することは、実質的に、リアルタイム、バッチモード、またはその組み合わせで行われることを特徴とするシステム。
  3. 請求項1に記載のシステム(10)であって、
    前記ドキュメント(42)は、ウェブページ(22)であることを特徴とするシステム。
  4. 請求項1に記載のシステム(10)であって、
    前記決定は、サーチエンジン(21)上で問合せを行うことを含むことを特徴とするシステム。
  5. 請求項4に記載のシステム(10)であって、
    前記決定は、所定のフィールド内に所定のタームを含むドキュメント(42)を検索することを含むことを特徴とするシステム。
  6. 請求項5に記載のシステム(10)であって、
    前記所定のタームは、用語集、定義(44)、および辞書のうちの一つを含むことを特徴とするシステム。
  7. 請求項5に記載のシステム(10)であって、
    前記所定のフィールドは、タイトルフィールドであることを特徴とするシステム。
  8. 請求項1に記載のシステム(10)であって、
    前記マッチングは、一つ以上の決定されたドキュメント(42)における前記フレーズ(41)の存在を決定することを含むことを特徴とするシステム。
  9. 請求項8に記載のシステム(10)であって、
    前記マッチングは、一つ以上の決定されたドキュメント(42)における前記フレーズ(41)の非存在を決定することを特徴とするシステム。
  10. 請求項8に記載のシステム(10)であって、
    前記フレーズ(41)の存在を決定することはさらに、前記フレーズ(41)が正確に一致するという決定を含むことを特徴とするシステム。
  11. 請求項8に記載のシステム(10)であって、
    前記マッチングは、前記フレーズ(41)の修正を含むことを特徴とするシステム。
  12. 請求項11に記載のシステム(10)であって、
    前記フレーズ(41)の修正は、前記フレーズ(41)の標準的な形態の決定を含むことを特徴とするシステム。
  13. 請求項1に記載のシステム(10)であって、
    前記マッチングはさらに、前記フレーズ(41)について対応する定義(44)を検索することを含むことを特徴とするシステム。
  14. 請求項1に記載のシステム(10)であって、
    一つ以上の定義(44)を提示することは、該定義(44)をランク付けすることを含むことを特徴とするシステム。
  15. 請求項14に記載のシステム(10)であって、
    前記ランク付けは、少なくとも部分的に、前記ドキュメント(42)に基づくことを特徴とするシステム。
  16. 請求項15に記載のシステム(10)であって、
    前記ランク付けは、少なくとも部分的に、前記定義(44)に対応するドキュメント(42)のPageRankに基づくことを特徴とするシステム。
  17. 請求項1に記載のシステム(10)であって、
    前記提示はさらに、前記定義(44)を処理することを含むことを特徴とするシステム。
  18. 請求項1に記載のシステム(10)であって、
    前記フレーズ(41)に対して前記定義(44)を提示することは、該フレーズ(41)を、実質的に最も一般的に大文字化して提示することを含むことを特徴とするシステム。
  19. 請求項18に記載のシステム(10)はさらに、前記フレーズ(41)についてそれほど一般的でない形態の提示を含むことを特徴とするシステム。
  20. 請求項1に記載のシステム(10)はさらに、前記ドキュメント(42)に存在する前記フレーズ(41)のスーパーストリングの決定を含むことを特徴とするシステム。
  21. 請求項20に記載のシステム(10)はさらに、前記決定されたスーパーストリングのうちの少なくともいくつかについての提示を含むことを特徴とするシステム。
  22. 請求項21に記載のシステム(10)であって、
    前記提示されたスーパーストリングの少なくとも一つは、関連するフレーズ(41)または提案された問合せのうちのいずれか一つとして提示されることを特徴とするシステム。
  23. 定義(44)を供給するための方法(40)であって、
    定義付けすべきフレーズ(41)を受信し、
    少なくとも一つの定義(44)を各々含む一つ以上のドキュメント(42)を決定し、
    前記定義(44)の少なくとも一つに対し前記フレーズ(41)をマッチングし、
    前記フレーズ(41)に対する一つ以上の定義(44)を提示することを具備する方法(40)。
  24. 請求項23に記載の方法(40)であって、
    定義付けすべきフレーズ(41)を受信し、少なくとも一つの定義(44)を各々含む一つ以上のドキュメント(42)を決定し、前記定義(44)の少なくとも一つに対し前記フレーズ(41)をマッチングし、前記フレーズ(41)に対する一つ以上の定義(44)を提示することは、実質的に、リアルタイム、バッチモード、またはその組み合わせで行われることを特徴とする方法。
  25. 請求項23に記載の方法(40)であって、
    前記ドキュメント(42)は、ウェブページ(22)であることを特徴とする方法。
  26. 請求項23に記載の方法(40)であって、
    前記決定は、サーチエンジン(21)上で問合せを行うことを含むことを特徴とする方法。
  27. 請求項23に記載の方法(40)であって、
    前記決定は、所定のフィールド内に所定のタームを含むドキュメント(42)を検索することを含むことを特徴とする方法。
  28. 請求項27に記載の方法(40)であって、
    前記所定のタームは、用語集、定義(44)、および辞書のうちの一つを含むことを特徴とする方法。
  29. 請求項27に記載の方法(40)であって、
    所定のフィールドは、タイトルフィールドであることを特徴とする方法。
  30. 請求項23に記載の方法(40)であって、
    前記マッチングは、一つ以上の決定されたドキュメント(42)における前記フレーズ(41)の存在を決定することを含むことを特徴とする方法。
  31. 請求項30に記載の方法(40)であって、
    前記マッチングは、一つ以上の決定されたドキュメント(42)内におけるフレーズ(41)の非存在を決定することを特徴とする方法。
  32. 請求項30に記載の方法(40)であって、
    前記フレーズ(41)の存在を決定することはさらに、前記フレーズ(41)が正確に一致するという決定を含むことを特徴とする方法。
  33. 請求項30に記載の方法(40)であって、
    前記マッチングは、前記フレーズ(41)の修正を含むことを特徴とする方法。
  34. 請求項33に記載の方法(40)であって、
    前記フレーズ(41)の修正は、前記フレーズ(41)の標準的な形態の決定を含むことを特徴とする方法。
  35. 請求項23に記載の方法(40)であって、
    前記マッチングはさらに、前記フレーズ(41)に対応する定義(44)を検索することを含むことを特徴とする方法。
  36. 請求項23に記載の方法(40)であって、
    一つ以上の定義(44)を提示することは、該定義(44)をランク付けすることを含むことを特徴とする方法。
  37. 請求項36に記載の方法(40)であって、
    前記ランク付けは、少なくとも部分的に、前記ドキュメント(42)に基づくことを特徴とする方法。
  38. 請求項37に記載の方法(40)であって、
    前記ランク付けは、少なくとも部分的に、前記定義(44)に対応するドキュメント(42)のPageRankに基づくことを特徴とする方法。
  39. 請求項23に記載の方法(40)であって、
    前記提示はさらに、前記定義(44)を処理することを含むことを特徴とする方法。
  40. 請求項23に記載の方法(40)であって、
    前記フレーズ(41)に対して前記定義(44)を提示することは、該フレーズ(41)を実質的に最も一般的に大文字化して提示することを含むことを特徴とする方法。
  41. 請求項40に記載の方法(40)はさらに、前記フレーズ(41)についてそれほど一般的でない形態での提示を含むことを特徴とする方法。
  42. 請求項23に記載の方法(40)はさらに、前記ドキュメント(42)に存在する前記フレーズ(41)のスーパーストリングの決定を含むことを特徴とする方法。
  43. 請求項42に記載の方法(40)はさらに、前記決定されたスーパーストリングのうちの少なくともいくつかについての提示を含むことを特徴とする方法。
  44. 請求項43に記載の方法(40)であって、
    前記提示されたスーパーストリングの少なくとも一つは、関連するフレーズ(41)または提案された問合せのうちのいずれか一つとして提示されることを特徴とする方法。
  45. 請求項23による方法(40)を実行するための、コンピュータで読み取り可能な記憶媒体が保持するコード。
  46. 定義(44)を供給するための装置(30)であって、
    定義付けすべきフレーズ(41)を受信する手段と、
    少なくとも一つの定義(44)を各々含む一つ以上のドキュメント(42)を決定する手段と、
    前記定義(44)の少なくとも一つに対し前記フレーズ(41)をマッチングする手段と、
    前記フレーズ(41)に対する一つ以上の定義(44)を提示する手段と、
    を具備することを特徴とする装置。
JP2006533349A 2003-05-20 2004-05-20 定義付けシステムおよび方法 Active JP4621680B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US47244503P 2003-05-20 2003-05-20
US10/608,270 US8255417B2 (en) 2003-05-20 2003-06-27 System and method for providing definitions
PCT/US2004/016258 WO2004114158A1 (en) 2003-05-20 2004-05-20 System and method for providing definitions

Publications (2)

Publication Number Publication Date
JP2006529044A true JP2006529044A (ja) 2006-12-28
JP4621680B2 JP4621680B2 (ja) 2011-01-26

Family

ID=33457345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006533349A Active JP4621680B2 (ja) 2003-05-20 2004-05-20 定義付けシステムおよび方法

Country Status (5)

Country Link
US (2) US8255417B2 (ja)
EP (2) EP1631928A1 (ja)
JP (1) JP4621680B2 (ja)
IL (2) IL172033A (ja)
WO (1) WO2004114158A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8255417B2 (en) * 2003-05-20 2012-08-28 Google Inc. System and method for providing definitions
JP4653805B2 (ja) * 2005-04-12 2011-03-16 富士通株式会社 意味検索プログラム
CA2639438A1 (en) * 2008-09-08 2010-03-08 Semanti Inc. Semantically associated computer search index, and uses therefore
US9519712B2 (en) * 2009-01-06 2016-12-13 At&T Intellectual Property I, L.P. Systems and methods to evaluate search qualities
US9384678B2 (en) 2010-04-14 2016-07-05 Thinkmap, Inc. System and method for generating questions and multiple choice answers to adaptively aid in word comprehension
US8543586B2 (en) * 2010-11-24 2013-09-24 International Business Machines Corporation Determining points of interest using intelligent agents and semantic data
US9235566B2 (en) * 2011-03-30 2016-01-12 Thinkmap, Inc. System and method for enhanced lookup in an online dictionary
US20130262437A1 (en) * 2011-12-30 2013-10-03 Sameer Abhinkar Energy-Efficient Query Optimization

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002117058A (ja) * 2000-10-05 2002-04-19 Nippon Telegr & Teleph Corp <Ntt> 用語解説検索方法及び装置及び用語解説検索プログラムを格納した記憶媒体

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62199891U (ja) * 1986-06-09 1987-12-19
EP0437615B1 (en) * 1989-06-14 1998-10-21 Hitachi, Ltd. Hierarchical presearch-type document retrieval method, apparatus therefor, and magnetic disc device for this apparatus
US5347115A (en) * 1990-01-12 1994-09-13 Norand Corporation Portable modular work station including printer and portable data collection terminal
US5237159A (en) * 1991-07-17 1993-08-17 J. D. Carreker And Associates Electronic check presentment system
US5488676A (en) * 1992-01-10 1996-01-30 Checkmate Electronics, Inc. Miniature MICR document reader with power management and motorized conveyance
US5345090A (en) * 1993-03-08 1994-09-06 Verifone, Inc. Manual check reader apparatus with optical imaging
JP3457061B2 (ja) * 1994-06-28 2003-10-14 富士通株式会社 属性混在文字列のソート装置及び属性混在文字列のソート方法
EP0856175A4 (en) * 1995-08-16 2000-05-24 Univ Syracuse SYSTEM AND METHOD FOR RETURNING MULTI-LANGUAGE DOCUMENTS USING A SEMANTIC VECTOR COMPARISON
JP3254642B2 (ja) * 1996-01-11 2002-02-12 株式会社日立製作所 索引の表示方法
US5789916A (en) * 1996-01-31 1998-08-04 Axiohm Ipb Inc. Method and apparatus for improving readhead performance
US5651624A (en) * 1996-01-31 1997-07-29 Axiohm Ipb Inc. Apparatus for receipt printing having shared pathway with check validation
US5913215A (en) * 1996-04-09 1999-06-15 Seymour I. Rubinstein Browse by prompted keyword phrases with an improved method for obtaining an initial document set
US5832480A (en) * 1996-07-12 1998-11-03 International Business Machines Corporation Using canonical forms to develop a dictionary of names in a text
US5808283A (en) * 1996-08-17 1998-09-15 Verifone Inc. Modular point-of-sale transaction apparatus and method of manufacture and assembly
US6065679A (en) * 1996-09-06 2000-05-23 Ivi Checkmate Inc. Modular transaction terminal
US6285999B1 (en) * 1997-01-10 2001-09-04 The Board Of Trustees Of The Leland Stanford Junior University Method for node ranking in a linked database
JP3195275B2 (ja) * 1997-06-27 2001-08-06 インターナショナル・ビジネス・マシーンズ・コーポレ−ション データベース・アクセス・システム
US6442540B2 (en) * 1997-09-29 2002-08-27 Kabushiki Kaisha Toshiba Information retrieval apparatus and information retrieval method
US5999929A (en) * 1997-09-29 1999-12-07 Continuum Software, Inc World wide web link referral system and method for generating and providing related links for links identified in web pages
US6109521A (en) * 1997-10-06 2000-08-29 Axiohm Transaction Solutions, Inc. Check processing method and apparatus
US6089450A (en) * 1997-10-06 2000-07-18 Axiohm Transaction Solutions, Inc. Receipt printer having a check reading mechanism with selective engagement
US6085977A (en) * 1997-10-06 2000-07-11 Axiohm Tranaction Solutions, Inc. Check processing procedure
US6293715B1 (en) * 1997-10-06 2001-09-25 Axiohm Transaction Solutions, Inc. Self contained point of sale printing system and method
US6261008B1 (en) * 1998-02-12 2001-07-17 Seiko Epson Corporation Platen mechanism, a printing device with the platen mechanism, and a method of controlling the printing device
JP3666005B2 (ja) * 1998-03-03 2005-06-29 マツダ株式会社 特許情報検索システム、特許情報検索装置、情報検索中継装置並びに特許情報検索方法
US6097606A (en) * 1998-05-28 2000-08-01 International Verifact Inc. Financial transaction terminal with limited access
US6321226B1 (en) * 1998-06-30 2001-11-20 Microsoft Corporation Flexible keyboard searching
US6126073A (en) * 1998-08-07 2000-10-03 Axiohm Transaction Solutions, Inc. Point-of-sale MICR printing and reading
US5997192A (en) * 1998-08-07 1999-12-07 Axiohm Transaction Solutions, Inc. Thermal transfer MICR point-of-sale printer with bi-directional clutch
US6269189B1 (en) * 1998-12-29 2001-07-31 Xerox Corporation Finding selected character strings in text and providing information relating to the selected character strings
US6584458B1 (en) * 1999-02-19 2003-06-24 Novell, Inc. Method and apparatuses for creating a full text index accommodating child words
US6386097B1 (en) * 1999-05-21 2002-05-14 Walton Foods, L.L.C. System and method for filling a nugget transported on a conveyor
US7225182B2 (en) * 1999-05-28 2007-05-29 Overture Services, Inc. Recommending search terms using collaborative filtering and web spidering
US6373511B1 (en) * 1999-11-26 2002-04-16 Ivi Checkmate Corp. Combination terminal and printer
US6772150B1 (en) * 1999-12-10 2004-08-03 Amazon.Com, Inc. Search query refinement using related search phrases
US6701309B1 (en) * 2000-04-21 2004-03-02 Lycos, Inc. Method and system for collecting related queries
US7152058B2 (en) * 2000-07-13 2006-12-19 Biap Systems, Inc. Apparatus for and method of selectively retrieving information and enabling its subsequent display
KR20020045343A (ko) * 2000-12-08 2002-06-19 오길록 표준화된 문장 구문구조 및 의미구조에 기반한 정보생성/검색 장치 및 그 방법
US6922809B2 (en) * 2001-01-25 2005-07-26 International Business Machines Corporation Method and apparatus providing capitalization recovery for text
US7099845B2 (en) * 2001-08-16 2006-08-29 Ncr Corporation Electronic check presentment with image interchange system and method of operating an electronic check presentment with image interchange system
WO2003027894A1 (en) * 2001-09-26 2003-04-03 The Trustees Of Columbia University In The City Of New York System and method of generating dictionary entries
US7814043B2 (en) * 2001-11-26 2010-10-12 Fujitsu Limited Content information analyzing method and apparatus
US20030229624A1 (en) * 2002-06-05 2003-12-11 Petrisor Greg C. Search system
EP1552427A4 (en) * 2002-06-13 2009-12-16 Mark Logic Corp PARENT-CHILD QUERY INDEX FOR XML DATA BANKS
CN100485603C (zh) * 2003-04-04 2009-05-06 雅虎公司 用于从搜索查询中产生概念单元的系统和方法
US8255417B2 (en) * 2003-05-20 2012-08-28 Google Inc. System and method for providing definitions
US7240049B2 (en) * 2003-11-12 2007-07-03 Yahoo! Inc. Systems and methods for search query processing using trend analysis
US7747639B2 (en) * 2005-08-24 2010-06-29 Yahoo! Inc. Alternative search query prediction
US7844599B2 (en) * 2005-08-24 2010-11-30 Yahoo! Inc. Biasing queries to determine suggested queries

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002117058A (ja) * 2000-10-05 2002-04-19 Nippon Telegr & Teleph Corp <Ntt> 用語解説検索方法及び装置及び用語解説検索プログラムを格納した記憶媒体

Also Published As

Publication number Publication date
JP4621680B2 (ja) 2011-01-26
US8713047B2 (en) 2014-04-29
US8255417B2 (en) 2012-08-28
US20040236739A1 (en) 2004-11-25
EP3159812A1 (en) 2017-04-26
EP1631928A1 (en) 2006-03-08
IL172033A (en) 2014-02-27
US20130046532A1 (en) 2013-02-21
IL230822A0 (en) 2014-03-31
WO2004114158A1 (en) 2004-12-29

Similar Documents

Publication Publication Date Title
EP1428139B1 (en) System and method for extracting content for submission to a search engine
US8452766B1 (en) Detecting query-specific duplicate documents
JP4805929B2 (ja) インラインのコンテキストクエリを用いた検索システムおよび方法
US9104772B2 (en) System and method for providing tag-based relevance recommendations of bookmarks in a bookmark and tag database
JP4857075B2 (ja) ウェブドキュメントの集合において効率的に日付を検索する方法、コンピュータプログラム
US9367637B2 (en) System and method for searching a bookmark and tag database for relevant bookmarks
US7725451B2 (en) Generating clusters of images for search results
JP4731479B2 (ja) 検索システム及び検索方法
US7783633B2 (en) Display of results of cross language search
US8713047B2 (en) System and method for providing definitions
US20090287676A1 (en) Search results with word or phrase index
US7099870B2 (en) Personalized web page
WO2009059297A1 (en) Method and apparatus for automated tag generation for digital content
JPH11191114A (ja) メタ検索方法、画像検索方法、メタ検索エンジン及び画像検索エンジン
JP2017504105A (ja) インメモリデータベースサーチのためのシステム及び方法
JP2007122513A (ja) コンテンツ検索方法、及び、コンテンツ検索サーバ
US8108410B2 (en) Determining veracity of data in a repository using a semantic network
JP2006164086A (ja) オンライン知識検索支援装置、およびオンライン知識検索支援方法
JP2010282403A (ja) 文書検索方法
Mengistu Design and Implementation of Amharic Search Engine
Zhang Search term selection and document clustering for query suggestion
Wang A comparative study of keyphrase-based query-specific clustering on WWW

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060601

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091215

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100312

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100319

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100415

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100422

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100517

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100518

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101005

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101101

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131105

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4621680

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250