JP5379696B2 - 概念ベースの検索とランク付けを伴う情報検索のシステム、方法およびソフトウェア - Google Patents
概念ベースの検索とランク付けを伴う情報検索のシステム、方法およびソフトウェア Download PDFInfo
- Publication number
- JP5379696B2 JP5379696B2 JP2009544261A JP2009544261A JP5379696B2 JP 5379696 B2 JP5379696 B2 JP 5379696B2 JP 2009544261 A JP2009544261 A JP 2009544261A JP 2009544261 A JP2009544261 A JP 2009544261A JP 5379696 B2 JP5379696 B2 JP 5379696B2
- Authority
- JP
- Japan
- Prior art keywords
- documents
- concept
- query
- document
- query terms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本願の一部は、著作権保護の対象となる資料を含んでいる。版権所有者は、米国特許庁の特許ファイルあるいは記録に現れる限りにおいて、特許出願文書あるいは特許開示のなにびとによるファクシミリ複製に異議は唱えないが、そうでない場合は版権等を留保する。以下の通知は、本文書にも適用する。
Copyright(C)2006、Thomson Global Resouces
(アイルランドの法律に基づいて設立された法人)
(関連出願の参照)
本願は、2006年12月29日に出願された米国仮出願番号第60/878,014号に基づく優先権を主張するものであり、全体として参照により本明細書中に援用される
(技術分野)
本発明の種々の実施形態は、情報検索システムおよび関連するクエリー処理コンポーネントと方法に関するものである。
本発明は、例えば、以下の項目も提供する。
(項目1)
目的文書の組と、
該目的文書の一つ以上の組を、ユーザクェリーに基づいて結果文書として検索し、識別する手段であって、
検索し、識別する該手段は、一つ以上の第一の文書を、単語共起確率の組に基づいて認識する手段を含み、該単語共起確率の組は、該目的文書の組とは異なる文書の組から抽出される、手段と
を含むシステム。
(項目2)
前記目的文書の一つ以上の組を検索し識別する前記手段は、一つ以上の第二の文書を、結果文書として、逆文書頻度情報に基づいて識別する手段と、該結果文書を、該逆文書頻度情報と前記単語共起確率の組とに基づいてランク付けする手段と
を含む、項目1に記載のシステム。
(項目3)
前記目的文書の組は、判例を含む、項目1に記載のシステム。
(項目4)
前記目的文書の組は、法人の電子メールを含む、項目1に記載のシステム。
(項目5)
クェリーを処理する方法であって、
逆文書頻度型の第一の検索エンジンを用いて、文書の第一の組を、クェリーに基づいて識別し、ランク付けすることと、
該文書の第一の組を含む文書の結果の組の関連性を、該第一の組とは異なる文書の第二の組から得られる単語共起確率に基づいてランク付けすることと、
該文書の結果の組の少なくとも一部分のリストを、関連性のランクの順に表示することと
を含む方法。
(項目6)
前記文書の結果の組は、単語共起確率に基づいて識別された文書を含む、項目5に記載の方法。
(項目7)
クェリーに応答して検索エンジンによって識別された検索結果の文書のランク付けされた組を提供することと、
単語共起確率に基づいて、検索結果の文書の該ランク付けされた一つ以上の組のランキングを調整することと、
検索結果の文書の該調整されたランク付けされた組を表示することと
を含む方法。
(項目8)
前記検索エンジンは、逆文書頻度型の検索エンジンである、項目7に記載の方法。
(概念)
例示のシステムでは、ユーザクェリーに概念的に関連する文書を識別するベースとして単語の対の間の「翻訳」確率を用いる。「翻訳」確率は、一つの単語が他の単語に翻訳され得る確率である。これは、一つの言語から他の言語に翻訳するとき、把握するのが容易である。例えば、フランス語の「pomme」が英語の「apple」に翻訳される確率は高く、「pomme」が「sock」に翻訳される確率はほぼゼロである。
(情報検索システムの例)
図1は、例示的なオンライン情報検索システム100を示している。システム100は、一つ以上のデータベース110、一つ以上のサーバ120と一つ以上のアクセス装置130を含む。
データベース110は、一つ以上のデータベースの組を含む。例示的な法律データベースは、判例データベースと法規データベースを含み、それぞれ、判決の見解と一つ以上の地方、州、連邦および/または国際裁判からの法令を含む。例示の法律データベースは、また、法律分類データベースと法律レビューとを含む。他の例示データベースは、弁護士、判事、法律事務所、製品および会社プロファイルを含む。いくつかの実施形態では、判例文書がデータ構造を介して、他のデータベースの文書またはプロファイルに論理的に関連付けられる。他の実施形態は、財務的、科学的、あるいはヘルスケア情報を含む非法律データベースを含み得る。さらに、他の実施形態は、INFOTRACを通じて利用可能になるような公的なあるいは民間のデータベースを提供する。いくつかの実施形態では、インターネット検索を可能にし、従って、ウェブサイトおよびウェブページを包含し、他の実施形態は、ユーザが、例えば、電子メール文書や電子証拠開示手続に準ずる文書データベースのような、自身のデータベースを定めることを可能にする。
一般に、ウェブページあるいは他のマークアップ言語の形式のデータに役立つ一つ以上のサーバを表すサーバ120は、関連するアプレット、ActiveX制御、遠隔起動オブジェクト、あるいは他の関連するソフトウェアおよび種々の「厚さ」のサービスクライアントに対するデータ構造と共に構成する。より詳しくは、サーバ120は、プロセッサモジュール121、メモリモジュール122、契約者データベース123、一次検索モジュール124、概念検索モジュール125およびユーザインターフェイスモジュール126を含む。
一次検索モジュール124は、一つ以上の検索エンジンと、一つ以上のデータベース110に対するユーザクェリーを受信しかつ処理するための関連するユーザインターフェイスコンポーネントを含む。例示の実施形態では、検索モジュール124に関連する一つ以上の検索エンジンが、Boolean、tr−idf、自然言語検索性能を提供する。
単語の対は、次のような方法でコーパスから構築される。
停止単語が除かれ、その後、各単語は、その両側で5単語の距離までの他の全ての単語(それ自身を含む)と対にされ、単語当り11単語対をもたらす。単語対は、例示実施形態では順不問(すなわち、X_Y=Y_X)である。(しかしながら、いくつかの実施形態は順序付けられた単語対を使用し得る。)さらに、例示の実施形態は、8文字で単語対の単語の頭を切り、単語対データに対するある量の平滑化を提供する。
共起対の使用はリコールを強化し、より関連ある文書が、全ての関連ある文書に対する関係で検索されることを可能にする;
キーワード型の言語モデルの使用は、高い正確さを有している;
モデルは、リコールと正確さを最大にするように、コンポーネントを異なる「重み付け」することを可能にするので、柔軟性がある。
単語対に対して、文書得点は、次のように定義される。
アクセス装置130は、一般に一つ以上のアクセス装置を表す。例示の実施形態では、アクセス装置130は、パーソナルコンピュータ、ワークステーション、パーソナルデジタルアシスタント、携帯電話、あるいは、サーバまたはデータベースとの効果的なユーザインターフェイスを提供できる他の任意の装置の形式を取る。特に、アクセス装置130は、プロセッサモジュール131(一つ以上のプロセッサ(あるいは処理回路)131)、メモリ132、ディスプレイ133、キーボード134、およびグラフィカルポインタまたはセレクタ135を含む。
例示実施形態では、これらの制御機構は、ハイパーリンクまたは他のブラウザ互換のコマンド入力の形式を取り、クェリー領域1381および検索結果領域1382へのアクセスと制御を提供する。領域1382での制御機構のユーザの選択、特に、テキスト形式のクェリーの入力フィールド1381Aへの入力および、サブミットボタン1381Bの始動を介してのサーバ120へのクェリーのサブミットは、結果領域1382内の検索結果リスト1382Aの表示をもたらす。リスト1382Aからのリストされた文書の選択は、インターフェイス138(図には示されない)の領域内で、対応する文書の少なくとも一部分の検索と表示の結果をもたらす。図1は領域1381および1382を同時に表示されているとして示すが、いくつかの実施形態は別々の時刻にそれらを表示する。インターフェイスの他の機能的な局面は、以下に記述される。
図2は、システム100のようなシステムを操作する一つ以上の例示的方法のフローチャート200を示す。フローチャート200は、例示実施形態の中で逐次実行シーケンスに編成され記載される複数のブロック210〜240を含む。しかしながら、他の実施形態が、マルチプロセッサあるいはプロセッサ様のデバイスあるいは、2つ以上の仮想マシンまたはサブプロセッサとして構成された単一のプロセッサを用いて、2つ以上のブロックを平行して実行する。他の実施形態もまた、類似の結果を達成するために、処理シーケンスを変更するか、あるいは異なる機能の区分を提供する。例えば、いくつかの実施形態はサーバ側に示されてかつ記述された機能を全体としてあるいは一部としてクライアント側に、およびその逆に実装されるように、機能のクライアント−サーバ割当てを変更する。さらに、他の実施形態は、ブロックをモジュール間あるいはモジュールを通じて通信される関連制御信号およびデータ信号を伴う、2つ以上の接続されたハードウェアモジュールとして実装する。このように、例示的処理フローは、ソフトウェア、ハードウェアおよびファームウェアの実装に適用する。
上で記述された実施形態は、本発明の一つ以上の実施あるいは実装を例示することと教示することとのみを意図しており、その幅あるいは範囲を制限することを意図するものではない。本発明の教示を実施するあるいは実装する全ての方法を包含する本発明の実際の範囲は、公表される特許請求の範囲およびそれらの均等物によってのみ定義される。
Claims (17)
- プロセッサおよびメモリを有するシステムであって、
前記システムは、
一組の目的文書と、
ユーザクェリーに関連する一組の少なくとも一つの概念を識別することに基づいて、前記プロセッサにより、前記一組の目的文書のうちの一つ以上の目的文書を、結果文書として検索し、識別する手段と
をさらに備え、
前記検索し、識別する手段は、前記プロセッサにより、第一の組の文書を、一組の単語共起確率に少なくとも部分的に基づいて識別する手段と、前記一組の単語共起確率に少なくとも部分的に基づいて前記第一の組の文書をランク付けする手段とを含み、前記一組の単語共起確率は、前記一組の少なくとも一つの概念に関する文書の少なくとも一つのコーパスから導出され、前記一組の少なくとも一つの概念の各々は、前記第一の組の文書において、前記ユーザクェリーからの単語と共起する複数の単語と同等である、システム。 - 前記一組の目的文書は、判例文書を含む、請求項1に記載のシステム。
- 前記一組の目的文書は、法人の電子メールまたはニュース文書を含む、請求項1に記載のシステム。
- 一つ以上のクェリー用語を有するクェリーを用いてデータベース内の一組の一つ以上の文書を識別する方法であって、前記方法は、プロセッサおよびメモリを備えるシステムにより実行され、前記データベースは、前記メモリに格納されており、
前記方法は、
前記プロセッサが、クェリーを構成する一つ以上のクェリー用語に関連する一組の少なくとも一つの概念を識別することと、
前記プロセッサが、前記データベース内の一つ以上の文書の各々について、その文書内の前記クェリー用語のうちの一つ以上の出現と、その文書内の一つ以上の非クェリー用語の出現とに基づいて、得点を決定することであって、前記非クェリー用語は、一組の文書内の前記クェリー用語のうちの一つ以上と共起すると知られており、かつ、前記一組の少なくとも一つの概念に関連し、前記一組の少なくとも一つの概念の各々は、前記一つ以上の文書において、前記一つ以上のクェリー用語のうちの少なくとも一つの用語と共起する複数の単語と同等である、ことと、
前記プロセッサが、決定された得点に基づいて、検索結果内の前記文書のうちの一つ以上の文書をそれぞれランク付けすることと、
前記プロセッサが、前記ランク付けすることに基づいて、前記文書のうちの前記一つ以上の文書を表示することと
を含む、方法。 - 前記得点は、キーワードモデルおよび翻訳言語モデルに少なくとも部分的に基づく、請求項4に記載の方法。
- 前記得点は、第一の量および第二の量の合計に基づき、前記第一の量は、前記クェリー用語のうちの一つが前記文書内で出現した回数の計数に少なくとも部分的に基づき、前記第二の量は、前記非クェリー用語のうちの一つが前記一組の文書内の前記クェリー用語のうちの一つと共起した回数の計数に少なくとも部分的に基づく、請求項4に記載の方法。
- プロセッサおよびメモリを有するコンピュータにより実行されるように構成される検索方法であって、
前記検索方法は、
ユーザクェリーに関連する一組の少なくとも一つの概念を識別することと、前記プロセッサにより、第一の組の文書を、一組の単語共起確率に少なくとも部分的に基づいて識別することと、前記一組の単語共起確率に少なくとも部分的に基づいて前記第一の組の文書をランク付けすることとに基づいて、前記プロセッサにより、一組の目的文書のうちの一つ以上の目的文書を、結果文書として検索し、識別することを含み、
前記一組の目的文書は、前記メモリに格納されており、前記一組の単語共起確率は、前記一組の少なくとも一つの概念に関する文書のコーパスから導出され、前記一組の少なくとも一つの概念の各々は、前記第一の組の文書において、前記ユーザクェリーからの単語と共起する複数の単語と同等である、検索方法。 - 前記文書のコーパスは、前記一組の目的文書を含む、請求項7に記載の検索方法。
- 一つ以上のクェリー用語を有するクェリーを用いてデータベース内の一組の一つ以上の文書を識別するシステムであって、前記システムは、プロセッサおよびメモリを有し、前記システムは、
クェリーを構成する一つ以上のクェリー用語に関連する一組の少なくとも一つの概念を識別することと、
前記データベース内の一つ以上の文書の各々について、その文書内の前記クェリー用語のうちの一つ以上の出現と、その文書内の一つ以上の非クェリー用語の出現とに基づいて、得点を決定することであって、前記非クェリー用語は、一組の文書内の前記クェリー用語のうちの一つ以上と共起すると知られており、かつ、前記一組の少なくとも一つの概念に関連し、前記一組の少なくとも一つの概念の各々は、前記一つ以上の文書において、前記一つ以上のクェリー用語のうちのクェリー用語と共起する複数の単語と同等である、ことと、
決定された得点に基づいて、検索結果内の前記文書のうちの一つ以上の文書をそれぞれランク付けすることと、
ランクに基づいて、前記文書のうちの前記一つ以上の文書を表示することと
を実行するように適合されたコードセットをさらに備える、システム。 - 前記データベース内の前記一組の一つ以上の文書に基づいた一組の確率をさらに備える、請求項9に記載のシステム。
- 前記文書のコーパスは、前記一組の目的文書を含む、請求項1に記載のシステム。
- 前記一組の単語共起確率は、前記一組の目的文書に関連するコンテンツに基づく、請求項1に記載のシステム。
- 前記プロセッサが、前記データベース内の前記一組の一つ以上の文書に基づいて一組の確率を決定することをさらに含む、請求項4に記載の方法。
- 前記文書の少なくとも一つのコーパスは、文書の概念ベースのコーパスを生成するように前記一組の少なくとも一つの概念に関するように予め決定されている、請求項1に記載のシステム。
- 前記データベース内の一つ以上の文書の各々について得点を決定することは、前記少なくとも一つの概念に対する前記クェリー用語および非クェリー用語の相対的な寄与にさらに基づく、請求項4に記載の方法。
- 前記一組の文書は、前記一組の少なくとも一つの概念に関するように予め決定されており、かつ、文書の概念ベースのコーパスを表す、請求項4に記載の方法。
- 前記プロセッサが、第一の概念に十分関連すると発見された前記一組の文書のうちの一つ以上の文書を、前記第一の概念に関する前記文書の概念ベースのコーパスに追加することをさらに含む、請求項16に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US87801406P | 2006-12-29 | 2006-12-29 | |
US60/878,014 | 2006-12-29 | ||
PCT/US2007/088927 WO2008083211A1 (en) | 2006-12-29 | 2007-12-27 | Information-retrieval systems, methods, and software with concept-based searching and ranking |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013011827A Division JP2013077333A (ja) | 2006-12-29 | 2013-01-25 | 概念ベースの検索とランク付けを伴う情報検索のシステム、方法およびソフトウェア |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010515171A JP2010515171A (ja) | 2010-05-06 |
JP5379696B2 true JP5379696B2 (ja) | 2013-12-25 |
Family
ID=39276259
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009544261A Expired - Fee Related JP5379696B2 (ja) | 2006-12-29 | 2007-12-27 | 概念ベースの検索とランク付けを伴う情報検索のシステム、方法およびソフトウェア |
JP2013011827A Withdrawn JP2013077333A (ja) | 2006-12-29 | 2013-01-25 | 概念ベースの検索とランク付けを伴う情報検索のシステム、方法およびソフトウェア |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013011827A Withdrawn JP2013077333A (ja) | 2006-12-29 | 2013-01-25 | 概念ベースの検索とランク付けを伴う情報検索のシステム、方法およびソフトウェア |
Country Status (10)
Country | Link |
---|---|
US (1) | US8321425B2 (ja) |
EP (1) | EP2115638A1 (ja) |
JP (2) | JP5379696B2 (ja) |
CN (1) | CN101622618B (ja) |
AR (1) | AR064694A1 (ja) |
AU (1) | AU2007339839A1 (ja) |
BR (1) | BRPI0720718A2 (ja) |
CA (1) | CA2674294C (ja) |
NZ (1) | NZ578672A (ja) |
WO (1) | WO2008083211A1 (ja) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008083211A1 (en) | 2006-12-29 | 2008-07-10 | Thomson Reuters Global Resources | Information-retrieval systems, methods, and software with concept-based searching and ranking |
CN101286150B (zh) | 2007-04-10 | 2010-09-15 | 阿里巴巴集团控股有限公司 | 生成更新参数的方法和装置、展示相关关键词的方法和装置 |
US8037086B1 (en) * | 2007-07-10 | 2011-10-11 | Google Inc. | Identifying common co-occurring elements in lists |
US20090058820A1 (en) | 2007-09-04 | 2009-03-05 | Microsoft Corporation | Flick-based in situ search from ink, text, or an empty selection region |
US8332205B2 (en) * | 2009-01-09 | 2012-12-11 | Microsoft Corporation | Mining transliterations for out-of-vocabulary query terms |
US20100191746A1 (en) * | 2009-01-26 | 2010-07-29 | Microsoft Corporation | Competitor Analysis to Facilitate Keyword Bidding |
CN101957828B (zh) * | 2009-07-20 | 2013-03-06 | 阿里巴巴集团控股有限公司 | 一种对搜索结果进行排序的方法和装置 |
US8180755B2 (en) * | 2009-09-04 | 2012-05-15 | Yahoo! Inc. | Matching reviews to objects using a language model |
US8949248B2 (en) | 2009-10-29 | 2015-02-03 | At&T Intellectual Property I, L.P. | Method and apparatus for generating a web page |
US8515972B1 (en) | 2010-02-10 | 2013-08-20 | Python 4 Fun, Inc. | Finding relevant documents |
US11386510B2 (en) * | 2010-08-05 | 2022-07-12 | Thomson Reuters Enterprise Centre Gmbh | Method and system for integrating web-based systems with local document processing applications |
CN102419755B (zh) | 2010-09-28 | 2013-04-24 | 阿里巴巴集团控股有限公司 | 一种搜索结果的排序方法和装置 |
US9589053B1 (en) * | 2010-12-17 | 2017-03-07 | The Boeing Company | Method and apparatus for constructing a query based upon concepts associated with one or more search terms |
US9519714B2 (en) * | 2010-12-22 | 2016-12-13 | Microsoft Technology Licensing, Llc | Presenting list previews among search results |
US8396871B2 (en) | 2011-01-26 | 2013-03-12 | DiscoverReady LLC | Document classification and characterization |
US8868567B2 (en) | 2011-02-02 | 2014-10-21 | Microsoft Corporation | Information retrieval using subject-aware document ranker |
US9116895B1 (en) | 2011-08-25 | 2015-08-25 | Infotech International Llc | Document processing system and method |
US9633012B1 (en) | 2011-08-25 | 2017-04-25 | Infotech International Llc | Construction permit processing system and method |
US9785638B1 (en) | 2011-08-25 | 2017-10-10 | Infotech International Llc | Document display system and method |
US9817898B2 (en) | 2011-11-14 | 2017-11-14 | Microsoft Technology Licensing, Llc | Locating relevant content items across multiple disparate content sources |
US9667514B1 (en) | 2012-01-30 | 2017-05-30 | DiscoverReady LLC | Electronic discovery system with statistical sampling |
US10467252B1 (en) | 2012-01-30 | 2019-11-05 | DiscoverReady LLC | Document classification and characterization using human judgment, tiered similarity analysis and language/concept analysis |
US9218344B2 (en) | 2012-06-29 | 2015-12-22 | Thomson Reuters Global Resources | Systems, methods, and software for processing, presenting, and recommending citations |
US20140025687A1 (en) * | 2012-07-17 | 2014-01-23 | Koninklijke Philips N.V | Analyzing a report |
US8898154B2 (en) * | 2012-09-19 | 2014-11-25 | International Business Machines Corporation | Ranking answers to a conceptual query |
US10152538B2 (en) | 2013-05-06 | 2018-12-11 | Dropbox, Inc. | Suggested search based on a content item |
US9754020B1 (en) | 2014-03-06 | 2017-09-05 | National Security Agency | Method and device for measuring word pair relevancy |
US10242090B1 (en) * | 2014-03-06 | 2019-03-26 | The United States Of America As Represented By The Director, National Security Agency | Method and device for measuring relevancy of a document to a keyword(s) |
GB2545548A (en) * | 2014-03-29 | 2017-06-21 | Camelot Uk Bidco Ltd | Improved method, system and software for searching, identifying, retrieving and presenting electronic documents |
US11144555B2 (en) * | 2015-05-06 | 2021-10-12 | App Annie Inc. | Keyword reporting for mobile applications |
US10387882B2 (en) | 2015-07-01 | 2019-08-20 | Klarna Ab | Method for using supervised model with physical store |
US9904916B2 (en) * | 2015-07-01 | 2018-02-27 | Klarna Ab | Incremental login and authentication to user portal without username/password |
US20170116194A1 (en) * | 2015-10-23 | 2017-04-27 | International Business Machines Corporation | Ingestion planning for complex tables |
US10474704B2 (en) | 2016-06-27 | 2019-11-12 | International Business Machines Corporation | Recommending documents sets based on a similar set of correlated features |
US20180018333A1 (en) | 2016-07-18 | 2018-01-18 | Bioz, Inc. | Continuous evaluation and adjustment of search engine results |
EP3542259A4 (en) | 2016-11-28 | 2020-08-19 | Thomson Reuters Enterprise Centre GmbH | SYSTEM AND METHOD FOR FINDING SIMILAR DOCUMENTS ON THE BASIS OF SEMANTIC FACTICAL SIMILARITY |
CN108628906B (zh) * | 2017-03-24 | 2021-01-26 | 北京京东尚科信息技术有限公司 | 短文本模板挖掘方法、装置、电子设备和可读存储介质 |
CN110785754B (zh) * | 2017-08-30 | 2023-11-21 | 深圳市欢太科技有限公司 | 应用资源处理方法及相关产品 |
US20240086433A1 (en) * | 2022-09-12 | 2024-03-14 | Thomson Reuters Enterprise Centre Gmbh | Interactive tool for determining a headnote report |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02116242A (ja) * | 1988-10-26 | 1990-04-27 | Fuji Xerox Co Ltd | 電子メールシステム |
JPH04130839A (ja) * | 1990-09-21 | 1992-05-01 | Nec Corp | 電子メールのキーワード検索方式 |
IL107482A (en) * | 1992-11-04 | 1998-10-30 | Conquest Software Inc | A method for solving questions in natural language from databases of full texts |
AU6849196A (en) * | 1995-08-16 | 1997-03-19 | Syracuse University | Multilingual document retrieval system and method using semantic vector matching |
JP3431836B2 (ja) * | 1998-06-18 | 2003-07-28 | 株式会社トレンディ | ドキュメントデータベースの検索支援方法とそのプログラムを記憶した記憶媒体 |
US6728695B1 (en) * | 2000-05-26 | 2004-04-27 | Burning Glass Technologies, Llc | Method and apparatus for making predictions about entities represented in documents |
US6684202B1 (en) * | 2000-05-31 | 2004-01-27 | Lexis Nexis | Computer-based system and method for finding rules of law in text |
JP2002108914A (ja) * | 2000-10-03 | 2002-04-12 | Canon Inc | 情報検索装置及び情報検索方法及びコンピュータ読み取り可能な記憶媒体 |
AUPR082400A0 (en) * | 2000-10-17 | 2000-11-09 | Telstra R & D Management Pty Ltd | An information retrieval system |
US6970881B1 (en) * | 2001-05-07 | 2005-11-29 | Intelligenxia, Inc. | Concept-based method and system for dynamically analyzing unstructured information |
EP1288794A1 (en) * | 2001-08-29 | 2003-03-05 | Tarchon BV | Methods of ordering and of retrieving information from a corpus of documents and database system for the same |
US7085771B2 (en) * | 2002-05-17 | 2006-08-01 | Verity, Inc | System and method for automatically discovering a hierarchy of concepts from a corpus of documents |
JP4163524B2 (ja) * | 2003-02-03 | 2008-10-08 | 日本電信電話株式会社 | 共起シソーラス間類似度測定装置、共起シソーラス間類似度測定プログラム及び共起シソーラス間類似度測定プログラム記録媒体 |
US7406459B2 (en) * | 2003-05-01 | 2008-07-29 | Microsoft Corporation | Concept network |
US7051014B2 (en) * | 2003-06-18 | 2006-05-23 | Microsoft Corporation | Utilizing information redundancy to improve text searches |
BRPI0506675A (pt) * | 2003-12-31 | 2007-05-15 | Thomson Global Resources | sistema, métodos, interfaces e software para estender resultados de busca além dos limites definidos pela consulta inicial |
EP1782291A4 (en) * | 2004-08-23 | 2009-08-26 | Lexisnexis A Division Of Reed | SYSTEM AND METHODS FOR LEGAL REFERENCE |
US7953723B1 (en) * | 2004-10-06 | 2011-05-31 | Shopzilla, Inc. | Federation for parallel searching |
US20060179051A1 (en) * | 2005-02-09 | 2006-08-10 | Battelle Memorial Institute | Methods and apparatus for steering the analyses of collections of documents |
JP2006227823A (ja) * | 2005-02-16 | 2006-08-31 | Canon Inc | 情報処理装置及びその制御方法 |
US7519588B2 (en) * | 2005-06-20 | 2009-04-14 | Efficient Frontier | Keyword characterization and application |
US7716226B2 (en) * | 2005-09-27 | 2010-05-11 | Patentratings, Llc | Method and system for probabilistically quantifying and visualizing relevance between two or more citationally or contextually related data objects |
WO2007043322A1 (ja) * | 2005-09-30 | 2007-04-19 | Nec Corporation | トレンド評価装置と、その方法及びプログラム |
US7814102B2 (en) * | 2005-12-07 | 2010-10-12 | Lexisnexis, A Division Of Reed Elsevier Inc. | Method and system for linking documents with multiple topics to related documents |
US7590626B2 (en) * | 2006-10-30 | 2009-09-15 | Microsoft Corporation | Distributional similarity-based models for query correction |
WO2008083211A1 (en) | 2006-12-29 | 2008-07-10 | Thomson Reuters Global Resources | Information-retrieval systems, methods, and software with concept-based searching and ranking |
-
2007
- 2007-12-27 WO PCT/US2007/088927 patent/WO2008083211A1/en active Application Filing
- 2007-12-27 AU AU2007339839A patent/AU2007339839A1/en not_active Abandoned
- 2007-12-27 CN CN200780051927.6A patent/CN101622618B/zh not_active Expired - Fee Related
- 2007-12-27 NZ NZ578672A patent/NZ578672A/xx unknown
- 2007-12-27 BR BRPI0720718-2A patent/BRPI0720718A2/pt not_active Application Discontinuation
- 2007-12-27 JP JP2009544261A patent/JP5379696B2/ja not_active Expired - Fee Related
- 2007-12-27 CA CA2674294A patent/CA2674294C/en active Active
- 2007-12-27 EP EP07869971A patent/EP2115638A1/en not_active Ceased
- 2007-12-28 AR ARP070105966A patent/AR064694A1/es not_active Application Discontinuation
-
2008
- 2008-08-22 US US12/196,930 patent/US8321425B2/en active Active
-
2013
- 2013-01-25 JP JP2013011827A patent/JP2013077333A/ja not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
NZ578672A (en) | 2012-08-31 |
CA2674294A1 (en) | 2008-07-10 |
AR064694A1 (es) | 2009-04-22 |
US20090198674A1 (en) | 2009-08-06 |
WO2008083211A1 (en) | 2008-07-10 |
CN101622618B (zh) | 2017-06-20 |
CA2674294C (en) | 2017-03-07 |
AU2007339839A1 (en) | 2008-07-10 |
BRPI0720718A2 (pt) | 2014-04-01 |
EP2115638A1 (en) | 2009-11-11 |
JP2013077333A (ja) | 2013-04-25 |
JP2010515171A (ja) | 2010-05-06 |
CN101622618A (zh) | 2010-01-06 |
US8321425B2 (en) | 2012-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5379696B2 (ja) | 概念ベースの検索とランク付けを伴う情報検索のシステム、方法およびソフトウェア | |
CN107993724B (zh) | 一种医学智能问答数据处理的方法及装置 | |
US10650058B2 (en) | Information retrieval systems with database-selection aids | |
Balog et al. | Formal models for expert finding in enterprise corpora | |
JP6095621B2 (ja) | 回答候補間の関係を識別および表示する機構、方法、コンピュータ・プログラム、ならびに装置 | |
CN103678576B (zh) | 基于动态语义分析的全文检索系统 | |
Kim et al. | Automatic boolean query suggestion for professional search | |
US8140524B1 (en) | Estimating confidence for query revision models | |
CA2603673C (en) | Integration of multiple query revision models | |
US20130268519A1 (en) | Fact verification engine | |
US20110078205A1 (en) | Method and system for finding appropriate semantic web ontology terms from words | |
US20060230005A1 (en) | Empirical validation of suggested alternative queries | |
JP2008537225A (ja) | クエリについての検索システムおよび方法 | |
CA2886603A1 (en) | A method and system for monitoring social media and analyzing text to automate classification of user posts using a facet based relevance assessment model | |
Lossio Ventura et al. | Biomedical terminology extraction: A new combination of statistical and web mining approaches | |
US20090094212A1 (en) | Natural local search engine | |
Wu et al. | Exploring noise control strategies for UMLS-based query expansion in health and biomedical information retrieval | |
Juan | An effective similarity measurement for FAQ question answering system | |
RU2473119C1 (ru) | Способ и система семантического поиска электронных документов | |
Oard et al. | TREC 2006 at Maryland: Blog, Enterprise, Legal and QA Tracks. | |
JP2012104051A (ja) | 文書インデックス作成装置 | |
JP4428703B2 (ja) | 情報検索方法及びそのシステム並びにコンピュータプログラム | |
JP2010282403A (ja) | 文書検索方法 | |
CN115905577B (zh) | 知识图谱的构建方法及装置、法规检索方法和装置 | |
AU2013205851B2 (en) | Information-retrieval systems, methods, and software with concept-based searching and ranking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120725 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121024 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121031 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121122 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121130 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121221 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130220 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130517 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130524 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130619 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130626 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20130719 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20130726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130820 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130912 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130927 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5379696 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |