JP2006085628A - 文書検索装置、文書検索方法、プログラム及び記憶媒体 - Google Patents
文書検索装置、文書検索方法、プログラム及び記憶媒体 Download PDFInfo
- Publication number
- JP2006085628A JP2006085628A JP2004272287A JP2004272287A JP2006085628A JP 2006085628 A JP2006085628 A JP 2006085628A JP 2004272287 A JP2004272287 A JP 2004272287A JP 2004272287 A JP2004272287 A JP 2004272287A JP 2006085628 A JP2006085628 A JP 2006085628A
- Authority
- JP
- Japan
- Prior art keywords
- document
- function
- conforming
- search
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 検索者が入出力部23を操作することで指定した適合文書に基づいて関連文書検索結果から不適合文書抽出部35により不適合文書を自動的に抽出し、学習部36により適合文書及び不適合文書から学習データを生成し、その学習データに基づいて、関連文書検索部32によりデータベース21の文書群から関連文書を検索し、その検索結果から分類部37により適合文書を抽出することによって、コストを抑え高い精度で文書群から検索者が求める適合文書を得ることができる。
【選択図】 図2
Description
21 蓄積部(データベース)
23 表示部(入出力部)
23 操作部(入出力部)
31 第1手段、第1機能、第1ステップ(検索語抽出部)
32 第2手段、第2機能、第2ステップ(関連文書検索部)
32 第3手段、第3機能、第3ステップ(関連文書検索部)
32 第6手段、第6機能、第6ステップ(関連文書検索部)
32 第10手段、第10機能、第10ステップ(関連文書検索部)
32 第12手段、第12機能、第12ステップ(関連文書検索部)
32 第13手段、第13機能、第13ステップ(関連文書検索部)
33 第4手段、第4機能、第4ステップ(適合文書指定部)
34 第5手段、第5機能、第5ステップ(関連語抽出部)
35 第7手段、第7機能、第7ステップ(不適合文書抽出部)
36 第8手段、第8機能、第8ステップ(学習部)
36 第9手段、第9機能、第9ステップ(学習部)
37 第11手段、第11機能、第11ステップ(分類部)
S8 第13手段、第13機能、第13ステップ
Claims (18)
- 操作を受け付ける操作部に対する検索者の入力操作に応じて検索用の語句を検索語として設定する第1手段と、
電子化された複数の文書を文書群として蓄積する蓄積部に蓄積されている文書群から、前記第1手段により設定された前記検索語を含む文書を関連文書として検索する第2手段と、
表示動作を行う表示部に前記第2手段による検索結果を表示させる第3手段と、
前記操作部に対する検索者の入力操作に応じて、前記第2手段により検索された複数の前記関連文書から検索者が求める適合文書を指定する第4手段と、
前記第4手段により指定された前記適合文書に基づいて検索用の語句を関連語として設定する第5手段と、
前記蓄積部に蓄積されている文書群から、前記第5手段により設定された前記関連語を含む文書を関連文書として検索する第6手段と、
前記第6手段により検索された複数の前記関連文書から、前記第4手段により指定された前記適合文書に基づいて検索者が求めない不適合文書を抽出する第7手段と、
前記第4手段により指定された前記適合文書及び前記第7手段により抽出された前記不適合文書に基づいて分類用のパラメータを生成する第8手段と、
前記第8手段により生成された前記パラメータに基づいて前記検索語を再設定する第9手段と、
前記蓄積部に蓄積されている文書群から、前記第9手段により再設定された前記検索語を含む文書を前記関連文書として検索する第10手段と、
前記第10手段により検索された複数の前記関連文書から、前記第8手段により生成された前記パラメータに基づいて前記適合文書を抽出する第11手段と、
前記表示部に前記第11手段による抽出結果を表示させる第12手段と、
を備える文書検索装置。 - 前記蓄積部を備える、
請求項1記載の文書検索装置。 - 前記操作部及び前記表示部を備える、
請求項1又は2記載の文書検索装置。 - 前記第3手段は、前記表示部に前記第6手段による検索結果も表示させ、
前記第4手段は、前記操作部に対する検索者の入力操作に応じて、前記第6手段により検索された複数の前記関連文書からも前記適合文書を指定し、
前記第3手段、前記第4手段、第5手段及び第6手段を複数回繰り返す第13手段を備える、
請求項1、2又は3記載の文書検索装置。 - 前記第7手段は、前記適合文書及び前記関連文書間の類似度を求め、その類似度に基づいて複数の前記関連文書から前記不適合文書を抽出する、
請求項1、2、3又は4記載の文書検索装置。 - 前記第7手段は、前記適合文書と同数の前記不適合文書を抽出する、
請求項1、2、3、4又は5記載の文書検索装置。 - 前記第11手段は、前記パラメータに基づいて前記適合文書と前記不適合文書とを分類するフィルタリングを行って前記第10手段により検索された複数の前記関連文書から前記適合文書を抽出する、
請求項1、2、3、4、5又は6記載の文書検索装置。 - 操作を受け付ける操作部に対する検索者の入力操作に応じて検索用の語句を検索語として設定する第1ステップと、
電子化された複数の文書を文書群として蓄積する蓄積部に蓄積されている文書群から、前記第1ステップにより設定された前記検索語を含む文書を関連文書として検索する第2ステップと、
表示動作を行う表示部に前記第2ステップによる検索結果を表示させる第3ステップと、
前記操作部に対する検索者の入力操作に応じて、前記第2ステップにより検索された複数の前記関連文書から検索者が求める適合文書を指定する第4ステップと、
前記第4ステップにより指定された前記適合文書に基づいて検索用の語句を関連語として設定する第5ステップと、
前記蓄積部に蓄積されている文書群から、前記第5ステップにより設定された前記関連語を含む文書を関連文書として検索する第6ステップと、
前記第6ステップにより検索された複数の前記関連文書から、前記第4ステップにより指定された前記適合文書に基づいて検索者が求めない不適合文書を抽出する第7ステップと、
前記第4ステップにより指定された前記適合文書及び前記第7ステップにより抽出された前記不適合文書に基づいて分類用のパラメータを生成する第8ステップと、
前記第8ステップにより生成された前記パラメータに基づいて前記検索語を再設定する第9ステップと、
前記蓄積部に蓄積されている文書群から、前記第9ステップにより再設定された前記検索語を含む文書を前記関連文書として検索する第10ステップと、
前記第10ステップにより検索された複数の前記関連文書から、前記第8ステップにより生成された前記パラメータに基づいて前記適合文書を抽出する第11ステップと、
前記表示部に前記第11ステップによる抽出結果を表示させる第12ステップと、
を備える文書検索方法。 - 前記第3ステップは、前記表示部に前記第6ステップによる検索結果も表示させ、
前記第4ステップは、前記操作部に対する検索者の入力操作に応じて、前記第6ステップにより検索された複数の前記関連文書からも前記適合文書を指定し、
前記第3ステップ、前記第4ステップ、第5ステップ及び第6ステップを複数回繰り返す第13ステップを備える、
請求項8記載の文書検索方法。 - 前記第7ステップは、前記適合文書及び前記関連文書間の類似度を求め、その類似度に基づいて複数の前記関連文書から前記不適合文書を抽出する、
請求項8又は9記載の文書検索方法。 - 前記第7ステップは、前記適合文書と同数の前記不適合文書を抽出する、
請求項8、9又は10記載の文書検索方法。 - 前記第11ステップは、前記パラメータに基づいて前記適合文書と前記不適合文書とを分類するフィルタリングを行って前記第10ステップにより検索された複数の前記関連文書から前記適合文書を抽出する、
請求項8、9、10又は11記載の文書検索方法。 - 操作を受け付ける操作部に対する検索者の入力操作に応じて検索用の語句を検索語として設定する第1機能と、
電子化された複数の文書を文書群として蓄積する蓄積部に蓄積されている文書群から、前記第1機能により設定された前記検索語を含む文書を関連文書として検索する第2機能と、
表示動作を行う表示部に前記第2機能による検索結果を表示させる第3機能と、
前記操作部に対する検索者の入力操作に応じて、前記第2機能により検索された複数の前記関連文書から検索者が求める適合文書を指定する第4機能と、
前記第4機能により指定された前記適合文書に基づいて検索用の語句を関連語として設定する第5機能と、
前記蓄積部に蓄積されている文書群から、前記第5機能により設定された前記関連語を含む文書を関連文書として検索する第6機能と、
前記第6機能により検索された複数の前記関連文書から、前記第4機能により指定された前記適合文書に基づいて検索者が求めない不適合文書を抽出する第7機能と、
前記第4機能により指定された前記適合文書及び前記第7機能により抽出された前記不適合文書に基づいて分類用のパラメータを生成する第8機能と、
前記第8機能により生成された前記パラメータに基づいて前記検索語を再設定する第9機能と、
前記蓄積部に蓄積されている文書群から、前記第9機能により再設定された前記検索語を含む文書を前記関連文書として検索する第10機能と、
前記第10機能により検索された複数の前記関連文書から、前記第8機能により生成された前記パラメータに基づいて前記適合文書を抽出する第11機能と、
前記表示部に前記第11機能による抽出結果を表示させる第12機能と、
をコンピュータに実行させるコンピュータ読取可能なプログラム。 - 前記第3機能は、前記表示部に前記第6機能による検索結果も表示させ、
前記第4機能は、前記操作部に対する検索者の入力操作に応じて、前記第6機能により検索された複数の前記関連文書からも前記適合文書を指定し、
前記第3機能、前記第4機能、第5機能及び第6機能を複数回繰り返す第13機能を前記コンピュータに実行させる、
請求項13記載のプログラム。 - 前記第7機能は、前記適合文書及び前記関連文書間の類似度を求め、その類似度に基づいて複数の前記関連文書から前記不適合文書を抽出する、
請求項13又は14記載のプログラム。 - 前記第7機能は、前記適合文書と同数の前記不適合文書を抽出する、
請求項13、14又は15記載のプログラム。 - 前記第11機能は、前記パラメータに基づいて前記適合文書と前記不適合文書とを分類するフィルタリングを行って前記第10機能により検索された複数の前記関連文書から前記適合文書を抽出する、
請求項13、14、15又は16記載のプログラム。 - 請求項13ないし17のいずれか一記載のプログラムを記憶しているコンピュータ読取可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004272287A JP4520264B2 (ja) | 2004-09-17 | 2004-09-17 | 文書検索装置、文書検索方法、プログラム及び記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004272287A JP4520264B2 (ja) | 2004-09-17 | 2004-09-17 | 文書検索装置、文書検索方法、プログラム及び記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006085628A true JP2006085628A (ja) | 2006-03-30 |
JP4520264B2 JP4520264B2 (ja) | 2010-08-04 |
Family
ID=36164058
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004272287A Expired - Fee Related JP4520264B2 (ja) | 2004-09-17 | 2004-09-17 | 文書検索装置、文書検索方法、プログラム及び記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4520264B2 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001256253A (ja) * | 2000-03-13 | 2001-09-21 | Kddi Corp | 文書フィルタリング方法および装置 |
JP2002073681A (ja) * | 2000-08-28 | 2002-03-12 | Hitachi Ltd | 類似文書検索方法および装置および、類似文書検索方法のためのプログラムが記録された記憶媒体 |
JP2002215642A (ja) * | 2001-01-23 | 2002-08-02 | Ryosuke Okada | フィードバック型インターネット検索方法及びその方法を実施するためのシステムとプログラム記録媒体 |
JP2003316818A (ja) * | 2002-02-21 | 2003-11-07 | Kddi Corp | 情報検索方法及びその装置、コンピュータプログラム |
JP2004178421A (ja) * | 2002-11-28 | 2004-06-24 | Ricoh Co Ltd | 文書検索装置、文書検索方法、プログラムおよび記録媒体 |
JP2004220082A (ja) * | 2003-01-09 | 2004-08-05 | Ntt Data Corp | 文書検索プログラム、文書検索方法および文書検索装置 |
-
2004
- 2004-09-17 JP JP2004272287A patent/JP4520264B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001256253A (ja) * | 2000-03-13 | 2001-09-21 | Kddi Corp | 文書フィルタリング方法および装置 |
JP2002073681A (ja) * | 2000-08-28 | 2002-03-12 | Hitachi Ltd | 類似文書検索方法および装置および、類似文書検索方法のためのプログラムが記録された記憶媒体 |
JP2002215642A (ja) * | 2001-01-23 | 2002-08-02 | Ryosuke Okada | フィードバック型インターネット検索方法及びその方法を実施するためのシステムとプログラム記録媒体 |
JP2003316818A (ja) * | 2002-02-21 | 2003-11-07 | Kddi Corp | 情報検索方法及びその装置、コンピュータプログラム |
JP2004178421A (ja) * | 2002-11-28 | 2004-06-24 | Ricoh Co Ltd | 文書検索装置、文書検索方法、プログラムおよび記録媒体 |
JP2004220082A (ja) * | 2003-01-09 | 2004-08-05 | Ntt Data Corp | 文書検索プログラム、文書検索方法および文書検索装置 |
Non-Patent Citations (1)
Title |
---|
CSNB200100266001, 徳永健伸, 言語と計算5 情報検索と言語処理, 19991125, 初版, 第154−159頁, JP, 財団法人東京大学出版会 * |
Also Published As
Publication number | Publication date |
---|---|
JP4520264B2 (ja) | 2010-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7793209B2 (en) | Electronic apparatus with a web page browsing function | |
US6654742B1 (en) | Method and system for document collection final search result by arithmetical operations between search results sorted by multiple ranking metrics | |
JP4434972B2 (ja) | 情報提供システム、情報提供方法及びそのプログラム | |
JP2005332212A (ja) | 検索サーバ、検索端末、検索方法、及び、検索実行方法 | |
JP5161658B2 (ja) | キーワード入力支援装置、キーワード入力支援方法及びプログラム | |
JP2004126840A (ja) | 文書検索方法、プログラムおよびシステム | |
JP3220886B2 (ja) | 文書検索方法および装置 | |
US20040006460A1 (en) | System and method for problem solution support, and medium storing a program therefor | |
JP4179858B2 (ja) | 文書検索装置、文書検索方法、プログラムおよび記録媒体 | |
JP4754849B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP2018181148A (ja) | 情報出力プログラム、情報出力方法および情報処理装置 | |
JP5579140B2 (ja) | 文書検索装置及び方法及びプログラム | |
JP4699909B2 (ja) | キーワード対応関係分析装置及び分析方法 | |
JP4520264B2 (ja) | 文書検索装置、文書検索方法、プログラム及び記憶媒体 | |
JP6882975B2 (ja) | 対話ログ群からコンテキストを決定可能な対話シナリオ生成装置、プログラム及び方法 | |
CN115858742A (zh) | 问题文本扩充方法、装置、设备及存储介质 | |
JPH11272709A (ja) | ファイル検索方式 | |
JP2004362121A (ja) | 情報検索装置、携帯情報端末装置、情報検索方法、情報検索プログラム及び記録媒体 | |
Zainudin et al. | M-Hadith: Retrieving Malay Haditli text in a mobile application | |
JP2006350749A (ja) | 文書フィルタリング装置、文書フィルタリング方法、プログラムおよび記録媒体 | |
JP2007241635A (ja) | 文書検索装置、情報処理装置、検索結果出力方法、検索結果表示方法およびプログラム | |
JP4029680B2 (ja) | 検索端末装置、検索端末プログラムおよび検索システム | |
JP4574186B2 (ja) | 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置 | |
JP2005258910A (ja) | 階層キーワード抽出装置、方法、およびプログラム | |
JP2010501927A (ja) | コンテンツ検索システムを搭載した情報端末機 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20070208 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070827 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100216 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100518 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100520 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130528 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140528 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |