JP4569179B2 - ドキュメント検索装置 - Google Patents
ドキュメント検索装置 Download PDFInfo
- Publication number
- JP4569179B2 JP4569179B2 JP2004166213A JP2004166213A JP4569179B2 JP 4569179 B2 JP4569179 B2 JP 4569179B2 JP 2004166213 A JP2004166213 A JP 2004166213A JP 2004166213 A JP2004166213 A JP 2004166213A JP 4569179 B2 JP4569179 B2 JP 4569179B2
- Authority
- JP
- Japan
- Prior art keywords
- keyword
- classification code
- classification
- document
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
Claims (5)
- 分類符号に関連づけられた複数のドキュメントを保持するドキュメントデータベースにアクセス可能に接続され、当該ドキュメントデータベースから、与えられた検索条件を満足するドキュメントを検索するドキュメント検索装置であって、
検索条件となるテキストの入力を受け入れる手段と、
前記テキストから少なくとも一つの文字列をキーワードとして抽出するキーワード抽出手段と、
前記ドキュメントデータベースから、前記抽出したキーワードの各々に関係する第1ドキュメント群を抽出し、当該キーワードごとに抽出した第1ドキュメント群を参照し、当該第1ドキュメント群に関連付けられた分類符号の少なくとも一部を用いて生成された、キーワードごとの分類符号のリストを取得するリスト取得手段と、
前記キーワードごとの分類符号のリストから、分類符号ごとに関連するキーワードの数をカウントし、この数に基づいて第1の検索キー候補となる分類符号を選択する手段と、
前記キーワードごとの分類符号のリストに含まれる分類符号の論理和を得、当該論理和に含まれる分類符号の数に対して、前記キーワードごとの分類符号のリストに含まれる分類符号の数の割合をキーワードごとの分類符号の分布割合として演算し、前記キーワード抽出手段が抽出したキーワードのうちから、前記演算したキーワードごとの分類符号の分布割合に基づき、キーワードを中心概念語として取得し、前記キーワードごとの分類符号のリストのうち当該中心概念語に関係する分類符号の出現頻度に基づいて、前記キーワードごとの分類符号のリストのうちから、第2の検索キー候補となる分類符号を選択する手段と、
前記第1の検索キー候補となる分類符号と、第2の検索キー候補となる分類符号とを用いて、前記ドキュメントデータベースから第2ドキュメント群を取得する検索手段と、
を備え、
前記第2ドキュメント群が、検索結果として提示されることを特徴とするドキュメント検索装置。 - 分類符号に関連づけられた複数のドキュメントを保持する第1ドキュメントデータベースと、前記分類符号の検索インデックスを有する第2ドキュメントデータベースとにアクセス可能に接続され、当該第1,第2の少なくとも一方のドキュメントデータベースから、与えられた検索条件を満足するドキュメントを検索するドキュメント検索装置であって、
検索条件となるテキストの入力を受け入れる手段と、
前記テキストから少なくとも一つの文字列をキーワードとして抽出するキーワード抽出手段と、
前記第1ドキュメントデータベースから、前記抽出したキーワードの各々に関係する第1ドキュメント群を抽出し、当該キーワードごとに抽出した第1ドキュメント群を参照し、当該第1ドキュメント群に関連付けられた分類符号の少なくとも一部を用いて生成された、キーワードごとの分類符号のリストを取得するリスト取得手段と、
前記キーワードごとの分類符号のリストから、分類符号ごとに関連するキーワードの数をカウントし、この数に基づいて第1の検索キー候補となる分類符号を選択する手段と、
前記キーワードごとの分類符号のリストに含まれる分類符号の論理和を得、当該論理和に含まれる分類符号の数に対して、前記キーワードごとの分類符号のリストに含まれる分類符号の数の割合をキーワードごとの分類符号の分布割合として演算し、前記キーワード抽出手段が抽出したキーワードのうちから、前記演算したキーワードごとの分類符号の分布割合に基づき、キーワードを中心概念語として取得し、前記キーワードごとの分類符号のリストのうち当該中心概念語に関係する分類符号の出現頻度に基づいて、前記キーワードごとの分類符号のリストのうちから、第2の検索キー候補となる分類符号を選択する手段と、
前記第1の検索キー候補となる分類符号と、第2の検索キー候補となる分類符号とを用いて、前記第1又は第2の少なくとも一方のドキュメントデータベースから第2ドキュメント群を取得する検索手段と、
を備え、
前記第2ドキュメント群が、検索結果として提示されることを特徴とするドキュメント検索装置。 - 請求項1または2に記載のドキュメント検索装置であって、
分類符号と、分類符号に係る文字列を関連付けて保持する分類符号データベースにアクセス可能に接続されており、
前記第1の検索キー候補となる分類符号と、第2の検索キー候補となる分類符号とに係る文字列を、前記分類符号データベースから取得し、当該取得した文字列を提示する提示手段をさらに含む
ことを特徴とするドキュメント検索装置。 - 分類符号に関連づけられた複数のドキュメントを保持するドキュメントデータベースにアクセス可能に接続されたコンピュータに、当該ドキュメントデータベースから、与えられた検索条件を満足するドキュメントを検索させるドキュメント検索プログラムであって、コンピュータを、
検索条件となるテキストの入力を受け入れる手段と、
前記テキストから少なくとも一つの文字列をキーワードとして抽出するキーワード抽出手段と、
前記ドキュメントデータベースから、前記抽出したキーワードの各々に関係する第1ドキュメント群を抽出し、当該キーワードごとに抽出した第1ドキュメント群を参照し、当該第1ドキュメント群に関連付けられた分類符号の少なくとも一部を用いて生成された、キーワードごとの分類符号のリストを取得するリスト取得手段と、
前記キーワードごとの分類符号のリストから、分類符号ごとに関連するキーワードの数をカウントし、この数に基づいて第1の検索キー候補となる分類符号を選択する手段と、
前記キーワードごとの分類符号のリストに含まれる分類符号の論理和を得、当該論理和に含まれる分類符号の数に対して、キーワードごとの分類符号のリストに含まれる分類符号の数の割合をキーワードごとの分類符号の分布割合として演算し、前記キーワード抽出手段が抽出したキーワードのうちから、前記演算したキーワードごとの分類符号の分布割合が、予め定めたしきい値を下回っているキーワードを中心概念語として取得し、前記キーワードごとの分類符号のリストのうち当該中心概念語に関係する分類符号の出現頻度に基づいて、前記キーワードごとの分類符号のリストのうちから、第2の検索キー候補となる分類符号を選択する手段と、
前記第1の検索キー候補となる分類符号と、第2の検索キー候補となる分類符号とを用いて、前記ドキュメントデータベースから第2ドキュメント群を取得する検索手段と、
として機能させ、
前記第2ドキュメント群が、検索結果として提示されることを特徴とするドキュメント検索プログラム。 - 分類符号に関連づけられた複数のドキュメントを保持する第1ドキュメントデータベースと、前記分類符号の検索インデックスを有する第2ドキュメントデータベースとにアクセス可能に接続されたコンピュータに、当該第1又は第2のドキュメントデータベースから、与えられた検索条件を満足するドキュメントを検索させるプログラムであって、コンピュータを、
検索条件となるテキストの入力を受け入れる手段と、
前記テキストから少なくとも一つの文字列をキーワードとして抽出するキーワード抽出手段と、
前記第1ドキュメントデータベースから、前記抽出したキーワードの各々に関係する第1ドキュメント群を抽出し、当該キーワードごとに抽出した第1ドキュメント群を参照し、当該第1ドキュメント群に関連付けられた分類符号の少なくとも一部を用いて生成された、キーワードごとの分類符号のリストを取得するリスト取得手段と、
前記キーワードごとの分類符号のリストから、分類符号ごとに関連するキーワードの数をカウントし、この数に基づいて第1の検索キー候補となる分類符号を選択する手段と、
前記キーワードごとの分類符号のリストに含まれる分類符号の論理和を得、当該論理和に含まれる分類符号の数に対して、キーワードごとの分類符号のリストに含まれる分類符号の数の割合をキーワードごとの分類符号の分布割合として演算し、前記キーワード抽出手段が抽出したキーワードのうちから、前記演算したキーワードごとの分類符号の分布割合が、予め定めたしきい値を下回っているキーワードを中心概念語として取得し、前記キーワードごとの分類符号のリストのうち当該中心概念語に関係する分類符号の出現頻度に基づいて、前記キーワードごとの分類符号のリストのうちから、第2の検索キー候補となる分類符号を選択する手段と、
前記第1の検索キー候補となる分類符号と、第2の検索キー候補となる分類符号とを用いて、前記第1又は第2の少なくとも一方のドキュメントデータベースから第2ドキュメント群を取得する検索手段と、
として機能させ、
前記第2ドキュメント群が、検索結果として提示されることを特徴とするドキュメント検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004166213A JP4569179B2 (ja) | 2004-06-03 | 2004-06-03 | ドキュメント検索装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004166213A JP4569179B2 (ja) | 2004-06-03 | 2004-06-03 | ドキュメント検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005346486A JP2005346486A (ja) | 2005-12-15 |
JP4569179B2 true JP4569179B2 (ja) | 2010-10-27 |
Family
ID=35498794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004166213A Expired - Fee Related JP4569179B2 (ja) | 2004-06-03 | 2004-06-03 | ドキュメント検索装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4569179B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105608071A (zh) * | 2015-12-21 | 2016-05-25 | 北京奇虎科技有限公司 | 用于确定中心词的机器学习算法的生成方法及装置 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4857448B2 (ja) * | 2006-03-10 | 2012-01-18 | 独立行政法人情報通信研究機構 | 多義語による情報検索装置及びプログラム |
TW200837581A (en) * | 2007-03-13 | 2008-09-16 | Sunonwealth Electr Mach Ind Co | Verifying method for reliability of patent data |
JP5060601B2 (ja) * | 2010-08-03 | 2012-10-31 | 株式会社東芝 | 文書分析装置およびプログラム |
US9043350B2 (en) * | 2011-09-22 | 2015-05-26 | Microsoft Technology Licensing, Llc | Providing topic based search guidance |
JP2012216239A (ja) * | 2012-07-12 | 2012-11-08 | Toshiba Corp | 情報処理装置、プログラムおよび情報検索方法 |
JP6623547B2 (ja) | 2015-05-12 | 2019-12-25 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0228769A (ja) * | 1988-07-18 | 1990-01-30 | Nippon Telegr & Teleph Corp <Ntt> | キーワード自動生成装置 |
JPH0424869A (ja) * | 1990-05-21 | 1992-01-28 | Toshiba Corp | 文書処理システム |
JPH05128152A (ja) * | 1991-11-06 | 1993-05-25 | Hitachi Ltd | 文書検索支援方法 |
JPH0675995A (ja) * | 1992-08-27 | 1994-03-18 | Omron Corp | 自動分類付与装置および方法 |
JPH1125108A (ja) * | 1997-07-02 | 1999-01-29 | Matsushita Electric Ind Co Ltd | 関連キーワード自動抽出装置、文書検索装置及びこれらを用いた文書検索システム |
-
2004
- 2004-06-03 JP JP2004166213A patent/JP4569179B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0228769A (ja) * | 1988-07-18 | 1990-01-30 | Nippon Telegr & Teleph Corp <Ntt> | キーワード自動生成装置 |
JPH0424869A (ja) * | 1990-05-21 | 1992-01-28 | Toshiba Corp | 文書処理システム |
JPH05128152A (ja) * | 1991-11-06 | 1993-05-25 | Hitachi Ltd | 文書検索支援方法 |
JPH0675995A (ja) * | 1992-08-27 | 1994-03-18 | Omron Corp | 自動分類付与装置および方法 |
JPH1125108A (ja) * | 1997-07-02 | 1999-01-29 | Matsushita Electric Ind Co Ltd | 関連キーワード自動抽出装置、文書検索装置及びこれらを用いた文書検索システム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105608071A (zh) * | 2015-12-21 | 2016-05-25 | 北京奇虎科技有限公司 | 用于确定中心词的机器学习算法的生成方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2005346486A (ja) | 2005-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7769771B2 (en) | Searching a document using relevance feedback | |
US10552467B2 (en) | System and method for language sensitive contextual searching | |
US20050081146A1 (en) | Relation chart-creating program, relation chart-creating method, and relation chart-creating apparatus | |
JP2010003015A (ja) | 文書検索システム | |
KR100396826B1 (ko) | 정보검색에서 질의어 처리를 위한 단어 클러스터 관리장치 및 그 방법 | |
JPH11102377A (ja) | データベースからドキュメントを検索する方法および装置 | |
JP4569179B2 (ja) | ドキュメント検索装置 | |
US9875298B2 (en) | Automatic generation of a search query | |
JP6533876B2 (ja) | 商品情報表示システム、商品情報表示方法、及びプログラム | |
US8612431B2 (en) | Multi-part record searches | |
JP2001184358A (ja) | カテゴリ因子による情報検索装置,情報検索方法およびそのプログラム記録媒体 | |
JP2014102625A (ja) | 情報検索システム、プログラム、および方法 | |
Ochs et al. | Google Knows Who is Famous Today--Building an Ontology from Search Engine Knowledge and DBpedia | |
JP2005128872A (ja) | 文書検索システム及び文書検索プログラム | |
JP2009129176A (ja) | 構造化文書検索装置、方法およびプログラム | |
Yoon et al. | A conference paper exploring system based on citing motivation and topic | |
JP6173990B2 (ja) | 検索支援装置、方法およびプログラム | |
JP4569178B2 (ja) | 分類符号処理装置 | |
JP4525224B2 (ja) | ドキュメント管理プログラム、ドキュメント管理方法、及びドキュメント管理装置 | |
JP2007323238A (ja) | 強調表示装置及びプログラム | |
JP2014146076A (ja) | 文字列抽出方法、文字列抽出装置、および文字列抽出プログラム | |
JP7284371B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP6967412B2 (ja) | サジェスト生成装置、サジェスト生成プログラム及びサジェスト生成方法 | |
JP2004206608A (ja) | 文書検索方法及び装置並びにプログラム | |
JP2003178057A (ja) | フレーズ生成装置、フレーズ生成方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070517 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20071112 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20071115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091222 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100217 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100420 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100713 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100726 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130820 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |