JP2009187211A - 情報検索システム、情報検索方法およびプログラム - Google Patents
情報検索システム、情報検索方法およびプログラム Download PDFInfo
- Publication number
- JP2009187211A JP2009187211A JP2008025444A JP2008025444A JP2009187211A JP 2009187211 A JP2009187211 A JP 2009187211A JP 2008025444 A JP2008025444 A JP 2008025444A JP 2008025444 A JP2008025444 A JP 2008025444A JP 2009187211 A JP2009187211 A JP 2009187211A
- Authority
- JP
- Japan
- Prior art keywords
- search
- index
- information
- score calculation
- calculation information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】情報検索システムは、索引語について、他の検索インデックス又は情報処理システムから取得したスコア演算情報を格納可能な検索インデックスと、検索の際に、前記検索インデックスに格納されたスコア演算情報を用いてスコア演算を行って検索結果を生成する検索手段と、を備える。
【選択図】図1
Description
図1は、本発明の第1の実施形態に係る情報検索システムの概要構成を示す図である。
図1を参照すると、本発明の第1の実施形態に係る情報検索システムは、文書格納手段1と、インデックス登録手段2と、インデックス31〜33と、検索手段41〜43と、マージ手段5と、検索条件入力手段6と、検索結果提示手段7とを備えている。
・ユーザが保持するパーソナルコンピュータのハードディスク装置や、
・NAS(Network Attached Storage)等の外部装置、
・WWW(World Wide Web)、
・Intranet(企業内のWebページ群)、
・バックアップのための記憶装置および情報システム、
・データを出力する情報システム(例えば、データベースシステムや、データベースなどのシステムの情報から目的に合わせた情報を出力するビジネスインテリジェンス(BI)システムなど)
等が挙げられる。
続いて、本発明の第2の実施形態について図面を参照して詳細に説明する。例えば、非特許文献3のような時系列にインデックスを区分する情報検索システムでは、個々のインデックス内で完結するスコア演算情報を保持し、そのスコア演算情報を用いて検索することにも価値がある。
2 インデックス登録手段
5 マージ手段
6 検索条件入力手段
7 検索結果提示手段
8 スコア演算方法選定手段
21 文書取得手段
22 索引語抽出手段
23 索引語及びスコア演算情報登録手段
24 スコア演算情報取得手段
31 インデックス
32 インデックス
33 インデックス
41 検索手段
42 検索手段
43 検索手段
311 文書リスト格納位置特定情報格納手段
312 文書リスト及びスコア演算情報格納手段
321 文書リスト格納位置特定情報格納手段
322 文書リスト及びスコア演算情報格納手段
411 文書リスト及びスコア演算情報取得手段
412 スコア演算処理手段
413 検索結果出力手段
Claims (19)
- 索引語について、他の検索インデックス又は情報処理システムから取得したスコア演算情報を格納可能な検索インデックスと、
検索の際に、前記検索インデックスに格納されたスコア演算情報を用いてスコア演算を行って検索結果を生成する検索手段と、を備えたこと、
を特徴とする情報検索システム。 - 個々の検索インデックスが、前記他の検索インデックス又は情報処理システムから取得したスコア演算情報を格納可能である複数の検索インデックスを備えること、
を特徴とする請求項1に記載の情報検索システム。 - 所定のインデックス更新規則に従って、前記他の検索インデックス又は情報処理システムから当該索引語のスコア演算情報を取得して、前記検索インデックスを更新するインデックス更新手段を備えること、を特徴とする請求項1又は2に記載の情報検索システム。
- 前記インデックス更新手段は、
所定の文書から索引語を抽出する手段と、
他の検索インデックス又は情報処理システムから、当該索引語のスコア演算情報を取得する手段と、
更新対象の検索インデックスに、前記索引語と、前記スコア演算情報とを関連付けて格納する手段と、を含むこと、
を特徴とする請求項3に記載の情報検索システム。 - 前記インデックス更新手段は、
前記索引語と、自インデックスのスコア演算情報と、前記他の検索インデックス又は情報処理システムから取得したスコア演算情報と、を関連付けて格納する請求項3に記載の情報検索システム。 - 前記インデックス更新手段は、
前記自インデックスのスコア演算情報と、前記他の検索インデックス又は情報処理システムから取得したスコア演算情報と、を記憶媒体上の連続した位置に格納すること、を特徴とする請求項5に記載の情報検索システム。 - 前記スコア演算情報は、検索対象文書集合における当該索引文字列を含む文書数を示す文書頻度情報である請求項1乃至6いずれか一に記載の情報検索システム。
- 前記他の検索インデックス又は情報処理システムから取得したスコア演算情報として、検索対象文書全体のスコア演算情報が格納されている請求項2乃至7いずれか一に記載の情報検索システム。
- 前記他の検索インデックス又は情報処理システムから取得したスコア演算情報として、他の検索インデックスのスコア演算情報が、選択可能に個別に格納されている請求項2乃至7いずれか一に記載の情報検索システム。
- 前記各検索インデックスは時系列に分割されており、前記他の検索インデックスから取得したスコア演算情報として、時系列的に過去に当たる検索インデックスのスコア演算情報が格納されている請求項2乃至7いずれか一に記載の情報検索システム。
- 更に、スコア演算に用いる前記他の検索インデックスのスコア演算情報の組み合わせを選定するスコア演算方法選定手段と、を備えたことを特徴とする請求項1乃至10いずれか一に記載の情報検索システム。
- 検索インデックスを備える情報検索システムにおける情報検索方法であって、
前記検索インデックスの更新の際に、他の検索インデックス又は情報処理システムから更新する索引語についてのスコア演算情報を取得し、更新対象の検索インデックスに格納しておき、
任意の検索インデックスを用いた検索の際に、当該検索インデックスに格納されたスコア演算情報を用いてスコア演算を行って検索結果を生成すること、
を特徴とする情報検索方法。 - 前記スコア演算情報は、検索対象文書集合における当該索引文字列を含む文書数を示す文書頻度情報である請求項12に記載の情報検索方法。
- 前記検索インデックスの更新の際に、自インデックスを含むすべての検索インデックスのスコア演算情報に基づいて算出した検索対象文書全体のスコア演算情報を、前記更新対象の検索インデックスに格納する請求項12又は13に記載の情報検索方法。
- 前記検索インデックスの更新の際に、他の検索インデックスのスコア演算情報を取得し、前記更新対象の検索インデックスに、前記他の検索インデックスのスコア演算情報を選択可能に個別に格納する請求項12又は13に記載の情報検索方法。
- 所定のタイミングで検索インデックスを新設してゆき、
前記検索インデックスを新設した際に、前記他の検索インデックスのスコア演算情報として、時系列的に過去に当たる検索インデックスのスコア演算情報を格納する請求項12又は13に記載の情報検索方法。 - 任意の検索インデックスを用いた検索の際に、スコア演算に用いる前記他の検索インデックスのスコア演算情報の組み合わせの選択を受け付けること、を特徴とする請求項12乃至16いずれか一に記載の情報検索方法。
- 索引語について、他の検索インデックス又は情報処理システムから取得したスコア演算情報を格納可能な検索インデックスを備える情報検索システムを構成するコンピュータに実行させるプログラムであって、
検索の際に、前記検索インデックスに格納された前記他の検索インデックス又は情報処理システムから取得したスコア演算情報を用いてスコア演算を行って検索結果を生成する検索手段として前記コンピュータを機能させることを特徴とするプログラム。 - 他の検索インデックス又は情報処理システムから取得したスコア演算情報を格納可能な検索インデックスを備える情報検索システムを構成するコンピュータに実行させるプログラムであって、
所定のインデックス更新規則に従って、前記他の検索インデックス又は情報処理システムから当該索引語のスコア演算情報を取得して、前記検索インデックスを更新するインデックス更新手段として前記コンピュータを機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008025444A JP5374881B2 (ja) | 2008-02-05 | 2008-02-05 | 情報検索システム、情報検索方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008025444A JP5374881B2 (ja) | 2008-02-05 | 2008-02-05 | 情報検索システム、情報検索方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009187211A true JP2009187211A (ja) | 2009-08-20 |
JP5374881B2 JP5374881B2 (ja) | 2013-12-25 |
Family
ID=41070396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008025444A Active JP5374881B2 (ja) | 2008-02-05 | 2008-02-05 | 情報検索システム、情報検索方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5374881B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012003740A (ja) * | 2010-06-16 | 2012-01-05 | Fuji Xerox Co Ltd | 検索結果生成方法、検索結果生成プログラムおよび検索システム |
JP2012058936A (ja) * | 2010-09-08 | 2012-03-22 | Dainippon Printing Co Ltd | 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法及びプログラム |
WO2013179441A1 (ja) * | 2012-05-31 | 2013-12-05 | 株式会社日立製作所 | 検索サーバ、検索方法及びプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11265393A (ja) * | 1998-03-17 | 1999-09-28 | Matsushita Electric Ind Co Ltd | 情報検索装置 |
JP2004164060A (ja) * | 2002-11-11 | 2004-06-10 | Matsushita Electric Ind Co Ltd | 検索処理システム及び検索処理方法 |
JP2006331117A (ja) * | 2005-05-26 | 2006-12-07 | Ricoh Co Ltd | 文書検索システム、文書検索装置、文書検索方法および文書検索プログラム |
JP2008009918A (ja) * | 2006-06-30 | 2008-01-17 | Fujitsu Ltd | 索引作成プログラム、索引作成装置および索引作成方法 |
-
2008
- 2008-02-05 JP JP2008025444A patent/JP5374881B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11265393A (ja) * | 1998-03-17 | 1999-09-28 | Matsushita Electric Ind Co Ltd | 情報検索装置 |
JP2004164060A (ja) * | 2002-11-11 | 2004-06-10 | Matsushita Electric Ind Co Ltd | 検索処理システム及び検索処理方法 |
JP2006331117A (ja) * | 2005-05-26 | 2006-12-07 | Ricoh Co Ltd | 文書検索システム、文書検索装置、文書検索方法および文書検索プログラム |
JP2008009918A (ja) * | 2006-06-30 | 2008-01-17 | Fujitsu Ltd | 索引作成プログラム、索引作成装置および索引作成方法 |
Non-Patent Citations (2)
Title |
---|
CSNG199900471002; 森 大二郎他: '分散型大規模文書検索システムに関する一検討' 情報処理学会研究報告 Vol.98,No.107(98-DD-15-2), 19981127, pp.9-16., 社団法人情報処理学会 * |
JPN6012064932; 森 大二郎他: '分散型大規模文書検索システムに関する一検討' 情報処理学会研究報告 Vol.98,No.107(98-DD-15-2), 19981127, pp.9-16., 社団法人情報処理学会 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012003740A (ja) * | 2010-06-16 | 2012-01-05 | Fuji Xerox Co Ltd | 検索結果生成方法、検索結果生成プログラムおよび検索システム |
JP2012058936A (ja) * | 2010-09-08 | 2012-03-22 | Dainippon Printing Co Ltd | 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法及びプログラム |
WO2013179441A1 (ja) * | 2012-05-31 | 2013-12-05 | 株式会社日立製作所 | 検索サーバ、検索方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5374881B2 (ja) | 2013-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5492187B2 (ja) | 編集距離および文書情報を使用する検索結果順位付け | |
US11853334B2 (en) | Systems and methods for generating and using aggregated search indices and non-aggregated value storage | |
US7689574B2 (en) | Index and method for extending and querying index | |
JP5233233B2 (ja) | 情報検索システム、情報検索用インデックスの登録装置、情報検索方法及びプログラム | |
JP4922692B2 (ja) | 検索クエリー作成装置 | |
JP5079471B2 (ja) | 同義語抽出装置 | |
KR20130049111A (ko) | 분산 처리를 이용한 포렌식 인덱스 방법 및 장치 | |
CN110109910A (zh) | 数据处理方法及系统、电子设备和计算机可读存储介质 | |
Hmedeh et al. | Subscription indexes for web syndication systems | |
CN105224624A (zh) | 一种实现倒排链快速归并的方法和装置 | |
JP5374881B2 (ja) | 情報検索システム、情報検索方法およびプログラム | |
Huang et al. | Design a batched information retrieval system based on a concept-lattice-like structure | |
Karras et al. | Query optimization in NoSQL databases using an enhanced localized R-tree index | |
KR101135126B1 (ko) | 메타데이터 기반 색인 및 검색 장치와 그 방법 | |
Yadav et al. | Wavelet tree based hybrid geo-textual indexing technique for geographical search | |
WO2013069149A1 (ja) | データ検索装置、データの検索方法及びプログラム | |
JP5472929B2 (ja) | 文書検索装置、文書検索方法及び文書検索プログラム | |
Rong et al. | Efficient duplicate detection on cloud using a new signature scheme | |
Buranasaksee | Optimization of textual attribute support in generic location-aware rank query | |
Helin et al. | High-Speed Retrieval Method for Unstructured Big Data Platform Based on K-Ary Search Tree Algorithm | |
Sah et al. | ‘Learning to Rank’Text Search Engine Platform for Internal Wikis | |
Kumar et al. | Enhancing the Search Results through Web Structure Mining Using Frequent Pattern Analysis and Linear Correlation Method | |
JP5389715B2 (ja) | 複合語に対する文書数予測装置及び方法及びプログラム | |
Veretennikov | Proximity full-text searches of frequently occurring words with a response time guarantee | |
JP2003030238A (ja) | 並列型情報検索装置および方法と並列型情報検索プログラムおよび該プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110112 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121211 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130827 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130909 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5374881 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |