JP5155001B2 - 文書検索装置 - Google Patents
文書検索装置 Download PDFInfo
- Publication number
- JP5155001B2 JP5155001B2 JP2008095462A JP2008095462A JP5155001B2 JP 5155001 B2 JP5155001 B2 JP 5155001B2 JP 2008095462 A JP2008095462 A JP 2008095462A JP 2008095462 A JP2008095462 A JP 2008095462A JP 5155001 B2 JP5155001 B2 JP 5155001B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- document
- expression
- formula
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3341—Query execution using boolean model
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
hit(A+B+…)=min(N,hit(A)+hit(B)+…)
で推定する。OR結合の場合は、式の構成要素の推定値を足した値が式全体の推定値となる。ただし、足した結果が総文書数を上回る場合は、総文書数Nを推定値とする。
hit(A*B*…)=min(hit(A),hit(B),…)
で推定する。AND結合の場合は、式の構成要素の推定値の中で最小のものが式全体の推定値となる。
hit(A+B)=hit(A)+hit(B)−hit(A*B)
hit(A*B)=hit(A)*hit(B)/N
を同じく再帰的に適用していく。本発明の実施の形態では、確率的な推定ではなく、上記の最小値による推定を用いる。
101 CPU
102 メモリ
103 文書DB
104 検索制御部
105 検索部
11 ネットワーク
121,112,113 検索クライアント
Claims (6)
- プロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、検索対象の文書及び前記文書を検索するためのインデックス情報を格納する文書DBとを用い、キーワードの論理式から成る検索式から文書を検索する文書検索装置において、
複数の検索式を、それぞれの予測検索速度に基づいて複数の検索式集合に振り分ける検索式制御部と、
振り分けられた前記複数の検索式集合を予測検索速度の速い集合から順次検索を行い、かつ、それぞれの検索処理では、対応する検索式集合内の検索式をまとめて一括検索する検索部と
を備えることを特徴とする文書検索装置。 - 請求項1記載の文書検索装置において、前記検索部は、ある検索式集合1を一括検索している途中に到着した検索式の予測検索速度が検索式集合1の次に一括検索される検索式集合2の予測検索速度より速いとき、当該検索式を前記検索式集合2に含めて一括検索することを特徴とする文書検索装置。
- 請求項1記載の文書検索装置において、一定長の連続文字列が出現する検索対象の文書リストを前記インデックス情報として前記文書DBに格納し、前記一括検索では、前記インデックス情報を用い前記検索式内の各キーワードを構成する連続文字列の接続条件を考慮しないインデックス検索を行い、前記インデックス検索によって得られた各文書を、先頭の文字から走査しながら前記検索式内の各キーワードを構成する連続文字列の接続条件を検査し、前記検査に合格した文書を最終的な検索結果として出力することを特徴とする文書検索装置。
- 請求項3記載の文書検索装置において、前記検索制御部は前記インデックス情報を用いて、前記検索式内の各キーワードを構成する各連続文字列に対してその連続文字列が出現する文書数を取得し、前記文書数の組み合わせから前記検索式のインデックス検索の結果の文書数を予測し、前記予測文書数を前記予測検索速度とすることを特徴とする文書検索装置。
- 請求項3記載の文書検索装置において、過去に処理した検索式のインデックス検索の結果の文書数をデータとして蓄積し、前記検索制御部において検索式の振り分けを行う際に、振り分けのためのパラメータを前記蓄積したデータから計算することを特徴とする文書検索装置。
- 請求項5記載の文書検索装置において、過去に処理した検索式の情報が無い初期状態ではあらかじめ指定したパラメータを振り分けに使い、検索式が一定個数蓄積される度に、それまでに蓄積したデータを用いて振り分けのためのパラメータを更新することを特徴とする文書検索装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008095462A JP5155001B2 (ja) | 2008-04-01 | 2008-04-01 | 文書検索装置 |
US12/342,166 US7984044B2 (en) | 2008-04-01 | 2008-12-23 | System or program for searching documents |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008095462A JP5155001B2 (ja) | 2008-04-01 | 2008-04-01 | 文書検索装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2009251686A JP2009251686A (ja) | 2009-10-29 |
JP2009251686A5 JP2009251686A5 (ja) | 2011-03-03 |
JP5155001B2 true JP5155001B2 (ja) | 2013-02-27 |
Family
ID=41118641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008095462A Expired - Fee Related JP5155001B2 (ja) | 2008-04-01 | 2008-04-01 | 文書検索装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7984044B2 (ja) |
JP (1) | JP5155001B2 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110029985A1 (en) * | 2009-07-31 | 2011-02-03 | Nokia Corporation | Method and apparatus for coordinating resource access |
CN104933669A (zh) * | 2009-10-16 | 2015-09-23 | 日本电气株式会社 | 人物服装特征提取装置及方法 |
JP5552448B2 (ja) * | 2011-01-28 | 2014-07-16 | 株式会社日立製作所 | 検索式生成装置、検索システム、検索式生成方法 |
JP5678691B2 (ja) | 2011-01-28 | 2015-03-04 | 富士通株式会社 | 検索制御装置、検索制御プログラムおよび検索制御方法 |
DE212011100098U1 (de) | 2011-04-28 | 2013-01-10 | Google Inc. | Präsentieren von Suchergebnissen für Galerie-Webseiten |
JP5799706B2 (ja) * | 2011-09-26 | 2015-10-28 | 富士通株式会社 | 検索要求処理装置 |
US9002772B2 (en) | 2011-11-18 | 2015-04-07 | International Business Machines Corporation | Scalable rule-based processing system with trigger rules and rule evaluator |
US8990070B2 (en) | 2011-11-18 | 2015-03-24 | International Business Machines Corporation | Computer-based construction of arbitrarily complex formal grammar expressions |
US9069882B2 (en) * | 2013-01-22 | 2015-06-30 | International Business Machines Corporation | Mapping and boosting of terms in a format independent data retrieval query |
US20150112976A1 (en) * | 2013-10-17 | 2015-04-23 | Nicole Lang Beebe | Relevancy ranking information retrieval system and method of using the same |
DE112015002839T5 (de) * | 2014-06-16 | 2017-03-09 | Nec Corporation | Kriterienerzeugungsvorrichtung, Kriterienerzeugungsverfahren, Speichermedium, das ein Kriterienerzeugungsprogramm speichert, Datenbanksuchsystem und Speichermedium, das ein Datenbanksuchprogramm aufweist |
US10282448B2 (en) * | 2014-11-18 | 2019-05-07 | Huawei International Pte. Ltd. | System and method for searching a symmetrically encrypted database for conjunctive keywords |
JP6737117B2 (ja) * | 2016-10-07 | 2020-08-05 | 富士通株式会社 | 符号化データ検索プログラム、符号化データ検索方法および符号化データ検索装置 |
US10956416B2 (en) * | 2019-03-12 | 2021-03-23 | International Business Machines Corporation | Data schema discovery with query optimization |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5454105A (en) | 1989-06-14 | 1995-09-26 | Hitachi, Ltd. | Document information search method and system |
JPH0561919A (ja) * | 1991-04-25 | 1993-03-12 | Hitachi Ltd | 多重データ検索方法および装置 |
JP3343989B2 (ja) * | 1993-05-17 | 2002-11-11 | 株式会社日立製作所 | 文書検索方法 |
US20050278368A1 (en) * | 2004-06-08 | 2005-12-15 | Benedikt Michael A | System and method for XML data integration |
-
2008
- 2008-04-01 JP JP2008095462A patent/JP5155001B2/ja not_active Expired - Fee Related
- 2008-12-23 US US12/342,166 patent/US7984044B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009251686A (ja) | 2009-10-29 |
US7984044B2 (en) | 2011-07-19 |
US20090248652A1 (en) | 2009-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5155001B2 (ja) | 文書検索装置 | |
JP4980148B2 (ja) | 文書検索方法 | |
US11775501B2 (en) | Trace and span sampling and analysis for instrumented software | |
US6820121B1 (en) | Methods systems and computer program products for processing an event based on policy rules using hashing | |
JP4981221B2 (ja) | メディア・セグメント化システムおよび関連する方法 | |
US10289717B2 (en) | Semantic search apparatus and method using mobile terminal | |
WO2021052177A1 (zh) | 日志解析方法、装置、服务器和存储介质 | |
US9164980B2 (en) | Name identification rule generating apparatus and name identification rule generating method | |
JPH11203294A (ja) | 情報検索システム、装置、方法及び記録媒体 | |
CN113015970A (zh) | 划分知识图 | |
CN111104511A (zh) | 一种提取热点话题的方法、装置及存储介质 | |
US11281645B2 (en) | Data management system, data management method, and computer program product | |
US20160342652A1 (en) | Database query cursor management | |
WO2020181820A1 (zh) | 数据缓存方法、装置、计算机设备和存储介质 | |
US10884865B2 (en) | Identifying redundant nodes in a knowledge graph data structure | |
JPH10240766A (ja) | 情報検索方法および情報検索装置 | |
US20150106376A1 (en) | Document tagging and retrieval using entity specifiers | |
JP2004326480A (ja) | 大量データの分散並列分析方法 | |
US20230267033A1 (en) | Recommending remediation actions for incidents identified by performance management systems | |
US11922222B1 (en) | Generating a modified component for a data intake and query system using an isolated execution environment image | |
JP4952309B2 (ja) | 負荷分析システム、方法、及び、プログラム | |
RU2757592C1 (ru) | Способ и система для кластеризации документов | |
JP5652282B2 (ja) | 検索制御プログラム、検索制御方法、検索システム | |
RU2490702C1 (ru) | Способ ускорения обработки множественных запросов типа select к rdf базе данных с помощью графического процессора | |
US11720591B1 (en) | Virtual metrics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110113 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121031 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121206 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5155001 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |