JP2009251686A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2009251686A5 JP2009251686A5 JP2008095462A JP2008095462A JP2009251686A5 JP 2009251686 A5 JP2009251686 A5 JP 2009251686A5 JP 2008095462 A JP2008095462 A JP 2008095462A JP 2008095462 A JP2008095462 A JP 2008095462A JP 2009251686 A5 JP2009251686 A5 JP 2009251686A5
- Authority
- JP
- Japan
- Prior art keywords
- search
- document
- expression
- predicted
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000014509 gene expression Effects 0.000 claims 13
- 230000000875 corresponding Effects 0.000 claims 1
- 238000007689 inspection Methods 0.000 claims 1
- 238000000034 method Methods 0.000 claims 1
Claims (6)
- プロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、検索対象の文書及び前記文書を検索するためのインデックス情報を格納する文書DBとを用い、キーワードの論理式から成る検索式から文書を検索する文書検索装置において、
複数の検索式を、それぞれの予測検索速度に基づいて複数の検索式集合に振り分ける検索式制御部と、
振り分けられた前記複数の検索式集合を予測検索速度の速い集合から順次検索を行い、かつ、それぞれの検索処理では、対応する検索式集合内の検索式をまとめて一括検索する検索部と
を備えることを特徴とする文書検索装置。 - 請求項1記載の文書検索装置において、前記検索部は、ある検索式集合1を一括検索している途中に到着した検索式の予測検索速度が検索式集合1の次に一括検索される検索式集合2の予測検索速度より速いとき、当該検索式を前記検索式集合2に含めて一括検索することを特徴とする文書検索装置。
- 請求項1記載の文書検索装置において、一定長の連続文字列が出現する検索対象の文書リストを前記インデックス情報として前記文書DBに格納し、前記一括検索では、前記インデックス情報を用い前記検索式内の各キーワードを構成する連続文字列の接続条件を考慮しないインデックス検索を行い、前記インデックス検索によって得られた各文書を、先頭の文字から走査しながら前記検索式内の各キーワードを構成する連続文字列の接続条件を検査し、前記検査に合格した文書を最終的な検索結果として出力することを特徴とする文書検索装置。
- 請求項3記載の文書検索装置において、前記検索制御部は前記インデックス情報を用いて、前記検索式内の各キーワードを構成する各連続文字列に対してその連続文字列が出現する文書数を取得し、前記文書数の組み合わせから前記検索式のインデックス検索の結果の文書数を予測し、前記予測文書数を前記予測検索速度とすることを特徴とする文書検索装置。
- 請求項3記載の文書検索装置において、過去に処理した検索式のインデックス検索の結果の文書数をデータとして蓄積し、前記検索制御部において検索式の振り分けを行う際に、振り分けのためのパラメータを前記蓄積したデータから計算することを特徴とする文書検索装置。
- 請求項5記載の文書検索装置において、過去に処理した検索式の情報が無い初期状態ではあらかじめ指定したパラメータを振り分けに使い、検索式が一定個数蓄積される度に、それまでに蓄積したデータを用いて振り分けのためのパラメータを更新することを特徴とする文書検索装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008095462A JP5155001B2 (ja) | 2008-04-01 | 2008-04-01 | 文書検索装置 |
US12/342,166 US7984044B2 (en) | 2008-04-01 | 2008-12-23 | System or program for searching documents |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008095462A JP5155001B2 (ja) | 2008-04-01 | 2008-04-01 | 文書検索装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2009251686A JP2009251686A (ja) | 2009-10-29 |
JP2009251686A5 true JP2009251686A5 (ja) | 2011-03-03 |
JP5155001B2 JP5155001B2 (ja) | 2013-02-27 |
Family
ID=41118641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008095462A Expired - Fee Related JP5155001B2 (ja) | 2008-04-01 | 2008-04-01 | 文書検索装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7984044B2 (ja) |
JP (1) | JP5155001B2 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110029985A1 (en) * | 2009-07-31 | 2011-02-03 | Nokia Corporation | Method and apparatus for coordinating resource access |
EP2490171B1 (en) * | 2009-10-16 | 2020-11-25 | Nec Corporation | Person image search starting from clothing query text. |
JP5552448B2 (ja) * | 2011-01-28 | 2014-07-16 | 株式会社日立製作所 | 検索式生成装置、検索システム、検索式生成方法 |
JP5678691B2 (ja) | 2011-01-28 | 2015-03-04 | 富士通株式会社 | 検索制御装置、検索制御プログラムおよび検索制御方法 |
DE212011100098U1 (de) | 2011-04-28 | 2013-01-10 | Google Inc. | Präsentieren von Suchergebnissen für Galerie-Webseiten |
JP5799706B2 (ja) * | 2011-09-26 | 2015-10-28 | 富士通株式会社 | 検索要求処理装置 |
US9002772B2 (en) | 2011-11-18 | 2015-04-07 | International Business Machines Corporation | Scalable rule-based processing system with trigger rules and rule evaluator |
US8990070B2 (en) | 2011-11-18 | 2015-03-24 | International Business Machines Corporation | Computer-based construction of arbitrarily complex formal grammar expressions |
US9069882B2 (en) * | 2013-01-22 | 2015-06-30 | International Business Machines Corporation | Mapping and boosting of terms in a format independent data retrieval query |
US20150112976A1 (en) * | 2013-10-17 | 2015-04-23 | Nicole Lang Beebe | Relevancy ranking information retrieval system and method of using the same |
US10769144B2 (en) * | 2014-06-16 | 2020-09-08 | Nec Corporation | Database search system, database search method, and non-transitory recording medium |
US10282448B2 (en) * | 2014-11-18 | 2019-05-07 | Huawei International Pte. Ltd. | System and method for searching a symmetrically encrypted database for conjunctive keywords |
JP6737117B2 (ja) * | 2016-10-07 | 2020-08-05 | 富士通株式会社 | 符号化データ検索プログラム、符号化データ検索方法および符号化データ検索装置 |
US10956416B2 (en) * | 2019-03-12 | 2021-03-23 | International Business Machines Corporation | Data schema discovery with query optimization |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5454105A (en) * | 1989-06-14 | 1995-09-26 | Hitachi, Ltd. | Document information search method and system |
JPH0561919A (ja) * | 1991-04-25 | 1993-03-12 | Hitachi Ltd | 多重データ検索方法および装置 |
JP3343989B2 (ja) * | 1993-05-17 | 2002-11-11 | 株式会社日立製作所 | 文書検索方法 |
US20050278368A1 (en) * | 2004-06-08 | 2005-12-15 | Benedikt Michael A | System and method for XML data integration |
-
2008
- 2008-04-01 JP JP2008095462A patent/JP5155001B2/ja not_active Expired - Fee Related
- 2008-12-23 US US12/342,166 patent/US7984044B2/en not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009251686A5 (ja) | ||
AU2010200478B2 (en) | Multiple index based information retrieval system | |
JP4976666B2 (ja) | 情報検索システムにおけるフレーズ識別方法 | |
KR101223172B1 (ko) | 정보 검색 시스템에서의 문구 기반 서치 | |
US7702618B1 (en) | Information retrieval system for archiving multiple document versions | |
JP2008146602A5 (ja) | ||
CN105912526A (zh) | 一种面向体育比赛直播文字的体育新闻自动构建方法及装置 | |
NO335144B1 (no) | Frasebasert generasjon av dokumentbeskrivelser | |
US8732160B2 (en) | Exploring large textual data sets via interactive aggregation | |
CN103914569B (zh) | 输入提示方法、装置及字典树模型的创建方法、装置 | |
CN101246499A (zh) | 网络信息搜索方法及系统 | |
JP2012168925A5 (ja) | ||
CN103544307B (zh) | 一种不依赖文档库的多搜索引擎自动化对比评测方法 | |
JP2010211793A (ja) | 自動オントロジーのためのドメインコーパス及び辞書の生成 | |
JP2007042069A5 (ja) | ||
US10452692B2 (en) | Method and an apparatus for fast merging inverted chains | |
Cartright et al. | Fast query expansion using approximations of relevance models | |
CN106815265A (zh) | 裁判文书的搜索方法及装置 | |
CN104572720A (zh) | 一种网页信息排重的方法、装置及计算机可读存储介质 | |
Abuaiadah et al. | On the impact of dataset characteristics on arabic document classification | |
CN106528726A (zh) | 基于关键词优化实现搜索引擎优化技术 | |
JP2012532375A5 (ja) | ||
CN103279492A (zh) | 一种抓取网页的方法和装置 | |
Wang et al. | Re-ranking search results using semantic similarity | |
CN106933818A (zh) | 一种快速的多关键字文本匹配方法及装置 |