JP2009251686A5 - - Google Patents

Download PDF

Info

Publication number
JP2009251686A5
JP2009251686A5 JP2008095462A JP2008095462A JP2009251686A5 JP 2009251686 A5 JP2009251686 A5 JP 2009251686A5 JP 2008095462 A JP2008095462 A JP 2008095462A JP 2008095462 A JP2008095462 A JP 2008095462A JP 2009251686 A5 JP2009251686 A5 JP 2009251686A5
Authority
JP
Japan
Prior art keywords
search
document
expression
predicted
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008095462A
Other languages
English (en)
Other versions
JP5155001B2 (ja
JP2009251686A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2008095462A priority Critical patent/JP5155001B2/ja
Priority claimed from JP2008095462A external-priority patent/JP5155001B2/ja
Priority to US12/342,166 priority patent/US7984044B2/en
Publication of JP2009251686A publication Critical patent/JP2009251686A/ja
Publication of JP2009251686A5 publication Critical patent/JP2009251686A5/ja
Application granted granted Critical
Publication of JP5155001B2 publication Critical patent/JP5155001B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (6)

  1. プロセッサと、前記プロセッサによって実行されるプログラムを格納するメモリと、検索対象の文書及び前記文書を検索するためのインデックス情報を格納する文書DBとを用い、キーワードの論理式から成る検索式から文書を検索する文書検索装置において、
    複数の検索式を、それぞれの予測検索速度に基づいて複数の検索式集合に振り分ける検索式制御部と、
    振り分けられた前記複数の検索式集合を予測検索速度の速い集合から順次検索を行い、かつ、それぞれの検索処理では、対応する検索式集合内の検索式をまとめて一括検索する検索部と
    を備えることを特徴とする文書検索装置。
  2. 請求項1記載の文書検索装置において、前記検索部は、ある検索式集合1を一括検索している途中に到着した検索式の予測検索速度が検索式集合1の次に一括検索される検索式集合2の予測検索速度より速いとき、当該検索式を前記検索式集合2に含めて一括検索することを特徴とする文書検索装置。
  3. 請求項1記載の文書検索装置において、一定長の連続文字列が出現する検索対象の文書リストを前記インデックス情報として前記文書DBに格納し、前記一括検索では、前記インデックス情報を用い前記検索式内の各キーワードを構成する連続文字列の接続条件を考慮しないインデックス検索を行い、前記インデックス検索によって得られた各文書を、先頭の文字から走査しながら前記検索式内の各キーワードを構成する連続文字列の接続条件を検査し、前記検査に合格した文書を最終的な検索結果として出力することを特徴とする文書検索装置。
  4. 請求項3記載の文書検索装置において、前記検索制御部は前記インデックス情報を用いて、前記検索式内の各キーワードを構成する各連続文字列に対してその連続文字列が出現する文書数を取得し、前記文書数の組み合わせから前記検索式のインデックス検索の結果の文書数を予測し、前記予測文書数を前記予測検索速度とすることを特徴とする文書検索装置。
  5. 請求項3記載の文書検索装置において、過去に処理した検索式のインデックス検索の結果の文書数をデータとして蓄積し、前記検索制御部において検索式の振り分けを行う際に、振り分けのためのパラメータを前記蓄積したデータから計算することを特徴とする文書検索装置。
  6. 請求項5記載の文書検索装置において、過去に処理した検索式の情報が無い初期状態ではあらかじめ指定したパラメータを振り分けに使い、検索式が一定個数蓄積される度に、それまでに蓄積したデータを用いて振り分けのためのパラメータを更新することを特徴とする文書検索装置。
JP2008095462A 2008-04-01 2008-04-01 文書検索装置 Expired - Fee Related JP5155001B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008095462A JP5155001B2 (ja) 2008-04-01 2008-04-01 文書検索装置
US12/342,166 US7984044B2 (en) 2008-04-01 2008-12-23 System or program for searching documents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008095462A JP5155001B2 (ja) 2008-04-01 2008-04-01 文書検索装置

Publications (3)

Publication Number Publication Date
JP2009251686A JP2009251686A (ja) 2009-10-29
JP2009251686A5 true JP2009251686A5 (ja) 2011-03-03
JP5155001B2 JP5155001B2 (ja) 2013-02-27

Family

ID=41118641

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008095462A Expired - Fee Related JP5155001B2 (ja) 2008-04-01 2008-04-01 文書検索装置

Country Status (2)

Country Link
US (1) US7984044B2 (ja)
JP (1) JP5155001B2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110029985A1 (en) * 2009-07-31 2011-02-03 Nokia Corporation Method and apparatus for coordinating resource access
EP2490171B1 (en) * 2009-10-16 2020-11-25 Nec Corporation Person image search starting from clothing query text.
JP5552448B2 (ja) * 2011-01-28 2014-07-16 株式会社日立製作所 検索式生成装置、検索システム、検索式生成方法
JP5678691B2 (ja) 2011-01-28 2015-03-04 富士通株式会社 検索制御装置、検索制御プログラムおよび検索制御方法
DE212011100098U1 (de) 2011-04-28 2013-01-10 Google Inc. Präsentieren von Suchergebnissen für Galerie-Webseiten
JP5799706B2 (ja) * 2011-09-26 2015-10-28 富士通株式会社 検索要求処理装置
US9002772B2 (en) 2011-11-18 2015-04-07 International Business Machines Corporation Scalable rule-based processing system with trigger rules and rule evaluator
US8990070B2 (en) 2011-11-18 2015-03-24 International Business Machines Corporation Computer-based construction of arbitrarily complex formal grammar expressions
US9069882B2 (en) * 2013-01-22 2015-06-30 International Business Machines Corporation Mapping and boosting of terms in a format independent data retrieval query
US20150112976A1 (en) * 2013-10-17 2015-04-23 Nicole Lang Beebe Relevancy ranking information retrieval system and method of using the same
US10769144B2 (en) * 2014-06-16 2020-09-08 Nec Corporation Database search system, database search method, and non-transitory recording medium
US10282448B2 (en) * 2014-11-18 2019-05-07 Huawei International Pte. Ltd. System and method for searching a symmetrically encrypted database for conjunctive keywords
JP6737117B2 (ja) * 2016-10-07 2020-08-05 富士通株式会社 符号化データ検索プログラム、符号化データ検索方法および符号化データ検索装置
US10956416B2 (en) * 2019-03-12 2021-03-23 International Business Machines Corporation Data schema discovery with query optimization

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5454105A (en) * 1989-06-14 1995-09-26 Hitachi, Ltd. Document information search method and system
JPH0561919A (ja) * 1991-04-25 1993-03-12 Hitachi Ltd 多重データ検索方法および装置
JP3343989B2 (ja) * 1993-05-17 2002-11-11 株式会社日立製作所 文書検索方法
US20050278368A1 (en) * 2004-06-08 2005-12-15 Benedikt Michael A System and method for XML data integration

Similar Documents

Publication Publication Date Title
JP2009251686A5 (ja)
AU2010200478B2 (en) Multiple index based information retrieval system
JP4976666B2 (ja) 情報検索システムにおけるフレーズ識別方法
KR101223172B1 (ko) 정보 검색 시스템에서의 문구 기반 서치
US7702618B1 (en) Information retrieval system for archiving multiple document versions
JP2008146602A5 (ja)
CN105912526A (zh) 一种面向体育比赛直播文字的体育新闻自动构建方法及装置
NO335144B1 (no) Frasebasert generasjon av dokumentbeskrivelser
US8732160B2 (en) Exploring large textual data sets via interactive aggregation
CN103914569B (zh) 输入提示方法、装置及字典树模型的创建方法、装置
CN101246499A (zh) 网络信息搜索方法及系统
JP2012168925A5 (ja)
CN103544307B (zh) 一种不依赖文档库的多搜索引擎自动化对比评测方法
JP2010211793A (ja) 自動オントロジーのためのドメインコーパス及び辞書の生成
JP2007042069A5 (ja)
US10452692B2 (en) Method and an apparatus for fast merging inverted chains
Cartright et al. Fast query expansion using approximations of relevance models
CN106815265A (zh) 裁判文书的搜索方法及装置
CN104572720A (zh) 一种网页信息排重的方法、装置及计算机可读存储介质
Abuaiadah et al. On the impact of dataset characteristics on arabic document classification
CN106528726A (zh) 基于关键词优化实现搜索引擎优化技术
JP2012532375A5 (ja)
CN103279492A (zh) 一种抓取网页的方法和装置
Wang et al. Re-ranking search results using semantic similarity
CN106933818A (zh) 一种快速的多关键字文本匹配方法及装置