JP2015022723A - 文書を検索する装置及び方法 - Google Patents
文書を検索する装置及び方法 Download PDFInfo
- Publication number
- JP2015022723A JP2015022723A JP2013153024A JP2013153024A JP2015022723A JP 2015022723 A JP2015022723 A JP 2015022723A JP 2013153024 A JP2013153024 A JP 2013153024A JP 2013153024 A JP2013153024 A JP 2013153024A JP 2015022723 A JP2015022723 A JP 2015022723A
- Authority
- JP
- Japan
- Prior art keywords
- document
- condition
- search
- documents
- conditions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】文書検索装置10において、検索クエリー受付部12が、検索クエリー「A AND B」を受け付け、検索クエリー変換部14が、この検索クエリーを、語句Aが出現する文書を含む文書群に含まれるという条件<A>と、語句Bが出現する文書を含む文書群に含まれるという条件<B>と、条件「A OR B」とをAND論理演算子で結合した検索クエリーに変換し、第2検索処理部16が、条件<A>を満たす文書と条件<B>を満たす文書とを検索し、第1検索処理部15が、条件「A OR B」を満たす文書を検索し、検索結果生成部17が、これらの文書に共通の文書を検索結果の文書とし、検索結果処理部18が、検索結果の文書を示す情報を表示するための処理を行う。
【選択図】図4
Description
本実施の形態では、まず、文書を検索するために用いる索引を作成する。図1は、本実施の形態で作成する索引について模式的に示した図である。
本実施の形態では、索引を走査する際に検索クエリーを加工しないようにすることにより、親子関係を考慮しない検索が可能となる。例えばAND検索を各文書内でのみ評価できるようになる。また、検索結果を処理する際に補正を行わないようにすることにより、親子関係を考慮せずに検索結果を評価し表示することも可能となる。これは、検索条件の評価は親子関係を考慮して行いたいが、検索結果の表示は文書ごとに行いたい、といった要求に応えるものである。更に、索引を走査する際の検索クエリーの加工及び検索結果を処理する際の補正の何れも行わなければ、検索条件の評価及び検索結果の表示共に親子関係を考慮せずに行えるようになる。そして、本実施の形態は、このように種々の検索を行う場合でも、図1に示した索引を予め作成しておくことで、検索ごとに索引を再作成することを不要とするものである。
図4は、本実施の形態における文書検索装置10の機能構成例を示したブロック図である。図示するように、文書検索装置10は、索引情報記憶部11と、検索クエリー受付部12と、検索クエリー判定部13と、検索クエリー変換部14とを備える。また、第1検索処理部15と、第2検索処理部16と、検索結果生成部17と、検索結果処理部18とを備える。
図5は、本実施の形態における文書検索装置10の動作例を示したフローチャートである。ユーザがキーボード/マウス90i(図7参照)等を用いて検索クエリーを入力することにより、この動作は開始する。その際、ユーザは検索クエリー「A AND B」を入力するものとして説明する。
図6は、図5のステップ106及びステップ108で呼び出される第2検索処理部16による第2検索処理の動作例を示したフローチャートである。尚、ここでは、図5のステップ105で語句Aが設定され、ステップ106で呼び出されたときの動作について説明する。
Claims (8)
- 互いに関連する文書を各々が含む複数の文書群に分けられる複数の文書から文書を検索する装置であって、
複数の条件と当該複数の条件を結合する少なくとも1つの論理演算子とを含む検索条件を取得する取得部と、
前記複数の条件の各条件について、前記複数の文書群の中で、当該各条件を満たす文書を含む文書群を特定する文書群特定部と、
前記複数の文書の中で、前記複数の条件のうちの少なくとも1つの条件を満たす文書を特定する文書特定部と、
前記複数の条件の各条件について特定された文書群に含まれる文書と、特定された前記複数の条件のうちの少なくとも1つの条件を満たす文書とについて、前記少なくとも1つの論理演算子に応じた取捨選択を行うことにより、前記検索条件に基づく検索結果の文書を決定する決定部と、
前記検索条件に基づく検索結果の文書を示す情報を生成する生成部と
を含む、装置。 - 前記検索条件を、前記複数の条件の各条件についての当該各条件を満たす文書を含むという前記複数の文書群に対する条件と、前記複数の条件のうちの少なくとも1つの条件を満たすという前記複数の文書に対する条件と、当該複数の文書群に対する条件と当該複数の文書に対する条件とを結合する前記少なくとも1つの論理演算子に応じた少なくとも2つの論理演算子とを含むように変更する変更部を更に含み、
前記文書群特定部は、前記複数の文書群に対する条件に基づいて、前記複数の条件の各条件について当該各条件を満たす文書を含む文書群を特定し、
前記文書特定部は、前記複数の文書に対する条件に基づいて、前記複数の条件のうちの少なくとも1つの条件を満たす文書を特定し、
前記決定部は、前記少なくとも2つの論理演算子に基づいて前記取捨選択を行うことにより、前記検索条件に基づく検索結果の文書を決定する、請求項1の装置。 - 前記複数の条件の各条件と前記複数の文書のうちの当該各条件を満たす文書に割り当てられた識別子とを対応付けた索引であって、前記複数の文書群の各文書群に含まれる文書に連続する識別子が割り当てられた索引を記憶する記憶部を更に含み、
前記文書群特定部は、前記索引を用いて、前記複数の条件の各条件について当該各条件を満たす文書を含む文書群を特定し、
前記文書特定部は、前記索引を用いて、前記複数の条件のうちの少なくとも1つの条件を満たす文書を特定する、請求項1又は請求項2の装置。 - 前記生成部は、前記検索条件に基づく検索結果の文書を示す情報として、当該検索結果の文書を含む文書群又は当該文書群に含まれる他の文書を示す情報を生成する、請求項1乃至請求項3の何れかの装置。
- 互いに関連する文書を各々が含む複数の文書群に分けられる複数の文書から文書を検索する装置であって、
第1の条件と第2の条件とをAND論理演算子で結合してなる検索条件を取得する取得部と、
前記複数の文書群の中で、前記第1の条件を満たす文書を含む第1の文書群と、前記第2の条件を満たす文書を含む第2の文書群とを特定する文書群特定部と、
前記複数の文書の中で、前記第1の条件及び前記第2の条件の少なくとも何れか一方の条件を満たす文書を特定する文書特定部と、
前記第1の文書群及び前記第2の文書群の両方に含まれ、かつ、前記文書特定部により特定された文書を、前記検索条件に基づく検索結果の文書に決定する決定部と、
前記検索条件に基づく検索結果の文書を示す情報を生成する生成部と
を含む、装置。 - 互いに関連する文書を各々が含む複数の文書群に分けられる複数の文書から文書を検索する装置であって、
第1の条件と、第2の条件とを、当該第1の条件に後続し当該第2の条件に先行するNOT論理演算子で結合してなる検索条件を取得する取得部と、
前記複数の文書群の中で、前記第1の条件を満たす文書を含む第1の文書群と、前記第2の条件を満たす文書を含む第2の文書群とを特定する文書群特定部と、
前記複数の文書の中で、前記第1の条件を満たす文書を特定する文書特定部と、
前記第1の文書群に含まれるが前記第2の文書群に含まれず、かつ、前記文書特定部により特定された文書を、前記検索条件に基づく検索結果の文書に決定する決定部と、
前記検索条件に基づく検索結果の文書を示す情報を生成する生成部と
を含む、装置。 - 互いに関連する文書を各々が含む複数の文書群に分けられる複数の文書から文書を検索する方法であって、
複数の条件と当該複数の条件を結合する少なくとも1つの論理演算子とを含む検索条件を取得するステップと、
前記複数の条件の各条件について、前記複数の文書群の中で、当該各条件を満たす文書を含む文書群を特定するステップと、
前記複数の文書の中で、前記複数の条件のうちの少なくとも1つの条件を満たす文書を特定するステップと、
前記複数の条件の各条件について特定された文書群に含まれる文書と、特定された前記複数の条件のうちの少なくとも1つの条件を満たす文書とについて、前記少なくとも1つの論理演算子に応じた取捨選択を行うことにより、前記検索条件に基づく検索結果の文書を決定するステップと、
前記検索条件に基づく検索結果の文書を示す情報を生成するステップと
を含む、方法。 - 互いに関連する文書を各々が含む複数の文書群に分けられる複数の文書から文書を検索する装置として、コンピュータを機能させるプログラムであって、
前記コンピュータを、
複数の条件と当該複数の条件を結合する少なくとも1つの論理演算子とを含む検索条件を取得する取得部と、
前記複数の条件の各条件について、前記複数の文書群の中で、当該各条件を満たす文書を含む文書群を特定する文書群特定部と、
前記複数の文書の中で、前記複数の条件のうちの少なくとも1つの条件を満たす文書を特定する文書特定部と、
前記複数の条件の各条件について特定された文書群に含まれる文書と、特定された前記複数の条件のうちの少なくとも1つの条件を満たす文書とについて、前記少なくとも1つの論理演算子に応じた取捨選択を行うことにより、前記検索条件に基づく検索結果の文書を決定する決定部と、
前記検索条件に基づく検索結果の文書を示す情報を生成する生成部と
して機能させる、プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013153024A JP5954742B2 (ja) | 2013-07-23 | 2013-07-23 | 文書を検索する装置及び方法 |
US14/318,854 US9767191B2 (en) | 2013-07-23 | 2014-06-30 | Group based document retrieval |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013153024A JP5954742B2 (ja) | 2013-07-23 | 2013-07-23 | 文書を検索する装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015022723A true JP2015022723A (ja) | 2015-02-02 |
JP5954742B2 JP5954742B2 (ja) | 2016-07-20 |
Family
ID=52391380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013153024A Expired - Fee Related JP5954742B2 (ja) | 2013-07-23 | 2013-07-23 | 文書を検索する装置及び方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9767191B2 (ja) |
JP (1) | JP5954742B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10776376B1 (en) * | 2014-12-05 | 2020-09-15 | Veritas Technologies Llc | Systems and methods for displaying search results |
CN108614842B (zh) * | 2016-12-13 | 2021-03-30 | 北京国双科技有限公司 | 查询数据的方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005165521A (ja) * | 2003-12-01 | 2005-06-23 | Fuji Xerox Co Ltd | 文書検索装置、文書検索方法、プログラム |
JP2012078966A (ja) * | 2010-09-30 | 2012-04-19 | Internatl Business Mach Corp <Ibm> | 検索クエリーの作成を支援する装置、グラフィカルユーザインターフェース生成システム、方法及びプログラム |
JP2012185780A (ja) * | 2011-03-08 | 2012-09-27 | Mizuho Information & Research Institute Inc | 文書管理システム及び文書管理方法 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03129472A (ja) * | 1989-07-31 | 1991-06-03 | Ricoh Co Ltd | 文書検索装置における処理方法 |
US5664172A (en) * | 1994-07-19 | 1997-09-02 | Oracle Corporation | Range-based query optimizer |
JPH0869471A (ja) | 1994-08-30 | 1996-03-12 | Toshiba Corp | 検索用インデックスの作成方法、文書検索方法及び文書検索装置 |
JP3448452B2 (ja) | 1997-03-24 | 2003-09-22 | 株式会社リコー | 文書情報管理システム |
JP2000003366A (ja) | 1998-06-11 | 2000-01-07 | Hitachi Ltd | 文書登録方法と文書検索方法及びその実施装置並びにその処理プログラムを記録した媒体 |
JP3918374B2 (ja) * | 1999-09-10 | 2007-05-23 | 富士ゼロックス株式会社 | 文書検索装置および方法 |
JP2001306617A (ja) | 2000-04-24 | 2001-11-02 | Nec Soft Ltd | 文書管理装置 |
US7389204B2 (en) * | 2001-03-01 | 2008-06-17 | Fisher-Rosemount Systems, Inc. | Data presentation system for abnormal situation prevention in a process plant |
US7096395B2 (en) * | 2001-12-28 | 2006-08-22 | Hewlett-Packard Development Company, L.P. | Efficient word recognizer for a logic analyzer |
JP2003323457A (ja) * | 2002-02-28 | 2003-11-14 | Ricoh Co Ltd | 文書検索装置、文書検索方法、プログラム及び記録媒体 |
US7418600B2 (en) * | 2003-03-13 | 2008-08-26 | International Business Machines Corporation | Secure database access through partial encryption |
JP4189387B2 (ja) | 2005-03-28 | 2008-12-03 | 株式会社東芝 | 知識検索システム、知識検索方法及びプログラム |
JP2007072723A (ja) | 2005-09-06 | 2007-03-22 | Ricoh Co Ltd | 文書管理装置、文書管理方法、プログラム及び記録媒体 |
JP4490930B2 (ja) | 2006-02-07 | 2010-06-30 | 株式会社東芝 | 構造化文書検索装置および構造化文書検索方法 |
US7814460B2 (en) * | 2006-07-13 | 2010-10-12 | Scriptlogic Corporation | Hierarchical modular software packages and associated development tool |
JP4860416B2 (ja) | 2006-09-29 | 2012-01-25 | 株式会社ジャストシステム | 文書検索装置、文書検索方法および文書検索プログラム |
JP4930153B2 (ja) * | 2007-03-30 | 2012-05-16 | 富士通株式会社 | 文書検索システム、文書番号部分列取得装置、および文書検索方法 |
US8086597B2 (en) * | 2007-06-28 | 2011-12-27 | International Business Machines Corporation | Between matching |
US9015194B2 (en) * | 2007-07-02 | 2015-04-21 | Verint Systems Inc. | Root cause analysis using interactive data categorization |
JP5187313B2 (ja) * | 2007-10-12 | 2013-04-24 | 日本電気株式会社 | 文書重要度算出システム、文書重要度算出方法およびプログラム |
JP5376163B2 (ja) | 2007-11-15 | 2013-12-25 | 日本電気株式会社 | 文書管理・検索システムおよび文書の管理・検索方法 |
JP5200793B2 (ja) | 2008-09-11 | 2013-06-05 | 株式会社リコー | 文書管理装置、文書管理方法、文書管理プログラムおよび記憶媒体 |
JP5225021B2 (ja) | 2008-10-29 | 2013-07-03 | 日本電信電話株式会社 | 全文検索方法及び装置及びプログラム |
JP2010108453A (ja) | 2008-10-31 | 2010-05-13 | Internatl Business Mach Corp <Ibm> | 文書部品管理装置、方法、およびプログラム |
CN102279893B (zh) * | 2011-09-19 | 2015-07-22 | 索意互动(北京)信息技术有限公司 | 文献群组多对多自动分析 |
-
2013
- 2013-07-23 JP JP2013153024A patent/JP5954742B2/ja not_active Expired - Fee Related
-
2014
- 2014-06-30 US US14/318,854 patent/US9767191B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005165521A (ja) * | 2003-12-01 | 2005-06-23 | Fuji Xerox Co Ltd | 文書検索装置、文書検索方法、プログラム |
JP2012078966A (ja) * | 2010-09-30 | 2012-04-19 | Internatl Business Mach Corp <Ibm> | 検索クエリーの作成を支援する装置、グラフィカルユーザインターフェース生成システム、方法及びプログラム |
JP2012185780A (ja) * | 2011-03-08 | 2012-09-27 | Mizuho Information & Research Institute Inc | 文書管理システム及び文書管理方法 |
Also Published As
Publication number | Publication date |
---|---|
US20150032748A1 (en) | 2015-01-29 |
JP5954742B2 (ja) | 2016-07-20 |
US9767191B2 (en) | 2017-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101137147B1 (ko) | 질의 강제 인덱싱 | |
US11157550B2 (en) | Image search based on feature values | |
US8732173B2 (en) | Classification hierarchy regeneration system, classification hierarchy regeneration method, and classification hierarchy regeneration program | |
CN104239395B (zh) | 搜索的方法和系统 | |
WO1999046698A1 (fr) | Processeur de documents et support d'enregistrement | |
JP2008027072A (ja) | データベース分析プログラム、データベース分析装置、データベース分析方法 | |
US9552415B2 (en) | Category classification processing device and method | |
TW201415254A (zh) | 語意標註建議方法及其系統 | |
JP2017097823A (ja) | 分散ネットワークで使用するための検索サーバ、端末装置、及び検索方法 | |
EP3249557B1 (en) | Computer implemented and computer controlled method, computer program product and platform for arranging data for processing and storage at a data storage engine | |
JP2019204246A (ja) | 学習データ作成方法及び学習データ作成装置 | |
KR20160117965A (ko) | NoSQL 모델 생성 방법 및 그 장치 | |
US9990444B2 (en) | Apparatus and method for supporting visualization of connection relationship | |
JP2013041385A (ja) | 文献検索方法、文献検索装置及び文献検索プログラム | |
JPWO2010013472A1 (ja) | データ分類システム、データ分類方法、及びデータ分類プログラム | |
JP5954742B2 (ja) | 文書を検索する装置及び方法 | |
JP2001325276A (ja) | 情報処理システム、情報処理方法、コンピュータプログラム、記憶媒体及びプログラム伝送装置 | |
CN115617980A (zh) | 一种诉讼案例检索报告生成方法及系统 | |
CN112989011B (zh) | 数据查询方法、数据查询装置和电子设备 | |
KR20150096848A (ko) | 인덱스를 이용하는 데이터 검색 장치 및 이를 이용하는 방법 | |
JP2006350655A (ja) | Web画像検索結果分類提示方法及び装置及びプログラム及びプログラムを格納した記憶媒体 | |
JP6081609B2 (ja) | データ分析システム及びその方法 | |
CN111695031A (zh) | 基于标签的搜索方法、装置、服务器及存储介质 | |
US20130262980A1 (en) | Information processing apparatus, history control method, and computer-readable recording medium | |
CN111368055A (zh) | 一种专利数据库联合企业信息平台的检索方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151127 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20160115 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20160122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160517 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20160517 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160607 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5954742 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |