JP2008210272A - 文書検索システム及び文書検索方法 - Google Patents
文書検索システム及び文書検索方法 Download PDFInfo
- Publication number
- JP2008210272A JP2008210272A JP2007047860A JP2007047860A JP2008210272A JP 2008210272 A JP2008210272 A JP 2008210272A JP 2007047860 A JP2007047860 A JP 2007047860A JP 2007047860 A JP2007047860 A JP 2007047860A JP 2008210272 A JP2008210272 A JP 2008210272A
- Authority
- JP
- Japan
- Prior art keywords
- structured document
- search
- storage device
- unit
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】マスタデータベース処理装置は、各データベース処理装置に格納されている構造化文書の階層構造を示す構造情報のうち、第2データベース処理装置に格納された構造化文書のノード群であって、第1データベース処理装置に格納された構造化文書のノード群と一致する同一ノードを抽出し、当該同一ノードを含む検索用構造情報を第1のデータベース処理装置に送信し、第1データベース処理装置は、検索用構造情報を受信し、検索用構造情報中の同一ノードを含む構造化文書を検索し、当該構造化文書が有する同一ノードと当該同一ノードに対するテキスト情報とを第2データベース処理装置に送信し、第2データベース処理装置は、同一ノードと、当該同一ノードのテキスト情報とを受信し、当該テキスト情報と一致する同一ノードを含む構造化文書を検索する。
【選択図】 図2
Description
110 第1データベース処理装置
111 第1スレーブDBMS
112 第1構造化文書データ格納部
120 第2データベース処理装置
121 第2スレーブDBMS
122 第2構造化文書データ格納部
130 第3データベース処理装置
131 第3スレーブDBMS
132 第3構造化文書データ格納部
201 構造情報格納部
211 外部通信処理部
212 検索処理部
213 内部通信処理部
214 データ格納処理部
215 クエリ解析部
216 抽出部
217 実行部
218 送信部
219 受信部
221 内部通信処理部
222 検索処理部
223 データ格納処理部
224 受信部
225 送信部
231 内部通信処理部
232 検索処理部
233 データ格納処理部
234 受信部
235 送信部
241 内部通信処理部
242 検索処理部
243 データ格納処理部
244 受信部
245 送信部
1101 CPU
1102 ROM
1103 RAM
1104 表示装置
1105 通信I/F
1106 外部記憶装置
1107 バス
Claims (6)
- 各要素が論理的に階層化された構造化文書を格納する第1の格納装置及び第2の格納装置と、当該第1の格納装置及び第2の格納装置を管理する文書管理装置とを接続する文書検索システムにおいて、
前記文書管理装置は、
前記第1の格納装置及び前記第2の格納装置に格納されている各前記構造化文書の前記要素の階層位置関係を、一括して有する階層構造を示す構造情報を記憶する構造記憶部と、
前記構造情報のうち、前記第2の格納装置に格納された前記構造化文書の所定の要素であって、前記第1の格納装置に格納された前記構造化文書の要素と一致する同一要素を抽出する抽出部と、
前記同一要素を、前記第1の格納装置に送信する送信部と、を備え、
前記第1の格納装置は、
前記構造化文書を格納する第1の記憶部と、
前記文書管理装置から前記同一要素を受信する第1の受信部と、
前記第1の記憶部に格納された前記構造化文書から、前記同一要素を含む構造化文書を検索する第1の検索部と、
検索された前記構造化文書が有する前記同一要素と、当該同一要素に対するテキスト情報とを対応付けて、前記第2の格納装置に送信する第1の送信部と、を備え、
前記第2の格納装置は、
前記第1の格納装置から、前記同一要素と、当該同一要素に対応付けられた前記テキスト情報とを受信する第2の受信部と、
受信した前記テキスト情報と一致する前記同一要素を含む構造化文書を検索する第2の検索部と、を備えること、
を特徴とする文書検索システム。 - 前記文書管理装置の、
前記構造記憶部は、前記構造情報が保持する前記階層構造内で階層位置が規定されている要素を示す規定要素がユニークであるか否かを示すユニーク情報を規定要素毎に保持し、
前記抽出部は、前記同一要素と、前記構造情報において対応する前記規定要素のユニーク情報がユニークである場合に、前記同一要素と共に、当該ユニーク情報を抽出し、
前記送信部は、前記同一要素と、抽出された前記ユニーク情報とを対応付けて送信し、
前記第1の格納装置の、
前記第1の受信部は、前記同一要素と、前記同一要素に対応付けられた前記ユニーク情報とを受信し、
前記第1の検索部は、前記ユニーク情報に対応付けられた前記同一要素を1つのみ含む前記構造化文書を検索すること、
を特徴とする請求項1に記載のシステム。 - 前記第2の格納装置に格納されている前記構造化文書のユニークな要素が、前記第1の格納装置に格納されている前記構造化文書のユニークな要素より多いこと、
を特徴とする請求項2に記載のシステム。 - 前記文書管理装置は、
利用者から検索条件として所定の要素が一致する前記構造化文書の組み合わせを検索する旨の指示を受け付ける受付部と、をさらに備え、
前記抽出部は、指示として受け付けた前記所定の要素であって、前記第1の格納装置に格納された前記構造化文書の要素と一致する同一要素を抽出すること、
を特徴とする請求項1乃至3のいずれか一つに記載のシステム。 - 前記第1の格納装置の、
前記第1の送信部は、検索された前記構造化文書を、前記文書管理装置に送信し、
前記第2の格納装置は、
検索された前記構造化文書を、前記文書管理装置に送信する第2の送信部をさらに備え、
前記文書管理装置は、
前記第1の格納装置からの前記構造化文書と、前記第2の格納装置からの前記構造化文書を受信する受信部と、
受信した構造化文書から、同一の要素を含む構造化文書の組み合わせた検索結果を生成する生成手段と、をさらに備えること、
を特徴とする請求項1乃至4のいずれか一つに記載のシステム。 - 各要素が論理的に階層化された構造化文書を格納する第1の格納装置及び第2の格納装置に対して、検索を行う文書検索方法において、
構造記憶部に記憶された、前記第1の格納装置及び前記第2の格納装置に格納されている各前記構造化文書の前記要素の階層位置関係を、一括して有する階層構造を示す構造情報のうち、前記第2の格納装置に格納された前記構造化文書の所定の要素であって、前記第1の格納装置に格納された前記構造化文書の要素と一致する同一要素を抽出し、
前記同一要素を、前記第1の格納装置に送信し、
前記第1の格納装置が、前記同一要素を受信し、
第1の記憶部に格納された前記構造化文書から、前記同一要素を含む構造化文書を検索し、
検索された前記構造化文書が有する前記同一要素と、当該同一要素に対するテキスト情報とを対応付けて、前記第2の格納装置に送信し、
前記第2の格納装置が、前記第1の格納装置から、前記同一要素と、当該同一要素に対応付けられた前記テキスト情報とを受信し、
受信した前記テキスト情報と一致する前記同一要素を含む構造化文書を検索する、
ことを特徴とする文書検索方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007047860A JP4854542B2 (ja) | 2007-02-27 | 2007-02-27 | 文書検索システム及び文書検索方法 |
US12/032,880 US8086561B2 (en) | 2007-02-27 | 2008-02-18 | Document searching system and document searching method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007047860A JP4854542B2 (ja) | 2007-02-27 | 2007-02-27 | 文書検索システム及び文書検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008210272A true JP2008210272A (ja) | 2008-09-11 |
JP4854542B2 JP4854542B2 (ja) | 2012-01-18 |
Family
ID=39717084
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007047860A Active JP4854542B2 (ja) | 2007-02-27 | 2007-02-27 | 文書検索システム及び文書検索方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8086561B2 (ja) |
JP (1) | JP4854542B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010176319A (ja) * | 2009-01-28 | 2010-08-12 | Toshiba Corp | 構造化文書検索システム、装置、及び方法 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5172931B2 (ja) * | 2010-10-25 | 2013-03-27 | 株式会社東芝 | 検索装置、検索方法および検索プログラム |
US9104769B2 (en) * | 2011-11-10 | 2015-08-11 | Room 77, Inc. | Metasearch infrastructure with incremental updates |
CN103827861B (zh) * | 2012-09-07 | 2017-09-08 | 株式会社东芝 | 结构化文档管理装置及方法 |
US10701154B2 (en) | 2017-05-22 | 2020-06-30 | Microsoft Technology Licensing, Llc | Sharding over multi-link data channels |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001109758A (ja) * | 1999-10-06 | 2001-04-20 | Hitachi Ltd | 仮想表インタフェースと該インタフェースを用いた問合せ処理システム及び方法 |
JP2003308335A (ja) * | 2002-04-15 | 2003-10-31 | Just Syst Corp | 文書検索システム及び方法、並びにプログラム |
JP2005135317A (ja) * | 2003-10-31 | 2005-05-26 | Toshiba Solutions Corp | 文書管理システムおよび文書管理プログラム |
JP2007206945A (ja) * | 2006-02-01 | 2007-08-16 | Toshiba Corp | 構造化文書検索システムおよび構造化文書検索方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4398664B2 (ja) | 2003-04-03 | 2010-01-13 | 株式会社セック | Xmlデータの検索方法及び検索装置、並びにプログラムおよびプログラムを記録した記録媒体 |
JP4247108B2 (ja) * | 2003-12-25 | 2009-04-02 | 株式会社東芝 | 構造化文書検索方法、構造化文書検索装置、及びプログラム |
-
2007
- 2007-02-27 JP JP2007047860A patent/JP4854542B2/ja active Active
-
2008
- 2008-02-18 US US12/032,880 patent/US8086561B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001109758A (ja) * | 1999-10-06 | 2001-04-20 | Hitachi Ltd | 仮想表インタフェースと該インタフェースを用いた問合せ処理システム及び方法 |
JP2003308335A (ja) * | 2002-04-15 | 2003-10-31 | Just Syst Corp | 文書検索システム及び方法、並びにプログラム |
JP2005135317A (ja) * | 2003-10-31 | 2005-05-26 | Toshiba Solutions Corp | 文書管理システムおよび文書管理プログラム |
JP2007206945A (ja) * | 2006-02-01 | 2007-08-16 | Toshiba Corp | 構造化文書検索システムおよび構造化文書検索方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010176319A (ja) * | 2009-01-28 | 2010-08-12 | Toshiba Corp | 構造化文書検索システム、装置、及び方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4854542B2 (ja) | 2012-01-18 |
US20080208843A1 (en) | 2008-08-28 |
US8086561B2 (en) | 2011-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4516566B2 (ja) | Xml文書とリレーショナルデータと間のマッピングにおける階層情報の保持 | |
US7293018B2 (en) | Apparatus, method, and program for retrieving structured documents | |
US7181680B2 (en) | Method and mechanism for processing queries for XML documents using an index | |
US9009173B2 (en) | Using views of subsets of nodes of a schema to generate data transformation jobs to transform input files in first data formats to output files in second data formats | |
US11030243B2 (en) | Structure based storage, query, update and transfer of tree-based documents | |
US6996571B2 (en) | XML storage solution and data interchange file format structure | |
US8484210B2 (en) | Representing markup language document data in a searchable format in a database system | |
US8935267B2 (en) | Apparatus and method for executing different query language queries on tree structured data using pre-computed indices of selective document paths | |
US20100299327A1 (en) | Generating Structured Query Language/Extensible Markup Language (SQL/XML) Statements | |
US8145674B2 (en) | Structure based storage, query, update and transfer of tree-based documents | |
US8145641B2 (en) | Managing feature data based on spatial collections | |
US10242123B2 (en) | Method and system for handling non-presence of elements or attributes in semi-structured data | |
US8117186B2 (en) | Database processing apparatus, information processing method, and computer program product | |
JP2007206945A (ja) | 構造化文書検索システムおよび構造化文書検索方法 | |
JP4854542B2 (ja) | 文書検索システム及び文書検索方法 | |
AU2007275507B2 (en) | Semantic aware processing of XML documents | |
JP4212615B2 (ja) | 構造化文書検索システム、構造化文書検索方法、検索装置、および文書管理装置 | |
Ciglan et al. | Corporate memory: A framework for supporting tools for acquisition, organization and maintenance of information and knowledge | |
JP2009181463A (ja) | サーバ、データ転送方法及びプログラム | |
Al Hamad | RXML: Path-based and XML DOM approaches for integrating between relational and XML databases | |
Al-Zoube | USING MPQF FOR QUERYING MPEG-7 RDF DESCRIPTIONS | |
Hohenstein et al. | Plugging Files in Database Federations. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090326 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110930 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111004 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111025 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141104 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4854542 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141104 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |