JP5439606B1 - 構造化文書管理装置、方法およびプログラム - Google Patents
構造化文書管理装置、方法およびプログラム Download PDFInfo
- Publication number
- JP5439606B1 JP5439606B1 JP2012542303A JP2012542303A JP5439606B1 JP 5439606 B1 JP5439606 B1 JP 5439606B1 JP 2012542303 A JP2012542303 A JP 2012542303A JP 2012542303 A JP2012542303 A JP 2012542303A JP 5439606 B1 JP5439606 B1 JP 5439606B1
- Authority
- JP
- Japan
- Prior art keywords
- structural condition
- condition
- structural
- query
- structured document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/83—Querying
- G06F16/835—Query processing
- G06F16/8358—Query translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/83—Querying
- G06F16/835—Query processing
- G06F16/8373—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
まず、第1の実施形態について、図1〜図12を参照して説明する。図1は、第1の実施形態にかかる構造化文書管理システムのシステム構築例を示す模式図である。ここでは、実施形態の構造化文書管理システムとして、図1に示すように、構造化文書管理装置であるサーバコンピュータ(以下、サーバという。)1に、LAN(Local Area Network)等のネットワーク2を介して、クライアントコンピュータ(以下、クライアント端末という。)3が複数台接続されたサーバクライアントシステムを想定する。
次に、第2の実施形態について、説明する。本実施形態は、子孫構造条件以外の構造条件を書き換える際に、要素単独で書き換えずに前後の構造条件と組み合わせて書き換えるようにした例である。なお、以下の説明において、上述した第1の実施形態と共通の構成については同一の符号を付し、重複した説明を省略する。
Claims (7)
- 階層化された論理構造を有する構造化文書を検索するためのクエリデータの入力を受け付けるクエリデータ受付部と、
前記クエリデータを、構造条件を含む複数の要素毎に分割する構造条件分割部と、
分割された前記構造条件の種類が、下位の階層から上位の階層を指定する先祖構造条件、同一階層の前後を指定する兄弟構造条件、及び構造条件の中にXMLデータに含まれる要素の順序関係を指定する順序構造条件のいずれかであった場合、前記構造条件を、前記構造条件の前後の構造条件に影響を与えないように構造条件の種類毎に予め定められた子孫構造条件と結合演算処理とを含む書換えクエリに書き換える構造条件書換え部と、
前記構造条件、及び書換えクエリを含むクエリデータを入力として、検索結果を出力するクエリ実行部と、
を備える構造化文書管理装置。 - 前記構造条件書換え部は、さらに、前記分割された各前記構造条件のうちの第1構造条件に対して、前記構造条件の種類が直下の階層のノードを取得対象とする構造条件であった場合、第1構造条件で指定される文字列と、前記第1構造条件の次に位置する第2構造条件とを取得して、前記第2構造条件が直上の階層のノードの任意の文字列を取得対象とする構造条件であるか否かを判定し、
前記第2構造条件が直上の階層のノードの任意の文字列を取得対象とする構造条件であると判定された場合は、前記第1構造条件で指定される文字列を指定する子孫構造条件を有する単一の前記書換えクエリへと、前記第1構造条件、及び第2構造条件を変換する、
請求項1に記載の構造化文書管理装置。 - クエリデータ受付部が階層化された論理構造を有する構造化文書を検索するためのクエリデータの入力を受け付けるステップと、
構造条件分割部が前記クエリデータを、構造条件を含む複数の要素毎に分割するステップと、
構造条件書換え部が分割された前記構造条件の種類が、下位の階層から上位の階層を指定する先祖構造条件、同一階層の前後を指定する兄弟構造条件、及び構造条件の中にXMLデータに含まれる要素の順序関係を指定する順序構造条件のいずれかであった場合、前記構造条件を、前記構造条件の前後の構造条件に影響を与えないように構造条件の種類毎に予め定められた子孫構造条件と結合演算処理とを含む書換えクエリに書き換えるステップと、
クエリ実行部が前記構造条件、及び書換えクエリを含むクエリデータを入力として、検索結果を出力するステップと、
を含むことを特徴とする構造化文書管理方法。 - コンピュータに、
階層化された論理構造を有する構造化文書を検索するためのクエリデータの入力を受け付けるクエリデータ受付機能と、
前記クエリデータを、構造条件を含む複数の要素毎に分割する構造条件分割機能と、
分割された前記構造条件の種類が、下位の階層から上位の階層を指定する先祖構造条件、同一階層の前後を指定する兄弟構造条件、及び構造条件の中にXMLデータに含まれる要素の順序関係を指定する順序構造条件のいずれかであった場合、前記構造条件を、前記構造条件の前後の構造条件に影響を与えないように構造条件の種類毎に予め定められた子孫構造条件と結合演算処理とを含む書換えクエリに書き換える構造条件書換え機能と、
前記構造条件、及び書換えクエリを含むクエリデータを入力として、検索結果を出力するクエリ実行機能と、
を実行させるための構造化文書管理プログラム。 - 階層化された論理構造を有する構造化文書を検索するためのクエリデータの入力を受け付けるクエリデータ受付部と、
前記クエリデータを、構造条件を含む複数の要素毎に分割する構造条件分割部と、
分割された前記構造条件の種類が構造化文書の上位の階層から下位の階層を指定する子孫構造条件以外であった場合、前記構造条件を、前記構造条件の前後の構造条件に影響を与えないように構造条件の種類毎に予め定められた子孫構造条件と結合演算処理とを含む書換えクエリに書き換える構造条件書換え部と、
前記構造条件、及び書換えクエリを含むクエリデータを入力として、検索結果を出力するクエリ実行部と、を備え、
前記構造条件書換え部は、さらに、前記分割された各前記構造条件のうちの第1構造条件に対して、前記構造条件の種類が直下の階層のノードを取得対象とする構造条件であった場合、第1構造条件で指定される文字列と、前記第1構造条件の次に位置する第2構造条件とを取得して、前記第2構造条件が直上の階層のノードの任意の文字列を取得対象とする構造条件であるか否かを判定し、
前記第2構造条件が直上の階層のノードの任意の文字列を取得対象とする構造条件であると判定された場合は、前記第1構造条件で指定される文字列を指定する子孫構造条件を有する単一の前記書換えクエリへと、前記第1構造条件、及び第2構造条件を変換する、
構造化文書管理装置。 - クエリデータ受付部が階層化された論理構造を有する構造化文書を検索するためのクエリデータの入力を受け付けるステップと、
構造条件分割部が前記クエリデータを、構造条件を含む複数の要素毎に分割するステップと、
構造条件書換え部が分割された前記構造条件の種類が構造化文書の上位の階層から下位の階層を指定する子孫構造条件以外であった場合、前記構造条件を、前記構造条件の前後の構造条件に影響を与えないように構造条件の種類毎に予め定められた子孫構造条件と結合演算処理とを含む書換えクエリに書き換えるステップと、
構造条件書換え部が前記分割された各前記構造条件のうちの第1構造条件に対して、前記構造条件の種類が直下の階層のノードを取得対象とする構造条件であった場合、第1構造条件で指定される文字列と、前記第1構造条件の次に位置する第2構造条件とを取得して、前記第2構造条件が直上の階層のノードの任意の文字列を取得対象とする構造条件であるか否かを判定するステップと、
構造条件書換え部が前記第2構造条件が直上の階層のノードの任意の文字列を取得対象とする構造条件であると判定された場合は、前記第1構造条件で指定される文字列を指定する子孫構造条件を有する単一の前記書換えクエリへと、前記第1構造条件、及び第2構造条件を変換するステップと、
クエリ実行部が前記構造条件、及び書換えクエリを含むクエリデータを入力として、検索結果を出力するステップと、
を含むことを特徴とする構造化文書管理方法。 - コンピュータに、
階層化された論理構造を有する構造化文書を検索するためのクエリデータの入力を受け付けるクエリデータ受付機能と、
前記クエリデータを、構造条件を含む複数の要素毎に分割する構造条件分割機能と、
分割された前記構造条件の種類が構造化文書の上位の階層から下位の階層を指定する子孫構造条件以外であった場合、前記構造条件を、前記構造条件の前後の構造条件に影響を与えないように構造条件の種類毎に予め定められた子孫構造条件と結合演算処理とを含む書換えクエリに書き換える構造条件書換え機能と、
前記構造条件、及び書換えクエリを含むクエリデータを入力として、検索結果を出力するクエリ実行機能と、を実行させ、
前記構造条件書換え機能は、さらに、前記分割された各前記構造条件のうちの第1構造条件に対して、前記構造条件の種類が直下の階層のノードを取得対象とする構造条件であった場合、第1構造条件で指定される文字列と、前記第1構造条件の次に位置する第2構造条件とを取得して、前記第2構造条件が直上の階層のノードの任意の文字列を取得対象とする構造条件であるか否かを判定し、
前記第2構造条件が直上の階層のノードの任意の文字列を取得対象とする構造条件であると判定された場合は、前記第1構造条件で指定される文字列を指定する子孫構造条件を有する単一の前記書換えクエリへと、前記第1構造条件、及び第2構造条件を変換する、
構造化文書管理プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2012/072940 WO2014038069A1 (ja) | 2012-09-07 | 2012-09-07 | 構造化文書管理装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5439606B1 true JP5439606B1 (ja) | 2014-03-12 |
JPWO2014038069A1 JPWO2014038069A1 (ja) | 2016-08-08 |
Family
ID=50234453
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012542303A Active JP5439606B1 (ja) | 2012-09-07 | 2012-09-07 | 構造化文書管理装置、方法およびプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US10007666B2 (ja) |
JP (1) | JP5439606B1 (ja) |
CN (1) | CN103827861B (ja) |
WO (1) | WO2014038069A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112650846B (zh) * | 2021-01-13 | 2024-08-23 | 北京智通云联科技有限公司 | 一种基于问句框架的问答意图知识库构建系统及方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3612914B2 (ja) * | 1997-01-14 | 2005-01-26 | 富士ゼロックス株式会社 | 構造化文書検索装置及び構造化文書検索方法 |
WO2002027551A2 (en) * | 2000-08-01 | 2002-04-04 | Nimble Technology, Inc. | Nested conditional relations (ncr) model and algebra |
SE523930C3 (sv) * | 2002-09-03 | 2004-08-18 | Sixsteps Ab Ideon Science Park | Datorprogramprodukt med tillhörande metoder för att söka i en databas med objekt, koppla samman objekt i en sådan databas och exportera data från minst en godtycklig databas |
US7219091B1 (en) * | 2003-02-24 | 2007-05-15 | At&T Corp. | Method and system for pattern matching having holistic twig joins |
US7451144B1 (en) * | 2003-02-25 | 2008-11-11 | At&T Corp. | Method of pattern searching |
JP2006127229A (ja) * | 2004-10-29 | 2006-05-18 | Toshiba Corp | 構造化文書検索システム、構造化文書検索方法及びプログラム |
US7685203B2 (en) * | 2005-03-21 | 2010-03-23 | Oracle International Corporation | Mechanism for multi-domain indexes on XML documents |
US7685138B2 (en) * | 2005-11-08 | 2010-03-23 | International Business Machines Corporation | Virtual cursors for XML joins |
JP5121146B2 (ja) | 2006-02-22 | 2013-01-16 | 株式会社東芝 | 構造化文書管理装置、構造化文書管理プログラムおよび構造化文書管理方法 |
US7502802B2 (en) * | 2006-06-27 | 2009-03-10 | International Business Machines Corporation | Optimizing cursor movement in holistic twig joins |
JP4854542B2 (ja) * | 2007-02-27 | 2012-01-18 | 株式会社東芝 | 文書検索システム及び文書検索方法 |
JP4445509B2 (ja) * | 2007-03-20 | 2010-04-07 | 株式会社東芝 | 構造化文書検索システム及びプログラム |
JP4398988B2 (ja) * | 2007-03-26 | 2010-01-13 | 株式会社東芝 | 構造化文書を管理する装置、方法およびプログラム |
JP5320697B2 (ja) * | 2007-07-26 | 2013-10-23 | 富士通株式会社 | 照合処理プログラムおよび照合処理装置 |
JP5060345B2 (ja) * | 2008-02-29 | 2012-10-31 | 株式会社東芝 | データベース処理装置、情報処理方法及びプログラム |
JP5125662B2 (ja) * | 2008-03-24 | 2013-01-23 | 富士通株式会社 | クエリ変換方法および検索装置 |
JP5296128B2 (ja) | 2011-03-18 | 2013-09-25 | 株式会社東芝 | 構造化文書管理装置、方法およびプログラム |
US8468150B2 (en) * | 2011-10-31 | 2013-06-18 | International Business Machines Corporation | Accommodating gaps in database index scans |
US9275103B2 (en) * | 2013-02-28 | 2016-03-01 | International Business Machines Corporation | Optimization of JOIN queries for related data |
-
2012
- 2012-09-07 CN CN201280002750.1A patent/CN103827861B/zh active Active
- 2012-09-07 JP JP2012542303A patent/JP5439606B1/ja active Active
- 2012-09-07 WO PCT/JP2012/072940 patent/WO2014038069A1/ja active Application Filing
-
2013
- 2013-03-18 US US13/845,962 patent/US10007666B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
WO2014038069A1 (ja) | 2014-03-13 |
JPWO2014038069A1 (ja) | 2016-08-08 |
US20140074875A1 (en) | 2014-03-13 |
US10007666B2 (en) | 2018-06-26 |
CN103827861B (zh) | 2017-09-08 |
CN103827861A (zh) | 2014-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7293018B2 (en) | Apparatus, method, and program for retrieving structured documents | |
US7080067B2 (en) | Apparatus, method, and program for retrieving structured documents | |
JP4314221B2 (ja) | 構造化文書記憶装置、構造化文書検索装置、構造化文書システム、方法およびプログラム | |
KR20090028758A (ko) | 정보 재사용 방법, 정보 제공 방법, 편집 가능한 문서, 및 문서 편집 시스템 | |
US7457812B2 (en) | System and method for managing structured document | |
US8595215B2 (en) | Apparatus, method, and computer program product for processing query | |
JP4247135B2 (ja) | 構造化文書記憶方法、構造化文書記憶装置、構造化文書検索方法 | |
JP2006053724A (ja) | Xmlデータ管理方法 | |
US9378301B2 (en) | Apparatus, method, and computer program product for searching structured document | |
US8086561B2 (en) | Document searching system and document searching method | |
JP3914081B2 (ja) | アクセス権限設定方法および構造化文書管理システム | |
JP5439606B1 (ja) | 構造化文書管理装置、方法およびプログラム | |
JP2008243075A (ja) | 構造化文書管理装置及び方法 | |
JP5296128B2 (ja) | 構造化文書管理装置、方法およびプログラム | |
JP4289022B2 (ja) | 構造化文書処理方法及び装置及び構造化文書処理プログラム及び構造化文書処理プログラムを格納した記憶媒体 | |
JP2002297601A (ja) | 構造化文書管理方法および構造化文書管理装置およびプログラム | |
JP3842574B2 (ja) | 情報抽出方法および構造化文書管理装置およびプログラム | |
JP3842575B2 (ja) | 構造化文書検索方法、構造化文書管理装置及びプログラム | |
JP5422751B1 (ja) | 構造化文書管理装置、方法およびプログラム | |
JP2006018584A (ja) | 構造化文書管理システム、値索引生成方法及びプログラム | |
CN116955310A (zh) | 数据工件的扩展的传播 | |
CN117472940A (zh) | 数据血缘关系构建方法和装置、电子设备及存储介质 | |
JP2004126640A (ja) | 文書構造検索方法、文書構造検索装置および文書構造検索プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131119 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131216 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5439606 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |