JP4246186B2 - 構造化文書のデータ展開方法、データ処理方法及び処理システム - Google Patents
構造化文書のデータ展開方法、データ処理方法及び処理システム Download PDFInfo
- Publication number
- JP4246186B2 JP4246186B2 JP2005243703A JP2005243703A JP4246186B2 JP 4246186 B2 JP4246186 B2 JP 4246186B2 JP 2005243703 A JP2005243703 A JP 2005243703A JP 2005243703 A JP2005243703 A JP 2005243703A JP 4246186 B2 JP4246186 B2 JP 4246186B2
- Authority
- JP
- Japan
- Prior art keywords
- record
- name
- structured document
- array
- associative array
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/84—Mapping; Conversion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/81—Indexing, e.g. XML tags; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/154—Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1は、本発明の一実施の形態の構造化文書展開方法の説明図、図2は、図1のタグの連想配列と内容の連想配列とのプログラムでの指定方法の説明図、図3は、本発明の構造化文書展開方法のAPIへの実装図である。
(1)要素(要素名、要素内容)に、順序を付ける。
(2)Tag1,Tag2の番号を変更することで,レコードの挿入を容易にする。
図4は、本発明の一実施の形態のXML文書の読み取り、連想配列への格納処理フロー図である。ここで,タグを格納するタグの連想配列に、"Tag1"、"Tag2"を、要素内容/属性値を格納する連想配列に"Array"を使うものとする。図1、図10を参照して、図4の処理を説明する。
**構造化文書展開処理をAPIとした構造化文書処理**
図6は、本発明の一実施の形態の構造化文書展開処理をAPIとした構造化文書処理フロー図である。
**他の実施の形態**
前述の実施の形態では、構造化文書を、XML文書で説明したが、他の構造化文書にも適用できる。又、XML文書を、図10の例で、図1、図2のように、展開したもので説明したが、他の内容のXML文書にも適用できる。更に、図3のSAXの代わりに、DOMを使用することもできる。
20 2次元連想配列アプリケーション
30 SAX
100,102 構造化文書(XML文書)
110 基盤ソフト(APIソフト)
112 アプリケーションソフト
Tag1 1次元の添字にする連想配列
Tag2 2次元の添字にする連想配列
Array 内容の連想配列
Claims (6)
- タグで囲まれた文字列からなる複数のレコード要素が階層化されて関連付けたレコードで構成された構造化文書のファイルを、コンピュータが読み出し、前記構造化文書内の前記レコード要素の出現順序に、前記レコード要素から、要素名/属性名と、要素内容/属性値に分解し、メモリに展開する構造化文書の展開方法であって、
前記コンピュータが、前記読み出したレコード要素を、前記構造化文書の前記階層を含む前記要素名/属性名を添字とし,前記要素名/属性名に、前記出現順序に関係付けた連続番号を割り付け、1段目の連想配列を作成し、前記メモリに格納するステップと,
前記コンピュータが、前記連続番号を添字とし,リンク先としての対応する要素内容/属性値を格納した2段目の連想配列を作成し、前記メモリに格納するステップとを有する
ことを特徴とする構造化文書の展開方法。 - 前記1段目の連想配列を作成し、前記メモリに格納するステップは、
前記コンピュータが、前記レコードの上位階層の前記レコード要素に対し、1次元目の添字として、第1の連続番号を割り付け、前記1段目の第1の連想配列を作成し、前記メモリに格納するステップと、
前記コンピュータが、前記レコードの下位階層の前記レコード要素に対し、2次元目の要素として、第2の連続番号を割り付け、前記1段目の第2の連想配列を作成し、前記メモリに格納するステップからなる
ことを特徴とする請求項1の構造化文書の展開方法。 - 前記1段目の第1の連想配列を作成し、格納するステップは、
前記レコードの外の同一の階層の他のレコードの上位階層の前記レコード要素を表すときに,前記コンピュータが、前記第1の連続番号を、間隔を空けて割り付けるステップを有する
ことを特徴とする請求項2の構造化文書の展開方法。 - タグで囲まれた文字列からなる複数のレコード要素が階層化されて関連付けたレコードで構成された構造化文書のファイルを、コンピュータが読み出し、前記構造化文書内の前記レコード要素の出現順序に、前記レコード要素から、要素名/属性名と、要素内容/属性値に分解し、メモリに展開し、展開したレコードを処理する構造化文書の処理方法であって、
前記コンピュータが、前記読み出したレコード要素を、前記構造化文書の前記階層を含む前記要素名/属性名を添字とし,前記要素名/属性名に、前記出現順序に関係付けた連続番号を割り付け、1段目の連想配列を作成し、前記メモリに格納するステップと,
前記コンピュータが、前記連続番号を添字とし,リンク先としての対応する要素内容/属性値を格納した2段目の連想配列を作成し、前記メモリに格納するステップと、
前記コンピュータが、前記階層を含む要素名/属性名で、レコード要素を指定し、前記第1の連想配列の対応する前記連続番号により、前記第2の連想配列の前記要素内容/属性値を、アクセスし、参照処理するステップと、
前記コンピュータが、前記連続番号で前記要素内容/属性値を読み出し、前記構造化文書に書き出すステップとを有する
ことを特徴とする構造化文書の処理方法。 - 前記参照処理するステップは、前記コンピュータが、前記連続番号により、異なる前記要素内容/属性値を持つ連想配列に、移し変えるステップからなる
ことを特徴とする請求項4の構造化文書の処理方法。 - タグで囲まれた文字列からなる複数のレコード要素が階層化されて関連付けたレコードで構成された構造化文書のファイルと、
前記ファイルを読み出し、前記構造化文書内の前記レコード要素の出現順序に、前記レコード要素から、要素名/属性名と、要素内容/属性値に分解し、メモリに展開し、展開したレコードを処理するコンピュータとを有し、
前記コンピュータは、前記読み出したレコード要素を、前記構造化文書の前記階層を含む前記要素名/属性名を添字とし,前記要素名/属性名に、前記出現順序に関係付けた連続番号を割り付け、1段目の連想配列を作成し、前記メモリに格納し、前記連続番号を添字とし,リンク先としての対応する要素内容/属性値を格納した2段目の連想配列を作成し、前記メモリに格納し、
前記コンピュータが、前記階層を含む要素名/属性名で、レコード要素を指定し、前記第1の連想配列の対応する前記連続番号により、前記第2の連想配列の前記要素内容/属性値を、アクセスし、参照処理し、前記連続番号で前記要素内容/属性値を読み出し、前記構造化文書に書き出す
ことを特徴とする構造化文書の処理システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005243703A JP4246186B2 (ja) | 2005-08-25 | 2005-08-25 | 構造化文書のデータ展開方法、データ処理方法及び処理システム |
US11/334,525 US20070055679A1 (en) | 2005-08-25 | 2006-01-19 | Data expansion method and data processing method for structured documents |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005243703A JP4246186B2 (ja) | 2005-08-25 | 2005-08-25 | 構造化文書のデータ展開方法、データ処理方法及び処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007058623A JP2007058623A (ja) | 2007-03-08 |
JP4246186B2 true JP4246186B2 (ja) | 2009-04-02 |
Family
ID=37831171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005243703A Expired - Fee Related JP4246186B2 (ja) | 2005-08-25 | 2005-08-25 | 構造化文書のデータ展開方法、データ処理方法及び処理システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20070055679A1 (ja) |
JP (1) | JP4246186B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7231606B2 (en) | 2000-10-31 | 2007-06-12 | Software Research, Inc. | Method and system for testing websites |
WO2008126224A1 (ja) * | 2007-03-29 | 2008-10-23 | Fujitsu Limited | 情報処理装置及び情報処理方法 |
US8392890B2 (en) * | 2007-10-15 | 2013-03-05 | Software Research, Inc. | Method and system for testing websites |
US8266518B2 (en) * | 2008-01-16 | 2012-09-11 | Raytheon Company | Anti-tamper process toolset |
US20110251914A1 (en) * | 2008-09-22 | 2011-10-13 | Fujifilm North America Corporation | System and Method for Providing Scalable and Customized Product Offerings to Customers |
AU2012282688B2 (en) * | 2011-07-11 | 2017-08-17 | Paper Software LLC | System and method for processing document |
EP2732381A4 (en) | 2011-07-11 | 2015-10-21 | Paper Software LLC | METHOD AND SYSTEM TO SEARCH FOR A DOCUMENT |
AU2012281166B2 (en) | 2011-07-11 | 2017-08-24 | Paper Software LLC | System and method for processing document |
US10572578B2 (en) | 2011-07-11 | 2020-02-25 | Paper Software LLC | System and method for processing document |
CN102306191A (zh) * | 2011-08-31 | 2012-01-04 | 飞天诚信科技股份有限公司 | 基于嵌入式平台的xml报文解析方法 |
US10268948B2 (en) * | 2015-07-23 | 2019-04-23 | The Boeing Company | Data driven classification and troubleshooting system and method using associative memory and a machine learning algorithm to improve the accuracy and performance of the associative memory |
CN108205529A (zh) * | 2016-12-16 | 2018-06-26 | 北京京东尚科信息技术有限公司 | 明细数据的显示方法及装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06250895A (ja) * | 1993-02-26 | 1994-09-09 | Fujitsu Ltd | 構造化データベースシステム |
US6763499B1 (en) * | 1999-07-26 | 2004-07-13 | Microsoft Corporation | Methods and apparatus for parsing extensible markup language (XML) data streams |
US6721727B2 (en) * | 1999-12-02 | 2004-04-13 | International Business Machines Corporation | XML documents stored as column data |
US6490591B1 (en) * | 2000-03-13 | 2002-12-03 | Cisco Technology, Inc. | Apparatus and method for storing complex structures by conversion of arrays to strings |
US6938204B1 (en) * | 2000-08-31 | 2005-08-30 | International Business Machines Corporation | Array-based extensible document storage format |
EP1225516A1 (en) * | 2001-01-22 | 2002-07-24 | Sun Microsystems, Inc. | Storing data of an XML-document in a relational database |
US7089567B2 (en) * | 2001-04-09 | 2006-08-08 | International Business Machines Corporation | Efficient RPC mechanism using XML |
JP4045400B2 (ja) * | 2001-08-24 | 2008-02-13 | 富士ゼロックス株式会社 | 検索装置及び検索方法 |
US20030066033A1 (en) * | 2001-09-13 | 2003-04-03 | Direen, Harry George | Method of performing set operations on hierarchical objects |
US6925470B1 (en) * | 2002-01-25 | 2005-08-02 | Amphire Solutions, Inc. | Method and apparatus for database mapping of XML objects into a relational database |
US20030188264A1 (en) * | 2002-03-29 | 2003-10-02 | Full Degree, Inc. | Method and apparatus for XML data normalization |
JP4388929B2 (ja) * | 2002-12-27 | 2009-12-24 | 富士通株式会社 | 構造化文書の構造変換装置、構造変換方法、記録媒体 |
GB0306610D0 (en) * | 2003-03-21 | 2003-04-30 | British Telecomm | Conversion of structured information |
US7124147B2 (en) * | 2003-04-29 | 2006-10-17 | Hewlett-Packard Development Company, L.P. | Data structures related to documents, and querying such data structures |
US7870112B2 (en) * | 2004-06-30 | 2011-01-11 | Oracle International Corporation | Efficient memory usage for unified document object model implementation for Java |
GB0428365D0 (en) * | 2004-12-24 | 2005-02-02 | Ibm | Methods and apparatus for generating a parser and parsing a document |
-
2005
- 2005-08-25 JP JP2005243703A patent/JP4246186B2/ja not_active Expired - Fee Related
-
2006
- 2006-01-19 US US11/334,525 patent/US20070055679A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20070055679A1 (en) | 2007-03-08 |
JP2007058623A (ja) | 2007-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4246186B2 (ja) | 構造化文書のデータ展開方法、データ処理方法及び処理システム | |
US8418053B2 (en) | Division program, combination program and information processing method | |
JP4997749B2 (ja) | 文書処理方法、プログラム及びシステム | |
US7114123B2 (en) | User controllable data grouping in structural document translation | |
JP4189416B2 (ja) | 構造化文書管理システム及びプログラム | |
US20090210780A1 (en) | Document processing and management approach to creating a new document in a mark up language environment using new fragment and new scheme | |
US20080098018A1 (en) | Secondary lazy-accessible serialization of electronic content | |
JP2002108850A (ja) | 階層構造の構造化文書を変換する装置 | |
JP2003203067A (ja) | 構造化文書変換方法およびデータ変換方法 | |
JP4388929B2 (ja) | 構造化文書の構造変換装置、構造変換方法、記録媒体 | |
JP2008090500A (ja) | データ構造変換システム、プログラム及びデータ構造 | |
JP2005234837A (ja) | 構造化文書処理方法、構造化文書処理システム及びそのプログラム | |
US6175843B1 (en) | Method and system for displaying a structured document | |
US7073122B1 (en) | Method and apparatus for extracting structured data from HTML pages | |
JPH0652161A (ja) | 文書処理方法及び文書処理装置 | |
CA2422490C (en) | Method and apparatus for extracting structured data from html pages | |
JP3788956B2 (ja) | 構造化文書表示方法、構造化文書表示装置及びプログラム | |
JP4951407B2 (ja) | コンテンツ部品検索方法及び装置 | |
JP2003140960A (ja) | Xmlデータのデータ変換方法及びプログラム | |
JP4887726B2 (ja) | 構造化文書のデータ処理方法、データ処理プログラム、およびデータ処理装置 | |
JP4606862B2 (ja) | データ変換装置 | |
JP4410005B2 (ja) | 構造化文書の構造変換装置、プログラム | |
KR20140065389A (ko) | 모듈의 구조 해석을 지원하는 장치 및 프로그램 | |
JP2006154952A (ja) | 構造化文書処理装置及び構造化文書処理方法、プログラム、記憶媒体 | |
JP4786695B2 (ja) | 構造化文書の構造変換装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080731 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080902 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090106 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090107 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120116 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130116 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130116 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140116 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |