JP2003044459A - Method for compressing and exchanging structured data - Google Patents

Method for compressing and exchanging structured data

Info

Publication number
JP2003044459A
JP2003044459A JP2001235046A JP2001235046A JP2003044459A JP 2003044459 A JP2003044459 A JP 2003044459A JP 2001235046 A JP2001235046 A JP 2001235046A JP 2001235046 A JP2001235046 A JP 2001235046A JP 2003044459 A JP2003044459 A JP 2003044459A
Authority
JP
Japan
Prior art keywords
data
information
structured data
content
structured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001235046A
Other languages
Japanese (ja)
Inventor
Mutsumi Komuro
睦 小室
Original Assignee
Hitachi Software Eng Co Ltd
日立ソフトウエアエンジニアリング株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Eng Co Ltd, 日立ソフトウエアエンジニアリング株式会社 filed Critical Hitachi Software Eng Co Ltd
Priority to JP2001235046A priority Critical patent/JP2003044459A/en
Publication of JP2003044459A publication Critical patent/JP2003044459A/en
Application status is Pending legal-status Critical

Links

Abstract

PROBLEM TO BE SOLVED: To provide a method for compressing and exchanging data, by which a data amount can be reduced and data can be exchanged after simultaneously applying enciphering by using the structure information of structured data. SOLUTION: In a compressing (enciphering) module, the internal expression data of the structured data are separated to structure information and contents by using previously applied syntax designation information and further, they are compressed (enciphered) together. The compressed (enciphered) data are delivered from a transmitting side system through a network to a receiving side system. In an extending (deciphering) module, the received compressed (enciphered) data are restored into internal expression data of the structured data by using the syntax designation information.

Description

【発明の詳細な説明】 【0001】 【発明の属する技術分野】本発明は、構造化データを用いたデータ交換、アプリケーション統合、システム統合、およびデータ保存など、構造化データを利用するシステムにおける圧縮方法およびデータ交換方法に関する。 BACKGROUND OF THE INVENTION [0001] [Technical Field of the Invention The present invention relates to a data exchange with the structured data, application integration, system integration, and the like data storage, compression in system utilizing structured data methods and data exchange method. 【0002】 【従来の技術】従来より、テキストデータの可逆圧縮処理方法としては、ランレングス、ハフマン符号化、およびLZ(Zip-Lempel符号)などの各種方法が知られている。 2. Description of the Related Art Conventionally, as a reversible compression method of the text data, the run-length Huffman coding, and various methods such as LZ (Zip-Lempel code) is known. これらは、テキストデータ一般に対する圧縮処理手法である。 These are compressed approach to text data in general. 構造化ドキュメントがテキストデータの形式であるときには、その構造化ドキュメントに対して上記のテキストデータ一般に対する圧縮処理手法を用いることができる。 When the structured document is in the form of text data can be used compression techniques for text data generally above for the structured document. この場合には、その圧縮処理において、そのドキュメントが構造化されているという情報を有効に用いてはいないことになる。 In this case, in the compression process, so that the document is not in use effectively the information that has been structured. 【0003】一方、XML等の構造化データによるデータ交換が一般化しつつある。 On the other hand, data exchange with structured data such as XML is becoming generalized. これは基本的にテキストフォーマットのデータである。 This is the data of the basic text format. 【0004】 【発明が解決しようとする課題】上述したように、XML [0004] [0006] As described above, XML
等の構造化データはテキストフォーマットであるので、 Since the structure of data and the like is a text format,
上述のテキストデータ一般に対する圧縮処理手法を用いて圧縮し、データ交換を行うことが一般化しつつあるが、構造化データが基本的にテキストフォーマットのデータであるため、以下のような問題点がある。 Compressed using a compression process approach to text data generally described above, by performing the data exchange is becoming generalized, since the structured data is data basically text formatting, has the following problem . 【0005】(1)構造化情報をタグとして付与するためデータ量が増大する。 [0005] (1) the amount of data to impart a structured information as the tag is increased. (2)タグおよびコンテンツがテキストとして読めるため、盗聴等によりデータの内容が盗まれる危険がある。 (2) Since the tags and the content is read as text, there is a risk that the contents of the data is stolen by wiretapping. (3)交換後のデータを利用する際、字句解析、構文解析等のパージング処理を行う必要があり処理上のオーバヘッドとなりうる。 (3) When using the data after the replacement, lexical analysis, it can become an overhead on the need might process for purging processing such as parsing. 【0006】本発明は、構造化データの構造情報を用いることで、データ量を削減し、同時に暗号化を施したうえでデータ交換を可能とする構造化データに対する圧縮方法およびデータ交換方法を提供することを目的とする。 The present invention, by using the structure information of the structured data, provides a compression method and data exchange method for the structured data to reduce the data amount, to enable data exchange after having subjected to encryption at the same time an object of the present invention is to. 【0007】 【課題を解決するための手段】上記目的を達成するため、請求項1に係る発明は、構造化データに対するデータ圧縮方法であって、処理対象の構造化データの構造を定義する情報である複数の文法規則を含む構文指定情報内で個々の文法規則を識別情報で特定できるようにしておき、該文法規則を特定する識別情報を用いて前記構造化データの構造を表す構文木を表現することにより、前記構造化データの構造情報とコンテンツ情報とを分離することを特徴とする。 [0007] [Means for Solving the Problems] To achieve the above object, the information invention according to claim 1 is a data compression method for structured data, that defines the structure of the structured data to be processed you should be prepared to identify individual grammar rules by the identification information in the syntax specification information including a plurality of grammar rules is, a syntax tree representing the structure of the structured data by using the identification information for identifying the 該文 method rules by expressing, and separating the structure information and the content information of the structured data. 【0008】請求項2に係る発明は、請求項1に記載の構造化データに対するデータ圧縮方法において、前記構造化データから分離して得たコンテンツ情報をさらにデータ型に応じて分類することを特徴とする。 [0008] The invention according to claim 2, characterized in that for classifying the data compression method for the structured data according to claim 1, the content information obtained by separating from the structured data further in accordance with the data type to. 【0009】請求項3に係る発明は、請求項1に記載の構造化データに対するデータ圧縮方法において、前記コンテンツ情報に含まれるコンテンツデータのデータ出現位置を変数で表すことを特徴とする。 [0009] The invention according to claim 3, in the data compression method for the structured data according to claim 1, characterized in that to represent the data appearing position of the content data included in the content information in the variable. 【0010】請求項4に係る発明は、構造化データのデータ交換方法であって、請求項1から3の何れか1つに記載のデータ圧縮方法を用いて、データ交換の対象データである構造化データを構造情報とコンテンツ情報に分離し、分離した構造情報とコンテンツ情報をそれぞれ所定の圧縮方式で圧縮または所定の暗号化方式で暗号化し、該圧縮または暗号化した構造情報とコンテンツ情報を送信することを特徴とする。 [0010] The invention according to claim 4 is a data exchange method for structured data, using the data compression method according to any one of claims 1 to 3, which is the target data of the data exchange structure separating the data structure information and the content information, each separated structure information and contents information encrypted by a compression or predetermined encryption method by a predetermined compression scheme, transmit the structure information and content information the compressed or encrypted characterized in that it. 【0011】請求項5に係る発明は、構造化データに対するデータ圧縮方法であって、処理対象の構造化データの構造を定義する情報である複数の文法規則を含む構文指定情報を、それらの文法規則を識別情報で特定できるように、記憶手段に保持しておくステップと、前記処理対象の構造化データの構造を表す文法規則を求め、求めたすべての文法規則の識別情報を並べて構造情報を生成するとともに、それらの文法規則のうちコンテンツデータが付随するものについてはそのコンテンツデータをコンテンツ情報に格納し、構造情報に並べた識別情報には当該コンテンツデータが付随することを示す指標を付するステップとを備えたことを特徴とする。 [0011] The invention according to claim 5 is a data compression method for structured data, the syntax specification information including a plurality of grammar rules is information that defines the structure of the structured data to be processed, their grammatical rules to the identifiable by the identification information, a step to hold in the storage means, obtains a grammar rule which represents the structure of the structured data of the processing target, the structure information by arranging the identification information of all the grammatical rules determined and generates, for which content data of those grammatical rules associated stores the content data in the content information, denoted by the index indicating that the content data is accompanied with the identification information arranged in the structure information characterized by comprising the steps. 【0012】請求項6に係る発明は、構造化データに対するデータ圧縮または暗号化方法であって、処理対象の構造化データの構造を定義する情報である複数の文法規則を含む構文指定情報を、それらの文法規則を識別情報で特定できるように、記憶手段に保持しておくステップと、前記処理対象の構造化データの構造を表す文法規則を求め、求めたすべての文法規則の識別情報を並べて構造情報を生成するとともに、それらの文法規則のうちコンテンツデータが付随するものについてはそのコンテンツデータをコンテンツ情報に格納し、構造情報に並べた識別情報には当該コンテンツデータが付随することを示す指標を付するステップと、前記構造情報およびコンテンツ情報を圧縮または暗号化するステップとを備えたことを特徴とする。 [0012] The invention according to claim 6 is the data compression or encryption methods for structured data, the syntax specification information including a plurality of grammar rules is information that defines the structure of the structured data to be processed, as those grammar rules can be specified by the identification information; to hold in the storage means, we obtain a grammar rule which represents the structure of the structured data of the processing target, by arranging the identification information of all the grammatical rules determined indicator generates the structure information, for which the content data of those grammatical rules associated stores the content data in the content information, indicating that the content data is accompanied with the identification information arranged in the structure information a step of subjecting a, characterized in that a step of compressing or encrypting the structure information and content information. 【0013】請求項7に係る発明は、請求項6に記載のデータ圧縮または暗号化方法で圧縮または暗号化された構造情報およびコンテンツ情報を伸長または復号化するデータ伸長または復号化方法であって、圧縮または暗号化された構造情報およびコンテンツ情報を伸長または復号化するステップと、伸長または復号化した構造情報から文法規則の識別情報を取り出し、前記構文指定情報を参照して、取り出した識別情報に対応する文法規則を取得するステップと、取得した文法規則が表すデータ構造の構造化データを復元するとともに、その文法規則にコンテンツデータが付随するものについては前記コンテンツ情報から対応するコンテンツデータを取り出して構造化データの対応する位置に設定することにより、構造化データを復元する [0013] The invention according to claim 7 is a data decompression or decoding method expands or decoding the compressed or encrypted structure information and the content information in the data compression or encryption method according to claim 6 a step of decompression or decoding a compressed or encrypted structure information and content information, retrieve the identification information of grammar rules from the extended or decoding structure information, with reference to the syntax specification information, the identification information extracted acquiring a grammar rule corresponding to, as well as restoring the structured data of the data structure representing the acquired grammar rules about what content data to the grammar rule associated retrieves the content data corresponding from the content information by setting a corresponding position of the structured data Te to recover the structured data テップとを備えたことを特徴とする。 Characterized in that a step. 【0014】 【発明の実施の形態】以下、図面を参照して本発明の実施の形態を詳細に説明する。 DETAILED DESCRIPTION OF THE INVENTION Hereinafter, the embodiments of the present invention will be described in detail with reference to the accompanying drawings. 【0015】図1および図2は、本発明の一実施形態に係る基本的なシステム構成と処理手順を示した図である。 [0015] Figures 1 and 2 are diagrams showing a basic system configuration and processing procedure according to an embodiment of the present invention. 【0016】図1は、構造化データを圧縮または暗号化する場合のシステム構成と処理手順を示す。 [0016] Figure 1 shows a system configuration and processing procedure when compressed or encrypted structured data. 圧縮・暗号化する場合、まず字句・構文解析モジュール(103) If you want to compression and encryption, first lexical, syntactic analysis module (103)
は、入力された構造化データ(101)を事前に与えられた構文指定情報(102)に基づいて解析し、該構造化データ(101)に出現する部分構文木列(104) Analyzes based on the syntax specified information given in advance input structured data (101) (102), partial parse tree columns appearing in the structured data (101) (104)
とそこで現れるコンテンツ(105)とを取り出す。 Take out the content (105) that appears in there and. これらのデータは、それぞれ、構文圧縮(暗号化)モジュール(106)とコンテンツ圧縮(暗号化)モジュール(107)に引き渡す。 These data are respectively delivered to the syntax compressed (encrypted) module (106) and a content compressed (encrypted) module (107). 構文圧縮(暗号化)モジュール(106)は、部分構文木列(104)の圧縮または暗号化を行う。 Syntax compressed (encrypted) module (106) performs a compression or encryption of the partial parse tree column (104). コンテンツ圧縮(暗号化)モジュール(1 Content Compression (encryption) module (1
07)は、コンテンツ(105)の圧縮または暗号化を行う。 07) performs compression or encryption of the content (105). これらのモジュールによる圧縮(暗号化)の結果をあわせて圧縮(暗号化)データ(108)として出力する。 Output as compression by these modules compressing together the results of (encryption) (encrypted) data (108). 【0017】図2は、圧縮(暗号化)データを伸長または復号化する場合のシステム構成と処理手順を示す。 [0017] Figure 2, the compression shows a system configuration and processing procedure in the case of decompression or decoding the (encrypted) data. 伸長・復号化する場合、図1に示した処理とは逆に、圧縮(暗号化)データ(201)を入力として受け取り、部分構文木伸長(復号化)モジュール(202)およびコンテンツ伸長(復号化)モジュール(203)に、圧縮(暗号化)データ201の相当部分を、それぞれ引き渡す。 When extending and decoding, in contrast to the process shown in FIG. 1, receives compressed (encrypted) data (201) as input, partial parse tree extension (decryption) module (202) and the content decompression (decoding ) module (203), compressing (a substantial portion of the encrypted) data 201, and passes respectively. 部分構文木伸長(復号化)モジュール(202) Partial parse tree extension (decryption) module (202)
は、構文指定情報に基づいて、圧縮(暗号化)されている部分構文木列を伸長(復号化)し、部分構文木列(2 Is based on the syntax specification information, compressed (encrypted) has been that partial parse tree column extension (decryption), partial parse tree columns (2
04)を出力する。 04) to the. コンテンツ伸長(復号化)モジュール(203)は、圧縮(暗号化)されているコンテンツを伸長(復号化)し、コンテンツ(205)を出力する。 Content decompression (decoding) module (203) is compressed (encrypted) has been has extended the content (decryption), and outputs the content (205). 最後に合成モジュール(206)は、部分構文木列(204)上にコンテンツ(205)をはめこんで、もとの構造化データ(207)を得る。 Finally synthesis module (206) Fit the content (205) on a partial parse tree columns (204), obtain the original structured data (207). 【0018】図3は、図1および図2に示すシステムを利用して、構造化データを用いたデータ交換を行う場合のシステム構成と処理手順を示した図である。 [0018] Figure 3, by using the system shown in FIG. 1 and FIG. 2 is a diagram showing a system configuration and processing procedure in the case of performing data exchange using structured data. まず、送信したい構造化データに対する構文指定情報(301) First, the syntax specification information for the structured data to be transmitted (301)
および(302)を、予めデータ送信側システム(30 And (302), advance data sending system (30
3)、圧縮(暗号化)モジュール(304)、伸長(復号化)モジュール(305)、およびデータ受信側システム(306)の間で共有しておく。 3), compressed (encrypted) module (304), previously shared between the decompression (decoding) module (305), and a data receiving system (306). 【0019】この図に示すシステムでは、同一の構文指定情報のコピーを(301)と(302)の2つ用意する。 [0019] In the system shown in this figure, two prepared copies of the same syntax specifies information (301) (302). データ送信側システム(303)と圧縮(暗号化) Data transmitting side compression system (303) (encryption)
モジュール(304)が構文指定情報(301)を使用し、伸長(復号化)モジュール(305)とデータ受信側システム(306)内の字句・構文解析モジュール(313)が構文指定情報(302)を使用する場合を図示している。 Module (304) using the syntax specification information (301), decompresses (decodes) module (305) lexical-syntactic analysis module (313) syntax specification information of the data receiving side in the system (306) (302) It illustrates the case that you want to use. 【0020】データ送信側システム(303)は、与えられた入力データを構文指定情報(301)に基づき構文解析し、構文木などによる内部データ(307)の形式でこれを保持する。 [0020] Data transmission side system (303) parses based input data given to the syntax specification information (301), holds it in the form of internal data (307) due to syntax trees. 構造化データ作成モジュール(3 Structured data creation module (3
08)は、この内部データ(307)からテキスト形式の構造化データ(309)を出力する。 08) outputs a structured text format data from the internal data (307) (309). これを受け取った圧縮(暗号化)モジュール(304)は、図1で説明したようにその構造化データ(309)を構造情報とコンテンツに分離してそれぞれを圧縮(暗号化)した圧縮(暗号化)データ(310)とし、ネットワーク(31 Compression received this (encryption) module (304), compresses each separating the structured data (309) as described in structure information and contents in FIG. 1 (encrypted) and compressed (encrypted ) and data (310), the network (31
1)経由で受信側に送信する。 1) to the receiving side via. 【0021】受信側では、受け取った圧縮(暗号化)データ(310)を伸長(復号化)モジュール(305) [0021] On the receiving side, the received compressed (encrypted) extension data (310) (decryption) module (305)
で図2で説明したように伸長(復号化)し、元の構造化データ(312)に戻したのち、データ受信側システム(306)に引渡す。 In extended (decoded) as described in FIG. 2, after returning to the original structured data (312) and passes the data receiving system (306). データ受信側システム(306) Data receiving system (306)
内の字句・構文解析モジュール(313)は、その構造化データ(312)を内部データ(314)に変換した後、データ処理をすすめる。 Lexical-parsing module of the inner (313), converts the structured data (312) to an internal data (314), proceeding data processing. 【0022】このシステム構成では、データ交換する際に構造化データ(309)を圧縮しているため、ネットワーク(311)を通過する通信データ量は削減される。 [0022] In this system configuration, since compressing the structured data (309) during the data exchange, amount of communication data passing through the network (311) is reduced. 【0023】図4は、図3のデータ交換システムを改良して、パージング処理を組みこむことでデータの圧縮(暗号化)・伸長(復号化)処理のオーバヘッドをなくしたシステム構成例である。 [0023] Figure 4, to improve the data exchange system of FIG. 3 is a system configuration example of eliminating the overhead of the compressed data by incorporating a purging process (encryption) and decompression (decoding) process. 図3における構造化データ作成モジュール(308)の代わりに、圧縮(暗号化) Alternatively, the compression of the structured data generation module in FIG. 3 (308) (encryption)
モジュール(304)をデータ送信側システム(30 The data transmission side system module (304) (30
3)に直接組みこんだのが、図4のデータ送信側システム(401)である。 The incorporating directly 3) is a data transmitting side system in FIG. 4 (401). 同様に、図3における字句・構文解析モジュール(313)の代わりに、伸長(復号化) Similarly, instead, the extension of the lexical-syntactic analysis module in FIG. 3 (313) (decryption)
モジュール(305)をデータ受信側システム(30 Data receiving system module (305) (30
6)に直接組みこんだのが、図4のデータ受信側システム(402)である。 The incorporating directly 6) is data receiving system in FIG. 4 (402). 【0024】このようなシステム構成をとることで、データの内部表現を構造化データに変換することなく圧縮(暗号化)データとしているので、図3のデータ交換システムで生じていたオーバヘッドは解消される。 [0024] By employing such a system configuration, since a rather compressed (encrypted) data to convert the internal representation of data in structured data, overhead which occurs in a data exchange system of Figure 3 is eliminated that. さらに、単にオーバヘッドを解消するのみでなく、圧縮(暗号化)モジュール(304)および伸長(復号化)モジュール(305)を全く用いずに直接、構造化データを送信した場合と比較して、むしろ性能向上することが可能となる。 Further, merely not only to eliminate the overhead compression (encryption) module (304) and extension (decryption) module (305) directly without at all, as compared with the case of transmitting structured data, rather it is possible to improve performance. 実際、図4で送信される圧縮(暗号化)データ(403)は構文情報を既に含んでいるため、データ受信側システム402で字句・構文解析を実行せずに構文木などによる内部データ(404)を得ることができる。 Indeed, compressed (encrypted) transmitted in FIG. 4 data (403) is because it contains syntax information already internal data (404 due syntax trees without running the lexical-parsing the data receiving system 402 ) can be obtained. 【0025】図5および図6に、圧縮・暗号化の具体例を示す。 [0025] Figures 5 and 6 show a specific example of compression and encryption. 【0026】図5において、(5.1)は住所録を作成するための複数の構文定義情報から成る構文指定情報(図1〜図4の102,301,302など)で、XML [0026] In FIG. 5, in (5.1) syntax specification information comprising a plurality of syntax definition information for creating an address book (such as 102,301,302 of FIGS 4), XML
文書用のDTDと呼ばれる定義形式で記述してある。 It is described in the definition format called DTD for the document.
(5.2)は、このDTDを用いたXMLによる構造化データ(図1〜図4の101,207,309,312)であり、住所録データベースからの検索結果を想定している。 (5.2) is a structured data by XML using the DTD (101,207,309,312 in FIGS. 1-4), it is assumed that the search results from the address book database. 後の参照のために、構文指定情報(5.1)には、 For later reference, the syntax specified information (5.1) is,
1から15までの番号を振ってある。 They are numbered from 1 to 15. この番号は、構文指定情報(5.1)中の1行分の情報を特定するものであり、構文指定情報(5.1)の中にこの番号データが含まれている訳ではない。 This number is for specifying a row of information in the statement specifying information (5.1), the syntax specification information (5.1) The number data not contained within the. 構造化データ(5.2)をみるとわかるように、構造化データ(5.2)ではデータの半分以上が構文を定めるタグ定義であり、しかも似たような構文が繰返し現れている。 As can be seen looking at the structured data (5.2), it is a tag definition that more than half of the data in the structured data (5.2) defines the syntax, yet something similar syntax has appeared repeatedly. 【0027】図6は、構造化データ(5.2)を構文(図1,2の104,204)とコンテンツ(図1,2 [0027] Figure 6 includes a content (FIGS structured data (5.2) syntax (104, 204 in FIGS. 1 and 2)
の105,205)に分離した結果を示す。 It shows the results of separating the 105, 205) of the. (6.1) (6.1)
が構文情報を分離したもので、構造化データ(5.2) There obtained by separation of the syntax information, structured data (5.2)
を構文指定情報(5.1)で番号付けした15個の文法規則のどれを用いて構文解析したかという情報と、コンテンツとして通常の文字列データであるPCDATAまたは特殊文字も含む文字列データであるCDATAのいずれかを含んでいるかという情報をあわせて出力させている。 And the information of which one was parsed using the 15 pieces of grammar rules that were numbered in the syntax specified information (5.1), in the character string data, including also PCDATA or special character is a normal character string data as content and then outputs the combined information as to contain any of a CDATA. すなわち、構文(6.1)では、PCDATAを含むときは変数p、CDATAを含む場合には変数cをつけて表わしている。 That is, in the syntax (6.1), in the case when they contain PCDATA, including a variable p, CDATA represents with a variable c. 【0028】例えば、構文(6.1)の先頭からの「1,2,3」は、それぞれ構文指定情報(5.1)の第1〜3行の定義規則に基づく構造情報(具体的には(5.2)の第1行目の<address-book>から第3行目の [0028] For example, the syntax (6.1) "1,2,3" from the beginning of each syntax specification information (5.1) structure information based on the first to third line definition rules (specifically is (5.2) of the first row from the <address-book> of the third row
<name>まで)が最初に来ることを示している。 <Name> to) have shown that comes first. 次の「4 The following "4
p」は構文指定情報(5.2)の4行目の定義規則に基づく構造情報がPCDATAを含んで次に来ることを示している。 p "structure information based on the fourth row of the rules defined syntax specification information (5.2) shows that come next comprise PCDATA. これは、(5.2)の<firstname>John</firstname This is, <firstname> John </ firstname of (5.2)
>の部分に相当する。 It corresponds to a portion of>. 【0029】構造化データ(5.2)と(6.1)を比較すればわかるように、構文情報に関しては、この変換のみでもタグを番号で置換えているため既に圧縮の効果があることがわかる。 [0029] As can be seen by comparing the structured data and (5.2) a (6.1), with respect to the syntax information, that there is already the effect of compression because it replaced by number tag in this transformation only Recognize. (6.2)と(6.3)は、PCDA (6.2) and (6.3) is, PCDA
TAとCDATAを出現順に適当な区切り記号をつけて連結したものである。 The TA and CDATA is the concatenation with the appropriate delimiters in the order in which they appear. XMLの仕様ではPCDATAでは'>'、CDATAでは']]>'を文字列として含まないことに定められているので、ここではこれらを区切り文字として採用している。 In PCDATA is an XML specification '>', since it is specified in that it does not contain a CDATA At ']]>' as a string, here employs them as delimiters. 【0030】構造化データ(5.2)のデータ圧縮を行うには、図6に示すように分離された構文(6.1)、 [0030] To perform data compression of the structured data (5.2), the syntax separated as shown in FIG. 6 (6.1)
PCDATA(6.2)、およびCDATA(6.3)のそれぞれを圧縮すればよい。 PCDATA (6.2), and may be compressed to respective CDATA (6.3). この例の場合、構造化データ(5. In this example, structured data (5.
2)の構文はほとんど同じ形式のデータが繰り返されると予想される。 Syntax 2) it is expected to most data in the same format is repeated. (6.1)では、データの中身は変数化して構文のみをとりだしているので、この部分は全く同じかほとんど同じ文字列の繰返しになることが予想される。 In (6.1), since the contents of the data are taken out only syntax and variable reduction, this portion is expected to be exactly the repetition of the same or almost the same string. したがって、例えばランレングスのような初等的な圧縮方法でも十分な圧縮効果をあげられる。 Thus, like a sufficient compression effect in primary compression methods, such as run length. PCDATA PCDATA
(6.2)およびCDATA(6.3)のテキストデータに関しては、上述のような著しいデータの偏りこそないものの、構造化データ(5.2)の同じタグの部分を取り出してきているので、住所なら住所、人名なら人名といった同じ分類の言葉が集まることが期待できる。 For the text data (6.2) and CDATA (6.3), but what no bias significant data as described above, since it has removed part of the same tag in the structured data (5.2), address if the address, can be expected to gather the words of the same classification, such as person's name if person's name. このため、局所的に同じ文字列の出現率が高いときに効果のある圧縮方法、例えばLZ77(Zip-Lampel)符号を用いることで高い圧縮効果を得ることができる。 Therefore, the compression method that is effective when a high incidence of locally same string, it is possible to obtain a high compression effect by using, for example, LZ77 (Zip-Lampel) code. 【0031】なお、この例では定義形式としてDTDを用いたが、データ形式をさらに細かく定義できる新しい定義形式としてXML SchemaやRelaxといったものも提案されている。 [0031] Although using the DTD as defined format in this example, has also been proposed, such as XML Schema and Relax as a new definition format that can further define the data format. このような場合、さらにデータの局所的な偏りを高めることができるので、圧縮効果はさらに高くなると期待される。 In such a case, it is possible to further enhance the local data skew, the compression effect is expected to further increase. また、型ごとにデータを集めることができるので、データ型に応じた符号化を採用することで、圧縮効率をさらに高めることが可能になる。 Further, it is possible to collect the data for each type, by employing the encoding in accordance with the data type, it is possible to further increase the compression efficiency. 実際、 In fact
XML Schemaの2000年4月7日付けのWorkingDraft(h WorkingDraft of April 7, 2000 with the XML Schema (h
ttp://www.w3.org/TR/2000/WD-xmlschema-0-20000407/) ttp: //www.w3.org/TR/2000/WD-xmlschema-0-20000407/)
では文字列、論理値、浮動点小数、倍精度実数、十進数、日付、および期間など40種類以上の単純型が組込み型として予め定義されており、これらの型によるデータ分類を用いればデータの局所性を著しく高めることが可能である。 The character string, a logical value, floating point numbers, double precision, decimal, date, and duration such as 40 or more simple types are predefined as embedded, data With these types by the data classification it is possible to significantly increase the locality. 【0032】このように圧縮された構造化データを伸長するには、まず採用した圧縮方法に対する伸長を行い、 [0032] expands the compressed structured data in this way, performs decompression for first adopted compression method,
図6に示したような構文(6.1)、PCDATA(6. Syntax (6.1) as shown in FIG. 6, PCDATA (6.
2)、およびCDATA(6.3)の分類を得た後、構文(6.1)の変数部分にPCDATA(6.2)およびCDATA 2), and after obtaining the classification of CDATA (6.3), PCDATA the variable part of the syntax (6.1) (6.2) and CDATA
(6.3)のデータを区切り文字を分割しながら順に代入していけばよい。 (6.3) may be should be assigned to the order while data by dividing the delimiter of. この代入においては、まず、構文指定情報(5.1)の各文法規則に対して対応する有限状態機械を構成しておく。 In this assignment, first, keep constituting the corresponding finite state machine for each grammar rule syntax specification information (5.1). これは各文法規則が正規表現で書かれていることから標準的なアルゴリズムで構成できる。 This can be configured in a standard algorithm since each grammar rule is written in a regular expression. さらに、DTDの各文法規則からこのように得られた有限状態機械は決定性を持たなければならないことがXM Furthermore, XM be finite state machine obtained as this from the grammar rules of the DTD that must have deterministic
Lの仕様で定められている。 It is defined in the L specifications. 【0033】以下、図6のデータ分類を得るための手順を説明する。 [0033] Hereinafter, the procedure for obtaining the data classification of FIG. XML等の構造化データは構文的なあいまいさはないように設計されているので、YACCなどに代表されるLALR(1)パーザ生成プログラムにより構文解析プログラムを作成できる。 Because it is designed to structured data such as XML is not syntactic ambiguities can create parser by LALR (1) parser generator represented by a YACC. すなわち、構文解析ルールをBN In other words, the parsing rules BN
F形式に記述し、各ルールに対し、そのルール適用時のアクションを指定することで構文解析を行うプログラムを生成できる。 Described F format, for each rule, can generate program for parsing by specifying the action when the rule applies. したがって、次のような手順で構文解析ルールをDTDから構成すれば、図6のデータ分類を得るための解析プログラム(図1の103)を生成することができる。 Therefore, by forming the parsing rules in the following procedure from the DTD, it is possible to generate an analysis program (103 in FIG. 1) for obtaining the data classification of FIG. 【0034】ステップ1:DTD内の<!ELEMENT tag_name [0034] Step 1:! In the DTD <ELEMENT tag_name
body>の形の各要素定義に対して、lex_id(tag_name) For each element defined in the form of a body>, lex_id (tag_name)
→ trans(body )の形の構文解析ルールを作成する。 → to create a form of parsing rules of trans (body). ただし、lex_id は字句解析プログラムが返すtag_nameに対するID、trans(body)はステップ2以下で得られるbod However, Lex_id the ID for tag_name returned by the lexical analyzer, trans (body) is obtained in Step 2 below bod
yの変換結果とする。 The conversion result of y. また、対応するアクションは次のような文字列を返す操作とする:<!ELEMENT tag_name b In addition, the corresponding action is an operation that returns a string such as the following:! <ELEMENT tag_name b
ody>につけられた番号の次にtrans(body)のアクションとして得られる文字列を連結することによって得られる文字列。 Character string obtained by concatenating the character string obtained in the following Lighted number to ody> as the action of trans (body). 【0035】ステップ2:変換transを以下のように再帰的に定める。 [0035] Step 2: determining the conversion trans recursively as follows. 【0036】(1)trans(nil) = nilとする。 [0036] and (1) trans (nil) = nil. このアクションは空文字列""を返す操作である。 This action is an operation that returns an empty string "". 【0037】(2)(x . y) で先頭要素xの次にリストy [0037] (2) (x. Y) listed in the following of the first element x by y
が連結されているリストを表すこととし、trans(x . y) There was a represent a list that is connected, trans (x. Y)
= (trans_each(x) . trans(y))とする。 = A (trans_each (x). Trans (y)). アクションは、trans_each(x), trans(y)のアクションの結果として得られる文字列を連結して得られる文字列を返す操作とする。 Action is an operation that returns a string obtained by concatenating strings obtained as a result of the action of trans_each (x), trans (y). ただし、trans_eachは、以下のように定義される。 However, Trans_each is defined as follows. 【0038】(2−1)trans_each(#PCDATA) = lex_id [0038] (2-1) trans_each (#PCDATA) = lex_id
(#PCDATA) 、アクションは文字列 "p"を返す操作とする。 (#PCDATA), the action is an operation that returns a string "p". (2−2)trans_each(#CDATA) =lex_id(#CDATA) 、アクションは文字列 "c"を返す操作とする。 (2-2) trans_each (#CDATA) = lex_id (#CDATA), the action is an operation that returns a string "c". (2−3)trans_each(tag_name) = lex_id(tag_nam (2-3) trans_each (tag_name) = lex_id (tag_nam
e)、アクションは空文字列""を返す操作とする。 e), the action is an operation that returns an empty string "". 【0039】(2−4)trans_each(tag_name*) =make_ [0039] (2-4) trans_each (tag_name *) = make_
new_symbol(lex_id(tag_name),_ list)、アクションは恒等写像とする。 new_symbol (lex_id (tag_name), _ list), the action is the identity mapping. ただし、make_new_symbolは、引数として与えられた2つの記号を連結して新しい記号をつくる関数とする。 However, Make_new_symbol is a function to create a new symbol by connecting two symbols given as arguments. さらに、この場合、tn = lex_id(tag_na In addition, in this case, tn = lex_id (tag_na
me)、tn_list= make_new_symbol(ln,_list) に対する次の新しいルールを追加する。 me), add the following new rules for tn_list = make_new_symbol (ln, _list). (2−4−1)tn_list → nil 、アクションは空文字列""を返す操作とする。 (2-4-1) tn_list → nil, action is an operation that returns an empty string "". (2−4−2)tn_list → tn_list tn 、アクションは右辺のアクションの結果として返される2つの文字列を連結した文字列を返す操作とする。 (2-4-2) tn_list → tn_list tn, actions and operations that return a concatenated string of two strings to be returned as a result of the right side of the action. 【0040】(2−5)trans_each(tag_name+) =make_ [0040] (2-5) trans_each (tag_name +) = make_
new_symbol(lex_id(tag_name),_ list1)、アクションは恒等写像とする。 new_symbol (lex_id (tag_name), _ list1), action is the identity mapping. この場合、tn = lex_id(tag_name)、t In this case, tn = lex_id (tag_name), t
n_list1= make_new_symbol(ln,_list1) に対する次の新しいルールを追加する。 n_list1 = make_new_symbol (ln, _list1) to add the following new rules for. (2−5−1)tn_list1 → tn 、アクションは恒等写像とする。 (2-5-1) tn_list1 → tn, action is the identity mapping. (2−5−2)tn_list1 → tn_list tn 、アクションは右辺のアクションの結果として返される2つの文字列を連結した文字列を返す操作とする。 (2-5-2) tn_list1 → tn_list tn, actions and operations that return a concatenated string of two strings to be returned as a result of the right side of the action. 【0041】(2−6)trans_each(tag_name?) =make_ [0041] (2-6) trans_each (tag_name?) = Make_
new_symbol(lex_id(tag_name),_ opt)、アクションは恒等写像とする。 new_symbol (lex_id (tag_name), _ opt), action is the identity mapping. この場合、tn = lex_id(tag_name)、tn_ In this case, tn = lex_id (tag_name), tn_
opt= make_new_symbol(ln,_opt) に対する次の新しいルールを追加する。 opt = make_new_symbol (ln, _opt) to add the following new rules for. (2−6−1)tn_opt → nil 、アクションは空文字列""を返す操作とする。 (2-6-1) tn_opt → nil, action is an operation that returns an empty string "". (2−6−2)tn_opt → tn 、アクションは恒等写像とする。 (2-6-2) tn_opt → tn, action is the identity mapping. 【0042】以上、主として圧縮・伸長する場合を例として説明したが、暗号化・復号化する場合も同様である。 The invention has been described with respect to an example in which mainly compression and decompression, the same applies when encrypting and decrypting. すなわち、図6のように分類した後、構文(6. That is, after classified as 6, the syntax (6.
1)、PCDATA(6.2)、およびCDATA(6.3)をそれぞれ暗号化して送信し、受信側では復号化すればよい。 1), PCDATA (6.2), and CDATA a (6.3), respectively and transmits the encrypted, may be decrypted by the receiver. 構文指定情報(5.1)がデータ交換する当事者以外には秘密になっていれば、構文(6.1)の形にしただけでも構造化情報については既に暗号化が行われていると見ることができる。 If in addition to the parties syntax specified information (5.1) is data exchange is sufficient that the secret, seen as already encrypted for structured information alone was in the form of syntax (6.1) has been carried out be able to. 【0043】 【発明の効果】以上説明したように、この発明によれば、構造化データを構文指定情報に従って、構文とコンテンツに分離してそれぞれを圧縮・暗号化するので、構造化データをそのまま圧縮するよりも、通信データ量を効果的に削減することが可能になる。 [0043] As has been described in the foregoing, according to the present invention, according to the syntax specification information structured data, since the compression and encrypts each separated into syntax and content, as structured data than compression also makes it possible to reduce the amount of communication data effectively. また、データ交換の際には、本発明に係る圧縮・暗号方式を採用することで、通信データ量の削減および安全性向上の効果の上に、さらに構造化データのパージングにともなうオーバヘッドなしのデータ交換が実現できる。 At the time of data exchange, the use of the compression and encryption system according to the present invention, on the effect of reducing the amount of communication data and safety improvement, data without the overhead associated with more structured data parsing exchange can be realized.

【図面の簡単な説明】 【図1】構造化データを圧縮または暗号化する場合のシステム構成と処理手順を示した図【図2】圧縮(暗号)データを伸長または復号化する場合のシステム構成と処理手順を示した図【図3】構造化データを用いたデータ交換を行う場合のシステム構成と処理手順を示した図【図4】パージング処理を組みこむことでオーバヘッドをなくしたシステム構成の例を示した図【図5】圧縮・暗号方法の概要を例示するための適用例を示した図【図6】構造化データを構文とコンテンツに分離した結果を示した図【符号の説明】 101…構造化データ、102…構文指定情報、103 System configuration when BRIEF DESCRIPTION OF THE DRAWINGS [Figure 1] decompression or decoding a diagram showing a system configuration and processing procedure [2] Compression (encrypted) data in the case of compressed or encrypted structured data and showing a procedure Figure 3 shows the case where exchange data with structured data Figure 4 shows shows a system configuration and processing procedure of the system configuration eliminates the overhead by incorporating a purging process Figure shows the FIG. 5 is a diagram [6] showing an application example to illustrate an overview of a compression-cryptosystem results structured data separated into syntax and content of an example eXPLANATION oF REFERENCE nUMERALS 101 ... structured data, 102 ... syntax specification information 103
…字句・構文解析、104…部分構文木列、105…コンテンツ、106…構文圧縮(暗号)モジュール、10 ... lexical-syntactic analysis, 104 ... partial parse tree rows, 105 ... content, 106 ... syntax compression (cryptographic) module, 10
7…コンテンツ圧縮(暗号)モジュール、108…圧縮(暗号)データ、201…圧縮(暗号)データ、202 7 ... Content Compression (cryptographic) module, 108 ... compression (encrypted) data, 201 ... compression (encrypted) data, 202
…部分構文木伸長(復号)モジュール、203…コンテンツ伸長モジュール、204…部分構文木列、205… ... partial parse tree extension (decoding) module, 203 ... content decompression module, 204 ... partial parse tree rows, 205 ...
コンテンツ、206…合成モジュール、207…構造化データ、301、302…構文指定情報、303…データ送信側システム、304…圧縮(暗号化)モジュール、305…伸長(復号化)モジュール、306…データ受信側システム、313…字句・構文解析モジュール、307…内部データ、308…構造化データ作成モジュール、309…構造化データ、310…圧縮(暗号化)データ、311…ネットワーク、312…構造化データ、313…字句・構文解析モジュール、314…内部データ、401…データ送信側システム、402…データ受信側システム、403…圧縮(暗号化)データ、 Content, 206 ... synthesis module, 207 ... structured data, 301, 302 ... syntax specification information, 303 ... Data transmitting side system, 304 ... compression (encryption) module, 305 ... decompression (decoding) module, 306 ... data receiving side system 313 ... lexical-syntactic analysis module, 307 ... internal data, 308 ... structured data creation module, 309 ... structured data, 310 ... compression (encrypted) data, 311 ... network, 312 ... structured data, 313 ... lexical-syntactic analysis module, 314 ... internal data, 401 ... data transmitting side system, 402 ... data receiving system 403 ... compression (encrypted) data,
404…内部データ、5.1…構文指定情報、5.2… 404 ... internal data, 5.1 ... syntax specified information, 5.2 ...
構造化データ。 Structured data.

Claims (1)

  1. 【特許請求の範囲】 【請求項1】構造化データに対するデータ圧縮方法であって、 処理対象の構造化データの構造を定義する情報である複数の文法規則を含む構文指定情報内で個々の文法規則を識別情報で特定できるようにしておき、該文法規則を特定する識別情報を用いて前記構造化データの構造を表す構文木を表現することにより、前記構造化データの構造情報とコンテンツ情報とを分離することを特徴とする構造化データに対するデータ圧縮方法。 Patent Claims: 1. A data compression method for structured data, individual grammar in the syntax specification information including a plurality of grammar rules is information that defines the structure of the structured data to be processed you should be prepared to identify the rule by the identification information, by expressing the syntax tree representing the structure of the structured data by using the identification information for identifying the 該文 method rules, the structure information and the content information of the structured data data compression method for structured data and separating the. 【請求項2】請求項1に記載の構造化データに対するデータ圧縮方法において、 前記構造化データから分離して得たコンテンツ情報をさらにデータ型に応じて分類することを特徴とする構造化データに対するデータ圧縮方法。 2. A data compression method for the structured data according to claim 1, for the structured data, characterized in that classified according to the further data type content information obtained by separating from the structured data data compression method. 【請求項3】請求項1に記載の構造化データに対するデータ圧縮方法において、 前記コンテンツ情報に含まれるコンテンツデータのデータ出現位置を変数で表すことを特徴とする構造化データに対するデータ圧縮方法。 3. A data compression method for the structured data according to claim 1, the data compression method for structured data, characterized by representing the data appearance position of the content data included in the content information in the variable. 【請求項4】構造化データのデータ交換方法であって、 請求項1から3の何れか1つに記載のデータ圧縮方法を用いて、データ交換の対象データである構造化データを構造情報とコンテンツ情報に分離し、分離した構造情報とコンテンツ情報をそれぞれ所定の圧縮方式で圧縮または所定の暗号化方式で暗号化し、該圧縮または暗号化した構造情報とコンテンツ情報を送信することを特徴とするデータ交換方法。 4. A data exchange method of structured data, using the data compression method according to any one of claims 1 to 3, structured data and structural information is the subject data of the data exchange separating the content information, each separated structure information and contents information encrypted by a compression or predetermined encryption method by a predetermined compression method, and transmits the structure information and content information the compressed or encrypted data exchange method. 【請求項5】構造化データに対するデータ圧縮方法であって、 処理対象の構造化データの構造を定義する情報である複数の文法規則を含む構文指定情報を、それらの文法規則を識別情報で特定できるように、記憶手段に保持しておくステップと、 前記処理対象の構造化データの構造を表す文法規則を求め、求めたすべての文法規則の識別情報を並べて構造情報を生成するとともに、それらの文法規則のうちコンテンツデータが付随するものについてはそのコンテンツデータをコンテンツ情報に格納し、構造情報に並べた識別情報には当該コンテンツデータが付随することを示す指標を付するステップとを備えたことを特徴とする構造化データに対するデータ圧縮方法。 5. A data compression method for structured data, the syntax specification information including a plurality of grammar rules is information that defines the structure of the structured data to be processed, identify those grammar rules in the identification information as can, a step to hold in the storage means, obtains a grammar rule which represents the structure of the structured data of the processing target, and generates a structural information by arranging the identification information of all the grammar rules obtained, their and stores the content data for which the content data is accompanied of grammar rules to the content information, further comprising the step of subjecting an indication that the content data is accompanied with the identification information arranged in the structure information data compression method for structured data, wherein. 【請求項6】構造化データに対するデータ圧縮または暗号化方法であって、 処理対象の構造化データの構造を定義する情報である複数の文法規則を含む構文指定情報を、それらの文法規則を識別情報で特定できるように、記憶手段に保持しておくステップと、 前記処理対象の構造化データの構造を表す文法規則を求め、求めたすべての文法規則の識別情報を並べて構造情報を生成するとともに、それらの文法規則のうちコンテンツデータが付随するものについてはそのコンテンツデータをコンテンツ情報に格納し、構造情報に並べた識別情報には当該コンテンツデータが付随することを示す指標を付するステップと、 前記構造情報およびコンテンツ情報を圧縮または暗号化するステップとを備えたことを特徴とする構造化データに対するデ 6. A data compression or encryption methods for structured data, the syntax specification information including a plurality of grammar rules is information that defines the structure of the structured data to be processed, identify those grammar rules as can be specified by the information, a step to hold in the storage means, obtains a grammar rule which represents the structure of the structured data of the processing target, and generates a structural information by arranging the identification information of all the grammatical rules determined , for which content data of those grammatical rules associated with the step of subjecting an indication that the content data is accompanied in its storing content data to the content information, the identification information arranged in the structure information, de for structured data, characterized in that a step of compressing or encrypting the structure information and content information タ圧縮または暗号化方法。 Data compression or encryption method. 【請求項7】請求項6に記載のデータ圧縮または暗号化方法で圧縮または暗号化された構造情報およびコンテンツ情報を伸長または復号化するデータ伸長または復号化方法であって、 圧縮または暗号化された構造情報およびコンテンツ情報を伸長または復号化するステップと、 伸長または復号化した構造情報から文法規則の識別情報を取り出し、前記構文指定情報を参照して、取り出した識別情報に対応する文法規則を取得するステップと、 取得した文法規則が表すデータ構造の構造化データを復元するとともに、その文法規則にコンテンツデータが付随するものについては前記コンテンツ情報から対応するコンテンツデータを取り出して構造化データの対応する位置に設定することにより、構造化データを復元するステップとを備えたこ 7. A data decompression or decoding method expands or decoding the compressed or encrypted structure information and the content information in the data compression or encryption method according to claim 6, compressed or encrypted and a step of decompression or decoding structural information and content information, retrieve the identification information of grammar rules from the extended or decoding structure information, with reference to the syntax specification information, the grammatical rule corresponding to the identification information extracted acquiring, with restoring the structured data of the data structure representing the acquired grammar rules, the corresponding structured data fetches the content data corresponding from the content information about what content data to the grammar rule associated by setting a position, this having and restoring the structured data を特徴とする構造化データに対するデータ伸長または復号化方法。 Data decompression or decoding method for structured data, wherein.
JP2001235046A 2001-08-02 2001-08-02 Method for compressing and exchanging structured data Pending JP2003044459A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001235046A JP2003044459A (en) 2001-08-02 2001-08-02 Method for compressing and exchanging structured data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001235046A JP2003044459A (en) 2001-08-02 2001-08-02 Method for compressing and exchanging structured data

Publications (1)

Publication Number Publication Date
JP2003044459A true JP2003044459A (en) 2003-02-14

Family

ID=19066550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001235046A Pending JP2003044459A (en) 2001-08-02 2001-08-02 Method for compressing and exchanging structured data

Country Status (1)

Country Link
JP (1) JP2003044459A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005018672A (en) * 2003-06-30 2005-01-20 Hitachi Ltd Method for compressing structured document
EP1990737A1 (en) 2003-09-24 2008-11-12 NTT DoCoMo, Inc. Document transformation system
US7774387B2 (en) 2003-09-19 2010-08-10 Ntt Docomo, Inc. Data compressor, data decompressor, and data management system
US9871536B1 (en) 2016-07-27 2018-01-16 Fujitsu Limited Encoding apparatus, encoding method and search method

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005018672A (en) * 2003-06-30 2005-01-20 Hitachi Ltd Method for compressing structured document
US7774387B2 (en) 2003-09-19 2010-08-10 Ntt Docomo, Inc. Data compressor, data decompressor, and data management system
EP1990737A1 (en) 2003-09-24 2008-11-12 NTT DoCoMo, Inc. Document transformation system
US7530017B2 (en) 2003-09-24 2009-05-05 Ntt Docomo, Inc. Document transformation system
US9871536B1 (en) 2016-07-27 2018-01-16 Fujitsu Limited Encoding apparatus, encoding method and search method

Similar Documents

Publication Publication Date Title
JP3894280B2 (en) Encoding method Xml data decoding method xml data encoded, the encoding system xml data, encoded xml data decoding system, program, and recording medium
US7639818B2 (en) Structured document signature device, structured document adaptation device and structured document verification device
Girardot et al. Millau: an encoding format for efficient representation and exchange of XML over the Web
US7349959B2 (en) Method for creating and processing a soap message, and method, apparatus and program for processing information
DE60109467T2 (en) A method and apparatus for transmitting network information through secure transcoding
US5953503A (en) Compression protocol with multiple preset dictionaries
EP1504369B1 (en) System and method for processing of xml documents represented as an event stream
Buswell et al. The open math standard
JP3278297B2 (en) Data compression method and data recovery method and a data compression apparatus and a data recovery device
DE10319435B4 (en) A method for processing data to protect a software program before reconstruction
JP3229148B2 (en) Encryption method and system
KR100286195B1 (en) Decoding apparatus for signal encoded by variable length code
KR100424130B1 (en) Data compression apparatus, database system, data communication system, data compression method, storage medium and program transmission apparatus
JP4774145B2 (en) The structured document compressing apparatus and structured document restoring apparatus and structured document processing system
JP3650611B2 (en) Program for encrypting and decrypting
US20040054692A1 (en) Method for compressing/decompressing a structured document
US20040205340A1 (en) File editing system and shared file editing system with file content secrecy, file version management, and asynchronous editing
CA2276036C (en) Method and apparatus for secure storage of data
US7418098B1 (en) Data type preserving encryption
CN100580661C (en) Method and devices for encoding/decoding structured documents, especially XML documents
JP4893750B2 (en) Data compression apparatus and a data recovery device
JP4373721B2 (en) Method and system for encoding a markup language document
US8401186B2 (en) Cloud storage data access method, apparatus and system based on OTP
RU2285354C2 (en) Binary format for mpeg-7 samples
US20050120031A1 (en) Structured document encoder, method for encoding structured document and program therefor