JP2003044459A - Method for compressing and exchanging structured data - Google Patents

Method for compressing and exchanging structured data

Info

Publication number
JP2003044459A
JP2003044459A JP2001235046A JP2001235046A JP2003044459A JP 2003044459 A JP2003044459 A JP 2003044459A JP 2001235046 A JP2001235046 A JP 2001235046A JP 2001235046 A JP2001235046 A JP 2001235046A JP 2003044459 A JP2003044459 A JP 2003044459A
Authority
JP
Japan
Prior art keywords
data
information
content
structured data
structured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001235046A
Other languages
Japanese (ja)
Inventor
Mutsumi Komuro
睦 小室
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Software Engineering Co Ltd
Original Assignee
Hitachi Software Engineering Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Software Engineering Co Ltd filed Critical Hitachi Software Engineering Co Ltd
Priority to JP2001235046A priority Critical patent/JP2003044459A/en
Publication of JP2003044459A publication Critical patent/JP2003044459A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a method for compressing and exchanging data, by which a data amount can be reduced and data can be exchanged after simultaneously applying enciphering by using the structure information of structured data. SOLUTION: In a compressing (enciphering) module, the internal expression data of the structured data are separated to structure information and contents by using previously applied syntax designation information and further, they are compressed (enciphered) together. The compressed (enciphered) data are delivered from a transmitting side system through a network to a receiving side system. In an extending (deciphering) module, the received compressed (enciphered) data are restored into internal expression data of the structured data by using the syntax designation information.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、構造化データを用
いたデータ交換、アプリケーション統合、システム統
合、およびデータ保存など、構造化データを利用するシ
ステムにおける圧縮方法およびデータ交換方法に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a compression method and a data exchange method in a system using structured data such as data exchange using structured data, application integration, system integration, and data storage.

【0002】[0002]

【従来の技術】従来より、テキストデータの可逆圧縮処
理方法としては、ランレングス、ハフマン符号化、およ
びLZ(Zip-Lempel符号)などの各種方法が知られてい
る。これらは、テキストデータ一般に対する圧縮処理手
法である。構造化ドキュメントがテキストデータの形式
であるときには、その構造化ドキュメントに対して上記
のテキストデータ一般に対する圧縮処理手法を用いるこ
とができる。この場合には、その圧縮処理において、そ
のドキュメントが構造化されているという情報を有効に
用いてはいないことになる。
2. Description of the Related Art Conventionally, various methods such as run length, Huffman coding, and LZ (Zip-Lempel code) are known as lossless compression processing methods for text data. These are compression processing methods for general text data. When the structured document is in the form of text data, the above compression processing method for general text data can be used for the structured document. In this case, the compression process does not effectively use the information that the document is structured.

【0003】一方、XML等の構造化データによるデータ
交換が一般化しつつある。これは基本的にテキストフォ
ーマットのデータである。
On the other hand, data exchange using structured data such as XML is becoming popular. This is basically text-formatted data.

【0004】[0004]

【発明が解決しようとする課題】上述したように、XML
等の構造化データはテキストフォーマットであるので、
上述のテキストデータ一般に対する圧縮処理手法を用い
て圧縮し、データ交換を行うことが一般化しつつある
が、構造化データが基本的にテキストフォーマットのデ
ータであるため、以下のような問題点がある。
[Problems to be Solved by the Invention] As described above, XML
Since structured data such as is in text format,
It is becoming common to perform data exchange by compressing using the above-described compression processing method for general text data, but since structured data is basically text format data, there are the following problems. .

【0005】(1)構造化情報をタグとして付与するた
めデータ量が増大する。 (2)タグおよびコンテンツがテキストとして読めるた
め、盗聴等によりデータの内容が盗まれる危険がある。 (3)交換後のデータを利用する際、字句解析、構文解
析等のパージング処理を行う必要があり処理上のオーバ
ヘッドとなりうる。
(1) Since the structured information is added as a tag, the amount of data increases. (2) Since the tag and content can be read as text, there is a risk that the content of the data will be stolen by eavesdropping or the like. (3) When using the data after the exchange, it is necessary to perform parsing processing such as lexical analysis and syntax analysis, which may cause processing overhead.

【0006】本発明は、構造化データの構造情報を用い
ることで、データ量を削減し、同時に暗号化を施したう
えでデータ交換を可能とする構造化データに対する圧縮
方法およびデータ交換方法を提供することを目的とす
る。
The present invention provides a compression method and a data exchange method for structured data, which makes it possible to exchange data after reducing the amount of data and simultaneously performing encryption by using the structure information of the structured data. The purpose is to do.

【0007】[0007]

【課題を解決するための手段】上記目的を達成するた
め、請求項1に係る発明は、構造化データに対するデー
タ圧縮方法であって、処理対象の構造化データの構造を
定義する情報である複数の文法規則を含む構文指定情報
内で個々の文法規則を識別情報で特定できるようにして
おき、該文法規則を特定する識別情報を用いて前記構造
化データの構造を表す構文木を表現することにより、前
記構造化データの構造情報とコンテンツ情報とを分離す
ることを特徴とする。
In order to achieve the above object, the invention according to claim 1 is a data compression method for structured data, wherein a plurality of pieces of information defining the structure of the structured data to be processed are provided. Individual grammar rules can be specified by the identification information in the syntax specification information including the grammar rules, and the syntax tree representing the structure of the structured data is expressed by using the identification information specifying the grammar rules. According to, the structure information of the structured data and the content information are separated.

【0008】請求項2に係る発明は、請求項1に記載の
構造化データに対するデータ圧縮方法において、前記構
造化データから分離して得たコンテンツ情報をさらにデ
ータ型に応じて分類することを特徴とする。
The invention according to claim 2 is the data compression method for structured data according to claim 1, characterized in that the content information obtained by separating from the structured data is further classified according to the data type. And

【0009】請求項3に係る発明は、請求項1に記載の
構造化データに対するデータ圧縮方法において、前記コ
ンテンツ情報に含まれるコンテンツデータのデータ出現
位置を変数で表すことを特徴とする。
The invention according to claim 3 is the data compression method for structured data according to claim 1, wherein the data appearance position of the content data included in the content information is represented by a variable.

【0010】請求項4に係る発明は、構造化データのデ
ータ交換方法であって、請求項1から3の何れか1つに
記載のデータ圧縮方法を用いて、データ交換の対象デー
タである構造化データを構造情報とコンテンツ情報に分
離し、分離した構造情報とコンテンツ情報をそれぞれ所
定の圧縮方式で圧縮または所定の暗号化方式で暗号化
し、該圧縮または暗号化した構造情報とコンテンツ情報
を送信することを特徴とする。
A fourth aspect of the present invention is a method for exchanging structured data, wherein the data compression method according to any one of the first to third aspects is used, and the data is data to be exchanged. The encrypted data is separated into structure information and content information, the separated structure information and content information are respectively compressed by a predetermined compression method or encrypted by a predetermined encryption method, and the compressed or encrypted structure information and content information are transmitted. It is characterized by doing.

【0011】請求項5に係る発明は、構造化データに対
するデータ圧縮方法であって、処理対象の構造化データ
の構造を定義する情報である複数の文法規則を含む構文
指定情報を、それらの文法規則を識別情報で特定できる
ように、記憶手段に保持しておくステップと、前記処理
対象の構造化データの構造を表す文法規則を求め、求め
たすべての文法規則の識別情報を並べて構造情報を生成
するとともに、それらの文法規則のうちコンテンツデー
タが付随するものについてはそのコンテンツデータをコ
ンテンツ情報に格納し、構造情報に並べた識別情報には
当該コンテンツデータが付随することを示す指標を付す
るステップとを備えたことを特徴とする。
According to a fifth aspect of the present invention, there is provided a data compression method for structured data, wherein syntax specification information including a plurality of grammatical rules, which are information defining a structure of structured data to be processed, is provided with grammars thereof. The step of holding the rule in the storage means so that the rule can be identified by the identification information, the grammatical rule representing the structure of the structured data to be processed is obtained, and the identification information of all the obtained grammatical rules is arranged to obtain the structural information. For those grammatical rules that are accompanied by content data while being generated, the content data is stored in the content information, and the identification information arranged in the structure information is provided with an index indicating that the content data is associated. And a step.

【0012】請求項6に係る発明は、構造化データに対
するデータ圧縮または暗号化方法であって、処理対象の
構造化データの構造を定義する情報である複数の文法規
則を含む構文指定情報を、それらの文法規則を識別情報
で特定できるように、記憶手段に保持しておくステップ
と、前記処理対象の構造化データの構造を表す文法規則
を求め、求めたすべての文法規則の識別情報を並べて構
造情報を生成するとともに、それらの文法規則のうちコ
ンテンツデータが付随するものについてはそのコンテン
ツデータをコンテンツ情報に格納し、構造情報に並べた
識別情報には当該コンテンツデータが付随することを示
す指標を付するステップと、前記構造情報およびコンテ
ンツ情報を圧縮または暗号化するステップとを備えたこ
とを特徴とする。
According to a sixth aspect of the present invention, there is provided a data compression or encryption method for structured data, wherein syntax designation information including a plurality of grammatical rules, which is information defining a structure of structured data to be processed, is provided. A step of holding the grammatical rules in a storage means so that they can be specified by the identification information, a grammatical rule representing the structure of the structured data to be processed is obtained, and the identification information of all the obtained grammatical rules are arranged. An index indicating that the structure information is generated and the content data is stored in the content information for those grammatical rules associated with the content data, and the identification information arranged in the structure information is associated with the content data. And a step of compressing or encrypting the structure information and the content information.

【0013】請求項7に係る発明は、請求項6に記載の
データ圧縮または暗号化方法で圧縮または暗号化された
構造情報およびコンテンツ情報を伸長または復号化する
データ伸長または復号化方法であって、圧縮または暗号
化された構造情報およびコンテンツ情報を伸長または復
号化するステップと、伸長または復号化した構造情報か
ら文法規則の識別情報を取り出し、前記構文指定情報を
参照して、取り出した識別情報に対応する文法規則を取
得するステップと、取得した文法規則が表すデータ構造
の構造化データを復元するとともに、その文法規則にコ
ンテンツデータが付随するものについては前記コンテン
ツ情報から対応するコンテンツデータを取り出して構造
化データの対応する位置に設定することにより、構造化
データを復元するステップとを備えたことを特徴とす
る。
The invention according to claim 7 is a data decompression or decryption method for decompressing or decrypting structure information and content information compressed or encrypted by the data compression or encryption method according to claim 6. Decompressing or decrypting the compressed or encrypted structure information and content information, and extracting the identification information of the grammar rule from the expanded or decrypted structure information, and referring to the syntax designation information, the extracted identification information And a step of acquiring the grammatical rule corresponding to the grammar rule, the structured data having the data structure represented by the acquired grammatical rule is restored, and the content data associated with the grammatical rule is extracted from the corresponding content data. Restore the structured data by setting it to the corresponding position in the structured data. Characterized in that a step.

【0014】[0014]

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を詳細に説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

【0015】図1および図2は、本発明の一実施形態に
係る基本的なシステム構成と処理手順を示した図であ
る。
1 and 2 are diagrams showing a basic system configuration and a processing procedure according to an embodiment of the present invention.

【0016】図1は、構造化データを圧縮または暗号化
する場合のシステム構成と処理手順を示す。圧縮・暗号
化する場合、まず字句・構文解析モジュール(103)
は、入力された構造化データ(101)を事前に与えら
れた構文指定情報(102)に基づいて解析し、該構造
化データ(101)に出現する部分構文木列(104)
とそこで現れるコンテンツ(105)とを取り出す。こ
れらのデータは、それぞれ、構文圧縮(暗号化)モジュ
ール(106)とコンテンツ圧縮(暗号化)モジュール
(107)に引き渡す。構文圧縮(暗号化)モジュール
(106)は、部分構文木列(104)の圧縮または暗
号化を行う。コンテンツ圧縮(暗号化)モジュール(1
07)は、コンテンツ(105)の圧縮または暗号化を
行う。これらのモジュールによる圧縮(暗号化)の結果
をあわせて圧縮(暗号化)データ(108)として出力
する。
FIG. 1 shows a system configuration and a processing procedure for compressing or encrypting structured data. When compressing / encrypting, first the lexical / syntactic analysis module (103)
Analyzes the input structured data (101) on the basis of the syntax designation information (102) given in advance, and outputs a partial syntax tree string (104) appearing in the structured data (101).
And the content (105) that appears there are retrieved. These data are passed to the syntax compression (encryption) module (106) and the content compression (encryption) module (107), respectively. The syntax compression (encryption) module (106) compresses or encrypts the partial syntax tree sequence (104). Content compression (encryption) module (1
07) compresses or encrypts the content (105). The results of compression (encryption) by these modules are combined and output as compressed (encrypted) data (108).

【0017】図2は、圧縮(暗号化)データを伸長また
は復号化する場合のシステム構成と処理手順を示す。伸
長・復号化する場合、図1に示した処理とは逆に、圧縮
(暗号化)データ(201)を入力として受け取り、部
分構文木伸長(復号化)モジュール(202)およびコ
ンテンツ伸長(復号化)モジュール(203)に、圧縮
(暗号化)データ201の相当部分を、それぞれ引き渡
す。部分構文木伸長(復号化)モジュール(202)
は、構文指定情報に基づいて、圧縮(暗号化)されてい
る部分構文木列を伸長(復号化)し、部分構文木列(2
04)を出力する。コンテンツ伸長(復号化)モジュー
ル(203)は、圧縮(暗号化)されているコンテンツ
を伸長(復号化)し、コンテンツ(205)を出力す
る。最後に合成モジュール(206)は、部分構文木列
(204)上にコンテンツ(205)をはめこんで、も
との構造化データ(207)を得る。
FIG. 2 shows a system configuration and a processing procedure when decompressing or decrypting compressed (encrypted) data. In the case of decompression / decryption, contrary to the processing shown in FIG. 1, compressed (encrypted) data (201) is received as an input, and a partial syntax tree decompression (decryption) module (202) and content decompression (decryption) are performed. ) Deliver corresponding portions of the compressed (encrypted) data 201 to the module (203). Partial syntax tree decompression (decoding) module (202)
Decompresses (decrypts) the compressed (encrypted) partial syntax tree string based on the syntax designation information, and
04) is output. The content decompression (decryption) module (203) decompresses (decrypts) the compressed (encrypted) content and outputs the content (205). Finally, the composition module (206) embeds the content (205) on the partial syntax tree string (204) to obtain the original structured data (207).

【0018】図3は、図1および図2に示すシステムを
利用して、構造化データを用いたデータ交換を行う場合
のシステム構成と処理手順を示した図である。まず、送
信したい構造化データに対する構文指定情報(301)
および(302)を、予めデータ送信側システム(30
3)、圧縮(暗号化)モジュール(304)、伸長(復
号化)モジュール(305)、およびデータ受信側シス
テム(306)の間で共有しておく。
FIG. 3 is a diagram showing a system configuration and a processing procedure when data exchange using structured data is performed using the system shown in FIGS. 1 and 2. First, the syntax designation information (301) for the structured data to be transmitted
And (302) in advance by the data transmission side system (30
3), the compression (encryption) module (304), the decompression (decryption) module (305), and the data receiving side system (306).

【0019】この図に示すシステムでは、同一の構文指
定情報のコピーを(301)と(302)の2つ用意す
る。データ送信側システム(303)と圧縮(暗号化)
モジュール(304)が構文指定情報(301)を使用
し、伸長(復号化)モジュール(305)とデータ受信
側システム(306)内の字句・構文解析モジュール
(313)が構文指定情報(302)を使用する場合を
図示している。
In the system shown in this figure, two copies of the same syntax designation information (301) and (302) are prepared. Data transmission system (303) and compression (encryption)
The module (304) uses the syntax designation information (301), and the decompression (decoding) module (305) and the lexical / syntax analysis module (313) in the data receiving system (306) use the syntax designation information (302). The case where it uses is illustrated.

【0020】データ送信側システム(303)は、与え
られた入力データを構文指定情報(301)に基づき構
文解析し、構文木などによる内部データ(307)の形
式でこれを保持する。構造化データ作成モジュール(3
08)は、この内部データ(307)からテキスト形式
の構造化データ(309)を出力する。これを受け取っ
た圧縮(暗号化)モジュール(304)は、図1で説明
したようにその構造化データ(309)を構造情報とコ
ンテンツに分離してそれぞれを圧縮(暗号化)した圧縮
(暗号化)データ(310)とし、ネットワーク(31
1)経由で受信側に送信する。
The data transmission side system (303) parses the given input data based on the syntax designation information (301) and holds it in the form of internal data (307) by a syntax tree or the like. Structured data creation module (3
08) outputs structured data (309) in the text format from this internal data (307). The compression (encryption) module (304) that receives this separates the structured data (309) into structural information and content and compresses (encrypts) each as described in FIG. ) Data (310) and network (31
1) Send to the receiving side via.

【0021】受信側では、受け取った圧縮(暗号化)デ
ータ(310)を伸長(復号化)モジュール(305)
で図2で説明したように伸長(復号化)し、元の構造化
データ(312)に戻したのち、データ受信側システム
(306)に引渡す。データ受信側システム(306)
内の字句・構文解析モジュール(313)は、その構造
化データ(312)を内部データ(314)に変換した
後、データ処理をすすめる。
On the receiving side, the received compressed (encrypted) data (310) is expanded (decrypted) module (305).
Then, the data is decompressed (decoded) as described in FIG. 2, restored to the original structured data (312), and then passed to the data receiving system (306). Data receiving system (306)
The lexical / syntactic analysis module (313) therein converts the structured data (312) into internal data (314) and then proceeds with data processing.

【0022】このシステム構成では、データ交換する際
に構造化データ(309)を圧縮しているため、ネット
ワーク(311)を通過する通信データ量は削減され
る。
In this system configuration, since the structured data (309) is compressed when exchanging data, the amount of communication data passing through the network (311) is reduced.

【0023】図4は、図3のデータ交換システムを改良
して、パージング処理を組みこむことでデータの圧縮
(暗号化)・伸長(復号化)処理のオーバヘッドをなく
したシステム構成例である。図3における構造化データ
作成モジュール(308)の代わりに、圧縮(暗号化)
モジュール(304)をデータ送信側システム(30
3)に直接組みこんだのが、図4のデータ送信側システ
ム(401)である。同様に、図3における字句・構文
解析モジュール(313)の代わりに、伸長(復号化)
モジュール(305)をデータ受信側システム(30
6)に直接組みこんだのが、図4のデータ受信側システ
ム(402)である。
FIG. 4 is an example of a system configuration in which the data exchange system of FIG. 3 is improved and a purging process is incorporated to eliminate the overhead of data compression (encryption) / decompression (decryption). Instead of the structured data creation module (308) in FIG. 3, compression (encryption)
The module (304) is connected to the data transmission system (30
The data transmission side system (401) of FIG. 4 is directly incorporated into 3). Similarly, decompression (decoding) instead of the lexical / syntactic analysis module (313) in FIG.
The module (305) is connected to the data receiving system (30
The data receiving side system (402) of FIG. 4 is directly incorporated in 6).

【0024】このようなシステム構成をとることで、デ
ータの内部表現を構造化データに変換することなく圧縮
(暗号化)データとしているので、図3のデータ交換シ
ステムで生じていたオーバヘッドは解消される。さら
に、単にオーバヘッドを解消するのみでなく、圧縮(暗
号化)モジュール(304)および伸長(復号化)モジ
ュール(305)を全く用いずに直接、構造化データを
送信した場合と比較して、むしろ性能向上することが可
能となる。実際、図4で送信される圧縮(暗号化)デー
タ(403)は構文情報を既に含んでいるため、データ
受信側システム402で字句・構文解析を実行せずに構
文木などによる内部データ(404)を得ることができ
る。
By adopting such a system configuration, the internal representation of the data is compressed (encrypted) data without being converted into structured data, so that the overhead generated in the data exchange system of FIG. 3 is eliminated. It Furthermore, rather than simply eliminating the overhead, rather than sending the structured data directly without any compression (encryption) module (304) and decompression (decryption) module (305), It is possible to improve the performance. In fact, since the compressed (encrypted) data (403) transmitted in FIG. 4 already includes syntax information, the internal data (404) that is a syntax tree or the like without performing the lexical / syntactic analysis in the data receiving system 402. ) Can be obtained.

【0025】図5および図6に、圧縮・暗号化の具体例
を示す。
5 and 6 show specific examples of compression / encryption.

【0026】図5において、(5.1)は住所録を作成
するための複数の構文定義情報から成る構文指定情報
(図1〜図4の102,301,302など)で、XML
文書用のDTDと呼ばれる定義形式で記述してある。
(5.2)は、このDTDを用いたXMLによる構造化データ
(図1〜図4の101,207,309,312)であ
り、住所録データベースからの検索結果を想定してい
る。後の参照のために、構文指定情報(5.1)には、
1から15までの番号を振ってある。この番号は、構文
指定情報(5.1)中の1行分の情報を特定するもので
あり、構文指定情報(5.1)の中にこの番号データが
含まれている訳ではない。構造化データ(5.2)をみ
るとわかるように、構造化データ(5.2)ではデータ
の半分以上が構文を定めるタグ定義であり、しかも似た
ような構文が繰返し現れている。
In FIG. 5, (5.1) is syntax designation information (102, 301, 302, etc. in FIGS. 1 to 4) consisting of a plurality of syntax definition information for creating an address book, which is XML.
It is described in the definition format called DTD for documents.
(5.2) is XML structured data (101, 207, 309, 312 in FIGS. 1 to 4) using this DTD, and is assumed to be a search result from the address book database. For later reference, the syntax specification information (5.1) includes
They are numbered 1 to 15. This number identifies one line of information in the syntax designation information (5.1), and this number data is not included in the syntax designation information (5.1). As can be seen from the structured data (5.2), in the structured data (5.2), more than half of the data is the tag definition that defines the syntax, and similar syntax appears repeatedly.

【0027】図6は、構造化データ(5.2)を構文
(図1,2の104,204)とコンテンツ(図1,2
の105,205)に分離した結果を示す。(6.1)
が構文情報を分離したもので、構造化データ(5.2)
を構文指定情報(5.1)で番号付けした15個の文法
規則のどれを用いて構文解析したかという情報と、コン
テンツとして通常の文字列データであるPCDATAまたは特
殊文字も含む文字列データであるCDATAのいずれかを含
んでいるかという情報をあわせて出力させている。すな
わち、構文(6.1)では、PCDATAを含むときは変数
p、CDATAを含む場合には変数cをつけて表わしてい
る。
FIG. 6 shows the structured data (5.2) as the syntax (104, 204 in FIGS. 1, 2) and the content (FIGS. 1, 2).
105, 205) of the above. (6.1)
Is the separated syntactic information, structured data (5.2)
Information on which of the 15 grammar rules numbered in the syntax specification information (5.1) was used for parsing, and PCDATA which is normal character string data as contents, or character string data including special characters. It also outputs the information indicating whether any CDATA is included. That is, in the syntax (6.1), a variable p is included when PCDATA is included, and a variable c is included when CDATA is included.

【0028】例えば、構文(6.1)の先頭からの
「1,2,3」は、それぞれ構文指定情報(5.1)の
第1〜3行の定義規則に基づく構造情報(具体的には
(5.2)の第1行目の<address-book>から第3行目の
<name>まで)が最初に来ることを示している。次の「4
p」は構文指定情報(5.2)の4行目の定義規則に基
づく構造情報がPCDATAを含んで次に来ることを示してい
る。これは、(5.2)の<firstname>John</firstname
>の部分に相当する。
For example, "1, 2, 3" from the beginning of the syntax (6.1) is structural information (specifically, based on the definition rules of the first to third lines of the syntax designation information (5.1). Is from <address-book> on the first line of (5.2) to the third line of
(up to <name>) comes first. Next `` 4
“P” indicates that the structure information based on the definition rule on the fourth line of the syntax designation information (5.2) comes next including PCDATA. This is the (5.2) <firstname> John </ firstname
Corresponds to the> part.

【0029】構造化データ(5.2)と(6.1)を比
較すればわかるように、構文情報に関しては、この変換
のみでもタグを番号で置換えているため既に圧縮の効果
があることがわかる。(6.2)と(6.3)は、PCDA
TAとCDATAを出現順に適当な区切り記号をつけて連結し
たものである。XMLの仕様ではPCDATAでは'>'、CDATAで
は']]>'を文字列として含まないことに定められている
ので、ここではこれらを区切り文字として採用してい
る。
As can be seen by comparing the structured data (5.2) and (6.1), with regard to the syntax information, the tag is replaced by the number only with this conversion, so that the compression effect may already be obtained. Recognize. (6.2) and (6.3) are PCDA
TA and CDATA are concatenated in the order of appearance with appropriate delimiters. The XML specification specifies that PCDATA does not include '>' and CDATA does not include ']]>' as character strings, so these are used as delimiters here.

【0030】構造化データ(5.2)のデータ圧縮を行
うには、図6に示すように分離された構文(6.1)、
PCDATA(6.2)、およびCDATA(6.3)のそれぞれ
を圧縮すればよい。この例の場合、構造化データ(5.
2)の構文はほとんど同じ形式のデータが繰り返される
と予想される。(6.1)では、データの中身は変数化
して構文のみをとりだしているので、この部分は全く同
じかほとんど同じ文字列の繰返しになることが予想され
る。したがって、例えばランレングスのような初等的な
圧縮方法でも十分な圧縮効果をあげられる。PCDATA
(6.2)およびCDATA(6.3)のテキストデータに
関しては、上述のような著しいデータの偏りこそないも
のの、構造化データ(5.2)の同じタグの部分を取り
出してきているので、住所なら住所、人名なら人名とい
った同じ分類の言葉が集まることが期待できる。このた
め、局所的に同じ文字列の出現率が高いときに効果のあ
る圧縮方法、例えばLZ77(Zip-Lampel)符号を用いるこ
とで高い圧縮効果を得ることができる。
In order to perform the data compression of the structured data (5.2), the separated syntax (6.1) as shown in FIG.
PCDATA (6.2) and CDATA (6.3) may be compressed. In the case of this example, the structured data (5.
The syntax of 2) is expected to repeat data of almost the same format. In (6.1), since the contents of the data are variable and only the syntax is taken out, it is expected that this part will be the same or almost the same repetition of character strings. Therefore, a sufficient compression effect can be obtained even with an elementary compression method such as run length. PCDATA
As for the text data of (6.2) and CDATA (6.3), the same tag portion of the structured data (5.2) is taken out, though there is no significant data bias as described above. It can be expected that words of the same category such as an address if it is an address and a person's name if it is a person's name will be gathered. Therefore, a high compression effect can be obtained by using a compression method effective when the appearance rate of the same character string is locally high, for example, LZ77 (Zip-Lampel) code.

【0031】なお、この例では定義形式としてDTDを用
いたが、データ形式をさらに細かく定義できる新しい定
義形式としてXML SchemaやRelaxといったものも提案さ
れている。このような場合、さらにデータの局所的な偏
りを高めることができるので、圧縮効果はさらに高くな
ると期待される。また、型ごとにデータを集めることが
できるので、データ型に応じた符号化を採用すること
で、圧縮効率をさらに高めることが可能になる。実際、
XML Schemaの2000年4月7日付けのWorkingDraft(h
ttp://www.w3.org/TR/2000/WD-xmlschema-0-20000407/)
では文字列、論理値、浮動点小数、倍精度実数、十進
数、日付、および期間など40種類以上の単純型が組込
み型として予め定義されており、これらの型によるデー
タ分類を用いればデータの局所性を著しく高めることが
可能である。
Although the DTD is used as the definition format in this example, XML Schema and Relax are also proposed as new definition formats that can define the data format more finely. In such a case, the local bias of the data can be further increased, so that the compression effect is expected to be further enhanced. Further, since data can be collected for each type, it is possible to further improve the compression efficiency by adopting the encoding according to the data type. In fact
Working Draft (h of XML Schema of April 7, 2000)
(ttp: //www.w3.org/TR/2000/WD-xmlschema-0-20000407/)
For more than 40 simple types such as character strings, logical values, floating point decimals, double precision real numbers, decimal numbers, dates, and periods, are predefined as built-in types. It is possible to significantly increase locality.

【0032】このように圧縮された構造化データを伸長
するには、まず採用した圧縮方法に対する伸長を行い、
図6に示したような構文(6.1)、PCDATA(6.
2)、およびCDATA(6.3)の分類を得た後、構文
(6.1)の変数部分にPCDATA(6.2)およびCDATA
(6.3)のデータを区切り文字を分割しながら順に代
入していけばよい。この代入においては、まず、構文指
定情報(5.1)の各文法規則に対して対応する有限状
態機械を構成しておく。これは各文法規則が正規表現で
書かれていることから標準的なアルゴリズムで構成でき
る。さらに、DTDの各文法規則からこのように得られた
有限状態機械は決定性を持たなければならないことがXM
Lの仕様で定められている。
In order to decompress the structured data compressed in this way, decompression is performed for the adopted compression method,
The syntax as shown in FIG. 6 (6.1), PCDATA (6.
2) and CDATA (6.3) classification, then PCDATA (6.2) and CDATA in the variable part of the syntax (6.1)
The data of (6.3) may be substituted in order while dividing the delimiter. In this substitution, first, a finite state machine corresponding to each grammatical rule of the syntax designation information (5.1) is constructed. This can be constructed with standard algorithms because each grammar rule is written in regular expressions. Furthermore, the finite state machine thus obtained from each grammatical rule of the DTD must be deterministic.
It is defined by the L specification.

【0033】以下、図6のデータ分類を得るための手順
を説明する。XML等の構造化データは構文的なあいまい
さはないように設計されているので、YACCなどに代表さ
れるLALR(1)パーザ生成プログラムにより構文解析プロ
グラムを作成できる。すなわち、構文解析ルールをBN
F形式に記述し、各ルールに対し、そのルール適用時の
アクションを指定することで構文解析を行うプログラム
を生成できる。したがって、次のような手順で構文解析
ルールをDTDから構成すれば、図6のデータ分類を得る
ための解析プログラム(図1の103)を生成すること
ができる。
The procedure for obtaining the data classification shown in FIG. 6 will be described below. Structured data such as XML is designed so that there is no syntactic ambiguity, so a parser can be created with the LALR (1) parser generator, such as YACC. That is, the parsing rule is BN
It is possible to generate a program for performing syntax analysis by describing in F format and specifying an action when the rule is applied to each rule. Therefore, if the syntax analysis rule is constructed from the DTD in the following procedure, the analysis program (103 in FIG. 1) for obtaining the data classification in FIG. 6 can be generated.

【0034】ステップ1:DTD内の<!ELEMENT tag_name
body>の形の各要素定義に対して、lex_id(tag_name)
→ trans(body )の形の構文解析ルールを作成する。た
だし、lex_id は字句解析プログラムが返すtag_nameに
対するID、trans(body)はステップ2以下で得られるbod
yの変換結果とする。また、対応するアクションは次の
ような文字列を返す操作とする:<!ELEMENT tag_name b
ody>につけられた番号の次にtrans(body)のアクション
として得られる文字列を連結することによって得られる
文字列。
Step 1: <! ELEMENT tag_name in DTD
For each element definition in the form of body>, lex_id (tag_name)
→ Create a parsing rule of the form trans (body). However, lex_id is the ID for the tag_name returned by the lexical analyzer, and trans (body) is the bod obtained in step 2 and below.
Let y be the conversion result. Also, the corresponding action is an operation that returns the following string: <! ELEMENT tag_name b
A string obtained by concatenating the string obtained as the action of trans (body) after the number given to ody>.

【0035】ステップ2:変換transを以下のように再
帰的に定める。
Step 2: The transformation trans is recursively determined as follows.

【0036】(1)trans(nil) = nilとする。このアク
ションは空文字列""を返す操作である。
(1) trans (nil) = nil. This action is an operation that returns an empty string "".

【0037】(2)(x . y) で先頭要素xの次にリストy
が連結されているリストを表すこととし、trans(x . y)
= (trans_each(x) . trans(y))とする。アクション
は、trans_each(x), trans(y)のアクションの結果とし
て得られる文字列を連結して得られる文字列を返す操作
とする。ただし、trans_eachは、以下のように定義され
る。
(2) In (x .y), after the head element x, list y
Let be a concatenated list of trans (x .y)
= (trans_each (x) .trans (y)). The action is an operation that returns the character string obtained by concatenating the character strings obtained as a result of the trans_each (x) and trans (y) actions. However, trans_each is defined as follows.

【0038】(2−1)trans_each(#PCDATA) = lex_id
(#PCDATA) 、アクションは文字列 "p"を返す操作とす
る。 (2−2)trans_each(#CDATA) =lex_id(#CDATA) 、ア
クションは文字列 "c"を返す操作とする。 (2−3)trans_each(tag_name) = lex_id(tag_nam
e)、アクションは空文字列""を返す操作とする。
(2-1) trans_each (#PCDATA) = lex_id
(#PCDATA), the action is an operation that returns the character string "p". (2-2) trans_each (#CDATA) = lex_id (#CDATA), the action is an operation that returns the character string "c". (2-3) trans_each (tag_name) = lex_id (tag_nam
e), the action is an operation that returns an empty string "".

【0039】(2−4)trans_each(tag_name*) =make_
new_symbol(lex_id(tag_name),_ list)、アクションは
恒等写像とする。ただし、make_new_symbolは、引数と
して与えられた2つの記号を連結して新しい記号をつく
る関数とする。さらに、この場合、tn = lex_id(tag_na
me)、tn_list= make_new_symbol(ln,_list) に対する次
の新しいルールを追加する。 (2−4−1)tn_list → nil 、アクションは空文字
列""を返す操作とする。 (2−4−2)tn_list → tn_list tn 、アクション
は右辺のアクションの結果として返される2つの文字列
を連結した文字列を返す操作とする。
(2-4) trans_each (tag_name *) = make_
new_symbol (lex_id (tag_name), _ list), action is the identity map. However, make_new_symbol is a function that connects two symbols given as arguments to create a new symbol. Furthermore, in this case, tn = lex_id (tag_na
me), tn_list = make_new_symbol (ln, _list) add the following new rule. (2-4-1) tn_list → nil, and the action is an operation that returns an empty character string "". (2-4-2) tn_list → tn_list tn, the action is an operation of returning a character string that is a concatenation of two character strings returned as a result of the action on the right side.

【0040】(2−5)trans_each(tag_name+) =make_
new_symbol(lex_id(tag_name),_ list1)、アクションは
恒等写像とする。この場合、tn = lex_id(tag_name)、t
n_list1= make_new_symbol(ln,_list1) に対する次の新
しいルールを追加する。 (2−5−1)tn_list1 → tn 、アクションは恒等写
像とする。 (2−5−2)tn_list1 → tn_list tn 、アクション
は右辺のアクションの結果として返される2つの文字列
を連結した文字列を返す操作とする。
(2-5) trans_each (tag_name +) = make_
new_symbol (lex_id (tag_name), _ list1), the action is the identity map. In this case, tn = lex_id (tag_name), t
n_list1 = Add the following new rule for make_new_symbol (ln, _list1). (2-5-1) tn_list1 → tn, and the action is the identity map. (2-5-2) tn_list1 → tn_list tn, the action is an operation that returns a character string that is a concatenation of two character strings returned as a result of the action on the right side.

【0041】(2−6)trans_each(tag_name?) =make_
new_symbol(lex_id(tag_name),_ opt)、アクションは恒
等写像とする。この場合、tn = lex_id(tag_name)、tn_
opt= make_new_symbol(ln,_opt) に対する次の新しいル
ールを追加する。 (2−6−1)tn_opt → nil 、アクションは空文字
列""を返す操作とする。 (2−6−2)tn_opt → tn 、アクションは恒等写像
とする。
(2-6) trans_each (tag_name?) = Make_
new_symbol (lex_id (tag_name), _ opt), action is the identity map. In this case, tn = lex_id (tag_name), tn_
Add the following new rule for opt = make_new_symbol (ln, _opt). (2-6-1) tn_opt → nil, and the action is an operation that returns an empty character string "". (2-6-2) tn_opt → tn, and the action is the identity map.

【0042】以上、主として圧縮・伸長する場合を例と
して説明したが、暗号化・復号化する場合も同様であ
る。すなわち、図6のように分類した後、構文(6.
1)、PCDATA(6.2)、およびCDATA(6.3)をそ
れぞれ暗号化して送信し、受信側では復号化すればよ
い。構文指定情報(5.1)がデータ交換する当事者以
外には秘密になっていれば、構文(6.1)の形にした
だけでも構造化情報については既に暗号化が行われてい
ると見ることができる。
Although the case of mainly compressing / decompressing has been described above, the same applies to the case of encryption / decryption. That is, after classifying as shown in FIG. 6, the syntax (6.
1), PCDATA (6.2), and CDATA (6.3) may be encrypted and transmitted, and the receiving side may decrypt them. If the syntax designation information (5.1) is secret to parties other than the data exchanger, it is considered that the structured information has already been encrypted even if it is in the form of the syntax (6.1). be able to.

【0043】[0043]

【発明の効果】以上説明したように、この発明によれ
ば、構造化データを構文指定情報に従って、構文とコン
テンツに分離してそれぞれを圧縮・暗号化するので、構
造化データをそのまま圧縮するよりも、通信データ量を
効果的に削減することが可能になる。また、データ交換
の際には、本発明に係る圧縮・暗号方式を採用すること
で、通信データ量の削減および安全性向上の効果の上
に、さらに構造化データのパージングにともなうオーバ
ヘッドなしのデータ交換が実現できる。
As described above, according to the present invention, the structured data is separated into the syntax and the content according to the syntax designation information and compressed and encrypted. Therefore, the structured data is not compressed as it is. Also, it becomes possible to effectively reduce the amount of communication data. Further, at the time of data exchange, by adopting the compression / encryption method according to the present invention, in addition to the effect of reducing the amount of communication data and improving the safety, data without overhead due to the purging of structured data is further provided. Exchange can be realized.

【図面の簡単な説明】[Brief description of drawings]

【図1】構造化データを圧縮または暗号化する場合のシ
ステム構成と処理手順を示した図
FIG. 1 is a diagram showing a system configuration and a processing procedure when compressing or encrypting structured data.

【図2】圧縮(暗号)データを伸長または復号化する場
合のシステム構成と処理手順を示した図
FIG. 2 is a diagram showing a system configuration and a processing procedure when decompressing or decrypting compressed (encrypted) data.

【図3】構造化データを用いたデータ交換を行う場合の
システム構成と処理手順を示した図
FIG. 3 is a diagram showing a system configuration and a processing procedure when exchanging data using structured data.

【図4】パージング処理を組みこむことでオーバヘッド
をなくしたシステム構成の例を示した図
FIG. 4 is a diagram showing an example of a system configuration in which overhead is eliminated by incorporating a purging process.

【図5】圧縮・暗号方法の概要を例示するための適用例
を示した図
FIG. 5 is a diagram showing an application example for illustrating an outline of a compression / encryption method.

【図6】構造化データを構文とコンテンツに分離した結
果を示した図
FIG. 6 is a diagram showing a result of separating structured data into syntax and content.

【符号の説明】[Explanation of symbols]

101…構造化データ、102…構文指定情報、103
…字句・構文解析、104…部分構文木列、105…コ
ンテンツ、106…構文圧縮(暗号)モジュール、10
7…コンテンツ圧縮(暗号)モジュール、108…圧縮
(暗号)データ、201…圧縮(暗号)データ、202
…部分構文木伸長(復号)モジュール、203…コンテ
ンツ伸長モジュール、204…部分構文木列、205…
コンテンツ、206…合成モジュール、207…構造化
データ、301、302…構文指定情報、303…デー
タ送信側システム、304…圧縮(暗号化)モジュー
ル、305…伸長(復号化)モジュール、306…デー
タ受信側システム、313…字句・構文解析モジュー
ル、307…内部データ、308…構造化データ作成モ
ジュール、309…構造化データ、310…圧縮(暗号
化)データ、311…ネットワーク、312…構造化デ
ータ、313…字句・構文解析モジュール、314…内
部データ、401…データ送信側システム、402…デ
ータ受信側システム、403…圧縮(暗号化)データ、
404…内部データ、5.1…構文指定情報、5.2…
構造化データ。
101 ... Structured data, 102 ... Syntax designation information, 103
... Lexical / syntactic analysis, 104 ... Partial syntax tree string, 105 ... Content, 106 ... Syntax compression (encryption) module, 10
7 ... Content compression (encryption) module, 108 ... Compressed (encrypted) data, 201 ... Compressed (encrypted) data, 202
... Partial syntax tree expansion (decoding) module, 203 ... Content expansion module, 204 ... Partial syntax tree string, 205 ...
Contents, 206 ... Compositing module, 207 ... Structured data, 301, 302 ... Syntax designation information, 303 ... Data transmission side system, 304 ... Compression (encryption) module, 305 ... Decompression (decryption) module, 306 ... Data reception Side system, 313 ... Lexical / syntactic analysis module, 307 ... Internal data, 308 ... Structured data creation module, 309 ... Structured data, 310 ... Compressed (encrypted) data, 311 ... Network, 312 ... Structured data, 313 ... Lexical / syntactic analysis module, 314 ... Internal data, 401 ... Data transmission side system, 402 ... Data reception side system, 403 ... Compressed (encrypted) data,
404 ... Internal data, 5.1 ... Syntax designation information, 5.2 ...
Structured data.

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】構造化データに対するデータ圧縮方法であ
って、 処理対象の構造化データの構造を定義する情報である複
数の文法規則を含む構文指定情報内で個々の文法規則を
識別情報で特定できるようにしておき、該文法規則を特
定する識別情報を用いて前記構造化データの構造を表す
構文木を表現することにより、前記構造化データの構造
情報とコンテンツ情報とを分離することを特徴とする構
造化データに対するデータ圧縮方法。
1. A data compression method for structured data, wherein individual grammar rules are specified by identification information in syntax specification information including a plurality of grammar rules that are information defining a structure of structured data to be processed. The structure information of the structured data and the content information are separated by expressing the syntax tree representing the structure of the structured data by using the identification information for specifying the grammar rule. Data compression method for structured data.
【請求項2】請求項1に記載の構造化データに対するデ
ータ圧縮方法において、 前記構造化データから分離して得たコンテンツ情報をさ
らにデータ型に応じて分類することを特徴とする構造化
データに対するデータ圧縮方法。
2. The data compression method for structured data according to claim 1, wherein the content information obtained by separating from the structured data is further classified according to a data type. Data compression method.
【請求項3】請求項1に記載の構造化データに対するデ
ータ圧縮方法において、 前記コンテンツ情報に含まれるコンテンツデータのデー
タ出現位置を変数で表すことを特徴とする構造化データ
に対するデータ圧縮方法。
3. The data compression method for structured data according to claim 1, wherein the data appearance position of the content data included in the content information is represented by a variable.
【請求項4】構造化データのデータ交換方法であって、 請求項1から3の何れか1つに記載のデータ圧縮方法を
用いて、データ交換の対象データである構造化データを
構造情報とコンテンツ情報に分離し、分離した構造情報
とコンテンツ情報をそれぞれ所定の圧縮方式で圧縮また
は所定の暗号化方式で暗号化し、該圧縮または暗号化し
た構造情報とコンテンツ情報を送信することを特徴とす
るデータ交換方法。
4. A method for exchanging structured data, wherein the structured data, which is the target data for exchanging data, is converted into structure information by using the data compression method according to claim 1. Separated into content information, the separated structure information and content information are respectively compressed by a predetermined compression method or encrypted by a predetermined encryption method, and the compressed or encrypted structure information and content information are transmitted. Data exchange method.
【請求項5】構造化データに対するデータ圧縮方法であ
って、 処理対象の構造化データの構造を定義する情報である複
数の文法規則を含む構文指定情報を、それらの文法規則
を識別情報で特定できるように、記憶手段に保持してお
くステップと、 前記処理対象の構造化データの構造を表す文法規則を求
め、求めたすべての文法規則の識別情報を並べて構造情
報を生成するとともに、それらの文法規則のうちコンテ
ンツデータが付随するものについてはそのコンテンツデ
ータをコンテンツ情報に格納し、構造情報に並べた識別
情報には当該コンテンツデータが付随することを示す指
標を付するステップと を備えたことを特徴とする構造化データに対するデータ
圧縮方法。
5. A data compression method for structured data, wherein syntax specification information including a plurality of grammatical rules, which is information defining a structure of structured data to be processed, is specified by identification information. As possible, a step of retaining in a storage means, obtaining grammatical rules representing the structure of the structured data to be processed, generating identification information of all the obtained grammatical rules, and generating the structural information. Of the grammatical rules, if the content data is attached, the content data is stored in the content information, and the identification information arranged in the structure information is provided with an index indicating that the content data is attached. A data compression method for structured data.
【請求項6】構造化データに対するデータ圧縮または暗
号化方法であって、 処理対象の構造化データの構造を定義する情報である複
数の文法規則を含む構文指定情報を、それらの文法規則
を識別情報で特定できるように、記憶手段に保持してお
くステップと、 前記処理対象の構造化データの構造を表す文法規則を求
め、求めたすべての文法規則の識別情報を並べて構造情
報を生成するとともに、それらの文法規則のうちコンテ
ンツデータが付随するものについてはそのコンテンツデ
ータをコンテンツ情報に格納し、構造情報に並べた識別
情報には当該コンテンツデータが付随することを示す指
標を付するステップと、 前記構造情報およびコンテンツ情報を圧縮または暗号化
するステップとを備えたことを特徴とする構造化データ
に対するデータ圧縮または暗号化方法。
6. A data compression or encryption method for structured data, wherein syntax specification information including a plurality of grammatical rules, which is information defining a structure of structured data to be processed, is identified. A step of storing the information in a storage means so that it can be specified by information, obtaining grammatical rules representing the structure of the structured data to be processed, and generating structural information by arranging identification information of all the obtained grammatical rules. For those grammatical rules accompanied by content data, the content data is stored in the content information, and the identification information arranged in the structure information is provided with an index indicating that the content data is associated, A step of compressing or encrypting the structure information and the content information. Data compression or encryption method.
【請求項7】請求項6に記載のデータ圧縮または暗号化
方法で圧縮または暗号化された構造情報およびコンテン
ツ情報を伸長または復号化するデータ伸長または復号化
方法であって、 圧縮または暗号化された構造情報およびコンテンツ情報
を伸長または復号化するステップと、 伸長または復号化した構造情報から文法規則の識別情報
を取り出し、前記構文指定情報を参照して、取り出した
識別情報に対応する文法規則を取得するステップと、 取得した文法規則が表すデータ構造の構造化データを復
元するとともに、その文法規則にコンテンツデータが付
随するものについては前記コンテンツ情報から対応する
コンテンツデータを取り出して構造化データの対応する
位置に設定することにより、構造化データを復元するス
テップとを備えたことを特徴とする構造化データに対す
るデータ伸長または復号化方法。
7. A data decompression or decryption method for decompressing or decrypting structure information and content information compressed or encrypted by the data compression or encryption method according to claim 6, which is compressed or encrypted. The step of decompressing or decoding the structure information and the content information, and extracting the identification information of the grammar rule from the expanded or decrypted structure information, referring to the syntax designation information, and determining the grammar rule corresponding to the extracted identification information. Acquiring step and restoring the structured data of the data structure represented by the acquired grammar rule, and if the grammatical rule is accompanied by the content data, extract the corresponding content data from the content information and correspond the structured data. Setting the position to restore the structured data. Data decompression or decoding method for structured data, wherein.
JP2001235046A 2001-08-02 2001-08-02 Method for compressing and exchanging structured data Pending JP2003044459A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001235046A JP2003044459A (en) 2001-08-02 2001-08-02 Method for compressing and exchanging structured data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001235046A JP2003044459A (en) 2001-08-02 2001-08-02 Method for compressing and exchanging structured data

Publications (1)

Publication Number Publication Date
JP2003044459A true JP2003044459A (en) 2003-02-14

Family

ID=19066550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001235046A Pending JP2003044459A (en) 2001-08-02 2001-08-02 Method for compressing and exchanging structured data

Country Status (1)

Country Link
JP (1) JP2003044459A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005018672A (en) * 2003-06-30 2005-01-20 Hitachi Ltd Method for compressing structured document
EP1990737A1 (en) 2003-09-24 2008-11-12 NTT DoCoMo, Inc. Document transformation system
US7774387B2 (en) 2003-09-19 2010-08-10 Ntt Docomo, Inc. Data compressor, data decompressor, and data management system
US9871536B1 (en) 2016-07-27 2018-01-16 Fujitsu Limited Encoding apparatus, encoding method and search method
JP2018520576A (en) * 2015-05-21 2018-07-26 ゼロポイント テクノロジーズ アーベー Method, apparatus and system for data compression and decompression of semantic values

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005018672A (en) * 2003-06-30 2005-01-20 Hitachi Ltd Method for compressing structured document
US7774387B2 (en) 2003-09-19 2010-08-10 Ntt Docomo, Inc. Data compressor, data decompressor, and data management system
EP1990737A1 (en) 2003-09-24 2008-11-12 NTT DoCoMo, Inc. Document transformation system
US7530017B2 (en) 2003-09-24 2009-05-05 Ntt Docomo, Inc. Document transformation system
JP2018520576A (en) * 2015-05-21 2018-07-26 ゼロポイント テクノロジーズ アーベー Method, apparatus and system for data compression and decompression of semantic values
JP7031828B2 (en) 2015-05-21 2022-03-08 ゼロポイント テクノロジーズ アーベー Methods, devices, and systems for data compression and decompression of semantic values
US9871536B1 (en) 2016-07-27 2018-01-16 Fujitsu Limited Encoding apparatus, encoding method and search method

Similar Documents

Publication Publication Date Title
KR100420552B1 (en) Method and apparatus for encrypting data
US7043686B1 (en) Data compression apparatus, database system, data communication system, data compression method, storage medium and program transmission apparatus
US9461817B2 (en) Method and system for encrypting JavaScript object notation (JSON) messages
US7821427B2 (en) Data processing system and method
US7965841B2 (en) Method and apparatus for compressing and decompressing data, and computer product
JP2005538436A (en) Method and apparatus for encoding / decoding structured text, especially XML text
JP2004032774A (en) Method and system for encoding markup language document
CN111683046A (en) Method, device, equipment and storage medium for compressing and acquiring file
CN101763397B (en) Device and method for processing expanding information in image file
JP2005217842A (en) Data compression method, data restoration method, and program thereof
US20080071814A1 (en) Queriable Hierarchical Text Data
JP4168946B2 (en) Document data encoding or decoding method and program thereof
KR100352783B1 (en) Software/data transmitting-receiving system
JP2004102926A (en) Identifier generating method, identity determining method, identifier sending method, identifier generating device, identity determining device, and identifier sending device
JP3729248B2 (en) Data distribution device and data scrambler
JP2003044459A (en) Method for compressing and exchanging structured data
JPWO2003084077A1 (en) Variable length / fixed length data conversion method and apparatus
JP2011081030A (en) Searchable color-encoded file-composing method and searchable color-encoded file system
JPH05324485A (en) File compressing ciphering processing device
CN114253549A (en) JavaScript obfuscation method implemented based on syntax tree AST editing
US10552635B2 (en) Encoding method, encoding device, decoding method and decoding device
CN112311529A (en) Data encryption method, data decryption method and data processing method of database
JP4221824B2 (en) Transmission / reception system and reception apparatus
JP4830558B2 (en) Structured document encoding apparatus and structured document decoding apparatus
KR100968083B1 (en) Method and devices for encoding/decoding structured documents, especially xml documents