JP3894280B2 - Xmlデータの符号化方法、符号化されたxmlデータの復号化方法、xmlデータの符号化システム、符号化されたxmlデータの復号化システム、プログラムおよび記録媒体 - Google Patents

Xmlデータの符号化方法、符号化されたxmlデータの復号化方法、xmlデータの符号化システム、符号化されたxmlデータの復号化システム、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP3894280B2
JP3894280B2 JP2001027462A JP2001027462A JP3894280B2 JP 3894280 B2 JP3894280 B2 JP 3894280B2 JP 2001027462 A JP2001027462 A JP 2001027462A JP 2001027462 A JP2001027462 A JP 2001027462A JP 3894280 B2 JP3894280 B2 JP 3894280B2
Authority
JP
Japan
Prior art keywords
data
asn
syntax
type
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001027462A
Other languages
English (en)
Other versions
JP2002244894A (ja
Inventor
剛 今村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2001027462A priority Critical patent/JP3894280B2/ja
Priority to US10/047,958 priority patent/US7143397B2/en
Publication of JP2002244894A publication Critical patent/JP2002244894A/ja
Application granted granted Critical
Publication of JP3894280B2 publication Critical patent/JP3894280B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Document Processing Apparatus (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、データの符号化および復号化技術に関し、特にXML(extensible markup language)データの符号化における圧縮率の向上に適用して有効な技術に関する。
【0002】
【従来の技術】
近年、インターネット上でのデータ表現の手段としてXMLが注目されている。XMLは拡張可能なメタ言語であり、ユーザが独自に文法を規定することができる。また、各要素に論理的な意味を持たせることが可能であり、HTML(hypertext markup language)に比較してデータ処理が大幅に容易になる。このため、電子商取引等インターネットで交換される構造化文書の標準的な表現方式として期待されている。なお、XMLについては、「W3C. Extensible Markup Language (XML) 1.0, 1998. http://www.w3.org/TR/REC-xml」に詳細が記述されている。
【0003】
XMLデータは文字で記述されるため可読性が高い利点がある。その反面、冗長性も高いという難点がある。すなわち要素の意味は主に開始タグ内に記述され、その意味内容は文字で記述されている内容を参照すれば容易に把握できる。しかし、全てが文字で記述されるため、全体の文字数が増加し、XMLデータ全体の情報量(文字数)が多くなる。文字数が多ければ、たとえばストレージに格納したり、あるいはネットワークで転送する際に、記録容量あるいは転送量が多くなり物理的、時間的コストの上昇を来たす。そこで、XMLデータを短い符号に符号化(または圧縮)できれば都合がよい。
【0004】
データの圧縮法には各種の手法が知られている。たとえば、ランレングス符号、Huffman符号、算術符号、LZ77等である。これら符号化の手法については、たとえば、「Huffman, D.A. “A method for the construction of minimum-redundancy codes” Proc. of the IRE September,1952」、「Mark Nelson and Jean Loup Gailly “The Data Compression Book”, Second Edition. M&T Books 1996」、「Jacob Ziv and Abraham Lempel. “A universal algorithm for sequential data compression” IEEE Transactions on Information Theory May, 1977」に詳しい。
【0005】
しかしながら、これら圧縮手法はXMLに特化されたものではなく、XMLデータに適用した場合に必ずしも圧縮効率が高いものではない。XMLデータに特化した圧縮手法には、たとえば「D. Suciu and H. Liefke. XMill: an Efficient Compressor for XML Data, 1999. http://www.research.att.com/sw/tools/xmill/」に記載のXMill、「XML Solutions Corp. XMLZip, 1999. http://www.xmls.com/products/xmlzip/xmlzip.html」に記載のXMLZip、あるいは「井川甲作著、東京工業大学工学部情報工学科卒業論文「DTDを用いたXML文書圧縮アルゴリズムに関する研究」、平成12年2月」に記載のXCompなどがある。
【0006】
XMillは、XMLデータから要素ごとのコンテンツ(テキスト)部分を抽出する。この抽出された部分をコンテナと呼ぶ。そして構造部分を数字で符号化し、テキスト部分はコンテナごとに LZ77などの方法で圧縮する。基本的にはパラメータ等の情報を必要とせず、アプリケーションのみで圧縮が可能である。必要であればパラメータ等を指定してコンテナごとの圧縮方法を指定し、圧縮効率を高めることが可能である。また、Cで実装されるため圧縮速度が速いという特徴をもつ。
【0007】
XMLZipは、ルート要素からの深さを指定し、指定部分をドキュメント要素から分割し、残りをZIPで圧縮する。ルート要素部分は符号化されず直接操作することが可能になる。使用しない部分を圧縮することで文書へのアクセスを迅速に行える。ただし、圧縮効率はXMillに比較して低い。
【0008】
XCompは、XMLデータの構造部分のうち、DTD(Document Type Definition)から一意に決定される部分は符号化せず、一意に決定できない部分についての構造部分のみを圧縮する。テキスト部分はXMill と同じ方法で圧縮する。すなわち、以下の手順で圧縮を行う。(1)構造とコンテンツを分離する。(2)DTDからプッシュダウンオートマトン(PDA)を生成する。(3)生成されたPDAを用いて構造部分を符号化する符号化トランスデューサを生成する。(4)符号化トランスデューサの各ノードに割り振られた数字をオートマトンを連鎖的に遷移することにより出力し、構造を符号化する。(5)得られた構造符号と要素ごとのコンテンツをLZ77等で圧縮し、圧縮されたXML文書を出力する。
【0009】
上記XML文書に特化された圧縮手法のうち、XCompは構造部分の一部を符号化しないので、かなりよい圧縮効率を達成する。
【0010】
【発明が解決しようとする課題】
上記の通り、XCompはXML文書の圧縮手法として相対的に優れる。しかし、本発明者の検討によればXCompにおいても、XMLデータがある特定の構造をしている場合に圧縮効率が悪くなるという課題がある。すなわち、要素に「?」オペレータや「*」オペレータ(「+」オペレータを含む)が適用された場合である。
【0011】
「?」オペレータは、ある要素の子要素が0回もしくは1回出現する場合に、要素の宣言文において子要素に付されるオペレータである。XCompにおいて「?」オペレータが出現した場合、「?」オペレータは、ある状態から別の状態に遷移する複数の選択肢で表現される。選択肢にはインデクスが付与される。XCompの実行時には、選択された選択肢に付与されたインデクスが出力される。選択肢の数は、「?」オペレータの後に「?」オペレータなどがいくつ連続するかによる。例えば、「?」オペレータがn個連続する場合に、最初の「?」オペレータに対する選択肢はn+1個となる。従って、インデクスはn+1種類必要であり、その1つを表現するにはO(log n)ビット必要である。「?」オペレータが適用された要素がすべて存在すると、インデクスが複数羅列される。その1つを表現するのにO(log n)ビット必要であるから、それ全体を表現するにはO(nlog n)ビット必要である。
【0012】
「*」オペレータは、ある要素の子要素が0回以上出現する場合に、要素の宣言文において子要素に付されるオペレータであり、「+」オペレータは、ある要素の子要素が1回以上出現する場合に、要素の宣言文において子要素に付されるオペレータである。XCompにおいて「*」オペレータ(または「+」オペレータ)が出現した場合、「*(または+)」オペレータは、同じ状態か別の状態に遷移する2つの選択肢で表現される。選択肢には、インデクスが付与される。XCompの実行時には、選択された選択肢に付与されたインデクスが出力される。「*」オペレータが適用された要素が複数存在すると、同じインデクスが複数羅列される。インデクスの数は、存在する要素の数に比例する。従って、インデクス全体を表現するのに、要素の数をnとすると、O(n)ビット必要である。
【0013】
すなわち、XCompではDTDから一意的に決まらない構造のうち特定のものについて、それらを表現する符号のビット数が大きくなって、必ずしも十分な圧縮効率を達成できない問題がある。
【0014】
本発明の目的は、より圧縮効率の高いXMLデータ(XML文書)の符号化方式を提案し、それを実現する方法およびシステムを提供することにある。
【0015】
【課題を解決するための手段】
より高いXMLデータの圧縮効率を達成するために、本発明では、「ITU-T. X.680 - Abstract Syntax Notation One (ASN.1): Specification of basic notation, 1997. http://www.itu.int/itudoc/itu-t/rec/x/x500up/x680.html」に記載のASN.1を利用する。すなわち、符号化対象のXMLデータを構造とコンテンツ(テキスト)に分離する。一方、符号化対象のXMLデータの文法をASN.1抽象構文(型)に変換する。分離したコンテンツは要素ごとあるいはまとめてXMillと同様に圧縮する。また、分離した構造(要素)をASN.1抽象構文(型)に従うASN.1抽象構文(値)に変換する。次に、ASN.1抽象構文(値)をASN.1で規定されている符号化規則を用いてASN.1転送構文に変換する。ASN.1で規定される符号化規則には、BER、DER、PER等があるが、特に符号化効率の観点からPERを用いることが好ましい。そして符号化された要素(構文)であるASN.1転送構文と圧縮されたコンテンツ(テキスト)を併合し、符号化されたXMLデータを生成する。なお、PERについては、「ITU-T. X.691-ASN.1 encoding rules: Specification of Packed Encoding Rules (PER)、 1997. http://www.itu.int/itudoc/itu-t/rec/x/x500up/x691.html」に詳しく記載されている。
【0016】
このような符号化手法を用いることにより、XCompに比較して圧縮効率の高い符号化が行える。たとえば「?」オペレータがn個連続して出現した場合の構造の符号化では、本発明を用いることによりO(n)ビットでそれを表現できる。また、「*」オペレータが出現した場合の構造の符号化では、本発明を用いることによりオーダとしてはXCompと同じであるが、実質的には少ないビット数でそれを表現できる。そして符号化(圧縮)されたXMLデータを通信あるいはストレージに用いることにより通信負荷を低減し、またストレージの容量を節約できる。
【0017】
なお、符号化されたXMLデータの復号化は、前記と逆の処理を行うことにより実現できる。また、本発明の符号化あるいは復号化の方法は、システムとして把握することも可能であり、さらに、前記方法によって実現される機能をコンピュータに実現させるためのプログラムとして把握することも可能である。
【0018】
【発明の実施の形態】
以下、本発明の実施の形態を図面を用いて詳細に説明する。ただし、本発明は多くの異なる態様で実施することが可能であり、本実施の形態の記載内容に限定して解釈すべきではない。なお、実施の形態の全体を通して同じ要素には同じ番号を付するものとする。
【0019】
以下の実施の形態では、主に方法またはシステムについて説明するが、当業者であれば明らかなとおり、本発明はコンピュータで使用可能なプログラムとしても実施できる。したがって、本発明は、ハードウェアとしての実施形態、ソフトウェアとしての実施形態またはソフトウェアとハードウェアとの組合せの実施形態をとることができる。プログラムは、ハードディスク、CD−ROM、光記憶装置または磁気記憶装置等の任意のコンピュータ可読媒体に記録できる。
【0020】
また以下の実施の形態では、一般的なコンピュータシステムを用いることができる。実施の形態で用いることができるコンピュータシステムは、中央演算処理装置(CPU)、主記憶装置(メインメモリ:RAM)、不揮発性記憶装置(ROM)、コプロセッサ、画像アクセラレータ、キャッシュメモリ、入出力制御装置(I/O)等、一般的にコンピュータシステムに備えられるハードウェア資源を備える。また、ハードディスク装置等の外部記憶装置、インターネット等のネットワークに接続可能な通信手段を備えることができる。コンピュータシステムには、パーソナルコンピュータ、ワークステーション、メインフレームコンピュータ等各種のコンピュータが含まれる。
【0021】
(実施の形態1)
1.前提条件
本実施の形態を説明するにあたり、本実施の形態における前提となる条件を述べる。
(1)XMLデータは、文法で構造が定義される。また、文法は、XMLデータを符号化する側と復号化する側で共有される。たとえば文法定義ファイルを外部データとして所定のIPアドレスに記録し、符号化あるいは復号化する際にIPアドレスを用いてこの外部ファイルを参照できる。なお、本実施の形態では文法定義としてDTDを用いるが、これに限られない。例えば、XML SchemaやRELAXなどを用いることができる。
(2)XMLデータは、要素とテキストだけから構成される。その他のもの(例えば、属性や処理命令)は、別の方法で管理される。例えば、属性や処理命令を特別な要素として表現し、XMLデータの中に埋め込むことができる。この際、文法も変更する必要がある。また、XMLデータから分離して、XPointerなどと共に別に格納することも考えられる。
(3)テキストは、XMillなどの方法で圧縮される。
このような前提条件の下に本実施の形態のXMLデータの符号化および復号化が行われることを説明する。
【0022】
2.符号化手順
2.1 システム構成と手順の概要
図1は本実施の形態の符号化システムの一例をその機能について示したブロック図である。本実施の形態の符号化システムは、構文(型)生成装置2−1、分離装置2−2、構文(値)生成装置2−3、転送構文生成装置2−4、圧縮装置2−5、併合装置2−6を有する。
【0023】
構文(型)生成装置2−1は、DTDからASN.1抽象構文(型)を生成し、分離装置2−2は、XMLデータから要素の内容(テキスト)と構造(要素名および構造)を分離する。構文(値)生成装置2−3は、要素の構造からASN.1抽象構文(値)を生成し、転送構文生成装置2−4は、ASN.1転送構文を生成する。圧縮装置2−5は分離したテキストを圧縮し、併合装置2−6は圧縮テキストとASN.1転送構文を併合して符号化されたXMLデータを生成する。
【0024】
このような符号化システムを用いた本実施の形態の符号化方法の手順の概要は以下のとおりである。
(ステップ2−1) 構文(型)生成装置2−1を用いてDTDをASN.1抽象構文(型)に変換する。
(ステップ2−2) 分離装置2−2を用いてステップ2−1のDTDに従うXMLデータからテキストを分離する。なお、ステップ2−2は、ステップ2−1と並行に行われても良く、ステップ2−1よりも先に行われても良い。
(ステップ2−3) 構文(値)生成装置2−3を用いてステップ2−2でテキストが分離された後のXMLデータ(要素の構文)を、ステップ2−1のASN.1抽象構文(型)に従うASN.1抽象構文(値)に変換する。
(ステップ2−4) 転送構文生成装置2−4を用いてステップ2−3のASN.1抽象構文(値)をASN.1転送構文に変換する。
(ステップ2−5) 圧縮装置2−5を用いてステップ2−2で分離されたテキストを圧縮する。なお、ステップ2−5はステップ2−3〜ステップ2−4と並行に行われる。
(ステップ2−6) 併合装置2−6を用いてステップ2−4で生成されたASN.1転送構文とステップ2−5で生成された圧縮テキストを併合し、符号化XMLデータを生成する。
【0025】
なお、ASN.1抽象構文(値)をASN.1転送構文に変換するには、ASN.1で規定されている符号化規則に従う。そのような規則には、BERやDER、PERなどがある。特に、PERは、ASN.1抽象構文(型)から一意に決定される型やその値などを符号化しないため、符号化効率がよい。
【0026】
以下、前記各ステップを詳細に説明する。
2.2 ステップ2−1
ステップ2−1では、DTDをASN.1抽象構文(型)に変換する。以下では、内容モデルのパターンごとに、その方法を説明する。
【0027】
2.2.1 要素内容(element content)
XMLの要素内容は、要素名とオペレータの組み合わせで構成される。通常要素名は文字列で表される。オペレータは要素内容における子要素の出現順と出現回数を指定するための演算子である。周知のとおりXMLでは、「,」、「|」、「?」、「*」、「+」の各オペレータが許可される。
原則として、要素名はASN.1抽象構文では識別子として、オペレータは同じくASN.1抽象構文では型として表現する。ただし、識別子はBERなどでは符号化されないため、要素名を識別子とする必然性はない。以下では、オペレータごとに、それをどのような型で表現するかを説明する。
【0028】
2.2.1.1 「,」オペレータ
「,」オペレータは、ASN.1抽象構文ではsequence型で表現する。例えば、DTDとして、
<!ELEMENT a (b、c)>
<!ELEMENT b (#PCDATA)>
<!ELEMENT c (#PCDATA)>
が与えられるとき、ASN.1抽象構文(型)は、
Figure 0003894280
となる。ここで、A、B、Cは、便宜上導入した型参照である。型参照は、衝突さえしなければどのようなものでもよい。また、テキストはステップ2−2で分離されるため、BやCはnull型とする。
【0029】
2.2.1.2 「|」オペレータ
「|」オペレータは、ASN.1抽象構文ではchoice型で表現する。例えば、DTDとして、
<!ELEMENT a (b|c)>
<!ELEMENT b (#PCDATA)>
<!ELEMENT c(#PCDATA)>
が与えられているとき、ASN.1抽象構文(型)は、
Figure 0003894280
となる。
【0030】
2.2.1.3 「?」オペレータ
「?」オペレータは、ASN.1抽象構文ではsequence型とキーワード「OPTIONAL」の組み合わせで表現する。例えば、DTDとして、
<!ELEMENT a (b?)>
<!ELEMENT b (#PCDATA)>
が与えらるとき、ASN.1抽象構文(型)は、
Figure 0003894280
となる。
【0031】
2.2.1.4 「*」オペレータ
「*」オペレータは、ASN.1抽象構文ではsequence−of型で表現する。例えば、DTDとして、
<!ELEMENT a (b*)>
<!ELEMENT b (#PCDATA)>
が与えられるとき、ASN.1抽象構文(型)は、
A ::= SEQUENCE OF B
B ::= NULL
となる。
【0032】
2.2.1.5 「+」オペレータ
「+」オペレータは、ASN.1抽象構文ではサイズが制限されたsequence−of型で表現する。ただし、サイズ制限は符号化には影響しないため、「+」オペレータに対する符号は「*」オペレータに対するそれと同じものになる。例えば、DTDとして、
<!ELEMENT a (b+)>
<!ELEMENT b (#PCDATA)>
が与えられるとき、ASN.1抽象構文(型)は、
A ::= SEQUENCE SIZE (1 .. MAX) OF B
B ::= NULL
となる。
【0033】
2.2.1.6 オペレータなし
要素内容には、オペレータの適用されていない要素名が1つだけ指定されることもある。そのような要素名は、ASN.1抽象構文ではdefined型で表現する。例えば、DTDとして、
<!ELEMENT a (b)>
<!ELEMENT b (#PCDATA)>
が与えられるとき、ASN.1抽象構文(型)は、
A ::= B
B ::= NULL
となる。
【0034】
2.2.2 混在内容(mixed content)
混在内容は、キーワード「#PCDATA」と1つ以上の要素名を「|」オペレータで結合した後、「*」オペレータを適用したものである。そこで、ASN.1抽象構文ではchoice型とsequence−of型の組み合わせで表現する。例えば、DTDとして、
<!ELEMENT a (#PCDATA|b)*>
<!ELEMENT b (#PCDATA)>
が与ええられるとき、ASN.1抽象構文(型)は、
Figure 0003894280
となる。ここで、txtは便宜上導入した識別子であり、混在内容に含まれるテキストに対応する。
【0035】
2.2.3 空要素(EMPTY)
空要素は、ASN.1抽象構文ではnull型で表現する。例えば、DTDが、
<!ELEMENT a EMPTY>
の場合はASN.1抽象構文(型)は、
A ::= NULL
となる。
【0036】
2.2.4 任意要素(ANY)
任意要素は、キーワード「#PCDATA」とDTDで宣言されたすべての要素名から構成される混在内容と等価である。従って、任意要素のASN.1抽象構文における表現は、混在内容のそれに帰着される。
【0037】
2.3 ステップ2−2
ステップ2−2では、ステップ2−1のDTDに従うXMLデータからテキストを分離する。例えば、XMLデータが、
Figure 0003894280
の場合、要素bから「10」が、要素cから「20」が分離される。その結果、XMLデータ(要素名および構造)は次のようになる。
Figure 0003894280
【0038】
分離されたテキストを圧縮する方法は、例えば、XMillなどのように、要素ごとにまとめた後、圧縮することができる。なお、その他の圧縮方法を適用してももちろん良い。
【0039】
2.4 ステップ2−3
ステップ2−3では、ステップ2−2のXMLデータを、ステップ2−1のASN.1抽象構文(型)に従うASN.1抽象構文(値)に変換する。例えば、ASN.1抽象構文(型)が、
Figure 0003894280
の場合、以下のXMLデータ(要素名および構造)、
Figure 0003894280
をASN.1抽象構文(値)に変換すると、
Figure 0003894280
となる。
【0040】
2.5 ステップ2−4
ステップ2−4では、ASN.1で規定されている符号化規則に従って、ステップ2−3のASN.1抽象構文(値)をASN.1転送構文に変換する。そのような規則にはBERやDER、PER(ALIGNED/UNALIGNED)などがある。しかしながら、符号化効率を向上する観点からPER(UNALIGNED)を利用することが好ましい。尤も、BER、DER、PER(ALIGNED)を利用してもよいことは勿論である。
【0041】
2.6 ステップ2−5
ステップ2−5では、テキストを圧縮する。圧縮の具体的方法については、周知のLZ77等を用いる。その他、従来技術の項で説明した公知技術を用いることができる。圧縮は、要素ごとに行われても良く、また、各要素をまとめて圧縮しても良い。
【0042】
2.7 ステップ2−6
ステップ2−6では、ASN.1転送構文と圧縮テキストを併合する。両データを単に結合することも可能であるが、復号時の分離を考慮したセパレータをデータ間に挿入し、あるいはデータビット数情報を持つヘッダ等を付加しても良い。
【0043】
3.復号化手順
3.1 システム構成と手順の概要
図2は本実施の形態の復号化システムの一例をその機能について示したブロック図である。本実施の形態の復号化システムは、構文(型)生成装置3−1、転送構文復号装置3−2、抽象構文復号装置3−3、併合装置3−4、分離装置3−5、解凍装置3−6を有する。
【0044】
構文(型)生成装置3−1は、前記した構文(型)生成装置2−1と同様に、DTDをASN.1抽象構文(型)に変換する。分離装置3−5は、符号化されたXMLデータからASN.1転送構文と圧縮テキストを分離し、転送構文復号装置3−2は、ASN.1転送構文をASN.1抽象構文(型)に従うASN.1抽象構文(値)に変換する。抽象構文復号装置3−3は、ASN.1抽象構文(値)をDTDに従うXMLデータ(要素名と構造)に変換する。併合装置3−4は復号化されたテキスト(要素の内容)とXMLデータ(要素名と構造)を併合し、XMLデータを生成する。解凍装置3−6は、圧縮テキストを解凍する。
【0045】
このような復号化システムを用いた本実施の形態の復号化方法の手順は、前記符号化の手順をほぼ逆に行う。その概要は以下のとおりである。
(ステップ3−1) DTDをASN.1抽象構文(型)に変換する。
(ステップ3−2) 符号化XMLデータを圧縮テキストとASN.1転送構文に分離する。なお、ステップ3−2は、ステップ3−1と並行に行われても良く、ステップ3−1よりも先に行われても良い。
(ステップ3−3) ASN.1転送構文を、ステップ3−1のASN.1抽象構文(型)に従うASN.1抽象構文(値)に変換する。
(ステップ3−4) ステップ3−3のASN.1抽象構文(値)を、ステップ3−1のDTDに従うXMLデータ(要素名と構造)に変換する。
(ステップ3−5) ステップ3−2で分離した圧縮テキストを解凍する。
(ステップ3−6) ステップ3−4のXMLデータ(要素名と構造)にステップ3−5で解凍したテキストを結合する。
【0046】
なお、前記ステップ3−1〜ステップ3−6における復号化の各処理は、それに相当する符号化の場合の逆であって自明である。よって、その詳細な説明を省略する。
以下、DTDの変換およびそのDTDに従うXMLデータのPERによる符号化の具体例を示す。
【0047】
4.「,」オペレータを含む場合
ここでは、「,」オペレータを含むDTDと、それに従うXMLデータを例にとる。以下のDTD、
<!ELEMENT a (b、c)>
<!ELEMENT b (#PCDATA)>
<!ELEMENT c (#PCDATA)>
が与えられている場合、前記ステップ2−1で生成されるASN.1抽象構文(型)は、
Figure 0003894280
となる。このようなDTDに従う符号化対象のXMLデータとして、
Figure 0003894280
を例示すれば、前記ステップ2−2で分離される要素(XMLデータの要素名と構造)は、
Figure 0003894280
となる。この要素から前記ステップ2−3で生成されるASN.1抽象構文(値)は、
Figure 0003894280
となる。
【0048】
PERでは、sequence型の値は、原則としてその構成要素の値がその順番で符号化される。しかし、ここではbやcの値はnullであり、nullは空ビット列に符号化されるため、aの値は空ビット列となる。その場合に、符号は例外的に、
00000000(2)
のようになる。このようにして、ASN.1転送構文が生成される。なお、このようなASN.1転送構文の生成は前記ステップ2−4で行われる。また、下付き文字の“(2)”は2進数であることを示す。
【0049】
その後、前記ステップ2−5で圧縮処理された圧縮テキストとASN.1転送構文(ここでは「00000000(2)」)が前記ステップ2−6で併合され、符号化XMLデータが生成される。
【0050】
5.「|」オペレータを含む場合
ここでは、「|」オペレータを含むDTDと、それに従うXMLデータを例にとる。以下のDTD、
<!ELEMENT a (b|c)>
<!ELEMENT b (#PCDATA)>
<!ELEMENT c(#PCDATA)>
が与えられている場合、前記ステップ2−1で生成されるASN.1抽象構文(型)は、
Figure 0003894280
となる。このようなDTDに従う符号化対象のXMLデータとして、
Figure 0003894280
を例示すれば、前記ステップ2−2で分離される要素(XMLデータの要素名と構造)は、
Figure 0003894280
となる。この要素から前記ステップ2−3で生成されるASN.1抽象構文(値)は、
a A ::= b:NULL
となる。
【0051】
PERでは、choice型の値は、まず選択された構成要素のインデクス(0ベース)が符号化され、次にその構成要素の値が符号化される。ここでは bが選択されているため、インデクスは0である。また、bの値はnull である。従って、aの値は、
0XXXXXXX(2)
のようになる。ここで、Xは、8ビットの倍数にするために付加されたパディング・ビットを表わす。このようにして、ASN.1転送構文が生成される。なお、圧縮テキストの生成および圧縮テキストとASN.1転送構文の併合は前記“4.「,」オペレータを含む場合”と同様である。
【0052】
6.「?」オペレータを含む場合
ここでは、「?」オペレータを含むDTDと、それに従うXMLデータを例にとる。以下のDTD、
<!ELEMENT a (b?、c)>
<!ELEMENT b (#PCDATA)>
<!ELEMENT c (#PCDATA)>
が与えられている場合、前記ステップ2−1で生成されるASN.1抽象構文(型)は、
Figure 0003894280
となる。このようなDTDに従う符号化対象のXMLデータとして、
Figure 0003894280
を例示すれば、前記ステップ2−2で分離される要素(XMLデータの要素名と構造)は、
Figure 0003894280
となる。この要素から前記ステップ2−3で生成されるASN.1抽象構文(値)は、
Figure 0003894280
となる。
【0053】
PERでは、sequence型の構成要素が少なくとも1つ「OPTIONAL」と指定されている場合に、各構成要素の値が符号化される前に、どの構成要素が存在しているかを表わすビット列が付加される。ビットは、構成要素が存在する場合に1、存在しない場合に0となる。ここではbだけが「OPTIONAL」と指定されており、それが存在しているため、まずビット列1 が付加される。次にbとcの値が符号化されるが、それらは共にnullであるため、aの値は、
1XXXXXXX(2)
のようになる。このようにして、ASN.1転送構文が生成される。なお、圧縮テキストの生成および圧縮テキストとASN.1転送構文の併合は前記“4.「,」オペレータを含む場”と同様である。
【0054】
7.「*」オペレータを含む場合
ここでは、「*」オペレータを含むDTDと、それに従うXMLデータを例にとる。以下のDTD、
<!ELEMENT a (b*)>
<!ELEMENT b (#PCDATA)>
が与えられている場合、前記ステップ2−1で生成されるASN.1抽象構文(型)は、
A ::= SEQUENCE OF B
B ::= NULL
となる。このようなDTDに従う符号化対象のXMLデータとして、
Figure 0003894280
を例示すれば、前記ステップ2−2で分離される要素(XMLデータの要素名と構造)は、
Figure 0003894280
となる。この要素から前記ステップ2−3で生成されるASN.1抽象構文(値)は、
Figure 0003894280
となる。
【0055】
PERでは、sequence−of型の値は、まずその構成要素の数が符号化され、次に各構成要素の値がその順番で符号化される。ここでは構成要素の数は2であり、まずその値が符号化される。次に各構成要素の値が符号化されるが、それらはすべてnullであるため、aの値は、
00000010(2)
のようになる。このようにして、ASN.1転送構文が生成される。なお、圧縮テキストの生成および圧縮テキストとASN.1転送構文の併合は前記“4.「,」オペレータを含む場合”と同様である。
【0056】
8.混在内容を含む場合
ここでは、混在内容を含むDTDと、それに従うXMLデータを例にとる。以下のDTD、
<!ELEMENT a (#PCDATA|b)*>
<!ELEMENT b (#PCDATA)>
が与えられている場合、前記ステップ2−1で生成されるASN.1抽象構文(型)は、
Figure 0003894280
となる。このようなDTDに従う符号化対象のXMLデータとして、
Figure 0003894280
を例示すれば、前記ステップ2−2で分離される要素(XMLデータの要素名と構造)は、
Figure 0003894280
となる。
【0057】
なお、上記において「xxx」はテキストの内容を示し、「txt」は要素がテキストであることを示す。この要素から前記ステップ2−3で生成されるASN.1抽象構文(値)は、
Figure 0003894280
となる。
【0058】
sequence−of型の値とchoice型の値をPERで符号化する方法は、前述の通りである。ここでは、構成要素の数は3である。また、構成要素としてtxt、b、bがその順番で選択されているため、インデクスは0、 1、1となる。それらの値はすべてnullであるため、aの値は、
00000011(2)
011XXXXX(2)
のようになる。このようにして、ASN.1転送構文が生成される。なお、圧縮テキストの生成および圧縮テキストとASN.1転送構文の併合は前記“4.「,」オペレータを含む場合”と同様である。
【0059】
(実施の形態2)
前記実施の形態1では、XMLデータは要素とテキストだけから構成され、その他のもの(例えば、属性や処理命令)は別の方法で管理されると仮定して説明を行った。本実施の形態では、属性や処理命令等が含まれる場合の処理の一例を説明する。すなわち、それら属性等を特別な要素で表現し、XMLデータの中に埋め込む方法を例示する。この場合、文法も変更する必要がある。なお、本実施の形態の例に関わらず、属性等をXMLデータから分離して、XPointerなどと共に別に格納する方法を採用することも可能である。このような属性等を特別な要素としてXMLデータに埋め込む方策は、前記実施の形態1の処理の前処理および後処理として把握することが可能である。これにより広い範囲のXMLデータを扱えるようになる。以下では、そのような前処理の例として、DTDで定義される項目をXMLデータの中に埋め込む方法を説明する。
【0060】
9.1 前処理システムと前処理の概要
図3は、本実施の形態の前処理システムの一例をその機能について示したブロック図である。本実施の形態の前処理システムは、DTD変換装置9−1、XMLデータ変換装置9−2、符号化装置9−3を有する。
【0061】
DTD変換装置9−1は、一般のDTDを要素以外の項目についても考慮したDTD’に変換する。XMLデータ変換装置9−2は、一般のDTDに従うXMLデータをDTD’に従うXMLデータ’に変換する。符号化装置9−3は、実施の形態1の符号化システムである。
【0062】
本実施の形態の前処理方法は、装置9−1によるDTDの変換および装置9−2によるXMLデータの変換の各ステップを有する。各々変換後、実施の形態1の符号化処理を行うことにより符号化XMLデータが生成される。
【0063】
9.2 DTDの変換処理
DTDには、要素型宣言以外に属性リスト宣言、エンティティ宣言、記法宣言の3つの宣言が含まれうる。
【0064】
エンティティ宣言で定義されるエンティティには、パース対象エンティティ、パース対象外エンティティ、パラメータ・エンティティがある。パース対象エンティティは、テキストや属性値など、あらゆる場所で参照されうる。このエンティティは、単純に展開する。また、パース対象外エンティティは、属性値でしか参照されえない。従って、属性を処理できれば十分である。一方、パラメータ・エンティティは、DTDの中でしか参照されえない。従って、パラメータ・エンティティは本実施の形態では考慮しない。
【0065】
記法宣言で定義される記法は、属性値でしか参照されえない。従って、属性を処理できれば十分である。
【0066】
以上の議論から、DTDに対する前処理は、要素型宣言と属性リスト宣言に対するそれに帰着される。
【0067】
属性リスト宣言では、ある要素に付与される属性と、その属性の取りうる値が定義される。また、必要であれば、デフォルト値も定義される。属性は、「REQUIRED」であるか、「IMPLIED」であるか、デフォルト値が定義されているか、それは「FIXED」であるかで、要素に対する付与のされ方が変わる。従って、属性は原則として要素で表現することにするが、その定義に従って表現を多少変えることが好ましい。
【0068】
属性リスト宣言に従って要素型宣言を変更する規則は、以下のとおりである。
(1)属性は、要素(以下、属性要素)で表現する。要素名は、属性名から一意に決定できるようにする。例えば、“親の要素名”+“_”+“属性名”のようにする。ただし、要素名がすでに使用されていないことに注意する。以下では、この命名規則に従うことにする。
(2)属性値はすべて「CDATA」として扱い、属性要素に含める。
(3)属性要素は、親要素の子要素の先頭に挿入する。
(4)「REQUIRED」属性は、要素で表現する。
(5)「IMPLIED」属性は、「?」オペレータが適用された要素で表現する。
(6)デフォルト値が定義されている属性は、「?」オペレータが適用された要素で表現する。
(7)「FIXED」デフォルト値が定義されている属性は、無視する。
【0069】
以下具体例をあげる。例えば、DTDとして、
Figure 0003894280
が与えられたとき、DTD’は、
<!ELEMENT a (a_w、a_x?、a_y?、b、c)>
<!ELEMENT a_w (#PCDATA)>
<!ELEMENT a_x (#PCDATA)>
<!ELEMENT a_y (#PCDATA)>
となる。
【0070】
9.3 XMLデータの変換処理
ここでは、上記のDTDに従うXMLデータを上記DTD’に従うXMLデータ’に変換する。基本的には、要素に付与されている属性を属性要素に変換し、その属性要素をその要素の子要素の先頭に挿入すればよい。ただし、属性にデフォルト値が定義されており、属性値がそれと一致するのであれば、属性要素には変換しない。
【0071】
例えば、9.2におけるDTDに従うXMLデータとして、
Figure 0003894280
を例示すれば、XMLデータ’は、
Figure 0003894280
に変換される。ここで、a要素にはx属性が付与されていないため、a_x要素は現れていない。また、y属性の値はデフォルト値と一致するため、a_y要素も現れていない。さらに、z属性は「FIXED」デフォルト値が定義されているため、削除されている。
【0072】
9.4 後処理システムと後処理の概要
図4は、本実施の形態の後処理システムの一例をその機能について示したブロック図である。本実施の形態の後処理システムは、DTD変換装置9−4、復号化装置9−5、XMLデータ変換装置9−6を有する。
【0073】
DTD変換装置9−4はDTD変換装置9−1と同様である。復号化装置9−5は、実施の形態1の復号化システムである。XMLデータ変換装置9−6は、DTD’に従うXMLデータ’からDTDに従うXMLデータに変換する。
【0074】
本実施の形態の後処理方法は、装置9−4によるDTDの変換および装置9−6によるXMLデータの変換の各ステップを有する。実施の形態1の復号化処理の後、これらステップを実行する。装置9−4によるDTDの変換は9.2と同様であり、装置9−6によるXMLデータの変換は9.3の変換を逆に行うことにより実行できる。よって、詳細な説明は省略する。なお、図中破線矢印は、必要があればDTDを参照することを意味する。属性要素を識別でき、かつその要素名から属性名を一意に決定できるのであれば、DTDを参照する必要はない。また、後処理は前処理がいかに行われたかに依存するので、前記前処理が異なる場合に本実施の形態の後処理もそれに併せて変更されることは勿論である。
【0075】
10.実施の形態の効果
上記した実施の形態1、2の符号化方法を用いれば、XMLデータを効率良く圧縮することが可能である。以下、XCompとの比較において、本実施の形態の効果を説明する。
【0076】
XMLデータを符号化するときに、DTDから一意に決定される情報は符号化しないという点で、本手法とXCompは同じである。しかし、XCompは、XMLデータがある特定の構造をしている場合に、圧縮効率が悪くなる。具体的には、要素に「?」オペレータや「*」オペレータ(「+」オペレータを含む)が適用された場合である。
【0077】
10.1 「?」オペレータ
本実施の形態の手法は要素が存在するかどうかをビット列で表現するのに対して、XCompは存在する要素(選択肢)に付与されたインデクスを羅列する。この差は、「?」オペレータが適用された要素がいくつか連続し、それらがすべて存在する場合に顕著に現れる。
【0078】
例えば、DTD:
<!ELEMENT a (b?、c?)>
<!ELEMENT b (#PCDATA)>
<!ELEMENT c (#PCDATA)>
に従うXMLデータ:
Figure 0003894280
を考える。このXMLデータには、要素bと要素cが共に存在している。このXMLデータは、本手法では11(2)に符号化される。ただし、簡単のため、パディング・ビットは付加していない。
【0079】
一方、XCompでは、オートマトン:
Figure 0003894280
が作成されたとすると、インデクス列11が得られる。このインデクス列を0 ベースに変換し、必要最小限のビット数で符号化すると、符号000(2)が得られる。本手法による符号とXCompによるそれを比較すると、本手法のほうが1ビットだけ短く符号化できることが分かる。
【0080】
表1に、「?」オペレータが適用された要素がいくつか連続し、それらがすべて存在する場合に、それらを符号化するのに必要なビット数を、本手法とXCompで比較したものを示す。表1から、本手法はXCompと同じか、それよりも効率よく符号化できることが分かる。一般には、「?」オペレータが適用された要素がn個連続する場合に、XCompはO(nlog n)ビットを必要とするのに対して、本手法はO(n)ビットで十分である。
【0081】
【表1】
Figure 0003894280
【0082】
10.2 「*」オペレータ
本実施の形態の手法は存在する要素の数を符号化するのに対して、XCompは存在する要素(選択肢)に付与されたインデクスを羅列する。この差は、「*」オペレータが適用された要素がいくつも存在する場合に顕著に現れる。
【0083】
例えば、DTD:
<!ELEMENT a (b*)>
<!ELEMENT b (#PCDATA)>
に従うXMLデータ:
Figure 0003894280
を考える。ここで、要素bは8回出現しているとする。このXMLデータは、本手法では00001000(2)に符号化される。
【0084】
一方、XCompでは、オートマトン:
Figure 0003894280
が作成されたとすると、インデクス列111111112が得られる。このインデクス列を0ベースに変換し、必要最小限のビット数で符号化すると、符号000000001(2)が得られる。本手法による符号とXCompによるそれとを比較すると、本手法のほうが1ビットだけ短く符号化できることが分かる。
【0085】
図5に、「*」オペレータが適用された要素がいくつも存在する場合に、それらを符号化するのに必要なビット数を、本手法とXCompで比較したものを示す。同図から、要素が8つ以上存在する場合に、本手法はXCompよりも効率よく符号化できることが分かる。本手法は、一般にはXCompと同じオーダのビット数を必要とするが、実質的にはそれよりも少ないビット数で十分である。
【0086】
以上、本発明者によってなされた発明を発明の実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。
【0087】
たとえば、本発明の手法は、複数のオペレータを組み合わせて適用しても良い。内容モデルで使用されうるオペレータには、「,」、「|」、「?」、「*」(「+」 を含む)の4つがある。従って、適用順序を考慮に入れると、それらの組み合わせは16通りある。各組み合わせに対して、前記実施の形態と同様にXMLデータをASN.1抽象構文に変換することができる。よって、本発明を利用してあらゆるオペレータの組合せを含むXMLデータを符号化できる。
【0088】
また、前記実施の形態で説明した手法のポイントの1つは、文法やそれに従うXMLデータのASN.1抽象構文における表現を定義したことである。しかし、それとは別の表現も考えられる。
【0089】
たとえば、「?」オペレータは、前記実施の形態ではsequence型とキーワード「OPTIONAL」の組み合わせで表現した。具体的には、DTD:
<!ELEMENT a (b?、c)>
は、ASN.1抽象構文:
Figure 0003894280
に変換される。
【0090】
しかし、先のDTDはASN.1抽象構文:
Figure 0003894280
に変換されてもよい。このように変換されるほうが、BERやDERで符号化する場合に符号が短くなるため都合がよい。
【0091】
ただし、この方法では、以下のDTD:
<!ELEMENT a (b?)>
<!ELEMENT a (b?|c)>
のような場合にうまく機能しないので、実施の形態のように表現するほうが妥当である。
【0092】
また、前記実施の形態では、オペレータは何からの型で表現される。例えば、「,」オペレータはsequence型で表現され、「|」オペレータはchoice型で表現される。一方、オペレータの適用をプロダクションと見なし、すべてsequence型で表現するという方法も採れる。その場合に、sequence 型で表現されていない「|」オペレータ、「*」オペレータ(「+」オペレータを含む)およびオペレータなしは、次のように表現できる。
【0093】
すなわち、<!ELEMENT a(b|c)>は、
Figure 0003894280
と表現できる。また、<!ELEMENT a (b*)>は、
Figure 0003894280
と表現できる。また、<!ELEMENT a (b)>は、
Figure 0003894280
と表現できる。
【0094】
この表現法では、sequence型で統一的に表現することで、見た目には分かりやすくなる。また、オペレータをsequence型でラップすることに相当するので、複数のオペレータを組み合わせてもうまく機能することが分かる。ただし、BERやDERでは常に型が符号化されるため、型を挿入すればするほど符号は長くなる。従って、必要以上の型を挿入するべきではなく、その理由から前記実施の形態の手法で表現するほうが妥当である。
【0095】
【発明の効果】
本願で開示される発明のうち、代表的なものによって得られる効果は、以下の通りである。すなわち、XMLデータの符号化(圧縮)効率を高めることが可能になり、また、属性等要素以外の記述を含めたXMLデータの符号化(圧縮)が可能になる。これにより、XMLデータの転送による通信負荷を軽減し、また、XMLデータのストレージ容量を少なくできる。
【図面の簡単な説明】
【図1】本発明の一実施の形態である符号化システムの一例をその機能について示したブロック図である。
【図2】本発明の一実施の形態である復号化システムの一例をその機能について示したブロック図である。
【図3】本発明の一実施の形態である前処理システムの一例をその機能について示したブロック図である。
【図4】本発明の一実施の形態である後処理システムの一例をその機能について示したブロック図である。
【図5】本実施の形態の符号化手法の符号化率をXCompとの比較において示した図である。
【符号の説明】
2−1…構文(型)生成装置、2−2…分離装置、2−3…構文(値)生成装置、2−4…転送構文生成装置、2−5…圧縮装置、2−6…併合装置、3−1…構文(型)生成装置、3−2…転送構文復号装置、3−3…抽象構文復号装置、3−4…併合装置、3−5…分離装置、3−6…解凍装置、9−1…DTD変換装置、9−2…XMLデータ変換装置、9−3…符号化装置、9−4…DTD変換装置、9−5…復号化装置、9−6…XMLデータ変換装置。

Claims (23)

  1. コンピュータで実行可能なソフトウェアにより、
    XMLデータの文法定義データからASN.1抽象構文(型)データを生成する構文(型)生成機能と、
    前記XMLデータからその要素の内容(テキスト)データおよび構造(要素名および構造)データを分離する分離機能と、
    前記構造データからASN.1抽象構文(値)データを生成する構文(値)生成機能と、
    前記ASN.1抽象構文(型)データおよび前記ASN.1抽象構文(値)データからASN.1転送構文データを生成する転送構文生成機能と、
    前記内容データを圧縮して圧縮データを生成する圧縮機能と、
    前記ASN.1転送構文データおよび前記圧縮データを併合して符号化XMLデータを生成する併合機能と、
    を実現するXMLデータの符号化システムにおける方法であって、
    前記構文(型)生成機能において、前記文法定義データにおける各要素の要素名とオペレータとを取得し、前記要素名をASN.1抽象構文の識別子に対応付け、前記オペレータをASN.1抽象構文の型に対応付け、前記識別子、前記型および他の型参照を用いて前記要素毎の型参照を生成することにより、前記ASN.1抽象構文(型)データを生成するステップと、
    前記分離機能において、前記XMLデータを取得し前記XMLデータの各要素における要素の内容(テキスト)と構造(要素名および構造)と分離し、前記内容データおよび構造データを生成するステップと、
    前記構文(値)生成機能において、前記構造データを取得し前記構造データを変換して前記ASN.1抽象構文(型)データに従う前記ASN.1抽象構文(値)データを生成するステップと、
    前記転送構文生成機能において、前記ASN.1抽象構文(値)データをASN.1で規定される符号化規則に従って変換し、前記ASN.1転送構文データを生成するステップと、
    前記圧縮機能において、前記内容データを圧縮し、前記圧縮データを生成するステップと、
    前記併合機能において、前記圧縮データと前記ASN.1転送構文データとを結合し、前記符号化XMLデータを生成するステップと、
    を含むXMLデータの符号化方法。
  2. 前記文法定義データに属性、処理命令その他前記要素以外の文法定義項目を有し、
    前記要素以外の文法定義項目を特別要素として前記要素に含めるように前記文法定義データを他の文法定義データに変換するステップと、
    前記他の文法定義データにおける定義に従うように、前記XMLデータを他のXMLデータに変換するステップと、
    をさらに有する請求項1記載のXMLデータの符号化方法。
  3. 前記文法定義データはDTDであり、
    前記DTDの要素内容には、「,」、「|」、「?」、「*」または「+」から選択される単一または複数のオペレータが含まれ、または前記オペレータを含まず、
    前記ASN.1抽象構文(型)において、
    前記「,」オペレータは、sequence型で表現し、
    前記「|」オペレータは、choice型で表現し、
    前記「?」オペレータは、sequence型とキーワード「OPTIONAL」の組み合わせで表現し、
    前記「*」オペレータは、sequence−of型で表現し、
    前記「+」オペレータは、サイズが制限されたsequence−of型で表現し、
    前記オペレータが無いときには、defined型で表現する、
    請求項1または2記載のXMLデータの符号化方法。
  4. 前記文法定義データを他の文法定義データに変換するステップにおいて、
    前記文法定義データに含まれる属性を、一意に決定できる属性要素として表現し、前記属性の親要素の子要素として扱い、
    前記属性の属性値は、「CDATA」として前記属性要素の子要素として扱い、
    前記属性が「REQUIRED」属性の場合、前記属性要素を要素で表現し、
    前記属性が「IMPLIED」属性の場合、または、前記属性にデフォルト値が定義されている場合、前記属性要素を「?」オペレータが適用された要素で表現し、
    前記XMLデータを他のXMLデータに変換するステップにおいて、
    前記XMLデータの要素に含まれる属性を、一意に決定できる属性要素として表現し、前記属性の親要素の子要素として扱う(ただし前記属性にデフォルト値が定義され、かつ前記属性の属性値が前記デフォルト値と一致する場合を除く)、
    請求項3記載のXMLデータの符号化方法。
  5. 前記ASN.1抽象構文(値)データを前記ASN.1転送構文データに変換するステップにおいて、PER規則を用いる請求項1または2記載のXMLデータの符号化方法。
  6. コンピュータで実行可能なソフトウェアにより、
    XMLデータの文法定義データからASN.1抽象構文(型)データを生成する構文(型)生成機能と、
    符号化XMLデータからASN.1転送構文データおよび圧縮データを分離する分離機能と、
    前記ASN.1転送構文データを前記ASN.1抽象構文(型)データに従うASN.1抽象構文(値)データに変換する転送構文復号機能と、
    前記ASN.1抽象構文(値)データを前記文法定義データに従う前記XMLデータの構造(要素名および構造)データに変換する抽象構文復号機能と、
    前記圧縮データを解凍して前記XMLデータの要素の内容(テキスト)データを生成する解凍機能と、
    前記構造データおよび内容データを併合して前記XMLデータを生成する併合機能と、
    を実現する符号化XMLデータの復号化システムにおける方法であって、
    前記構文(型)生成機能において、前記文法定義データにおける各要素の要素名とオペレータとを取得し、前記要素名をASN.1抽象構文の識別子に対応付け、前記オペレータをASN.1抽象構文の型に対応付け、前記識別子、前記型および他の型参照を用いて前記要素毎の型参照を生成することにより、前記ASN.1抽象構文(型)データを生成するステップと、
    前記分離機能において、前記符号化XMLデータを取得し、前記符号化XMLデータを分離して前記ASN.1転送構文データおよび前記圧縮データを生成するステップと、
    前記転送構文復号機能において、前記ASN.1転送構文データを取得し、前記ASN.1抽象構文(型)データに従うASN.1抽象構文(値)データを生成するステップと、
    前記抽象構文復号機能において、前記ASN.1抽象構文(値)データを取得し、前記文法定義データに従うXMLデータの要素の構造(要素名および構造データを生成するステップと、
    前記解凍機能において、前記圧縮データを解凍し、前記XMLデータの要素の内容(テキスト)データを生成するステップと、
    前記併合機能において、前記内容データと前記構造データとを併合し、前記XMLデータを生成するステップと、
    を含む符号化されたXMLデータの復号化方法。
  7. 前記文法定義データに属性、処理命令その他前記要素以外の文法定義項目を有し、
    前記要素以外の文法定義項目を特別要素として前記要素に含めるように前記文法定義データを他の文法定義データに変換するステップと、
    前記文法定義データにおける定義に従うように、前記復号化されたXMLデータを他のXMLデータに変換するステップと、
    をさらに有する請求項6記載の符号化されたXMLデータの復号化方法。
  8. 前記文法定義データはDTDであり、
    前記DTDの要素内容には、「,」、「|」、「?」、「*」または「+」から選択される単一または複数のオペレータが含まれ、または前記オペレータを含まず、
    前記ASN.1抽象構文(型)において、
    前記「,」オペレータは、sequence型で表現し、
    前記「|」オペレータは、choice型で表現し、
    前記「?」オペレータは、sequence型とキーワード「OPTIONAL」の組み合わせで表現し、
    前記「*」オペレータは、sequence−of型で表現し、
    前記「+」オペレータは、サイズが制限されたsequence−of型で表現し、
    前記オペレータが無いときには、defined型で表現する、
    請求項6または7記載の符号化されたXMLデータの復号化方法。
  9. 前記文法定義データを他の文法定義データに変換するステップにおいて、
    前記文法定義データに含まれる属性を、一意に決定できる属性要素として表現し前記属性の親要素の子要素として扱い、
    前記属性の属性値は、「CDATA」として前記属性要素の子要素として扱い、
    前記属性が「REQUIRED」属性の場合、前記属性要素を要素で表現し、
    前記属性が「IMPLIED」属性の場合、または、前記属性にデフォルト値が定義されている場合、前記属性要素を「?」オペレータが適用された要素で表現し、
    前記復号化されたXMLデータを他のXMLデータに変換するステップにおいて、
    前記復号化されたXMLデータの要素に子要素として含まれる前記属性要素を、前記要素の属性またはその属性値に変換する、
    請求項8記載の符号化されたXMLデータの復号化方法。
  10. 前記ASN.1転送構文データを前記ASN.1抽象構文(値)データに変換するステップにおいて、PER規則を用いる請求項6または7記載の符号化されたXMLデータの復号化方法。
  11. コンピュータで実行可能なソフトウェアにより、
    XMLデータの文法定義データからASN.1抽象構文(型)データを生成する構文(型)生成機能と、
    前記XMLデータからその要素の内容(テキスト)データおよび構造(要素名および構造)データを分離する分離機能と、
    前記構造データからASN.1抽象構文(値)データを生成する構文(値)生成機能と、
    前記ASN.1抽象構文(型)データおよび前記ASN.1抽象構文(値)データからASN.1転送構文データを生成する転送構文生成機能と、
    前記内容データを圧縮して圧縮データを生成する圧縮機能と、
    前記ASN.1転送構文データおよび前記圧縮データを併合して符号化XMLデータを生成する併合機能と、
    を実現するXMLデータの符号化システムであって、
    前記構文(型)生成機能は、前記文法定義データにおける各要素の要素名とオペレータとを取得し、前記要素名をASN.1抽象構文の識別子に対応付け、前記オペレータをASN.1抽象構文の型に対応付け、前記識別子、前記型および他の型参照を用いて前記要素毎の型参照を生成することにより、前記ASN.1抽象構文(型)データを生成するも のであり
    前記分離機能は、前記XMLデータを取得し前記XMLデータの各要素における要素の内容(テキスト)と構造(要素名および構造)と分離し、前記内容データおよび構造データを生成するものであり
    前記構文(値)生成機能は、前記構造データを取得し前記構造データを変換して前記ASN.1抽象構文(型)データに従う前記ASN.1抽象構文(値)データを生成するものであり
    前記転送構文生成機能は、前記ASN.1抽象構文(値)データをASN.1で規定される符号化規則に従って変換し、前記ASN.1転送構文データを生成するものであり
    前記圧縮機能は、前記内容データを圧縮し、前記圧縮データを生成するものであり
    前記併合機能は、前記圧縮データと前記ASN.1転送構文データとを結合し、前記符号化XMLデータを生成するものである、
    XMLデータの符号化システム。
  12. 前記文法定義データに属性、処理命令その他前記要素以外の文法定義項目を有し、
    前記要素以外の文法定義項目を特別要素として前記要素に含めるように前記文法定義データを他の文法定義データに変換する機能と、
    前記他の文法定義データにおける定義に従うように、前記XMLデータを他のXMLデータに変換する機能と、
    コンピュータで実行可能なソフトウェアによりさらに実現する請求項11記載のXMLデータの符号化システム。
  13. 前記文法定義データはDTDであり、
    前記DTDの要素内容には、「,」、「|」、「?」、「*」または「+」から選択される単一または複数のオペレータが含まれ、または前記オペレータを含まず、
    前記ASN.1抽象構文(型)において、
    前記「,」オペレータは、sequence型で表現し、
    前記「|」オペレータは、choice型で表現し、
    前記「?」オペレータは、sequence型とキーワード「OPTIONAL」の組み合わせで表現し、
    前記「*」オペレータは、sequence−of型で表現し、
    前記「+」オペレータは、サイズが制限されたsequence−of型で表現し、
    前記オペレータが無いときには、defined型で表現する、
    請求項11または12記載のXMLデータの符号化システム。
  14. 前記文法定義データを他の文法定義データに変換する機能において、
    前記文法定義データに含まれる属性を、一意に決定できる属性要素として表現し、前記属性の親要素の子要素として扱い、
    前記属性の属性値は、「CDATA」として前記属性要素の子要素として扱い、
    前記属性が「REQUIRED」属性の場合、前記属性要素を要素で表現し、
    前記属性が「IMPLIED」属性の場合、または、前記属性にデフォルト値が定義されている場合、前記属性要素を「?」オペレータが適用された要素で表現し、
    前記XMLデータを他のXMLデータに変換する手段において、
    前記XMLデータの要素に含まれる属性を、一意に決定できる属性要素として表現し、前記属性の親要素の子要素として扱う(ただし前記属性にデフォルト値が定義され、かつ前記属性の属性値が前記デフォルト値と一致する場合を除く)、
    請求項13記載のXMLデータの符号化システム。
  15. 前記ASN.1抽象構文(値)データを前記ASN.1転送構文データに変換する機能において、PER規則を用いる請求項11または12記載のXMLデータの符号化システム。
  16. コンピュータで実行可能なソフトウェアにより、
    XMLデータの文法定義データからASN.1抽象構文(型)データを生成する構文(型)生成機能と、
    符号化XMLデータからASN.1転送構文データおよび圧縮データを分離する分離機能と、
    前記ASN.1転送構文データを前記ASN.1抽象構文(型)データに従うASN.1抽象構文(値)データに変換する転送構文復号機能と、
    前記ASN.1抽象構文(値)データを前記文法定義データに従う前記XMLデータの構造(要素名および構造)データに変換する抽象構文復号機能と、
    前記圧縮データを解凍して前記XMLデータの要素の内容(テキスト)データを生成する解凍機能と、
    前記構造データおよび内容データを併合して前記XMLデータを生成する併合機能と、
    を実現する符号化XMLデータの復号化システムであって、
    前記構文(型)生成機能は、前記文法定義データにおける各要素の要素名とオペレータとを取得し、前記要素名をASN.1抽象構文の識別子に対応付け、前記オペレータをASN.1抽象構文の型に対応付け、前記識別子、前記型および他の型参照を用いて前記要素毎の型参照を生成することにより、前記ASN.1抽象構文(型)データを生成するものであり
    前記分離機能は、前記符号化XMLデータを取得し、前記符号化XMLデータを分離して前記ASN.1転送構文データおよび前記圧縮データを生成するものであり
    前記転送構文復号機能は、前記ASN.1転送構文データを取得し、前記ASN.1抽象構文(型)データに従うASN.1抽象構文(値)データを生成するものであり
    前記抽象構文復号機能は、前記ASN.1抽象構文(値)データを取得し、前記文法定義データに従うXMLデータの要素の構造(要素名および構造データを生成するものであり
    前記解凍機能は、前記圧縮データを解凍し、前記XMLデータの要素の内容(テキスト)データを生成するものであり
    前記併合機能は、前記内容データと前記構造データとを併合し、前記XMLデータを生成するものである
    符号化されたXMLデータの復号化システム。
  17. 前記文法定義データに属性、処理命令その他前記要素以外の文法定義項目を有し、
    前記要素以外の文法定義項目を特別要素として前記要素に含めるように前記文法定義データを他の文法定義データに変換する機能と、
    前記文法定義データにおける定義に従うように、前記復号化されたXMLデータを他のXMLデータに変換する機能と、
    コンピュータで実行可能なソフトウェアによりさらに実現する請求項16記載の符号化されたXMLデータの復号化システム。
  18. 前記文法定義データはDTDであり、
    前記DTDの要素内容には、「,」、「|」、「?」、「*」または「+」から選択される単一または複数のオペレータが含まれ、または前記オペレータを含まず、
    前記ASN.1抽象構文(型)において、
    前記「,」オペレータは、sequence型で表現し、
    前記「|」オペレータは、choice型で表現し、
    前記「?」オペレータは、sequence型とキーワード「OPTIONAL」の組み合わせで表現し、
    前記「*」オペレータは、sequence−of型で表現し、
    前記「+」オペレータは、サイズが制限されたsequence−of型で表現し、
    前記オペレータが無いときには、defined型で表現する、
    請求項16または17記載の符号化されたXMLデータの復号化システム。
  19. 前記文法定義データを他の文法定義データに変換する機能において、
    前記文法定義データに含まれる属性を、一意に決定できる属性要素として表現し、前記属性の親要素の子要素として扱い、
    前記属性の属性値は、「CDATA」として前記属性要素の子要素として扱い、
    前記属性が「REQUIRED」属性の場合、前記属性要素を要素で表現し、
    前記属性が「IMPLIED」属性の場合、または、前記属性にデフォルト値が定義されている場合、前記属性要素を「?」オペレータが適用された要素で表現し、
    前記復号化されたXMLデータを他のXMLデータに変換する手段において、
    前記復号化されたXMLデータの要素に子要素として含まれる前記属性要素を、前記要素の属性またはその属性値に変換する、
    請求項18記載の符号化されたXMLデータの復号化システム。
  20. 前記ASN.1転送構文データを前記ASN.1抽象構文(値)データに変換する機能において、PER規則を用いる請求項16または17記載の符号化されたXMLデータの復号化システム。
  21. XMLデータの文法定義データからASN.1抽象構文(型)データを生成する構文(型)生成機能と、
    前記XMLデータからその要素の内容(テキスト)データおよび構造(要素名および構造)データを分離する分離機能と、
    前記構造データからASN.1抽象構文(値)データを生成する構文(値)生成機能と、
    前記ASN.1抽象構文(型)データおよび前記ASN.1抽象構文(値)データからASN.1転送構文データを生成する転送構文生成機能と、
    前記内容データを圧縮して圧縮データを生成する圧縮機能と、
    前記ASN.1転送構文データおよび前記圧縮データを併合して符号化XMLデータを生成する併合機能と、
    を実現するコンピュータで実行可能なプログラムであって、
    前記構文(型)生成機能は、前記文法定義データにおける各要素の要素名とオペレータとを取得し、前記要素名をASN.1抽象構文の識別子に対応付け、前記オペレータをASN.1抽象構文の型に対応付け、前記識別子、前記型および他の型参照を用いて前記要素毎の型参照を生成することにより、前記ASN.1抽象構文(型)データを生成するものであり
    前記分離機能は、前記XMLデータを取得し前記XMLデータの各要素における要素の内容(テキスト)と構造(要素名および構造)と分離し、前記内容データおよび構造データを生成するものであり
    前記構文(値)生成機能は、前記構造データを取得し前記構造データを変換して前記ASN.1抽象構文(型)データに従う前記ASN.1抽象構文(値)データを生成するものであり
    前記転送構文生成機能は、前記ASN.1抽象構文(値)データをASN.1で規定される符号化規則に従って変換し、前記ASN.1転送構文データを生成するものであり
    前記圧縮機能は、前記内容データを圧縮し、前記圧縮データを生成するものであり
    前記併合機能は、前記圧縮データと前記ASN.1転送構文データとを結合し、前記符号化XMLデータを生成するものである、
    プログラム。
  22. XMLデータの文法定義データからASN.1抽象構文(型)データを生成する構文(型)生成機能と、
    符号化XMLデータからASN.1転送構文データおよび圧縮データを分離する分離機能と、
    前記ASN.1転送構文データを前記ASN.1抽象構文(型)データに従うASN.1抽象構文(値)データに変換する転送構文復号機能と、
    前記ASN.1抽象構文(値)データを前記文法定義データに従う前記XMLデータの 構造(要素名および構造)データに変換する抽象構文復号機能と、
    前記圧縮データを解凍して前記XMLデータの要素の内容(テキスト)データを生成する解凍機能と、
    前記構造データおよび内容データを併合して前記XMLデータを生成する併合機能と、
    を実現するコンピュータで実行可能なプログラムであって、
    前記構文(型)生成機能は、前記文法定義データにおける各要素の要素名とオペレータとを取得し、前記要素名をASN.1抽象構文の識別子に対応付け、前記オペレータをASN.1抽象構文の型に対応付け、前記識別子、前記型および他の型参照を用いて前記要素毎の型参照を生成することにより、前記ASN.1抽象構文(型)データを生成するものであり
    前記分離機能は、前記符号化XMLデータを取得し、前記符号化XMLデータを分離して前記ASN.1転送構文データおよび前記圧縮データを生成するものであり
    前記転送構文復号機能は、前記ASN.1転送構文データを取得し、前記ASN.1抽象構文(型)データに従うASN.1抽象構文(値)データを生成するものであり
    前記抽象構文復号機能は、前記ASN.1抽象構文(値)データを取得し、前記文法定義データに従うXMLデータの要素の構造(要素名および構造データを生成するものであり
    前記解凍機能は、前記圧縮データを解凍し、前記XMLデータの要素の内容(テキスト)データを生成するものであり
    前記併合機能は、前記内容データと前記構造データとを併合し、前記XMLデータを生成するものである
    プログラム。
  23. コンピュータ読取可能な記録媒体であって、
    XMLデータの文法定義データからASN.1抽象構文(型)データを生成する構文(型)生成機能と、
    前記XMLデータからその要素の内容(テキスト)データおよび構造(要素名および構造)データを分離する分離機能と、
    前記構造データからASN.1抽象構文(値)データを生成する構文(値)生成機能と、
    前記ASN.1抽象構文(型)データおよび前記ASN.1抽象構文(値)データからASN.1転送構文データを生成する転送構文生成機能と、
    前記内容データを圧縮して圧縮データを生成する圧縮機能と、
    前記ASN.1転送構文データおよび前記圧縮データを併合して符号化XMLデータを生成する併合機能と、
    をコンピュータで実現し、
    前記構文(型)生成機能は、前記文法定義データにおける各要素の要素名とオペレータとを取得し、前記要素名をASN.1抽象構文の識別子に対応付け、前記オペレータをASN.1抽象構文の型に対応付け、前記識別子、前記型および他の型参照を用いて前記要素毎の型参照を生成することにより、前記ASN.1抽象構文(型)データを生成するものであり
    前記分離機能は、前記XMLデータを取得し前記XMLデータの各要素における要素の内容(テキスト)と構造(要素名および構造)と分離し、前記内容データおよび構造データを生成するものであり
    前記構文(値)生成機能は、前記構造データを取得し前記構造データを変換して前記ASN.1抽象構文(型)データに従う前記ASN.1抽象構文(値)データを生成するものであり
    前記転送構文生成機能は、前記ASN.1抽象構文(値)データをASN.1で規定される符号化規則に従って変換し、前記ASN.1転送構文データを生成するものであり
    前記圧縮機能は、前記内容データを圧縮し、前記圧縮データを生成するものであり
    前記併合機能は、前記圧縮データと前記ASN.1転送構文データとを結合し、前記符 号化XMLデータを生成するものである、
    第1プログラム、または、
    XMLデータの文法定義データからASN.1抽象構文(型)データを生成する構文(型)生成機能と、
    符号化XMLデータからASN.1転送構文データおよび圧縮データを分離する分離機能と、
    前記ASN.1転送構文データを前記ASN.1抽象構文(型)データに従うASN.1抽象構文(値)データに変換する転送構文復号機能と、
    前記ASN.1抽象構文(値)データを前記文法定義データに従う前記XMLデータの構造(要素名および構造)データに変換する抽象構文復号機能と、
    前記圧縮データを解凍して前記XMLデータの要素の内容(テキスト)データを生成する解凍機能と、
    前記構造データおよび内容データを併合して前記XMLデータを生成する併合機能と、
    をコンピュータで実現し、
    前記構文(型)生成機能は、前記文法定義データにおける各要素の要素名とオペレータとを取得し、前記要素名をASN.1抽象構文の識別子に対応付け、前記オペレータをASN.1抽象構文の型に対応付け、前記識別子、前記型および他の型参照を用いて前記要素毎の型参照を生成することにより、前記ASN.1抽象構文(型)データを生成するものであり
    前記分離機能は、前記符号化XMLデータを取得し、前記符号化XMLデータを分離して前記ASN.1転送構文データおよび前記圧縮データを生成するものであり
    前記転送構文復号機能は、前記ASN.1転送構文データを取得し、前記ASN.1抽象構文(型)データに従うASN.1抽象構文(値)データを生成するものであり
    前記抽象構文復号機能は、前記ASN.1抽象構文(値)データを取得し、前記文法定義データに従うXMLデータの要素の構造(要素名および構造データを生成するものであり
    前記解凍機能は、前記圧縮データを解凍し、前記XMLデータの要素の内容(テキスト)データを生成するものであり
    前記併合機能は、前記内容データと前記構造データとを併合し、前記XMLデータを生成するものである、
    第2プログラム、
    の何れかのプログラムが記録された記録媒体。
JP2001027462A 2001-02-02 2001-02-02 Xmlデータの符号化方法、符号化されたxmlデータの復号化方法、xmlデータの符号化システム、符号化されたxmlデータの復号化システム、プログラムおよび記録媒体 Expired - Fee Related JP3894280B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001027462A JP3894280B2 (ja) 2001-02-02 2001-02-02 Xmlデータの符号化方法、符号化されたxmlデータの復号化方法、xmlデータの符号化システム、符号化されたxmlデータの復号化システム、プログラムおよび記録媒体
US10/047,958 US7143397B2 (en) 2001-02-02 2002-01-15 XML data encoding and decoding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001027462A JP3894280B2 (ja) 2001-02-02 2001-02-02 Xmlデータの符号化方法、符号化されたxmlデータの復号化方法、xmlデータの符号化システム、符号化されたxmlデータの復号化システム、プログラムおよび記録媒体

Publications (2)

Publication Number Publication Date
JP2002244894A JP2002244894A (ja) 2002-08-30
JP3894280B2 true JP3894280B2 (ja) 2007-03-14

Family

ID=18892112

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001027462A Expired - Fee Related JP3894280B2 (ja) 2001-02-02 2001-02-02 Xmlデータの符号化方法、符号化されたxmlデータの復号化方法、xmlデータの符号化システム、符号化されたxmlデータの復号化システム、プログラムおよび記録媒体

Country Status (2)

Country Link
US (1) US7143397B2 (ja)
JP (1) JP3894280B2 (ja)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003230751A1 (en) * 2002-03-29 2003-10-13 Bank One, Delaware, N.A. System and process for performing purchase transaction using tokens
US7669120B2 (en) * 2002-06-21 2010-02-23 Microsoft Corporation Method and system for encoding a mark-up language document
WO2004073278A1 (en) * 2003-02-14 2004-08-26 Research In Motion Limited System and method of compact messaging in network communications
ATE405032T1 (de) * 2003-02-14 2008-08-15 Research In Motion Ltd System und verfahren zum komprimieren von strukturierter definition-sprache
JP3815567B2 (ja) 2003-03-31 2006-08-30 日本電気株式会社 コンピュータシステム、コンピュータプログラム、コンピュータ間の通信方法、構造化文書の符号化方法、符号化された構造化文書の復号方法
JP2005018672A (ja) * 2003-06-30 2005-01-20 Hitachi Ltd 構造化文書の圧縮方法
US7720794B2 (en) * 2003-08-05 2010-05-18 International Business Machines Corporation Identifying resource and data instances in management systems
GB2412978A (en) * 2004-04-07 2005-10-12 Hewlett Packard Development Co Method and system for compressing and decompressing hierarchical data structures
CA2563431A1 (en) * 2004-04-09 2005-10-20 Huawei Technologies Co., Ltd. Asn.1 protocol processor and method for asn.1 protocol processing
US7885980B2 (en) 2004-07-02 2011-02-08 Oracle International Corporation Mechanism for improving performance on XML over XML data using path subsetting
US8769401B2 (en) * 2004-08-05 2014-07-01 Digi International Inc. Method for compressing XML documents into valid XML documents
US20060075391A1 (en) * 2004-10-05 2006-04-06 Esmonde Laurence G Jr Distributed scenario generation
US8346737B2 (en) * 2005-03-21 2013-01-01 Oracle International Corporation Encoding of hierarchically organized data for efficient storage and processing
US7461335B2 (en) 2005-05-31 2008-12-02 Sap Ag Dynamic conversion of data into markup language format
US7933928B2 (en) 2005-12-22 2011-04-26 Oracle International Corporation Method and mechanism for loading XML documents into memory
US8024427B2 (en) * 2006-01-09 2011-09-20 Microsoft Corporation Dynamic storage of documents
US7593949B2 (en) * 2006-01-09 2009-09-22 Microsoft Corporation Compression of structured documents
US7565339B2 (en) * 2006-03-31 2009-07-21 Agiledelta, Inc. Knowledge based encoding of data
US9460064B2 (en) * 2006-05-18 2016-10-04 Oracle International Corporation Efficient piece-wise updates of binary encoded XML data
US7405677B2 (en) * 2006-08-08 2008-07-29 International Business Machines Corporation Apparatus, system, and method for incremental encoding conversion of XML data using Java
US20080077606A1 (en) * 2006-09-26 2008-03-27 Motorola, Inc. Method and apparatus for facilitating efficient processing of extensible markup language documents
US7627566B2 (en) * 2006-10-20 2009-12-01 Oracle International Corporation Encoding insignificant whitespace of XML data
US7739251B2 (en) * 2006-10-20 2010-06-15 Oracle International Corporation Incremental maintenance of an XML index on binary XML data
US8010889B2 (en) * 2006-10-20 2011-08-30 Oracle International Corporation Techniques for efficient loading of binary XML data
JP4976109B2 (ja) * 2006-11-09 2012-07-18 三菱電機株式会社 Sipメッセージ圧縮解凍モジュール生成装置、通信装置およびsipメッセージ圧縮解凍方法
US9953103B2 (en) * 2006-11-16 2018-04-24 Oracle International Corporation Client processing for binary XML in a database system
US7836396B2 (en) * 2007-01-05 2010-11-16 International Business Machines Corporation Automatically collecting and compressing style attributes within a web document
US7668860B2 (en) * 2007-04-02 2010-02-23 Business Objects Software Ltd. Apparatus and method for constructing and using a semantic abstraction for querying hierarchical data
US7747558B2 (en) * 2007-06-07 2010-06-29 Motorola, Inc. Method and apparatus to bind media with metadata using standard metadata headers
KR100950026B1 (ko) 2007-08-31 2010-03-29 (주)지슨 에이에스엔.1 을 이용하여 데이터를 연동하는 시스템과데이터 연동 장치, 에이에스엔.1을 이용하여 이종시스템으로 송출할 데이터를 인코딩하는 방법 및 이종시스템과의 데이터 연동 방법
US7831540B2 (en) * 2007-10-25 2010-11-09 Oracle International Corporation Efficient update of binary XML content in a database system
US7991768B2 (en) 2007-11-08 2011-08-02 Oracle International Corporation Global query normalization to improve XML index based rewrites for path subsetted index
US8250062B2 (en) 2007-11-09 2012-08-21 Oracle International Corporation Optimized streaming evaluation of XML queries
US8543898B2 (en) 2007-11-09 2013-09-24 Oracle International Corporation Techniques for more efficient generation of XML events from XML data sources
US9842090B2 (en) 2007-12-05 2017-12-12 Oracle International Corporation Efficient streaming evaluation of XPaths on binary-encoded XML schema-based documents
US8145794B2 (en) * 2008-03-14 2012-03-27 Microsoft Corporation Encoding/decoding while allowing varying message formats per message
KR101419885B1 (ko) 2008-04-10 2014-07-16 (주)휴맥스 적응적 복호화 장치 및 방법
US8429196B2 (en) 2008-06-06 2013-04-23 Oracle International Corporation Fast extraction of scalar values from binary encoded XML
EP2161667A1 (en) * 2008-09-08 2010-03-10 Thomson Licensing, Inc. Method and device for encoding elements
FR2943441A1 (fr) 2009-03-18 2010-09-24 Canon Kk Procede de codage ou decodage d'un document structure a l'aide d'un schema xml, dispositif et structure de donnees associes
US8997207B2 (en) * 2009-09-24 2015-03-31 Sap Ag Modular secure data transfer
US20110107201A1 (en) * 2009-10-29 2011-05-05 Microsoft Corporation Representing complex document structure via simpler structure through isomorphism
US8255372B2 (en) 2010-01-18 2012-08-28 Oracle International Corporation Efficient validation of binary XML data
EP2570921A1 (de) * 2011-06-14 2013-03-20 Siemens Aktiengesellschaft Verfahren und Vorrichtungen zum Austausch von Daten
US10756759B2 (en) 2011-09-02 2020-08-25 Oracle International Corporation Column domain dictionary compression
US8812523B2 (en) 2012-09-28 2014-08-19 Oracle International Corporation Predicate result cache
KR102126018B1 (ko) 2013-11-06 2020-06-23 삼성전자주식회사 필드의 위치 정보를 포함하는 패킷을 처리하는 송, 수신 노드의 동작 방법 및 필드의 위치 정보를 포함하는 패킷

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3305191B2 (ja) 1996-03-19 2002-07-22 富士通株式会社 文書管理装置及びデータ圧縮方法及びデータ復元方法
KR19980033054A (ko) * 1996-10-23 1998-07-25 윌리엄비.켐플러 프로그램 가능 메모리 액세스
JP2925084B1 (ja) * 1998-07-10 1999-07-26 トーヨーテクノ株式会社 開口レーザーラインマーカー
JP4003854B2 (ja) 1998-09-28 2007-11-07 富士通株式会社 データ圧縮装置及び復元装置並びにその方法
JP2000357568A (ja) * 1999-06-14 2000-12-26 Harness Syst Tech Res Ltd 放電式ランプのソケット
US6772413B2 (en) * 1999-12-21 2004-08-03 Datapower Technology, Inc. Method and apparatus of data exchange using runtime code generator and translator
US7024413B2 (en) * 2000-07-26 2006-04-04 International Business Machines Corporation Method of externalizing legacy database in ASN.1-formatted data into XML format

Also Published As

Publication number Publication date
JP2002244894A (ja) 2002-08-30
US20030018466A1 (en) 2003-01-23
US7143397B2 (en) 2006-11-28

Similar Documents

Publication Publication Date Title
JP3894280B2 (ja) Xmlデータの符号化方法、符号化されたxmlデータの復号化方法、xmlデータの符号化システム、符号化されたxmlデータの復号化システム、プログラムおよび記録媒体
Girardot et al. Millau: an encoding format for efficient representation and exchange of XML over the Web
US6883137B1 (en) System and method for schema-driven compression of extensible mark-up language (XML) documents
US20020029229A1 (en) Systems and methods for data compression
US7739586B2 (en) Encoding of markup language data
US7808975B2 (en) System and method for history driven optimization of web services communication
KR100614677B1 (ko) 구조화된 문서를 압축/복원하기 위한 방법
US8819287B2 (en) System and method for compressing URL request parameters
EP1803225A1 (en) Adaptive compression scheme
JP4653381B2 (ja) 構造化文書の圧縮/解凍方法
JP2004227579A (ja) Xmlコードをバイナリコードへ変換する方法およびシステム
JP2005538436A (ja) 構造化された文章、特にxml文章の符号化/復号化のための方法及び装置
CN104199951B (zh) 网页处理方法及装置
KR20020069229A (ko) 텍스트 도큐먼트들을 압축하기 위한 방법 및 장치
US20060184547A1 (en) Method and system for fast encoding of data documents
US7676742B2 (en) System and method for processing of markup language information
US20060184562A1 (en) Method and system for decoding encoded documents
KR100653189B1 (ko) 엑스엠엘 문서 변환 장치 및 그 방법
RU2294012C2 (ru) Структура данных и способы преобразования потока битов в электронный документ и формирования потока битов из электронного документа на ее основе
US10762281B1 (en) Prefix compression for keyed values
League et al. Type-based compression of xml data
Alakuijala et al. RFC 7932: Brotli Compressed Data Format
Bharathi et al. A plain-text incremental compression (pic) technique with fast lookup ability
JP2005284903A (ja) 文書符号化装置、文書復号化装置、文書符号化方法及び文書復号化方法
Leighton et al. A grammar-based approach for compressing XML

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051107

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060207

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060508

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061114

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20061117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061205

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131222

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees