JP2005056363A - Xml information transmitter - Google Patents

Xml information transmitter Download PDF

Info

Publication number
JP2005056363A
JP2005056363A JP2003289473A JP2003289473A JP2005056363A JP 2005056363 A JP2005056363 A JP 2005056363A JP 2003289473 A JP2003289473 A JP 2003289473A JP 2003289473 A JP2003289473 A JP 2003289473A JP 2005056363 A JP2005056363 A JP 2005056363A
Authority
JP
Japan
Prior art keywords
serialized dom
serialized
dom block
character string
indicating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003289473A
Other languages
Japanese (ja)
Inventor
Atsushi Sakakibara
淳 榊原
Mikio Oda
美樹男 織田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Media Fusion Co Ltd
Original Assignee
Media Fusion Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Media Fusion Co Ltd filed Critical Media Fusion Co Ltd
Priority to JP2003289473A priority Critical patent/JP2005056363A/en
Publication of JP2005056363A publication Critical patent/JP2005056363A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To convert a DOM indicative of the structure of a structured document such as an XML document, or the like into the serialized DOM considering transfer without depending on the individual properties of the structured documents; and to access the serialized DOM to an element without undergoing processes for re-purse or deserialization. <P>SOLUTION: The structured XML document such as XML document information is divided into a serialized DOM block group and character sequence information. A serialized DOM generation section has: an element type provision means; a master element reference position provision means; a slave element reference position provision means; an attribute information reference position provision means; a next element reference position provision means; a character sequence leading position provision means; and a character sequence length provision means. The serialized DOM generation section generates a serialized DOM block and finally generates a serialized DOM block body. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、SGML(Standard Generalized Markup Language)やXML(Extensible Markup Language)などの構造化文書のための圧縮・復元に係る技術に関するものである。 The present invention relates to a technology related to compression / decompression for structured documents such as SGML (Standard Generalized Markup Language) and XML (Extensible Markup Language).

前記、SGMLやXMLなどの構造化文書は、データ構造をタグとしてドキュメントに埋め込む形式であるために、データ構造が理解しやすく様々なアプリケーションが考えられる一方において、データ構造に意味を付与するために、一般的に冗長な記述となりデータ量は大幅に増大する。
データ転送およびデータ蓄積のことを考えた場合にはデータは圧縮されることが望ましく、その方法として一般的に用いられるのは、バイナリーデータとして圧縮し保存することである。しかし、これは計算機に依存する圧縮形式であるために、汎用的な方法ではないという欠点を有する。
The structured document such as SGML or XML has a format in which the data structure is embedded in the document as a tag, so that the data structure is easy to understand and various applications can be considered. On the other hand, in order to give meaning to the data structure In general, the description becomes redundant, and the amount of data greatly increases.
In consideration of data transfer and data storage, it is desirable that the data is compressed, and the method generally used is compression and storage as binary data. However, since this is a compression format depending on a computer, it has a disadvantage that it is not a general-purpose method.

このような問題を解決するために、近年において、たとえば特開2003−44459におけるように、構造化データの特徴を生かした圧縮方法が提案されている。すなわち、タグである構造化データとテキストデータであるコンテンツデータを分離して保存するという方法である。前記タグである構造化データを符号化し符号列を作成し、また前記テキストデータであるコンテンツデータを文字列として作成し、これらの両者の対応づけをするだけで、構造化文書を圧縮できるというものである。ことに、タグを符号化することによる圧縮の効果は大きい。また、コンテンツデータの文字列を圧縮することにより、さらに圧縮の効果が得られる。
公開番号:2003−44459
In order to solve such a problem, in recent years, for example, as disclosed in Japanese Patent Application Laid-Open No. 2003-44459, a compression method utilizing the characteristics of structured data has been proposed. That is, the structured data as tags and the content data as text data are stored separately. A structured document can be compressed simply by encoding the structured data, which is the tag, and creating a code string, creating the content data, which is the text data, as a character string, and associating the two. It is. In particular, the compression effect by encoding the tag is great. Further, by compressing the character string of the content data, a further compression effect can be obtained.
Publication number: 2003-44459

しかし、この圧縮アルゴリズムは、圧縮される構造化文書の特性に依存する圧縮方法であるという問題点を有する。このために、前記の圧縮方法においては、圧縮後に再びオリジナルの構造化XMLドキュメントにアクセスするためには、特殊な復元の過程が必要となるという問題点があげられる。   However, this compression algorithm has the problem that it is a compression method that depends on the characteristics of the structured document to be compressed. For this reason, the above-described compression method has a problem that a special decompression process is required to access the original structured XML document again after compression.

このような事情に鑑み、本発明においては、特に、XMLドキュメントに着目し、XMLドキュメントを表すDOM(Document Object Model)を転送を考慮したバイトストリームにシリアライズするという、汎用的な圧縮アルゴリズムを提供する。このために、そのシリアライズの過程においてデータ転送量を圧縮できるだけでなく、同時にデータ受信側において、前記シリアライズされたDOMが、再度のパースおよびデシリアライズの過程を経ることなく、要素へのアクセスを可能とする。この前記汎用的アルゴリズムは、構造化文書の圧縮技術として標準化できるように、構造化文書の性質に依存しないアルゴリズムを提供することを目的とする。   In view of such circumstances, the present invention provides a general-purpose compression algorithm that serializes a DOM (Document Object Model) representing an XML document into a byte stream that considers transfer, particularly focusing on the XML document. . For this reason, not only can the data transfer amount be compressed during the serialization process, but at the same time, the serialized DOM can access the element without going through the re-parsing and deserialization process at the data receiving side. And This general-purpose algorithm aims to provide an algorithm that does not depend on the properties of the structured document so that it can be standardized as a compression technique for the structured document.

上記問題を解決するための発明のひとつは、XMLドキュメント情報からシリアライズDOMブロック体を生成するシリアライズDOMブロック体生成装置であって、XMLドキュメント情報を取得するXMLドキュメント情報取得部と、シリアライズDOMブロック体生成部と、シリアライズDOMブロック体出力部と、を有し、前記シリアライズDOMブロック体生成部は、シリアライズDOM生成手段と、文字列情報生成手段と、シリアライズDOMブロック生成手段と、シリアライズDOMブロック群生成手段と、を有し、   One of the inventions for solving the above-mentioned problem is a serialized DOM block body generating device for generating a serialized DOM block body from XML document information, an XML document information acquiring unit for acquiring XML document information, and a serialized DOM block body A generation unit; and a serialized DOM block body output unit. The serialized DOM block body generation unit includes a serialized DOM generation unit, a character string information generation unit, a serialized DOM block generation unit, and a serialized DOM block group generation. Means,

前記シリアライズDOMブロック体は、シリアライズDOMブロック群と、文字列情報とからなり、前記シリアライズDOMブロック群は、シリアライズDOMブロックからなり、前記シリアライズDOMブロックは、シリアライズDOMからなり、前記シリアライズDOM生成部は、以下の(1)から(7)の手段を有するシリアライズDOMブロック体生成装置。
(1)自身が属するシリアライズDOMブロックが示す要素の型を示す属性を与える要素型付与手段
(2)自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき親要素を示す親シリアライズDOMブロックの位置を示す属性を与える親要素参照位置付与手段
(3)自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき子要素を示す子要素シリアライズDOMブロックの位置を示す属性を与える子要素参照位置付与手段
(4)自身が属するシリアライズDOMブロックに含まれる要素の内、属性を有する要素がある場合に、その要素の属性を示すシリアライズDOMのシリアライズDOMブロック群中での位置を示す属性を与える属性情報参照位置付与手段
(5)自身が属するシリアライズDOMブロックで示す要素の次に続く要素を示す次要素シリアライズDOMブロックのシリアライズDOMブロック群中での位置を示す属性を与える次要素参照位置付与手段
(6)自身が属するシリアライズDOMブロックが値を有する場合に、その値を示す前記文字列情報中での文字列の先頭位置を示す属性を与える文字列先頭位置付与手段と、
(7)自身が属するシリアライズDOMブロックが値を有する場合に、その値を示す前記文字列情報中での文字列の長さを示す属性を与える文字列長付与手段と
を有する。
The serialized DOM block body includes a serialized DOM block group and character string information. The serialized DOM block group includes a serialized DOM block. The serialized DOM block includes a serialized DOM. The serialized DOM generation unit includes: A serialized DOM block body generating device having the following means (1) to (7).
(1) Element type giving means for giving an attribute indicating the type of an element indicated by the serialized DOM block to which the serialized DOM block belongs. (2) A parent serialized DOM block showing a parent element to which the serialized DOM block to which the serialized belongs refers should be referenced. Parent element reference position providing means for giving an attribute indicating the position of the child element (3) A child element for giving an attribute indicating the position of the serialized DOM block indicating the child element to which the serialized DOM block to which itself belongs should refer in the serialized DOM block group When there is an element having an attribute among the elements included in the serialized DOM block to which the reference position assigning means (4) belongs, the attribute indicating the position in the serialized DOM block group of the serialized DOM indicating the attribute of the element is displayed. Attribute information reference position giving means (5) itself to give Next element reference position giving means for giving an attribute indicating the position in the serialized DOM block group of the next element serialized DOM block indicating the element following the element indicated by the serialized DOM block to which the serialized DOM block belongs. A character string start position giving means for giving an attribute indicating the start position of the character string in the character string information indicating the value,
(7) When the serialized DOM block to which the device itself belongs has a value, it has character string length giving means for giving an attribute indicating the length of the character string in the character string information indicating the value.

本発明のXML情報送信装置は、以下の(1)から(7)の効果を有する。
(1)XMLドキュメント情報を表すDOMを、転送を考慮したバイトストリームにシリアライズできる。
(2)シリアライズされたDOMは、再度のパース、デシリアライズの過程を経ることなく、要素へのアクセスを可能とする。
(3)XMLドキュメント情報はシリアライズDOMブロック体もしくはシリアライズDOMブロック群に置き換えられ、文字列情報は文字列情報もしくは準備文字列情報に含ませることができる。
(4)データを送信するのに必要なバイト数のみを送受信することができる。
(5)圧縮されたデータは、圧縮された状態のままで、そのXMLドキュメントのおのおの要素へのアクセスを可能とする。
(6)構造化データであるバイトストリームと、コンテンツデータである文字列辞書を分離してそれぞれを圧縮および暗号化するので、構造化データをそのまま圧縮するよりも通信データ量を削減することが可能になる。
(7)シリアライズDOMブロックは汎用性があり、送信する構造化XMLドキュメントの特殊性に依存しない圧縮アルゴリズムであるために、これをXMLなどの構造化XMLドキュメントの送受信のフォーマットとして標準化が可能である。
The XML information transmitting apparatus of the present invention has the following effects (1) to (7).
(1) A DOM representing XML document information can be serialized into a byte stream considering transfer.
(2) The serialized DOM enables access to elements without going through the re-parsing and deserialization process.
(3) The XML document information is replaced with a serialized DOM block body or a serialized DOM block group, and the character string information can be included in the character string information or the prepared character string information.
(4) Only the number of bytes necessary for transmitting data can be transmitted and received.
(5) The compressed data can be accessed to each element of the XML document while being compressed.
(6) Since the byte stream, which is structured data, and the character string dictionary, which is content data, are separated and compressed and encrypted, the amount of communication data can be reduced compared to compressing structured data as it is. become.
(7) Since the serialized DOM block is versatile and is a compression algorithm that does not depend on the speciality of the structured XML document to be transmitted, it can be standardized as a transmission / reception format of a structured XML document such as XML. .

以下、本発明の実施の形態について、図を用いて説明する。なお、本発明は、これら実施形態に何ら限定されるべきものではなく、その要旨を逸脱しない範囲において、種々なる態様で実施し得る。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. In addition, this invention should not be limited to these embodiments at all, and can be implemented in various modes without departing from the gist thereof.

実施形態1は主に請求項1および請求項5などに関する。   The first embodiment mainly relates to claims 1 and 5.

実施形態2は主に請求項2および請求項6などに関する。   The second embodiment mainly relates to claims 2 and 6.

実施形態3は主に請求項3などに関する。   The third embodiment mainly relates to claim 3 and the like.

実施形態4は主に請求項4などに関する。   The fourth embodiment mainly relates to claim 4 and the like.

実施形態5は主に請求項7などに関する。   The fifth embodiment mainly relates to claim 7 and the like.

まず、本発明の実施の例について、図を用いて説明する。なお、本発明の技術的範囲が以下に説明する実施の例に限定されて解釈されるべきではない。   First, an embodiment of the present invention will be described with reference to the drawings. The technical scope of the present invention should not be construed as being limited to the examples described below.

≪予備知識≫   ≪Preliminary knowledge≫

以下では本件発明にて用いられる用語について説明する。「XML」、「XMLパーサ」、「シリアライズDOMブロック体」、「シリアライズDOMブロック群」、「シリアライズDOMブロック」、「文字列情報」、「準備文字列情報」、「シリアライズDOM」、「親要素」、「子要素」、「属性情報」、「次要素」、「シリアライズDOMブロックの位置を示す属性」、「親要素参照位置」、「子要素参照位置」、「属性情報参照位置」、「次要素参照位置」、について説明する。   Hereinafter, terms used in the present invention will be described. “XML”, “XML parser”, “serialized DOM block body”, “serialized DOM block group”, “serialized DOM block”, “character string information”, “prepared character string information”, “serialized DOM”, “parent element” ”,“ Child element ”,“ attribute information ”,“ next element ”,“ attribute indicating the position of the serialized DOM block ”,“ parent element reference position ”,“ child element reference position ”,“ attribute information reference position ”,“ Next element reference position "will be described.

<XMLドキュメント>   <XML document>

「XML」は、構造化文書と呼ばれるデータ構造が定義できるコンピューター言語のひとつである。データ構造を定義するにあたって、XMLドキュメント自身の中にタグを埋め込む形で、そのXMLドキュメントのデータ構造が記述される。「<」で始まり「>」で終わり、これらで囲まれた文字列を含む部分をタグと呼ぶ。   “XML” is one of computer languages that can define a data structure called a structured document. In defining the data structure, the data structure of the XML document is described in a form in which a tag is embedded in the XML document itself. A portion that starts with “<” and ends with “>” and includes a character string surrounded by these is called a tag.

<要素>   <Element>

なお、このタグを本件発明においては「要素」と呼ぶ。一方、「<特定の文字列>」を開始タグ、「</特定の文字列>」を終了タグと呼ぶ。なお、本件発明においては、これらの開始タグと終了タグとの間に囲まれた領域に記述された文字列も、「要素」と呼ぶ。   This tag is referred to as an “element” in the present invention. On the other hand, “<specific character string>” is called a start tag, and “</ specific character string>” is called an end tag. In the present invention, a character string described in an area enclosed between the start tag and the end tag is also referred to as an “element”.

<XMLパーサ>   <XML parser>

「XMLパーサ」とは、構文解析を行うプログラムである。構文解析とは、データ構造の解析のことである。データ構造の解析とは、データのツリー構造を解析することである。一例として、図6のXMLドキュメント0601をXMLパーサを用いて構文解析することによって、図9に示される「DOMツリー」と呼ばれるツリー構造が組み立てられる。なお、「DOM」とは、Document Object Modelの略である。   An “XML parser” is a program that performs syntax analysis. Parsing is the analysis of the data structure. Data structure analysis is to analyze the tree structure of data. As an example, the XML document 0601 in FIG. 6 is parsed using an XML parser, and a tree structure called “DOM tree” shown in FIG. 9 is assembled. Note that “DOM” is an abbreviation for Document Object Model.

<シリアライズDOMブロック体>   <Serialized DOM block body>

「シリアライズDOMブロック体」とは、シリアライズDOMブロック体生成部により生成されるものである。シリアライズDOMブロック体とは、シリアライズDOMブロック群と文字列情報からなる。一例として、図11にシリアライズDOMブロック体の概念図を示す。シリアライズDOMブロック体1109は、シリアライズDOMブロック群1107と文字列情報1108からなる。   The “serialized DOM block body” is generated by the serialized DOM block body generation unit. The serialized DOM block body includes a serialized DOM block group and character string information. As an example, FIG. 11 shows a conceptual diagram of a serialized DOM block body. The serialized DOM block body 1109 includes a serialized DOM block group 1107 and character string information 1108.

<シリアライズDOMブロック群>   <Serialized DOM block group>

「シリアライズDOMブロック群」とは、シリアライズDOMブロック群生成手段により生成されるものである。シリアライズDOMブロック群とは、複数のシリアライズDOMブロックからなる。図11の一例に示すように、シリアライズDOMブロック1101からシリアライズDOMブロック1106が直列にならべられることによって、シリアライズDOMブロック群1107が生成される。シリアライズDOMブロック群の部分を構成するシリアライズDOMブロックは、図9の一例に示されるDOMツリーに対応しており、DOMツリーの要素0901は、シリアライズDOM1101に対応し、要素0902は、シリアライズDOM1102に対応し、要素0903は、シリアライズDOM1103に対応し、要素0904は、シリアライズDOM1104に対応し、要素0905は、シリアライズDOM1105に対応し、要素0906は、シリアライズDOM1106に対応している。   The “serialized DOM block group” is generated by the serialized DOM block group generation means. The serialized DOM block group includes a plurality of serialized DOM blocks. As shown in the example of FIG. 11, the serialized DOM block 1106 is serially arranged from the serialized DOM block 1101 to generate a serialized DOM block group 1107. The serialized DOM blocks constituting the part of the serialized DOM block group correspond to the DOM tree shown in the example of FIG. The element 0903 corresponds to the serialized DOM 1103, the element 0904 corresponds to the serialized DOM 1104, the element 0905 corresponds to the serialized DOM 1105, and the element 0906 corresponds to the serialized DOM 1106.

<シリアライズDOMブロック>   <Serialized DOM block>

「シリアライズDOMブロック」とは、シリアライズDOMブロック生成手段により生成されるものである。シリアライズDOMブロックとは、複数のシリアライズDOMからなる。   The “serialized DOM block” is generated by the serialized DOM block generation unit. The serialized DOM block is composed of a plurality of serialized DOMs.

<シリアライズDOM>   <Serialize DOM>

「シリアライズDOM」とは、シリアライズDOM生成手段により生成されるものである。シリアライズDOMとは、シリアライズDOMブロック体を構成する基本となる要素であり、最小単位である。   The “serialized DOM” is generated by the serialized DOM generation unit. The serialized DOM is a basic element constituting a serialized DOM block body and is a minimum unit.

<文字列情報>   <String information>

「文字列情報」とは、文字を示す情報であり、シリアライズDOMブロック体に利用される文字を並べたものである。文字列情報とは、一例として、前記XMLドキュメントのタグに含まれた文字列と、前記開始タグと終了タグに囲まれた領域に記述された文字列とを含む文字列情報である。また、文字列情報が、あらかじめ準備されている場合には、これを「準備文字列情報」と読んで区別する。図11の文字列情報1108では、図09に示すDOMツリーに用いられるすべての文字が含まれている。   “Character string information” is information indicating characters, and is a list of characters used in a serialized DOM block. For example, the character string information is character string information including a character string included in the tag of the XML document and a character string described in an area surrounded by the start tag and the end tag. If character string information is prepared in advance, it is distinguished by reading it as “prepared character string information”. The character string information 1108 in FIG. 11 includes all characters used in the DOM tree shown in FIG.

<親要素>   <Parent element>

「親要素」とは、すでに説明した要素であり、自身よりひとつ上の階層に属し、かつ自身がその要素に含まれる要素を指す。一例として、図9におけるDOMツリーにおいて、要素0902を自身と考えると、自身に対する親要素は、要素0901である。要素0904は自身に対してひとつ上の階層に属するが、自身である要素0902は要素0904には含まれないので、要素0904は自身である要素2002の親要素ではない。   “Parent element” refers to an element that has already been described, belongs to a hierarchy one level higher than itself, and includes itself. As an example, in the DOM tree in FIG. 9, when the element 0902 is considered to be itself, the parent element for the element 0902 is the element 0901. The element 0904 belongs to a hierarchy higher than itself, but the element 0902 that is the element 0904 is not included in the element 0904, so the element 0904 is not a parent element of the element 2002 that is the element 0904.

<親シリアライズDOMブロック>   <Parent serialized DOM block>

「親シリアライズDOMブロック」とは、自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき親を示すシリアライズDOMブロックである。一例を示せば、図11のシリアライズDOM群1107の場合には、シリアライズDOM1102の親要素は、シリアライズDOM1101である。   The “parent serialized DOM block” is a serialized DOM block that indicates a parent to which the serialized DOM block to which the serialized DOM block belongs should refer. For example, in the case of the serialized DOM group 1107 in FIG. 11, the parent element of the serialized DOM 1102 is the serialized DOM 1101.

<子要素>   <Child element>

「子要素」とは、自身よりひとつ下の階層に属し、かつ自身がその要素を含む要素を指す。たとえば、図9におけるDOMツリーにおいて、要素0902を自身と考えれば、自身に対する子要素は、要素0903である。要素0905は自身である要素0902のひとつ下の階層に属するが、自身である要素0902は要素0905を含まないので、要素0905は自身である要素0902の子要素ではない。   A “child element” refers to an element that belongs to a hierarchy below itself and that includes the element. For example, in the DOM tree shown in FIG. The element 0905 belongs to the hierarchy immediately below the element 0902 that is the element 0902. However, since the element 0902 that is the element 0905 does not include the element 0905, the element 0905 is not a child element of the element 0902 that is the element 0905.

<子シリアライズDOMブロック>   <Child serialized DOM block>

「子シリアライズDOMブロック」とは、自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき子を示すシリアライズDOMブロックである。一例を示せば、図11のシリアライズDOM群1107の場合には、シリアライズDOM1102の子要素は、シリアライズDOM1103である。   The “child serialized DOM block” is a serialized DOM block indicating a child to which the serialized DOM block to which the serialized DOM belongs belongs should be referred to in the group of serialized DOM blocks. For example, in the case of the serialized DOM group 1107 in FIG. 11, the child element of the serialized DOM 1102 is the serialized DOM 1103.

<属性情報>   <Attribute information>

「属性情報」とは、要素の属性を示す情報である。   “Attribute information” is information indicating element attributes.

<次要素>   <Next element>

「次要素」とは、自身と同じ階層に属し、かつ自身に隣接する要素を指す。図9中で一例を示すと、要素0902を自身と考えれば、「次要素」は、自身と同じ階層に属し、かつ自身に隣接する要素0904である。図11のシリアライズDOM群1107の場合には、シリアライズDOM1102の次要素は、シリアライズDOM1104である。   The “next element” refers to an element that belongs to the same hierarchy as itself and is adjacent to itself. As an example in FIG. 9, when the element 0902 is considered to be itself, the “next element” is the element 0904 that belongs to the same hierarchy as itself and is adjacent to itself. In the case of the serialized DOM group 1107 in FIG. 11, the next element of the serialized DOM 1102 is the serialized DOM 1104.

<次要素シリアライズDOMブロック>   <Next element serialized DOM block>

「次要素シリアライズDOMブロック」とは、自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき次を示すシリアライズDOMブロックである。一例を示せば、図11のシリアライズDOM群1107の場合には、シリアライズDOM1102の次要素は、シリアライズDOM1104である。   The “next element serialized DOM block” is a serialized DOM block that indicates the next to which the serialized DOM block to which the next element belongs should refer in the group of serialized DOM blocks. For example, in the case of the serialized DOM group 1107 in FIG. 11, the next element of the serialized DOM 1102 is the serialized DOM 1104.

<シリアライズDOMブロックの位置を示す属性>   <Attribute indicating the position of the serialized DOM block>

「シリアライズDOMブロックの位置を示す属性」とは、シリアライズDOMブロック群中でシリアライズDOMブロックの位置を示す属性である。たとえば、図15は、図11におけるシリアライズDOMブロック群1107を、シリアライズDOMのレベルまで記載したものであり、シリアライズDOMブロックの位置を示す属性は、図15に示す行番号1501を用いることができる。一例として、図11におけるシリアライズDOMブロック1102の位置を示す属性は、シリアライズDOMブロックが複数のシリアライズDOMから構成されるために行番号1501における19行目から27行目を表す19から27のいずれの数値も位置を示す属性として用いることができる。ひとつのブロックは、ひとつの位置を示す属性で表現することが可能であるために、代表値として、シリアライズDOMブロックの先頭行の行番号の番号を位置を示す属性として用いることができる。したがって、この例においては、数値19が位置を示す属性として付与される。   The “attribute indicating the position of the serialized DOM block” is an attribute indicating the position of the serialized DOM block in the serialized DOM block group. For example, FIG. 15 shows the serialized DOM block group 1107 in FIG. 11 up to the level of the serialized DOM, and the attribute indicating the position of the serialized DOM block can use the row number 1501 shown in FIG. As an example, the attribute indicating the position of the serialized DOM block 1102 in FIG. 11 is any of 19 to 27 that represents the 19th to 27th lines in the line number 1501 because the serialized DOM block is composed of a plurality of serialized DOMs. Numerical values can also be used as attributes indicating positions. Since one block can be expressed by an attribute indicating one position, the number of the line number of the first line of the serialized DOM block can be used as an attribute indicating the position as a representative value. Therefore, in this example, the numerical value 19 is given as an attribute indicating the position.

<親要素参照位置>   <Parent element reference position>

「親要素参照位置」とは、自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき親を示す親シリアライズDOMブロックの位置を示す属性である。たとえば、図15において、自身が属するシリアライズDOMブロックの位置を示す属性が19である場合には、親要素参照位置は10である。   The “parent element reference position” is an attribute indicating the position of the parent serialized DOM block indicating the parent to which the serialized DOM block to which the element belongs belongs should be referred to in the serialized DOM block group. For example, in FIG. 15, when the attribute indicating the position of the serialized DOM block to which the element belongs is 19, the parent element reference position is 10.

<子要素参照位置>   <Child element reference position>

「子要素参照位置」とは、自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき子を示す子シリアライズDOMブロックの位置を示す属性である。たとえば、図15において、自身が属するシリアライズDOMブロックの位置を示す属性が19である場合には、子要素参照位置は28である。   The “child element reference position” is an attribute indicating the position of a child serialized DOM block that indicates a child to which the serialized DOM block to which the element belongs should be referred in the serialized DOM block group. For example, in FIG. 15, when the attribute indicating the position of the serialized DOM block to which it belongs is 19, the child element reference position is 28.

<属性情報参照位置>   <Attribute information reference position>

「属性情報参照位置」とは、自身が属するシリアライズDOMブロックに含まれる要素の内、属性を有する要素がある場合に、その要素の属性を示すシリアライズDOMのシリアライズDOMブロック群中での位置を示す属性である。   The “attribute information reference position” indicates the position in the serialized DOM block group of the serialized DOM indicating the attribute of the element when there is an element having an attribute among the elements included in the serialized DOM block to which the attribute information belongs. Attribute.

<次要素参照位置>   <Next element reference position>

「次要素参照位置」とは、自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき次を示す次シリアライズDOMブロックの位置を示す属性である。たとえば、図15において、自身が属するシリアライズDOMブロックの位置を示す属性が19である場合には、次要素参照位置は37である。
≪実施形態1≫
The “next element reference position” is an attribute indicating the position of the next serialized DOM block that indicates the next to which the serialized DOM block to which the next element belongs should refer in the serialized DOM block group. For example, in FIG. 15, when the attribute indicating the position of the serialized DOM block to which it belongs is 19, the next element reference position is 37.
<< Embodiment 1 >>

<実施形態1の構成>   <Configuration of Embodiment 1>

図1は本実施形態の機能ブロック図である。図6、図7と図14は本実施形態の情報の構成図である。   FIG. 1 is a functional block diagram of this embodiment. FIG. 6, FIG. 7 and FIG. 14 are information configuration diagrams of the present embodiment.

<全体構成>   <Overall configuration>

実施形態1は、シリアライズDOMブロック体生成装置0102であって、XMLドキュメント情報取得部0103と、シリアライズDOMブロック体生成部0104と、シリアライズDOMブロック体出力部0105と、を有し、前記シリアライズDOMブロック体生成部0108は、シリアライズDOM生成手段0107と、文字列情報生成手段0110と、シリアライズDOMブロック生成手段0108と、シリアライズDOMブロック群生成手段0109と、を有し、前記シリアライズDOMブロック体0702は、シリアライズDOMブロック群0703と、文字列情報0704とからなり、前記シリアライズDOMブロック群0703は、シリアライズDOMブロック1410からなり、前記シリアライズDOMブロック1410は、シリアライズDOM1401からシリアライズDOM1409からなり、前記シリアライズDOM生成手段0107は、要素型付与手段0111と、親要素参照位置付与手段0112と、子要素参照位置付与手段0113と、属性情報参照位置付与手段0114と、次要素参照位置付与手段0115と、文字列先頭位置付与手段0116と、文字列長付与手段0117と、を有するシリアライズDOMブロック体生成装置である。   Embodiment 1 is a serialized DOM block body generation device 0102, which includes an XML document information acquisition unit 0103, a serialized DOM block body generation unit 0104, and a serialized DOM block body output unit 0105, and the serialized DOM block The field generation unit 0108 includes a serialized DOM generation unit 0107, a character string information generation unit 0110, a serialized DOM block generation unit 0108, and a serialized DOM block group generation unit 0109. The serialized DOM block body 0702 includes: The serialized DOM block group 0703 and the character string information 0704 are included. The serialized DOM block group 0703 includes the serialized DOM block 1410, and the serialized DOM block 1410. Includes serialized DOM1401 to serialized DOM1409. The serialized DOM generating unit 0107 includes an element type providing unit 0111, a parent element reference position providing unit 0112, a child element reference position providing unit 0113, and an attribute information reference position providing unit 0114. A serialized DOM block body generating device including a next element reference position assigning unit 0115, a character string head position assigning unit 0116, and a character string length providing unit 0117.

<実施形態1の構成の説明>   <Description of Configuration of Embodiment 1>

「シリアライズDOMブロック体生成装置」0102は、シリアライズDOMブロック体を生成する装置である。シリアライズDOMブロック体生成装置は、XMLドキュメント情報取得部0103と、シリアライズDOMブロック体生成部0104と、シリアライズDOMブロック体出力部0105と、を有する。   The “serialized DOM block body generation device” 0102 is a device that generates a serialized DOM block body. The serialized DOM block body generation device includes an XML document information acquisition unit 0103, a serialized DOM block body generation unit 0104, and a serialized DOM block body output unit 0105.

「XMLドキュメント情報取得部」0103は、XMLドキュメント情報を取得する。XMLドキュメント情報とは、例えば、XMLドキュメントや、XMLドキュメントから生成される中間情報である場合がある。   An “XML document information acquisition unit” 0103 acquires XML document information. The XML document information may be, for example, an XML document or intermediate information generated from the XML document.

「シリアライズDOMブロック体出力部」0105は、シリアライズDOMブロック体を出力する。たとえば、シリアライズDOMブロック群0703と文字列情報0704からなるシリアライズDOMブロック体0702を合体させた後、送信のために二進数に置き換えるための中間情報の生成や、中間情報から二進数データ生成などの機能を有する。   The “serialized DOM block body output unit” 0105 outputs a serialized DOM block body. For example, after the serialized DOM block body 0702 composed of the serialized DOM block group 0703 and the character string information 0704 is combined, generation of intermediate information to be replaced with a binary number for transmission, generation of binary data from the intermediate information, etc. It has a function.

「シリアライズDOMブロック体生成部」0108は、シリアライズDOMブロック体の生成部である。シリアライズDOMブロック体生成部は、シリアライズDOM生成手段0107と、文字列情報生成手段0110と、シリアライズDOMブロック生成手段0108と、シリアライズDOMブロック群生成手段0109と、を有する。   The “serialized DOM block body generation unit” 0108 is a generation unit of a serialized DOM block body. The serialized DOM block body generating unit includes serialized DOM generating means 0107, character string information generating means 0110, serialized DOM block generating means 0108, and serialized DOM block group generating means 0109.

「文字列情報生成手段」0101は、文字列情報を生成する手段である。文字列情報は、XMLドキュメント情報に含まれるすべての文字列である。一例をあげれば、図6(A)のXMLドキュメント0601に含まれるすべての文字列は、root、content、XXXX、/content、content、YYYY、/content、/rootである。なお、本実施形態1においては、「/」を文字列から省くため、root、content、XXXX、content、YYYY、rootがすべての文字列である。さらに本実施形態1においては、文字列情報は直列にならべた、rootcontentXXXXcontentYYYYrootが文字列情報である。実施形態1では、文字列情報は、さらに繰り返しの部分を削除して、rootcontentXXXXYYYYである。   “Character string information generating means” 0101 is means for generating character string information. The character string information is all character strings included in the XML document information. As an example, all character strings included in the XML document 0601 in FIG. 6A are root, content, XXX, / content, content, YYYY, / content, and / root. In the first embodiment, since “/” is omitted from the character string, “root”, “content”, “XXXX”, “content”, “YYYY”, and “root” are all character strings. Furthermore, in the first embodiment, the character string information is arranged in series, and rootcontentXXXcontentYYYYroot is the character string information. In the first embodiment, the character string information is rootcontentXXXXYYYY by further deleting a repeated portion.

「シリアライズDOMブロック体」0702は、シリアライズDOMブロック生成部によって生成される情報である。シリアライズDOMブロック体は、シリアライズDOMブロック群0703と、文字列情報0704とからなる。   The “serialized DOM block body” 0702 is information generated by the serialized DOM block generation unit. The serialized DOM block body includes a serialized DOM block group 0703 and character string information 0704.

「シリアライズDOMブロック群」0703は、シリアライズDOMブロック群生成手段によって生成される情報である。シリアライズDOMブロック群は、シリアライズDOMブロック1410からなる。   The “serialized DOM block group” 0703 is information generated by the serialized DOM block group generation unit. The serialized DOM block group includes serialized DOM blocks 1410.

「シリアライズDOMブロック」1410は、シリアライズDOMブロック生成手段によって生成される情報である。シリアライズDOMブロックは、シリアライズDOM1401からシリアライズDOM1409からなる。シリアライズDOMブロックは、要素型情報、親要素参照位置情報、子要素参照位置情報、属性情報参照位置情報、次要素参照位置情報、文字列先頭位置情報、文字列長情報、を有する。   The “serialized DOM block” 1410 is information generated by the serialized DOM block generation unit. The serialized DOM block includes serialized DOM1401 to serialized DOM1409. The serialized DOM block has element type information, parent element reference position information, child element reference position information, attribute information reference position information, next element reference position information, character string head position information, and character string length information.

「シリアライズDOM」は、シリアライズDOM生成手段によって生成される情報である。シリアライズDOMは、要素型情報、親要素参照位置情報、子要素参照位置情報、属性情報参照位置情報、次要素参照位置情報、文字列先頭位置情報、文字列長情報、の情報を示す。ひとつのシリアライズDOMは、前記要素型情報、親要素参照位置情報、子要素参照位置情報、属性情報参照位置情報、次要素参照位置情報、文字列先頭位置情報、文字列長情報、のうちのひとつの情報を有する。   “Serialized DOM” is information generated by the serialized DOM generating means. The serialized DOM indicates information of element type information, parent element reference position information, child element reference position information, attribute information reference position information, next element reference position information, character string head position information, and character string length information. One serialized DOM is one of the element type information, parent element reference position information, child element reference position information, attribute information reference position information, next element reference position information, character string head position information, and character string length information. Information.

「シリアライズDOM生成手段」0107は、シリアライズDOM生成手段である。シリアライズDOM生成手段は、要素型付与手段0111と、親要素参照位置付与手段0112と、子要素参照位置付与手段0113と、属性情報参照位置付与手段0114と、次要素参照位置付与手段0115と、文字列先頭位置付与手段0116と、文字列長付与手段0117と、を有する。   The “serialized DOM generation unit” 0107 is a serialized DOM generation unit. The serialized DOM generation means includes an element type assigning means 0111, a parent element reference position assigning means 0112, a child element reference position assigning means 0113, an attribute information reference position assigning means 0114, a next element reference position assigning means 0115, a character Column head position providing means 0116 and character string length providing means 0117 are provided.

「要素型付与手段」0111は、自身が属するシリアライズDOMブロックが示す要素の型を示す属性を与える。実施形態1では、一例として、「要素型」は、XMLドキュメント自身を示すDocumentと、XMLドキュメント情報の要素を示すElementと、XMLドキュメント情報の要素内容を示すTextと、を有する。   The “element type assigning unit” 0111 gives an attribute indicating the type of the element indicated by the serialized DOM block to which the element type assigning unit belongs. In the first embodiment, as an example, the “element type” includes a document indicating the XML document itself, an element indicating the element of the XML document information, and a text indicating the element content of the XML document information.

「親要素参照位置付与手段」0112は、自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき親要素を示す親シリアライズDOMブロックの位置を示す属性を与える。   “Parent element reference position assigning means” 0112 gives an attribute indicating the position of the parent serialized DOM block indicating the parent element to which the serialized DOM block to which the element belongs belongs should be referred to in the serialized DOM block group.

「子要素参照位置付与手段」0113は、自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき子要素を示すシリアライズDOMブロックの位置を示す属性を与える。   The “child element reference position assigning unit” 0113 gives an attribute indicating the position of the serialized DOM block indicating the child element to which the serialized DOM block to which the child element belongs belongs should be referred to in the serialized DOM block group.

「属性情報付与手段」0114は、自身が属するシリアライズDOMブロックに含まれる要素の内、属性を有する要素がある場合に、その要素の属性を示すシリアライズDOMのシリアライズDOMブロック群中での位置を示す属性を与える。「属性情報」とは、要素の属性を示す。   The “attribute information giving means” 0114 indicates the position of the serialized DOM indicating the attribute of the element in the serialized DOM block group when there is an element having the attribute among the elements included in the serialized DOM block to which the attribute information assigning unit 0114 belongs. Give attributes. “Attribute information” indicates an attribute of an element.

「次要素付与手段」0115は、自身が属するシリアライズDOMブロックで示す要素の次に続く要素を示す次要素シリアライズDOMブロックのシリアライズDOMブロック群中での位置を示す属性を与える。   The “next element assigning unit” 0115 gives an attribute indicating the position in the serialized DOM block group of the next element serialized DOM block indicating the element following the element indicated by the serialized DOM block to which the next element assigning unit 0115 belongs.

「文字列先頭位置付与手段」0116は、自身が属するシリアライズDOMブロックが値を有する場合に、その値を示す前記文字列情報中での文字列の先頭位置を示す属性を与える。「文字列情報」は、要素に含まれる文字列を直列に並べたものである。   When the serialized DOM block to which the character string belongs has a value, the “character string start position assigning unit” 0116 gives an attribute indicating the start position of the character string in the character string information indicating the value. “Character string information” is a string in which character strings included in elements are arranged in series.

「文字列長付与手段」0117は、自身が属するシリアライズDOMブロックが値を有する場合に、その値を示す前記文字列情報中での文字列の長さを示す属性を与える。「文字列長」とは、文字列を構成する文字の個数である。   “Character string length giving means” 0117 gives an attribute indicating the length of a character string in the character string information indicating the value when the serialized DOM block to which the character string belongs has a value. “Character string length” is the number of characters constituting the character string.

「シリアライズDOMブロック体出力部」0105は、シリアライズDOMブロック体を出力する。ここでは、シリアライズDOMブロック群0703と文字列情報0704からなるシリアライズDOMブロック体0702を、送信のために二進数に置き換えるための中間情報の生成や、中間情報から二進数データ生成などの機能も有する。   The “serialized DOM block body output unit” 0105 outputs a serialized DOM block body. Here, it also has functions such as generation of intermediate information for replacing the serialized DOM block body 0702 composed of the serialized DOM block group 0703 and the character string information 0704 with a binary number for transmission, and generation of binary data from the intermediate information. .

<実施形態1の処理の流れ>   <Processing flow of Embodiment 1>

また、図3は本実施発明形態のフローチャートを表す図である。図6、図7は、XMLドキュメント情報、シリアライズDOMブロック体などの情報を示す。図8、図9、図11は、XMLドキュメントから生成される中間情報を示す図である。   FIG. 3 shows a flowchart of the present embodiment. 6 and 7 show information such as XML document information and serialized DOM block bodies. 8, 9, and 11 are diagrams showing intermediate information generated from the XML document.

「XMLドキュメント情報を取得するステップ」S0301は、XMLドキュメント情報を取得する。本ステップにて取得するXMLドキュメント情報は、例えば図6(A)に示されるXMLドキュメントである。   “Step of acquiring XML document information” S0301 acquires XML document information. The XML document information acquired in this step is, for example, an XML document shown in FIG.

「XMLドキュメント情報から中間情報を生成するステップ」S0302は、XMLドキュメント情報から中間情報を生成する。一例として図6(A)XMLドキュメント情報図0601から図6(B)のような中間情報0602を生成する。図6(B)の中間情報0602は、図8に示される要素型情報0803と文字列情報0804を有する要素情報0802を単位として、図6(A)に示すXMLドキュメント情報が有する階層構造および要素間の連結関係が保持される中間情報である。   “Step of generating intermediate information from XML document information” S0302 generates intermediate information from XML document information. As an example, the intermediate information 0602 as shown in FIG. 6B is generated from the XML document information FIG. The intermediate information 0602 in FIG. 6B includes the hierarchical structure and elements of the XML document information shown in FIG. 6A with the element information 0802 having the element type information 0803 and the character string information 0804 shown in FIG. 8 as a unit. This is intermediate information in which the connection relationship between them is maintained.

「中間情報に対してシリーズナンバーと階層ナンバーを付与するステップ」S0303は、中間情報に対してシリーズナンバーと階層ナンバーを付与する。前記図6(B)の中間情報0602に、階層情報mおよびシリーズナンバーnを属性として付与し図6(C)に示される中間情報0603を生成する。シリーズナンバーは、図6(B)のテーブルにおける左上から右方向へ番号が付与され、さらに次行においては、もっとも左にある要素から右方向の要素へ向かって番号が付与される。シリーズナンバーは、2から順番に付与される。シリーズナンバー1は、ドキュメント自身を表す番号として付与される。   “Step of assigning a series number and a hierarchy number to intermediate information” S0303 assigns a series number and a hierarchy number to the intermediate information. The intermediate information 0602 shown in FIG. 6B is assigned the hierarchy information m and the series number n as attributes to generate intermediate information 0603 shown in FIG. 6C. The series number is assigned from the upper left to the right in the table of FIG. 6B, and in the next line, the number is assigned from the leftmost element to the right element. Series numbers are assigned in order from 2. Series number 1 is given as a number representing the document itself.

「シリアライズDOMにおける要素型の付与ステップ」S0304においては、自身が属するシリアライズDOMブロックが示す要素の型を示す属性を与える。本実施形態1では、一例をあげれば、中間情報0901のrootの要素型はElementである。したがって、この例では、rootに対応するシリアライズDOMブロック中のシリアライズDOMに対して要素型Elementが要素型として付与される。シリアライズDOMブロック群1502の二つ目のブロック中の行番号1501の10行目にこの文字が付与されている。   In “Step of assigning element type in serialized DOM” S0304, an attribute indicating the type of element indicated by the serialized DOM block to which the element belongs is given. In the first embodiment, for example, the root element type of the intermediate information 0901 is Element. Therefore, in this example, the element type Element is assigned as the element type to the serialized DOM in the serialized DOM block corresponding to the root. This character is assigned to the 10th line of the line number 1501 in the second block of the serialized DOM block group 1502.

「シリアライズDOMにおける親要素参照位置の付与ステップ」S0305においては、シリアライズDOMブロックにおける親要素参照位置が付与される。図6(C)に示すXMLドキュメント情報から生成される中間情報0603より要素の親要素に関する親要素情報を取得し、シリアライズDOMの親要素参照位置に前記親要素情報を付与する機能を有する。本実施形態1では、前述したように、中間情報0603におけるシリーズナンバーn=3の要素の親要素とは、自身に対して直上にある要素を意味しており、シリーズナンバーn=2が親要素となる。この親要素を表すシリアライズDOMブロックの先頭行の行番号は「10」である。したがって、この例では、親要素参照位置付与手段0112は、シリーズナンバーn=3に対応するシリアライズDOMブロック中のシリアライズDOMに対して行番号の「10」を親要素参照位置として付与する。このシリアライズDOMは、シリアライズDOMブロック群1502の三つ目のブロックに対応し、行番号1501の20行目にこの数値が付与されている。   In the “giving step of parent element reference position in serialized DOM” S0305, the parent element reference position in the serialized DOM block is given. It has a function of acquiring parent element information related to the parent element of the element from the intermediate information 0603 generated from the XML document information shown in FIG. 6C, and assigning the parent element information to the parent element reference position of the serialized DOM. In the first embodiment, as described above, the parent element of the element of the series number n = 3 in the intermediate information 0603 means an element immediately above itself, and the series number n = 2 is the parent element. It becomes. The line number of the first line of the serialized DOM block representing this parent element is “10”. Therefore, in this example, the parent element reference position assigning unit 0112 assigns the row number “10” as the parent element reference position to the serialized DOM in the serialized DOM block corresponding to the series number n = 3. This serialized DOM corresponds to the third block of the serialized DOM block group 1502, and this numerical value is given to the 20th line of the line number 1501.

ところで、この親要素参照位置をあらわすシリアライズDOMブロック内における行番号は、計算により求めることができる。すなわち、本実施形態においては、   By the way, the row number in the serialized DOM block representing the parent element reference position can be obtained by calculation. That is, in this embodiment,

親要素参照位置=9×(n−1)+1 となる。例えば、前記の例では、n=2を代入することにより親要素参照位置を示す値である「10」を得ることができる。   Parent element reference position = 9 × (n−1) +1. For example, in the above example, “10” that is a value indicating the parent element reference position can be obtained by substituting n = 2.

「シリアライズDOMにおける子要素参照位置の付与ステップ」S0306においては、シリアライズDOMにおける子要素参照位置が付与される。本実施形態1では、中間情報0901におけるシリーズナンバーn=3の要素の子要素とは、自身の直下にある要素を意味しており、シリーズナンバーn=4が子要素となる。子要素であるシリーズナンバーn=4の要素のシリアライズDOMブロックの先頭行の行番号は「28」である。したがって、この例では、子要素参照位置付与手段0113は、シリーズナンバーn=3に対応するシリアライズDOMブロック中のシリアライズDOMに対して行番号の「28」を子要素参照位置として付与する。前記シリアライズDOMブロックは、シリアライズDOMブロック群1502の三つ目のブロックに対応し、行番号1501の21行目のシリアライズDOMにこの数値が付与されている。   In “assignment step of child element reference position in serialized DOM” S0306, a child element reference position in serialized DOM is assigned. In the first embodiment, the child element of the element of the series number n = 3 in the intermediate information 0901 means an element immediately below itself, and the series number n = 4 is a child element. The line number of the first line of the serialized DOM block of the element of series number n = 4 which is a child element is “28”. Therefore, in this example, the child element reference position assigning unit 0113 assigns the row number “28” as the child element reference position to the serialized DOM in the serialized DOM block corresponding to the series number n = 3. The serialized DOM block corresponds to the third block of the serialized DOM block group 1502, and this numerical value is assigned to the serialized DOM in the 21st row of the row number 1501.

ところで、この子要素参照位置をあらわすシリアライズDOMブロック内における行番号は、計算により求めることができる。すなわち、本実施形態においては、   By the way, the line number in the serialized DOM block representing the child element reference position can be obtained by calculation. That is, in this embodiment,

子要素参照位置=9×(n−1)+1 となる。例えば、前記の例では、n=4を代入することにより子要素参照位置を示す値である「28」を得ることができる。   Child element reference position = 9 × (n−1) +1. For example, in the above example, “28” which is a value indicating the child element reference position can be obtained by substituting n = 4.

「シリアライズDOMにおける属性情報参照位置の付与ステップ」S0307においては、シリアライズDOMにおける属性情報参照位置が付与される。本実施例1では、属性情報が無いが、このような場合には、シリアライズDOMブロック中の属性情報を付与するシリアライズDOMに対して属性情報参照位置を示す値である「0」を付与する。   In the “assignment step of attribute information reference position in serialized DOM” S0307, the attribute information reference position in serialized DOM is assigned. In the first embodiment, there is no attribute information. In such a case, “0” that is a value indicating the attribute information reference position is assigned to the serialized DOM to which the attribute information in the serialized DOM block is assigned.

「シリアライズDOMにおける次要素参照位置の付与ステップ」S0304は、シリアライズDOMにおける次要素が付与される。本実施形態では、中間情報0603におけるシリーズナンバーn=3の要素の次要素は、前述したように自分自身と同一の階層にあり、隣接しかつより大きなシリーズナンバーを有する要素を指し、シリーズナンバーn=5が次要素となる。この次要素を表すシリアライズDOMブロックの先頭行の行番号1501は行番号の「37」である。したがって、この例では、数値「37」を次要素として付与する。前記シリアライズDOMブロックは、シリアライズDOMブロック群1502の三つ目のブロックであり、行番号1501の23行目にこの数値が付与されている。   The “next element reference position assignment step in the serialized DOM” S0304 is provided with the next element in the serialized DOM. In the present embodiment, the element next to the element of the series number n = 3 in the intermediate information 0603 indicates an element that is in the same hierarchy as itself and has a larger series number as described above. = 5 is the next element. The line number 1501 of the first line of the serialized DOM block representing this next element is the line number “37”. Therefore, in this example, the numerical value “37” is assigned as the next element. The serialized DOM block is the third block of the serialized DOM block group 1502, and this numerical value is assigned to the 23rd row of the row number 1501.

ところで、この次要素をあらわすシリアライズDOMブロック内における行番号は、計算により求めることができる。すなわち、本実施形態においては、   By the way, the row number in the serialized DOM block representing this next element can be obtained by calculation. That is, in this embodiment,

子要素参照位置=9×(n−1)+1 となる。例えば、前記の例では、n=5を代入することにより次要素参照位置を示す値である「37」を得ることができる。   Child element reference position = 9 × (n−1) +1. For example, in the above example, “37” that is a value indicating the next element reference position can be obtained by substituting n = 5.

「テキストの文字列を文字列情報から検索し、最初に現れた同じ文字列の先頭位置の付与ステップ」S0309においては、シリアライズDOMに文字列先頭位置が付与される。本実施形態1では、本実施形態1では、シリーズナンバーn=3が保持する文字列情報contentは、文字列情報0604において左端のrの位置を「0」番目とすると、「4」番目の位置からcontentの文字が配列されている。したがって、本実施形態1においては数値「4」が文字列先頭位置として付与される。前記シリアライズDOMブロックは、シリアライズDOMブロック群1502の三つ目のブロックであり、行番号1501の24行目にこの数値が付与されている。   In the step of “searching the character string of the text from the character string information and assigning the head position of the same character string that appears first” S0309, the character string head position is assigned to the serialized DOM. In the first embodiment, in the first embodiment, the character string information content held by the series number n = 3 is the “4” -th position when the leftmost r position in the character string information 0604 is the “0” -th position. To content characters are arranged. Therefore, in the first embodiment, the numerical value “4” is assigned as the character string head position. The serialized DOM block is the third block of the serialized DOM block group 1502, and this numerical value is assigned to the 24th row of the row number 1501.

「テキストの文字列長の付与ステップ」S0310においては、シリアライズDOMに文字列長を付与される。本実施形態1では、シリーズナンバーn=3が保持する文字列情報contentの文字数は、「7」である。したがって、本実施形態1では、数値7が文字長として付与される。前記シリアライズDOMブロックは、シリアライズDOMブロック群1502の三つ目のブロックであり、行番号1501の25行目にこの数値が付与されている。
「上記データからシリアライズDOMブロックを生成するステップ」S0311においては、シリアライズDOMブロックが生成される。例えば、シリアライズDOMブロック群1502の行番号1501の1行目から9行目で示される範囲に存するシリアライズDOMの集合がシリアライズDOMブロックとして生成される。
In “text character string length assignment step” S0310, a character string length is assigned to the serialized DOM. In the first embodiment, the number of characters of the character string information content held by the series number n = 3 is “7”. Therefore, in the first embodiment, the numerical value 7 is given as the character length. The serialized DOM block is the third block of the serialized DOM block group 1502, and this numerical value is given to the 25th line of the line number 1501.
In “Step of generating a serialized DOM block from the data” S0311, a serialized DOM block is generated. For example, a set of serialized DOMs in the range indicated by the first to ninth lines of the line number 1501 of the serialized DOM block group 1502 is generated as a serialized DOM block.

「すべての要素についてシリアライズDOMブロックを生成ステップ」S0312においていは、すべての要素についてシリアライズDOMブロックが生成されたかどうかが判定される。すべての要素についてシリアライズDOMブロックが生成された場合は、次ステップへ進み、すべての要素についてシリアライズDOMブロックが生成されていない場合は、再びシリアライズDOMブロック生成のステップに戻る。   In “Generate Serialized DOM Blocks for All Elements” S0312, it is determined whether serialized DOM blocks have been generated for all elements. If serialized DOM blocks have been generated for all elements, the process proceeds to the next step. If serialized DOM blocks have not been generated for all elements, the process returns to the step for generating serialized DOM blocks.

「上記データからシリアライズDOMブロック群を生成するステップ」S0313においては、シリアライズDOMブロック群が生成される。シリアライズDOMブロックを連続して生成するものであり、図7(F)はシリアライズDOMブロック群の一例である。   In “Step of generating a serialized DOM block group from the data” S0313, a serialized DOM block group is generated. Serialized DOM blocks are continuously generated, and FIG. 7F is an example of a serialized DOM block group.

「上記データからシリアライズDOMブロック体を生成するステップ」S0314においては、シリアライズDOMブロック体が生成される。図7(E)のシリアライズDOMブロック群と図6(D)の文字列情報を連続、もしくは別別に生成するものであり、図7(F)は、本実施形態1におけるシリアライズDOMブロック体の一例である。   In “Step of generating serialized DOM block body from the above data” S0314, a serialized DOM block body is generated. The serialized DOM block group in FIG. 7E and the character string information in FIG. 6D are generated continuously or separately. FIG. 7F is an example of the serialized DOM block body in the first embodiment. It is.

「上記データからシリアライズDOMブロック体を出力するステップ」S0315においては、シリアライズDOMブロック体が出力される。一例としとて、シリアライズDOMブロック体は、シリアライズDOMブロック群0703と文字列情報0704からなる。このシリアライズDOMブロック体は、送信のために、さらに二進数に置き換えるための中間情報の生成や、中間情報から二進数データ生成などが含まれる。
≪実施形態2≫
In "Step of outputting serialized DOM block body from the above data" S0315, the serialized DOM block body is output. As an example, the serialized DOM block body includes a serialized DOM block group 0703 and character string information 0704. This serialized DOM block includes generation of intermediate information for replacement with binary numbers for transmission, generation of binary data from the intermediate information, and the like.
<< Embodiment 2 >>

<実施形態2の構成>   <Configuration of Embodiment 2>

図2は本実施形態の機能ブロック図である。図16、図17と図14は本実施形態の情報の構成図である。   FIG. 2 is a functional block diagram of the present embodiment. FIG. 16, FIG. 17 and FIG. 14 are information configuration diagrams of this embodiment.

<全体構成>   <Overall configuration>

実施形態2は、シリアライズDOMブロック体生成装置0202であって、XMLドキュメント情報取得部0203と、シリアライズDOMブロック体生成部0204と、シリアライズDOMブロック体出力部0205と、を有し、前記シリアライズDOMブロック体生成部0208は、シリアライズDOM生成手段0207と、シリアライズDOMブロック生成手段0208と、シリアライズDOMブロック群生成手段0209と、を有し、前記シリアライズDOMブロック体1702は、シリアライズDOMブロック群1701からなり、前記シリアライズDOMブロック群0701は、シリアライズDOMブロック1410からなり、前記シリアライズDOMブロック1410は、シリアライズDOM1401からシリアライズDOM1409からなり、前記シリアライズDOM生成手段0207は、要素型付与手段0211と、親要素参照位置付与手段0212と、子要素参照位置付与手段0213と、属性情報参照位置付与手段0214と、次要素参照位置付与手段0215と、準備文字列先頭位置付与手段0216と、準備文字列長付与手段0217と、を有するシリアライズDOMブロック体生成装置である。   The second embodiment is a serialized DOM block body generation device 0202, which includes an XML document information acquisition unit 0203, a serialized DOM block body generation unit 0204, and a serialized DOM block body output unit 0205, and the serialized DOM block The body generation unit 0208 includes a serialized DOM generation unit 0207, a serialized DOM block generation unit 0208, and a serialized DOM block group generation unit 0209. The serialized DOM block body 1702 includes a serialized DOM block group 1701. The serialized DOM block group 0701 includes a serialized DOM block 1410, and the serialized DOM block 1410 includes serialized DOM1401 to serialized DOM14. The serialized DOM generating unit 0207 includes an element type providing unit 0211, a parent element reference position providing unit 0212, a child element reference position providing unit 0213, an attribute information reference position providing unit 0214, and a next element reference position. This is a serialized DOM block body generating device having an assigning unit 0215, a preparation character string head position giving unit 0216, and a preparation character string length giving unit 0217.

<実施形態2の構成の説明>   <Description of Configuration of Embodiment 2>

XMLドキュメント情報取得部、シリアライズDOM生成手段、シリアライズDOMブロック生成手段、シリアライズDOMブロック群生成手段、シリアライズDOMブロック体出力部、要素型付与手段、親要素参照位置付与手段、子要素参照位置付与手段、属性情報参照位置付与手段、次要素参照位置付与手段、に関しては、実施形態1と基本的に機能は共通なので、詳細な説明は省略する。   XML document information acquisition unit, serialized DOM generation unit, serialized DOM block generation unit, serialized DOM block group generation unit, serialized DOM block body output unit, element type provision unit, parent element reference position provision unit, child element reference position provision unit, Since the attribute information reference position assigning means and the next element reference position assigning means have basically the same functions as those of the first embodiment, detailed description thereof will be omitted.

「シリアライズDOMブロック体生成装置」は、シリアライズDOMブロック体を生成する装置である。シリアライズDOMブロック体生成装置は、XMLドキュメント情報取得部と、シリアライズDOMブロック群生成部と、シリアライズDOMブロック群出力部と、を有する。   The “serialized DOM block body generating device” is a device that generates a serialized DOM block body. The serialized DOM block body generation device includes an XML document information acquisition unit, a serialized DOM block group generation unit, and a serialized DOM block group output unit.

「シリアライズDOMブロック群生成部」は、シリアライズDOMブロック群の生成部である。シリアライズDOMブロック群生成部は、シリアライズDOM生成手段と、文字列情報生成手段と、シリアライズDOMブロック生成手段と、シリアライズDOMブロック群生成手段と、を有する。   The “serialized DOM block group generation unit” is a generation unit of a serialized DOM block group. The serialized DOM block group generation unit includes a serialized DOM generation unit, a character string information generation unit, a serialized DOM block generation unit, and a serialized DOM block group generation unit.

「シリアライズDOMブロック体」は、シリアライズDOMブロック体生成生成部によって生成される情報である。シリアライズDOMブロック体は、シリアライズDOMブロック群からなる。   The “serialized DOM block body” is information generated by the serialized DOM block body generation / generation unit. The serialized DOM block body includes a serialized DOM block group.

「シリアライズDOMブロック群」は、シリアライズDOMブロック群生成手段によって生成される情報である。シリアライズDOMブロック群は、シリアライズDOMブロックからなる。   The “serialized DOM block group” is information generated by the serialized DOM block group generation unit. The serialized DOM block group includes serialized DOM blocks.

「シリアライズDOMブロック」は、シリアライズDOMブロック生成手段によって生成される情報である。シリアライズDOMブロックは、シリアライズDOM1401からシリアライズDOM1409からなる。シリアライズDOMブロックは、要素型情報、親要素参照位置情報、子要素参照位置情報、属性情報参照位置情報、次要素参照位置情報、準備文字列先頭位置情報、準備文字列長情報、を有する。   The “serialized DOM block” is information generated by the serialized DOM block generation unit. The serialized DOM block includes serialized DOM1401 to serialized DOM1409. The serialized DOM block has element type information, parent element reference position information, child element reference position information, attribute information reference position information, next element reference position information, preparation character string head position information, and preparation character string length information.

「シリアライズDOM」は、シリアライズDOM生成手段によって生成される情報である。シリアライズDOMは、要素型情報、親要素参照位置情報、子要素参照位置情報、属性情報参照位置情報、次要素参照位置情報、準備文字列先頭位置情報、準備文字列長情報、の情報を示す。ひとつのシリアライズDOMは、前記要素型情報、親要素参照位置情報、子要素参照位置情報、属性情報参照位置情報、次要素参照位置情報、準備文字列先頭位置情報、準備文字列長情報、のうちのひとつの情報を有する。   “Serialized DOM” is information generated by the serialized DOM generating means. The serialized DOM indicates information of element type information, parent element reference position information, child element reference position information, attribute information reference position information, next element reference position information, preparation character string head position information, and preparation character string length information. One serialized DOM includes element type information, parent element reference position information, child element reference position information, attribute information reference position information, next element reference position information, preparation character string head position information, and preparation character string length information. Have one piece of information.

「シリアライズDOM生成手段」は、シリアライズDOM生成手段である。シリアライズDOM生成手段は、要素型付与手段と、親要素参照位置付与手段と、子要素参照位置付与手段と、属性情報参照位置付与手段と、次要素参照位置付与手段と、準備文字列先頭位置付与手段と、準備文字列長付与手段と、を有する。   The “serialized DOM generation unit” is a serialized DOM generation unit. The serialized DOM generating means includes an element type assigning means, a parent element reference position giving means, a child element reference position giving means, an attribute information reference position giving means, a next element reference position giving means, and a preparation character string head position giving. And a preparation character string length giving means.

「準備文字列先頭位置付与手段」は、自身が属するシリアライズDOMブロックが値を有する場合に、その値を示す前記準備文字列情報中での文字列の先頭位置を示す属性を与える。   When the serialized DOM block to which the “preparation character string head position belongs” has a value, the “preparation character string head position adding unit” gives an attribute indicating the head position of the character string in the preparation character string information indicating the value.

「準備文字列長付与手段」は、自身が属するシリアライズDOMブロックが値を有する場合に、その値を示す前記準備文字列情報中での文字列の長さを示す属性を与える。「文字列長」とは、文字列を構成する文字の個数である。   When the serialized DOM block to which the “preparation character string length” belongs has a value, the “preparation character string length giving means” gives an attribute indicating the length of the character string in the preparation character string information indicating the value. “Character string length” is the number of characters constituting the character string.

「シリアライズDOMブロック群出力部」は、シリアライズDOMブロック群を出力する。たとえば、シリアライズDOMブロック群を、送信のために二進数に置き換えるための中間情報の生成や、中間情報から二進数データ生成などの機能も有する。
<実施形態2の処理の流れ>
The “serialized DOM block group output unit” outputs a serialized DOM block group. For example, it has functions such as generation of intermediate information for replacing a serialized DOM block group with a binary number for transmission and generation of binary data from the intermediate information.
<Processing flow of Embodiment 2>

また、図5は本実施発明形態のフローチャートを表す図である。図16、図17は、XMLドキュメント情報、シリアライズDOMブロック体などの情報を示す。図8、図9、図11は、XMLドキュメントから生成される中間情報を示す図である。   FIG. 5 shows a flowchart of the present embodiment. 16 and 17 show information such as XML document information and serialized DOM block bodies. 8, 9, and 11 are diagrams showing intermediate information generated from the XML document.

「XMLドキュメント情報を取得するステップ」S0501は、XMLドキュメント情報を取得する。本ステップにて取得するXMLドキュメント情報は、例えば図16(A)に示されるXMLドキュメントである。   “Step of acquiring XML document information” S0501 acquires XML document information. The XML document information acquired in this step is, for example, an XML document shown in FIG.

「XMLドキュメント情報から中間情報を生成するステップ」S0502は、XMLドキュメント情報から中間情報を生成する。一例として図16(A)XMLドキュメント情報図1601から図16(B)のような中間情報1602を生成する。図16(B)の中間情報1602は、図8に示される要素型情報0803と文字列情報0804を有する要素情報0802を単位として、図16(A)に示すXMLドキュメント情報が有する階層構造および要素間の連結関係が保持される中間情報である。   “Step of generating intermediate information from XML document information” S0502 generates intermediate information from XML document information. As an example, intermediate information 1602 as shown in FIG. 16 (A) XML document information diagram 1601 to FIG. 16 (B) is generated. The intermediate information 1602 in FIG. 16B includes the hierarchical structure and elements of the XML document information shown in FIG. 16A, with the element information 0802 having the element type information 0803 and the character string information 0804 shown in FIG. This is intermediate information in which the connection relationship between them is maintained.

「中間情報に対してシリーズナンバーと階層ナンバーを付与するステップ」S0503は、中間情報に対してシリーズナンバーと階層ナンバーを付与する。前記図16(B)の中間情報1602に、階層情報mおよびシリーズナンバーnを属性として付与し図16(C)に示される中間情報1603を生成する。シリーズナンバーは、図16(B)のテーブルにおける左上から右方向へ番号が付与され、さらに次行においては、もっとも左にある要素から右方向の要素へ向かって番号が付与される。シリーズナンバーは、2から順番に付与される。シリーズナンバー1は、ドキュメント自身を表す番号として付与される。   “Step of assigning a series number and a hierarchy number to intermediate information” S0503 assigns a series number and a hierarchy number to the intermediate information. The intermediate information 1602 shown in FIG. 16B is assigned with the hierarchy information m and the series number n as attributes to generate the intermediate information 1603 shown in FIG. The series number is assigned from the upper left to the right in the table of FIG. 16B, and in the next line, the number is assigned from the leftmost element to the right element. Series numbers are assigned in order from 2. Series number 1 is given as a number representing the document itself.

「シリアライズDOMにおける要素型の付与ステップ」S0504においては、自身が属するシリアライズDOMブロックが示す要素の型を示す属性を与える。本実施形態1では、一例をあげれば、中間情報0901のrootの要素型はElementである。したがって、この例では、rootに対応するシリアライズDOMブロック中のシリアライズDOMに対して要素型Elementが要素型として付与される。シリアライズDOMブロック群1502の二つ目のブロック中の行番号1501の10行目にこの文字が付与されている。   In “assignment step of element type in serialized DOM” S0504, an attribute indicating the type of element indicated by the serialized DOM block to which the element belongs is given. In the first embodiment, for example, the root element type of the intermediate information 0901 is Element. Therefore, in this example, the element type Element is assigned as the element type to the serialized DOM in the serialized DOM block corresponding to the root. This character is assigned to the 10th line of the line number 1501 in the second block of the serialized DOM block group 1502.

「シリアライズDOMにおける親要素参照位置の付与ステップ」S0505においては、シリアライズDOMブロックにおける親要素参照位置が付与される。図16(C)に示すXMLドキュメント情報から生成される中間情報1603より要素の親要素に関する親要素情報を取得し、シリアライズDOMの親要素参照位置に前記親要素情報を付与する機能を有する。本実施形態1では、前述したように、中間情報1603におけるシリーズナンバーn=3の要素の親要素とは、自身に対して直上にある要素を意味しており、シリーズナンバーn=2が親要素となる。この親要素を表すシリアライズDOMブロックの先頭行の行番号は「10」である。したがって、この例では、親要素参照位置付与手段は、シリーズナンバーn=3に対応するシリアライズDOMブロック中のシリアライズDOMに対して行番号の「10」を親要素参照位置として付与する。このシリアライズDOMは、シリアライズDOMブロック群1502の三つ目のブロックに対応し、行番号1501の20行目にこの数値が付与されている。   In "Granting step of parent element reference position in serialized DOM" S0505, the parent element reference position in the serialized DOM block is given. It has a function of acquiring parent element information related to the parent element of the element from the intermediate information 1603 generated from the XML document information shown in FIG. 16C and assigning the parent element information to the parent element reference position of the serialized DOM. In the first embodiment, as described above, the parent element of the element of series number n = 3 in the intermediate information 1603 means an element immediately above itself, and the series number n = 2 is the parent element. It becomes. The line number of the first line of the serialized DOM block representing this parent element is “10”. Therefore, in this example, the parent element reference position assigning means assigns the row number “10” as the parent element reference position to the serialized DOM in the serialized DOM block corresponding to the series number n = 3. This serialized DOM corresponds to the third block of the serialized DOM block group 1502, and this numerical value is given to the 20th line of the line number 1501.

ところで、この親要素参照位置をあらわすシリアライズDOMブロック内における行番号は、計算により求めることができる。すなわち、本実施形態においては、   By the way, the row number in the serialized DOM block representing the parent element reference position can be obtained by calculation. That is, in this embodiment,

親要素参照位置=9×(n−1)+1
となる。例えば、前記の例では、n=2を代入することにより親要素参照位置を示す値である「10」を得ることができる。
Parent element reference position = 9 × (n−1) +1
It becomes. For example, in the above example, “10” that is a value indicating the parent element reference position can be obtained by substituting n = 2.

「シリアライズDOMにおける子要素参照位置の付与ステップ」S0506においては、シリアライズDOMにおける子要素参照位置が付与される。本実施形態1では、中間情報1603におけるシリーズナンバーn=3の要素の子要素とは、自身の直下にある要素を意味しており、シリーズナンバーn=4が子要素となる。子要素であるシリーズナンバーn=4の要素のシリアライズDOMブロックの先頭行の行番号は「28」である。したがって、この例では、子要素参照位置付与手段は、シリーズナンバーn=3に対応するシリアライズDOMブロック中のシリアライズDOMに対して行番号の「28」を子要素参照位置として付与する。前記シリアライズDOMブロックは、シリアライズDOMブロック群1502の三つ目のブロックに対応し、行番号1501の21行目のシリアライズDOMにこの数値が付与されている。   In the “assignment step of child element reference position in serialized DOM” S0506, the child element reference position in serialized DOM is assigned. In the first embodiment, the child element of the element with the series number n = 3 in the intermediate information 1603 means an element immediately below itself, and the series number n = 4 is a child element. The line number of the first line of the serialized DOM block of the element of series number n = 4 which is a child element is “28”. Therefore, in this example, the child element reference position assigning unit assigns the row number “28” as the child element reference position to the serialized DOM in the serialized DOM block corresponding to the series number n = 3. The serialized DOM block corresponds to the third block of the serialized DOM block group 1502, and this numerical value is assigned to the serialized DOM in the 21st row of the row number 1501.

ところで、この子要素参照位置をあらわすシリアライズDOMブロック内における行番号は、計算により求めることができる。すなわち、本実施形態においては、   By the way, the line number in the serialized DOM block representing the child element reference position can be obtained by calculation. That is, in this embodiment,

子要素参照位置=9×(n−1)+1 となる。例えば、前記の例では、n=4を代入することにより子要素参照位置を示す値である「28」を得ることができる。   Child element reference position = 9 × (n−1) +1. For example, in the above example, “28” which is a value indicating the child element reference position can be obtained by substituting n = 4.

「シリアライズDOMにおける属性情報参照位置の付与ステップ」S0507においては、シリアライズDOMにおける属性情報参照位置が付与される。本実施例1では、属性情報が無いが、このような場合には、シリアライズDOMブロック中の属性情報を付与するシリアライズDOMに対して属性情報参照位置を示す値である「0」を付与する。   In the “assignment step of attribute information reference position in serialized DOM” S0507, the attribute information reference position in serialized DOM is assigned. In the first embodiment, there is no attribute information. In such a case, “0” that is a value indicating the attribute information reference position is assigned to the serialized DOM to which the attribute information in the serialized DOM block is assigned.

「シリアライズDOMにおける次要素参照位置の付与ステップ」S0504は、シリアライズDOMにおける次要素が付与される。本実施形態では、中間情報1603におけるシリーズナンバーn=3の要素の次要素は、前述したように自分自身と同一の階層にあり、隣接しかつより大きなシリーズナンバーを有する要素を指し、シリーズナンバーn=5が次要素となる。この次要素を表すシリアライズDOMブロックの先頭行の行番号1501は行番号の「37」である。したがって、この例では、数値「37」を次要素として付与する。前記シリアライズDOMブロックは、シリアライズDOMブロック群1502の三つ目のブロックであり、行番号1501の23行目にこの数値が付与されている。   The “next element reference position assignment step in the serialized DOM” S0504 is assigned the next element in the serialized DOM. In the present embodiment, the element next to the element of the series number n = 3 in the intermediate information 1603 is an element that is in the same hierarchy as itself as described above and is adjacent and has a higher series number. = 5 is the next element. The line number 1501 of the first line of the serialized DOM block representing this next element is the line number “37”. Therefore, in this example, the numerical value “37” is assigned as the next element. The serialized DOM block is the third block of the serialized DOM block group 1502, and this numerical value is assigned to the 23rd row of the row number 1501.

ところで、この次要素をあらわすシリアライズDOMブロック内における行番号は、計算により求めることができる。すなわち、本実施形態においては、   By the way, the row number in the serialized DOM block representing this next element can be obtained by calculation. That is, in this embodiment,

子要素参照位置=9×(n−1)+1 となる。例えば、前記の例では、n=5を代入することにより次要素参照位置を示す値である「37」を得ることができる。   Child element reference position = 9 × (n−1) +1. For example, in the above example, “37” that is a value indicating the next element reference position can be obtained by substituting n = 5.

「テキストの文字列を準備文字列情報から検索し、最初に現れた同じ文字列の先頭位置の付与ステップ」S0509においては、シリアライズDOMにテキストの文字列を準備文字列情報から検索し、最初に現れた同じ文字列の先頭位置が付与される。本実施形態1では、本実施形態1では、シリーズナンバーn=3が保持する文字列情報contentは、図13の準備文字列情報1301において左端のrの位置を「0」番目とすると、「4」番目の位置からcontentの文字が配列されている。したがって、本実施形態1においては数値「4」が準備文字列先頭位置として付与される。前記シリアライズDOMブロックは、シリアライズDOMブロック群1502の三つ目のブロックであり、行番号1501の24行目にこの数値が付与されている。   In the step of “searching the text string from the prepared string information and assigning the head position of the same string first appearing” S0509, the serialized DOM is searched from the prepared string information for the text string, The head position of the same character string that appears is given. In the first embodiment, in the first embodiment, the character string information content held by the series number n = 3 is “4” when the position of r at the left end in the prepared character string information 1301 in FIG. The content characters are arranged from the “th” position. Therefore, in the first embodiment, the numerical value “4” is given as the preparation character string head position. The serialized DOM block is the third block of the serialized DOM block group 1502, and this numerical value is given to the 24th row of the row number 1501.

「テキストの文字列長の付与ステップ」S0510においては、シリアライズDOMにテキストの文字列長を付与される。本実施形態1では、シリーズナンバーn=3が保持する文字列情報contentの文字数は、「7」である。したがって、本実施形態1では、数値「7」が文字長として付与される。前記シリアライズDOMブロックは、シリアライズDOMブロック群1502の三つ目のブロックであり、行番号1501の25行目にこの数値が付与されている。
「上記データからシリアライズDOMブロックを生成するステップ」S0511においては、シリアライズDOMブロックが生成される。例えば、シリアライズDOMブロック群1502の行番号1501の1行目から9行目で示される範囲に存するシリアライズDOMの集合がシリアライズDOMブロックとして生成される。
In “text character string length assigning step” S0510, the character string length of the text is assigned to the serialized DOM. In the first embodiment, the number of characters of the character string information content held by the series number n = 3 is “7”. Therefore, in the first embodiment, the numerical value “7” is assigned as the character length. The serialized DOM block is the third block of the serialized DOM block group 1502, and this numerical value is given to the 25th line of the line number 1501.
In “Step of generating serialized DOM block from the above data” S0511, a serialized DOM block is generated. For example, a set of serialized DOMs in the range indicated by the first to ninth lines of the line number 1501 of the serialized DOM block group 1502 is generated as a serialized DOM block.

「すべての要素についてシリアライズDOMブロックを生成ステップ」S0512においていは、すべての要素についてシリアライズDOMブロックが生成されたかどうかが判定される。すべての要素についてシリアライズDOMブロックが生成された場合は、次ステップへ進み、すべての要素についてシリアライズDOMブロックが生成されていない場合は、再びシリアライズDOMブロック生成のステップに戻る。   In “Generate serialized DOM block for all elements” S0512, it is determined whether or not serialized DOM blocks have been generated for all elements. When serialized DOM blocks have been generated for all elements, the process proceeds to the next step. When serialized DOM blocks have not been generated for all elements, the process returns to the step of generating serialized DOM blocks again.

「上記データからシリアライズDOMブロック群を生成するステップ」S0513においては、シリアライズDOMブロック群が生成される。シリアライズDOMブロックを連続して生成するものであり、図17(D)はシリアライズDOMブロック群の一例である。   In “Step of generating a serialized DOM block group from the above data” S0513, a serialized DOM block group is generated. Serialized DOM blocks are continuously generated, and FIG. 17D is an example of a serialized DOM block group.

「上記データからシリアライズDOMブロック体を出力するステップ」S0514においては、シリアライズDOMブロック体が出力される。一例として、シリアライズDOMブロック体1702は、シリアライズDOMブロック群1701からなる。このシリアライズDOMブロック体は、送信のために、さらに二進数に置き換えるための中間情報の生成や、中間情報から二進数データ生成なども含まれる。
≪実施形態3≫
In “Step of outputting serialized DOM block body from the above data” S0514, the serialized DOM block body is output. As an example, the serialized DOM block body 1702 includes a serialized DOM block group 1701. This serialized DOM block includes generation of intermediate information for replacement with binary numbers for transmission, generation of binary data from the intermediate information, and the like.
<< Embodiment 3 >>

<全体構成>   <Overall configuration>

実施形態3は、シリアライズDOMブロック体生成装置0102であって、XMLドキュメント情報取得部0103と、シリアライズDOMブロック体生成部0104と、シリアライズDOMブロック体出力部0105と、を有し、前記シリアライズDOMブロック体生成部0108は、シリアライズDOM生成手段0107と、文字列情報生成手段0110と、シリアライズDOMブロック生成手段0108と、シリアライズDOMブロック群生成手段0109と、を有し、前記シリアライズDOMブロック体0702は、シリアライズDOMブロック群0703と、文字列情報0704とからなり、前記シリアライズDOMブロック群0703は、シリアライズDOMブロック1410からなり、前記シリアライズDOMブロックは、シリアライズDOM1401からシリアライズDOM1409なり、前記シリアライズDOM生成部は、要素型付与手段0111と、親要素参照位置付与手段0112と、子要素参照位置付与手段0113と、属性情報参照位置付与手段0114と、次要素参照位置付与手段0115と、文字列先頭位置付与手段0116と、文字列長付与手段0117と、を有するシリアライズDOMブロック体生成装置であり、特徴点は、前記文字列情報は圧縮済み文字列情報である点をあげることができる。   Embodiment 3 is a serialized DOM block body generation device 0102, which includes an XML document information acquisition unit 0103, a serialized DOM block body generation unit 0104, and a serialized DOM block body output unit 0105, and the serialized DOM block The field generation unit 0108 includes a serialized DOM generation unit 0107, a character string information generation unit 0110, a serialized DOM block generation unit 0108, and a serialized DOM block group generation unit 0109. The serialized DOM block body 0702 includes: The serialized DOM block group 0703 and character string information 0704 are included. The serialized DOM block group 0703 includes a serialized DOM block 1410. The serialized DOM block is a serialized DOM block. The serialized DOM generation unit includes an element type assigning unit 0111, a parent element reference position providing unit 0112, a child element reference position providing unit 0113, an attribute information reference position providing unit 0114, and a next element. A serialized DOM block body generating device having a reference position assigning unit 0115, a character string head position assigning unit 0116, and a character string length providing unit 0117. The feature point is that the character string information is compressed character string information. There are some points.

<実施形態3の構成の説明>   <Description of Configuration of Embodiment 3>

特徴点以外の構成要件、シリアライズDOMブロック体生成装置、XMLドキュメント情報取得部、シリアライズDOMブロック体生成部、シリアライズDOMブロック体出力部、シリアライズDOM生成手段、文字列情報生成手段、シリアライズDOMブロック生成手段、シリアライズDOMブロック群生成手段、シリアライズDOMブロック体、シリアライズDOMブロック群、文字列情報、シリアライズDOMブロック、シリアライズDOM、要素型付与手段、親要素参照位置付与手段、子要素参照位置付与手段、属性情報参照位置付与手段、次要素参照位置付与手段、文字列先頭位置付与手段、文字列長付与手段、に関しては、実施形態1と基本的に機能は共通であるので、詳細な説明は省略する。   Configuration requirements other than feature points, serialized DOM block body generation device, XML document information acquisition unit, serialized DOM block body generation unit, serialized DOM block body output unit, serialized DOM generation unit, character string information generation unit, serialized DOM block generation unit Serialized DOM block group generation means, serialized DOM block body, serialized DOM block group, character string information, serialized DOM block, serialized DOM, element type giving means, parent element reference position giving means, child element reference position giving means, attribute information Since the reference position giving means, the next element reference position giving means, the character string head position giving means, and the character string length giving means have basically the same functions as those of the first embodiment, detailed description thereof will be omitted.

図10は、圧縮文字列情報を生成する装置の一例を示したものである。   FIG. 10 shows an example of an apparatus that generates compressed character string information.

本実施形態の説明においては、本実施形態に特徴的な圧縮済み文字列情報について説明する。   In the description of the present embodiment, compressed character string information characteristic of the present embodiment will be described.

「圧縮済み文字列情報」1003は、シリアライズDOMブロックで参照される文字列単体の集合である文字列群を圧縮した圧縮済み文字列を示す情報である。一例をあげれば、圧縮済み文字列情報1003は、XMLドキュメント内1001における文字列を、表1002にすべて記述し、繰り返し現れる同じ文字列をひとつの文字列で代表させることによって得られる。
<実施形態3の処理の流れ>
“Compressed character string information” 1003 is information indicating a compressed character string obtained by compressing a character string group that is a set of character strings referred to in the serialized DOM block. For example, the compressed character string information 1003 is obtained by describing all the character strings in the XML document 1001 in the table 1002 and representing the same character string that appears repeatedly as one character string.
<Processing flow of Embodiment 3>

図4は、本実施形態における圧縮済み文字列情報を得るためのフローチャートの例を示す図である。   FIG. 4 is a diagram showing an example of a flowchart for obtaining compressed character string information in the present embodiment.

「同じ文字列は同じ列に書きこむというルールに基づいて、XMLドキュメントのすべての文字列を文字列表に書き込むステップ」S0401では、同じ文字列は同じ列に書きこむというルールに基づいて、XMLドキュメントのすべての文字列を文字列表に書き込む。一例をあげれば、文字列表は、二次元の表1002である。この文字列表1002に、XMLドキュメント1001に現れる文字列を表の上段の行から順番に文字列情報圧縮テーブル1002に挿入する。この挿入する際のルールは、同じ文字列の場合には同じ列に記述するというルールであるが、さらに、前記文字列内に含まれかつ連続する文字列が、すでに表内に記述された文字列の一部である場合には、前記文字列内に含まれかつ連続する文字列を、すでに文字が挿入された行よりも下の行の対応する連続する列に挿入することにより、より圧縮効率を高めることが可能である。   “Step of writing all character strings of the XML document to the character string table based on the rule that the same character string is written in the same column” In S0401, the XML document is based on the rule that the same character string is written in the same column. Write all strings in to the string table. For example, the character string table is a two-dimensional table 1002. Character strings appearing in the XML document 1001 are inserted into the character string table 1002 in order from the upper row of the table. The rule for this insertion is that the same character string is described in the same column, but further, a continuous character string included in the character string is already described in the table. If it is part of a column, it is more compressed by inserting the string that is contained in and continuous in the string into the corresponding continuous column below the line where the character has already been inserted. It is possible to increase efficiency.

「文字列表から圧縮文字列情報を生成するステップ」S0402では、文字列表から圧縮文字列情報を生成する。このステップで得られる圧縮文字列情報が、圧縮済み文字列情報である。この圧縮済み文字列情報を取得するためには、たとえば、文字列表のひとつの列からはひとつの文字を抽出するというルールにしたがって抽出すればよい。
このような圧縮文字列情報を用いることにより、送信データの圧縮が可能になる。
≪実施形態4≫
In “Step of generating compressed character string information from character string table” S0402, compressed character string information is generated from the character string table. The compressed character string information obtained in this step is compressed character string information. In order to acquire this compressed character string information, for example, extraction may be performed according to a rule that one character is extracted from one column of the character string table.
By using such compressed character string information, transmission data can be compressed.
<< Embodiment 4 >>

<実施形態4の全体>   <Overall of Embodiment 4>

実施形態4は、シリアライズDOMブロック体生成装置0102であって、XMLドキュメント情報取得部0103と、シリアライズDOMブロック体生成部0104と、シリアライズDOMブロック体出力部0105と、を有し、前記シリアライズDOMブロック体生成部0108は、シリアライズDOM生成手段0107と、文字列情報生成手段0110と、シリアライズDOMブロック生成手段0108と、シリアライズDOMブロック群生成手段0109と、を有し、前記シリアライズDOMブロック体0702は、シリアライズDOMブロック群0703と、文字列情報0704とからなり、前記シリアライズDOMブロック群0703は、シリアライズDOMブロック1410からなり、前記シリアライズDOMブロックは、シリアライズDOM1401からシリアライズDOM1409なり、前記シリアライズDOM生成部は、要素型付与手段0111と、親要素参照位置付与手段0112と、子要素参照位置付与手段0113と、属性情報参照位置付与手段0114と、次要素参照位置付与手段0115と、文字列先頭位置付与手段0116と、文字列長付与手段0117と、を有するシリアライズDOMブロック体生成装置であり、特徴点は、前記シリアライズDOMが可変バイト収納構造を有する、点をあげることができる。   The fourth embodiment is a serialized DOM block body generation device 0102, which includes an XML document information acquisition unit 0103, a serialized DOM block body generation unit 0104, and a serialized DOM block body output unit 0105, and the serialized DOM block The field generation unit 0108 includes a serialized DOM generation unit 0107, a character string information generation unit 0110, a serialized DOM block generation unit 0108, and a serialized DOM block group generation unit 0109. The serialized DOM block body 0702 includes: The serialized DOM block group 0703 and character string information 0704 are included. The serialized DOM block group 0703 includes a serialized DOM block 1410. The serialized DOM block is a serialized DOM block. The serialized DOM 1409 is changed from the serialized DOM 1401 to the serialized DOM 1409. The serialized DOM generation unit includes an element type assigning unit 0111, a parent element reference position providing unit 0112, a child element reference position providing unit 0113, an attribute information reference position providing unit 0114, and a next element. It is a serialized DOM block body generating device having a reference position giving unit 0115, a character string head position giving unit 0116, and a character string length giving unit 0117. The feature point is that the serialized DOM has a variable byte storage structure. You can give a point.

<実施形態4の構成の説明>   <Description of Configuration of Embodiment 4>

特徴点以外の構成要件、シリアライズDOMブロック体生成装置、XMLドキュメント情報取得部、シリアライズDOMブロック体生成部、シリアライズDOMブロック体出力部、シリアライズDOM生成手段、文字列情報生成手段、シリアライズDOMブロック生成手段、シリアライズDOMブロック群生成手段、シリアライズDOMブロック体、シリアライズDOMブロック群、文字列情報、シリアライズDOMブロック、シリアライズDOM、要素型付与手段、親要素参照位置付与手段、子要素参照位置付与手段、属性情報参照位置付与手段、次要素参照位置付与手段、文字列先頭位置付与手段、文字列長付与手段、に関しては、実施形態1と基本的に機能は共通であるので、詳細な説明は省略する。   Configuration requirements other than feature points, serialized DOM block body generation device, XML document information acquisition unit, serialized DOM block body generation unit, serialized DOM block body output unit, serialized DOM generation unit, character string information generation unit, serialized DOM block generation unit Serialized DOM block group generation means, serialized DOM block body, serialized DOM block group, character string information, serialized DOM block, serialized DOM, element type giving means, parent element reference position giving means, child element reference position giving means, attribute information Since the reference position giving means, the next element reference position giving means, the character string head position giving means, and the character string length giving means have basically the same functions as those of the first embodiment, detailed description thereof will be omitted.

図12は、本実施形態における可変バイト収納構造とフィールドデリミタの構造を示す図である。   FIG. 12 is a diagram showing a variable byte storage structure and a field delimiter structure in the present embodiment.

本実施形態の説明においては、本実施形態に特徴的な可変バイト収納構造について説明する。   In the description of this embodiment, the variable byte storage structure characteristic of this embodiment will be described.

「可変バイト収納構造」とは、1バイトごとに属性を有するデータの終了バイトであるか、終了バイトでないかを示すフィールドデリミタを有する構造のことである。一例をあげれば、図12の1204はフィールドデリミタである。また、これにつづく7桁の2進数1205はバイトデータである。図12の1201は、1バイトの場合のバイトデータであり、フィールドデリミタの値は1である。バイトデータのトップの数字がデータのフィールドデリミタ、すなわち区切り文字として認識され、前記区切り文字が1の場合がデータ区切りを意味し、前記区切り文字が0の場合はデータが連続することを意味する。バイトデータのトップは、単に区切り文字として認識されるので、前記バイトデータ1201は、0000001が値となる。図12の1202は、2バイトの場合のバイトデータである。区切り文字1206は1、区切り文字1208は0である。この場合、区切り文字はデータではないので読み飛ばされ、前記バイトデータ1202は、10010000000001が値となる。図12の1203は、3バイトの場合のバイトデータである。区切り文字1210は1、区切り文字1212は0、区切り文字1215は0である。この場合も区切り文字は単なる区切り文字として認識され読み飛ばされるので、前記バイトデータ1203は、010000000011010000110が値となる。   The “variable byte storage structure” is a structure having a field delimiter indicating whether each byte is an end byte of data having an attribute or not. As an example, 1204 in FIG. 12 is a field delimiter. The 7-digit binary number 1205 that follows this is byte data. 1201 in FIG. 12 is byte data in the case of 1 byte, and the value of the field delimiter is 1. The number at the top of the byte data is recognized as a data field delimiter, that is, a delimiter. When the delimiter is 1, it means a data delimiter, and when the delimiter is 0, it means that data is continuous. Since the top of the byte data is simply recognized as a delimiter, the byte data 1201 has a value of 0000001. 1202 in FIG. 12 is byte data in the case of 2 bytes. The delimiter 1206 is 1, and the delimiter 1208 is 0. In this case, since the delimiter is not data, it is skipped and the byte data 1202 has a value of 10010000000001. 1203 in FIG. 12 is byte data in the case of 3 bytes. The delimiter 1210 is 1, the delimiter 1212 is 0, and the delimiter 1215 is 0. Also in this case, since the delimiter is recognized as a simple delimiter and skipped, the value of the byte data 1203 is 010000000011000010001.

シリアライズDOMに、フィールドデリミタを有する可変バイト収納構造を持たせることにより、無駄な空白スペースが生じることを防止することができる。このフィールドデリミタを用いた前記シリアライズDOMの可変バイトデータ収納構造を有するシリアライズDOMブロック体生成装置は、請求項2または請求項3のシリアライズDOMにおいても同様の構造の実現が可能である。
≪実施形態5≫
By providing the serialized DOM with a variable byte storage structure having a field delimiter, it is possible to prevent a useless blank space from being generated. The serialized DOM block generation device having the variable byte data storage structure of the serialized DOM using the field delimiter can realize the same structure also in the serialized DOM of claim 2 or claim 3.
<< Embodiment 5 >>

<全体構成>   <Overall configuration>

実施形態5は、シリアライズDOMブロック体生成装置0102であって、XMLドキュメント情報取得部0103と、シリアライズDOMブロック体生成部0104と、シリアライズDOMブロック体出力部0105と、を有し、前記シリアライズDOMブロック体生成部0108は、シリアライズDOM生成手段0107と、文字列情報生成手段0110と、シリアライズDOMブロック生成手段0108と、シリアライズDOMブロック群生成手段0109と、を有し、前記シリアライズDOMブロック体0702は、シリアライズDOMブロック群0703と、文字列情報0704とからなり、前記シリアライズDOMブロック群0703は、シリアライズDOMブロック1410からなり、前記シリアライズDOMブロックは、シリアライズDOM1401からシリアライズDOM1409なり、前記シリアライズDOM生成部は、要素型付与手段0111と、親要素参照位置付与手段0112と、子要素参照位置付与手段0113と、属性情報参照位置付与手段0114と、次要素参照位置付与手段0115と、文字列先頭位置付与手段0116と、文字列長付与手段0117と、を有するシリアライズDOMブロック体生成装置であり、特徴点は、シリアライズDOMブロック群中のシリアライズDOMブロックのシリアライズDOMの配列順位は固定である、点にある。   The fifth embodiment is a serialized DOM block body generation device 0102, which includes an XML document information acquisition unit 0103, a serialized DOM block body generation unit 0104, and a serialized DOM block body output unit 0105, and the serialized DOM block The field generation unit 0108 includes a serialized DOM generation unit 0107, a character string information generation unit 0110, a serialized DOM block generation unit 0108, and a serialized DOM block group generation unit 0109. The serialized DOM block body 0702 includes: The serialized DOM block group 0703 and character string information 0704 are included. The serialized DOM block group 0703 includes a serialized DOM block 1410. The serialized DOM block is a serialized DOM block. The serialized DOM 1409 is changed from the serialized DOM 1401 to the serialized DOM 1409. The serialized DOM generation unit includes an element type assigning unit 0111, a parent element reference position providing unit 0112, a child element reference position providing unit 0113, an attribute information reference position providing unit 0114, and a next element. A serialized DOM block body generating device having a reference position providing unit 0115, a character string head position providing unit 0116, and a character string length providing unit 0117, and a feature point is serialization of a serialized DOM block in a serialized DOM block group The order of DOM arrangement is fixed.

<実施形態5の構成の説明>   <Description of Configuration of Embodiment 5>

特徴点以外の構成要件、シリアライズDOMブロック体生成装置、XMLドキュメント情報取得部、シリアライズDOMブロック体生成部、シリアライズDOMブロック体出力部、シリアライズDOM生成手段、文字列情報生成手段、シリアライズDOMブロック生成手段、シリアライズDOMブロック群生成手段、シリアライズDOMブロック体、シリアライズDOMブロック群、文字列情報、シリアライズDOMブロック、シリアライズDOM、要素型付与手段、親要素参照位置付与手段、子要素参照位置付与手段、属性情報参照位置付与手段、次要素参照位置付与手段、文字列先頭位置付与手段、文字列長付与手段、に関しては、実施形態1と基本的に機能は共通であるので、詳細な説明は省略する。   Configuration requirements other than feature points, serialized DOM block body generation device, XML document information acquisition unit, serialized DOM block body generation unit, serialized DOM block body output unit, serialized DOM generation unit, character string information generation unit, serialized DOM block generation unit Serialized DOM block group generation means, serialized DOM block body, serialized DOM block group, character string information, serialized DOM block, serialized DOM, element type giving means, parent element reference position giving means, child element reference position giving means, attribute information Since the reference position assigning means, the next element reference position assigning means, the character string head position assigning means, and the character string length giving means have basically the same functions as those of the first embodiment, detailed description thereof will be omitted.

図14は、本実施形態におけるシリアライズDOMブロックの配列順位の一例を示す。   FIG. 14 shows an example of the arrangement order of serialized DOM blocks in the present embodiment.

ここでは、実施形態5に特徴的なシリアライズDOMブロック群中のシリアライズDOMブロックのシリアライズDOMの配列順位は固定である点、について説明する。   Here, the point that the arrangement order of the serialized DOMs of the serialized DOM blocks in the serialized DOM block group that is characteristic of the fifth embodiment is fixed will be described.

「シリアライズDOMブロック群中のシリアライズDOMブロックのシリアライズDOMの配列順位は固定である」とは、シリアライズDOMブロック群中のシリアライズDOMブロックのシリアライズDOMの配列の順位が固定であることを示す。一例をあげれば、図14に示すシリアライズDOMブロック1410を構成するシリアライズDOMの配列順位が、シリアライズDOMブロック群中のいずれのシリアライズDOMブロックにおいてもシリアライズDOMの配列が固定である、ということである。   “The serialized DOM array order of the serialized DOM blocks in the serialized DOM block group is fixed” indicates that the serialized DOM array order of the serialized DOM blocks in the serialized DOM block group is fixed. For example, the serialized DOM arrangement order of the serialized DOM blocks 1410 shown in FIG. 14 is that the serialized DOM arrangement is fixed in any serialized DOM block in the serialized DOM block group.

これによって、いかなる要素に対しても、同じシリアライズDOMの配列順序となるために、標準化が容易になる。これは、請求項2においても同様の手段の実現が可能である。   This facilitates standardization because any element has the same serialized DOM arrangement order. The same means can be realized in claim 2 as well.

シリアライズDOMブロック体生成装置機能ブロックを示した図。The figure which showed the serialization DOM block body production | generation apparatus functional block. シリアライズDOMブロック体生成装置機能ブロックを示した図。The figure which showed the serialization DOM block body production | generation apparatus functional block. シリアライズDOMブロック体生成のフローチャートを示した図。The figure which showed the flowchart of a serialization DOM block body production | generation. 圧縮文字列情報を生成するフローチャートを示した図。The figure which showed the flowchart which produces | generates compressed character string information. シリアライズDOMブロック体生成のフローチャートを示した図。The figure which showed the flowchart of a serialization DOM block body production | generation. シリアライズDOMブロック体生成装置にて入力加工出力されるデータを示す概念図。The conceptual diagram which shows the data input and output by the serialization DOM block body production | generation apparatus. シリアライズDOMブロック体生成装置にて入力加工出力されるデータを示す概念図。The conceptual diagram which shows the data input and output by the serialization DOM block body production | generation apparatus. XMLドキュメントから生成される中間情報のひとつを表した図。The figure showing one of the intermediate information produced | generated from an XML document. DOMツリーを表す図。A diagram representing a DOM tree. 圧縮文字列を作成するための文字列表を示した図。The figure which showed the character string table for creating a compression character string. シリアライズDOMブロック体の概念図。The conceptual diagram of a serialized DOM block body. フィールドデリミタを有する可変バイトデータ収納構造を示した図。The figure which showed the variable byte data storage structure which has a field delimiter. 準備文字列情報の例を示した図。The figure which showed the example of preparation character string information. シリアライズDOMとシリアライズDOMブロックの関係を示す図。The figure which shows the relationship between serialized DOM and a serialized DOM block. シリアライズDOMブロックの概念図とシリアライズDOMの先頭位置からの順序の表示図。The conceptual diagram of a serialized DOM block, and the display figure of the order from the head position of serialized DOM. シリアライズDOMブロック体生成装置にて入力加工出力されるデータを示す概念図。The conceptual diagram which shows the data input and output by the serialization DOM block body production | generation apparatus. シリアライズDOMブロック体生成装置にて入力加工出力されるデータを示す概念図。The conceptual diagram which shows the data input and output by the serialization DOM block body production | generation apparatus.

符号の説明Explanation of symbols

0601 XMLドキュメント
0604 文字列情報
0801 単位情報
0907 DOMツリー
1107 シリアライズDOMブロック群
1108 文字列情報
1109 シリアライズDOMブロック体
1301 準備文字列情報
1502 シリアライズDOMブロック群概念図
1503 シリアライズDOMのシリアライズDOMブロック群の先頭位置からの位置情報を表す行番号
0601 XML document 0604 character string information 0801 unit information 0907 DOM tree 1107 serialized DOM block group 1108 character string information 1109 serialized DOM block body 1301 preparation character string information 1502 serialized DOM block group conceptual diagram 1503 start position of serialized DOM block group of serialized DOM The line number representing the location information from

Claims (7)

XMLドキュメント情報からシリアライズDOMブロック体を生成するシリアライズDOMブロック体生成装置であって、XMLドキュメント情報を取得するXMLドキュメント情報取得部と、シリアライズDOMブロック体生成部と、シリアライズDOMブロック体出力部と、を有し、
前記シリアライズDOMブロック体生成部は、シリアライズDOM生成手段と、文字列情報生成手段と、シリアライズDOMブロック生成手段と、シリアライズDOMブロック群生成手段と、を有し、
前記シリアライズDOMブロック体は、
シリアライズDOMブロック群と、文字列情報とからなり、
前記シリアライズDOMブロック群は、シリアライズDOMブロックからなり、
前記シリアライズDOMブロックは、シリアライズDOMからなり、
前記シリアライズDOM生成手段は、以下の(1)から(7)の手段を有するシリアライズDOMブロック体生成装置。
(1)自身が属するシリアライズDOMブロックが示す要素の型を示す属性を与える要素型付与手段
(2)自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき親要素を示す親シリアライズDOMブロックの位置を示す属性を与える親要素参照位置付与手段
(3)自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき子要素を示す子要素シリアライズDOMブロックの位置を示す属性を与える子要素参照位置付与手段
(4)自身が属するシリアライズDOMブロックに含まれる要素の内、属性を有する要素がある場合に、その要素の属性を示すシリアライズDOMのシリアライズDOMブロック群中での位置を示す属性を与える属性情報参照位置付与手段
(5)自身が属するシリアライズDOMブロックで示す要素の次に続く要素を示す次要素シリアライズDOMブロックのシリアライズDOMブロック群中での位置を示す属性を与える次要素参照位置付与手段
(6)自身が属するシリアライズDOMブロックが値を有する場合に、その値を示す前記文字列情報中での文字列の先頭位置を示す属性を与える文字列先頭位置付与手段
(7)自身が属するシリアライズDOMブロックが値を有する場合に、その値を示す前記文字列情報中での文字列の長さを示す属性を与える文字列長付与手段
A serialized DOM block body generation device that generates a serialized DOM block body from XML document information, an XML document information acquisition unit that acquires XML document information, a serialized DOM block body generation unit, a serialized DOM block body output unit, Have
The serialized DOM block body generation unit includes serialized DOM generation means, character string information generation means, serialized DOM block generation means, and serialized DOM block group generation means,
The serialized DOM block body is:
It consists of a serialized DOM block group and character string information.
The serialized DOM block group includes serialized DOM blocks.
The serialized DOM block includes a serialized DOM.
The serialized DOM generation means is a serialized DOM block body generation apparatus having the following means (1) to (7).
(1) Element type giving means for giving an attribute indicating the type of an element indicated by the serialized DOM block to which the serialized DOM block belongs. (2) A parent serialized DOM block showing a parent element to which the serialized DOM block to which the serialized belongs refers should be referenced. Parent element reference position providing means for giving an attribute indicating the position of the child element (3) A child element for giving an attribute indicating the position of the serialized DOM block indicating the child element to which the serialized DOM block to which itself belongs should refer in the serialized DOM block group When there is an element having an attribute among the elements included in the serialized DOM block to which the reference position assigning means (4) belongs, the attribute indicating the position in the serialized DOM block group of the serialized DOM indicating the attribute of the element is displayed. Attribute information reference position giving means (5) itself to give Next element reference position giving means for giving an attribute indicating the position in the serialized DOM block group of the next element serialized DOM block indicating the element following the element indicated by the serialized DOM block to which the serialized DOM block belongs. If the serialized DOM block to which the character string head position assigning means (7) itself belongs has a value, the value is given in the character string information indicating the value. Character string length giving means for giving an attribute indicating the length of the character string in the character string information indicating
XMLドキュメント情報からシリアライズDOMブロック体を生成するシリアライズDOMブロック体生成装置であって、XMLドキュメント情報を取得するXMLドキュメント情報取得部と、シリアライズDOMブロック体生成部と、シリアライズDOMブロック体出力部と、を有し、
前記シリアライズDOMブロック体生成部は、シリアライズDOM生成手段と、シリアライズDOMブロック生成手段と、シリアライズDOMブロック群生成手段と、を有し、
前記シリアライズDOMブロック体は、
シリアライズDOMブロック群からなり、
前記シリアライズDOMブロック群は、シリアライズDOMブロックからなり、
前記シリアライズDOMブロックは、シリアライズDOMからなり、
前記シリアライズDOM生成手段は、以下の(1)から(7)の手段を有するシリアライズDOMブロック体生成装置。
(1)自身が属するシリアライズDOMブロックが示す要素の型を示す属性を与える要素型付与手段
(2)自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき親要素を示す親シリアライズDOMブロックの位置を示す属性を与える親要素参照位置付与手段
(3)自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき子要素を示す子要素シリアライズDOMブロックの位置を示す属性を与える子要素参照位置付与手段
(4)自身が属するシリアライズDOMブロックに含まれる要素の内、属性を有する要素がある場合に、その要素の属性を示すシリアライズDOMのシリアライズDOMブロック群中での位置を示す属性を与える属性情報参照位置付与手段
(5)自身が属するシリアライズDOMブロックで示す要素の次に続く要素を示す次要素シリアライズDOMブロックのシリアライズDOMブロック群中での位置を示す属性を与える次要素参照位置付与手段
(6)自身が属するシリアライズDOMブロックが値を有する場合に、その値を示す文字列情報であって、予め計算機中に用意されたものの文字列の先頭位置を示す属性を与える準備文字列先頭位置付与手段
(7)自身が属するシリアライズDOMブロックが値を有する場合に、その値を示す文字列情報であって、予め計算機中に用意されたものの文字列の長さを示す属性を与える準備文字列長付与手段
A serialized DOM block body generation device that generates a serialized DOM block body from XML document information, an XML document information acquisition unit that acquires XML document information, a serialized DOM block body generation unit, a serialized DOM block body output unit, Have
The serialized DOM block body generation unit includes serialized DOM generation means, serialized DOM block generation means, and serialized DOM block group generation means,
The serialized DOM block body is:
Consists of serialized DOM blocks
The serialized DOM block group includes serialized DOM blocks.
The serialized DOM block includes a serialized DOM.
The serialized DOM generation means is a serialized DOM block body generation apparatus having the following means (1) to (7).
(1) Element type giving means for giving an attribute indicating the type of an element indicated by the serialized DOM block to which the serialized DOM block belongs. (2) A parent serialized DOM block showing a parent element to which the serialized DOM block to which the serialized belongs refers should be referenced. Parent element reference position providing means for giving an attribute indicating the position of the child element (3) A child element for giving an attribute indicating the position of the serialized DOM block indicating the child element to which the serialized DOM block to which itself belongs should refer in the serialized DOM block group When there is an element having an attribute among the elements included in the serialized DOM block to which the reference position assigning means (4) belongs, the attribute indicating the position in the serialized DOM block group of the serialized DOM indicating the attribute of the element is displayed. Attribute information reference position giving means (5) itself to give Next element reference position giving means for giving an attribute indicating the position in the serialized DOM block group of the next element serialized DOM block indicating the element following the element indicated by the serialized DOM block to which the serialized DOM block belongs. If there is a character string information indicating the value of the character string information, the prepared character string head position adding means (7) for giving an attribute indicating the head position of the character string of the character string prepared in advance in the computer. Is a character string information indicating the value, and a preparation character string length giving means for giving an attribute indicating the length of the character string of the one prepared in advance in the computer
前記文字列情報は、シリアライズDOMブロックで参照される文字列単体の集合である文字列群を圧縮した文字列である圧縮済み文字列を示す情報である圧縮済み文字列情報である請求項1に記載のシリアライズDOMブロック体生成装置。   The character string information is compressed character string information that is information indicating a compressed character string that is a character string obtained by compressing a character string group that is a set of character strings referred to in a serialized DOM block. The serialized DOM block body generation device described. 前記シリアライズDOMは、可変バイトデータ収納構造を有し、前記可変バイトデータ収納構造は、1バイトごとに前記属性を示すデータの終了バイトであるか、終了バイトでないかを示すフィールドデリミタを有する請求項1から3の何れか一に記載のシリアライズDOMブロック体生成装置。   The serialized DOM has a variable byte data storage structure, and the variable byte data storage structure has a field delimiter indicating whether each byte is an end byte of data indicating the attribute or not. The serialized DOM block body generation device according to any one of 1 to 3. XMLドキュメント情報からシリアライズDOMブロック体を生成するシリアライズDOMブロック体生成プログラムであって、XMLドキュメント情報を取得するXMLドキュメント情報取得ステップと、シリアライズDOMブロック体生成ステップと、シリアライズDOMブロック体出力ステップと、を計算機に実行させ、
前記シリアライズDOMブロック体生成ステップは、シリアライズDOM生成ステップと、文字列情報生成ステップと、シリアライズDOMブロック生成ステップと、シリアライズDOMブロック群生成ステップと、を有し、
前記シリアライズDOMブロック体は、
シリアライズDOMブロック群と、文字列情報とからなり、
前記シリアライズDOMブロック群は、シリアライズDOMブロックからなり、
前記シリアライズDOMブロックは、シリアライズDOMからなり、
前記シリアライズDOM生成ステップは、以下の(1)から(7)のステップを有するシリアライズDOMブロック体生成プログラム。
(1)自身が属するシリアライズDOMブロックが示す要素の型を示す属性を与える要素型付与ステップ
(2)自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき親要素を示す親シリアライズDOMブロックの位置を示す属性を与える親要素参照位置付与ステップ
(3)自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき子要素を示す子要素シリアライズDOMブロックの位置を示す属性を与える子要素参照位置付与ステップ
(4)自身が属するシリアライズDOMブロックに含まれる要素の内、属性を有する要素がある場合に、その要素の属性を示すシリアライズDOMのシリアライズDOMブロック群中での位置を示す属性を与える属性情報参照位置付与ステップ
(5)自身が属するシリアライズDOMブロックで示す要素の次に続く要素を示す次要素シリアライズDOMブロックのシリアライズDOMブロック群中での位置を示す属性を与える次要素参照位置付与ステップ
(6)自身が属するシリアライズDOMブロックが値を有する場合に、その値を示す前記文字列情報中での文字列の先頭位置を示す属性を与える文字列先頭位置付与ステップ
(7)自身が属するシリアライズDOMブロックが値を有する場合に、その値を示す前記文字列情報中での文字列の長さを示す属性を与える文字列長付与ステップ
A serialized DOM block body generation program for generating a serialized DOM block body from XML document information, an XML document information acquisition step for acquiring XML document information, a serialized DOM block body generation step, a serialized DOM block body output step, To the computer,
The serialized DOM block body generating step includes a serialized DOM generating step, a character string information generating step, a serialized DOM block generating step, and a serialized DOM block group generating step,
The serialized DOM block body is:
It consists of a serialized DOM block group and character string information.
The serialized DOM block group includes serialized DOM blocks.
The serialized DOM block includes a serialized DOM.
The serialized DOM generation step is a serialized DOM block body generation program including the following steps (1) to (7).
(1) Element type giving step for giving an attribute indicating the type of an element indicated by the serialized DOM block to which the serialized DOM block belongs (2) Parent serialized DOM block indicating a parent element to which the serialized DOM block to which the serialized writer belongs should refer Parent element reference position giving step for giving an attribute indicating the position of the child element (3) A child element for giving an attribute indicating the position of the serialized DOM block indicating the child element to which the serialized DOM block to which it belongs should refer in the serialized DOM block group Reference position assignment step (4) When there is an element having an attribute among the elements included in the serialized DOM block to which the reference position belongs, an attribute indicating the position in the serialized DOM block group of the serialized DOM indicating the attribute of the element Attribute information reference position assignment given (5) Next element reference position assignment step (6) itself that gives an attribute indicating the position in the serialized DOM block group of the next element serialized DOM block indicating the element following the element indicated by the serialized DOM block to which it belongs When the serialized DOM block to which the character string belongs has a value, a character string head position adding step (7) for giving an attribute indicating the head position of the character string in the character string information indicating the value. A character string length giving step for giving an attribute indicating the length of the character string in the character string information indicating the value
XMLドキュメント情報からシリアライズDOMブロック体を生成するシリアライズDOMブロック体生成プログラムであって、XMLドキュメント情報を取得するXMLドキュメント情報取得ステップと、シリアライズDOMブロック体生成ステップと、シリアライズDOMブロック体出力ステップ部と、を計算機に実行させ、
前記シリアライズDOMブロック体生成ステップは、シリアライズDOM生成ステップと、シリアライズDOMブロック生成ステップと、シリアライズDOMブロック体生成ステップと、を有し、
前記シリアライズDOMブロック体は、
シリアライズDOMブロック群からなり、
前記シリアライズDOMブロック群は、シリアライズDOMブロックからなり、
前記シリアライズDOMブロックは、シリアライズDOMからなり、
前記シリアライズDOM生成ステップは、以下の(1)から(7)のステップを有するシリアライズDOMブロック体生成プログラム。
(1)自身が属するシリアライズDOMブロックが示す要素の型を示す属性を与える要素型付与ステップ
(2)自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき親要素を示す親シリアライズDOMブロックの位置を示す属性を与える親要素参照位置付与ステップ
(3)自身が属するシリアライズDOMブロックがシリアライズDOMブロック群中で参照すべき子要素を示す子要素シリアライズDOMブロックの位置を示す属性を与える子要素参照位置付与ステップ
(4)自身が属するシリアライズDOMブロックに含まれる要素の内、属性を有する要素がある場合に、その要素の属性を示すシリアライズDOMのシリアライズDOMブロック群中での位置を示す属性を与える属性情報参照位置付与ステップ
(5)自身が属するシリアライズDOMブロックで示す要素の次に続く要素を示す次要素シリアライズDOMブロックのシリアライズDOMブロック群中での位置を示す属性を与える次要素参照位置付与ステップ
(6)自身が属するシリアライズDOMブロックが値を有する場合に、その値を示す文字列情報であって、予め計算機中に用意されたものの文字列の先頭位置を示す属性を与える準備文字列先頭位置付与ステップ
(7)自身が属するシリアライズDOMブロックが値を有する場合に、その値を示す文字列情報であって、予め計算機中に用意されたものの文字列の長さを示す属性を与える準備文字列長付与ステップ
A serialized DOM block body generation program for generating a serialized DOM block body from XML document information, an XML document information acquisition step for acquiring XML document information, a serialized DOM block body generation step, a serialized DOM block body output step unit, , Let the calculator execute
The serialized DOM block body generation step includes a serialized DOM generation step, a serialized DOM block generation step, and a serialized DOM block body generation step,
The serialized DOM block body is:
Consists of serialized DOM blocks
The serialized DOM block group includes serialized DOM blocks.
The serialized DOM block includes a serialized DOM.
The serialized DOM generation step is a serialized DOM block body generation program including the following steps (1) to (7).
(1) Element type giving step for giving an attribute indicating the type of an element indicated by the serialized DOM block to which the serialized DOM block belongs (2) Parent serialized DOM block indicating a parent element to which the serialized DOM block to which the serialized writer belongs should refer Parent element reference position giving step for giving an attribute indicating the position of the child element (3) A child element for giving an attribute indicating the position of the serialized DOM block indicating the child element to which the serialized DOM block to which it belongs should refer in the serialized DOM block group Reference position assignment step (4) When there is an element having an attribute among the elements included in the serialized DOM block to which the reference position belongs, an attribute indicating the position in the serialized DOM block group of the serialized DOM indicating the attribute of the element Attribute information reference position assignment given (5) Next element reference position assignment step (6) itself that gives an attribute indicating the position in the serialized DOM block group of the next element serialized DOM block indicating the element following the element indicated by the serialized DOM block to which it belongs When the serialized DOM block to which the file belongs has a value, a preparation character string head position adding step (7) that gives character string information indicating the value and an attribute indicating the head position of the character string prepared in advance in the computer ) When the serialized DOM block to which it belongs has a value, a preparation character string length giving step that gives character string information indicating the value and an attribute indicating the length of the character string of the one prepared in advance in the computer
前記シリアライズDOMブロック群中の前記シリアライズDOMブロックのシリアライズDOMの配列順位は固定である請求項1又は2に記載のシリアライズDOMブロック体生成装置。 The serialized DOM block body generation device according to claim 1 or 2, wherein the serialized DOM arrangement order of the serialized DOM blocks in the serialized DOM block group is fixed.
JP2003289473A 2003-08-07 2003-08-07 Xml information transmitter Pending JP2005056363A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003289473A JP2005056363A (en) 2003-08-07 2003-08-07 Xml information transmitter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003289473A JP2005056363A (en) 2003-08-07 2003-08-07 Xml information transmitter

Publications (1)

Publication Number Publication Date
JP2005056363A true JP2005056363A (en) 2005-03-03

Family

ID=34367781

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003289473A Pending JP2005056363A (en) 2003-08-07 2003-08-07 Xml information transmitter

Country Status (1)

Country Link
JP (1) JP2005056363A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008048796A1 (en) * 2006-10-20 2008-04-24 Microsoft Corporation Processing an xml feed with extensible or non-typed elements
JP2009537895A (en) * 2006-05-18 2009-10-29 オラクル・インターナショナル・コーポレイション Efficient piecewise update of binary encoded XML data

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009537895A (en) * 2006-05-18 2009-10-29 オラクル・インターナショナル・コーポレイション Efficient piecewise update of binary encoded XML data
WO2008048796A1 (en) * 2006-10-20 2008-04-24 Microsoft Corporation Processing an xml feed with extensible or non-typed elements
US8015483B2 (en) 2006-10-20 2011-09-06 Microsoft Corporation Processing an XML feed with extensible or non-typed elements

Similar Documents

Publication Publication Date Title
KR100614677B1 (en) Method for compressing/decompressing a structured document
JP4373721B2 (en) Method and system for encoding markup language documents
US7995842B2 (en) System and method for binary persistence format for a recognition result lattice
US8117217B2 (en) Information processing apparatus and encoding method
JP4653381B2 (en) Structured document compression / decompression method
CN105450232A (en) Encoding method, decoding method, encoding device and decoding device
KR20010078015A (en) Data compression apparatus, database system, data communication system, data compression method, storage medium and program transmission apparatus
RU2003134278A (en) METHOD AND COMPUTER READABLE MEDIA FOR IMPORT AND EXPORT OF HIERARCHICALLY STRUCTURED DATA
US20090254882A1 (en) Methods and devices for iterative binary coding and decoding of xml type documents
AU2006200055B2 (en) System and method for storing a document in a serial binary format
WO2008051783A2 (en) Context-free grammar
CN105005472B (en) The method and device of Uyghur Character is shown on a kind of WEB
US20070150494A1 (en) Method for transformation of an extensible markup language vocabulary to a generic document structure format
US9286272B2 (en) Method for transformation of an extensible markup language vocabulary to a generic document structure format
US20020120654A1 (en) Large character set browser
CN103365894B (en) A kind of font format conversion method and device
JP4086253B1 (en) XML document processing method and processing program
CN102063415A (en) Method and system for embedding single-byte fonts in PDF (Portable Document Format) file
JP4821287B2 (en) Structured document encoding method, encoding apparatus, encoding program, decoding apparatus, and encoded structured document data structure
JP2005056363A (en) Xml information transmitter
RU2294012C2 (en) Data structure and methods for transforming stream of bits to electronic document and generation of bit stream from electronic document based on said data structure
Galambos et al. Compression of Semistructured Documents
JP2006011549A (en) Structured document conversion device and program
Scanlon A Comparative Study of Data Transformations for Efficient XML and JSON Data Compression. An In-Depth Analysis of Data Transformation Techniques, including Tag and Capital Conversions, Character and Word N-Gram Transformations, and Domain-Specific Data Transforms using SMILES Data as a Case Study
JP2004342029A (en) Method and device for compressing structured document

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050114

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050324

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060605

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080229

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080304

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080630