CN1823528B - 用于对结构化文件进行编码的方法和装置 - Google Patents

用于对结构化文件进行编码的方法和装置 Download PDF

Info

Publication number
CN1823528B
CN1823528B CN2004800201113A CN200480020111A CN1823528B CN 1823528 B CN1823528 B CN 1823528B CN 2004800201113 A CN2004800201113 A CN 2004800201113A CN 200480020111 A CN200480020111 A CN 200480020111A CN 1823528 B CN1823528 B CN 1823528B
Authority
CN
China
Prior art keywords
data type
name space
code
name
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2004800201113A
Other languages
English (en)
Other versions
CN1823528A (zh
Inventor
A·胡特尔
J·霍伊尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority claimed from PCT/EP2004/051333 external-priority patent/WO2005008520A2/de
Publication of CN1823528A publication Critical patent/CN1823528A/zh
Application granted granted Critical
Publication of CN1823528B publication Critical patent/CN1823528B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Library & Information Science (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明涉及一种用于对结构化文件、特别是基于XML的文件进行编码的方法,其中,借助一个或者多个模式和/或名字空间产生大量代码,其中针对一个模式和/或一个名字空间和/或针对一组模式和/或名字空间,分别为借助在该模式和/或名字空间和/或在该组模式和/或名字空间中定义的和/或说明的元素分配单独的、不依赖于其他模式和/或名字空间的代码。

Description

用于对结构化文件进行编码的方法和装置
本发明涉及一种方法和一种装置,利用该方法和该装置借助所谓的模式对结构化的、特别是基于XML的文件进行编码和/或解码。
XML(=extensible markup language(可扩展标记语言))是一种语言,用它能够借助XML模式语言定义对文件的内容进行结构化描述。XML模式的更详细的说明以及其中所使用的结构、数据类型和内容模型可以在参考文献[1]、[2]和[3]中找到。
用于对基于XML的文件进行编码或者解码的方法、装置以及系统在关于MPEG-7标准的文件、特别是在文献[4]中已公开。
如果要编码的基于XML的描述或者文件的模式在传输开始时未完全为编码器和/或解码器所了解,则用于MPEG-7和其他基于XML的描述或者文件的二进制表示的已知方法具有在兼容性方面的欠缺。例如在文献[4]中说明了一种用于XML描述和XML文件的二进制表示的方法,该方法基于模式和名字空间来规定XML描述和XML文件的代码表。在此,名字空间是文件结构中的空间,在该空间中记录有在其中所使用的、具有明确的意义或者说明的名字,其中在一个名字空间内出现的名字可以在具有另一意义或者说明的另一名字空间中出现。与此相对,通过模式来定义名字空间的至少一部分。在[4]中所说明的方法中,数据类型、全局元素和替换组的代码表依赖于所有使用的名字空间。因此在建立代码表之前必须了解模式和名字空间。
在PCT专利申请文件(WO 02/063775A)中公开了一种编码方法,在该方法中解码器能够对结构化文件进行解码,其中该解码器不能使用第一模式的结构。
PCT专利申请文件(WO 03/001811A1)说明了一种方法和一种装置,使用该方法除了传输已经存在的名字空间之外还传输校正码,该校正码说明在已经存在的名字空间中缺少的元素。
现在,本发明所基于的任务在于,即使在编码器和/或解码器不完全知道模式时也能够实现有效的编码。
该任务通过独立权利要求来解决。从属权利要求涉及本发明的有利的扩展方案。
在用于对结构化文件进行编码的本发明方法中,借助一个或多个模式和/或名字空间产生大量代码。在此,针对一个模式和/或一个名字空间和/或针对一组模式和/或名字空间,分别为借助在该模式和/或名字空间和/或在该组模式和/或名字空间中所定义的和/或所说明的元素分配单独的、不依赖于其他模式和/或名字空间的代码。
本发明基本上在于,分别在模式和/或名字空间中分配代码。这里说明的发明是有利的,因为现在模式和/或名字空间根据需要在文件传输期间也能被加载,并且由此不必改变其他名字空间的现有的代码表,并且因此不必重新建立。另一个优点在于,单独的代码对于输入非常多的名字空间的情况来说要比如在[4]中联合所有名字空间时需要更少的编址位。即使在输入非常大的名字空间的情况下,也能用较少的位对其他名字空间的单独的代码进行编码。
此外,在本发明方法中,在给定的名字空间内按照包括下述步骤的方法分配单独的代码:
-在第一步骤中,在一个列表中以在MPEG-7标准中定义的、各基本数据类型的全局TypeCode的顺序对一个名字空间的、遗传自其他名字空间的数据类型的所有数据类型进行排序,其中所述基本数据类型是其他名字空间中的数据类型,所排序的数据类型遗传自这些数据类型;
一在第二步骤中,分别以词典编纂法对一个名字空间的、遗传自另一确定的名字空间的确定的基本数据类型的那些数据类型进行排序;
一在第三步骤中,在现有的数据类型列表中根据在MPEG-7标准中定义的顺序对一个名字空间的、不是遗传自其他名字空间的数据类型的所有数据类型进行排序,
一在第四步骤中,以该列表的顺序向该名字空间的数据类型分配单独的代码。
在此,优点在于,能够迅速找到所寻址的数据类型、特别是TypeCode并且能够因此对其进行解码。根据[4]中的规则,TypeeCode对相对于基本类型所导出的类型进行寻址。亦即该基本类型定义一个子树,在该子树中存在所有可寻址的数据类型。如果现在在该子树内包含多个名字空间,则可以通过由本发 明的上述实施形式实现的有利的相邻关系在该名字空间内迅速找到被寻址的数据类型,因为通过将所寻找的数据类型与所排序的遗传树中的两个相邻的数据类型进行比较,可以确定所寻找的数据类型是否位于两个相邻数据类型的具有最小二进制代码的数据类型的子树中。按这种方式能够大大减少寻找费用。这种相邻关系的另一个优点在于,解码器在根据[4]对TypeCode进行编码时可以直接由相邻的数据类型的代码距离计算出代码字长度,该代码字长度由导出的数据类型的数目决定。
在本发明的一个优选的变型方案中,把单独的代码分成地址区域,其中通过该地址区域可识别该模式和/或名字空间或者该组模式和/或名字空间。
在本发明编码方法的一个优选的实施形式中,单独的代码分别包括关于该模式和/或该名字空间和/或关于该组模式和/或名字空间的局部代码以及识别该模式和/或该名字空间和/或该组模式和/或名字空间的识别代码。在此情况下,局部代码是在通过识别代码识别的模式或者名字空间内唯一的代码。
优选地,为全局元素和/或SubstitutionGroup(替换组)和/或数据类型分配单独的代码。全局元素、SubstitutionGroup和数据类型的精确定义可在文献[1]、[2]和[3]中详细说明的XML模式定义中找到。
在一个优选的实施形式中,为在文献[4]中说明的数据类型TypeCode(类型代码)这样产生单独的代码,使得在一个名字空间的遗传树内,与相同名字空间内的第一数据类型相邻的数据类型具有到该第一数据类型的代码距离,该代码距离相应于在该名字空间内由第一数据类型导出的数据类型的数目。当由与第一数据类型相同的基本数据类型导出了一个数据类型并且在由该基本数据类型导出的所有数据类型中将大于第一数据类型的TypeCode的最小TypeCode分配给该数据类型时,该数据类型与第一数据类型相邻。在该实施形式中,这样为(可能分离的)遗传树之内的数据类型TypeCode分配代码,使得在给定的名字空间内存在有利的相邻关系,并且即使当在该名字空间内出现由其他名字空间导出的类型的子树时也得到保持。
除上述的本发明编码方法外,本发明此外还涉及一种解码方法,使用该解码方法对结构化文件、特别是基于XML的文件进行解码,其中这样构造该方法,使得对利用本发明编码方法编码的文件进行解码。在本发明解码方法的一个优选的扩展方案中,在此情况下,为了对二进制TypeCode进行解码,根据 导出的数据的数目确定二进制TypeCode的单独的代码的代码长度。此外,在一个优选的实施形式中,为了对名字空间的遗传树的子树的规定的TypeCode进行解码,优选地根据相邻的数据类型之间的代码距离来确定,其中所述规定的TypeCode处于该名字空间内。
除上述方法外,本发明此外还涉及用于执行本发明编码或者解码方法的编码装置以及解码装置。此外本发明包括编解码装置,利用它可执行本发明编码 方法和本发明解码方法。
下面根据附图来更详细地说明本发明的实施例。
图1示出按照本发明的具有编码器和解码器的编码和解码系统的原理图;
图2示出一个示例性的XML模式定义的图示,在该定义中数据类型也从其他名字空间输入以及导出。
图3示出在图2中所示的XML模式的数据类型的遗传树、包括单独的代码对在名字空间中出现的TypeCode(类型代码)的分配的图示。
在图1中示例性地示出一个具有编码器ENC和解码器DEC的编码和解码系统,其中使用该编码器和解码器对XML文件DOC进行编码或者解码。不仅编码器而且解码器两者都使用所谓的XML模式S,在该XML模式S中说明并定义为通信所使用的XML文件的元素和类型。由该模式S通过相应的模式编译SC在编码器和解码器中产生代码表CT。当XML文件DOC被编码时,通过代码表给该XML文件的内容分配二进制代码。由此产生文件DOC的二进制表示BDOC,该二进制表示可以借助代码表CT在解码器中重新被解码。在此情况下可以使用多种模式,特别是也可以使用基于一个基本模式并且从另一模式导出的模式。
在图2中示例性地示出一个XML模式定义的一段节录。专业人员了解这样的XML模式定义,所以不探讨图2的节录的详细内容。该节录包括两个模式定义,一方面在上面的部分中定义模式A,如通过弧形括号所示,另一方面在下面的部分中定义模式X,如同样通过弧形括号所示。模式X再次使用从模式A输入的数据类型。
在图3中以树结构形式用图形示出模式A和X之间的遗传关系和它们的数据类型。如从图中可知,两个模式A和X都遗传自表示XML模式名字空间的模式XS。数据类型树中的每一节点表示模式定义中的一个被定义的数据类型。在模式X中定义数据类型tType、iType、sType和nType。与此相对,在模式A中定义数据类型Nodel、myFirstType和mySecondType。使用本发明的方法,为模式A和X分别分配单独的代码,这些代码在图3中通过置于括号中的表达式来说明。在括号中所说明的表达式在此情况下首先包括名字空间标识“名字空间ID”并且接着包括(通过冒号分开的)局部代码形式的类型代码。对于名字空间标识,为模式X使用x并且为模式A使用a。TypeCode(类型代 码)说明在名字空间X中通过相应的数字1-4来表明,在名字空间A中通过1-3来表明。在此情况下重要的是,TypeCode说明是局部代码,这些局部代码在每一名字空间内是唯一的。通过这样分配局部代码,从现在开始模式A和X彼此不相依赖,以致不再需要为了借助一个模式进行解码而向解码器传输所有其他的模式。
文献目录: 
http://www.w3.org/TR/2001/REC-xmlschema-0-20010502/ 
http://www.w3.org/TR/2001/REC-xmlschema-1-20010502/ 
http://www.w3.org/TR/2001/REC-xmlschema-2-20010502/ 
ISO/IEC 15938-1“Multimedia Content Description Interface-Part l:Systems”,Geneva 2002. 

Claims (6)

1.用于对结构化文件进行编码的方法,包括:
借助一个或者多个名字空间产生大量代码;
针对一个名字空间和一组名字空间中的至少一个,分别为借助在该名字空间和该组名字空间的至少一个中定义的和/或说明的元素分配单独的、不依赖于其他名字空间的代码,
在一个给定的名字空间内按照下述方式为数据类型分配单独的代码:
在一个列表中以在MPEG-7标准中定义的、各基本数据类型的全局类型代码的顺序对一个名字空间的、遗传自其他名字空间的数据类型的所有数据类型进行排序,其中所述基本数据类型是其他名字空间中所排序的数据类型所遗传自的数据类型;
分别以词典编纂法对一个名字空间的、遗传自另一确定的名字空间的确定的基本数据类型的那些数据类型进行排序;
在现有的数据类型列表中根据在MPEG-7标准中定义的顺序对一个名字空间的、不是遗传自其他名字空间的数据类型的所有数据类型进行排序;
以该列表的顺序向该名字空间的数据类型分配单独的代码。
2.根据权利要求1所述的方法,其中,
为识别该名字空间和该组名字空间中的至少一个,把单独的代码划分为相应的地址区域。
3.根据上述权利要求之一所述的方法,其中,
单独的代码分别包括关于该名字空间和该组名字空间中至少一个的局部代码以及用于识别该名字空间和该组名字空间中至少一个的识别代码。
4.根据权利要求1或2所述的方法,其中,这样为各基本数据类型代码产生单独的代码,使得在一个特定名字空间的遗传树内与该特定名字空间内的第一数据类型相邻的相应数据类型具有到该第一数据类型的代码距离,该代码距离相应于在该特定名字空间内由该第一数据类型导出的数据类型的数目。
5.根据权利要求1所述的方法,其中,所述结构化文件是基于XML的文件。
6.用于对结构化文件进行编码的装置,包括:
用于借助一个或者多个名字空间产生大量代码的装置;
用于针对一个名字空间和一组名字空间中的至少一个,分别为借助在该名字空间和该组名字空间的至少一个中定义的和/或说明的元素分配单独的、不依赖于其他名字空间的代码的装置,
用于在一个给定的名字空间内为数据类型分配单独的代码的装置,包括:
用于在一个列表中以在MPEG-7标准中定义的、各基本数据类型的全局类型代码的顺序对一个名字空间的、遗传自其他名字空间的数据类型的所有数据类型进行排序的装置,其中所述基本数据类型是其他名字空间中所排序的数据类型所遗传自的数据类型;
用于分别以词典编纂法对一个名字空间的、遗传自另一确定的名字空间的确定的基本数据类型的那些数据类型进行排序的装置;
用于在现有的数据类型列表中根据在MPEG-7标准中定义的顺序对一个名字空间的、不是遗传自其他名字空间的数据类型的所有数据类型进行排序的装置;
用于以该列表的顺序向该名字空间的各基本数据类型分配单独的代码的装置。
CN2004800201113A 2003-07-15 2004-07-02 用于对结构化文件进行编码的方法和装置 Active CN1823528B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
DE10332054 2003-07-15
DE10332054.7 2003-07-15
DE10351897A DE10351897A1 (de) 2003-07-15 2003-11-06 Verfahren zur Codierung von strukturierten Dokumenten
DE10351897.5 2003-11-06
PCT/EP2004/051333 WO2005008520A2 (de) 2003-07-15 2004-07-02 Verfahren zur codierung von strukturierten dokumenten

Publications (2)

Publication Number Publication Date
CN1823528A CN1823528A (zh) 2006-08-23
CN1823528B true CN1823528B (zh) 2011-08-10

Family

ID=34071682

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2004800201113A Active CN1823528B (zh) 2003-07-15 2004-07-02 用于对结构化文件进行编码的方法和装置

Country Status (2)

Country Link
CN (1) CN1823528B (zh)
DE (1) DE10351897A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004009617A1 (de) 2004-02-27 2005-09-29 Siemens Ag Verfahren und Vorrichtung zur Codierung und Decodierung von strukturierten Dokumenten
JP5379372B2 (ja) * 2007-11-15 2013-12-25 キヤノン株式会社 データ圧縮装置、データ伸長装置およびデータ圧縮方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002063775A2 (en) * 2001-02-05 2002-08-15 Expway Method and system for compressing structured documents
WO2003001811A1 (de) * 2001-06-25 2003-01-03 Siemens Aktiengesellschaft System zur verbesserten encodierung/decodierung von strukturierten, insbesondere xml-basierten, dokumenten sowie verfahren und vorrichtungen zur verbesserten encodierung/decodierung von binären repräsentationen von solchen dokumenten
CN1401188A (zh) * 2000-10-17 2003-03-05 皇家菲利浦电子有限公司 Mpeg-7样品的二进制格式

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030121005A1 (en) * 2001-12-20 2003-06-26 Axel Herbst Archiving and retrieving data objects

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1401188A (zh) * 2000-10-17 2003-03-05 皇家菲利浦电子有限公司 Mpeg-7样品的二进制格式
WO2002063775A2 (en) * 2001-02-05 2002-08-15 Expway Method and system for compressing structured documents
WO2003001811A1 (de) * 2001-06-25 2003-01-03 Siemens Aktiengesellschaft System zur verbesserten encodierung/decodierung von strukturierten, insbesondere xml-basierten, dokumenten sowie verfahren und vorrichtungen zur verbesserten encodierung/decodierung von binären repräsentationen von solchen dokumenten

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WO 03001811 A1,全文.

Also Published As

Publication number Publication date
CN1823528A (zh) 2006-08-23
DE10351897A1 (de) 2005-02-17

Similar Documents

Publication Publication Date Title
CA2437123C (en) Method and system for compressing structured descriptions of documents
CN1669024A (zh) 结构化文档、尤其xml文档的编码/译码的方法和装置
US20110055684A1 (en) Method for improving the functionality of a binary representation
US20060212796A1 (en) Method for coding structured documents
JP3865694B2 (ja) 構造化文書の木構造におけるパスの符号化および復号化方法
CN1998241A (zh) 对xml文档编码的方法及解码方法、编码和解码方法、编码装置、解码装置以及编码和解码装置
Niedermeier et al. An MPEG-7 tool for compression and streaming of XML data
US7831903B2 (en) Method and device for coding and decoding structured documents
US20040186841A1 (en) System for the improved encoding/decoding of structured, in particularly xml-based, documents and methods and devices for the improved encoding/decoding of binary representations of such documents
CN1823528B (zh) 用于对结构化文件进行编码的方法和装置
US7797346B2 (en) Method for improving the functionality of the binary representation of MPEG-7 and other XML based content descriptions
US20060235862A1 (en) Method for encoding a structured document
US20090307243A1 (en) Coding Positions of Data Elements In A Data Structure
US20060259167A1 (en) Method for compressing and decompressing structured documents
US8898559B2 (en) Method for encoding an XML-based document
JP4668273B2 (ja) Xmlを基礎とする文書の符号化のための方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: PULASENGDE INVESTMENT CO., LTD

Free format text: FORMER OWNER: SIEMENS AG

Effective date: 20091023

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20091023

Address after: Delaware, USA

Applicant after: Siemens AG

Address before: Munich, Germany

Applicant before: Siemens AG

C14 Grant of patent or utility model
GR01 Patent grant