CN1227609C - 用于改进基于xml内容描述的二进制表示功能的方法 - Google Patents

用于改进基于xml内容描述的二进制表示功能的方法 Download PDF

Info

Publication number
CN1227609C
CN1227609C CN01822811.9A CN01822811A CN1227609C CN 1227609 C CN1227609 C CN 1227609C CN 01822811 A CN01822811 A CN 01822811A CN 1227609 C CN1227609 C CN 1227609C
Authority
CN
China
Prior art keywords
tree
schema
branch
code
path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN01822811.9A
Other languages
English (en)
Other versions
CN1526239A (zh
Inventor
J·霍伊尔
A·胡特
U·尼德梅尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of CN1526239A publication Critical patent/CN1526239A/zh
Application granted granted Critical
Publication of CN1227609C publication Critical patent/CN1227609C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Library & Information Science (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明主要在于使用两种不同的模式分支编码,高频率应用其中之一的模式编码,使得可产生压缩,模式分支编码和位置编码相结合,而且共同传输模式分支编码的位长,由此使得检索功能容易,仅在第一部分详细说明涉及要素的类型,而且基于一种版本号模式来传输,事先给定固定的扩展方式,也是译码器已知的,从而获得可扩展性的改善。

Description

用于改进基于XML内容描述的 二进制表示功能的方法
技术领域
本发明涉及基于XML结构文件的编码和译码,比如在MPEG-7中所指明的,XML(可扩展标记语言)是一种用于文件结构定义的标准,而且在文件中用来表示结构的数据,举例来说,组成用于XHTML语言的基础。这些基于XML的结构文件以大量的结构要素-以下也被称为模式-为基础,比如将可以借助于文件类型定义(DTD)、XML模式或多媒体描述模式(DS)举例详细说明。
背景技术
由草案ISO/IEC CD 15938-1信息技术—多媒体内容描述的接口:系统,ISO/IEC JTC 1 SC29/WG11/N3701(鲍尔(La baule)(法国),2000年10月,特别在第15页到22页)出发,MPEG-7-数据的二进制格式以及借助于树状分支编码表的导航路径结构是为公众所知的。
发明内容
本发明涉及对具有XML结构的文件最优化编码。本发明的根本目的就在于,一种改善基于XML的内容描述的二进制表示的功能的方法,特别是MPEG-7-文件描述的,使得这种情况下要传输的数据量尽可能少,在文件内的检索过程尽可能简单,而且在这种情况时在每个展示的模式中没有包含特定文件的扩展使得尽可能减少消耗。
本发明的目的通过用于改善基于XML的内容描述的二进制表示的功能的方法得到解决,其中一个特定的XML文件的结构与一个树状数据结构相适应,其中每个树节点表示一个内容描述的要素和具有在一个模式中确定的一种结构,并且其中该模式包含具有树状分支编码的树节点,在此树状分支编码具有模式分支编码,如果多次地出现根据该模式定义所属的子节点,那么该树状分支编码还具有位置编码,在每个节点编码时,对于模式分支编码构成两个不同的表,其中第一个表只包含复合要素和路径终端编码,其数据结构允许在子节点有一个分支,而第二个表除了复合要素以外还包括特征和简单要素,它表示了树状数据结构的叶,各自的总路径通过连接树节点形成,使得直到一个总路径的最后节点只从第一个表取出树节点,从第二个表中取出最后的树节点,而路径的倒数第二个节点包含一个路径终端编码。
本发明的目的还通过用于改善基于XML的内容描述的二进制表示的功能的方法得到解决,其中一个特定的XML文件的结构与一个树状数据结构相适应,其中每个树节点表示内容描述的一个要素和具有在一个模式中确定的一种结构并且其中该模式包含具有树状分支编码的树节点,在此树状分支编码包括模式分支编码,如果多次出现根据该模式定义所属的子节点,那么该树状分支编码还具有位置编码,其中总路径被再分类使得全部的位置编码在路径终端移动。
本发明的目的又通过用于改善基于XML的内容描述的二进制表示的功能的方法得到解决,其中一个特定的XML文件的结构与树状数据结构相适应,其中每个树节点表示一个内容描述要素和具有在一个模式中确定的一种结构,并且其中所述模式包含具有树状分支编码的树节点,其中树状分支编码包括模式分支编码,其中使得现有的模式通过以下方式被扩展即:对利用新要素进行的扩展考虑在树节点中没有被占据的模式分支编码,直到全部被消耗,于是模式分支编码的位长根据需要增加,其中位长变化通知译码器对内容描述的译码进行修正。
本发明的目的再通过用于改善基于XML的内容描述的二进制表示的功能的方法得到解决,其中一个特定的XML文件的结构与一个树状数据结构相适应,其中每个树节点表示内容描述的一个要素和具有在一个模式中确定的一种结构,并且其中该模式包含具有树状分支编码的树节点,在此包含树状分支编码,其中译码器通过以下方式浏览具有未知要素的路径:或者是某一要素依次排列的树状结构的比特数,传输其内容和译码器跳跃所述比特数,或者在路径传输后用一个新要素传输明确的同步序列,因此使得译码器首先重新设置属于已知模式的树节点。
本发明的目的还通过用于改善基于XML的内容描述的二进制表示的功能的方法得到解决,其中一个特定的XML文件的结构与一个树状数据结构相适应,其中每个树节点表示内容描述的一个要素和具有在一个模式中确定的一种结构,并且其中该模式包含具有树状分支编码的树节点,该树状分支编码具有模式分支编码,其中译码器对新的、与先前的模式路径不相配的要素进行译码,使得译码器不是事先传输该所属的树状结构节点就是传输一个完整的新模式。
在另外的情况下由上述的ISO/IEC-草案可知,XML-文件的结构可以理解为树状数据,其中每个要素的描述是与该树中的某个节点相对应。节点的结构是通过在模式中的定义确定的,该定义是以文件为基础。尤其子要素的类型和数量是由此阐明的。举例来说,这种节点的范例如在该草案的19页所示出的。这些树状结构节点由要素名称或复合类型,具有编码语句的TBC(树状分支编码)的字段组组成,它用于子要素的参考以及树状分支,它表示所提及的相应的子要素。同样由草案可以得出结论,TBCS划分为两个组成部分,也就是划分为模式分支和位置信息,其中模式信息由要素导出,它在模式中作为子要素出现,当位置信息包含着某一个要素的位置信息,它可以重复地出现。因此子要素可能的形式是,复合类型的要素,该符合类型的要素还可以包含子要素。或简单类型的要素或特征,它不能再包含子要素。#position字段组的长度将由最大数量(“最大发生的”)的相关要素所确定,它是在模式中详细描述的。对于这种情况,在这个例子中最大数量为大于7或者没有限制的,字段组是适当地加长了,直到欲编码的位置可以表示为止。这种划分有其特点,模式—分支编码或SBC#模式分支编码表示的完全一致,与此无关,正如在实际的原文本中可以存在很多子要素一样。
为了在文件中移动,TBC,即模式分支编码,和必要时位置编码相邻排列,使得产生一个在文件中的路径。所希望的要素插入一个终端编码到表中。如果所希望的要素不能有另外的子要素,也就是特征或者简单类型,则这些终端编码是不需要而且不必传输。然后传输已编码的特征或简单类型要素。
附图说明
下面将根据在附图中的实例详细解释本发明。其中,
图1a至1d各种不同的要素种类的地址解释压缩的改善。
图2XML模式文本
图2a和2b在图2的模式文本所属的节点表
图3a和3b表示解释依据本发明的检索能力的改善
图4a和4b数据流的程序段用来解释可扩展性的改善
图5a和5b表示另外的树状分支节点用来解释可扩展性的改善
图6a和6b图2和图2b,还可具有另外的要素。
图7和8跳跃未知要素的译码器序列
具体实施方式
本发明主要在于使用两种不同的模式分支编码,高频率应用其中之一的模式编码,使得可产生压缩,模式分支编码和位置编码相结合,而且共同传输模式分支编码的位长,因此检索功能由此很容易,仅在第一部分详细说明涉及要素的类型,而且基于一种版本号模式来传输,事先给定固定的扩展策略,这也就是公众熟知的译码器,从而获得可扩展性的改善。
压缩的改善
在图1中示出目前的一种简单型要素或特征的地址,在图1b中表示复合型要素的地址,正如它与已知的方法相符合。在图1c和1d中表示按本发明方法的相应的地址。由此可知,可以采用两种不同的模式分支编码SBC-A和SCB-B,而不仅仅是通常的模式分支编码SBC-B。正如上述的,这种链接的地址路径由TBC-编码组成,这就是说,在模式分支编码SBC-A之间也需要当前位置编码#POS,而且只在具有路径终端编码的模式分支编码SBC-A的末端实现,而不再含有一个通常的模式分支编码SBC-B的另外的位置数据,它可以包含简单型要素或特征,形成树状结构的叶。
由所述的链接的路径结构可以清楚TBC编码,在特征或简单类型的要素上可以仅指示路径最后的TBC。在复合型要素上必须指示全部前面所述的TBC,因为也可能只有子要素有。根据本发明方法中的目的,用于在文件中定位的编码长度与开始提到的ISO/IEC-草案相比较是减少了,对于每个节点引入两种不同的表用于#模式分支编码SBC。表A只包含复合型要素,这是说每个要素,它可以有子要素。另一个表包含全部要素,因此也包括特征和简单型要素。因此没有SBC是为路径结束保存的。两个表的#模式分支编码是在下面称为SBC-A和SBC-B。总路径又由TBC的链接形成,其中全部的直到在最后的具有SBC-A的TBC以及在必要时形成相应的#位置编码。利用表A所形成路径第一部分的末端是用终端编码,例如所有的比特1,信号化。其后跟随一个TBC,取用表B的#模式—分支编码。应该注意到在按照发明的方法中还必须传输终端编码,如果特征或简单型要素是已编址的。因为#模式分支编码的长度取决于可能的要素数,所以在表A中的编码,也是SBC-A编码,相应地缩短。从而使得压缩作用适当,SBC-A编码明显地比SBC-B编码更加频繁地被使用。
在图2中给出了一个XML-模式文本的实例,而在图2a和2b中表示相应的节点表SBC-A和SBC-B。由此很明显,对于SBC-A模式分支编码能够缩短,必须不包括简单型要素和特征。
检索功能的改善
然而一个依据ISO/IEC草案的方法的二进制表示要求保留能用的功能,使得对文件中给定要素的检索简化。这些检索最佳的方式应该可以通过简单的滤波结构实现,通过预先确定的位序列,所检索的文件中的要素清楚定址的,将在位流中每个图形比较进行检索。对树状文件中给定的要素进行快速检索是节省位流的,而且只准确地察看每个要素,它只在适当的路径段寻址。对于这种方法,正如在ISO/IEC-草案中所执行的一样,这种滤波不是无限制地可以执行的,因为#位置编码的长度是不能预定的,如果模式中要素的最大数量至少大于7或者是没有限制的。
根据本发明的方法的目的,尽可能简化位流滤波,执行部分地分类整理所述的树状分支节点的路径(TBCs)。因此#位置—编码在路径终端移动。这具有这个优点,路径的第一部分包含#模式分支—字段,单独地详细说明涉及要素的类型。
在一种可替换的解决办法中,在第一步是使#位置编码划分为具有固定长度的一部分以及具有变化长度的一部分。第二步是具有变化长度的一部分由TBCs取出来,而且在路径的终端移动。
对于绝对地址,对于给定的要素检索首选已经可以实现位模式的确定。在使用相对的地址时模式取决于在文件中的当前实际位置。对于这种情况通过新方法使其简化,滤波的#位置编码不是必须被译码和评估的。
作为完全参考整个路径必须包括全部的#位置—编码和译码,因此在每个节点时可以在涉及的子要素修正其分支。
为了实施简化这个方法,且能在路径开始传输路径整体长度L,在二进位中典型地,而没有忽略#位置编码,将启用一个用于位置编码的指针Z,因此可以使得适当的与SBC平行的位置进行译码。由此附加地对于所检索的要素在给定的位置(#位置)尽可能地检索,对于这种情况检索也支持在下面解释的可扩展性,在这种情况时路径的一部分不是每个译码器所识别的。
图3a示出了现有方法中的一个实例中的简单型要素或特征的地址关系。在图3b中示出的是相应地根据本发明的方法。图3b中很清楚,每个路径的全部模式分支编码SBC-B1...SBC-B5依次地排列,并显示其长度L,同样从起点首先传输的。位置编码#位置1......#位置5是被SBC分开的,而且依次的排列。位模式对于具有位长L的绝对地址是由模式限定而可确定的,因此也可以通过图形比较实现位流的滤波。
可扩展性的改善
根据ISO/IEC草案算法的编码模式,是上下文—灵敏度,就是说在每个要素中只有另外的,上下文可能性译码的。如果识别模式—定义,译码器可以仅识别位流并正确地解释。译码器必须是已知的,指示该要素的TBC编码,和在每个要素上的比特码长,因此对于每个路径段将识别正确的比特数。
在实际中常常出现这种情况,一定的模式补充地扩展,围绕新的限制条件,例如新的元数据类别,进行计算。这些扩展可以是任意的要素或者特征。在XML—文本形式所包含的文件中,它按旧的模式—定义建立,就新的定义而言即使在以后也具有其适用性(前向兼容性)。但是它也可以是通过保留导出数据类型,它在限制的情况下(由限制衍生的)保留TBCs或者在扩展时(由扩展衍生的),正如在下面叙述的,得到另外的TBC-表。
在文件的二进制表示中,举例来说如在ISO/IEC草案中所描述的,但不是这个案例,因为这里可以分配到TBCs供给的新的要素/特征。它预先寻址另一个要素/特征。然而根据本发明的具有下列规定的方法中可以避免这些缺点:
新的选择元素能够在树形结构节点TSN中,只在已存在的元素并且只在可能存在的路径终端编码之前提供使用。该新的元素目前没有分配已使用的模式分支编码,其中存在的元素在此没有失去模式分支编码安排。
在扩展到具有长地址的寻址时,所有的二进制表示方法根据编码长度的改变不再被编码。为了解决这个问题,按照本发明进行如下的寻址:
新的要素/特征是涉及对现有的要素/特征的模式分支编码,以及在必要情况时首先在树状结构节点TSN的路径终端登记。在这里不再使用更多的模式分支编码,在此情况下寻址扩展到一个或更多个比特,例如必要的有意义的比特。举例来说,现有的编码是用一个零扩展的。路径终端编码组成一个例外,是用1扩展而成,所以保留了树状结构节点的最后编码。新的要素/特征与指定的当前新的可支配的模式分支编码SBC相适应。模式分支编码的位长变化必须由译码器信号化。为了尽可能有一个增量的可扩展性,对于译码器前述的模式版本必须是已知的。因此没有必要贮存每种版本的完整信息。而应该只存贮保留的与更新的树状结构节点相符合的新版本的模式分支编码的位长或者数量,而且在必要时传输,在这种情况下第二个方法有助于识别有错误的编码。这些信息在编码以前必须传输变化后的模式分支编码。在这种方式时模式分支编码的位长与模式的版本号相结合。在文件以二进位编码以前应该只详细说明所使用的模式版本,不像以前一样传输全部使用的模式。举例来说ISO/IEC-草案的位流定义向着版本说明的领域扩展。如果不实现版本控制,在所利用一个标准中,例如MPEG-7所涉及的模式定义必定是已知的。这些模式定义比如可以确定为版本1。下面将给出有关版本信息的实施例。
在消息头中附加地,正如在ISO/IEC-草案中详细说明的,不仅给出模式信息而且还给出位长信息。对此信息,正如在图4a中表示的一样,将在数据流中存放。
标准化的版本可以使得指定的版本识别清楚。它在图4a中用M7_版本_ID来表示。更进一步,有关的扩展其特征在于利用扩展识别,在图4a中给出了扩展_ID。如果扩展的树状结构节点TSN的位长在位流中给出,这些就可以详细说明。正如在图4a中表示的,这些将通过标记DS扩展信号化。树状分支编码TBC的位长信息将由扩展的树状结构节点TSN在图4a中提供的DS_Updata_Info()中,正如图4b所表示的,进行编码。表达式Number_of_Changed_nodes表示改变的树状结构节点的数量。这个数量可以用可变的长度来编码,如同在ISO/IEC-草案中推荐的位置信息。
树状结构节点改变的信息可以在位流通过Navigation_Command发出导航指令,导航路径通过Navigation_Path()寻址。接下来传输全部要素的变化信息,如同已编址的节点,为同样的类型。下面是包含在数据流中的改变的编码长度SBC_Length或者的改变树状分支编码数量。而编码长度或数量又取决于编码的方法。它也采用Number_of_Changed_nodes来编码。
在进一步的实施例中,树状结构节点的改变可以通过复合类型在模式中识别的直接寻址来实现。例如这些直接寻址可以通过定义的复合类型的增加而实现。
另一个问题就在于按新的模式编码的文件由译码器译码,以前的模式定义必须为已知的(后向兼容性)。在一个基于XML的文本中可以获得XML-文件,对于在旧的模式中为已知的要素。这些取决于两个特征:
保留在旧的模式中定义的复合类型要素,但是所包含的要素和特征在数据类型中分别是有区别的。
通过要素的开始和结束标记,所谓的标签,可以使得新要素跳跃而且用已知的方式译码。
树状结构节点的位长变化与上述的地址建议相适应传输不同的版本,正如在上面的实例中所述,所以扩展的树状结构节点的已知要素由旧的译码器译码,仍在原来的模式的基础上进行工作的。然而在一个新要素中的路径说明不可由旧的译码器跳跃,而且译码器不再能够进一步译码。为了要支持这些重要的功能,将在依据发明的方法中采用一个可选择的后向兼容性的编码的文件:
a)新的要素/特征在TSN中寻址,那么首先附加用于全部的子树或者继承树的比特数量,这些要素/特征包括插入的N比特内容数据都可传输。在这种情况下译码器可以安排以后的N位,它在未知的情况下编码,进行跳跃而且在已知的TSN中重又安排。
b)根据路径传输,该路径包含一个要素/特征,将传输一个清楚的同步序列,它可以在已知的TSN中利用译码器重新设定。
c)路径传输,包括新要素,使得其TSN首先传输,TSN表示完整的模式的一部分。
d)路径传输,首先传输包括新要素的完整模式。
在选择(c)和(d)的情况下译码器也可以对新补充的文件的内容进行译码,而且在必要情况下可以存贮或者进一步处理。
在图5a和5b中示出的实例表示在模式定义的新版本的变化,其中在图5a中示出的是复合型要素的扩展树状结构节点,而在图5b中示出的是改变后模式扩展的树状结构节点。要素3到6是在新的版本中加入的。模式分支编码的长度因此由2延长到3。先前的地址保留直到零扩展,而仍保持MSB。
以下在图6a和6b中示出的是一个模式—扩展要素的编码实例。在与图2结合而使用的实例用作起始点。根据简单性的原因在上述的方法的表示中放弃节点表的分布。原来的模式“购货指令型”应该扩展几个要素。相对于图2,在图6a中更有利地强调了扩展。
要素“支票支付”,“支付方法”以及银行数据都是新附加的。因此新的树状分支编码表必须相应地扩展。其结果是三个二进制位不再够用于全部可能性的编码。
因此树状分支编码的扩展是用四个比特实现的,而且在图6b中详细地描述。通常情况下有两种事例要处理:
事例1:
按旧的模式—定义编码的文件,传输给译码器,其新模式是已知的。基于编码文件的模式版本号码必须首先传输给译码器。译码器有一个表,存放全部要素的每个版本号的比特宽度或模式分支编码SBC的数量。因此在译码器中可以确定,购货指令型的要素不是用四个比特,而只用三个比特编码。可以用这些信息正确地译码这些文件。
事例2:
按新的模式—定义编码的文件,传输给仅识别旧模式的译码器。译码器通过模式版本号识别传输的未知要素和利用另外的比特宽度编码的已知要素。要素的新比特宽度必须为译码器所知,否则他就不能与编码器的同步。或者在传输文件前这个信息根据每个要素的比特宽度排列的,例如是一个表,或者是译码器在具体指定的地址下(URI)写入这个信息。
根据本发明的方法的编码器有四种对文件进行编码的方法:
方法1:
传输正如在图7中所示树中每个新要素相应的排列的长度。
译码器通过模式分支编码01010识别已编地址的要素,而不必包括在标准模式中。在相近的比特解释相应未知要素的长度L。采用的长度说明可以实现与可变的整体编码相适应,正如在ISO/IEC-草案中描述的一样。利用这些长度说明可以跳跃到后排列的数部分中的“支票支付”,而且在#模式分支—编码0010时重新设定。可以接着译码下面的要素“指令”。
方法2:
对一个新要素,如图8中所示,传输一个清楚的同步序列。译码器分辨位流,直到找到标准化的确定的重新同步标记(Resyncmarker)为止,然后再继续译码。在这种方法中给出了可能性,很多新要素成块地编码,并且传输第一个至最后一个重新同步标记。
方法3
新要素包括的树状结构节点,以及其在文件树中的位置在原文件前传输。在这些方法中更新的模式,对译码器而言是已知的。与这种情况相适应,如果模式已知,实现文件的传输。另外也可以应用新的传输模式,内部已知要素通过新要素扩展,只要指定一个清楚的版本号,识别新的模式。
方法4:
将传输一个完整的新模式,在这种情况下,译码器处理文件正如按已知的模式编码的。另外也可以应用新的传输模式,它的内部已知要素绕着新要素扩展,只要指定一个清楚的版本号,识别新的模式。
每个根据本发明的方法可以单独或组合地实现。

Claims (8)

1、用于改善基于XML的内容描述的二进制表示的功能的方法,其中一个特定的XML文件的结构与一个树状数据结构相适应,其中每个树节点表示一个内容描述的要素和具有在一个模式中确定的一种结构,并且其中该模式包含具有树状分支编码(TBC)的树节点,在此树状分支编码具有模式分支编码,如果多次地出现根据该模式定义所属的子节点,那么该树状分支编码还具有位置编码(#POS),在每个节点编码时,对于模式分支编码构成两个不同的表,其中第一个表(SBC-A)只包含复合要素和路径终端编码,其数据结构允许在子节点有一个分支,而第二个表(SBC-B)除了复合要素以外还包括特征和简单要素,它表示了树状数据结构的叶,各自的总路径通过连接树节点形成,使得直到一个总路径的最后节点只从第一个表取出树节点,从第二个表中取出最后的树节点,而路径的倒数第二个节点包含一个路径终端编码。
2、用于改善基于XML的内容描述的二进制表示的功能的方法,其中一个特定的XML文件的结构与一个树状数据结构相适应,其中每个树节点表示内容描述的一个要素和具有在一个模式中确定的一种结构并且其中该模式包含具有树状分支编码(TBC)的树节点,在此树状分支编码包括模式分支编码,如果多次出现根据该模式定义所属的子节点,那么该树状分支编码还具有位置编码(#POS),其中总路径被再分类使得全部的位置编码在路径终端移动。
3、根据权利要求2的方法,其中在总路径的开始处将传送一个关于路径总长(L)的说明,其中只考虑模式分支编码,而不考虑位置编码。
4、根据权利要求2的方法,其中位置编码被划分为具有固定长度的一部分和具有可变长度的另一部分,而具有可变长度的部分是由树状分支编码取出的,并在路径终端移动。
5、用于改善基于XML的内容描述的二进制表示的功能的方法,其中一个特定的XML文件的结构与树状数据结构相适应,其中每个树节点表示一个内容描述要素和具有在一个模式中确定的一种结构,并且其中所述模式包含具有树状分支编码(TBC)的树节点,其中树状分支编码包括模式分支编码,其中使得现有的模式通过以下方式被扩展即:对利用新要素进行的扩展考虑在树节点中没有被占据的模式分支编码,直到全部被消耗,于是模式分支编码的位长(B)根据需要增加,其中位长变化通知译码器对内容描述的译码进行修正。
6、根据权利要求5的方法,其中在译码器中至少存贮模式的一种版本,而且相对于一种存贮版本仅有用于模式变化的一个调用信息,或者直接发送相对于一种存贮版本的模式变化。
7、用于改善基于XML的内容描述的二进制表示的功能的方法,其中一个特定的XML文件的结构与一个树状数据结构相适应,其中每个树节点表示内容描述的一个要素和具有在一个模式中确定的一种结构,并且其中该模式包含具有树状分支编码(TBC)的树节点,在此包含树状分支编码,其中译码器通过以下方式浏览具有未知要素的路径:或者是某一要素依次排列的树状结构的比特数,传输其内容和译码器跳跃所述比特数,或者在路径传输后用一个新要素传输明确的同步序列,因此使得译码器首先重新设置属于已知模式的树节点。
8、用于改善基于XML的内容描述的二进制表示的功能的方法,其中一个特定的XML文件的结构与一个树状数据结构相适应,其中每个树节点表示内容描述的一个要素和具有在一个模式中确定的一种结构,并且其中该模式包含具有树状分支编码(TBC)的树节点,该树状分支编码具有模式分支编码,其中译码器对新的、与先前的模式路径不相配的要素进行译码,使得译码器不是事先传输该所属的树状结构节点就是传输一个完整的新模式。
CN01822811.9A 2000-12-22 2001-12-20 用于改进基于xml内容描述的二进制表示功能的方法 Expired - Fee Related CN1227609C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
DE10064663 2000-12-22
DE10064663.8 2000-12-22
DE10109547 2001-02-28
DE10109547.3 2001-02-28

Publications (2)

Publication Number Publication Date
CN1526239A CN1526239A (zh) 2004-09-01
CN1227609C true CN1227609C (zh) 2005-11-16

Family

ID=26008063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN01822811.9A Expired - Fee Related CN1227609C (zh) 2000-12-22 2001-12-20 用于改进基于xml内容描述的二进制表示功能的方法

Country Status (6)

Country Link
US (5) US7233953B2 (zh)
EP (5) EP2197210A3 (zh)
JP (5) JP2004517410A (zh)
CN (1) CN1227609C (zh)
DE (1) DE50115539D1 (zh)
WO (1) WO2002052857A2 (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1122958A1 (de) * 2000-02-02 2001-08-08 Siemens Aktiengesellschaft Verfahren zur Übermittlung einer Nachricht sowie Telekommunikationssystem
EP2197210A3 (de) * 2000-12-22 2010-08-11 Siemens Aktiengesellschaft Verfahren zur Verbesserung der Funktionalität der binären Repräsentation von MPEG-7 und andere XML basierten Inhaltsbeschreibungen
EP1223759A1 (en) * 2001-01-08 2002-07-17 Robert Bosch Gmbh Method for providing an extension code for a binary description for multimedia data
EP1400124B1 (de) * 2001-02-01 2009-08-05 Siemens Aktiengesellschaft Verfahren zur verbesserung der funktionalität der binären repräsentation von mpeg-7 und anderen xml-basierten inhaltsbeschreibungen
CN100337407C (zh) * 2001-02-05 2007-09-12 捷通公司 对结构化文档进行编码和解码的方法和系统
US7689901B2 (en) * 2001-03-01 2010-03-30 Sony Corporation Multiple updates to content descriptions using a single command
WO2003001404A2 (de) 2001-06-25 2003-01-03 Siemens Aktiengesellschaft Verfahren zum schnellen suchen von elementen oder attributen oder zur schnellen filterung von fragmenten in binären repräsentationen von strukturierten dokumenten
DE10231970B3 (de) * 2002-07-15 2004-02-26 Siemens Ag Verfahren zur Codierung von Positionen von Datenelementen in einer Datenstruktur sowie Vorrichtungen zur entsprechenden Codierung und/oder Decodierung
DE10339971A1 (de) * 2002-12-03 2004-07-01 Siemens Ag Verfahren zur Codierung eines XML-basierten Dokuments
CN1768480B (zh) * 2003-02-03 2012-03-14 夏普株式会社 编码装置和方法、解码装置和方法
US7908248B2 (en) * 2003-07-22 2011-03-15 Sap Ag Dynamic meta data
US7685137B2 (en) * 2004-08-06 2010-03-23 Oracle International Corporation Technique of using XMLType tree as the type infrastructure for XML
US8954400B2 (en) 2004-09-13 2015-02-10 International Business Machines Corporation Method, system and program product for managing structured data
CN1312933C (zh) * 2004-10-28 2007-04-25 复旦大学 一种基于树状结构的视频图像压缩编码方法
CN100354862C (zh) * 2004-11-19 2007-12-12 北京九州软件有限公司 计算机文档的存储及解析方法
US8667179B2 (en) 2005-04-29 2014-03-04 Microsoft Corporation Dynamic utilization of condensing metadata
US20070143664A1 (en) * 2005-12-21 2007-06-21 Motorola, Inc. A compressed schema representation object and method for metadata processing
US7886223B2 (en) * 2006-11-17 2011-02-08 International Business Machines Corporation Generating a statistical tree for encoding/decoding an XML document
DE102007007830A1 (de) 2007-02-16 2008-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms
US7747558B2 (en) 2007-06-07 2010-06-29 Motorola, Inc. Method and apparatus to bind media with metadata using standard metadata headers
US7925643B2 (en) * 2008-06-08 2011-04-12 International Business Machines Corporation Encoding and decoding of XML document using statistical tree representing XSD defining XML document
EP2219117A1 (en) * 2009-02-13 2010-08-18 Siemens Aktiengesellschaft A processing module, a device, and a method for processing of XML data
CN101944229B (zh) * 2009-07-08 2012-11-28 方正国际软件(北京)有限公司 用于图像文件的附加信息方法
EP2388701A1 (en) * 2010-05-17 2011-11-23 Siemens Aktiengesellschaft Method and apparatus for providing a service implementation
US8375031B2 (en) * 2011-02-10 2013-02-12 Tektronix, Inc. Lossless real-time line-rate filtering using PCAP style filters and hardware assisted patricia trees

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5675668A (en) * 1992-04-08 1997-10-07 Kawaski Steel Corporation Coding method, semiconductor memory for implementing coding method, decoder for semiconductor memory and method for identification of hand-written characters
US5379355A (en) 1992-08-24 1995-01-03 Ricoh Corporation Data encoding using one or more adaptive decision trees
US5608903A (en) 1994-12-15 1997-03-04 Novell, Inc. Method and apparatus for moving subtrees in a distributed network directory
GB2300991B (en) 1995-05-15 1997-11-05 Andrew Macgregor Ritchie Serving signals to browsing clients
AU2585797A (en) * 1996-03-15 1997-10-01 University Of Massachusetts Compact tree for storage and retrieval of structured hypermedia documents
US5846718A (en) * 1996-05-31 1998-12-08 The Johns Hopkins University Identification of pyrazinamide-resistant mycobacteria and methods for treating mycobacterial infections
US6052686A (en) * 1997-07-11 2000-04-18 At&T Corporation Database processing using schemas
US6345126B1 (en) * 1998-01-29 2002-02-05 Xerox Corporation Method for transmitting data using an embedded bit stream produced in a hierarchical table-lookup vector quantizer
US6501491B1 (en) * 1998-09-21 2002-12-31 Microsoft Corporation Extensible user interface for viewing objects over a network
US6507856B1 (en) * 1999-01-05 2003-01-14 International Business Machines Corporation Dynamic business process automation system using XML documents
US6772180B1 (en) * 1999-01-22 2004-08-03 International Business Machines Corporation Data representation schema translation through shared examples
US6292114B1 (en) * 1999-06-10 2001-09-18 Intel Corporation Efficient memory mapping of a huffman coded list suitable for bit-serial decoding
US6978269B1 (en) 1999-07-13 2005-12-20 International Business Machines Corporation Apparatus and method for generating and displaying a schema diagram for a database
US6671853B1 (en) 1999-07-15 2003-12-30 International Business Machines Corporation Method and system for selectively streaming markup language documents
US6209124B1 (en) * 1999-08-30 2001-03-27 Touchnet Information Systems, Inc. Method of markup language accessing of host systems and data using a constructed intermediary
WO2001025895A1 (en) 1999-10-01 2001-04-12 Infoglide Corporation System and method for transforming a relational database to a hierarchical database
JP3368883B2 (ja) 2000-02-04 2003-01-20 インターナショナル・ビジネス・マシーンズ・コーポレーション データ圧縮装置、データベースシステム、データ通信システム、データ圧縮方法、記憶媒体及びプログラム伝送装置
US6883137B1 (en) 2000-04-17 2005-04-19 International Business Machines Corporation System and method for schema-driven compression of extensible mark-up language (XML) documents
EP1158420A1 (en) * 2000-05-24 2001-11-28 Robert Bosch Gmbh Method for a description of audio-visual data content in a multimedia environment
DE10047338C2 (de) 2000-09-25 2002-09-19 Siemens Ag Verfahren zur Datenkompression von strukturierten Dokumenten und Anordnung zur Durchführung des Verfahrens
BR0107329A (pt) * 2000-10-17 2002-08-27 Koninkl Philips Electronics Nv Processo de codificação para codificar um elemento de descrição de uma instância de um esquema tipo xml, processo de decodificação para decodificar um fragmento compreendendo um conteúdo e uma sequência de informação de identificação, codificador para codificar um elemento de descrição de uma instância de um esquema tipo xml, decodificador para decodificar um fragmento compreendendo um conteúdo e uma sequência de informação de identificação, sistema de transmissão, sinal para transmissão através de uma rede de transmissão, e, tabela destinada a ser usada em um codificador
US7934008B2 (en) * 2000-10-20 2011-04-26 Sony Corporation Delivery of multimedia descriptions using access units
US7398275B2 (en) * 2000-10-20 2008-07-08 Sony Corporation Efficient binary coding scheme for multimedia content descriptions
US6625615B2 (en) 2000-12-19 2003-09-23 International Business Machines Corporation Data processing system and method for multi-level directory searches
EP2197210A3 (de) 2000-12-22 2010-08-11 Siemens Aktiengesellschaft Verfahren zur Verbesserung der Funktionalität der binären Repräsentation von MPEG-7 und andere XML basierten Inhaltsbeschreibungen
EP1223759A1 (en) 2001-01-08 2002-07-17 Robert Bosch Gmbh Method for providing an extension code for a binary description for multimedia data
CN100337407C (zh) * 2001-02-05 2007-09-12 捷通公司 对结构化文档进行编码和解码的方法和系统
US6804677B2 (en) * 2001-02-26 2004-10-12 Ori Software Development Ltd. Encoding semi-structured data for efficient search and browsing
US7734997B2 (en) * 2001-05-29 2010-06-08 Sony Corporation Transport hint table for synchronizing delivery time between multimedia content and multimedia content descriptions
JP2003003115A (ja) * 2001-06-22 2003-01-08 Nippon Paint Co Ltd 中塗り塗料組成物、複層塗膜形成方法および複層塗膜
US20030009472A1 (en) * 2001-07-09 2003-01-09 Tomohiro Azami Method related to structured metadata
US7362909B2 (en) * 2003-04-10 2008-04-22 Sharp Kabushiki Kaisha Coding device and method and decoding device and method

Also Published As

Publication number Publication date
US7844895B2 (en) 2010-11-30
US7233953B2 (en) 2007-06-19
EP2197210A3 (de) 2010-08-11
JP2008090859A (ja) 2008-04-17
JP2011129156A (ja) 2011-06-30
US20070112806A1 (en) 2007-05-17
EP2197211A3 (de) 2010-08-25
WO2002052857A3 (de) 2003-03-13
CN1526239A (zh) 2004-09-01
EP2197211A2 (de) 2010-06-16
US7882428B2 (en) 2011-02-01
JP5366995B2 (ja) 2013-12-11
EP2197210A2 (de) 2010-06-16
US7844628B2 (en) 2010-11-30
JP5039018B2 (ja) 2012-10-03
JP2013140627A (ja) 2013-07-18
US20070112807A1 (en) 2007-05-17
DE50115539D1 (de) 2010-08-12
WO2002052857A2 (de) 2002-07-04
US20110055684A1 (en) 2011-03-03
JP2009110543A (ja) 2009-05-21
US20040139393A1 (en) 2004-07-15
JP2008299869A (ja) 2008-12-11
EP2197212A2 (de) 2010-06-16
JP4881353B2 (ja) 2012-02-22
JP4847943B2 (ja) 2011-12-28
EP2197213A2 (de) 2010-06-16
JP2004517410A (ja) 2004-06-10
EP2197213B1 (de) 2013-05-29
EP1344403B1 (de) 2010-06-30
EP2197212A3 (de) 2010-07-28
EP2197213A3 (de) 2010-07-14
US8037405B2 (en) 2011-10-11
US20070112805A1 (en) 2007-05-17
EP1344403A2 (de) 2003-09-17

Similar Documents

Publication Publication Date Title
CN1227609C (zh) 用于改进基于xml内容描述的二进制表示功能的方法
AU2002253002B2 (en) Method and system for compressing structured descriptions of documents
JP5054663B2 (ja) マルチメディアデータのバイナリ記述のための拡張コードを含むデータをデコーダによりデコーディングする方法
CN1669024A (zh) 结构化文档、尤其xml文档的编码/译码的方法和装置
US8723703B2 (en) Method and apparatus for encoding and decoding structured data
MXPA04000219A (es) METODO PARA LA COMPRESION DE UN áRBOL JERáRQUICO, SENALES CORRESPONDIENTES Y METODO PARA LA DECODIFICACION DE LA SENAL.
JP2004536481A (ja) 構造化文書の木構造におけるパスの符号化および復号化方法
US20060212796A1 (en) Method for coding structured documents
CN1739243A (zh) 用于从索引树中产生比特流的方法
US7571152B2 (en) Method for compressing and decompressing structured documents
US7627586B2 (en) Method for encoding a structured document
US20040107297A1 (en) Method for improving the functions of the binary representation of mpeg-7 and other xml-based content descriptions
JP4847943B6 (ja) Mpeg−7および他のxmlベースのコンテンツ記述のバイナリ表現機能を改善する方法
KR100968083B1 (ko) 구조화된 문서들, 특히 xml 문서들을인코딩/디코딩하기 위한 방법 및 장치
CN1823528B (zh) 用于对结构化文件进行编码的方法和装置
JP4668273B2 (ja) Xmlを基礎とする文書の符号化のための方法
JP2009543243A (ja) 構造化文書の圧縮のための方法と装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20051116

Termination date: 20191220