CN108885612B - 用于处理经二进制编码的结构文档的设备和方法 - Google Patents

用于处理经二进制编码的结构文档的设备和方法 Download PDF

Info

Publication number
CN108885612B
CN108885612B CN201780023309.4A CN201780023309A CN108885612B CN 108885612 B CN108885612 B CN 108885612B CN 201780023309 A CN201780023309 A CN 201780023309A CN 108885612 B CN108885612 B CN 108885612B
Authority
CN
China
Prior art keywords
binary
document
coded
structural
bci
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780023309.4A
Other languages
English (en)
Other versions
CN108885612A (zh
Inventor
R.孔奇克
D.佩因特纳
A.肖尔茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of CN108885612A publication Critical patent/CN108885612A/zh
Application granted granted Critical
Publication of CN108885612B publication Critical patent/CN108885612B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/70Type of the data to be coded, other than image and sound
    • H03M7/707Structured documents, e.g. XML
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/146Coding or compression of tree-structured data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

根据本发明的方法规定,尤其以EXI格式提供经二进制编码的结构文档以及经二进制编码的索引文档,经二进制编码的结构文档基于以基于文本的描述语言、尤其XML构建的结构文档,经二进制编码的索引文档基于结构文档的结构上的子集。经二进制编码的索引文档的存储表示被存放在设备的工作存储器中,经二进制编码的结构文档保存在被分配给设备的后台存储器中。通过至少一个处理过程来对处理操作或询问的执行借助经由对象接口对经二进制编码的索引文档的存储表示的存取来进行,其中,根据需要将经二进制编码的结构文档的片段在对象接口侧加载到工作存储器中。在经二进制编码的索引文档(也称作XIndex)上来处理操作的根据本发明的执行实现更快速的询问处理,其方式是,在没有经二进制编码的结构文档参与情况下已能借助索引文档BCI来处理确定的问询。

Description

用于处理经二进制编码的结构文档的设备和方法
技术领域
本发明涉及用于处理经二进制编码的结构文档的设备以及方法。
背景技术
在现有技术中,已知用于说明数据格式和对于数据的处理所需的方法的基于文本的描述语言。在该描述的意义上的结构文档至少部分地包括描述语言中的段落。
已知的描述语言是“Extensible Markup Language(可扩展标记语言)”,缩写为XML,借助所述可扩展标记语言以文本形式或“纯文本(Plain Text)”来描述分层次地结构化的数据。描述语言XML被用于在计算机系统之间与平台无关地交换数据。基于XML的文本特性, XML不仅通过机器而且也通过人可读。
以描述语言XML存在的结构文档为了处理包含在其中的数据通常被转变成存储表示,所述存储表示在专业领域也作为“in-memory(内存)”模型而已知,其中所述处理尤其包括:搜索、过滤、操纵、转换和查询数据。已知的用于对XML文档的存储表示进行存取的规范是“Document Object Model(文档对象模型)”或DOM,该规范为通过一个或多个处理过程进行的数据存取提供对象接口。该对象接口例如实施为编程接口或API(ApplicationProgramming Interface(应用程序编程接口))。但是,存储表示比所属的结构文档大多倍。出于该原因,在资源有限的、也即具有有限的存储空间和/或计算效率的设备中通常不实现或者仅仅有限地实现更广泛的结构文档的处理。这样的资源有限的设备例如包括尤其在生产线中或车辆中的用于监视功能、控制功能或调节功能的例如以所谓的智能传感器形式的嵌入式系统或»Embedded Systems«。
经常需要在设备之间的快速的数据交换,所述数据交换利用文本的描述语言、例如XML仅仅不充分地实现。因此,已提出XML的用于高效的数据交换的二进制表示。XML的称为“efficient XML interchange(高效XML交换)”、缩写为EXI的二进制表示与基于文本的XML数据相比在一般类型的设备或计算机系统之间的数据交换时需要更小的传输带宽。
交换格式EXI不仅仅在如名称赋予的(namensgebend)在计算机系统之间的数据交换中而且在资源有限的设备中经二进制编码的结构文档的设备内部的处理的情况下也展现其优点。经二进制编码的结构文档的设备内部处理、也即以EXI-格式,通常被证实为相对于XML格式的使用而言是更高效的,主要因为在设备之间本来就按照EXI规范来交换数据。
对于设备内部处理,将经二进制编码的结构文档然后以与经二进制编码的结构文档基于的以基于文本的描述语言所构建的结构文档类似的方式转变成存储表示,以便对于一个或多个处理过程实现:经由对象接口来存取经二进制编码的结构文档的数据。经二进制编码的结构文档的设备内部处理在资源有限的设备中也受到限制,所述限制使得需要在相对设备的工作存储器的有限的存储容量权衡中考虑存储表示的大小。
如果结构文档的存储表示超出预先确定的大小,则必须在放弃原本计划的功能性的情况下将所属的结构文档缩减为允许的大小。如果排除该可能性,则必然地必须采取用于更精简的存储表示或替代的处理过程的专有解决方案,其应单独地被设计用于相应的应用情况。这必然意味着,对于新的或改变了的应用情况必须再次拟定替代解决方案。这对于一般性可用的解决方案的基本目标是不利的。
此外已经表明,在可能的处理操作中,首先,读操作相对于具有写访问的操作占优。与读操作不同,在一般性的处理操作中,不仅仅读取数据,而且改变、写入或重新结构化数据。在这些读操作中,在经二进制编码的结构文档上在结构上的读操作比以下读操作又占优:在所述读操作中,应读取内容。最先提到的、结构上的读操作尤其包括:在基于的结构文档的结构内对多个待确定的元素的层次关系、数目或确定的类别的询问。结构上的读操作通常要求结构文档的完整的存储表示的处理,其在存储表示中例如以树结构来表示。接下来,出于普遍有效性的原因,参考以一般性术语处理操作所提到的所有的读和写的操作。
发明内容
本发明提出的任务是,创建一种在尤其资源有限的设备中的方法,通过其实现在经二进制编码的结构文档的存储表示上的处理操作,而经二进制编码的结构文档的大小不超出资源有限的设备的限制。
所述任务通过具有专利权利要求1的特征的方法来解决。
本发明由如下的主要考虑来支持:创建经二进制编码的索引文档,其结构与待处理的经二进制编码的结构文档的结构相同,然而,与完整的经二进制编码的结构文档不同,不包含所有内容、即例如不包含属性、不包含属性的值分配以及不包含元素的内容。
经二进制编码的结构文档和经二进制编码的索引文档这两个文档基于相同的结构文档,所述结构文档以基于文本的描述语言构建,优选以XML构建。经二进制编码的结构文档基于结构文档的全部内容,而经二进制编码的索引文档则仅仅基于结构文档的结构上的子集。索引文档可以说包含以树结构定义的元素的简明的(knapp)层次数据结构的二进制表示,而不包含所属的内容。基于仅仅所述结构上的子集,经二进制编码的索引文档比经二进制编码的结构文档自然需要存储空间的显著较小的范围。
根据本发明的方法现在规定,将经二进制编码的索引文档的存储表示存放在设备的工作存储器中,而将经二进制编码的结构文档存储在被分配给所述设备的后台存储器中。
根据本发明,通过至少一个处理过程借助经由对象接口来对经二进制编码的索引文档的存取来进行处理操作的执行,其中,根据需要将经二进制编码的结构文档的片段在所述对象接口侧加载到所述工作存储器中。
所述任务此外通过一种用于处理根据本发明的方法的计算机程序产品来解决。该计算机程序在处理器或控制器中被处理,所述处理器或控制器利用所述处理来实施所述方法。
所述任务此外通过一种用于尤其以资源有限的方式来处理经二进制编码的结构文档的设备来解决。
本发明的另外的构型是从属专利权利要求的主题。
附图说明
下面,根据附图详细阐述本发明的另外的实施例和优点。在此其中:
图1示出在设备中处理经二进制编码的结构文档的示意性结构示图;和
图2以与基于的以基于文本的描述语言所构建的结构文档相比较的方式示出索引文档的结构的示意图。
具体实施方式
图1以非决定性的方式示出在设备中处理经二进制编码的结构文档BCS的示意性结构图。
在对象接口OI中存放有经二进制编码的索引文档BCI的存储表示。对象接口OI使得相应的处理过程XP1、XP2、XP3能够对经二进制编码的索引文档BCI的存储表示进行存取。经二进制编码的索引文档BCI的存储表示以及对象接口OI被分配给设备的未示出的工作存储器。
在设备的未示出的后台存储器中存放有经二进制编码的结构文档BCS。所述经二进制编码的结构文档BCS的存储表示在需要情况下被加载到对象接口OI中。
处理过程XP1、XP2、XP3在经二进制编码的结构文档、例如以格式EXI(“efficientXML interchange(高效XML交换)”)的结构文档上执行处理操作。所述处理尤其包括:对在经二进制编码的结构文档中所包含的数据的数据进行搜索、过滤、操纵、转换和查询。对此的例子是基于查询语言或转换语言XPath、XQuery、XSLT等的处理过程,其中在专业领域通常也作为“EXI-处理器”来参考所述处理过程。
基于下面更详细阐述的、以与经二进制编码的索引文档BCI相互作用的方式来对经二进制编码的结构文档BCS的处理的根据本发明的可能性,本发明有利地允许使用转换语言XQuery,而不是受限制的查询语言XPath。转换语言XQuery的可能性超越于单纯的查询。其涉及具有广泛的转换可能性的图灵完备的语言,其中所述转换可能性远远超越于XPath的请求(Anfrage)与过滤可能性。与此相对,查询语言XPath仅仅提供XQuery的可能性的子集(Teilumfang bzw. Subset)。
以下附图描述在进一步参考图1的功能单元的情况下进行。不同的图中的相同的附图标记在此代表相同的功能单元。
图2以与基于的以基于文本的描述语言、在此为XML所构建的结构文档SD相比较的方式来示出索引文档BCI的结构的示意图。
在左半图中在结构块中所表示的示例性的结构文档SD基于以下XML代码:
Figure 176397DEST_PATH_IMAGE001
在此涉及笔记本的XML表示,该笔记本包含两个笔记。这些笔记如笔记本自身那样通过以JJJJ-MM-TT(年-月-日)形式的ISO 6601格式的相应的日期作为属性来引用。第一个笔记包含另一属性、即类别»EXI«。此外,每个笔记具有题目或»Subject«和实际内容或»Body«。
在图2的左半图中,包含以上示出的XML代码的结构文档SD以各个结构块示出。在右半图中示出由结构文档SD构成的经二进制编码的索引文档BCI的示意图,其中所述经二进制编码的索引文档根据本发明基于结构文档SD的结构上的子集。在附图中可以看出,经二进制编码的索引文档BCI的相应的结构块相应于结构文档SD的结构块,如通过虚线的参考箭头标出的那样。
根据一般的EXI编码措施,在经二进制编码的索引文档BCI中设置紧凑的识别码或»identifiers«,所述识别码取代在结构文档SD中包含的字符串或»String«。如果一个字符串重复多次地出现在结构文档SD中,则该字符串在EXI编码中通过相应的标识符被引用作为限定名称或»qname«。对此,设置对未示出的资源表或»EXI String Tables«的管理。在该示例中,标识符5在经二进制编码的索引文档BCI中代表限定名称»notebook«,标识符4代表»note«,标识符6代表»subject«,并且的标识符1代表限定名称»body«。
经二进制编码的索引文档BCI基于所示出的XML结构文档的子集,所述子集根据本发明的在此示出的实施方式限于结构索引,但不包含实际的值,也即,例如题目»subject«的内容»Shopping list«。经二进制编码的索引文档BCI因此包含在结构块中所定义的元素的简明的层次数据结构的二进制表示,而不包含所属的内容。
在一种替代的实施方式中,结构文档BCI的根据本发明的结构上的子集除了简明的(knapp)层次数据结构之外在需要情况下也包括如下内容,所述内容例如通常在请求中被需要。
以结构块进行的绘图表示也可以容易地以树结构进行,而这对经二进制编码的索引文档BCI本身的结构不具有影响。
在大多数情况中,已经以经二进制编码的索引文档BCI本身来应答如下询问,所述请求构成处理-操作的特殊情况。这样的询问尤其包括:对待确定的元素的层次关系、数目或确定的类别的询问。在大多数情况中,对结构数据的另外的处理操作、也即修改或转换仅仅能够以与经二进制编码的索引文档BCI的相互作用的方式来被执行。如果这样的处理操作伴随有经二进制编码的索引文档BCI的结构方面的修改,则该修改通过对象接口OI也在经二进制编码的结构文档BCS中执行。通过这种方式,保证经二进制编码的索引文档BCI作为经二进制编码的结构文档BCS的在结构映像(strukturelles Abbild)与经二进制编码的结构文档BCS的一致性。为了通过对象接口OI在经二进制编码的结构文档BCS中执行修改,在所述对象接口侧OI将经二进制编码的结构文档的片段加载到所述工作存储器中。对经二进制编码的结构文档中的值的存取经由从经二进制编码的索引文档中已经已知的识别码来进行。该措施允许对待修改的值的快速和随机存取。
对象接口OI尤其根据»Document Object Model«或DOM来被构型,所述对象接口允许例如以编程接口或API(Application Programming Interface(应用编程接口))的形式的数据存取。
从处理过程XP1、XP2、XP3角度来看,对象接口OI能够如此被寻址,就好像该对象接口已经加载了完整的经二进制编码的结构文档BCS那样。但是,对象接口OI首先仅仅持有在经二进制编码的索引文档BCI中所提供的结构信息并且在需要情况下借助在经二进制编码的索引文档BCI中提供的结构信息来再加载(nachladen)经二进制编码的结构文档BCS的一部分。
下面利用对经二进制编码的索引文档BCI的参与的描述来阐述两个示意性的处理操作。
第一询问的主题是以下问题:笔记本具有多少个笔记。这样的询问例如由处理过程XP1、XP2、XP3之一基于查询语言XPath或XQuery来提出,例如以询问语法:»count(/notebook/note/)«来提出。该询问可以在经二进制编码的索引文档BCI的唯一参与的情况下被应答,其方式是,对在那的具有识别码4的所有元素进行计数,其中所述识别码代表字符串»note«。
第二询问的主题是以下问题:多少笔记被施加以类别»EXI«。这样的询问例如以以下询问语法提出:»count(/notebook/note[@category='EXI'])«。该询问将追踪ID4的这两个识别码并对其分解,以便能够检查,属性»category«是否存在以及该属性是否具有值»EXI«。所述分解在未示出的资源表或»EXI String Table«的参与的情况下进行。然而为了检查属性»category«之一是否具有值»EXI«,以不同于以上的询问的方式,应考虑经二进制编码的结构文档BCS,因为该属性的内容不被包含在经二进制编码的索引文档BCI的结构上的子集中。因此,在对象接口OI侧加载经二进制编码的结构文档BCS的相应的片段并且执行检查。
经二进制编码的结构文档BCS作为实际的完整的信息载体文档借助二进制的EXI格式一方面紧凑地被示出并且具有索引跳转标号(Index-Sprungmarke),所述索引跳转标号实现对每个元素的随机存取。为了实现随机存取,例如利用元素的在EXI规范中设置的»selfContained«属性。
此外,已知的通过相应的识别码来取代元素名称的应用也在经二进制编码的索引文档BCI中导致:经二进制编码的索引文档BCI与其基于的结构文档SD相比被保持得非常精简(schlank)。在进一步省略值的情况下根据本发明地限于结构上的子集导致该XIndex的还更大的精简化,所述XIndex能够与根据本发明的措施一起完整地被存放在工作存储器中。
为了实现对经二进制编码的结构文档BCS的selfContained元素的随机存取,仅仅必须加载经二进制编码的结构文档BCS的相关元素以用于通过对象接口OI来处理,即以有利的方式不是加载完整的结构文档BCS或者加载结构文档BCS的更广泛的部分,其包括在位于所述相关元素前面和后面的可能文件内容在内,其中所述相关元素就此而论应理解为根据需要所必需的片段。
根据本发明的一种实施方式规定,除结构索引之外,经二进制编码的索引文档也包含另外的、尤其经常需要的内容和值。对所述经常需要的内容和值的处理因此不需要在对象接口OI侧重复地加载经二进制编码的结构文档BCS的相应的片段。取而代之地,对所述经常需要的内容和值的处理可以在经二进制编码的索引文档BCI的唯一参与的情况下进行。
根据本发明的一种实施方式规定,在经二进制编码的索引文档BCI所基于的结构文档SD中设置内联条目»<inline/>«,该内联条目显示,如此标记的元素不包含引用(Referenz)而是包含来自经二进制编码的结构文档BCS的值的备份。
在由此产生的经二进制编码的索引文档BCI基于的结构文档SD中的以内联条目»<inline/>«所标记的元素导致,如此标记的元素、更准确而言所标记的元素的二进制表示被列入(aufnehmen)到经二进制编码的索引文档BCI中并且因此对于处理操作而言能直接存取,而不必在对象接口OI侧从经二进制编码的结构文档BCS加载片段到工作存储器中。
内联条目被证明为有利的,以便加速询问处理,但以经二进制编码的索引文档BCI的大小为代价。许多询问也需要确定的值用于评估,例如用于评估过滤器谓词。如果这些值存在于经二进制编码的索引文档BCI的内联元素中,则不必越过该索引之外进行对经二进制编码的结构文档BCS的存取。这可能对于经常在查询选择谓词中被引用的值是有帮助的。
根据本发明的另一种实施方式规定,在经二进制编码的索引文档BCI基于的结构文档SD中设置幽灵条目(Ghost-Eintrag)»<ghost/>«,所述幽灵条目仅仅显示:存在元素,但其此外不包含另外的信息、尤其不包含内容和/或值。所述内容本身可以在需要情况下经由对经二进制编码的结构文档BCS的引用或者也对其他未示出的经二进制编码的索引文档的引用来被读取。
在由此产生的经二进制编码的索引文档BCI基于的结构文档SD中的以幽灵条目»<ghost/>«标记的元素导致,如此标记的元素不被列入到经二进制编码的索引文档BCI中,而是仅仅用于该元素的幽灵条目被列入。在经二进制编码的索引文档BCI中,针对该元素所录入的幽灵条目仅仅标记该元素的存在,而并非该元素或该元素的内容本身。如果该元素应被处理操作所需要,则在需要情况下必须在所述对象接口OI侧将该元素从经二进制编码的结构文档BCS加载到工作存储器中。
配备有幽灵条目的元素实现:即使在基于的大的结构文档SD的情况下也保持得精简的经二进制编码的索引文档BCI。该措施允许对一个或多个经二进制编码的索引文档的分区以及允许将该索引的预计很少被需要的部分从主存储器中转移。
下面,再次参考笔记本的上述XML表示。经二进制编码的索引文档BCI的EXI表示具有以下结构:
Figure 384655DEST_PATH_IMAGE002
Figure 199027DEST_PATH_IMAGE003
经二进制编码的索引文档 BCI优选具有与分别下一个元素的»局部的(local)«偏移量作为到实际的经二进制编码的结构文档BCS中的跳转标号。由于下一个元素的不同类型,在经二进制编码的索引文档BCI的在上面示出的EXI表示中,为了更好地理解,在名称上,在<offsetNextSibling/>、<offsetNextParentSibling/>和<offsetFirstChild/>之间进行区分。
对于每个元素分别具有所提到的偏移量中的恰好一个并且在技术上不需要所述不同类型的在名称上的区别。可替代地,因此该偏移量也一般性地被表示,例如被表示为<offsetNextElernentInDocumentOrder/>。
不同于以上描述的局部偏移量的绝对偏移量与此相对地具有以下优点:为了能够读取整体的相关元素而在经二进制编码的结构文档BCS中待跳过的字节的数目可以在一个步骤中被确定。然而,在经二进制编码的结构文档BCS中所包含的数据的结构上或内容上的修改的情况下,在绝对偏移量的情况下可能必须更新后续的所有元素索引。另一方面(hingegeben),在使用局部偏移量的情况下,元素的这样的修改仅仅引起位于该元素之上的层次中的更新。
局部偏移量有利地被使用,以便在从处理过程XP1、XP2、XP3之一方面进行询问的情况下能够跳过不相关的部分。例如对/notebook/note/body的询问将导致,在主体(body)之前的元素<subject>被视为不相关的并且可以通过偏移量来被跳过。
另一个示例是按照/notebook/editor的询问,该询问寻找元素»editor«,该元素实际上不存在。一旦该询问遇到<notebook>元素,则直接跳过该元素,因为在其中不包含<editor>元素并且因此不相关。
按照以下准则算出待跳过的元素的长度:
1. 以0初始化长度;
2. 如果存在,则将长度与<offsetFirstChild>相加,并且跳到firstChild索引
或者如果不存在,
则要么加上<offsetNextSibling>要么加上<offsetNextParentSibling>(有一个存在)并且跳至所述索引
3. 一直继续步骤2,直到:
a. 如果元素具有子元素(已经以<offsetFirstChild>开始),则直至每个子元素以<offsetNextParentSibling>结束;
b. 如果元素不具有子元素,那么<offsetNextSibling>则包括该长度。
在下面的表格中整理了偏移量:
Figure 21490DEST_PATH_IMAGE004
在其中,在列标头中:
AO:绝对偏移量(Absoulute Offset)
L:长度(Length),以字节为单位
OFC:与第一个子元素的偏移量(offsetFirstChild)
ONS:与下一个兄弟元素的偏移量(offsetNextSibling)
ONP:与下一个父元素的偏移量(offsetNextParentSibling)
在表格中,EX元素的开始标记(Start-Tag)以开始元素或SE表示,在结束标记上的对应事件(Ereignis oder Event)被表示为结束元素或EE。以AT输入开始标记的属性。以字符(character)或CH表示以下事件:在该事件之后接着是元素的数据。
用于笔记本[l]的长度的计算得出74,即4+8+6+21+4+16+15
用于笔记[l]的长度的计算得出35,即8+6+21
用于笔记[2]的长度的计算得出35:4+16+15
用于笔记[2]/题目[1]的长度的计算得出16:16。
在经二进制编码的索引文档BCI (其也称作XIndex)上的处理操作的根据本发明的执行具有以下优点:
- 所述方法实现更快速的询问处理,其方式是,已经能够借助索引文档BCI处理确定的请求;
- 在处理询问期间,不仅在资源有限的设备上而且也在其他的计算机系统直至服务器上显著减小的主存储器消耗;
- 除询问之外,所述方法也实现在索引文档BCI中所包含的数据的修改,所述数据来自于基于的以基于文本的描述语言所构建的结构文档SD;
- 作为结果,所述方法以有效的形式、即借助格式EXI来提供已经存在的数据;
- 所述方法实现标准技术、诸如转换语言XQuery也在资源有限的设备、如嵌入式系统上的应用,与询问语言XPath不同,所述转换语言允许通过单纯的查询或过滤来转换数据。

Claims (7)

1.一种用于在资源有限的设备中处理经二进制编码的结构文档的方法,其中,所述经二进制编码的结构文档BCS基于如下结构文档SD,所述结构文档SD是以基于文本的描述语言所构建的,并且其中经二进制编码的索引文档BCI基于所述结构文档SD的结构上的子集;所述方法包括以下步骤:
将所述经二进制编码的索引文档BCI的存储表示存放在所述设备的工作存储器中;
将所述经二进制编码的结构文档BCS存放在被分配给所述设备的后台存储器中;
通过至少一个处理过程利用经由对象接口OI来对所述经二进制编码的索引文档BCI的所述存储表示的存取来执行处理操作,其中,根据需要将所述经二进制编码的结构文档BCS的片段在所述对象接口OI侧加载到所述工作存储器中。
2.根据专利权利要求1所述的方法,其特征在于,所述经二进制编码的索引文档BCI和/或所述经二进制编码的结构文档BCS以高效XML交换格式或EXI格式存在。
3.根据专利权利要求1所述的方法,其特征在于,所述基于文本的描述语言是可扩展标记语言或XML。
4.根据专利权利要求1至3中任一项所述的方法,其特征在于,在所述经二进制编码的索引文档BCI中包含以下元素:根据在所基于的所述结构文档SD中的相应元素的标记,所述元素在所述经二进制编码的索引文档BCI中对于所述处理操作而言能直接存取。
5.根据专利权利要求1至3中任一项所述的方法,其特征在于,在所述经二进制编码的索引文档BCI中,元素根据在所基于的所述结构文档SD中的相应元素的标记而不被包含在所述经二进制编码的索引文档BCI中,并且,所述元素在需要情况下在所述对象接口OI侧从所述经二进制编码的结构文档BCS中被提取并且被加载到所述工作存储器中。
6.一种计算机程序产品,所述计算机程序产品具有如下装置,当所述计算机程序产品在资源有限的设备上被执行时,所述装置用于执行根据以上专利权利要求中任一项所述的方法。
7.一种用于以资源有限的方式来处理经二进制编码的结构文档的设备,所述设备包括被分配给所述设备的用于存放所述经二进制编码的结构文档的后台存储器,所述经二进制编码的结构文档基于如下结构文档,所述结构文档是以基于文本的描述语言所构建的;
具有用于存放基于所述结构文档的结构上的子集的经二进制编码的索引文档的工作存储器;
具有用于在通过至少一个处理过程执行处理操作时对所述经二进制编码的索引文档进行存取的对象接口,所述对象接口被设立用于根据需要将所述经二进制编码的结构文档的片段加载到所述工作存储器中。
CN201780023309.4A 2016-04-12 2017-03-28 用于处理经二进制编码的结构文档的设备和方法 Active CN108885612B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102016206046.5 2016-04-12
DE102016206046.5A DE102016206046A1 (de) 2016-04-12 2016-04-12 Gerät und Verfahren zur Bearbeitung eines binärkodierten Strukturdokuments
PCT/EP2017/057237 WO2017178222A1 (de) 2016-04-12 2017-03-28 Gerät und verfahren zur bearbeitung eines binärkodierten strukturdokuments

Publications (2)

Publication Number Publication Date
CN108885612A CN108885612A (zh) 2018-11-23
CN108885612B true CN108885612B (zh) 2023-06-30

Family

ID=58464518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780023309.4A Active CN108885612B (zh) 2016-04-12 2017-03-28 用于处理经二进制编码的结构文档的设备和方法

Country Status (5)

Country Link
US (1) US11545997B2 (zh)
EP (1) EP3411803B1 (zh)
CN (1) CN108885612B (zh)
DE (1) DE102016206046A1 (zh)
WO (1) WO2017178222A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112035565A (zh) * 2020-09-03 2020-12-04 天元大数据信用管理有限公司 一种根据word文档生成sql脚本的方法
US20220350818A1 (en) * 2021-04-29 2022-11-03 Salesforce, Inc. Data transformation using binary serialization format

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1612137A (zh) * 2003-10-29 2005-05-04 国际商业机器公司 用于存档和检索标记语言文档的方法和系统
CN1744087A (zh) * 2004-09-02 2006-03-08 佳能株式会社 搜索文档的文档处理装置及其控制方法
CN1845099A (zh) * 2006-04-27 2006-10-11 掌富科技(南京)有限公司 智能移动终端多媒体电子文档转换存储方法及转换存储结构
CN101136033A (zh) * 2006-08-28 2008-03-05 株式会社东芝 结构化文档管理系统和管理在所述系统中的索引的方法
FR2945363A1 (fr) * 2009-05-05 2010-11-12 Canon Kk Procede et dispositif de codage d'un document structure
CN103577513A (zh) * 2012-07-18 2014-02-12 德商赛克美国有限公司 藉延迟节点实例化以缓存xml信息集的系统和/或方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7210097B1 (en) * 2002-05-22 2007-04-24 Pitney Bowes Inc. Method for loading large XML documents on demand
WO2004068320A2 (en) * 2003-01-27 2004-08-12 Vincent Wen-Jeng Lue Method and apparatus for adapting web contents to different display area dimensions
US7627589B2 (en) 2004-08-10 2009-12-01 Palo Alto Research Center Incorporated High performance XML storage retrieval system and method
US7844633B2 (en) * 2007-09-13 2010-11-30 International Business Machines Corporation System and method for storage, management and automatic indexing of structured documents
FR2936623B1 (fr) * 2008-09-30 2011-03-04 Canon Kk Procede de codage d'un document structure et de decodage, dispositifs correspondants
JP2010250449A (ja) * 2009-04-13 2010-11-04 Canon Inc 情報処理装置、情報処理方法
CN104185845B (zh) * 2012-03-13 2017-12-12 谷歌公司 用于提供网页的二进制表示的系统和方法
US9959255B2 (en) * 2014-01-31 2018-05-01 Yahoo Holdings, Inc. Dynamic streaming content provided by server and client-side tracking application
US10282400B2 (en) * 2015-03-05 2019-05-07 Fujitsu Limited Grammar generation for simple datatypes
JP2019506652A (ja) * 2015-11-20 2019-03-07 ヒューレット−パッカード デベロップメント カンパニー エル.ピー.Hewlett‐Packard Development Company, L.P. Xmlファイルの凝縮

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1612137A (zh) * 2003-10-29 2005-05-04 国际商业机器公司 用于存档和检索标记语言文档的方法和系统
CN1744087A (zh) * 2004-09-02 2006-03-08 佳能株式会社 搜索文档的文档处理装置及其控制方法
CN1845099A (zh) * 2006-04-27 2006-10-11 掌富科技(南京)有限公司 智能移动终端多媒体电子文档转换存储方法及转换存储结构
CN101136033A (zh) * 2006-08-28 2008-03-05 株式会社东芝 结构化文档管理系统和管理在所述系统中的索引的方法
FR2945363A1 (fr) * 2009-05-05 2010-11-12 Canon Kk Procede et dispositif de codage d'un document structure
CN103577513A (zh) * 2012-07-18 2014-02-12 德商赛克美国有限公司 藉延迟节点实例化以缓存xml信息集的系统和/或方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XML-Less EXI with Code Generation for Integration of Embedded Devices in Web Based Systems;Yusuke Doi 等;《IEEE》;20121231;第1-8页 *

Also Published As

Publication number Publication date
EP3411803B1 (de) 2023-07-12
EP3411803A1 (de) 2018-12-12
US11545997B2 (en) 2023-01-03
EP3411803C0 (de) 2023-07-12
CN108885612A (zh) 2018-11-23
WO2017178222A1 (de) 2017-10-19
US20190155875A1 (en) 2019-05-23
DE102016206046A1 (de) 2017-10-12

Similar Documents

Publication Publication Date Title
US9928289B2 (en) Method for storing XML data into relational database
US7403940B2 (en) Optimal storage and retrieval of XML data
US20060047646A1 (en) Query-based document composition
US7844632B2 (en) Scalable DOM implementation
US8156494B2 (en) Pluggable DOM implementation using an abstract API when receiving API calls for accessing different formats of XML data
US20060036631A1 (en) High performance XML storage retrieval system and method
EP1723553A2 (en) Device for structured data transformation
CN101777045A (zh) 一种通过索引解析xml文档的方法
US20060106831A1 (en) System and method for managing structured document
CN108885612B (zh) 用于处理经二进制编码的结构文档的设备和方法
JP5548331B2 (ja) ナビゲーションデータベースのためのフォーマット記述
CN100397397C (zh) 基于关系数据库的xml数据存储与访问方法
US8805860B2 (en) Processing encoded data elements using an index stored in a file
US20060167907A1 (en) System and method for processing XML documents
CN101617307B (zh) 编解码设备和方法
Collard Addressing source code using srcml
EP2148276A1 (en) Mark-up language engine
CN100380322C (zh) 硬件加速的验证解析器
Horridge et al. Binary OWL.
EP1244032A1 (en) Management and distribution of electronic media
EP1244030A1 (en) Management and distribution of electronic media
Ball et al. Briefing paper: The adobe extensible metadata platform (xmp)
EP1244031A1 (en) Management and distribution of electronic media
Alvestad et al. Development of a Demand Driven Dom Parser
Kråkenes et al. Development of a Demand Driven Dom Parser

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant