CN102768674A - 一种基于路径结构的xml数据存储方法 - Google Patents

一种基于路径结构的xml数据存储方法 Download PDF

Info

Publication number
CN102768674A
CN102768674A CN2012101939484A CN201210193948A CN102768674A CN 102768674 A CN102768674 A CN 102768674A CN 2012101939484 A CN2012101939484 A CN 2012101939484A CN 201210193948 A CN201210193948 A CN 201210193948A CN 102768674 A CN102768674 A CN 102768674A
Authority
CN
China
Prior art keywords
node
path
xml
data
xml document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101939484A
Other languages
English (en)
Other versions
CN102768674B (zh
Inventor
赵伟
郑程光
孙伟丰
罗正海
李泉
李�浩
李书淦
程仁波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Founder Digital Publishing Technology (Shanghai) Co.,Ltd.
Founder Information Industry Holdings Co Ltd
Peking University Founder Group Co Ltd
Original Assignee
FOUNDER DIGITAL PUBLISHING TECHNOLOGY (SHANGHAI) CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FOUNDER DIGITAL PUBLISHING TECHNOLOGY (SHANGHAI) CO LTD filed Critical FOUNDER DIGITAL PUBLISHING TECHNOLOGY (SHANGHAI) CO LTD
Priority to CN201210193948.4A priority Critical patent/CN102768674B/zh
Publication of CN102768674A publication Critical patent/CN102768674A/zh
Application granted granted Critical
Publication of CN102768674B publication Critical patent/CN102768674B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于路径结构的XML数据存储方法,与现有技术相比,上述技术方案具有下优点:由于在现有技术的基础上,本发明的一种基于路径结构的XML数据存储方法和装置,利用路径信息实现独特的节点数据存储方案,可以实现高效的数据查询和更新操作,更加的高效、可靠,可用性和可扩展性显著提高。本发明的技术方案的应用,不涉及XML数据的查询和更新路径的长短以及XML文档自身的复杂性,在任何情况下,路径查询的代价恒定,因此,对于结构复杂的XML文档和具有较长路径的XQuery查询可以显著提高查询性能。同时,由于将XML文档的元数据独立地进行存储,避免了节点名称上的重复,在数据量非常巨大的数据库管理应用例中,可以显著地提高数据查询和更新性能。

Description

一种基于路径结构的XML数据存储方法
技术领域
本发明涉及数据存储领域,特别涉及一种基于路径结构的XML数据存储方法。
背景技术
随着现代信息产业的不断深入发展,对于信息的集成和共享的需求也变得日益迫切。XML(全称Extensible Markup Language),一种专门为internet而设计的一种标记语言。XML的重点不在于数据的形式本身,而在于管理数据信息,因此,XML使得不同数据库模式的统一成为可能,为异构数据库的集成问题提供了途径。因此,XML在近几年得到了发展和广泛的应用。
XML数据库管理系统(XMLDBMS)也是近年来发展迅速的一种新型的数据库管理系统,它以存储和检索符合W3C标准的XML文档数据为目标的数据库管理系统,并且可以更新XML文档。由于它存储的对象是XML文档库,因此XMLDBMS本质上就是一种XML文档库。
同时,XML文档被用作表达叙述性文档(比如电子书,用户手册等)本身的内容和外观的格式规范,比如微软Office软件的.docx,.xlsx,.pptx文档格式以及OpenOffice系统的文档格式都是基于XML来存储文档数据和格式的;还有使用标准的XML来表达网页内容的xhtml。此外很多文档处理工具也使用XML来作为其统一的数据源,比如docbook和doxygen等工具使用符合其内部定义的XML文档标准(由XML Schema定义)的XML文档作为统一的数据源来产生和输出各种表示方法下的文档,比如使用同一个xml文档数据源产生和输出html,pdf,chm等多种最终文档格式。如上所述,XML文档标准的描述方式是XML Schema或者DTD。
还有一大类XML文档是简单随意的XML文档,它们并不遵循任何文档标准,仅仅是符合XML语言标准的。它们存储的可以是以面向阅读的文字内容为主的文档内容,也可能是以数值类型为主的数据。
总之,XML文档被用作存储数据或者存储文档内容,它们可以遵循XML Schema/DTD定义的标准规范,也可能不遵循任何模式和标准的任意的Well Formed XML文档。并且这些文档都可能需要被更新。当然,相比于查询的访问量,更新数据这种访问所占的比重较小,文档还是以只读访问为主的,甚至有些用户愿意使用只读的数据源,如果这样可以得到更高的性能的话。在当前现实应用中,用户需要管理的XML文档数量巨大,并且大量用户会有频繁地并发读写的需求;另外有的XML文档非常巨大,单个文档可以达到若干个GB字节。这就需要XML数据库管理系统(XMLDBMS)来存储和检索以及更新XML文档,实现XML数据的高效的,高并发的,并且遵循事务ACID语义的读写访问,并且提供高可用性和高可扩展性。
发明内容
本发明解决的是现有技术中XML数据库管理系统查询和更新数据效率低下的问题。
为解决上述问题,本发明技术方案提供一种基于路径结构的XML数据存储方法包括:
步骤S1:解析所述XML文档,以获取包括所述XML文档的元素节点数据在内的信息;
步骤S2:获取所述元素节点的路径;
步骤S3:将获取的所述元素节点的所述路径插入路径表中,并在所述路径表中赋予所述每一条路径一个唯一的编号作为路径ID;
步骤S4:将所述路径ID存储至所述元素节点的节点对象中,并将所述节点对象存储至节点数据行中;
步骤S5:在路径索引表中插入一个指向所述节点数据行的索引行。
可选地,所述的步骤S1具体为:将所述XML文档送至XML文档解析器,以获取包括所述XML文档的元素节点数据在内的信息。
可选地,所述的包括所述XML文档的元素节点数据在内的信息进一步包括:所述XML文档的各个元素节点及其附属的子节点的数据,以及当前元素节点的名称和类型在内的信息。
可选地,所述的元素节点附属的子节点包括属性节点、名字空间节点、文本节点、注释节点和处理指令节点。
可选地,所述的XML文档解析器采用SAX方式解析所述XML文档。
可选地,所述的步骤S2具体为:将所述元素节点的名称依次出栈,获取所述元素节点的完整路径,而后再将所述元素节点的名称依次入栈。
可选地,步骤S3进一步包括:若所述XML文档具有类型信息,则将所述类型信息与路径ID一并存储至节点数据行中。
可选地,所述的步骤S4具体为:将包括路径ID、所述元素节点的附属子节点数据在内的所述元素节点的所有数据序列化为节点数据行,并插入所述节点数据表中。
可选地,在所述的步骤S5中,所述路径索引表以所述路径ID为键值,指向所述路径下的元素节点。
可选地,所述的路径为字符串,其为由多个PathSection组成的序列,所述的每个PathSection包括名字空间字符串ID和本地名称字符串。
本发明还提供了一种基于权项1的XML数据查询方法,包括:
使用所述路径表的索引找到路径数据行;
以路径ID作为键值查找所述路径表;
获取所述路径ID下所有元素节点对应的数据行;
对所述元素节点对应的数据行执行节点过滤操作,得到符合查询条件的最终结果,并返回给用户。
本发明还提供了一种基于权项1的XML数据更新方法,包括:
若一元素节点改变名称,则获取所述元素节点的新路径;
将获取的所述元素节点的所述路径插入路径表中,并在所述路径表中更新路径ID。
如果插入节点或者替换元素节点或者属性节点,那么获取新节点的路径,如果所述新节点的路径在路径表中不存在,则插入所述路径表中并且得到所述新节点的路径ID,并将所述路径ID设置到插入节点对象中,以在存储节点数据时将所述路径ID存储至节点数据行中。
与现有技术相比,上述技术方案具有下优点:
由于在现有技术的基础上,本发明的一种基于路径结构的XML数据存储方法和装置,利用路径信息实现独特的节点数据存储方案,可以实现高效的数据查询和更新操作,更加的高效、可靠,可用性和可扩展性显著提高。
本发明的技术方案的应用,不涉及XML数据的查询和更新路径的长短以及XML文档自身的复杂性,在任何情况下,路径查询的代价恒定,因此,对于结构复杂的XML文档和具有较长路径的XQuery查询可以显著提高查询性能。同时,由于将XML文档的元数据独立地进行存储,避免了节点名称上的重复,在数据量非常巨大的数据库管理应用例中,可以显著地提高数据查询和更新性能。
附图说明
图1是本发明实施方式的基于路径结构的XML数据存储方法的流程图;
图2是本发明实施方式的基于路径结构的XML数据存储方法所涉及的数据表和期间关系示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在以下描述中阐述了具体细节以便于充分理解本发明。但是本发明能够以多种不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广。因此本发明不受下面公开的具体实施方式的限制。
为解决现有技术中的问题,本发明的发明人经过研究,提出了一种基于路径结构的XML数据存储方法。
参阅图1和图2,图1是本发明实施方式的基于路径结构的XML数据存储方法的流程图。图2是根据本发明的存储方法所涉及的数据表和期间关系示意图。所述基于路径结构的XML数据存储方法包括:
步骤S1:解析所述XML文档,以获取包括所述XML文档的元素节点数据在内的所有信息;
步骤S2:获取所述元素节点的路径;
步骤S3:将获取的所述元素节点的所述路径插入路径表中,并在所述路径表中赋予所述路径一个唯一的编号作为路径ID;
步骤S4:将所述路径ID存储至所述元素节点的节点对象中,并将所述节点对象存储至节点数据行中;
步骤S5:在路径索引表中插入一个指向所述节点数据行的索引行。
我们知道,XML数据库管理系统(XMLDBMS)中存储的对象是XML文档,其中的用于存储XML文档的实体称为容器,各个容器中可存储任意数量的XML文档的数据,而每个容器则由若干数据表组成,这些数据表分别用于存储XML文档的各方面的数据和结构信息,包括但不限于节点数据,节点间关系,路径数据,各种索引,各种统计信息。而数据表则是由若干数据行组成,数据行则是实现数据存储的基本单位。通常情况下,数据行都会对应有索引,通过这些索引可以实现快速查找特定数据行的目标。
XML文档内容被作为节点数据存储在一个节点表中,在XDM的7种节点中,把属性节点,名字空间节点,文本节点,注释节点和处理指令节点都存放在它们的父亲节点(必然是元素节点)中,因此节点表中只存储元素节点和文档节点。文档节点存储一个XML文档的元数据信息,而文档的内容则存储在这个文档的所有的元素节点中。XML文档中元素节点构成一个节点树,所以节点之间的父子关系,兄弟关系这些结构信息也需要以某种方式存储起来,本方案在一个元素节点数据行中存储其父节点ID,第一个子节点ID,前一个和后一个兄弟节点ID,这样就可以把整个节点树的结构信息存储起来。
一个元素节点的路径就是从一个XML文档的根元素节点出发依次经历若干级节点而到达这个元素节点所经过的元素节点名称的序列。XML数据存储方案要支持高效的数据查询和更新操作,这是存储方案设计的目标。为了能够很好地支持XQuery的路径查询,维护XML文档的元素节点的路径信息。
下面以下述的简单的XML文档为例详细说明本发明实施方式的基于路径结构的XML数据存储方法。
XML文档为:
<a>
<b attr=”value”>
<c>ccc 1</c>
<c>ccc2</c>
</b>
</a>。
本发明的具体实施方式的基于路径结构的XML数据存储方法,采用以下的方式存储上述的XML文档数据:
步骤S1:解析所述XML文档,以获取包括所述XML文档的元素节点数据在内的所有信息;
其中,优选地,在本发明的一个优选的实施方式中,为了得到解析XML文档,首先,将XML文档送入XML文档解析器中,XML文档解析器采用SAX方式解析XML文档,通过XML文档解析器的事件通知机制,可以得到XML文档的各个元素节点及其附属的五种子节点(包括属性节点,名字空间节点,文本节点,注释节点,处理指令节点)的数据,以及当前元素节点的名称和类型等信息。
步骤S2:获取所述元素节点的路径;
其中,优选地,在本发明的一个优选的实施方式中,采用以下的方式来获取元素节点的路径,即首先将堆栈中的元素节点名称依次出栈,即可得到当前的元素节点的路径字符串,然后再将元素节点的名称依次入栈。由于XML元素节点的树型组织方式,在元素节点的所有子节点被处理完之前,不会得到该元素节点结束的事件通知。因此,可以采用上述的方式获取XML文档中的各个元素节点完整的路径字符串。以上述的XML文档为例,文档中的名称为“c”的两个元素节点,通过上述的操作,可以得到他们的完整的路径字符串为“/a/b/c”。
步骤S3:将获取的所述元素节点的所述路径插入路径表中,并在所述路径表中赋予所述路径一个唯一的编号作为路径ID;同时,若XML文档同时具有类型信息的话,那么应当将所述类型信息与路径ID一起存储至节点数据行中。
以上述的XML文档为例,可以得到下述表1所示的路径表:
表1
  PATH   类型信息   PathID
  /a   TypeInfo_1   1
  /a /b   TypeInfo_2   2
  /a/b/c   TypeInfo_3   3
采用上述的存储方案的好处在于,可以避免重复存储名字字符串。
同样,以上述的XML文档中的元素节点“c”为例:在每一个“c”节点的数据行中,都存储这个路径ID,并且不存储“c”元素节点名称,这样可以避免重复存储大量节点名称字符串,因为节点名称字符串一般相对冗长,可能长达几十个字节。而采用上述的存储方法后,在得到一个节点时,就可以得到相应节点的路径信息,进而同样可以得到各级节点的名称。
同时,应该指出的是,由于属性节点和元素节点一样也具有名称,为了避免重复存储属性节点的名称,也需要对属性节点与元素节点执行相同的操作,以避免存储大量重复的名称字符串。
步骤S4:将所述路径ID存储至所述元素节点的节点对象中,并将所述节点对象存储至节点数据行中;
其中,优选地,在本发明的一个优选的实施方式中,本步骤的操作具体为:将包括路径ID、所述元素节点的附属子节点数据在内的所述元素节点的所有数据序列化为节点数据行,并插入所述节点数据表中。其中的元素节点的五种子节点包括属性节点、名字空间节点、文本节点、注释节点和处理指令节点。
步骤S5:在路径索引表中插入一个指向所述节点数据行的索引行。
其中,优选地,本发明的一个优选的实施方式中,所述路径索引表以路径ID为键值,指向该路径下的元素节点。
本发明的实施方式中的路径索引表的引入,同时以路径ID为键值进行索引,可以快速定位到任何路径下的节点,查找开销与路径长度无关,使得路径查询变得更加高效、可靠。
同时,本发明还提供了一种基于上述的基于路径结构的XML数据存储方法的XML数据查询方法,包括:
以路径ID作为键值查找所述路径表;
获取所述路径ID下所有元素节点对应的数据行;
对所述元素节点对应的数据行执行节点过滤操作,得到符合查询条件的最终结果,并返回给用户。
本发明还提供了一种基于上述的基于路径结构的XML数据存储方法的XML数据更新方法,包括:
若一元素节点改变名称,则获取所述元素节点的新路径;
将获取的所述元素节点的所述新路径,并在所述路径表中更新路径ID。
当存储在容器中的一个XML文档被更新时,按照以下的方式更新元素节点的路径信息:若插入节点时,如果该节点存在,那么首先获取该节点的路径字符串,查询路径表得到其路径ID;若该节点不存在,则将路径ID与节点数据一起存储至节点数据行中;若节点的名称发生了变化,则获取该节点的变化以后的路径字符串,并按照将新的路径字符串插入路径表中,并获取路径ID,同时更新该节点的数据行中的路径ID信息;而删除或者更新一个节点的内含的数据则不需要对路径信息进行任何的操作。
同样以上述的XML文档为例,若进行下述的路径查询:
doc(“abc.xml”)/a/b/c
首先,以“/a/b/c”作为键值查找路径表得到路径ID,然后使用路径ID查找节点数据表的路径索引表,从中得到该路径下所有元素节点的数据行。然后将查找得到的所有相关的数据行送入节点过滤操作中,得到符合查询条件的最终结果并且返回给用户。
若路径查询带有”//”路径运算符,比如/a//c,那么遍历路径表中以/a开头的所有路径,得到所有满足/a//c的路径的ID,组成一个路径ID集合。然后遍历路径索引表,如果路径ID位于该集合中,那么对应的节点数据行即满足路径查询条件。
另外,在本发明的实施方式中,路径实质上为字符串,其为由多个PathSection组成的序列,所述的每个PathSection包括名字空间字符串ID和本地名称字符串。通过名字空间信息就可以避免名字冲突,确保在大量存储XML文档时不会导致节点的本地名称冲突而是的路径信息紊乱的情况的出现。
综上所述,本发明技术方案具有下优点:
由于在现有技术的基础上,本发明的一种基于路径结构的XML数据存储方法和装置,利用路径信息实现独特的节点数据存储方案,可以实现高效的数据查询和更新操作,更加的高效、可靠,可用性和可扩展性显著提高。
本发明的技术方案的应用,不涉及XML数据的查询和更新路径的长短以及XML文档自身的复杂性,在任何情况下,路径查询的代价恒定,因此,对于结构复杂的XML文档和具有较长路径的XQuery查询可以显著提高查询性能。同时,由于将XML文档的元数据独立地进行存储,避免了节点名称上的重复,在数据量非常巨大的数据库管理应用例中,可以显著地提高数据查询和更新性能。
应当理解的是这里所描述的方法和系统可以以各种形式的硬件、软件、固件、专用处理机或者它们的组合实现。尤其是,至少本发明的一部分包括程序指令的应用程序优选实现。这些程序指令被确实地包括在一个或者多个程序存储设备(包括但不限于硬盘,磁性软盘,RAM,ROM,CD,ROM等)里,并且可由任何包括适当结构的设备或者机器,例如一种具有处理器、内存和输入/输出接口的通用数字计算机执行。还应当理解由于附图中描述的一些系统的组成部件和处理步骤优选地以软件实现,所以,系统模块(或者方法步骤的逻辑流程)之间的连接可能不同,这取决于本发明的编程方式。根据这里给出的指导,相关领域的普通技术人员将能够设计出本发明的这些以及类似的实施方式。
以上公开了本发明的多个方面和实施方式,本领域的技术人员会明白本发明的其它方面和实施方式。本发明中公开的多个方面和实施方式只是用于举例说明,并非是对本发明的限定,本发明的真正保护范围和精神应当以权利要求书为准。

Claims (12)

1.一种基于路径结构的XML数据存储方法,其特征在于,包括:
    步骤S1:解析所述XML文档,以获取包括所述XML文档的元素节点数据在内的信息;
步骤S2:获取所述元素节点的路径;
步骤S3:将获取的所述元素节点的所述路径插入路径表中,并在所述路径表中赋予所述每一条路径一个唯一的编号作为路径ID;
步骤S4:将所述路径ID存储至所述元素节点的节点对象中,并将所述节点对象存储至节点数据行中;
步骤S5:在路径索引表中插入一个指向所述节点数据行的索引行。
2.如权利要求1所述的基于路径结构的XML数据存储方法,其特征在于,所述的步骤S1具体为:将所述XML文档送至XML文档解析器,以获取包括所述XML文档的元素节点数据在内的信息。
3.如权利要求2所述的基于路径结构的XML数据存储方法,其特征在于,所述的包括所述XML文档的元素节点数据在内的信息进一步包括:所述XML文档的各个元素节点及其附属的子节点的数据,以及当前元素节点的名称和类型在内的信息。
4.如权利要求3所述的基于路径结构的XML数据存储方法,其特征在于,所述的元素节点附属的子节点包括属性节点、名字空间节点、文本节点、注释节点和处理指令节点。
5.如权利要求2所述的基于路径结构的XML数据存储方法,其特征在于,所述的XML文档解析器采用SAX方式解析所述XML 文档。
6.如权利要求1所述的基于路径结构的XML数据存储方法,其特征在于,所述的步骤S2具体为:将所述元素节点的名称依次出栈,获取所述元素节点的完整路径,而后再将所述元素节点的名称依次入栈。
7.如权利要求1 所述的基于路径结构的XML数据存储方法,其特征在于,步骤S3进一步包括:若所述XML文档具有类型信息,则将所述类型信息与路径ID一并存储至节点数据行中。
8.如权利要求3所述的基于路径结构的XML数据存储方法,其特征在于,所述的步骤S4具体为:将包括路径ID、所述元素节点的附属子节点数据在内的所述元素节点的所有数据序列化为节点数据行,并插入所述节点数据表中。
9.如权利要求1所述的基于路径结构的XML数据存储方法,其特征在于,在所述的步骤S5中,所述路径索引表以所述路径ID为键值,指向所述路径下的元素节点。
10.如权利要求1或6所述的基于路径结构的XML数据存储方法,其特征在于,所述的路径为字符串,其为由多个PathSection组成的序列,所述的每个PathSection包括名字空间字符串ID和本地名称字符串。
11.一种基于权项1的XML数据查询方法,其特征在于,包括:
使用所述路径表的索引找到路径数据行;
以路径ID作为键值查找所述路径表;
获取所述路径ID下所有元素节点对应的数据行;
对所述元素节点对应的数据行执行节点过滤操作,得到符合查询条件的最终结果,并返回给用户。
12.一种基于权项1的XML数据更新方法,其特征在于,包括:
   若一元素节点改变名称,则获取所述元素节点的新路径;
将获取的所述元素节点的所述路径插入路径表中,并在所述路径表中更新路径ID;
如果插入节点或者替换元素节点或者属性节点,那么获取新节点的路径,如果所述新节点的路径在路径表中不存在,则插入所述路径表中并且得到所述新节点的路径ID,并将所述路径ID设置到插入节点对象中,以在存储节点数据时将所述路径ID存储至节点数据行中。
CN201210193948.4A 2012-06-12 2012-06-12 一种基于路径结构的xml数据存储方法 Expired - Fee Related CN102768674B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210193948.4A CN102768674B (zh) 2012-06-12 2012-06-12 一种基于路径结构的xml数据存储方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210193948.4A CN102768674B (zh) 2012-06-12 2012-06-12 一种基于路径结构的xml数据存储方法

Publications (2)

Publication Number Publication Date
CN102768674A true CN102768674A (zh) 2012-11-07
CN102768674B CN102768674B (zh) 2016-08-24

Family

ID=47096078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210193948.4A Expired - Fee Related CN102768674B (zh) 2012-06-12 2012-06-12 一种基于路径结构的xml数据存储方法

Country Status (1)

Country Link
CN (1) CN102768674B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103049494A (zh) * 2012-12-07 2013-04-17 华为技术有限公司 一种xml文档的表格存储方法及装置
CN104809145A (zh) * 2014-01-23 2015-07-29 三星泰科威株式会社 层次式数据分析方法
CN105138524A (zh) * 2014-05-30 2015-12-09 北大方正信息产业集团有限公司 一种创建文档节点路径索引的方法、装置和服务器
CN105608092A (zh) * 2014-11-24 2016-05-25 北大方正集团有限公司 一种创建动态索引的方法及装置
CN105868257A (zh) * 2015-12-28 2016-08-17 乐视网信息技术(北京)股份有限公司 Xml数据解析方法、生成方法以及处理系统
CN106021523A (zh) * 2016-05-24 2016-10-12 北京交通大学 基于json的数据仓库存储及查询方法
CN106814998A (zh) * 2015-11-27 2017-06-09 阿里巴巴集团控股有限公司 表单序列化方法及装置
CN107562777A (zh) * 2017-07-17 2018-01-09 阿里巴巴集团控股有限公司 数据处理方法及其设备
CN108319684A (zh) * 2018-01-31 2018-07-24 国信优易数据有限公司 一种可扩展标记语言xml文件的存储方法及装置
CN109918472A (zh) * 2019-02-27 2019-06-21 北京百度网讯科技有限公司 存储和查询数据的方法、装置、设备和介质
CN110806874A (zh) * 2018-08-03 2020-02-18 武汉斗鱼网络科技有限公司 一种直播间配置文件的解析方法、存储介质、电子设备及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1825306A (zh) * 2005-10-31 2006-08-30 北京神舟航天软件技术有限公司 基于关系数据库的xml数据存储与访问方法
CN101661481A (zh) * 2008-08-29 2010-03-03 国际商业机器公司 存储xml数据的方法、执行xml查询的方法及其装置
CN102043852A (zh) * 2010-12-22 2011-05-04 东北大学 一种基于路径信息的可扩展标记语言祖先后代索引方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1825306A (zh) * 2005-10-31 2006-08-30 北京神舟航天软件技术有限公司 基于关系数据库的xml数据存储与访问方法
CN101661481A (zh) * 2008-08-29 2010-03-03 国际商业机器公司 存储xml数据的方法、执行xml查询的方法及其装置
CN102043852A (zh) * 2010-12-22 2011-05-04 东北大学 一种基于路径信息的可扩展标记语言祖先后代索引方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103049494A (zh) * 2012-12-07 2013-04-17 华为技术有限公司 一种xml文档的表格存储方法及装置
CN103049494B (zh) * 2012-12-07 2017-05-24 华为技术有限公司 一种xml文档的表格存储方法及装置
CN104809145A (zh) * 2014-01-23 2015-07-29 三星泰科威株式会社 层次式数据分析方法
CN104809145B (zh) * 2014-01-23 2018-05-29 韩华泰科株式会社 层次式数据分析方法
CN105138524A (zh) * 2014-05-30 2015-12-09 北大方正信息产业集团有限公司 一种创建文档节点路径索引的方法、装置和服务器
CN105608092A (zh) * 2014-11-24 2016-05-25 北大方正集团有限公司 一种创建动态索引的方法及装置
CN105608092B (zh) * 2014-11-24 2020-07-14 北大方正集团有限公司 一种创建动态索引的方法及装置
CN106814998B (zh) * 2015-11-27 2020-08-25 菜鸟智能物流控股有限公司 表单序列化方法及装置
CN106814998A (zh) * 2015-11-27 2017-06-09 阿里巴巴集团控股有限公司 表单序列化方法及装置
CN105868257A (zh) * 2015-12-28 2016-08-17 乐视网信息技术(北京)股份有限公司 Xml数据解析方法、生成方法以及处理系统
CN106021523B (zh) * 2016-05-24 2019-07-26 北京交通大学 基于json的数据仓库存储及查询方法
CN106021523A (zh) * 2016-05-24 2016-10-12 北京交通大学 基于json的数据仓库存储及查询方法
CN107562777A (zh) * 2017-07-17 2018-01-09 阿里巴巴集团控股有限公司 数据处理方法及其设备
CN107562777B (zh) * 2017-07-17 2020-10-02 阿里巴巴集团控股有限公司 数据处理方法及其设备
CN108319684A (zh) * 2018-01-31 2018-07-24 国信优易数据有限公司 一种可扩展标记语言xml文件的存储方法及装置
CN110806874A (zh) * 2018-08-03 2020-02-18 武汉斗鱼网络科技有限公司 一种直播间配置文件的解析方法、存储介质、电子设备及系统
CN110806874B (zh) * 2018-08-03 2023-08-18 西安创业天下网络科技有限公司 一种直播间配置文件的解析方法、存储介质、电子设备及系统
CN109918472A (zh) * 2019-02-27 2019-06-21 北京百度网讯科技有限公司 存储和查询数据的方法、装置、设备和介质
US11334544B2 (en) 2019-02-27 2022-05-17 Beijing Baidu Netcom Science And Technology Co., Ltd. Method, apparatus, device and medium for storing and querying data

Also Published As

Publication number Publication date
CN102768674B (zh) 2016-08-24

Similar Documents

Publication Publication Date Title
CN102768674A (zh) 一种基于路径结构的xml数据存储方法
Meier et al. Nosql databases
US11169978B2 (en) Distributed pipeline optimization for data preparation
US20160371238A1 (en) Computing device and method for converting unstructured data to structured data
CN105989150B (zh) 一种基于大数据环境的数据查询方法及装置
US7376658B1 (en) Managing cross-store relationships to data objects
US10733172B2 (en) Method and computing device for minimizing accesses to data storage in conjunction with maintaining a B-tree
JP6598996B2 (ja) データ準備のためのシグニチャベースのキャッシュ最適化
CN102819585B (zh) 一种xml数据库文档控制方法
CN102810114A (zh) 基于本体的个人计算机资源管理系统
US9406018B2 (en) Systems and methods for semantic data integration
CN102024019A (zh) 一种分布式文件系统中基于后缀树的目录组织方法
EP3362808B1 (en) Cache optimization for data preparation
Michel et al. Translation of Heterogeneous Databases into RDF, and Application to the Construction of a SKOS Taxonomical Reference
Topçu et al. Data standardization in digital libraries: An ETD case in Turkey
US8032521B2 (en) Managing structured content stored as a binary large object (BLOB)
US11144580B1 (en) Columnar storage and processing of unstructured data
JP6006740B2 (ja) インデックス管理装置
JP7122773B2 (ja) 辞書構築装置、辞書の生産方法、およびプログラム
Tweed et al. A universal nosql engine, using a tried and tested technology
JP2007048318A (ja) リレーショナルデータベースの処理方法およびリレーショナルデータベース処理装置
Bouyukliev et al. Development of a personal bibliographic information system
US20100185652A1 (en) Multi-Dimensional Resource Fallback
Cummings et al. The Holinshed Project: Comparing and linking two editions of Holinshed's Chronicle
Aljarallah Comparative study of database modeling approaches

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: BEIDA FANGZHENG GROUP CO. LTD.

Free format text: FORMER OWNER: FOUNDER DIGITAL PUBLISHING TECHNOLOGY (SHANGHAI) CO., LTD.

Effective date: 20130121

Owner name: FOUNDER DIGITAL PUBLISHING TECHNOLOGY (SHANGHAI) C

Effective date: 20130121

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 201203 PUDONG NEW AREA, SHANGHAI TO: 100871 HAIDIAN, BEIJING

TA01 Transfer of patent application right

Effective date of registration: 20130121

Address after: 100871 Beijing, Haidian District into the house road, founder of the building on the 5 floor, No. 298

Applicant after: Peking Founder Group Co., Ltd.

Applicant after: Founder Digital Publishing Technology (Shanghai) Co.,Ltd.

Address before: 201203, No. 608, midsummer Road, Zhangjiang hi tech park, Shanghai, Pudong New Area

Applicant before: Founder Digital Publishing Technology (Shanghai) Co.,Ltd.

ASS Succession or assignment of patent right

Owner name: FOUNDER INFORMATION INDUSTRY HOLDING CO., LTD. FOU

Free format text: FORMER OWNER: FOUNDER DIGITAL PUBLISHING TECHNOLOGY (SHANGHAI) CO., LTD.

Effective date: 20130912

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20130912

Address after: 100871 Beijing, Haidian District into the house road, founder of the building on the 5 floor, No. 298

Applicant after: Peking Founder Group Co., Ltd.

Applicant after: Founder Holdings Company Limited (Founder Holdings)

Applicant after: Founder Digital Publishing Technology (Shanghai) Co.,Ltd.

Address before: 100871 Beijing, Haidian District into the house road, founder of the building on the 5 floor, No. 298

Applicant before: Peking Founder Group Co., Ltd.

Applicant before: Founder Digital Publishing Technology (Shanghai) Co.,Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160824

Termination date: 20170612

CF01 Termination of patent right due to non-payment of annual fee