CN101201816B - 将数据流中的数据输出到xml文件中的适配器及方法 - Google Patents

将数据流中的数据输出到xml文件中的适配器及方法 Download PDF

Info

Publication number
CN101201816B
CN101201816B CN 200710179917 CN200710179917A CN101201816B CN 101201816 B CN101201816 B CN 101201816B CN 200710179917 CN200710179917 CN 200710179917 CN 200710179917 A CN200710179917 A CN 200710179917A CN 101201816 B CN101201816 B CN 101201816B
Authority
CN
China
Prior art keywords
data
xml
file
ducted
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 200710179917
Other languages
English (en)
Other versions
CN101201816A (zh
Inventor
崇晓云
李新
夏松江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Peking University
Founder Apabi Technology Ltd
Original Assignee
Peking University
Peking University Founder Group Co Ltd
Beijing Founder Apabi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Peking University Founder Group Co Ltd, Beijing Founder Apabi Technology Co Ltd filed Critical Peking University
Priority to CN 200710179917 priority Critical patent/CN101201816B/zh
Publication of CN101201816A publication Critical patent/CN101201816A/zh
Application granted granted Critical
Publication of CN101201816B publication Critical patent/CN101201816B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种将数据流中的数据输出到XML文件中的适配器及方法,属于数据库ETL领域。在现有技术中,SQL Server 2005集成服务的数据流任务中没有提供一种功能可以直接把数据流中的数据输入到一个XML文件中。利用本发明所述的适配器及方法,用户可以通过事先按照一定格式生成的目标XML文件的说明模版,把从数据流任务管道中得到的数据输出到目标XML文件中。采用本发明所述的适配器及方法可以灵活有效的把数据流任务管道中的数据按照指定格式输出到目标XML文件中。

Description

将数据流中的数据输出到XML文件中的适配器及方法
技术领域
本发明属于数据库ETL领域,具体涉及一种将数据流中的数据输出到XML文件中的适配器及方法。
背景技术
Microsoft SQL Server 2005是一个全面的数据库平台,使用集成的商业智能(BI)工具提供了企业级的数据管理。Microsoft SQL Server 2005Integration Services(SSIS)是Microsoft SQL Server 2005强大功能之一,在技术上来讲,它被归类为一种商业智能功能,同时使一种在数据流中加载数据以及执行任务的强大方式,该功能主要用于数据加载,但也可以使用它来完成工作流中的其它任务。集成服务可以生成高性能数据集成解决方案,其中包括为数据仓库提取、转换和加载(ETL)包。集成服务中的任务可以描述为某个单一的工作单元,集成服务中包括很多任务,其中有批量插入任务,执行程序包任务等等,数据流任务是集成服务中非常重要的负责将数据加载并转换到目的地的任务,它采用管道的方式加载转换并载入到目的地,数据流的关键组成部分是源、目的地、转换和路径。其中目的地(destination)负责接收来自源或者来自转换的数据,现在已有的目的地包括Excel目的地,Flat File目的地,OLE DB目的地等,本发明中所描述的XML目的地适配器就是其中的一个以XML文件为目标的目的地。
XML(eXtensible Markup Language,扩展标记语言)是一种简单的数据存储语言,使用一系列简单的标记描述数据,而这些标记可以用方便的方式建立,XML极其简单易于掌握和使用。目前在很多应用中需要把数据库中查找到的数据或者在Microsoft SQL Server 2005集成服务数据流任务中组合而成的数据按照一定的格式输出成为XML文件,虽然SQL Server2005的集成服务提供了XML任务,但是却没有提供一种目的地可以把数据流管道中的数据直接输出到一个XML文件中。
XSLT(eXtensible Stylesheet Language Transformation)是一种用来转换XML文档结构的语言。为了使数据便于人们的阅读理解,我们需要将信息显示出来或者打印出来,例如将数据变成一个HTML文件,一个PDF文件,甚至是一段声音;同样,为了使数据适合不同的应用程序,必须能够将一种数据格式转换为另一种数据格式,比如需求格式可能是一个文本文件,一个SQL语句,一个HTTP信息,一定顺序的数据调用等。而XSLT就是我们用来实现这种转换功能的语言。将XML转换为HTML,是目前XSLT最主要的功能。
发明内容
针对现有技术中所存在的问题,本发明的目的是提供一种将数据流中的数据输出到XML文件中的适配器及方法,该适配器及方法能够使用户将Microsoft SQL Server 2005集成数据流任务中的数据灵活方便地输出到XML文件中。
为达到以上目的,本发明采取的技术方案是:
一种用于将Microsoft SQL Server 2005集成服务数据流管道中的数据按照要求的文件格式输出到XML文件中的适配器,包括以下模块:
XML文件读取模块,用于读取XML模板文件的内容,并将其存储到内存的XML模板文件中;所述的XML文件读取模块还包括一个输入连接管理器,用于验证模板文件是否存在以及是否为XML格式,并负责连接通过验证的XML模板文件数据源;
数据管理模块,用于读取数据流管道中的数据,将这些数据以行对象的方式存储到行对象集中;
数据组织模块,用于对行对象集进行处理;
XML目标输出模块,用于将XML模板对象的说明部分内容和数据组织模块处理后的数据输出到目标XML文件中;所述的XML目标输出模块还包括一个输出连接管理器,用于验证目标文件是否存在以及是否为XML格式,并负责连接通过验证的目标XML文件。
一种用于将Microsoft SQL Server 2005集成服务数据流管道中的数据按照要求的文件格式输出到XML文件中的方法,包括以下步骤:
(1)XML文件读取模块通过输入连接管理器连接到XML模板数据源,读取XML模板文件的内容,并将其存储到内存的XML模板对象中;所述的输入连接管理器用于验证模板文件是否存在以及是否为XML格式,并负责连接通过验证的XML模板文件数据源;
(2)数据管理模块读取数据流管道中的数据,将这些数据按照行存储到行对象集中;
(3)数据组织模块对行对象集进行处理;
(4)XML目标输出模块通过输出连接管理器连接目标XML文件,然后将XML模版对象的说明部分内容和数据组织模块的处理结果写入到目标XML文件中;所述的输出连接管理器用于验证目标文件是否存在以及是否为XML格式,并负责连接通过验证的目标XML文件。
进一步,步骤(1)中所述的XML模版文件是一个外部的可随需求自行定义的说明性文件,用来说明目标XML文件需要的格式。
进一步,所述的目标XML文件需要的格式包括目标XML文件所使用的XSLT文件名称,各个元素的层次关系,各个元素的名称,属性,及其与管道数据中各个字段的对应关系。
进一步,步骤(1)中所述的模版对象主要包括节点标签、节点属性集、节点的子节点集、节点的类型、节点的叶子节点。
进一步,步骤(2)中所述的管道中的数据是源适配器中流出的数据,或者是经过转换组件转换过的数据。
进一步,步骤(2)中所述的行对象是一个字段对象的集合。
进一步,所述的字段对象包括字段的名称和字段的值。
进一步,步骤(3)中数据组织模块对行对象集进行处理的过程如下:数据组织模块循环读取行对象集中的字段名称及其字段值,按照XML模版文件中对象的格式存放到行节点对象中,并从行对象集中删除当前行对象,直至处理完成。
本发明的效果在于:采用本发明所述的适配器及方法,用户可以方便地配置和操作该适配器,具有灵活性和非耦合性;此外,用户还可以通过拖拽的方式,把该适配器放在数据流任务中,并按照XML模版中规定的样式把数据流管道中的数据生成到XML文件中。
附图说明
图1是本发明所述的适配器模块图;
图2是本发明所述方法的流程图。
具体实施方式
下面结合实施例和附图对本发明作进一步的描述。
如图1所示,一种将数据流中的数据输出到XML文件中的适配器1,该适配器1包括以下模块:
XML文件读取模块2,包括一个输入连接管理器21,用于验证模板文件是否存在以及是否为XML格式,并连接通过验证的XML模版文件6数据源及读取XML模板文件6的内容,并将其存储到内存的XML模板对象中;
数据管理模块3,用于读取数据流管道中的数据,将这些数据以行对象的方式存储到行对象集中;
数据组织模块4,用于按照所述的XML模板文件6的说明格式组织所述的数据流管道中的数据;
XML目标输出模块5,包括一个输出连接管理器51,用于验证目标文件是否存在以及是否为XML格式,并连接通过验证的目标XML文件7,将XML模板对象的说明部分内容和数据组织模块组织后的数据输出到目标XML文件7中。
如图2所示,一种将数据流中的数据输出到XML文件中的方法,包括以下步骤:
(1)XML文件读取模块2通过输入连接管理器21连接到XML模板文件6数据源,读取XML模板文件6的内容,并将其存储到内存的模板对象中(S1);所述的XML模版文件6是一个外部的可随需求自行定义的说明性文件,用来说明目标XML文件需要的格式,包括目标XML文件所使用的XSLT文件名称,各元素的层次关系、名称、属性及其与数据流管道数据中各个字段的对应关系等;所述的模版对象包括节点标签、节点属性值、节点的子节点集、节点的类型、节点的叶子节点等。
(2)数据管理模块3读取数据流管道中流入的数据,将这些数据按照行存储到行对象集中,每一行对应一个行对象集(S2);所述的数据流管道中流入的数据可以是源适配器中流出的数据,也可以是经过转换组件转换过的数据;所述的行对象是一个字段对象的集合,字段对象又包括字段的名称及其字段的值。
(3)数据组织模块4对行对象集进行处理;首先循环读取行对象集中的字段名称及其字段值,按照模版对象的格式存放到行节点对象中,并从行对象集中删除当前行对象,直至处理完成(S3)。
(4)XML目标输出模块5通过输出连接管理器51连接目标XML文件7,然后将XML模版对象的说明部分的内容和行节点对象集写入到目标XML文件中7(S4)。
下面以图书搜索为例对本发明作进一步描述,要求把搜索关键词及其搜索到的前三本图书数据按照要求格式输出到XML文件中。此过程具有两个明显的阶段:设计阶段和运行阶段。当具体实现时将继承基类Microsoft.SqlServer.Dts.Pipeline.PipelineComponent的内容。
在设计阶段:采用的方法主要是重载的ProvideComponentProperties方法和Validate方法,具体完成以下工作:
(1)将输出到XML文件中数据的格式要求预先写入到XML模板文件6中;
本实施例中XML模版文件6的内容如下:
<?xml version=″1.0″encoding=″utf-8″?>
<XmlSchama>
   <xlstName>test.xls</xlstName>0
<nodes>
   <!--生成的Xml文件的根节点-->
   <node type=″root″>
     <nodeTag>BookTop</nodeTag>
     <attributes>
       <!--节点的属性-->
       <attribute>
         <!--属性的名称-->
         <name>type</name>
         <!--属性的值,对应数据流中的一列-->
         <value>topType</value>
        </attribute>
      </attributes>
      </node>
   <!--对应数据流中的一行-->
<node type=″row″>
   <nodeTag>keyWord</nodeTag>
   <attributes>
     <attribute>
       <name>name</name>
       <value>HotKeyWord</value>
      </attribute>
      <attribute>
        <name>count</name>
        <value>count</value>
      </attribute>
     </attributes>
     <!--这个节点中的子节点的名称-->
     <sonNodes>
       <sonNode>Book</sonNode>
   </sonNodes>
   <!--行的标示,表示这个节点是否结束-->
   <rowKey>HotKeyWord</rowKey>
</node>
   <!--节点的子节点-->
<node type=″sonNode″>
   <nodetag>Book</nodetag>
   <!--节点中包括的叶子节点-->
   <leafNodes>
     <leafNode>
        <Tag>BookId</Tag>
        <value>BookId</value>
     </leafNode>
     <leafNode>
        <Tag>BookName</Tag>
        <value>BookName</value>
      </leafNode>
      <leafNode>
        <Tag>Author</Tag>
        <value>Author</value>
       </leafNode>
       <leafNode>
         <Tag>BookImg</Tag>
         <value>BookImg</value>
       </leafNode>
     </leafNodes>
 </node>
 </nodes>
    </Xml Schama>
(2)XML文件读取模块2中的输入连接管理器21验证模板文件是否存在以及是否为XML格式,并负责连接通过验证的XML模板文件6;
(3)XML文件输出模块5中的输出连接管理器51验证目标文件是否存在以及是否为XML格式,并负责连接通过验证的目标XML文件7。。
在运行阶段:采用的方法主要是重载的PreExecute方法和processInput方法,具体完成以下工作:
(1)通过XML文件读取模块2的输入连接管理器21连接到存储有要求格式的XML模版文件6数据源,XML文件读取模块2读取XML模版文件6的内容,并将其存放到模版对象中(S1);
连接管理器连接XML模版文件6和目标XML文件7,其中重载的方法有AcquireConnections和ReleaseConnections两个方法。
(2)数据管理模块3读取管道中搜索图书的关键词和搜索到的前三本图书的数据,并将这些数据按照行存放到行对象集中,每一行对应一个行对象集(S2)。行对象是一个字段对象的集合,字段对象又包括字段的名称和字段的值;
本实施例中数据流管道中的数据,具体说明如下表所示:
  字段名称   字段类型   说明
  topType   Int   排行榜类型
  HotKeyWord   Nvarchar(50)   检索词
  count   int   检索次数
  BookID   Varchar(96)   图书ID
  BookName   Varchar(96)   图书名称
  Author   Varchar(96)   图书作者
  BookImg   Varchar(96)   图片位置
(3)数据组织模块4循环读取行对象集中的数据,按照XML模版文件预先写入的格式要求把每一行的数据存放到行节点对象中(S3)。
(4)最后通过XML目标输出模块5中的输出连接管理器51连接到目标XML文件7,XML目标输出模块5把模版对象的说明部分的内容和行节点对象集写入到目标XML文件7中(S4)。
本实施例中输出的目标xml文件7举例如下:
<?xml version=″1.0″encoding=″utf-8″?>
<?xml-style sheet type=″text/xsl″href=″test.xls″?>
<BookTop type=″12″>
<KeyWord name=″中国″count=″200″>
   <Book>
<BookID>m20070702DXGDST01446</BookID>
<BookName>中国思想史(三)</BookName>
<Author>读书堂著</Author>
<BookImg>Image2006\443\M20070702DXGDST01446.JPG</BookImg>
</Book>
<Book>
<BookID>m20070702DXGDST01447</BookID>
<BookName>中国思想史(四)</BookName>
<Author>读书堂著</Author>
<BookImg>Image2006\443\M20070702DXGDST01447.JPG</BookImg>
</Book>
<Book>
   <BookID>m20070702DXGDST01450</BookID>
   <BookName>中国文学史(上)</BookName>
   <Author>读书堂著</Author>
   <BookImg>Image2006\443\M20070702DXGDST01450.JPG</BookImg>
   </Book>
</KeyWord>
  <KeyWord name=″天气″count=″100″>
    <Book>
      <BookID>m20070713DXGWYSS00007</BookID>
      <BookName>气象万千</BookName>
      <Author>北京五洋盛世图书有限公司著</Author>
<BookImg>Image2006\445\M20070713DXGWYSS00007.jpg</BookImg>
     </Book>
     <Book>
       <BookID>m20070525DXGDST02268</BookID>
       <BookName>天气与气候</BookName>
       <Author>读书堂著</Author>
       <BookImg>Image2006\444\M20070525DXGDST02268.jpg</BookImg>
      </Book>
      <Book>
       <BookID>m20070828DXGDST3544</BookID>
       <BookName>中华学生百科全书--天气与气候</BookName>
       <Author>读书堂著</Author>
       <BookImg>Image2006\1\M20070828DXGDST3544.jpg</BookImg>
    </Book>
  </KeyWord>
</BookTop>
本发明所述的适配器及方法并不限于具体实施方式中所述的实施例,本领域技术人员根据本发明的技术方案得出其他的实施方式,例如将连接管理器不设置在XML文件读取模块和XML目标输出模块中,而是单独设置,同样属于本发明的技术创新范围。

Claims (10)

1.一种用于将Microsoft SQL Server 2005集成服务数据流管道中的数据按照要求的文件格式输出到XML文件中的适配器,包括以下模块:
XML文件读取模块,用于读取XML模板文件的内容,并将其存储到内存的XML模板对象中;所述的XML文件读取模块还包括一个输入连接管理器,用于验证模板文件是否存在以及是否为XML格式,并负责连接通过验证的XML模板文件数据源;
数据管理模块,用于读取数据流管道中的数据,将这些数据以行对象的方式存储到行对象集中;
数据组织模块,用于对行对象集进行处理;
XML目标输出模块,用于将XML模板对象的说明部分内容和数据组织模块处理后的数据输出到目标XML文件中;所述的XML目标输出模块还包括一个输出连接管理器,用于验证目标文件是否存在以及是否为XML格式,并负责连接通过验证的目标XML文件。
2.一种用于将Microsoft SQL Server 2005集成服务数据流管道中的数据按照要求的文件格式输出到XML文件中的方法,包括以下步骤:
(1)XML文件读取模块通过输入连接管理器连接到XML模板数据源,读取XML模板文件的内容,并将其存储到内存的XML模板对象中;所述的输入连接管理器用于验证模板文件是否存在以及是否为XML格式,并负责连接通过验证的XML模板文件数据源;
(2)数据管理模块读取数据流管道中的数据,将这些数据以行对象的方式存储到行对象集中;
(3)数据组织模块对行对象集进行处理;
(4)XML目标输出模块通过输出连接管理器连接目标XML文件,然后将XML模版对象的说明部分内容和数据组织模块的处理结果写入到目标XML文件中;所述的输出连接管理器用于验证目标文件是否存在以及是否为XML格式,并负责连接通过验证的目标XML文件。
3.如权利要求2所述的一种将Microsoft SQL Server 2005集成服务数据流管道中的数据输出到XML文件中的方法,其特征在于:步骤(1)中所述的XML模版文件是一个外部的可随需求自行定义的说明性文件,用来说明目标XML文件需要的格式。
4.如权利要求3所述的一种用于将Microsoft SQL Server 2005集成服务数据流管道中的数据输出到XML文件中的方法,其特征在于:所述的目标XML文件需要的格式包括目标XML文件所使用的XSLT文件名称,各个元素的层次关系、名称、属性及其与管道数据中各个字段的对应关系。
5.如权利要求2所述的一种用于将Microsoft SQL Server 2005集成服务数据流管道中的数据输出到XML文件中的方法,其特征在于:步骤(1)中所述的模版对象包括节点标签、节点属性集、节点的子节点集、节点的类型、节点的叶子节点。
6.如权利要求2所述的一种用于将Microsoft SQL Server 2005集成服务数据流管道中的数据输出到XML文件中的方法,其特征在于:步骤(2)中所述的管道中的数据是指源适配器中流出的数据。
7.如权利要求2所述的一种用于将Microsoft SQL Server 2005集成服务数据流管道中的数据输出到XML文件中的方法,其特征在于:步骤(2)中所述的管道中的数据是指经过转换组件转换过的数据。
8.如权利要求2所述的一种用于将Microsoft SQL Server 2005集成服务数据流管道中的数据输出到XML文件中的方法,其特征在于:步骤(2)中所述的行对象是一个字段对象的集合。
9.如权利要求8所述的一种用于将Microsoft SQL Server 2005集成服务数据流管道中的数据输出到XML文件中的方法,其特征在于:所述的字段对象包括字段的名称和字段的值。
10.如权利要求9所述的一种用于将Microsoft SQL Server 2005集成服务数据流管道中的数据输出到XML文件中的方法,其特征在于:步骤(3)中数据组织模块对行对象集进行处理的过程如下:数据组织模块循环读取行对象集中的字段名称及其字段值,按照XML模版文件中对象的格式存放到行节点对象中,并从行对象集中删除当前行对象,直至处理完成。
CN 200710179917 2007-12-20 2007-12-20 将数据流中的数据输出到xml文件中的适配器及方法 Expired - Fee Related CN101201816B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200710179917 CN101201816B (zh) 2007-12-20 2007-12-20 将数据流中的数据输出到xml文件中的适配器及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200710179917 CN101201816B (zh) 2007-12-20 2007-12-20 将数据流中的数据输出到xml文件中的适配器及方法

Publications (2)

Publication Number Publication Date
CN101201816A CN101201816A (zh) 2008-06-18
CN101201816B true CN101201816B (zh) 2010-10-13

Family

ID=39516985

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200710179917 Expired - Fee Related CN101201816B (zh) 2007-12-20 2007-12-20 将数据流中的数据输出到xml文件中的适配器及方法

Country Status (1)

Country Link
CN (1) CN101201816B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2423831A1 (en) * 2010-08-27 2012-02-29 Axel Springer Digital TV Guide GmbH Recommender system with consistent profile application
CN103914933B (zh) * 2012-12-30 2017-06-30 航天信息股份有限公司 一种基于xml技术的发票打印方法和装置
CN103605802B (zh) * 2013-12-05 2017-12-22 用友软件股份有限公司 数据传输装置和数据传输方法
CN104932866A (zh) * 2014-03-17 2015-09-23 无锡天脉聚源传媒科技有限公司 一种生成自定义xml文件的系统及方法
CN104317970B (zh) * 2014-11-19 2018-08-28 亚信科技(南京)有限公司 一种基于数据加工中心的数据流式处理方法
CN105701094B (zh) * 2014-11-24 2019-03-19 北京航管科技有限公司 一种etl数据采集方法和装置
CN107256217B (zh) * 2017-04-19 2020-10-02 江苏师范大学 一种xml数据的快速查询方法
CN108052320B (zh) * 2017-12-11 2021-03-05 上证所信息网络有限公司 一种将二进制结构体转换为json对象的方法
CN111338685B (zh) * 2018-12-19 2023-11-21 卓望数码技术(深圳)有限公司 一种公用组件配置方法、装置、设备和存储介质
CN110263221A (zh) * 2019-06-21 2019-09-20 福建南威软件有限公司 一种基于xml操作word文档的方法及系统
CN112632185B (zh) * 2020-12-16 2023-05-09 浪潮云信息技术股份公司 一种基于cpu环境的多类型数据库同步方法、装置及设备
CN112800733A (zh) * 2020-12-28 2021-05-14 鹏达精密包装材料(上海)有限公司 一种基于CAMworks的CNC设定单信息的自动导入方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1466722A (zh) * 2001-08-09 2004-01-07 ���Ͽع����޹�˾ 管理文档文本的工作流程系统及利用其的文档文本管理方法
US7062502B1 (en) * 2001-12-28 2006-06-13 Kesler John N Automated generation of dynamic data entry user interface for relational database management systems

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1466722A (zh) * 2001-08-09 2004-01-07 ���Ͽع����޹�˾ 管理文档文本的工作流程系统及利用其的文档文本管理方法
US7062502B1 (en) * 2001-12-28 2006-06-13 Kesler John N Automated generation of dynamic data entry user interface for relational database management systems

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CN 1466722 A,全文.
US 2006116983 A1,全文.

Also Published As

Publication number Publication date
CN101201816A (zh) 2008-06-18

Similar Documents

Publication Publication Date Title
CN101201816B (zh) 将数据流中的数据输出到xml文件中的适配器及方法
US6915303B2 (en) Code generator system for digital libraries
CN104715032A (zh) 一种报表系统中英文表名字段名映射系统及方法
Zamboulis XML data integration by graph restructuring
CN112199960B (zh) 一种标准知识元粒度解析系统
Ramalho et al. Metamorphosis–a topic maps based environment to handle heterogeneous information resources
Dickson et al. The semi-structured data model and implementation issues for semi-structured data
Lu et al. Language engineering for the Semantic Web: A digital library for endangered languages
Yu et al. Web warehouse–a new web information fusion tool for web mining
Cherkashin et al. Digital archives supporting document content inference
Della Penna et al. Interoperability mapping from XML schemas to ER diagrams
CN105740250A (zh) 一种创建 xml 节点的属性索引的方法及装置
CN105608092B (zh) 一种创建动态索引的方法及装置
Zhang et al. Automatic extraction rules generation based on xpath pattern learning
Kaczmarek et al. Information extraction from web pages for the needs of expert finding
Hendawi et al. EMD: entity mapping diagram for automated extraction, transformation, and loading processes in data warehousing
Peng et al. Formalized Chinese sentence pattern structure and its hierarchical analysis
Zhou et al. Semi-structure data management by bi-directional integration between XML and RDB
TWI262404B (en) System, method and machine-readable storage medium of transformation document management for structural language message
Fan et al. Research on Addressing Method in XML File Based on XPointer
Van den Hoven Database Management System and XML: Interchange of Data.
Duta et al. RA: An XML Schema Reduction Algorithm.
Al Hamad Catalog-based Conversion from Relational Database into XML Scheme (XSD)
Sekine et al. Extracting Schemas from Large Graphs with Utility Function and Parallelization
Rajeswari et al. Heterogeneous database integration for web applications

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230608

Address after: 3007, Hengqin international financial center building, No. 58, Huajin street, Hengqin new area, Zhuhai, Guangdong 519031

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: FOUNDER APABI TECHNOLOGY Ltd.

Patentee after: Peking University

Address before: 100871, fangzheng building, 298 Fu Cheng Road, Beijing, Haidian District

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: FOUNDER APABI TECHNOLOGY Ltd.

Patentee before: Peking University

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101013

CF01 Termination of patent right due to non-payment of annual fee