CN101777073A - 一种基于xml格式的数据转换方法 - Google Patents

一种基于xml格式的数据转换方法 Download PDF

Info

Publication number
CN101777073A
CN101777073A CN201010103369A CN201010103369A CN101777073A CN 101777073 A CN101777073 A CN 101777073A CN 201010103369 A CN201010103369 A CN 201010103369A CN 201010103369 A CN201010103369 A CN 201010103369A CN 101777073 A CN101777073 A CN 101777073A
Authority
CN
China
Prior art keywords
data
map unit
create
source
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201010103369A
Other languages
English (en)
Inventor
张家重
岳现国
潘博存
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Group Shandong General Software Co Ltd
Original Assignee
Inspur Group Shandong General Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Group Shandong General Software Co Ltd filed Critical Inspur Group Shandong General Software Co Ltd
Priority to CN201010103369A priority Critical patent/CN101777073A/zh
Publication of CN101777073A publication Critical patent/CN101777073A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明提供一种基于XML格式的数据转换方法,根据目标业务实体的结构和目标表的数据生成规则把复杂的数据转换过程分解为多个映射单元,包括以下步骤:1)识别目标业务对象的数据结构;2)创建并设置映射单元;还包括步骤:(1)识别主表数据的生成规则;(2)针对每一种生成规则为单表创建并设置映射单元;包括步骤:设置映射单元的编号、名称和描述信息;设置映射单元对应的目标数据表;设置映射单元的取数来源;设置映射单元的取数范围;设置映射单元的执行条件;设置映射单元的映射规则;(3)判断是否存在同一层级的映射单元;(4)存在同一层级的映射单元,为同层级的映射单元排序。

Description

一种基于XML格式的数据转换方法
技术领域
本发明涉及数据交换技术领域,尤其涉及一种基于XML格式的数据交换方法。一种基于XML格式的数据转换方法,具体地说是一种。
背景技术
一个信息系统中,总是被划分和识别为不同的业务处理环节(或功能),定义这些业务处理环节(或功能)的输入、输出及处理。业务处理环节(或功能)之间不是彼此独立的,总是可以通过业务流程的将其编排在一起,完成一个完整的业务处理过程。在业务处理环节(或功能)之间流转时,不可避免的产生了数据的流转,并且相邻的两个业务处理环节(或功能)之间,上一个环节的输出,与下一个环节的输入所定义的数据结构一般是不同构的,这种数据结构的差异,就会产生一个数据之间的映射转换过程。此外,企业信息化的过程中,在不同的时期,基于不同的需求,逐步搭建和积累了多个信息系统,基于业务发展的需求,这些信息系统之间需要进行集成,这个集成过程中异构系统之间也会产生大量的数据转换。
业务处理环节中的数据转换过程往往是复杂的,其复杂性主要表现在,数据转换的源或目标业务实体的结构是复杂的,一个业务实体的结构往往由多个数据实体组成(在关系数据库中,数据实体指的就是数据表或视图),数据实体间关系包括主从关系和平行关系。另外,数据转换的规则往往也是复杂的,目标数据实体的数据生成规则往往也不是唯一的。这种复杂的业务实体以及复杂的数据生成规则实体增加数据转换的复杂度。
发明内容
本发明的目的是提供一种基于XML格式的数据转换方法。
本发明的目的是按以下方式实现的,根据目标业务实体的复杂结构和目标数据实体的数据生成规则,把复杂的数据转换过程分解为一个或多个简单的数据转换单元。
其内容包括映射单元以及映射单元的分解方法。
业务实体的数据结构定义中定义的数据模型来描述业务数据结构。业务数据定义映射到关系型数据库中是一组具有主从关系或关联关系的表或视图的集合,因此,业务数据是一组数据集,每个数据集是一个二维表结构,包括列集和行集。在数据转换过程中,数据转换的源在本发明中称为源业务实体,数据转换的目标在本发明中称为目标业务实体;其中源业务实体包含的表称为源表,目标业务实体包含的表称为目标表。
映射单元用于描述按照规则对复杂映射分解的数据转换单元,其属性包括:编号、名称、描述、目标数据表、取数来源、源数据的取数范围、源数据的分组依据、映射单元的执行条件、执行顺序、上级映射单元、映射规则。
映射单元的结构属性的详细描述如下。
属性:属性描述
编号:映射单元的编号
名称:映射单元的名称
描述:详细描述映射单元的含义和用途
目标数据表:对应的目标数据表,用来确定为目标业务实体中的哪个数据表生成数据。
取数来源:本映射单元进行数据转换的数据来源,即源数据表,可以是一个或多个
取数范围:本映射单元中源数据的取数条件
分组依据:本映射单元中组织源数据的分组条件,用来处理源数据的汇总统计计算。
执行条件:确定本映射单元是否执行的条件,如果条件不满足,则不执行本映射单元。
执行顺序:同级映射单元执行的先后顺序
上级映射单元:用来确定映射单元间的层级关系,是根据目标数据表的主从关系确定的。
映射规则:目标表中的列的数据生成规则,其中包括目标表中的列和源表中的列的映射规则。
映射单元之间的关系是由目标表间的关系确定的,主从关系的数据表对应的映射单元其关系也是主从关系,平行数据表对应的映射单元其关系也是平行关系,具体关系参照图1。
映射单元的分解方法:
映射单元的分解依据有两个:1、目标业务实体的数据结构;2、目标表的数据生成规则。
映射单元的分解步骤如下:
1、识别目标业务实体的数据表组成以及数据表之间的关系:主从和平行。
2、根据目标业务实体的结构,从主表到子表依次为每个目标表创建映射并设置单元。
创建映射并设置单元可进一步描述为以下几个子步骤:
1)设置映射单元对应的目标数据表;
2)设置映射单元对应的数据来源;
3)设置源数据的取数范围;
4)设置源数据的分组依据;
5)设置映射单元的触发条件;
6)设置映射单元的映射规则。
识别每个目标表的数据生成规则,对于同一个目标表,如果存在不同数据生成规则(比如数据源不同、分组依据不同、执行条件不同、映射规则不对),要为该数据表针对每一个数据生成规则创建多个同级的映射单元;
如果该目标表存在子表,按照同样的方式依次为每个子表创建对应的映射单元,依次类推。
3、如果存在同层级的映射单元,对同层级的映射单元进行编排顺序。
根据上面的描述,可以看出本发明具有以下优点是:
使用本发明的方法可以把复杂的数据转换过程分解为简单的映射单元;同时根据映射单元之间的关系以及同层级映射单元的执行顺序可以有规律的执行数据转换过程;而且映射单元具有较好的可配置型和扩展性。
附图说明
图1是源业务实体、目标业务实体和映射单元之间的关系示意图;
图2是实施实例中目标业务实体结构和映射单元结构间的关系示意图;
图3是分解映射单元的流程图;
图4是创建并设置映射单元具体流程图;
图5是从表创建映射单元的具体流程图;
图6是生成规则为单表创建并设置映射单元的具体流程图。
具体实施方式
参照说明书附图对本发明的作以下详细地说明。
本发明的一种基于XML格式的数据转换方法,其结构是由为使本发明的意图、特征和优点更通俗易懂,下面将结合附图和具体实施方式对本发明作进一步详细的说明。
实施例:
应用系统A中的BizA业务数据转换为应用系统B中的BizB业务数据。
BizA的数据结构如下:
BizA的主表:A_MainTable
字段          数据类型       说明
A_MainCol1    St2010年1月28日ing    主键
A_MainCol2    St2010年1月28日ing
A_MainCol3    St2010年1月28日ing
A_MainTable的子表:A_SubTable
字段          数据类型
A_MainCol1    St2010年1月28日ing    外键,主表A_MainTable的主键
A_SubCol1     St2010年1月28日ing    主键
A_SubCol2     St2010年1月28日ing
A_SubCol3     St2010年1月28日ing
A_SubCol4     Int    枚举值:0,1;默认值为0
表A_MainTable和表A_SubTable是主从关系。
BizB的数据结构如下:
BizB的主表:B_MainTable
字段          数据类型      说明
B_MainCol1    St2010年1月28日ing    主键
B_MainCol2    St2010年1月28日ing
B_MainCol3    St2010年1月28日ing
B_MainTable的子表:B_SubTable
字段          数据类型
B_MainCol1    St2010年1月28日ing    外键,主表B_MainTable的主键
B_SubCol1     St2010年1月28日ing    主键
B_SubCol2     St2010年1月28日ing
B_SubCol3     St2010年1月28日ing
表B_MainTable和表B_SubTable是主从关系。
该实例是一个典型的数据交换的例子,其中BizA是源业务实体,BizB为目标业务实体。BizA和BizB的数据转换过程的分解步骤如下:(参照图3)
步骤一:识别目标业务实体BizB的数据结构
确认目标业务实体BizB有数据表B_MainTable和B_SubTable,而且两者为主从关系。
步骤二:创建并设置映射单元
1.创建并设置主表B_MainTabl对应的映射单元;(参照图4)
1)识别数据表B_MainTabl的数据的生成规则,只有一种生成规则:
B_MainCol1=A_MainCol1
B_MainCol2=A_MainCol2
B_MainCol3=A_MainCol3
2)创建主表B_MainTabl对应的映射单元B_MainTablUnit,并按照图6步骤设置属性如下:
属性:属性值
编号:B_MainTablUnit
名称:B_MainTablUnit
描述:B_MainTabl对应的映射单元
目标数据表:B_MainTabl
取数来源:A_MainTabl
取数范围:
分组依据:A_MainCol1
执行条件:
执行顺序:1
上级映射单元:
映射规则设置:B_MainCol1=A_MainCol1
              B_MainCol2=A_MainCol2
              B_MainCol3=A_MainCol3
2.判断B_MainTabl是否有子表,如果有设置其子表对应的映射单元(参照步骤5)
3.按照主映射单元B_MainTablUnit的创建和设置过程,创建并设置子表B_SubTable的映射单元
4.识别数据表B_SubTable的数据的生成规则,两种:当A_SubCol4=0时B_SubCol2=A_SubCol2,而B_SubCol3不参与映射;当A_SubCol4=1时B_SubCol3=A_SubCol3,而B_SubCol2不参与映射;
针对第一个生成规则创建B_SubTabl的第一个映射单元B_SubTablUnit1,并按照图6步骤设置属性如下:
属性项:属性值
编号:B_SubTablUnit1
名称:B_SubTablUnit1
描述:B_SubTabl对应的映射单元
目标数据表:B_SubTabl
取数来源:A_SubTabl
取数范围:A_SubCol4=0
分组依据:A_SubCol1
执行条件:A_SubCol4=0
执行顺序:1
上级映射单元:B_MainTablUnit
映射规则设置:B_SubCol1=A_SubCol1
B_SubCol2=A_SubCol2
5.针对第二个生成规则创建B_SubTabl的第一个映射单元B_SubTablUnit2,并按照图6步骤设置属性如下:
属性项:属性值
编号:B_SubTablUnit2
名称:B_SubTablUnit2
描述:B_SubTabl对应的映射单元
目标数据表:B_SubTabl
取数来源:A_SubTabl
取数范围:A_SubCol4=1
分组依据:A_SubCol1
执行条件:A_SubCol4=1
执行顺序:2
上级映射单元:B_MainTablUnit
映射规则设置:B_SubCol1=A_SubCol1
              B_SubCol3=A_SubCol3
步骤三:设置映射单元的顺序
同一层级映射只有一个映射单元时无需设置顺序,在本实例中B_MainTablUnit不需要设置执行顺序;如果同一层级有多个映射单元时,需要设置其相对顺序,在本实例中设置B_SubTablUnit1的执行顺序为1,B_SubTablUnit2的执行顺序为2。数据交换系统将根据映射单元的层级顺序和执行顺序进行逐个执行映射单元。
以上对本发明所提供的一种基于XML格式的数据转换方法,进行的详细的描述。本文中应用了具体的实施实例对本发明的原理和实施步骤进行了详细的阐述,以上的说明仅仅是为了帮助理解本发明的方法和思想。

Claims (3)

1.一种基于XML格式的数据转换方法,其特征在于,包括:根据目标业务实体的结构和目标表的数据生成规则把复杂的数据转换过程分解为多个映射单元,包括以下步骤:
1)识别目标业务对象的数据结构;
2)创建并设置映射单元;还包括步骤:
(1)识别主表数据的生成规则;
(2)针对每一种生成规则为单表创建并设置映射单元;包括步骤:
设置映射单元的编号、名称和描述信息;
设置映射单元对应的目标数据表;
设置映射单元的取数来源;
设置映射单元的取数范围;
设置映射单元的执行条件;
设置映射单元的映射规则;
(3)判断是否存在同一层级的映射单元;
(4)存在同一层级的映射单元,为同层级的映射单元排序;
3)为从表创建映射单元,判断识别主表是否存在从表;存在从表,依次为每一个从表执行识别主表的步骤,为每一个从表创建并设置映射单元。
2.如权利要求1所述的数据转换方法,其特征在于,业务实体的业务数据结构通过数据模型来描述,业务数据定义映射到关系型数据库中是一组具有主从关系或关联关系的表或视图的集合,因此,业务数据是一组数据集,每个数据集是一个二维表结构,包括列集和行集,在数据转换过程中,数据转换的源在本发明中称为源业务实体,数据转换的目标在本发明中称为目标业务实体;其中源业务实体包含的表称为源表,目标业务实体包含的表称为目标表;
映射单元用于描述按照规则对复杂映射分解的数据转换单元,其属性包括:编号、名称、描述、目标数据表、取数来源、源数据的取数范围、源数据的分组依据、映射单元的执行条件、执行顺序、上级映射单元、映射规则;映射单元之间的关系是由目标表间的关系确定的,主从关系的数据表对应的映射单元其关系也是主从关系,平行数据表对应的映射单元其关系也是平行关系。
3.如权利要求1所述的数据转换方法,其特征在于,映射单元的分解方法,包括以下内容:
映射单元的分解依据有两个:目标业务实体的数据结构;目标表的数据生成规则;
映射单元的分解步骤如下:
1)识别目标业务实体的数据表组成以及数据表之间的关系:主从和平行;
2)根据目标业务实体的结构,从主表到子表依次为每个目标表创建映射并设置单元;
创建映射并设置单元可进一步描述为以下几个子步骤:
(1)设置映射单元对应的目标数据表;
(2)设置映射单元对应的数据来源;
(3)设置源数据的取数范围;
(4)设置源数据的分组依据;
(5)设置映射单元的触发条件;
(6)设置映射单元的映射规则;
识别每个目标表的数据生成规则,对于同一个目标表,存在不同数据生成规则,包括数据源不同、分组依据不同、执行条件不同、映射规则不对,要为该数据表针对每一个数据生成规则创建多个同级的映射单元;该目标表存在子表,按照同样的方式依次为每个子表创建对应的映射单元,依次类推;
存在同层级的映射单元,要对同层级的映射单元进行编排顺序。
CN201010103369A 2010-02-01 2010-02-01 一种基于xml格式的数据转换方法 Pending CN101777073A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010103369A CN101777073A (zh) 2010-02-01 2010-02-01 一种基于xml格式的数据转换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010103369A CN101777073A (zh) 2010-02-01 2010-02-01 一种基于xml格式的数据转换方法

Publications (1)

Publication Number Publication Date
CN101777073A true CN101777073A (zh) 2010-07-14

Family

ID=42513534

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010103369A Pending CN101777073A (zh) 2010-02-01 2010-02-01 一种基于xml格式的数据转换方法

Country Status (1)

Country Link
CN (1) CN101777073A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102306187A (zh) * 2011-08-31 2012-01-04 浙江大学 二维表hash排序方法
CN102831167A (zh) * 2012-07-24 2012-12-19 东软集团股份有限公司 图结构的xml处理方法及装置
CN103092951A (zh) * 2013-01-15 2013-05-08 福州特力惠电子有限公司 一种基于信息展现层的通用数据交换方法及系统
CN104133722A (zh) * 2014-07-02 2014-11-05 北京邮电大学 一种实现多业务流程协作的方法及系统
CN105843605A (zh) * 2016-03-17 2016-08-10 中国银行股份有限公司 一种数据映射方法及装置
CN106909566A (zh) * 2015-12-23 2017-06-30 阿里巴巴集团控股有限公司 一种数据建模方法及设备
CN107111466A (zh) * 2014-12-22 2017-08-29 爱思打印解决方案有限公司 通过使用byod服务生成工作表的方法和用于执行该方法的移动设备
CN108733713A (zh) * 2017-04-21 2018-11-02 阿里巴巴集团控股有限公司 数据仓库中的数据查询方法及装置
CN111712809A (zh) * 2018-04-16 2020-09-25 甲骨文国际公司 通过示例来学习etl规则

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102306187A (zh) * 2011-08-31 2012-01-04 浙江大学 二维表hash排序方法
CN102831167A (zh) * 2012-07-24 2012-12-19 东软集团股份有限公司 图结构的xml处理方法及装置
CN102831167B (zh) * 2012-07-24 2015-01-07 东软集团股份有限公司 图结构的xml处理方法及装置
CN103092951A (zh) * 2013-01-15 2013-05-08 福州特力惠电子有限公司 一种基于信息展现层的通用数据交换方法及系统
CN103092951B (zh) * 2013-01-15 2016-07-13 福建特力惠信息科技股份有限公司 一种基于信息展现层的通用数据交换方法及系统
CN104133722A (zh) * 2014-07-02 2014-11-05 北京邮电大学 一种实现多业务流程协作的方法及系统
CN104133722B (zh) * 2014-07-02 2021-01-22 北京邮电大学 一种实现多业务流程协作的方法及系统
CN107111466B (zh) * 2014-12-22 2021-01-08 惠普发展公司,有限责任合伙企业 通过使用byod服务生成工作表的方法和用于执行该方法的移动设备
CN107111466A (zh) * 2014-12-22 2017-08-29 爱思打印解决方案有限公司 通过使用byod服务生成工作表的方法和用于执行该方法的移动设备
CN106909566A (zh) * 2015-12-23 2017-06-30 阿里巴巴集团控股有限公司 一种数据建模方法及设备
CN105843605A (zh) * 2016-03-17 2016-08-10 中国银行股份有限公司 一种数据映射方法及装置
CN105843605B (zh) * 2016-03-17 2019-03-08 中国银行股份有限公司 一种数据映射方法及装置
CN108733713A (zh) * 2017-04-21 2018-11-02 阿里巴巴集团控股有限公司 数据仓库中的数据查询方法及装置
CN108733713B (zh) * 2017-04-21 2022-01-11 创新先进技术有限公司 数据仓库中的数据查询方法及装置
CN111712809A (zh) * 2018-04-16 2020-09-25 甲骨文国际公司 通过示例来学习etl规则

Similar Documents

Publication Publication Date Title
CN101777073A (zh) 一种基于xml格式的数据转换方法
CN105447253B (zh) 一种三维工艺数据的集成方法
CN101493834A (zh) 一种任意业务系统单据生成记帐凭证的方法
CN107563628A (zh) Bim构件与施工任务关联关系的建立方法及系统
CN104778540A (zh) 一种建材装备制造bom管理方法及管理系统
CN101452441A (zh) 一种电子表格通用数据解析导入方法
CN113378011B (zh) 一种复杂产品总装数字孪生体的构建方法及系统
CN102426587A (zh) 一种基于复杂产品异构bom的定制查询方法
CN106372044A (zh) 一种基于报表生成类型化维度xbrl报告的方法
CN106528512B (zh) 一种excel概预算表格自动编排方法
CN101859303A (zh) 元数据管理方法及管理系统
CN104778236A (zh) 一种基于元数据的etl实现方法及系统
CN101246471A (zh) 一种不规则复杂报表的生成方法
CN103646100A (zh) 报表数据组织模型
CN104123422A (zh) 一种利用数据库管理系统的制前设计方法
CN103034703A (zh) 基于规则配置的多系统间数据交换的方法
CN101751400A (zh) 技术数据分析的系统与方法以及专利分析的系统
CN103473216A (zh) 一种基于excel的产品工艺编制方法
CN108509198B (zh) 一种基于中性bom的产品电子图册构建方法
CN108170855A (zh) 一种CityGML与IFC数据统一查询及数据抽取方法
Qiao et al. Data driven design and simulation system based on XML
CN103927402A (zh) 一种控制逻辑图模块化设计管理系统实现方法
Albrecht et al. Quality assurance in the EPO patent information resource
CN105912723A (zh) 一种自定义字段的存储方法
CN102722621A (zh) 一种有限元法计算结果的可视化处理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20100714