CN111625520A - 一种通用的异构数据库字段类型的映射方法及系统 - Google Patents

一种通用的异构数据库字段类型的映射方法及系统 Download PDF

Info

Publication number
CN111625520A
CN111625520A CN202010513360.7A CN202010513360A CN111625520A CN 111625520 A CN111625520 A CN 111625520A CN 202010513360 A CN202010513360 A CN 202010513360A CN 111625520 A CN111625520 A CN 111625520A
Authority
CN
China
Prior art keywords
field
database
field type
standard
mapping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010513360.7A
Other languages
English (en)
Other versions
CN111625520B (zh
Inventor
刘魁
曹亮
邓羽平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu University of Information Technology
Original Assignee
Chengdu University of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu University of Information Technology filed Critical Chengdu University of Information Technology
Priority to CN202010513360.7A priority Critical patent/CN111625520B/zh
Publication of CN111625520A publication Critical patent/CN111625520A/zh
Application granted granted Critical
Publication of CN111625520B publication Critical patent/CN111625520B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2255Hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种通用的异构数据库字段类型的映射方法及系统,建立一个通用的数据库字段类型标准,做到各个数据库的字段类型都能映射到该字段类型标准中从而达到两个不同的数据库字段之间的转换。通过本发明通过不同类型字段建立映射,使得建立不同数据源数据集成的通用模型变得容易,能高效地采集多源数据源数据;其标准通过对多种数据库的字段类型进行分析,提取出一套较为通用的,扩展性良好的,统一的字段标准规范。这套标准适用与绝大多数数据库;拓展性强,每个数据库实现对自定义的标准数据类型映射,增加新的数据库支持实现简单,转换准确,快速,通过自定义的标准规范,实现两个数据库字段类型的转换。

Description

一种通用的异构数据库字段类型的映射方法及系统
技术领域
本发明涉及数据处理领域,特别是涉及一种通用的异构数据库字段类型的映射方法及系统。
背景技术
目前全球企业系统越来越大,数据的总容量大约是每三年就要翻两番,这种情况下,数据存放可能分布越广,可能会出现同一个系统的数据被放到了不同的数据库中,或者由于要做系统升级换不同的数据库,要做不同数据库之间的数据移植,这时对于应用系统不同的数据库的访问的方法和方式完全不一样,造成了大量的升级工作量和工时。现有大多数系统和数据库应用绑定太紧密,造成系统上许多的不便利。
随着计算机数据处理的发展,现阶段存在着大量的异构数据库,他们的异构表现在多个方面,许多的信息系统需要从这些异构数据库中获取数据,异构数据库的差异导致了获取信息的难度,因此需要一种方式来解决多个异构数据库之间的信息集成。
发明内容
本发明的目的在于克服现有技术的不足,基于现有的设计模式,提供一种通用的异构数据库字段类型的映射方法及系统。
本发明的发明目的是通过以下技术方案实现的:一种通用的异构数据库字段类型的映射方法,其特征在于,包括以下步骤:
S1. 建立字段类型映射标准;
S2. 实现各个数据库到标准字段类型的映射;
其中,所述步骤S2还包括以下子步骤:
S201. 判断源字段是否可以映射为标准类型;若是,则执行步骤S202,若否,则对该字段类型进行降级处理或直接抛出异常;
S202. 判断标准字段类型是否可以转换为目标字段类型;若是,则执行步骤S204;若否,则执行步骤S203;
S203. 判断低优先级的哈希表中是否存在可以代替的字段类型;若是则执行步骤S204;若否,则抛出异常;
S204. 输出该字段类型。
所述步骤S201具体包括以下子步骤;
S2011. 断源字段是否可以映射为标准类型;若是,则执行步骤S2012;若否,则执行步骤S2013
S2012. 通过一个哈希表建立目标字段类型和标准字段类型的映射,并执行步骤S202;
S2013. 判断目标字段的数据类型的结构和标准字段类型的结构是否一致;若是,则执行步骤S2014,若否则执行步骤S2015;
S2014. 对他们建立映射关系,保存在较低优先级的哈希表中;
S2015. 将该目标字段记录到异常队列中。
所述步骤S204包括以下子步骤:
S2041. 将第一数据库中的哈希表将相关的字段类型转换成标准的字段类型;
S2041. 通过第二数据库中的哈希表,将标准的字段类型转换成第二数据库对应的字段类型。
一种通用的异构数据库字段类型的映射系统,包括第一数据库、第二数据库、字段类型标准库模块和字段类型映射模块;所述第一数据库与第二数据库通过字段类型映射模块对不同类型字段建立映射,并通过字段类型标注库模块进行字段类型转换。
所述第一数据库与第二数据库为异构数据库。
本发明的有益效果:
(1)通过不同类型字段建立映射,使得建立不同数据源数据集成的通用模型变得容易,能高效地采集多源数据源数据;
(2)其标准通过对多种数据库的字段类型进行分析,提取出一套较为通用的,扩展性良好的,统一的字段标准规范。这套标准适用与绝大多数数据库;
(3)拓展性强,每个数据库实现对自定义的标准数据类型映射,增加新的数据库支持实现简单,转换准确,快速,通过自定义的标准规范,实现两个数据库字段类型的转换。
附图说明
图1为本发明的方法流程框图;
图2为本发明的系统流程框图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图说明本发明的具体实施方式,但本发明的保护范围不局限于以下所述。
如图1,一种通用的异构数据库字段类型的映射方法,包括以下步骤:
S1. 建立字段类型映射标准;
S2. 实现各个数据库到标准字段类型的映射;
S3. 判断源字段是否可以映射为标准类型;若是,则执行步骤S4,若否,则对该字段类型进行降级处理或直接抛出异常;
S4. 判断标准字段类型是否可以转换为目标字段类型;若是,则执行步骤S6;若否,则执行步骤S5;
S5;判断低优先级的哈希表中是否存在可以代替的字段类型;若是则执行步骤S6;若否,则抛出异常;
S6;输出该字段类型。
所述步骤S3具体包括以下子步骤;
S301. 断源字段是否可以映射为标准类型;若是,则执行步骤S302;若否,则执行步骤S303
S302. 通过一个哈希表建立目标字段类型和标准字段类型的映射,并执行步骤S4;
S303. 判断目标字段的数据类型的结构和标准字段类型的结构是否一致;若是,则执行步骤S304,若否则执行步骤S305;
S304. 对他们建立映射关系,保存在较低优先级的哈希表中;
S305. 将该目标字段记录到异常队列中。
所述步骤S6包括以下子步骤:
S601. 将第一数据库中的哈希表将相关的字段类型转换成标准的字段类型;
S602. 通过第二数据库中的哈希表,将标准的字段类型转换成第二数据库对应的字段类型。
如图2,一种通用的异构数据库字段类型的映射系统,一种通用的异构数据库字段类型的映射系统,包括第一数据库、第二数据库、字段类型标准库模块和字段类型映射模块;所述第一数据库与第二数据库通过字段类型映射模块对不同类型字段建立映射,并通过字段类型标注库模块进行字段类型转换。
所述第一数据库与第二数据库为异构数据库。
本实施例的具体原理如下:
1. 建立一个通用的兼容各个数据库的字段类型标准规范,相关标准如下:
1.1 CHAR 表示定长字符;
1.2 VARCHAR 表示变长字符;
1.3 SMALLINT 表示 2 字节整型;
1.4 INT 表示 4 字节整型;
1.5 LONG 表示 8 字节整型;
1.6 FLOAT 表示 单精度浮点;
1.7 DOUBLE 表示 双精度浮点;
1.8 DATE 表示日期;
1.9 TIME 表示时间;
1.10 TIMESTAMP 表示日期+时间;
1.11 TEXT 表示文本;
1.12 BLOB 表示 二进制数据;
1.13 DECIMAL 表示可变精度;
1.14 NUMBER 表示可控精度。
2. 依据 1 中制定的数据类型标准规范,实现数据库到该标准类型的一个映射。
2.1 对于目标数据库中,存在字段与标准字段类型的匹配,那么通过一个哈希表建立目标字段类型和标准字段类型的映射。
2.2 对于目标数据库中,存在标准字段类型无法匹配该数据库中的相关字段。
a. 如果存在目标字段的数据类型的结构和标准字段类型的结构一致,可以对他们建立映射关系,保存在较低优先级的哈希表中。
b. 如果不存在目标字段的数据类型和结构和标准字段类型的结构一致,那么将该目标字段记录到异常队列中。
2.3 对于目标数据库中,存在一些该数据库特有的字段类型,无法匹配到标准字段类型。
a. 如果存在目标字段的数据类型的结构和标准字段类型的结构一致,可以对他们建立映射关系,保存在较低优先级的哈希表中。
b. 如果不存在目标字段的数据类型和结构和标准字段类型的结构一致,那么将该目标字段记录到异常队列中。
3. 依据2 完成了各种数据库到标准字段类型的相关映射关系。
4. 实现从第一数据库的子弹类型到第二数据库的字段类型转换。
4.1 将第一数据库中的哈希表将相关的字段类型转换成标准的字段类型。
4.2 利用第二数据库中的哈希表,将标准的字段类型转换成B 数据库对应的字段类型。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (5)

1.一种通用的异构数据库字段类型的映射方法,其特征在于,包括以下步骤:
S1. 建立字段类型映射标准;
S2. 实现各个数据库到标准字段类型的映射;
其中,所述步骤S2还包括以下子步骤:
S201. 判断源字段是否可以映射为标准类型;若是,则执行步骤S202,若否,则对该字段类型进行降级处理或直接抛出异常;
S202. 判断标准字段类型是否可以转换为目标字段类型;若是,则执行步骤S204;若否,则执行步骤S203;
S203. 判断低优先级的哈希表中是否存在可以代替的字段类型;若是则执行步骤S204;若否,则抛出异常;
S204. 输出该字段类型。
2.根据权利要求1所述的一种通用的异构数据库字段类型的映射方法,其特征在于,所述步骤S201具体包括以下子步骤;
S2011. 断源字段是否可以映射为标准类型;若是,则执行步骤S2012;若否,则执行步骤S2013
S2012. 通过一个哈希表建立目标字段类型和标准字段类型的映射,并执行步骤S202;
S2013. 判断目标字段的数据类型的结构和标准字段类型的结构是否一致;若是,则执行步骤S2014,若否则执行步骤S2015;
S2014. 对他们建立映射关系,保存在较低优先级的哈希表中;
S2015. 将该目标字段记录到异常队列中。
3.根据权利要求1所述的一种通用的异构数据库字段类型的映射方法,其特征在于,所述步骤S204包括以下子步骤:
S2041. 将第一数据库中的哈希表将相关的字段类型转换成标准的字段类型;
S2041. 通过第二数据库中的哈希表,将标准的字段类型转换成第二数据库对应的字段类型。
4.一种通用的异构数据库字段类型的映射系统,其特征在于,包括第一数据库、第二数据库、字段类型标准库模块、字段类型转换模块和字段类型映射模块;所述第一数据库与第二数据库通过字段类型映射模块对不同类型字段建立映射,通过字段类型标准库模块进行字段类型判断,再通过字段类型转换模块进行字段转换。
5.根据权利要求1所述的一种通用的异构数据库字段类型的映射系统,其特征在于,所述第一数据库与第二数据库为异构数据库。
CN202010513360.7A 2020-06-08 2020-06-08 一种通用的异构数据库字段类型的映射方法及系统 Active CN111625520B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010513360.7A CN111625520B (zh) 2020-06-08 2020-06-08 一种通用的异构数据库字段类型的映射方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010513360.7A CN111625520B (zh) 2020-06-08 2020-06-08 一种通用的异构数据库字段类型的映射方法及系统

Publications (2)

Publication Number Publication Date
CN111625520A true CN111625520A (zh) 2020-09-04
CN111625520B CN111625520B (zh) 2023-06-06

Family

ID=72272034

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010513360.7A Active CN111625520B (zh) 2020-06-08 2020-06-08 一种通用的异构数据库字段类型的映射方法及系统

Country Status (1)

Country Link
CN (1) CN111625520B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112417225A (zh) * 2020-11-30 2021-02-26 北京明略软件系统有限公司 一种多源异构数据的联合查询方法与系统
CN112800150A (zh) * 2021-02-25 2021-05-14 浪潮云信息技术股份公司 一种异构数据库自动映射建表方法
CN112860793A (zh) * 2021-02-03 2021-05-28 浪潮云信息技术股份公司 一种异源数据库间实现元数据同步的方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030195987A1 (en) * 2002-04-16 2003-10-16 International Business Machines Corporation Method, system, and article of manufacture for transferring structured data between different data stores
US6889260B1 (en) * 1999-06-10 2005-05-03 Ec Enabler, Ltd Method and system for transferring information
US20080034010A1 (en) * 2006-08-07 2008-02-07 Quan Dennis A Methods and apparatus for views of input specialized references
CN101930464A (zh) * 2010-08-25 2010-12-29 华南理工大学 一种面向rfid物流应用的松散性异构数据交换系统及方法
CN107045534A (zh) * 2017-01-20 2017-08-15 中国航天系统科学与工程研究院 大数据环境下基于HBase的异构数据库在线交换与共享系统
CN110119495A (zh) * 2018-02-05 2019-08-13 北大方正集团有限公司 数字字符串的转换方法、系统、计算机设备及介质
CN111078774A (zh) * 2019-12-05 2020-04-28 中国科学技术大学智慧城市研究院(芜湖) 一种数据的自动整合方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6889260B1 (en) * 1999-06-10 2005-05-03 Ec Enabler, Ltd Method and system for transferring information
US20030195987A1 (en) * 2002-04-16 2003-10-16 International Business Machines Corporation Method, system, and article of manufacture for transferring structured data between different data stores
US20080034010A1 (en) * 2006-08-07 2008-02-07 Quan Dennis A Methods and apparatus for views of input specialized references
CN101930464A (zh) * 2010-08-25 2010-12-29 华南理工大学 一种面向rfid物流应用的松散性异构数据交换系统及方法
CN107045534A (zh) * 2017-01-20 2017-08-15 中国航天系统科学与工程研究院 大数据环境下基于HBase的异构数据库在线交换与共享系统
CN110119495A (zh) * 2018-02-05 2019-08-13 北大方正集团有限公司 数字字符串的转换方法、系统、计算机设备及介质
CN111078774A (zh) * 2019-12-05 2020-04-28 中国科学技术大学智慧城市研究院(芜湖) 一种数据的自动整合方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
韩世杰等: "一种异构数据库迁移系统的设计与实现" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112417225A (zh) * 2020-11-30 2021-02-26 北京明略软件系统有限公司 一种多源异构数据的联合查询方法与系统
CN112860793A (zh) * 2021-02-03 2021-05-28 浪潮云信息技术股份公司 一种异源数据库间实现元数据同步的方法
CN112800150A (zh) * 2021-02-25 2021-05-14 浪潮云信息技术股份公司 一种异构数据库自动映射建表方法

Also Published As

Publication number Publication date
CN111625520B (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
CN111625520A (zh) 一种通用的异构数据库字段类型的映射方法及系统
US8176088B2 (en) Incremental cardinality estimation for a set of data values
CN109542889B (zh) 流式数据列存储方法、装置、设备和存储介质
CN111339103B (zh) 一种基于全量分片和增量日志解析的数据交换方法及系统
CN108563711A (zh) 一种基于时间节点的时序数据存储方法
CN103902623A (zh) 用于在存储系统上存取文件的方法和系统
EP1609081A2 (en) System and method for storing and accessing data in an interlocking trees datastore
CN105760534A (zh) 自定义的可序列化的数据结构、hadoop集群、服务器及其应用方法
CN104462269A (zh) 一种异构数据库数据交换方法及系统
CN102779138B (zh) 实时数据的硬盘存取方法
CN104731896A (zh) 一种数据处理方法及系统
Ramesh et al. Data modelling for discrete time series data using Cassandra and MongoDB
CN111061758A (zh) 数据存储方法、装置及存储介质
CN101645073A (zh) 一种将已有数据库文件导入嵌入式数据库的方法
CN110245043B (zh) 一种分布式系统间调用关系的跟踪系统
EP3343395A1 (en) Data storage method and apparatus for mobile terminal
CN111427845B (zh) 一种交互式建模分析算子数据交换方法
CN108763562A (zh) 一种基于大数据技术提升数据交换效率的构建方法
CN107291938A (zh) 订单查询系统及方法
CN116150236A (zh) 数据同步方法及装置、电子设备、计算机可读存储介质
CN105809577B (zh) 一种基于规则和组件的电厂信息化数据的分类处理方法
CN101894098B (zh) 一种内嵌字体数据处理方法及装置
CN110569243B (zh) 一种数据查询方法、数据查询插件和数据查询服务器
CN112162951A (zh) 一种信息检索方法、服务器及存储介质
CN105607957A (zh) 一种基于opc da的数据采集与监控系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant