CN113254446B - 数据融合方法、装置、电子设备及介质 - Google Patents
数据融合方法、装置、电子设备及介质 Download PDFInfo
- Publication number
- CN113254446B CN113254446B CN202110575173.6A CN202110575173A CN113254446B CN 113254446 B CN113254446 B CN 113254446B CN 202110575173 A CN202110575173 A CN 202110575173A CN 113254446 B CN113254446 B CN 113254446B
- Authority
- CN
- China
- Prior art keywords
- database table
- visual
- fields
- data
- fusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007500 overflow downdraw method Methods 0.000 title claims abstract description 22
- 230000000007 visual effect Effects 0.000 claims abstract description 249
- 230000004927 fusion Effects 0.000 claims abstract description 78
- 238000013515 script Methods 0.000 claims abstract description 54
- 238000000034 method Methods 0.000 claims abstract description 24
- 230000006870 function Effects 0.000 claims description 30
- 238000013075 data extraction Methods 0.000 claims description 20
- 238000013507 mapping Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012800 visualization Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000013508 migration Methods 0.000 description 6
- 230000005012 migration Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/214—Database migration support
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据处理技术,揭露一种数据融合方法,包括:接收第一数据库表及第二数据库表并获取对应的表结构脚本,根据表结构脚本分别构建第一可视数据库表及第二可视数据库表;获取第一可视数据库表及第二可视数据库表的主键和外键,根据所述外键建立第一可视数据库表及第二可视数据库表之间的对应关系;根据所述对应关系,比较可视数据库表中主键的字段,并根据字段比较结果将所述第一可视数据库表及所述第二可视数据库表中的字段进行标记,构建融合数据库表,并根据所述标记将第一数据库表及第二数据库表中的数据迁移至融合数据库表中。本发明还涉及区块链技术,所述数据库表可存储于区块链节点中。本发明可实现不同数据库中数据可溯源式融合。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据融合方法、装置、电子设备及计算机可读存储介质。
背景技术
在项目开发过程中,经常需要对已有项目进行重构或是对当前项目进行改造,在对已有项目进行重构或是对当前项目进行改造时往往涉及对数据库的迁移和融合。
现有技术中,在对数据库进行迁移和融合需要手动从项目进行的测试环境中导出表结构,人工进行整理核对,在这一过程中数据库表存在各种相同数据和不同数据,不将其进行可视化的区分十分影响整理核对的效率,并且现有技术中,对融合后数据表的数据来源也无法做到有效确认,不利于查找数据源头。
发明内容
本发明提供一种数据融合方法、装置、电子设备及计算机可读存储介质,其主要目的在于实现不同数据库中数据的融合。
为实现上述目的,本发明提供的一种数据融合方法,包括:
接收待融合的第一数据库表及第二数据库表,获取所述第一数据库表及第二数据库表的表结构脚本,根据所述表结构脚本分别构建所述第一数据库表的第一可视数据库表及所述第二数据库表的第二可视数据库表;
获取所述第一可视数据库表及所述第二可视数据库表的主键及外键,根据所述外键建立所述第一可视数据库表及所述第二可视数据库表之间的对应关系;
根据所述对应关系,比较所述第一可视数据库表及所述第二可视数据库表中主键的字段,得到字段比较结果,并根据所述字段比较结果将所述第一可视数据库表及所述第二可视数据库表中的字段进行标记;
根据标记后的所述字段构建融合数据库表,并将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中。
可选地,所述获取所述第一数据库表及第二数据库表的表结构脚本,包括:
从所述第一数据库表对应的第一数据库及所述第二数据库表对应的第二数据库中获取表信息;
根据所述表信息构建表信息模板;
从所述表信息模板中提取代码,对所述代码进行组合得到所述第一数据库的表结构脚本和所述第二数据库的表结构脚本。
可选地,所述根据所述表结构脚本分别构建所述第一数据库表的第一可视数据库表及所述第二数据库表的第二可视数据库表,包括:
构建第一空白数据库表和第二空白数据库表;
将所述第一数据库表的数据分配至所述第一空白数据库表得到第一更新数据库表,将所述第二数据库表的数据分配至所述第二空白数据库表中得到第二更新数据库表;
基于所述表结构脚本对所述第一更新数据库表和所述第二更新数据库表进行可视化操作,得到所述第一可视数据库表和所述第二可视数据库表。
可选地,所述获取所述第一可视数据库表及所述第二可视数据库表的主键及外键,根据所述外键建立所述第一可视数据库表及所述第二可视数据库表之间的对应关系,包括:
获取所述第一可视数据库表的主键;
根据所述第一可视数据库表的主键在所述第二可视数据库表获取所述第一可视数据库表的外键;
基于所述第二可视数据库表中所述第一可视数据库表中的外键建立所述第一可视数据库表和所述第二可视数据库表的对应关系。
可选地所述根据所述对应关系,比较所述第一可视数据库表及所述第二可视数据库表中主键的字段,得到字段比较结果,并根据所述字段比较结果将所述第一可视数据库表及所述第二可视数据库表中的字段进行标记,包括:
将所述第一可视数据库表作为母表,将所述第二可视数据库表作为子表,并根据所述对应关系利用所述母表查询所述子表中所有字段,获取所述子表和所述母表中的不相同字段和相同字段;
对所述相同字段进行字段含义分析,得到含义相同字段及含义不同字段;
采用预设的方法对所述不相同字段、含义相同字段及含义不同字段进行区分标记。
可选地,所述根据标记后的所述字段构建融合数据库表,包括:
构建第三空白数据库表;
将所述不相同字段直接添加至所述第三空白数据库表中;及
将所述含义相同字段进行重命名后添加至所述第三空白数据库表,得到融合数据库表,并生成所述第一可视数据库表以及所述第二可视数据库表与所述融合数据库表之间的映射关系。
可选地,所述将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中,包括:
获取所述融合数据库表与所述第一可视数据库表以及所述第二可视数据库表之间的映射关系;
根据所述映射关系,建立数据抽取函数;
对所述数据抽取函数进行优化,并建立调度控制表,利用优化后的所述数据抽取函数和所述调度控制表将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中。
为了解决上述问题,本发明还提供一种数据融合装置,所述装置包括:
数据库表可视化模块,用于接收待融合的第一数据库表及第二数据库表,获取所述第一数据库表及第二数据库表的表结构脚本,根据所述表结构脚本分别构建所述第一数据库表的第一可视数据库表及所述第二数据库表的第二可视数据库表;
表关系建立模块,用于获取所述第一可视数据库表及所述第二可视数据库表的主键及外键,根据所述外键和所述外键的键值建立所述第一可视数据库表及所述第二可视数据库表之间的对应关系;
字段标记模块,用于根据所述对应关系,比较所述第一可视数据库表及所述第二可视数据库表中主键的字段,得到字段比较结果,并根据所述字段比较结果将所述第一可视数据库表及所述第二可视数据库表中的字段进行标记;
数据库表融合模块,用于根据标记后的所述字段构建融合数据库表,并将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个计算机程序;及
处理器,执行所述存储器中存储的计算机程序以实现上述所述的数据融合方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,包括存储数据区和存储程序区,存储数据区存储创建的数据,存储程序区存储有计算机程序;其中,所述计算机程序被处理器执行时实现如上所述的数据融合方法。
本发明实施例中,接收待融合的第一数据库表及第二数据库表并获取表结构脚本,根据所述表结构脚本分别构建所述第一可视数据库表及所述第二可视数据库表,接收第一可视数据库表及所述第二可视数据库表的主键及外键并根据所述外键建立所述第一可视数据库表及第二可视数据库表的对应关系,利用所述对比关系可以将所述第一可视数据库表和第二可视数据库表中主键的字段进行标记,用来去除冗余数据,根据标记后的字段构建融合数据库表,能够对融合后数据库表的数据来源进行确认,并将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中,从而能够实现对数据库中的数据进行可溯源式融合目的。
附图说明
图1为本发明一实施例提供的一种数据融合方法的流程示意图;
图2为图1提供的数据融合方法中其中一个步骤的详细实施流程示意图;
图3为本发明一实施例提供的数据融合装置的模块示意图;
图4为本发明一实施例提供的实现数据融合方法的电子设备的内部结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种数据融合方法。所述数据融合方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述数据融合方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。参照图1所示,为本发明一实施例提供的一种数据融合方法的流程示意图。在本实施例中,所述数据融合方法包括:
S1、接收待融合的第一数据库表及第二数据库表,获取所述第一数据库表及第二数据库表的表结构脚本,根据所述表结构脚本分别构建所述第一数据库表的第一可视数据库表及所述第二数据库表的第二可视数据库表;
本发明实施例中,所述第一数据库表以及所述第二数据库表可以是保存第一数据库和第二数据库中数据的网格虚拟表,无需代码就可以简单的绑定数据库。
进一步地,本发明实施例中,所述表结构脚本为数据库系统中的脚本,是一种使用特定的描述性语言,依据一定的格式编写的可执行文件。利用所述表结构脚本可以将所述数据库表可视化,得到可视数据库表。
详细地,所述获取所述第一数据库表及第二数据库表的表结构脚本,包括:
从所述第一数据库表对应的第一数据库及所述第二数据库表对应的第二数据库中获取表信息;
根据所述表信息构建表信息模板;
从所述表信息模板中提取代码,对所述代码进行组合得到所述第一数据库的表结构脚本和所述第二数据库的表结构脚本。
本发明实施例中,所述表信息包括数据库字段的基础信息、基础存储信息等。本发明实施例可以通过已知的结构化查询语言(SQL、Structured Qurey Language)函数从所述第一数据库表对应的第一数据库及所述第二数据库表对应的第二数据库中获取表信息。
详细地,所述根据所述表结构脚本分别构建所述第一数据库表的第一可视数据库表及所述第二数据库表的第二可视数据库表包括:
构建第一空白数据库表和第二空白数据库表;
将所述第一数据库表的数据分配至所述第一空白数据库表得到第一更新数据库表,将所述第二数据库表的数据分配至所述第二空白数据库表中得到第二更新数据库表;
基于所述表结构脚本对所述第一更新数据库表和所述第二更新数据库表进行可视化操作,得到所述第一可视数据库表和所述第二可视数据库表。
本发明实施例中,所述数据库表为数据库中用来组织存储数据关系的表,而所述空白数据库表为没有对应数据库,不含数据的数据库表。
S2、获取所述第一可视数据库表及所述第二可视数据库表的主键及外键,根据所述外键建立所述第一可视数据库表及所述第二可视数据库表之间的对应关系。
本发明实施例中,所述主键为数据库表中用于确定唯一数据的键,本发明实施例根据所述主键的唯一性获取所述第一可视数据库表的主键。进一步地,所述外键为所述第一可视数据库中的主键位于所述第二可视数据库中时的键,所述外键可以表示所述第一可视数据库表和所述第二可视数据库表间的对应关系。
详细地,所述获取所述第一可视数据库表的主键及所述第二可视数据库表的主键及外键,根据所述外键建立所述第一可视数据库表及所述第二可视数据库表之间的对应关系包括:
获取所述第一可视数据库表的主键;
根据所述第一可视数据库表的主键在所述第二可视数据库表获取所述第一可视数据库表的外键;
基于所述第二可视数据库表中所述第一可视数据库表中的外键建立所述第一可视数据库表和所述第二可视数据库表的对应关系。
本发明另一实施例中,可以获取所述第二可视数据库表的主键,根据所述第二可视数据库表的主键在所述第一可视数据库表获取所述第一可视数据库表的外键,并基于所述第一可视数据库表中所述第二可视数据库表的外键建立所述第一可视数据库表和所述第二可视数据库表的对应关系。
S3、根据所述对应关系,比较所述第一可视数据库表及所述第二可视数据库表中主键的字段,得到字段比较结果,并根据所述字段比较结果将所述第一可视数据库表及所述第二可视数据库表中的字段进行标记。
本发明实施例中,所述字段为描述可视数据库表的某一特征,即数据项的记录单位,所述字段中包含供计算机识别的字段标识符。
详细地,参阅图2所示,所述S3包括:
S30、将所述第一可视数据库表作为母表,将所述第二可视数据库表作为子表,并根据所述对应关系利用所述母表查询所述子表中所有字段,获取所述子表和所述母表中的不相同字段和相同字段;
S31、对所述相同字段进行字段含义分析,得到含义相同字段及含义不同字段;
S32、采用预设的方法对所述不相同字段、含义相同字段及含义不同字段进行区分标记。
在本发明另一实施例中,将所述第二可视数据库表作为母表,将所述第一可视数据库表作为子表。
本发明实施例中,所述对所述相同字段进行字段含义分析为通过人工或预设程序实现。
进一步地,本发明实施例将不相同字段设置为第一标记字段、含义相同字段设置为第二标记字段、含义不同字段设置为第三标记字段,其中,所述预设方法可以为将所述第一标记字段设置为第一种颜色,如绿色,将所述第二标记字段设置为第二种颜色,如黄色,以及将所述第三标记字段设置为第三种颜色,如红色。
S4、根据标记后的所述字段构建融合数据库表,并将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中。
详细地,所述根据标记后的所述字段构建融合数据库表,包括:
构建第三空白数据库表;
将所述不相同字段直接添加至所述第三空白数据库表中;及
将所述含义相同字段进行重命名后添加至所述第三空白数据库表,得到融合数据库表,并生成所述第一可视数据库表以及所述第二可视数据库表与所述融合数据库表之间的映射关系。
本发明实施例可以使用mysqldump命令将字段写入架构化查询语言(SQL)脚本,并通过执行所述结构化查询语言脚本将所述字段写入所述第三空白数据库表。
进一步地,所述将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中,包括:
获取所述融合数据库表与所述第一可视数据库表以及所述第二可视数据库表之间的映射关系;
根据所述映射关系,建立数据抽取函数;
对所述数据抽取函数进行优化,并建立调度控制表,利用优化后的所述数据抽取函数和所述调度控制表将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中。
本发明实施例中,所述数据抽取函数用于对所述第一可视数据库表及所述第二可视数据库表对应的数据库中的数据进行抽取,
本发明实施例可以通过启动并行查询对所述数据抽取函数进行优化。进一步地,所述调度控制表为表示所述第一可视数据库表及所述第二可视数据库表对应的数据库和融合数据库的数据迁移情况,如记录各个数据抽取函数数据调度的起始时间和结束时间以及数据迁移过程中执行的正确或错误消息。
本发明另一个实施例中,在所述利用优化后的所述数据抽取函数和所述调度控制表将所述第一数据库表对应的第一数据库及所述第二数据库表中的数据迁移至所述融合数据库表中之前,还可以包括清洗所述第一数据库和所述第二数据库中的垃圾数据。
本发明实施例中,接收待融合的第一数据库表及第二数据库表并获取表结构脚本,根据所述表结构脚本分别构建所述第一可视数据库表及所述第二可视数据库表,接收第一可视数据库表及所述第二可视数据库表的主键及外键并根据所述外键建立所述第一可视数据库表及第二可视数据库表的对应关系,利用所述对比关系可以将所述第一可视数据库表和第二可视数据库表中主键的字段进行标记,用来去除冗余数据,根据标记后的字段构建融合数据库表,能够对融合后数据库表的数据来源进行确认,并将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中,从而能够实现对数据库中的数据进行可溯源式融合目的。
如图3所示,是本发明数据融合装置的模块示意图。
本发明所述数据融合装置100可以安装于电子设备中。根据实现的功能,所述数据融合装置可以包括数据库表可视化模块101、表关系建立模块102、字段标记模块103、和数据库表融合模块104。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述数据库表可视化模块101,用于接收待融合的第一数据库表及第二数据库表,获取所述第一数据库表及第二数据库表的表结构脚本,根据所述表结构脚本分别构建所述第一数据库表的第一可视数据库表及所述第二数据库表的第二可视数据库表。
本发明实施例中,所述第一数据库表以及所述第二数据库表可以是保存第一数据库和第二数据库中数据的网格虚拟表,无需代码就可以简单的绑定数据库。
进一步地,本发明实施例中,所述表结构脚本为数据库系统中的脚本,是一种使用特定的描述性语言,依据一定的格式编写的可执行文件。利用所述表结构脚本可以将所述数据库表可视化,得到可视数据库表。
详细地,所述获取所述第一数据库表及第二数据库表的表结构脚本,包括:
从所述第一数据库表对应的第一数据库及所述第二数据库表对应的第二数据库中获取表信息;
根据所述表信息构建表信息模板;
从所述表信息模板中提取代码,对所述代码进行组合得到所述第一数据库的表结构脚本和所述第二数据库的表结构脚本。
本发明实施例中,所述表信息包括数据库字段的基础信息、基础存储信息等。本发明实施例可以通过已知的结构化查询语言(SQL、Structured Qurey Language)函数从所述第一数据库表对应的第一数据库及所述第二数据库表对应的第二数据库中获取表信息。
详细地,所述根据所述表结构脚本分别构建所述第一数据库表的第一可视数据库表及所述第二数据库表的第二可视数据库表包括:
构建第一空白数据库表和第二空白数据库表;
将所述第一数据库表的数据分配至所述第一空白数据库表得到第一更新数据库表,将所述第二数据库表的数据分配至所述第二空白数据库表中得到第二更新数据库表;
基于所述表结构脚本对所述第一更新数据库表和所述第二更新数据库表进行可视化操作,得到所述第一可视数据库表和所述第二可视数据库表。
本发明实施例中,所述数据库表为数据库中用来组织存储数据关系的表,而所述空白数据库表为没有对应数据库,不含数据的数据库表。
所述表关系建立模块102,用于获取所述第一可视数据库表及所述第二可视数据库表的主键及外键,根据所述外键建立所述第一可视数据库表及所述第二可视数据库表之间的对应关系。
详细地,所述表关系建立模块102通过下述操作建立所述第一可视数据库及所述第二可视数据库表之间的对应关系:
获取所述第一可视数据库表的主键;
根据所述第一可视数据库表的主键在所述第二可视数据库表获取所述第一可视数据库表的外键;
基于所述第二可视数据库表中所述第一可视数据库表中的外键建立所述第一可视数据库表和所述第二可视数据库表的对应关系。
本发明实施例中,所述主键为数据库表中用于确定唯一数据的键,本发明实施例根据所述主键的唯一性获取所述第一可视数据库表的主键。进一步地,所述外键为所述第一可视数据库中的主键位于所述第二可视数据库中时的键,所述外键可以表示所述第一可视数据库表和所述第二可视数据库表间的对应关系。
本发明另一实施例中,可以获取所述第二可视数据库表的主键,根据所述第二可视数据库表的主键在所述第一可视数据库表获取所述第一可视数据库表的外键,并基于所述第一可视数据库表中所述第二可视数据库表的外键建立所述第一可视数据库表和所述第二可视数据库表的对应关系。
所述字段标记模块103,用于根据所述对应关系,比较所述第一可视数据库表及所述第二可视数据库表中主键的字段,得到字段比较结果,并根据所述字段比较结果将所述第一可视数据库表及所述第二可视数据库表中的字段进行标记。
本发明实施例中,所述字段为描述可视数据库表的某一特征,即数据项的记录单位,所述字段中包含供计算机识别的字段标识符。
详细地,所述字段标记模块103通过下述操作将所述第一可视数据库表及所述第二可视数据库表中的字段进行标记:
将所述第一可视数据库表作为母表,将所述第二可视数据库表作为子表,并根据所述对应关系利用所述母表查询所述子表中所有字段,获取所述子表和所述母表中的不相同字段和相同字段;
对所述相同字段进行字段含义分析,得到含义相同字段及含义不同字段;
采用预设的方法对所述不相同字段、含义相同字段及含义不同字段进行区分标记。
在本发明另一实施例中,将所述第二可视数据库表作为母表,将所述第一可视数据库表作为子表。
本发明实施例中,所述对所述相同字段进行字段含义分析为通过人工或预设程序实现。
进一步地,本发明实施例将不相同字段设置为第一标记字段、含义相同字段设置为第二标记字段、含义不同字段设置为第三标记字段,其中,所述预设方法可以为将所述第一标记字段设置为第一种颜色,如绿色,将所述第二标记字段设置为第二种颜色,如黄色,以及将所述第三标记字段设置为第三种颜色,如红色。
所述数据库表融合模块104,用于根据标记后的所述字段构建融合数据库表,并将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中。
详细地,所述根据标记后的所述字段构建融合数据库表,包括:
构建第三空白数据库表;
将所述不相同字段直接添加至所述第三空白数据库表中;及
将所述含义相同字段进行重命名后添加至所述第三空白数据库表,得到融合数据库表,并生成所述第一可视数据库表以及所述第二可视数据库表与所述融合数据库表之间的映射关系。
本发明实施例可以使用mysqldump命令将字段写入架构化查询语言(SQL)脚本,并通过执行所述结构化查询语言脚本将所述字段写入所述第三空白数据库表。
进一步地,所述将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中,包括:
获取所述融合数据库表与所述第一可视数据库表以及所述第二可视数据库表之间的映射关系;
根据所述映射关系,建立数据抽取函数;
对所述数据抽取函数进行优化,并建立调度控制表,利用优化后的所述数据抽取函数和所述调度控制表将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中。
本发明实施例中,所述数据抽取函数用于对所述第一可视数据库表及所述第二可视数据库表对应的数据库中的数据进行抽取,
本发明实施例可以通过启动并行查询对所述数据抽取函数进行优化。进一步地,所述调度控制表为表示所述第一可视数据库表及所述第二可视数据库表对应的数据库和融合数据库的数据迁移情况,如记录各个数据抽取函数数据调度的起始时间和结束时间以及数据迁移过程中执行的正确或错误消息。
本发明另一个实施例中,在所述利用优化后的所述数据抽取函数和所述调度控制表将所述第一数据库表对应的第一数据库及所述第二数据库表中的数据迁移至所述融合数据库表中之前,还可以包括清洗所述第一数据库和所述第二数据库中的垃圾数据。
本发明实施例中,接收待融合的第一数据库表及第二数据库表并获取表结构脚本,根据所述表结构脚本分别构建所述第一可视数据库表及所述第二可视数据库表,接收第一可视数据库表及所述第二可视数据库表的主键及外键并根据所述外键建立所述第一可视数据库表及第二可视数据库表的对应关系,利用所述对比关系可以将所述第一可视数据库表和第二可视数据库表中主键的字段进行标记,用来去除冗余数据,根据标记后的字段构建融合数据库表,能够对融合后数据库表的数据来源进行确认,并将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中,从而能够实现对数据库中的数据进行可溯源式融合目的。
如图4所示,是本发明实现数据融合方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如数据融合程序。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如数据融合程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行数据融合程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图4仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图4示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的数据融合程序是多个计算机程序的组合,在所述处理器10中运行时,可以实现:
接收待融合的第一数据库表及第二数据库表,获取所述第一数据库表及第二数据库表的表结构脚本,根据所述表结构脚本分别构建所述第一数据库表的第一可视数据库表及所述第二数据库表的第二可视数据库表;
获取所述第一可视数据库表及所述第二可视数据库表的主键及外键,根据所述外键建立所述第一可视数据库表及所述第二可视数据库表之间的对应关系;
根据所述对应关系,比较所述第一可视数据库表及所述第二可视数据库表中主键的字段,得到字段比较结果,并根据所述字段比较结果将所述第一可视数据库表及所述第二可视数据库表中的字段进行标记;
根据标记后的所述字段构建融合数据库表,并将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中。
本发明实施例中,接收待融合的第一数据库表及第二数据库表并获取表结构脚本,根据所述表结构脚本分别构建所述第一可视数据库表及所述第二可视数据库表,接收第一可视数据库表及所述第二可视数据库表的主键及外键并根据所述外键建立所述第一可视数据库表及第二可视数据库表的对应关系,利用所述对比关系可以将所述第一可视数据库表和第二可视数据库表中主键的字段进行标记,用来去除冗余数据,根据标记后的字段构建融合数据库表,能够对融合后数据库表的数据进行来源确认,并将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中,从而能够实现对数据库中的数据进行可溯源式融合目的。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
进一步地,所述计算机可用存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图表记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (9)
1.一种数据融合方法,其特征在于,所述方法包括:
接收待融合的第一数据库表及第二数据库表,获取所述第一数据库表及第二数据库表的表结构脚本,根据所述表结构脚本分别构建所述第一数据库表的第一可视数据库表及所述第二数据库表的第二可视数据库表;
获取所述第一可视数据库表及所述第二可视数据库表的主键及外键,根据所述外键建立所述第一可视数据库表及所述第二可视数据库表之间的对应关系;
根据所述对应关系,比较所述第一可视数据库表及所述第二可视数据库表中主键的字段,得到字段比较结果,并根据所述字段比较结果将所述第一可视数据库表及所述第二可视数据库表中的字段进行标记,包括:将所述第一可视数据库表作为母表,将所述第二可视数据库表作为子表,并根据所述对应关系利用所述母表查询所述子表中所有字段,获取所述子表和所述母表中的不相同字段和相同字段,对所述相同字段进行字段含义分析,得到含义相同字段及含义不同字段,采用预设的方法对所述不相同字段、含义相同字段及含义不同字段进行区分标记,所述对所述相同字段进行字段含义分析为通过人工或预设程序实现;
根据标记后的所述字段构建融合数据库表,并将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中。
2.如权利要求1所述的数据融合方法,其特征在于,所述获取所述第一数据库表及第二数据库表的表结构脚本,包括:
从所述第一数据库表对应的第一数据库及所述第二数据库表对应的第二数据库中获取表信息;
根据所述表信息构建表信息模板;
从所述表信息模板中提取代码,对所述代码进行组合得到所述第一数据库的表结构脚本和所述第二数据库的表结构脚本。
3.如权利要求1所述的数据融合方法,其特征在于,所述根据所述表结构脚本分别构建所述第一数据库表的第一可视数据库表及所述第二数据库表的第二可视数据库表,包括:
构建第一空白数据库表和第二空白数据库表;
将所述第一数据库表的数据分配至所述第一空白数据库表得到第一更新数据库表,将所述第二数据库表的数据分配至所述第二空白数据库表中得到第二更新数据库表;
基于所述表结构脚本对所述第一更新数据库表和所述第二更新数据库表进行可视化操作,得到所述第一可视数据库表和所述第二可视数据库表。
4.如权利要求1所述的数据融合方法,其特征在于,所述获取所述第一可视数据库表及所述第二可视数据库表的主键及外键,根据所述外键建立所述第一可视数据库表及所述第二可视数据库表之间的对应关系,包括:
获取所述第一可视数据库表的主键;
根据所述第一可视数据库表的主键在所述第二可视数据库表获取所述第一可视数据库表的外键;
基于所述第二可视数据库表中所述第一可视数据库表中的外键建立所述第一可视数据库表和所述第二可视数据库表的对应关系。
5.如权利要求1所述的数据融合方法,其特征在于,所述根据标记后的所述字段构建融合数据库表,包括:
构建第三空白数据库表;
将所述不相同字段直接添加至所述第三空白数据库表中;及
将所述含义相同字段进行重命名后添加至所述第三空白数据库表,得到融合数据库表,并生成所述第一可视数据库表以及所述第二可视数据库表与所述融合数据库表之间的映射关系。
6.如权利要求1所述的数据融合方法,其特征在于,所述将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中,包括:
获取所述融合数据库表与所述第一可视数据库表以及所述第二可视数据库表之间的映射关系;
根据所述映射关系,建立数据抽取函数;
对所述数据抽取函数进行优化,并建立调度控制表,利用优化后的所述数据抽取函数和所述调度控制表将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中。
7.一种数据融合装置,其特征在于,所述装置包括:
数据库表可视化模块,用于接收待融合的第一数据库表及第二数据库表,获取所述第一数据库表及第二数据库表的表结构脚本,根据所述表结构脚本分别构建所述第一数据库表的第一可视数据库表及所述第二数据库表的第二可视数据库表;
表关系建立模块,用于获取所述第一可视数据库表及所述第二可视数据库表的主键及外键,根据所述外键建立所述第一可视数据库表及所述第二可视数据库表之间的对应关系;
字段标记模块,用于根据所述对应关系,比较所述第一可视数据库表及所述第二可视数据库表中主键的字段,得到字段比较结果,并根据所述字段比较结果将所述第一可视数据库表及所述第二可视数据库表中的字段进行标记,包括:将所述第一可视数据库表作为母表,将所述第二可视数据库表作为子表,并根据所述对应关系利用所述母表查询所述子表中所有字段,获取所述子表和所述母表中的不相同字段和相同字段,对所述相同字段进行字段含义分析,得到含义相同字段及含义不同字段,采用预设的方法对所述不相同字段、含义相同字段及含义不同字段进行区分标记,所述对所述相同字段进行字段含义分析为通过人工或预设程序实现;
数据库表融合模块,用于根据标记后的所述字段构建融合数据库表,并将所述第一数据库表及所述第二数据库表中的数据迁移至所述融合数据库表中。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序指令,所述计算机程序指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至6中任一项所述的数据融合方法。
9.一种计算机可读存储介质,包括存储数据区和存储程序区,存储数据区存储创建的数据,存储程序区存储有计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的数据融合方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110575173.6A CN113254446B (zh) | 2021-05-26 | 2021-05-26 | 数据融合方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110575173.6A CN113254446B (zh) | 2021-05-26 | 2021-05-26 | 数据融合方法、装置、电子设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113254446A CN113254446A (zh) | 2021-08-13 |
CN113254446B true CN113254446B (zh) | 2023-05-12 |
Family
ID=77184438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110575173.6A Active CN113254446B (zh) | 2021-05-26 | 2021-05-26 | 数据融合方法、装置、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113254446B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113609715B (zh) * | 2021-10-11 | 2022-02-22 | 深圳奥雅设计股份有限公司 | 一种数字孪生背景下的多元模型数据融合方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440273A (zh) * | 2013-08-06 | 2013-12-11 | 北京航空航天大学 | 一种数据跨平台迁移方法及装置 |
CN103530327A (zh) * | 2013-09-25 | 2014-01-22 | 清华大学深圳研究生院 | 一种从非关系型数据库到关系型数据库的数据迁移方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005022417A2 (en) * | 2003-08-27 | 2005-03-10 | Ascential Software Corporation | Methods and systems for real time integration services |
US10853033B1 (en) * | 2017-10-11 | 2020-12-01 | Amperity, Inc. | Effectively fusing database tables |
CN111831629B (zh) * | 2019-04-15 | 2024-05-03 | 阿里巴巴集团控股有限公司 | 一种数据处理方法及装置 |
CN112765152B (zh) * | 2019-11-05 | 2024-04-12 | 北京京东振世信息技术有限公司 | 用于合并数据表的方法和装置 |
CN111443970B (zh) * | 2020-03-24 | 2023-11-03 | 浪潮通用软件有限公司 | 一种组装多来源数据的方法、装置、设备及可读介质 |
CN112506964B (zh) * | 2020-11-30 | 2024-05-28 | 深圳市移卡科技有限公司 | 数据查询方法、系统及计算机可读存储介质 |
-
2021
- 2021-05-26 CN CN202110575173.6A patent/CN113254446B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103440273A (zh) * | 2013-08-06 | 2013-12-11 | 北京航空航天大学 | 一种数据跨平台迁移方法及装置 |
CN103530327A (zh) * | 2013-09-25 | 2014-01-22 | 清华大学深圳研究生院 | 一种从非关系型数据库到关系型数据库的数据迁移方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113254446A (zh) | 2021-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112948427B (zh) | 数据查询方法、装置、设备及存储介质 | |
CN113239106B (zh) | Excel文件导出方法、装置、电子设备及存储介质 | |
CN112364107A (zh) | 系统分析可视化方法、装置、电子设备及计算机可读存储介质 | |
CN115408399A (zh) | 基于sql脚本的血缘关系分析方法、装置、设备及存储介质 | |
WO2022048362A1 (zh) | 数据存储方法、装置、电子设备及存储介质 | |
CN111651453A (zh) | 用户历史行为查询方法、装置、电子设备及存储介质 | |
CN112949278A (zh) | 数据核对方法、装置、电子设备及可读存储介质 | |
CN112231417A (zh) | 数据分类方法、装置、电子设备及存储介质 | |
CN114881616A (zh) | 业务流程执行方法、装置、电子设备及存储介质 | |
CN112579098A (zh) | 软件发布方法、装置、电子设备及可读存储介质 | |
CN114610747A (zh) | 数据查询方法、装置、设备及存储介质 | |
CN113806434A (zh) | 大数据处理方法、装置、设备及介质 | |
CN115129753A (zh) | 数据血缘关系分析方法、装置、电子设备及存储介质 | |
CN113254446B (zh) | 数据融合方法、装置、电子设备及介质 | |
CN113434542B (zh) | 数据关系识别方法、装置、电子设备及存储介质 | |
CN114637811A (zh) | 数据表实体关系图生成方法、装置、设备及存储介质 | |
CN112486532B (zh) | 配置文件的管理方法、装置、电子设备及存储介质 | |
CN112541688B (zh) | 业务数据校验方法、装置、电子设备及计算机存储介质 | |
CN112685384A (zh) | 数据迁移方法、装置、电子设备及存储介质 | |
CN113347451B (zh) | 视频上传方法、装置、电子设备及计算机可读存储介质 | |
CN115114297A (zh) | 数据轻量存储及查找方法、装置、电子设备及存储介质 | |
CN112925753B (zh) | 文件追加写入方法、装置、电子设备及存储介质 | |
CN115033605A (zh) | 数据查询方法、装置、电子设备及存储介质 | |
CN113051171A (zh) | 接口测试方法、装置、设备及存储介质 | |
CN114547011A (zh) | 数据抽取方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40051227 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |