CN105426440A - 一种基于数据库的异构型数据批量同步方法 - Google Patents

一种基于数据库的异构型数据批量同步方法 Download PDF

Info

Publication number
CN105426440A
CN105426440A CN201510749519.4A CN201510749519A CN105426440A CN 105426440 A CN105426440 A CN 105426440A CN 201510749519 A CN201510749519 A CN 201510749519A CN 105426440 A CN105426440 A CN 105426440A
Authority
CN
China
Prior art keywords
data
database
sub
job
synchronization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510749519.4A
Other languages
English (en)
Other versions
CN105426440B (zh
Inventor
张羿
赵志宇
孙北宁
李姝义
黄丁
杨思坚
赵毅涛
张志生
张莉娜
颜丽渊
郑研
赵涓
吴清华
冯玉喜
张�浩
任莹
李申章
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunnan Power Grid Co Ltd
Kunming Enersun Technology Co Ltd
Original Assignee
Yunnan Power Grid Co Ltd
Kunming Enersun Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunnan Power Grid Co Ltd, Kunming Enersun Technology Co Ltd filed Critical Yunnan Power Grid Co Ltd
Priority to CN201510749519.4A priority Critical patent/CN105426440B/zh
Publication of CN105426440A publication Critical patent/CN105426440A/zh
Application granted granted Critical
Publication of CN105426440B publication Critical patent/CN105426440B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于数据库的异构型数据批量同步方法,其特征在于,在系统计算资源有限的情况下,充分利用数据库管理软件的自身技术与接口,原子化实现异构类型数据同步单元,借助操作先来先服务调度算法(FCFS)执行批量并行同步,本发明的有益效果是:本发明是在信息系统计算资源有限的情况下,充分利用数据库管理软件的自身技术,利用操作系统先来先服务调度算法(FCFS),实现异构类型数据的批量并行同步方式。本发明是利用数据库自身的Database?link机制,升级JOB作业管理机制,实现动态批量的管理元子级的异构类型的数据同步过程执行数据同步,保证整个异构数据类型系统的数据一致性和完整性。

Description

一种基于数据库的异构型数据批量同步方法
技术领域
本发明属信息系统构建方法,尤其是一种基于数据库的异构型数据批量同步方法。
技术背景
随着信息化建设程度不断提升,各业务领域系统之间要求实现数据共享,消除信息孤单,以到达信息数据的最大化应用,统一构成分布式部署的综合系统,不同子系统之间数据结构各异,要保证子系统间数据的一致性和正确性,实现同构数据的批量同步成为了综合系统建设的技术。
成熟的ETL工具,更多的关注与数据同步过程,能够快速有效的实现数据同步的图形定制化配置,多线程同步的管理机制,但是不能嵌入数据所在的平台本身,通过分析系统前后台任务执行所需的资源利用率,实现系统自身资源利用率的平衡,而本发明正好是这一缺陷的补充。
在综合系统计算资源投入有限的情况下,充分的利用数据库管理软件自身技术机制,实现异构数据大批量的高效同步,满足综合系统应用的需求,能有效减少系统技术的复杂度,同时也具有非常良好的经济效益。
发明内容
本发明的目的正是为了克服上述现有技术存在的缺陷而提供一种基于数据库的异构型数据批量同步方法,本发明方法是在信息系统计算资源有限的情况下,充分利用数据库管理软件的自身技术,利用操作系统先来先服务调度算法(FCFS),实现异构类型数据的批量并行同步方式。
本发明方法是通过如下技术方案来实现的:
一种基于数据库的异构型数据批量同步方法,其特征在于,在系统计算资源有限的情况下,充分利用数据库管理软件的自身技术与接口,原子化实现异构类型数据同步单元,借助操作先来先服务调度算法(FCFS)执行批量并行同步,主要采用以下步骤和技术、算法实现:
(1)、建立子系统底层数据库之间的连接
建立网络链路,实现子系统数据库服务器之间的通信链路;利用数据库Databaselink技术,实现数据库之间相互访问连接;在此通过数据库权限的授予和限制,实现子系统内私有数据和公有数据的安全保护。
(2)、封装元子级的数据转换同步过程
结合子系统间异构数据同步的需求,按照数据转换同步的业务逻辑,封装出用于异构数据转换同步的最小元子级(Metadata)的同步存储过程;最小元子级同步过程需要充分的考虑异构数据对应的差异,利用数据库自身的临时表与缓存机制,降低内存的压力;按照数据库数据存储的原理,设计最小步骤的转换过程与转化的算法,提高数据同步过程中增、删、改、查等操作的性能,从而达到整体提高同步性能的目的。
(3)、建立作业任务调度控制过程
基于数据库自身的JOB任务管理机制,和数据库运行状态监控技术,采用先进先出的作业调度算法,建立同步作业调度控制过程;实现调度过程能够实时的根据数据库运行的状态和资源利用率,动态的设置负责执行元子同步过程的JOB数量,从而保证系统前端应用的应用性能,亦保证异构数据批量高效的同步,达到重复利用数据库硬件资源的目的;异构数据批量同步的控制流程:
步骤一:创建用于任务调度分配的主JOB,采用蚁群研究中“秩序即是高效”规律设计JOB的控制机制,通过分析系统的资源的利用率,达到控制子JOB数量和执行频率的目的,从而充分提高同步作业的整体效率;此步骤中为了能够在后面的执行过程中有限的监管数据同步过程,在此处还需加入数据同步监督管理逻辑,用于监控数据库软硬件负载情况,及元子的同步过程运行的详细信息。
步骤二:按照异构数据同步需求及数据规模设计元子同步过程,元子同步过程之间要消除前后的依赖,保证能够并发运行而不影响数据同步的目标。并将元子同步过程,注册进入调度列表中;
步骤三:主JOB按照设计好的调度机制,启动创建子JOB,执行最小元子同步过程。按照同步频率的需求,调整循环同步的周期,从而实现异构型数据的高效同步;
(4)注册元子同步过程进入调度控制过程
完成以上三个步骤,将元子同步过程注册进入调度控制过程,完成调度控制过程对元子同步过程的动态管理和执行。元子同步过程的执行,并不一定完全按照既定的逻辑执行,而是由主JOB根据当前的系统资源利用率相关信息动态分配,达到控制子JOB数量和执行频率的目的,从而充分提高同步作业的整体效率。
(5)监管异构数据同步过程
本阶段加入独立于同步过程的分析控制逻辑,通过分析“作业任务调度控制过程”记录系统运行数据、及元子的同步过程运行的详细数据,明确的指导调整数据库系统配置参数,结合系统服务应用的时间周期规律,及时的调整子过程调度的频率、数量、资源配额等参数,实现同步过程最高效的同步,同时不影响系统前端服务运用的效率与并发量。
本发明的有益效果是:本发明是在信息系统计算资源有限的情况下,充分利用数据库管理软件的自身技术,利用操作系统先来先服务调度算法(FCFS),实现异构类型数据的批量并行同步方式。本发明是利用数据库自身的Databaselink机制,升级JOB作业管理机制,实现动态批量的管理元子级的异构类型的数据同步过程执行数据同步,保证整个异构数据类型系统的数据一致性和完整性。
附图说明
图1为本发明异构数据批量同步的控制流程图;
图2为JOB控制调度作业执行效果图。
具体实施方式
见图1,图2,一种基于数据库的异构型数据批量同步方法,本发明特征在于,通过采用以下技术和算法实现:
(1)、建立子系统底层数据库之间的连接
建立网络链路,实现子系统数据库服务器之间的通信链路;利用数据库Databaselink技术,实现数据库之间相互访问连接;在此通过数据库权限的授予和限制,实现子系统内私有数据和公有数据的安全保护;
(2)、封装元子级的数据转换同步过程
结合子系统间异构数据同步的需求,按照数据转换同步的业务逻辑,封装出用于异构数据转换同步的最小单元的存储过程;元子级同步过程需要充分的考虑异构数据对应的差异,和转化的算法优化,提高数据同步过程中增删改查等操作的性能;
(3)、建立作业任务调度控制过程
基于数据库自身的JOB任务管理机制,和数据库运行状态监控技术,采用先进先出的作业调度算法,建立同步作业调度控制过程;实现调度过程能够实时的根据数据库运行的状态和资源利用率,动态的设置负责执行元子同步过程的JOB数量,从而保证系统前端应用的应用性能,亦保证异构数据批量高效的同步,达到重复利用数据库硬件资源的目的;异构数据批量同步的控制流程:
步骤一:创建用于任务调度分配的主JOB,采用蚁群研究中“秩序即是高效”规律设计JOB的控制机制,通过分析系统的资源的利用率,达到控制子JOB数量和执行频率的目的,从而充分提高同步作业的整体效率;
步骤二:按照异构数据同步需求及数据规模设计元子同步过程,元子同步过程之间要消除前后的依赖,保证能够并发运行而不影响数据同步的目标。并将元子同步过程,注册进入调度列表中;
步骤三:主JOB按照设计好的调度机制,启动创建子job,执行元子同步过程。按照同步频率的需求,调整循环同步的周期,从而实现异构型数据的高效同步;
(4)注册元子同步过程进入调度控制过程
完成以上三个步骤,将元子同步过程注册进入调度控制过程,完成调度控制过程对元子同步过程的动态管理和执行。元子同步过程的执行,并不一定完全按照既定的逻辑执行,而是由主JOB根据当前的系统资源利用率相关信息动态分配,达到控制子JOB数量和执行频率的目的,从而充分提高同步作业的整体效率。

Claims (1)

1.一种基于数据库的异构型数据批量同步方法,其特征在于,在系统计算资源有限的情况下,充分利用数据库管理软件的自身技术与接口,原子化实现异构类型数据同步单元,借助操作先来先服务调度算法(FCFS)执行批量并行同步,主要采用以下步骤和技术、算法实现:
(1)、建立子系统底层数据库之间的连接
建立网络链路,实现子系统数据库服务器之间的通信链路;利用数据库Databaselink技术,实现数据库之间相互访问连接;在此通过数据库权限的授予和限制,实现子系统内私有数据和公有数据的安全保护;
(2)、封装元子级的数据转换同步过程
结合子系统间异构数据同步的需求,按照数据转换同步的业务逻辑,封装出用于异构数据转换同步的最小元子级(Metadata)的同步存储过程;最小元子级同步过程需要充分的考虑异构数据对应的差异,利用数据库自身的临时表与缓存机制,降低内存的压力;按照数据库数据存储的原理,设计最小步骤的转换过程与转化的算法,提高数据同步过程中增、删、改、查等操作的性能,从而达到整体提高同步性能的目的;
(3)、建立作业任务调度控制过程
基于数据库自身的JOB任务管理机制,和数据库运行状态监控技术,采用先进先出的作业调度算法,建立同步作业调度控制过程;实现调度过程能够实时的根据数据库运行的状态和资源利用率,动态的设置负责执行元子同步过程的JOB数量,从而保证系统前端应用的应用性能,亦保证异构数据批量高效的同步,达到重复利用数据库硬件资源的目的;异构数据批量同步的控制流程:
步骤一:创建用于任务调度分配的主JOB,采用蚁群研究中“秩序即是高效”规律设计JOB的控制机制,通过分析系统的资源的利用率,达到控制子JOB数量和执行频率的目的,从而充分提高同步作业的整体效率;此步骤中为了能够在后面的执行过程中有限的监管数据同步过程,在此处还需加入数据同步监督管理逻辑,用于监控数据库软硬件负载情况,及元子的同步过程运行的详细信息;
步骤二:按照异构数据同步需求及数据规模设计元子同步过程,元子同步过程之间要消除前后的依赖,保证能够并发运行而不影响数据同步的目标,并将元子同步过程,注册进入调度列表中;
步骤三:主JOB按照设计好的调度机制,启动创建子JOB,执行最小元子同步过程,按照同步频率的需求,调整循环同步的周期,从而实现异构型数据的高效同步;
(4)注册元子同步过程进入调度控制过程
完成以上三个步骤,将元子同步过程注册进入调度控制过程,完成调度控制过程对元子同步过程的动态管理和执行,元子同步过程的执行,并不一定完全按照既定的逻辑执行,而是由主JOB根据当前的系统资源利用率相关信息动态分配,达到控制子JOB数量和执行频率的目的,从而充分提高同步作业的整体效率;
(5)监管异构数据同步过程
本阶段加入独立于同步过程的分析控制逻辑,通过分析“作业任务调度控制过程”记录系统运行数据、及元子的同步过程运行的详细数据,明确的指导调整数据库系统配置参数,结合系统服务应用的时间周期规律,及时的调整子过程调度的频率、资源配额等参数,实现同步过程最高效的同步,同时不影响系统前端服务运用的效率与并发量。
CN201510749519.4A 2015-11-06 2015-11-06 一种基于数据库的异构型数据批量同步方法 Active CN105426440B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510749519.4A CN105426440B (zh) 2015-11-06 2015-11-06 一种基于数据库的异构型数据批量同步方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510749519.4A CN105426440B (zh) 2015-11-06 2015-11-06 一种基于数据库的异构型数据批量同步方法

Publications (2)

Publication Number Publication Date
CN105426440A true CN105426440A (zh) 2016-03-23
CN105426440B CN105426440B (zh) 2018-07-27

Family

ID=55504652

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510749519.4A Active CN105426440B (zh) 2015-11-06 2015-11-06 一种基于数据库的异构型数据批量同步方法

Country Status (1)

Country Link
CN (1) CN105426440B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107770038A (zh) * 2016-08-22 2018-03-06 平安科技(深圳)有限公司 消息发送方法和装置
CN110187869A (zh) * 2019-05-14 2019-08-30 上海直真君智科技有限公司 一种大数据异构存储计算模型间的统一互操作系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060190500A1 (en) * 2005-02-22 2006-08-24 Microsoft Corporation Synchronization with derived metadata
CN1878166A (zh) * 2005-06-07 2006-12-13 联想(北京)有限公司 异构数据源同步方法及其设备
CN103605698A (zh) * 2013-11-06 2014-02-26 广东电子工业研究院有限公司 一种用于分布异构数据资源整合的云数据库系统
CN103617176A (zh) * 2013-11-04 2014-03-05 广东电子工业研究院有限公司 一种实现多源异构数据资源自动同步的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060190500A1 (en) * 2005-02-22 2006-08-24 Microsoft Corporation Synchronization with derived metadata
CN1878166A (zh) * 2005-06-07 2006-12-13 联想(北京)有限公司 异构数据源同步方法及其设备
CN103617176A (zh) * 2013-11-04 2014-03-05 广东电子工业研究院有限公司 一种实现多源异构数据资源自动同步的方法
CN103605698A (zh) * 2013-11-06 2014-02-26 广东电子工业研究院有限公司 一种用于分布异构数据资源整合的云数据库系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107770038A (zh) * 2016-08-22 2018-03-06 平安科技(深圳)有限公司 消息发送方法和装置
CN107770038B (zh) * 2016-08-22 2020-01-21 平安科技(深圳)有限公司 消息发送方法和装置
CN110187869A (zh) * 2019-05-14 2019-08-30 上海直真君智科技有限公司 一种大数据异构存储计算模型间的统一互操作系统及方法
CN110187869B (zh) * 2019-05-14 2020-09-01 上海直真君智科技有限公司 一种大数据异构存储计算模型间的统一互操作系统及方法

Also Published As

Publication number Publication date
CN105426440B (zh) 2018-07-27

Similar Documents

Publication Publication Date Title
US10191529B2 (en) Real-time data management for a power grid
CN104915407A (zh) 一种基于Hadoop多作业环境下的资源调度方法
CN109189589A (zh) 一种分布式大数据计算引擎及架构方法
CN109670199B (zh) 一种高效的电网拓扑分析方法及装置
CN108400992B (zh) 一种流式通信数据协议解析软件框架实现系统及方法
CN100573457C (zh) 一种金融数据实现etl加工的方法和系统
CN103944769A (zh) 基于rpc协议的集群资源统一管理系统
CN104050042A (zh) Etl作业的资源分配方法及装置
CN112445598B (zh) 一种基于quartz的任务调度方法、装置、电子设备以及介质
CN111327692A (zh) 模型训练方法、装置及集群系统
CN103873534A (zh) 一种应用集群迁移方法及装置
CN115374102A (zh) 数据处理方法及系统
WO2015047302A1 (en) Processing a hybrid flow associated with a service class
Bedini et al. Modeling performance of a parallel streaming engine: bridging theory and costs
CN109936471A (zh) 一种多集群的资源分配方法和装置
CN105426440A (zh) 一种基于数据库的异构型数据批量同步方法
CN104410511A (zh) 一种服务器管理方法及系统
Amoretti et al. Efficient autonomic cloud computing using online discrete event simulation
Theeten et al. Towards the optimization of a parallel streaming engine for telco applications
CN112486666A (zh) 一种模型驱动的参考架构方法及平台
CN110134533B (zh) 一种可批量调度数据的系统及方法
Pham A big data analytics framework for IoT applications in the cloud
CN104484230A (zh) 基于近数据计算原则的多卫星数据中心工作流调度算法
CN114090201A (zh) 资源调度方法、装置、设备及存储介质
CN103577424A (zh) 分布式数据库视图的实现方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant