CN105740069A - 一种多级数据转化任务的自动调度方法 - Google Patents
一种多级数据转化任务的自动调度方法 Download PDFInfo
- Publication number
- CN105740069A CN105740069A CN201610066935.9A CN201610066935A CN105740069A CN 105740069 A CN105740069 A CN 105740069A CN 201610066935 A CN201610066935 A CN 201610066935A CN 105740069 A CN105740069 A CN 105740069A
- Authority
- CN
- China
- Prior art keywords
- task
- data
- scheduling
- server
- task scheduling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Computer And Data Communications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种多级数据转化任务的自动调度方法,该法包括:1)任务调度服务器初始化任务池;2)设置任务调度规则;3)设置任务调度机制;4)按照数据级别调度任务;5)执行数据任务;6)源端数据库服务器和目标端数据库服务器中数据同步。本发明根据基础业务数据量的大小,使每个阶段都可对基础业务数据进行轻度汇总后再同步,最大限度压缩数据收集、处理及分析的耗时,提升数据统计汇总效率。
Description
技术领域
本发明涉及任务自动调度方法,具体讲涉及一种多级数据转化任务的自动调度方法。
背景技术
国网计量生产调度平台(简称SG-MDS)需要按照省级供电单位、省级计量生产调度平台(简称MDS)的相关业务和SG-MDS统计汇总业务对相关数据进行同步和汇总。MDS系统在各省级供电单位独立运行,其产生的业务数据种类繁多、体量庞大,存在分散性、复杂性和不一致性等缺点。总部对各省级供电单位相关计量生产数据的监管要求需考虑数据收集和统计的实时性及多样性。
收集数据会对源端数据库产生较大影响,如果直接在生产数据库中收集数据,会对现场造成不可预估的影响。
如果省级供电单位均将数据同步至SG‐MDS数据库后,再进行统一的统计分析,SG‐MDS数据库则会产生较大负荷,进而影响基础业务数据统计分析的及时性和SG‐MDS系统功能的可用性和稳定性。
发明内容
为了克服现有技术的上述缺陷,本发明提出了一种多级数据转化任务的自动调度方法,包括步骤:
1)初始化任务池;2)设置任务调度规则;3)设置任务调度机制;4)按照数据级别调度任务;5)执行数据任务;6)对数据库服务器的数据同步。
所述步骤1)中:编制所述任务池的任务;任务调度服务器初始化所述任务池中的任务数据。
所述步骤2)中:所述任务调度服务器按照数据级别设置所述任务调度规则;所述任务调度规则包括:划分数据级别、划分单位级别和划分业务优先级。
所述步骤3)中:所述任务调度服务器按照数据级别设置所述任务调度机制;所述任务调度机制包括:任务执行周期、任务执行的开始时间和并行执行的任务数量。
所述步骤4)中:所述任务调度服务器按照数据级别调度任务,并按照所述任务调度规则和所述任务调度机制获取任务。
所述步骤5)中:所述任务调度服务器调入所述任务数据到所述源端数据库服务器和目标端数据库服务器。
所述步骤6)中:所述任务调度服务器实时监控任务执行进度;利用ETL工具实现所述源端数据库服务器和目标端数据库服务器中数据的同步和汇总。
若当前数据级别仍有未执行的任务时,重复步骤5)至6);若当前数据级别任务全部执行完成,仍存在下一数据级别,重复步骤4)至6)。
与现有技术比,本发明的有益效果为:
1、本发明将数据ETL的压力分散到各中间阶段的数据服务器上,使SG‐MDS数据库服务器能充分支撑系统相关功能的运行指标,同时提高数据ETL的效率,实现总部及时控制各省级供电单位生产情况;
2、本发明根据基础业务数据量的大小,使每个阶段都可对基础业务数据进行轻度汇总后再同步,最大限度压缩数据收集、处理及分析的耗时,提升数据统计汇总效率;
3、本发明根据统计分析业务统一编制数据ETL任务,实现了电力计量数据的维度清晰、关联明确和质量的集中化、统一化及简约化。
4、本发明采用任务统一、集中调度机制,实现数据转化任务的自动化调度,对扩展数据统计分析业务提供了便利的条件,保证总部对省级供电单位业务的把控和监督。
附图说明
图1为本发明的系统结构框图;
图2为本发明的方法流程图。
具体实施方式
下面结合附图对本发明作进一步详细的描述。
如图1所示的本发明包括:任务调度服务器、源端数据库服务器和目标端数据库服务器3部分。
任务调度服务器主要提供任务池初始化、调度规则设置、调度机制设置及调度任务等功能;
数据库服务器主要提供数据接口对接及数据ETL等功能;
数据库采用Oracle10gR2版本,提供数据存储服务及执行数据ETL任务等功能。
通过ETL工具调用ORACEL存储过程及定制JAVA算法实现数据的同步和数据统计。
ETL(Extraction-Transformation-Loading)负责完成数据从数据源向目标数据仓库转化的过程。
如图2所示的本发明工作流程具体步骤如下:
(1)任务调度服务器初始化数据任务池;
利用任务调度服务器初始化功能,编制ETL任务,将ETL任务置入任务池;
(2)任务调度服务器按照数据级别设置任务调度规则;
在任务调度服务器上按照数据级别设置任务调度规则,调度规则包括:按照数据所在的数据库划分数据级别;按数据所在单位划分的单位级别;按照数据所属业务及统计业务需求划分业务优先级等;
(3)任务调度服务器按照数据级别设置任务调度机制;
在任务调度服务器上按照数据级别设置任务调度机制,调度机制定义了任务执行周期、执行开始时间及并行执行的任务数量等;
(4)任务调度服务器按数据级别调度任务;
在任务调度服务器上按照数据级别调度任务,按照任务调度规则和调度机制从任务池中获取任务;
(5)、任务调度服务器执行数据ETL任务;
任务调度服务器发起数据ETL任务,将ETL任务挂载到相应的源端数据库和目标端数据库,并启动任务;
(6)数据库服务器按任务对数据进行统计分析,其包括:
(a)任务调度服务器实时监控任务执行进度;
(b)数据库服务器根据任务进行数据同步和汇总;
(c)当任务完成后按照调度规则开始下次任务调度。
当本数据级别仍有未执行的任务时,任务调度服务器按照本数据级别的调度规则调度任务进行执行,重新执行第(5)至(6)步;
当本数据级别任务全部执行完成后,存在下一数据级别时,任务调度服务器按照数据级别的调度规则调度任务进行执行,重新执行第(4)至(6)步。
源端数据库与目标端数据库一般通过Databaselink方式连接,ETL任务通过目标端数据库服务器进行同步,针对体量庞大的数据,可在源端数据库服务器上进行轻度汇总后再由目标端数据库服务器进行抽取。采用附图2所示的国网计量生产调度平台即采用多级数据转化任务自动调度方法实现对国网公司各省级供电单位的计量生产数据进行数据同步、统计分析。
针对国网计量生产调度平台,系统提供数据ETL任务初始化、调度规则设置、调度机制设置、任务调度执行等功能,通过搭建省级供电单位业务中间库、国网中间库及国网汇总库,实现各MDS系统数据到SG-MDS系统ETL及统计分析的功能。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求范围当中。
Claims (9)
1.一种多级数据转化任务的自动调度方法,其特征在于,包括步骤:
1)初始化任务池;
2)设置任务调度规则;
3)设置任务调度机制;
4)按照数据级别调度任务;
5)执行数据任务;
6)对数据库服务器的数据同步。
2.如权利要求1所述的自动调度方法,其特征在于,所述步骤1)中:
编制所述任务池的任务;
任务调度服务器初始化所述任务池中的任务数据。
3.如权利要求2所述的自动调度方法,其特征在于,所述步骤2)中:
所述任务调度服务器按照数据级别设置所述任务调度规则;
所述任务调度规则包括:划分数据级别、划分单位级别和划分业务优先级。
4.如权利要求3所述的自动调度方法,其特征在于,所述步骤3)中:
所述任务调度服务器按照数据级别设置所述任务调度机制;
所述任务调度机制包括:任务执行周期、任务执行的开始时间和并行执行的任务数量。
5.如权利要求4所述的自动调度方法,其特征在于,所述步骤4)中:
所述任务调度服务器按照数据级别调度任务,并按照所述任务调度规则和所述任务调度机制获取任务。
6.如权利要求5所述的自动调度方法,所述步骤5)中:
所述任务调度服务器调入所述任务数据到所述源端数据库服务器和目标端数据库服务器。
7.如权利要求6所述的自动调度方法,其特征在于,所述步骤6)中:
所述任务调度服务器实时监控任务执行进度;
利用ETL工具实现所述源端数据库服务器和目标端数据库服务器中数据的同步和汇总。
8.如权利要求7所述的自动调度方法,其特征在于,若当前数据级别仍有未执行的任务时,重复步骤5)至6)。
9.如权利要求7所述的自动调度方法,其特征在于,若当前数据级别任务全部执行完成,仍存在下一数据级别,重复步骤4)至6)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610066935.9A CN105740069B (zh) | 2016-01-29 | 2016-01-29 | 一种多级数据转化任务的自动调度方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610066935.9A CN105740069B (zh) | 2016-01-29 | 2016-01-29 | 一种多级数据转化任务的自动调度方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105740069A true CN105740069A (zh) | 2016-07-06 |
CN105740069B CN105740069B (zh) | 2021-09-21 |
Family
ID=56247180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610066935.9A Active CN105740069B (zh) | 2016-01-29 | 2016-01-29 | 一种多级数据转化任务的自动调度方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105740069B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107506906A (zh) * | 2017-08-02 | 2017-12-22 | 贵州工程应用技术学院 | 一种基于数据处理的任务智能调度引擎设计方法 |
CN110062028A (zh) * | 2019-03-21 | 2019-07-26 | 深圳壹账通智能科技有限公司 | 数据同步的方法、装置、计算机设备及计算机存储介质 |
CN111475312A (zh) * | 2019-09-12 | 2020-07-31 | 北京东土科技股份有限公司 | 基于实时操作系统的消息驱动方法和装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1897025A (zh) * | 2006-04-27 | 2007-01-17 | 南京联创科技股份有限公司 | 海量数据处理中多线程工作包并行的etl技术 |
CN1953490A (zh) * | 2006-09-06 | 2007-04-25 | 南京中兴软创科技有限责任公司 | 一种利用etl技术对计费数据进行抽取提供的方法 |
US20110047525A1 (en) * | 2009-08-18 | 2011-02-24 | Castellanos Maria G | Quality-driven etl design optimization |
CN102096685A (zh) * | 2009-12-11 | 2011-06-15 | 阿里巴巴集团控股有限公司 | 分布式数据同步到数据仓库的方法及装置 |
CN102236580A (zh) * | 2010-04-26 | 2011-11-09 | 阿里巴巴集团控股有限公司 | 为etl任务分配节点的方法和调度系统 |
CN202068449U (zh) * | 2011-05-20 | 2011-12-07 | 广东商学院 | 用于多级数据交换的数据交换平台 |
US20130006935A1 (en) * | 2011-06-30 | 2013-01-03 | Bmc Software Inc. | Methods and apparatus related to graph transformation and synchronization |
CN102999528A (zh) * | 2011-09-16 | 2013-03-27 | 阿里巴巴集团控股有限公司 | 一种数据仓库中etl任务离线和数据清理的方法及装置 |
CN103942324A (zh) * | 2014-04-29 | 2014-07-23 | 北京中科启信软件技术有限公司 | 数据实时同步系统及方法 |
CN104252381A (zh) * | 2013-06-30 | 2014-12-31 | 北京百度网讯科技有限公司 | 一种用于调度etl任务的方法与设备 |
CN104572257A (zh) * | 2014-07-30 | 2015-04-29 | 南京坦道信息科技有限公司 | 一种基于有限状态自动机的高并发多种类作业的统一协调调度算法 |
US20150128112A1 (en) * | 2013-11-04 | 2015-05-07 | Bank Of America Corporation | Automated Build and Deploy System |
-
2016
- 2016-01-29 CN CN201610066935.9A patent/CN105740069B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1897025A (zh) * | 2006-04-27 | 2007-01-17 | 南京联创科技股份有限公司 | 海量数据处理中多线程工作包并行的etl技术 |
CN1953490A (zh) * | 2006-09-06 | 2007-04-25 | 南京中兴软创科技有限责任公司 | 一种利用etl技术对计费数据进行抽取提供的方法 |
US20110047525A1 (en) * | 2009-08-18 | 2011-02-24 | Castellanos Maria G | Quality-driven etl design optimization |
CN102096685A (zh) * | 2009-12-11 | 2011-06-15 | 阿里巴巴集团控股有限公司 | 分布式数据同步到数据仓库的方法及装置 |
CN102236580A (zh) * | 2010-04-26 | 2011-11-09 | 阿里巴巴集团控股有限公司 | 为etl任务分配节点的方法和调度系统 |
CN202068449U (zh) * | 2011-05-20 | 2011-12-07 | 广东商学院 | 用于多级数据交换的数据交换平台 |
US20130006935A1 (en) * | 2011-06-30 | 2013-01-03 | Bmc Software Inc. | Methods and apparatus related to graph transformation and synchronization |
CN102999528A (zh) * | 2011-09-16 | 2013-03-27 | 阿里巴巴集团控股有限公司 | 一种数据仓库中etl任务离线和数据清理的方法及装置 |
CN104252381A (zh) * | 2013-06-30 | 2014-12-31 | 北京百度网讯科技有限公司 | 一种用于调度etl任务的方法与设备 |
US20150128112A1 (en) * | 2013-11-04 | 2015-05-07 | Bank Of America Corporation | Automated Build and Deploy System |
CN103942324A (zh) * | 2014-04-29 | 2014-07-23 | 北京中科启信软件技术有限公司 | 数据实时同步系统及方法 |
CN104572257A (zh) * | 2014-07-30 | 2015-04-29 | 南京坦道信息科技有限公司 | 一种基于有限状态自动机的高并发多种类作业的统一协调调度算法 |
Non-Patent Citations (2)
Title |
---|
JIE ZHANG ET AL: "The Research in Improving the Quality of DW Data: The Job-Scheduling and Checking Based Program in Upgrading DW Performance", 《2009 5TH INTERNATIONAL CONFERENCE ON WIRELESS COMMUNICATIONS, NETWORKING AND MOBILE COMPUTING》 * |
霍卓群: "基于实时资源状况和代价分析的ETL动态调整研究", 《南阳理工学院学报》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107506906A (zh) * | 2017-08-02 | 2017-12-22 | 贵州工程应用技术学院 | 一种基于数据处理的任务智能调度引擎设计方法 |
CN110062028A (zh) * | 2019-03-21 | 2019-07-26 | 深圳壹账通智能科技有限公司 | 数据同步的方法、装置、计算机设备及计算机存储介质 |
CN111475312A (zh) * | 2019-09-12 | 2020-07-31 | 北京东土科技股份有限公司 | 基于实时操作系统的消息驱动方法和装置 |
CN111475312B (zh) * | 2019-09-12 | 2021-05-18 | 北京东土科技股份有限公司 | 基于实时操作系统的消息驱动方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN105740069B (zh) | 2021-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107402976B (zh) | 一种基于多元异构模型的电网多源数据融合方法及系统 | |
CN102750406B (zh) | 一种基于模型集和差异模型的电网模型多版本管理方法 | |
CN101944114B (zh) | 内存数据库和物理数据库间的数据同步方法 | |
CN102508709B (zh) | 购供售一体化电能量采集与监控系统中基于分布式缓存的采集任务调度方法 | |
CN105740069A (zh) | 一种多级数据转化任务的自动调度方法 | |
CN109325008A (zh) | 面向消息中间件的跨域数据同步方法与系统 | |
CN102955977A (zh) | 一种基于云技术的能效服务方法及其能效服务平台 | |
CN101571861A (zh) | 一种对数据表进行转换的方法及装置 | |
CN101639687B (zh) | 一种集成化工艺质量控制系统及其实现方法 | |
CN102722355A (zh) | 基于工作流机制的并发式etl转换方法 | |
CN109617099B (zh) | 一种虚拟储能协调控制系统及其方法 | |
CN102118261A (zh) | 一种数据采集的方法、数据采集装置及网管设备 | |
CN104599032A (zh) | 一种面向资源管理的分布式内存电网构建方法及系统 | |
CN109933565A (zh) | 一种多尺度海量遥感影像的快速切片方法及系统 | |
CN101794299A (zh) | 一种历史数据管理的增量定义、处理方法 | |
CN103440531A (zh) | 计及风电场风机运行状态的风电场短期风电功率预测系统 | |
CN111428895A (zh) | 一种智能电表故障诊断支撑中心 | |
CN105574032A (zh) | 规则匹配运算方法及装置 | |
CN102999528A (zh) | 一种数据仓库中etl任务离线和数据清理的方法及装置 | |
CN110751382A (zh) | 一种高效能源互联网的运行系统 | |
CN101692737B (zh) | 一种面向移动rfid的轻量级数据同步系统及同步方法 | |
CN111898052B (zh) | 一种轻量化bim模型的web端在线显示方法 | |
CN104346441A (zh) | 一种配电网信息数据动态集成交互方法 | |
CN114707948A (zh) | 大型测绘生产项目的管理方法、装置及存储介质 | |
CN116646987A (zh) | 多资源协同调度方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |