CN103810258A - 基于数据仓库的数据汇聚调度方法 - Google Patents
基于数据仓库的数据汇聚调度方法 Download PDFInfo
- Publication number
- CN103810258A CN103810258A CN201410037541.1A CN201410037541A CN103810258A CN 103810258 A CN103810258 A CN 103810258A CN 201410037541 A CN201410037541 A CN 201410037541A CN 103810258 A CN103810258 A CN 103810258A
- Authority
- CN
- China
- Prior art keywords
- task
- data
- cloud
- group
- convergence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 230000002776 aggregation Effects 0.000 title abstract 9
- 238000004220 aggregation Methods 0.000 title abstract 9
- 230000008569 process Effects 0.000 claims abstract description 29
- 238000012545 processing Methods 0.000 claims abstract description 10
- 230000000977 initiatory effect Effects 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 10
- 230000008034 disappearance Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 235000014161 Caesalpinia gilliesii Nutrition 0.000 description 1
- 244000003240 Caesalpinia gilliesii Species 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于数据仓库的数据汇聚调度方法,该方法包括:开启调度任务中的主任务进程;所述主任务进程根据数据源的属性信息启动第一相关任务云中的第一任务云;所述第一任务云对本地的第一任务组进行遍历,从所述第一任务组中选择满足汇聚条件的表组成第一组表;将所述第一组表并行汇聚处理得到汇聚表;当所述汇聚表的可信度发生变化时,则创建汇聚子任务进行记录所述汇聚表信息;标记所述第一任务组实例状态。本发明通过任务模型配置可以最大化地利用数据库资源,并在数据缺失时及时发出告警,通过数据戳快速定位问题根源。
Description
技术领域
本发明涉及数据仓库,特别是涉及一种基于数据仓库的数据汇聚调度方法。
背景技术
数据仓库主要有数据缓存层、基础数据层、数据仓库层和数据集市层组成。现有的数据仓库的数据处理方式普遍采用的是周期轮询和定时作业。即ETL将数据装载至数据存储层或者基础数据层;定时作业将数据抽取、汇聚至数据仓库层;根据业务需求从数据仓库层汇聚至数据集市层。而对于装载延时或数据缺失时通常是采用某个时间点来汇聚前面几个周期的数据。
现在技术存在以下几个问题:在遇到接口数据缺失、数据装载延时或者其它导致数据无法及时装载入库的问题时,由于汇聚程序是依赖定时、周期的作业驱动,从而无法及时得到消息仍然继续定时汇聚数据,导致上层数据缺失;由于ETL装载程序和汇聚程序脱节,没有及时有效的消息传递导致上层的数据缺失,通常是问题发生了一段时间之后,才由用户反应数据缺失,造成用户体验很差;为了弥补数据缺失问题,现有方案通常是某个时间点汇聚前面几个周期的数据,这样做了很多重复的工作,很大程度的浪费了数据库资源;由于数据仓库本身就具有多接口数据源、汇聚表间的依赖关系层次较深、数据处理有大量的并发任务等特点,而目前常用的方案由于ETL和汇聚之间没有有效的消息传递导致数据质量无法及时的捕获到异常情况,在问题溯源时只能通过人工排查,效率非常低下;并且对汇聚任务无法进行合理灵活的组织,导致数据库资源资源经常得不到充分合理的利用。
针对现有技术的数据仓库的装载延时或数据缺失等问题,需要建立一种新的基于数据仓库的数据汇聚调度方法。
发明内容
本发明的目的是为了解决接口数据缺失、数据装载延时导致数据无法及时装载入库的问题。
为实现上述目的,本发明提供了一种基于数据仓库的数据汇聚调度方法,其特征在于,所述方法包括:
开启调度任务中的主任务进程;
所述主任务进程根据数据源的属性信息启动第一相关任务云中的第一任务云;
所述第一任务云对本地的第一任务组进行遍历,从所述第一任务组中选择满足汇聚条件的表组成第一组表;
将所述第一组表并行汇聚处理得到汇聚表;
当所述汇聚表的可信度发生变化时,则创建汇聚子任务进行记录所述汇聚表信息;
标记所述第一任务组实例状态。
进一步地,所述方法还包括:数据装载程序将数据源在数据缓存层进行装载。
进一步地,所述方法还包括:所述数据装载程序通过校验标准接口获取所述数据源的属性信息。
进一步地,当所述汇聚表的可信度没有发生变化时,则标记所述第一任务组实例状态。
进一步地,所述第一任务云还包括第二任务组,所述方法还包括:
启动所述第二任务组;
所述第一任务云对本地的第二任务组进行遍历,从所述第二任务组中选择满足汇聚条件的表组成第二组表;
将所述第二组表并行汇聚处理得到汇聚表;
当所述汇聚表的可信度发生变化时,则创建汇聚子任务进行记录所述汇聚表信息;
标记所述第二任务组实例状态。
进一步地,所述第一相关任务云还包括第二任务云,所述方法还包括:
如果所述第一任务云和所述第二任务云在节点处汇合,则所述第一相关任务云遍历结束。
进一步地,所述方法还包括:所述主任务进程启动所述第二相关任务云。
进一步地,所述数据源属性信息包括:接口记录数、成功状态、数据粒度、数据戳。
进一步地,当所述第一任务云和第二任务云的所述数据源的属性信息相关时,同时启动所述第一任务云和第二任务云。
进一步地,具体的,还包括,利用所述数据戳查找数据缺失和提高补汇数据效率。
本发明的优点为:
1、本发明基于数据可信度,由任务自行触发其它关联任务,一个数据源接口的异动会自动触发汇聚所有由该接口影响的数据表,不需要人工干预,通过合理的任务模型配置可以最大可能的避免高峰期数据库资源使用瓶颈,将数据库资源科学的最大化利用;
2、可以在数据缺失时及时发出告警,并可以通过数据戳快速定位问题根源。
附图说明
图1为本发明实施例提供的基于数据仓库的数据汇聚调度方法流程图;
图2为本发明实施例提供的调度方法流程图;
图3为本发明实施例提供的任务模型示意图;
图4为本发明实施例提供的数据可信度流程图;
图5为本发明实施例提供的数据戳结构示意图;
图6为本发明实施例提供的任务调度流程图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
图1为本发明实施例提供的基于数据仓库的数据汇聚调度方法流程图。如图1所示,该方法包括以下步骤:
步骤101,开启调度任务中的主任务进程。
进一步地,在步骤101之前,该方法还包括:数据装载程序将数据源在数据缓存层进行装载;数据装载程序通过校验标准接口获取数据源的属性信息。数据源属性信息包括:接口记录数、成功状态、数据粒度、数据戳。利用数据戳查找数据缺失和提高补汇数据效率。
步骤102,主任务进程根据数据源的属性信息启动第一相关任务云中的第一任务云。
步骤103,第一任务云对本地的第一任务组进行遍历,从第一任务组中选择满足汇聚条件的表组成第一组表。
步骤104,将第一组表并行汇聚处理得到汇聚表。
步骤105,当汇聚表的可信度发生变化时,则创建汇聚子任务进行记录所述汇聚表信息。
进一步地,当汇聚表的可信度没有发生变化时,则标记第一任务组实例状态。
步骤106,标记第一任务组实例状态。
进一步地,第一任务云还包括第二任务组,该方法还包括:
启动第二任务组;
第一任务云对本地的第二任务组进行遍历,从第二任务组中选择满足汇聚条件的表组成第二组表;
将第二组表并行汇聚处理得到汇聚表;
当汇聚表的可信度发生变化时,则创建汇聚子任务进行记录汇聚表信息;
标记第二任务组实例状态。
进一步地,第一相关任务云还包括第二任务云,当第一任务云和第二任务云的数据源的属性信息相关时,同时启动第一任务云和第二任务云,如果第一任务云和第二任务云在节点处汇合,则第一相关任务云遍历结束。
进一步地,主任务进程启动第二相关任务云,该方法包括:
开启调度任务中的主任务进程;
主任务进程根据数据源的属性信息启动第二相关任务云中的第三任务云;
第三任务云对本地的第三任务组进行遍历,从第三任务组中选择满足汇聚条件的表组成第三组表;
将第三组表并行汇聚处理得到汇聚表;
当汇聚表的可信度发生变化时,则创建汇聚子任务进行记录汇聚表信息;
标记第三任务组实例状态。
图2为本发明实施例提供的调度方法流程图。如图2所示,该方法包括以下步骤:
步骤201,数据装载程序在装载完接口数据源后,通过校验标准的接口规格记录接口的记录数、成功状态、数据粒度、数据时间戳等属性消息;
步骤202,将数据源的属性消息装载成日志,并存入日志管理中。
步骤203,调度程序在启动后会读取该消息,从数据处理程序中调用汇聚程序并遍历任务模型,启动将满足汇聚条件的汇聚任务,并记录完整的汇聚和告警日志,存入日志管理中。
步骤204,数据处理程序将自己完整的汇聚程序日志也存入日志管理中。
该调度方法的基本原理为:将不同的数据元素按照一定的逻辑组织起来,通过各汇聚表的相互制约关系来达到各任务的联动,将任务按照一定的逻辑和功能组合成一个完整的任务模型,形成一个完备的自循环与自我修复调度系统。可以最大程度的实现自动、智能、快速的数据处理和数据补汇功能,通过合理的任务配置可以在空间上将数据库性能发挥到最大化。
图3为本发明实施例提供的任务模型示意图。如图3所示,该任务模型包括:主任务进程、任务云、任务组和子任务。
该任务模型的执行步骤为:
步骤301,启动主任务进程,主任务进程会根据配置信息启动多个相关的任务云;
步骤302,当某一任务云启动后,任务云会从指定组开始逐一遍历每一组表,并将满足汇聚条件的同组表并行汇聚,形成汇聚表。
步骤303,判断汇聚表当前的可信度和上次相比是否发生变化,如果发生变化则表示源数据发生变化,并创建汇聚子任务。
步骤304,汇聚子任务完成后,判断该任务云中是否还有下一组任务,如果有,则继续完成下一组任务,如果没有,则继续下一任务云。
该任务模型中的各个模型所起的作用如下:
调度主任务:每一次调度任务被启动时,会启动一个主任务进程,主任务会根据配置信息,启动多个相关的任务云,每朵任务云相当于一个独立的进程,但会在某一个节点处汇合,表示同级任务云到此节点处结束,然后会由主任务进程启动新的相关任务云,由此循环直到本轮调度任务完全结束;
任务云:每一朵任务云被启动时,标志着一阶段内可以完全独立运行的汇聚任务开始运行,从设定的组开始启动相应的组任务,由此循环直到运行至设定的节点处,此任务云将结束生命周期,等待其它同级任务云运行结束,然后会由主任务进程启动新的相关任务云进程;
任务组:为了避免在多任务并行执行时任务间可能存在资源利用冲突的情况,即多个任务同时运行时,可能存在对某张表或某个资源同时征用的情况,在调度程序中引入了组的概念,即将没有依赖关系的表分为同一组,并行汇聚,当某个任务云启动时,会从指定组开始逐一遍历每一组表,将满足汇聚条件的同组表并行汇聚,待本组表遍历完成判断是否存在下一组表,再执行后续任务,这样既从根本上杜绝了多任务并行执行时可能造成的冲突,提高调度程序的稳定性;
子任务:在每一组任务被启动时,会逐一遍历该组的每个汇聚表,从起始日期开始扫描,判断汇聚表当前的可信度和上次相比是否发生变化,如果有则表示源数据发生变化,会创建具体的汇聚子任务,每个被遍历过的汇聚表状态会被记录,当当前组每个汇聚表被遍历完成时会检查后续任务。每个子任务会在被启动后会有自己独立的完整的告警和调度日志记录,具体的数据处理程序会有自己的完整的汇聚日志记录,保证了任务的隔离性。
图4为本发明实施例提供的数据可信度流程图。如图4所示,表A的源表由B、C、D三个表组成,其中B为主表,C和D为次表。
该数据可信度包括以下步骤:
步骤401,当主表到位时,次表C和D还没有到位,等待一段时间后,如果次表还没有到位,就先对A表数据进行汇聚以满足上层数据需求,此处的A表数据在该时间点的可信度将由它的源表的可信度通过算法计算得出。
步骤402,当下一周期对A表进行扫描时,判断A表的源表是否增加,如果增加,则说明C和D表到位,会重新计算可信度。
图5为本发明实施例提供的数据戳结构示意图。如图5所示,数据戳是一个以表数据的构成为基础的元素集合,它由以下几部分组成:基础物理字段;时间粒度,它是将小时、天和月等粒度分别建成多张表,这些表有利于提高汇聚效率;可信度。
本实施例提供的每个粒度下数据源的分布计划模型为:A1表20130812的天粒度数据由B1、C1两个表的20130812小时粒度数据汇聚而成;A2表201307月份的月数据由B2、C2的201307月份天粒度数据和D2表201307月份月粒度数据汇聚而成。
在图5中,A表20130801的天粒度数据由B1的201308月份月粒度数据、B2的201307月份月粒度数据和B3的201308月份天粒度数据、B4的201308月份天粒度数据汇聚而成。
由此可以得出数据戳的形成原理,其中,每个源表都有两部分组成,一个是源表,一个是目标表,它们形成了一个完整的数据地图。数据地图可以用来表示和追溯某个时间维度的数据产生的完整路径,这样可以便于查找数据缺失的原因和提高补汇数据效率。
图6为本发明实施例提供的任务调度流程图。如图6所示,该任务调度包括以下步骤:
步骤601,创建调度任务,可以手动启动调度任务,也可以在一轮调度任务完成后,自动创建下一个调度任务,转到步骤602。
步骤602,判断是否有任务存在,如果没有任务存在,转到步骤603;如果有任务存在,判断是否正在运行,如果没有任务运行,转到步骤604。
步骤603,启动调度任务,转到步骤605。
步骤604,修改启动时间及参数,当到达启动时间时,转到步骤603。
步骤605,创建主任务实例,并循环创建根任务云,转到步骤606。
步骤606,查看父级任务云是否到位,如果到位,创建任务云实例,转到步骤607。
步骤607,创建任务组实例,转到步骤608。
步骤608,循环创建子任务实例,转到步骤609和步骤610。
步骤609,汇聚子任务,转到步骤611。
步骤610,检查子任务。
步骤611,对汇聚子任务初始化,检查是否触发汇聚日期,如果是,转到步骤612。
步骤612,检查主父表是否到位,如果到位,转到步骤713;如果不到位,转到步骤616。
步骤613,检查是否汇聚过,如果是,转到步骤614;如果不是,转到步骤615。
步骤614,检查可信度变化,如果发生变化,转到步骤615;如果没有发生变化,转到步骤617。
步骤615,汇聚子任务,转到步骤616。
步骤616,汇聚子任务完成后,标记任务实例状态,转到步骤617;
步骤617,检查同组其他任务是否遍历完成,如果是,转到步骤618。
步骤618,标记任务组实例状态,检查是否还有下一组任务,转到步骤619。
步骤619,如果有,转到步骤620;如果没有,转到步骤621。
步骤620,启动下一个任务组,转到步骤607。
步骤621,该任务云完成遍历,检查该任务云是否是叶子云,如果不是,转到步骤622;如果是,转到步骤623。
步骤622,循环创建子任务云,转到步骤606;
步骤623,检查所有叶子云是否完成遍历,如果完成遍历,转到步骤624。
步骤624,检查所有叶子云是否遍历到最大日期,转到步骤625。
步骤625,如果不是,转到步骤626;如果是,转到步骤627。
步骤626,启动新一天的主任务,转到步骤605。
步骤627,所有任务出口,转到步骤601。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于数据仓库的数据汇聚调度方法,其特征在于,所述方法包括:
开启调度任务中的主任务进程;
所述主任务进程根据数据源的属性信息启动第一相关任务云中的第一任务云;
所述第一任务云对本地的第一任务组进行遍历,从所述第一任务组中选择满足汇聚条件的表组成第一组表;
将所述第一组表并行汇聚处理得到汇聚表;
当所述汇聚表的可信度发生变化时,则创建汇聚子任务进行记录所述汇聚表信息;
标记所述第一任务组实例状态。
2.根据权利要求1所述的基于数据仓库的数据汇聚调度方法,其特征在于,所述方法还包括:数据装载程序将数据源在数据缓存层进行装载。
3.根据权利要求2所述的基于数据仓库的数据汇聚调度方法,其特征在于,所述方法还包括:所述数据装载程序通过校验标准接口获取所述数据源的属性信息。
4.根据权利要求1所述的基于数据仓库的数据汇聚调度方法,其特征在于,所述方法还包括:当所述汇聚表的可信度没有发生变化时,则标记所述第一任务组实例状态。
5.根据权利要求1所述的基于数据仓库的数据汇聚调度方法,其特征在于,所述第一任务云还包括第二任务组,所述方法还包括:
启动所述第二任务组;
所述第一任务云对本地的第二任务组进行遍历,从所述第二任务组中选择满足汇聚条件的表组成第二组表;
将所述第二组表并行汇聚处理得到汇聚表;
当所述汇聚表的可信度发生变化时,则创建汇聚子任务进行记录所述汇聚表信息;
标记所述第二任务组实例状态。
6.根据权利要求1所述的基于数据仓库的数据汇聚调度方法,其特征在于,所述第一相关任务云还包括第二任务云,所述方法还包括:
如果所述第一任务云和所述第二任务云在节点处汇合,则所述第一相关任务云遍历结束。
7.根据权利要求6所述的基于数据仓库的数据汇聚调度方法,其特征在于,所述方法还包括:所述主任务进程启动所述第二相关任务云。
8.根据权利要求1所述的基于数据仓库的数据汇聚调度方法,其特征在于,所述数据源属性信息包括:接口记录数、成功状态、数据粒度、数据戳。
9.根据权利要求1所述的基于数据仓库的数据汇聚调度方法,其特征在于,当所述第一任务云和第二任务云的所述数据源的属性信息相关时,同时启动所述第一任务云和第二任务云。
10.根据权利要求8所述的基于数据仓库的数据汇聚调度方法,其特征在于,具体的,还包括,利用所述数据戳查找数据缺失和提高补汇数据效率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410037541.1A CN103810258B (zh) | 2014-01-26 | 2014-01-26 | 基于数据仓库的数据汇聚调度方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410037541.1A CN103810258B (zh) | 2014-01-26 | 2014-01-26 | 基于数据仓库的数据汇聚调度方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103810258A true CN103810258A (zh) | 2014-05-21 |
CN103810258B CN103810258B (zh) | 2017-06-30 |
Family
ID=50707028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410037541.1A Active CN103810258B (zh) | 2014-01-26 | 2014-01-26 | 基于数据仓库的数据汇聚调度方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103810258B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109102754A (zh) * | 2018-06-20 | 2018-12-28 | 新华三大数据技术有限公司 | 数据地图的生成方法及装置 |
CN110737515A (zh) * | 2018-07-19 | 2020-01-31 | 阿里巴巴集团控股有限公司 | 一种数据任务指令的处理方法、计算机设备、存储介质 |
CN112328705A (zh) * | 2020-11-03 | 2021-02-05 | 成都中科大旗软件股份有限公司 | 支持任意配置周期的任务调度方法 |
CN113791955A (zh) * | 2021-09-17 | 2021-12-14 | 济南浪潮数据技术有限公司 | 一种用于监控系统的数据汇聚装置、方法及服务器 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101477572A (zh) * | 2009-01-12 | 2009-07-08 | 深圳市里王智通软件有限公司 | 基于tds过渡数据存储技术的动态数据仓库的方法与系统 |
CN102880503A (zh) * | 2012-08-24 | 2013-01-16 | 新浪网技术(中国)有限公司 | 数据分析系统及数据分析方法 |
US20130325788A1 (en) * | 2012-05-31 | 2013-12-05 | Cellco Partnership D/B/A Verizon Wireless | Etl data transit method and system |
CN103455633A (zh) * | 2013-09-24 | 2013-12-18 | 浪潮齐鲁软件产业有限公司 | 一种海量网络发票明细数据分布式分析方法 |
-
2014
- 2014-01-26 CN CN201410037541.1A patent/CN103810258B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101477572A (zh) * | 2009-01-12 | 2009-07-08 | 深圳市里王智通软件有限公司 | 基于tds过渡数据存储技术的动态数据仓库的方法与系统 |
US20130325788A1 (en) * | 2012-05-31 | 2013-12-05 | Cellco Partnership D/B/A Verizon Wireless | Etl data transit method and system |
CN102880503A (zh) * | 2012-08-24 | 2013-01-16 | 新浪网技术(中国)有限公司 | 数据分析系统及数据分析方法 |
CN103455633A (zh) * | 2013-09-24 | 2013-12-18 | 浪潮齐鲁软件产业有限公司 | 一种海量网络发票明细数据分布式分析方法 |
Non-Patent Citations (2)
Title |
---|
师金刚 等: "MapReduce环境下的并行Dwarf立方构建", 《计算机科学与探索》 * |
陈金玉: "数据仓库实体化视图联机一致性维护研究", 《中国优秀博硕士学位论文全文数据库(博士)信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109102754A (zh) * | 2018-06-20 | 2018-12-28 | 新华三大数据技术有限公司 | 数据地图的生成方法及装置 |
CN110737515A (zh) * | 2018-07-19 | 2020-01-31 | 阿里巴巴集团控股有限公司 | 一种数据任务指令的处理方法、计算机设备、存储介质 |
CN110737515B (zh) * | 2018-07-19 | 2024-04-09 | 阿里巴巴集团控股有限公司 | 一种数据任务指令的处理方法、计算机设备、存储介质 |
CN112328705A (zh) * | 2020-11-03 | 2021-02-05 | 成都中科大旗软件股份有限公司 | 支持任意配置周期的任务调度方法 |
CN113791955A (zh) * | 2021-09-17 | 2021-12-14 | 济南浪潮数据技术有限公司 | 一种用于监控系统的数据汇聚装置、方法及服务器 |
Also Published As
Publication number | Publication date |
---|---|
CN103810258B (zh) | 2017-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106202346B (zh) | 一种数据加载清洗引擎、调度与存储系统 | |
JP6223569B2 (ja) | ビジネスフローをスケジュールするためのコンピュータ装置、方法及び装置 | |
CN102521712B (zh) | 一种流程实例数据处理方法和装置 | |
CN104050042B (zh) | Etl作业的资源分配方法及装置 | |
CN101645036B (zh) | 基于测试执行机能力度的测试任务自动分配方法 | |
CN105719126B (zh) | 一种基于生命周期模型的互联网大数据任务调度的系统及方法 | |
CN114741375B (zh) | 一种多源异构数据库快速自动数据迁移系统及方法 | |
WO2019047441A1 (zh) | 一种通信优化方法及系统 | |
CN103176895A (zh) | 一种回归测试方法和系统 | |
CN103500119B (zh) | 一种基于预调度的任务分配方法 | |
CN112637263B (zh) | 一种多数据中心资源优化提升方法、系统和存储介质 | |
CN104243617A (zh) | 一种异构集群中面向混合负载的任务调度方法及系统 | |
CN102638566A (zh) | 一种基于云存储的blog系统运行方法 | |
CN102855173B (zh) | 一种软件性能测试方法和装置 | |
CN102681894A (zh) | 一种多任务并发调度方法及系统 | |
CN103810258A (zh) | 基于数据仓库的数据汇聚调度方法 | |
CN110083306A (zh) | 一种分布式对象存储系统及存储方法 | |
CN101226484A (zh) | 基于仿真网格的仿真场景自动部署方法 | |
CN105843991B (zh) | 模型级hla仿真成员组合系统及方法 | |
CN117057079A (zh) | 一种配电网拓扑控制方法、系统、设备及存储介质 | |
CN105260297B (zh) | 一种测试数据管理系统及方法 | |
CN110941422A (zh) | 代码自动生成方法、代码生成器及可读存储介质 | |
CN110879753A (zh) | 基于自动化集群资源管理的gpu加速性能优化方法和系统 | |
CN109544040B (zh) | 一种基于模态的业务流程动态重构方法 | |
CN104360899B (zh) | 一种进程管理系统及管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |