WO2017114170A1 - 实时计算任务控制方法、装置及应用其的实时计算系统 - Google Patents

实时计算任务控制方法、装置及应用其的实时计算系统 Download PDF

Info

Publication number
WO2017114170A1
WO2017114170A1 PCT/CN2016/110104 CN2016110104W WO2017114170A1 WO 2017114170 A1 WO2017114170 A1 WO 2017114170A1 CN 2016110104 W CN2016110104 W CN 2016110104W WO 2017114170 A1 WO2017114170 A1 WO 2017114170A1
Authority
WO
WIPO (PCT)
Prior art keywords
task
control node
real
node
auxiliary data
Prior art date
Application number
PCT/CN2016/110104
Other languages
English (en)
French (fr)
Inventor
刘键
封仲淹
方孝健
王逸
伍翀
Original Assignee
阿里巴巴集团控股有限公司
刘键
封仲淹
方孝健
王逸
伍翀
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 阿里巴巴集团控股有限公司, 刘键, 封仲淹, 方孝健, 王逸, 伍翀 filed Critical 阿里巴巴集团控股有限公司
Publication of WO2017114170A1 publication Critical patent/WO2017114170A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]

Abstract

一种实时计算任务控制方法、装置及应用其的实时计算系统,其通过在任务处理模块(1000)中设置任务控制节点(1110,1120),将与协调服务无关的辅助数据存储于该任务控制节点(1110,1120)中,并由任务控制节点(1110,1120)将辅助数据发送至中央调度模块(2000),既可以减轻协调服务模块(3000)的存储及读写压力,又可以减少中央调度模块(2000)和任务处理节点(1200)在数据读写操作上的等待时间,进而提高实时计算系统的计算能力及响应能力,有利于系统运行大集群和大拓扑任务。另外,由于上述辅助数据与协调服务无关,故即使不通过协调服务模块(3000)进行存储,也不会影响后续步骤对这些辅助数据的应用。

Description

实时计算任务控制方法、装置及应用其的实时计算系统 技术领域
本发明涉及分布式实时计算技术领域,特别是涉及实时计算任务控制方法、装置及应用其的实时计算系统。
背景技术
图1所示为现有Storm、Jstorm、Spark streaming等实时计算系统的拓扑结构。参照图1,在处理实时计算任务时,实时计算系统的任务执行模块1000的各个任务处理节点(task)1200分别将计算过程中产生的状态信息或采样信息等辅助数据存储在外部的协调服务模块3000(如Zookeeper)中;同时,中央调度模块2000(如Nimbus)从协调服务模块3000读取所需的辅助数据,以对所述任务执行模块1000进行实时调度和监控。例如,中央调度模块2000可以从协调服务模块3000读取任务处理节点的心跳数据,并判断其是否超时,如果超时,则中央调度模块2000触发该task的重新调度。又如,中央调度模块2000也会定期从协调服务模块3000中读取实时计算任务的采样数据,以用于任务信息的监控和展示。
基于上述实时计算任务处理过程,随着实时计算需求的增加,计算量随之增大,单位时间内需要由协调服务模块存储的数据量及存储次数也随之增加,相应的,中央调度模块为实现任务监控,单位时间内从协调服务模块中读取数据的次数也会增加。可见,实时计算任务的增加,要求协调服务模块有更高的数据读写速度;如果协调服务模块不能满足实时计算任务增加导致的数据高速读写要求,将导致系统的任务执行模块及中央调度模块长时间等待协调服务模块执行读写操作,即不能及时存储及读取辅助数据,最终导致系统计算能力及响应能力的下降。
发明内容
为了解决上述技术问题,本申请公开了一种实时计算任务控制方法、装置及应用其的实时计算系统。
本申请第一方面提供了一种实时计算任务控制方法,所述方法应用 于实时计算系统,且所述实时计算系统的任务执行模块中设置有控制节点;所述方法包括:
在所述控制节点作为任务控制节点时,所述任务控制节点获取并存储所述任务执行模块的各个任务处理节点产生的与协调服务无关的辅助数据;
所述任务控制节点将所述辅助数据发送至中央调度模块,以便所述中央调度模块根据所述辅助数据对所述任务处理节点进行调度和监控。
结合第一方面,在第一方面第一种可行的实施方式中,所述任务控制节点在将所述辅助数据发送至中央调度模块之前,所述方法还包括:
所述任务控制节点将所述辅助数据中的冗余数据进行合并。
结合第一方面,或者第一方面第一种可行的实施方式,在第一方面第二种可行的实施方式中,所述任务执行模块中设置的所述控制节点有多个,任一时刻有且仅有一个控制节点作为所述任务控制节点,其他控制节点作为备用控制节点;
所述方法还包括:
定期判断所述任务控制节点是否失效;如果失效,则将所述任务控制节点更改为当前备用控制节点中的任一控制节点。
结合第一方面第二种可行的实施方式,在第一方面第三种可行的实施方式中,所述定期判断所述任务控制节点是否失效,包括:
所述备用控制节点接收所述任务控制节点的同步消息;
如果所述备用控制节点在预设周期内未接收到所述同步消息,则判定所述任务控制节点失效。
结合第一方面,或者第一方面第一种可行的实施方式,在第一方面第四种可行的实施方式中,所述辅助数据至少包括:任务处理节点的心跳数据和监控采样数据。
本申请第二方面提供了一种实时计算任务控制装置,所述装置应用于实时计算系统;所述装置包括:设置于所述实时计算系统的任务执行 模块中的控制节点;
所述控制节点包括:
数据存储单元,用于在所述控制节点作为任务控制节点时,获取并存储所述任务执行模块的任务处理节点在执行所述实时计算任务时产生的与协调服务无关的辅助数据;
数据发送单元,用于将所述辅助数据发送至所述实时计算系统的中央调度模块,以便所述中央调度模块根据所述辅助数据对所述任务处理节点进行调度和监控。
结合第二方面,在第二方面第一种可行的实施方式中,所述控制节点还包括:
数据合并单元,用于在所述数据发送单元将所述辅助数据发送至中央调度模块之前,将所述辅助数据中的冗余数据进行合并。
结合第二方面,或者第二方面第一种可行的实施方式,在第二方面第二种可行的实施方式中,所述控制节点有多个,任一时刻有且仅有一个控制节点作为所述任务控制节点,其他控制节点作为备用控制节点;
所述装置还包括:
失效检测单元,用于定期判断所述任务控制节点是否失效;如果失效,则将所述任务控制节点更改为当前备用控制节点中的任一控制节点。
结合第二方面第二种可行的实施方式,在第二方面第三种可行的实施方式中,所述失效检测单元设置于所述控制节点中;
所述失效检测单元具体被配置为:在所在控制节点为备用控制节点时,接收所述任务控制节点的同步消息,如果在预设周期内未接收到所述同步消息,则判定所述任务控制节点失效。
本申请第三方面提供了一种实时计算系统,该系统包括:任务执行模块和中央调度模块;
其中,所述任务执行模块包括任务处理节点和任务控制节点;
所述任务处理节点用于执行实时计算任务;
所述任务控制节点用于获取并存储所述任务处理节点在执行所述实时计算任务时产生的与协调服务无关的辅助数据,并将所述辅助数据发送至所述中央调度模块;
所述中央调度模块用于根据所述辅助数据对所述任务处理节点进行调度和监控。
由以上技术方案可知,本申请实施例通过在任务处理模块中设置任务控制节点,将与协调服务无关的辅助数据存储于该任务控制节点中,并由任务控制节点将辅助数据发送至中央调度模块,既可以减轻协调服务模块的存储及读写压力,又可以减少中央调度模块和任务处理节点在数据读写操作上的等待时间,进而提高实时计算系统的计算能力及响应能力,有利于系统运行大集群和大拓扑任务。另外,由于上述辅助数据与协调服务无关,故即使不通过协调服务模块进行存储,也不会影响后续步骤对这些辅助数据的应用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为现有实时计算系统的拓扑结构图;
图2本申请实施例提供的一种实时计算系统的拓扑结构图;
图3为本申请一个实施例提供的实时计算任务控制方法的信号流图;
图4本申请实施例提供的另一种实时计算系统的拓扑结构图;
图5为本申请另一个实施例提供的实时计算任务控制方法的信号流图;
图6为本申请一个实施例提供的实时计算任务控制装置的结构框 图;
图7为本申请另一个实施例提供的实时计算任务控制装置的结构框图;
图8为本申请又一个实施例提供的实时计算任务控制装置的结构框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
首先对本申请提供的实时计算任务控制方法的实施例进行说明。
图2为基于本申请实施例进行改进得到的实时计算系统的拓扑结构图;参照图2,本实施例预先在实时计算系统的任务执行模块1000中设置控制节点1110,通过该控制节点1110实现对实时计算任务的控制;其中,上述实时计算系统具体可以为Storm、Jstorm、Spark streaming等。
图3为本申请实施例提供的一种实时计算任务控制方法信号流图。参照图2和图3,该方法包括如下步骤。
S11、在所述控制节点1110作为任务控制节点时,所述任务控制节点获取所述任务执行模块的各个任务处理节点产生的与协调服务无关的辅助数据。
上述与协调服务无关的辅助数据,即不需要经过Zookeeper等协调服务模块提供相关特殊服务处理的数据。
S12、所述任务控制节点存储所述辅助数据。
S13、所述任务控制节点将所述辅助数据发送至中央调度模块,以便所述中央调度模块根据所述辅助数据对所述任务处理节点进行调度 和监控。
由以上技术方案可知,本申请实施例将上述与协调服务无关的辅助数据存储于任务处理模块的任务控制节点中,并由任务控制节点将其发送至中央调度模块,既可以减轻协调服务模块的存储及读写压力,又可以减少中央调度模块和任务处理节点在数据读写操作上的等待时间,进而提高实时计算系统的计算能力及响应能力,有利于系统运行大集群和大拓扑任务。另外,由于上述辅助数据与协调服务无关,故即使不通过协调服务模块进行存储,也不会影响后续步骤对这些辅助数据的应用。
在本申请一个可行的实施例中,上述辅助数据至少包括:任务处理节点的心跳数据和监控采样数据。相关技术中,中央调度模块对这两种数据的读取频率较高,将其存储于任务控制节点中,可以大大减轻协调服务模块的数据读写压力。
在本申请一个可行的实施例中,在执行步骤S13将所述辅助数据发送至中央调度模块之前,还可以执行如下步骤:所述任务控制节点将所述辅助数据中的冗余数据进行合并。
以心跳数据为例,一般的,任务处理节点没10秒产生一次心跳数据,而心跳超市时间为4分钟,由于实施计算系统可以忍受一定的消息丢失率,任务控制节点可以将4分钟内接收到的心跳数据进行合并精简(例如删除一部分心跳数据),将合并精简后的心跳数据发送至中央调度模块,从而可以在不影响系统正常计算的前提下,减少中央调度模块所要读取并处理的数据量,减轻中央调度模块的数据处理压力。
在本申请一个可行的实施例中,任务执行模块中同时设置多个控制节点,任一时刻有且仅有一个控制节点作为所述任务控制节点,其他控制节点作为备用控制节点。如图4所示的另一种改进后的实时计算系统拓扑结构图,其任务执行模块中设置有两个控制节点,即控制节点1110和控制节点1120,某一情况下,可以将实线框表示的控制节点1110设定为任务控制节点,虚线框表示的控制节点1120作为备用控制节点;再另一情况下,也可以将控制节点1120设定为任务控制节点,控制节点1110作为备用控制节点。
基于图4所示拓扑结构,上述时计算任务控制方法还包括:
定期判断所述任务控制节点是否失效;如果失效,则将所述任务控制节点更改为当前备用控制节点中的任一控制节点。
以图4所示结构为例,在控制节点1110作为任务控制节点、控制节点1120作为备用控制节点的情况下,对控制节点1110的有效性进行检测;如果检测到控制节点1110失效,则将控制节点1120设定为任务控制节点,控制节点1110设定为备用控制节点,从而由控制节点1120执行上述步骤S11至S13。
上述实施例通过对当前的任务控制节点的有效性进行检测,当其失效时,换用备用控制节点作为任务控制节点,执行上述步骤S11至S13,从而提高上述控制方法的可用性,避免任务控制节点失效引起上述控制方法无法执行。
进一步的,在对任务控制节点进行有效性检测时,还可以同时对至少一个当前备用控制节点进行有效性检测;进而在判定任务控制节点失效时,选择经检测确认有效的一个当前备用控制节点作为新的任务控制节点。
优选的,可用直接通过备用控制节点判断任务控制节点是否失效,参照图5,具体步骤如下:
S14、所述备用控制节点接收所述任务控制节点的同步消息;
S15、如果所述备用控制节点在预设周期内未接收到所述同步消息,则判定所述任务控制节点失效。
仍以图4所示结构为例,在控制节点1110作为任务控制节点、控制节点1120作为备用控制节点的情况下,控制节点1110在执行上述步骤S11至S13的同时,按照预设周期向控制节点1120发送同步消息;相应的控制节点1120周期性接收控制节点1110发送的同步消息,如果控制节点1120在预设周期内未接收到控制节点1110的同步消息,则控制节点1120判定控制节点1110失效,控制节点1120自动提升为任务控制节点,相应的控制节点1110变更为备用控制节点。
另外,如果任务执行模块中的控制节点个数超过两个,可以为每个控制节点设置相应的优先级,优先将优先级高的控制节点设定为任务控制节点,相应的,当检测到当前的任务控制节点失效时,将多个备用控制节点中优先级最高的一个提升为任务控制节点。
与上述实时计算任务控制方法的实施例相对应,本申请实施例还提供了一种实时计算任务控制装置。图6示出了该实时计算任务控制装置的一种结构框图;该装置至少包括控制节点1110。具体的,可以将该实时计算任务控制装置设置于实时计算系统的任务控制模块中,也即将控制节点1110设置于任务控制模块中,得到的系统拓扑结构图可以参照图2,此处不再赘述。
如图6所示,本实施例提供的实时计算任务控制装置中,控制节点1110具体可以包括:数据存储单元1111和数据发送单元1112。
结合图2,数据存储单元1111用于,在所述控制节点1110作为任务控制节点时,获取并存储所述任务处理节点1200在执行所述实时计算任务时产生的与协调服务无关的辅助数据。
数据发送单元1112用于,将所述辅助数据发送至所述实时计算系统的中央调度模块2000,以便所述中央调度模块2000根据所述辅助数据对所述任务处理节点1200进行调度和监控。
由以上技术方案可知,本申请实施例通过在任务处理模块中设置任务控制节点,代替相关技术中的协调服务模块,存储任务处理节点产生的与协调服务无关的辅助数据,并由该任务控制节点将辅助数据发送至中央调度模块,既可以减轻协调服务模块的存储及读写压力,又可以减少中央调度模块和任务处理节点在数据读写操作上的等待时间,进而可以提高实时计算系统的计算能力及响应能力,有利于系统运行大集群和大拓扑任务。另外,由于上述辅助数据与协调服务无关,故即使不通过协调服务模块进行存储,也不会影响后续步骤对这些辅助数据的应用。
在本申请一个可行的实施方式中,上述装置中的控制节点1110还可以包括:数据合并单元,用于在所述数据发送单元将所述辅助数据发送至中央调度模块之前,将所述辅助数据中的冗余数据进行合并。
实际应用中,实时计算任务控制装置可以包括多个控制节点,如图4所示系统拓扑结构,任务处理模块中同时设置有两个控制节点(即,控制节点1110和控制节点1120),这两个控制节点均属于实时计算任务控制装置。在工作过程中,其中一个控制节点作为任务控制节点,触发其数据存储单元和数据发送单元,执行对相关辅助数据的存储和转发操作,其他控制节点作为备用控制节点;相应的,实时计算任务控制装置还包括:失效检测单元,用于定期判断所述任务控制节点是否失效;如果失效,则将所述任务控制节点更改为作为备用控制节点的任一控制节点。
图7展示了具有两个控制节点的实时计算任务控制装置,当前时刻,实线框表示的控制节点1110作为任务控制节点,虚线框表示的控制节点1120作为备用控制节点;失效检测单元1103用于定期判断控制节点1110(任务控制节点)是否失效;如果失效,则将任务控制节点更改为作为控制节点1120,原来作为任务控制节点的控制节点1110相应变更为备用控制节点。
在本申请一个可行的实施方式中,上述失效检测单元可以设置于各个控制节点中。参照图8,当控制节点1110作为任务控制节点,控制节点1120作为备用控制节点时,控制节点1110的数据存储单元1111和数据发送单元1112,以及控制节点1120的失效检测单元1123处于工作状态,失效检测单元1123用于定期检测控制节点1110是否失效,具体检测方法为:失效检测单元1123接收控制节点1110(任务控制节点)发送的同步消息,如果在预设周期内未接收到所述同步消息,则判定控制节点1110失效,进而将相应的控制节点1120提升为任务控制节点,控制节点1110相应变更为备用控制节点,即控制节点1120的数据存储单元1121和数据发送单元1122,以及控制节点1110的失效检测单元 1113处于工作状态,失效检测单元1113定期检测控制节点1120是否失效。
上述实施例通过对当前的任务控制节点的有效性进行检测,当其失效时,换用备用控制节点作为任务控制节点,执行对辅助数据的存储及转发操作,从而提高上述控制节点的可用性,避免任务控制节点失效引起相应辅助数据存储或转发失败。
本申请实施例还提供了一种实时计算系统,该系统包括任务执行模块和中央调度模块;其中,所述任务执行模块中设置有任务控制节点和多个任务处理节点。
所述任务处理节点用于执行实时计算任务;所述任务控制节点用于获取并存储所述任务处理节点在执行所述实时计算任务时产生的与协调服务无关的辅助数据,并将所述辅助数据发送至所述中央调度模块;所述中央调度模块用于根据所述辅助数据对所述任务处理节点进行调度和监控。
另外,上述实时计算系统还与外部的协调服务模块链接,以通过该协调服务模块存储任务处理节点产生的与协调服务相关的数据。
可见,本实施例通过在实时计算系统的任务处理模块中设置任务控制节点,代替协调服务模块存储任务处理节点产生的部分数据(即上述与协调服务无关的辅助数据),可以减轻协调服务模块的数据存储及读写压力,减少中央处理模块及任务处理节点在数据读写上的等待时间,进而可以提高实时计算系统的计算能力及响应能力,有利于系统运行大集群和大拓扑任务。
另外,本申请实施例还提供了一种计算机存储介质,例如可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等;该计算机存储介质中存储有程序,当所述存储介质中的程序由 该任务处理模块的处理器执行时,使得该任务处理模块能够执行上述方法实施例中记载的任一种实时计算任务控制方法所述的部分或全部步骤。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置和系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

  1. 一种实时计算任务控制方法,其特征在于,应用于实时计算系统,且所述实时计算系统的任务执行模块中设置有控制节点;所述方法包括:
    在所述控制节点作为任务控制节点时,所述任务控制节点获取并存储所述任务执行模块的各个任务处理节点产生的与协调服务无关的辅助数据;
    所述任务控制节点将所述辅助数据发送至中央调度模块,以便所述中央调度模块根据所述辅助数据对所述任务处理节点进行调度和监控。
  2. 根据权利要求1所述的方法,其特征在于,所述任务控制节点在将所述辅助数据发送至中央调度模块之前,所述方法还包括:
    所述任务控制节点将所述辅助数据中的冗余数据进行合并。
  3. 根据权利要求1或2所述的方法,其特征在于,所述任务执行模块中设置的所述控制节点有多个,任一时刻有且仅有一个控制节点作为所述任务控制节点,其他控制节点作为备用控制节点;
    所述方法还包括:
    定期判断所述任务控制节点是否失效;如果失效,则将所述任务控制节点更改为当前备用控制节点中的任一控制节点。
  4. 根据权利要求3所述的方法,其特征在于,所述定期判断所述任务控制节点是否失效,包括:
    所述备用控制节点接收所述任务控制节点的同步消息;
    如果所述备用控制节点在预设周期内未接收到所述同步消息,则判定所述任务控制节点失效。
  5. 根据权利要求1或2所述的方法,其特征在于,所述辅助数据至少包括:任务处理节点的心跳数据和监控采样数据。
  6. 一种实时计算任务控制装置,其特征在于,应用于实时计算系统;所述装置包括:设置于所述实时计算系统的任务执行模块中的控制节点;
    所述控制节点包括:
    数据存储单元,用于在所述控制节点作为任务控制节点时,获取并存储所述任务执行模块的任务处理节点在执行所述实时计算任务时产生的与协调服务无关的辅助数据;
    数据发送单元,用于将所述辅助数据发送至所述实时计算系统的中央调度模块,以便所述中央调度模块根据所述辅助数据对所述任务处理节点进行调度和监控。
  7. 根据权利要求6所述的装置,其特征在于,所述控制节点还包括:
    数据合并单元,用于在所述数据发送单元将所述辅助数据发送至中央调度模块之前,将所述辅助数据中的冗余数据进行合并。
  8. 根据权利要求6或7所述的装置,其特征在于,所述控制节点有多个,任一时刻有且仅有一个控制节点作为所述任务控制节点,其他控制节点作为备用控制节点;
    所述装置还包括:
    失效检测单元,用于定期判断所述任务控制节点是否失效;如果失效,则将所述任务控制节点更改为当前备用控制节点中的任一控制节 点。
  9. 根据权利要求8所述的装置,其特征在于,所述失效检测单元设置于所述控制节点中;
    所述失效检测单元具体被配置为:在所在控制节点为备用控制节点时,接收所述任务控制节点的同步消息,如果在预设周期内未接收到所述同步消息,则判定所述任务控制节点失效。
  10. 一种实时计算系统,其特征在于,包括:任务执行模块和中央调度模块;
    其中,所述任务执行模块包括任务处理节点和任务控制节点;
    所述任务处理节点用于执行实时计算任务;
    所述任务控制节点用于获取并存储所述任务处理节点在执行所述实时计算任务时产生的与协调服务无关的辅助数据,并将所述辅助数据发送至所述中央调度模块;
    所述中央调度模块用于根据所述辅助数据对所述任务处理节点进行调度和监控。
PCT/CN2016/110104 2015-12-29 2016-12-15 实时计算任务控制方法、装置及应用其的实时计算系统 WO2017114170A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201511008363.0 2015-12-29
CN201511008363.0A CN106933668A (zh) 2015-12-29 2015-12-29 实时计算任务控制方法、装置及应用其的实时计算系统

Publications (1)

Publication Number Publication Date
WO2017114170A1 true WO2017114170A1 (zh) 2017-07-06

Family

ID=59224543

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2016/110104 WO2017114170A1 (zh) 2015-12-29 2016-12-15 实时计算任务控制方法、装置及应用其的实时计算系统

Country Status (2)

Country Link
CN (1) CN106933668A (zh)
WO (1) WO2017114170A1 (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324539A (zh) * 2013-06-24 2013-09-25 浪潮电子信息产业股份有限公司 一种作业调度管理系统及方法
WO2015061976A1 (en) * 2013-10-30 2015-05-07 Nokia Technologies Oy Methods and apparatus for task management in a mobile cloud computing environment
CN104916127A (zh) * 2014-03-13 2015-09-16 深圳市赛格导航科技股份有限公司 一种车联网分布式实时分析交通路况的方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103825868B (zh) * 2012-11-19 2017-12-22 华为技术有限公司 一种本地语音逃生的方法、本地网关及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324539A (zh) * 2013-06-24 2013-09-25 浪潮电子信息产业股份有限公司 一种作业调度管理系统及方法
WO2015061976A1 (en) * 2013-10-30 2015-05-07 Nokia Technologies Oy Methods and apparatus for task management in a mobile cloud computing environment
CN104916127A (zh) * 2014-03-13 2015-09-16 深圳市赛格导航科技股份有限公司 一种车联网分布式实时分析交通路况的方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
XU, CHENG ET AL.: "New Mechanism of Monitoring on Hadoop Cloud Platform", COMPUTER SCIENCE, vol. 40, no. 1, 31 January 2013 (2013-01-31), XP055396157, ISSN: 1002-137X *

Also Published As

Publication number Publication date
CN106933668A (zh) 2017-07-07

Similar Documents

Publication Publication Date Title
US9240937B2 (en) Fault detection and recovery as a service
JP5861733B2 (ja) 若化処理装置、若化処理システム、コンピュータプログラムおよびデータ処理方法
WO2017097130A1 (zh) 一种分布式存储系统的服务节点切换方法和装置
US8850262B2 (en) Inter-processor failure detection and recovery
CN102209100B (zh) 一种任务调度云处理系统及其方法
WO2015169199A1 (zh) 分布式环境下虚拟机异常恢复方法
US20160140164A1 (en) Complex event processing apparatus and complex event processing method
WO2020248507A1 (zh) 基于容器云的系统资源监控方法及相关设备
JP2004516575A (ja) コンピュータ・クラスタリング・システムにおいて「スプリット・ブレイン」を防止する方法
US20150067387A1 (en) Method and apparatus for data storage
JP2019502202A (ja) 分散記憶システムをアップグレードするための方法および装置
EP3680787B1 (en) Method for synchronization between primary database and standby database, database system and device
WO2013102812A1 (en) A fault tolerant system in a loosely-coupled cluster environment
JP4155399B2 (ja) コンピュータ処理方法及びその実施システム並びにその処理プログラム
US20130219224A1 (en) Job continuation management apparatus, job continuation management method and job continuation management program
WO2020192065A1 (zh) 一种跨集群高可用的实现方法、装置、系统及设备
US10102088B2 (en) Cluster system, server device, cluster system management method, and computer-readable recording medium
CN109522100B (zh) 实时计算任务调整方法和装置
JP6612867B2 (ja) ハードドライブ電力消費を制御し、ハードドライブ電力消費の管理サービスを制御するための方法及び装置
CN112596371A (zh) 控制卡切换方法、装置、电子设备及存储介质
JP2011076344A (ja) 情報処理装置,情報処理装置の制御方法および制御プログラム
WO2017114170A1 (zh) 实时计算任务控制方法、装置及应用其的实时计算系统
US20180309702A1 (en) Method and device for processing data after restart of node
CN106326042B (zh) 一种运行状态确定方法及装置
CN114189429A (zh) 一种服务器集群故障的监测系统、方法、装置及介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16880960

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16880960

Country of ref document: EP

Kind code of ref document: A1