WO2016062087A1

WO2016062087A1 - 一种流式应用升级方法、主控节点及流计算系统

Info

Publication number: WO2016062087A1
Application number: PCT/CN2015/079944
Authority: WO
Inventors: 洪斯宝; 夏命榛; 张松山
Original assignee: 华为技术有限公司
Priority date: 2014-10-22
Filing date: 2015-05-27
Publication date: 2016-04-28
Also published as: CN104317556B; US20200404032A1; US20170223075A1; US10785272B2; EP3200095A1; EP3200095B1; CN104317556A; EP4148558A1; EP3200095A4

Abstract

一种流式应用升级方法及流计算系统，该方法包括：主控节点获取流式应用更新后的逻辑模型（S501），通过对比更新后的逻辑模型以及初始逻辑模型，以确定待调整的流（S502）；根据待调整的流，生成升级指令（S503）；将生成的升级指令下发给第一工作节点，指示第一工作节点调整其上分布的PE之间的数据流走向（S504）。所述方法能够实现流式应用的在线升级，不中断业务。

Description

一种流式应用升级方法、主控节点及流计算系统

技术领域

本发明涉及计算机技术领域，尤其涉及一种流式应用升级方法、一种主控节点以及一种流计算系统。

背景技术

随着大数据时代的到来，对海量数据进行实时处理、分析、决策的市场需求不断扩大，如：电信领域的精准广告推送，金融领域的交易动态实时分析，工业领域的实时监控等等。在此背景下，数据密集型应用，比如金融服务、网络监控、电信数据管理等，已经得到越来越广泛的应用，同时适应于数据密集型应用的流计算系统也应运而生。数据密集型应用产生的数据具有数据量大、快速、时变的特点，当数据密集型应用部署到流计算系统之后，流计算系统可以在接收到应用的数据时就立即对其进行处理，以保证实时性。如图1所示，流计算系统通常包括一个主控节点(Master)和多个工作节点(worker)，主控节点主要负责调度和管理各个工作节点，而工作节点是承载实际的数据处理操作的逻辑实体，工作节点具体通过调用若干个执行单元(PE，Process Element)来对数据进行处理，PE是业务逻辑的物理执行单元。

通常，流计算系统中部署的应用程序或业务被称为流式应用，现有技术中，当部署一个流式应用到流计算系统时，需要预先定义该流式应用的逻辑模型，流式应用的逻辑模型通常以无回路有向图(Directed Acyclic Graph，DAG)来表示，如图2所示，其中PE是承载实际的数据处理操作的物理载体，也是可被流计算系统调度执行的最小单元；stream代表各PE间的传输的数据流，箭头表示了数据流的走向；PE可以动态加载并执行业务逻辑，对流式应用的数据进行实时处理。如图3所示，流计算系统根据逻辑模型将各个PE部署在不同的工作节点上执行，各个PE依照自己的逻辑进行运算，并把运算结果转发给下游PE。而当用户需求或业务场景发生变化时，流式应用就需要更新或升级，初始的逻辑模型已经不再适用。因此首先需要离线完成流式应用的更新，并定义新的逻辑模型，然后停止旧的应用，再根据新的逻辑模型将更新后的流式应用重新部署到流计算系统中，最后再启动更新后的流式应用。可以看出，现有技术中进行流式应用的更新，需要中断原先业务，无法进行流式应用的在线升级，导致业务损失。

发明内容

本发明实施例提供一种流式应用升级方法、主控节点及流计算系统，用以在不需要中断业务的情况下，实现流计算系统中流式应用的在线升级。

第一方面，本发明实施例提供了一种流式应用升级方法，应用于流计算系统中的主控节点，所述流计算系统包括所述主控节点和至少一个工作节点，其中，多个执行单元PE分布于所述至少一个工作节点中的一个或多个工作节点上，用于对所述流计算系统上部署的流式应用的数据进行处理，其中所述流式应用的初始逻辑模型用于表示处理所述流式应用的数据的所述多个PE以及所述多个PE之间的数据流走向；所述方法包括：

在所述流式应用更新的情况下，所述主控节点获取所述流式应用更新后的逻辑模型，并通过比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，确定待调整的数据流；

根据所述待调整的数据流，生成升级指令；

将所述升级指令下发给第一工作节点，所述第一工作节点是与所述待调整的数据流相关的PE所在的工作节点，所述升级指令用于指示所述第一工作节点调整其上分布的PE之间的数据流走向。

在第一方面的第一种可能的实现方式中，所述比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，确定待调整的数据流包括：

比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，以确定所述待调整的数据流，其中所述流式应用的初始逻辑模型所表示的PE与所述更新后的逻辑模型所表示的PE相同。

在第一方面的第二种可能的实现方式中，所述通过比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，确定待调整的数据流包括：

比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，以确定待调整的PE以及所述待调整的数据流，其中所述流式应用的初始逻辑模型所表示的PE与所述更新后的逻辑模型所表示的PE不完全相同；

所述根据所述待调整的数据流，生成升级指令包括：

根据所述待调整的数据流，生成第一升级指令；根据所述待调整的PE生成第二升级指令；

所述将所述升级指令下发给第一工作节点包括：

将所述第一升级指令下发给所述第一工作节点，将所述第二升级指令下发给第二工作节点，所述第二工作节点包括所述待调整的PE所在的工作节点；所述第一升级指令用于指示所述第一工作节点调整其上分布的PE之间的数据流走向，所述第二升级指令用于指示所述第二工作节点调整其上分布的PE的数目。

结合第一方面，或者第一方面第一至第二种任意一种可能的实现方式，在第三种可能的实现方式中，还包括：

所述主控节点根据与所述待调整的数据流相关的PE的输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE和所述目标PE执行数据恢复的检查点checkpoint；

向所述目标PE所在工作节点下发数据恢复指令，所述数据恢复指令用于指示所述目标PE根据所述checkpoint恢复数据；

当确定所述第一工作节点完成调整，且所述第一工作节点上分布的PE准备就绪之后，所述主控节点触发所述目标PE将恢复的数据输入所述目标PE的下游PE进行处理。

结合第一方面第三种可能的实现方式，在第四种可能的实现方式中，所述待调整的数据流包括：待更新的数据流和待删除的数据流；所述主控节点根据与所述待调整的数据流相关的PE的输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE和所述目标PE执行数据恢复的检查点checkpoint，包括：

所述主控节点根据与所述待更新的数据流和待删除的数据流相关的PE的状态数据，确定执行数据恢复的checkpoint；根据与所述待更新的数据流和待删除的数据流相关的PE的输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE；其中，每个PE的状态数据是该PE在输出事件的触发下备份的，用于指示该PE处理数据的状态。

结合第一方面第二到第四种中任意一种可能的实现方式，在第五种可能的实现方式中，所述待调整的PE包括待新增的PE；所述第二工作节点为所述主控节点根据所述流计算系统中各个工作节点的负载状况选择的工作节点；所述第二升级指令用于指示所述第二工作节点创建所述待新增的PE。

结合第一方面第二到第五种中任意一种可能的实现方式，在第六种可能的实现方式中，所述待调整的PE包括待删除的PE；所述第二工作节点为所述待删除的PE所在的工作节点；所述第二升级指令用于指示所述第二工作节点删除所述待删除的PE。

结合第一方面，或者第一方面第一至第六种任意一种可能的实现方式，在第七种可能的实现方式中，还包括：

根据所述流式应用的初始逻辑模型配置所述多个PE对所述流式应用的数据进行处理。

结合第一方面，或者第一方面第一至第七种任意一种可能的实现方式，在第八种可能的实现方式中，所述流式应用的初始逻辑模型是用有向无环图DAG表示的。

第二方面，本发明实施例提供了一种流计算系统中的主控节点，，所述流计算系统包括所述主控节点和至少一个工作节点；其中，多个执行单元PE分布于所述至少一个工作节点中的一个或多个工作节点上，用于对所述流计算系统上部署的流式应用的数据进行处理，其中所述流式应用的初始逻辑模型用于表示处理所述流式应用的数据的所述多个PE以及所述多个PE之间的数据流走向；所述主控节点包括：

获取及比较模块，用于在所述流式应用更新的情况下，获取所述流式应用更新后的逻辑模型，并通过比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，确定待调整的数据流；

升级指令生成模块，用于根据所述待调整的数据流，生成升级指令；

发送模块，用于将所述升级指令下发给第一工作节点，所述第一工作节点是与所述待调整的数据流相关的PE所在的工作节点，所述升级指令用于指示所述第一工作节点调整其上分布的PE之间的数据流走向。

在第二方面的第一种可能的实现方式中，所述获取及比较模块具体用于：

在第二方面的第二种可能的实现方式中，其中所述流式应用的初始逻辑模型所表示的PE与所述更新后的逻辑模型所表示的PE不完全相同；

所述升级指令生成模块具体用于，根据所述待调整的数据流，生成第一升级指令；根据所述待调整的PE生成第二升级指令；

所述发送模块具体用于，将所述第一升级指令下发给所述第一工作节点，将所述第二升级指令下发给第二工作节点，所述第二工作节点包括所述待调整的PE所在的工作节点；所述第一升级指令用于指示所述第一工作节点调整其上分布的PE之间的数据流走向，所述第二升级指令用于指示所述第二工作节点调整其上分布的PE的数目。

结合第二方面，或者第二方面第一至第三种任意一种可能的实现方式，在第三种可能的实现方式中，还包括：

数据恢复模块，用于根据与所述待调整的数据流相关的PE的输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE和所述目标PE执行数据恢复的检查点checkpoint；

所述发送模块还用于，向所述目标PE所在工作节点下发数据恢复指令，所述数据恢复指令用于指示所述目标PE根据所述checkpoint恢复数据；

所述主控节点还包括：输入触发模块，用于当确定所述第一工作节点完成调整，且所述第一工作节点上分布的PE准备就绪之后，触发所述目标PE将恢复的数据输入所述目标PE的下游PE进行处理。

结合第二方面第三种可能的实现方式，在第四种可能的实现方式中，所述待调整的数据流包括：待更新的数据流和待删除的数据流；所述数据恢复模块具体用于：

结合第二方面第二到第四种中任意一种可能的实现方式，在第五种可能的实现方式中，所述待调整的PE包括待删除的PE；所述第二工作节点为所述待删除的PE所在的工作节点；所述第二升级指令用于指示所述第二工作节点删除所述待删除的PE。

结合第二方面第二到第五种中任意一种可能的实现方式，在第六种可能的实现方式中，所述待调整的PE包括待新增的PE；所述第二工作节点为所述主控节点根据所述流计算系统中各个工作节点的负载状况选择的工作节点；所述第二升级指令用于指示所述第二工作节点创建所述待新增的PE。

结合第二方面，或者第二方面第一至第六种任意一种可能的实现方式，在第七种可能的实现方式中，还包括：配置模块，用于根据所述流式应用的初始逻辑模型配置所述多个PE对所述流式应用的数据进行处理。

第三方面，本发明实施例提供了一种流计算系统，，包括：主控节点和至少一个工作节点，其中，多个执行单元PE分布于所述至少一个工作节点中的一个或多个工作节点上，用于对所述流计算系统上部署的流式应用的数据进行处理，其中所述流式应用的初始逻辑模型用于表示处理所述流式应用的数据的所述多个PE以及所述多个PE之间的数据流走向；

所述主控节点用于：在所述流式应用更新的情况下，获取所述流式应用更新后的逻辑模型，并通过比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，确定待调整的数据流；根据所述待调整的数据流，生成升级指令；将所述升级指令下发给第一工作节点，所述第一工作节点是与所述待调整的数据流相关的PE所在的工作节点，所述升级指令用于指示所述第一工作节点调整其上分布的PE之间的数据流走向；

所述第一工作节点，用于接收所述主控节点发送的升级指令，根据所述升级指令的指示，调整所述第一工作节点上分布的PE之间的数据流走向。

在第三方面的第一种可能的实现方式中，其中所述流式应用的初始逻辑模型所表示的PE与所述更新后的逻辑模型所表示的PE相同。

在第三方面的第二种可能的实现方式中，其中所述流式应用的初始逻辑模型所表示的PE与所述更新后的逻辑模型所表示的PE不完全相同；根据所述待调整的数据流，生成第一升级指令；根据所述待调整的PE生成第二升级指令；

将所述第一升级指令下发给所述第一工作节点，将所述第二升级指令下发给第二工作节点，所述第二工作节点包括所述待调整的PE所在的工作节点；

所述第一工作节点具体用于，接收所述主控节点发送的所述第一升级指令，根据所述第一升级指令的指示，调整所述第一工作节点上分布的PE之间的数据流走向；

所述第二工作节点具体用于，接收所述主控节点发送的所述第二升级指令，根据所述第二升级指令的指示，调整所述第二工作节点上分布的PE的数目。

结合第三方面，或者第三方面第一至第二种任意一种可能的实现方式，在第三种可能的实现方式中，所述主控节点还用于，根据与所述待调整的数据流相关的PE的输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE和所述目标PE执行数据恢复的检查点checkpoint；向所述目标PE所在工作节点下发数据恢复指令，所述数据恢复指令用于指示所述目标PE根据所述checkpoint恢复数据；当确定所述第一工作节点完成调整，且所述第一工作节点上分布的PE准备就绪之后，触发所述目标PE将恢复的数据输入所述目标PE的下游PE进行处理。

由上述技术方案可知，本发明实施例提供的流式应用升级方法及流计算系统，通过对比流式应用发生更新前后逻辑模型的差异，动态确定待调整的数据流，并根据待调整的数据流生成相应的升级指令下发给工作节点，从而在不需要中断业务的情况下，实现流计算系统中流式应用的在线升级。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的流计算系统架构示意图；

图2为本发明实施例提供的流式应用的逻辑模型示意图；

图3为本发明实施例提供的流式应用部署示意图；

图4为本发明实施例提供的流计算系统工作原理图；

图5为本发明实施例提供的流式应用升级方法的流程图；

图6为本发明实施例提供的流式应用更新前后逻辑模型变化示意图；

图7为本发明实施例提供的流式应用更新前后逻辑模型变化示意图；

图8为本发明实施例提供的流式应用升级方法的流程图；

图9为本发明实施例提供的流式应用逻辑模型示意图

图10为本发明实施例提供的流式应用的逻辑模型调整示意图；

图11为本发明实施例提供的流式应用升级之后的PE部署示意图；

图12为本发明实施例提供的PE的输入流和输出流的依赖关系示意图；

图13为本发明实施例提供的PE的输入流和输出流的依赖关系示意图；

图14为本发明实施例提供的PE状态数据备份示意图；

图15为本发明实施例提供的主控节点示意图；

图16为本发明实施例提供的流计算系统示意图；

图17为本发明实施例提供的主控节点示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明的技术方案进行清楚地描述。显然，下述的各个实施例都只是本发明一部分的实施例。基于本发明下述的各个实施例，本领域普通技术人员即使没有作出创造性劳动，也可以通过等效变换部分甚至全部的技术特征，而获得能够解决本发明技术问题，实现本发明技术效果的其它实施例，而这些变换而来的各个实施例显然并不脱离本发明所公开的范围。

本发明实施例提供的技术方案可典型地应用于流计算系统中，图4描述了流计算系统的基本结构，该流计算系统包括：主控节点(Master)和多个工作节点(worker)，在集群部署时，主控节点和工作节点都可以有一个或多个，主控节点可以是与工作节点分离的物理节点；在单机部署时，主控节点和工作节点可以是部署在同一个物理节点上的逻辑单元；其中，物理节点具体可以为计算机或服务器。主控节点负责将数据流调度到工作节点上进行处理。通常情况下，一台物理节点即为一个工作节点，在某些情形下，一台物理节点可以对应于多个工作节点，一台物理节点对应的工作节点的数量取决于该物理节点的硬件物理资源。可以将一个工作节点理解为是一份硬件物理资源。对应于同一物理节点的工作节点间采用进程通信的方式进行通信，对应于不同物理节点的工作节点间采用网络通信的方式进行通信。

如图4所示，流计算系统包括主控节点、工作节点1、工作节点2和工作节点3。

主控节点根据流式应用的逻辑模型将流式应用部署到到工作节点1、工作节点2和工作节点3这三个工作节点上进行处理。图3所示的逻辑模型为包含九个执行单元(PE，Process Element)：PE1至PE9，以及这九个PE之间的数据流走向的逻辑关系图，PE之间数据流的走向也体现了各个PE的输入流和输出流的依赖关系。需要说明的是，本发明实施例中数据流也简称为流(stream)。

主控节点根据流式应用的逻辑模型，配置工作节点1上的PE1、PE2和PE3，工作节点2上的PE4、PE7和PE9，以及工作节点3上的PE5、PE6、PE8来对流式应用的数据流进行处理。可以看出，经过配置之后，工作节点1、2、3上的PE之间的数据流走向与流式应用的逻辑模型是匹配的。

本发明实施例中的流式应用的逻辑模型可以为有向无环图(Directed Acyclic Graph，DAG)、树状图或者含有环的图。流式应用的逻辑模型可以参阅图2进行理解，如图2所示的流式计算应用图包括7个算子，分别从PE1到PE7，有8条数据流，分别从s1到s8。图2中明确标出了数据流的走向，例如：数据流s1是从PE1到算子PE5，表示PE5处理的是PE1输出的流，即PE5的输出依赖于PE1的输入，通常也称PE5为PE1的下游PE，而PE1为PE5的上游PE；可以理解的是，上游PE和下游PE是根据PE之间的数据流走向来确定的，对于一条数据流来说，与其相关的有且仅有两个PE：输出该数据流的源PE，以及该数据流流向的目的PE(也即接收该数据流的PE)，从数据流的方向来看，源PE为目的PE的上游PE，而目的PE为源PE的下游PE；进一步地，数据流S2输入PE2，并经PE2逻辑处理后，产生两条数据流S3和S4，分别进入PE3和PE4进行逻辑处理，同理，PE2也为PE1的下游PE，而PE1为PE2的上游PE；PE4输出的数据流S4和PE3输出的数据流S7均作为PE6的输入，即PE6的输出依赖于PE3和PE4的输入。需要说明的是，在本发明实施例中，将输出依赖于单一PE的输入的PE定义为无状态PE，比如PE5，PE3，PE4；将输出依赖于多个PE的输入的PE定义为有状态PE，比如PE6，PE7。数据流中包含单个数据段，称为元组，元组可以是结构化或非结构化数据。通常，元组中可表示特定时间点某事物的状态，流计算系统中的PE以元组为单位对流式应用产生的数据流进行处理，也可以认为元组是流计算系统中的数据的最小粒度划分和表示。

还需要说明的是，流计算系统只是本发明技术方案的一个典型应用场景，并不对本发明的应用场景构成限制，其它涉及分布式系统或云计算系统应用部署与升级的应用场景，本发明实施例的技术方案均适用。

本发明实施例提供一种流式应用升级方法，该方法可典型地应用与图1及图4所示的流计算系统中，假设该流计算系统上部署有流式应用A，且流式应用A的初始逻辑模型为D1，则该流计算系统的主控节点根据初始逻辑模型D1，部署多个执行单元(PE)来对流式应用A的数据流进行处理，其中，该多个执行单元PE分布于流计算系统的一个或多个工作节点上；如图6所示，当流式应用A发生升级或更新后，其逻辑模型也相应地发生更新(假设更新后的逻辑模型为D2)，通常逻辑模型的更新一般由开发人员来完成，或者由开发人员借助开发工具来完成，本发明不做特别限定。如图5所示，该流式应用升级方法的主要流程描述如下：

S501：在流式应用A更新的情况下，流计算系统的主控节点获取流式应用A更新后的逻辑模型D2；

S502：主控节点通过对比更新后的逻辑模型D2以及初始逻辑模型D1，以确定待调整的数据流；

S503：主控节点根据待调整的数据流，生成升级指令；

S504：主控节点将生成的升级指令下发给第一工作节点，其中，第一工作节点是与待调整的数据流相关的PE所在的工作节点，该升级指令用于指示第一工作节点调整其上分布的PE之间的数据流走向。

需要说明的是，本发明实施例中的待调整的数据流可以为一条，也可以为多条，视具体的情况而定，而对于每条待调整的数据流来说，与其相关的PE具体是指该待调整的数据流的源PE和目的PE，其中，该待调整的数据流的源PE为输出该待调整的数据流的PE,待调整的数据流的目的PE为接收该待调整的数据流的PE或该待调整的数据流的源PE的下游PE。

本发明实施例提供的流式应用升级方法及流计算系统，通过对比流式应用发生更新前后逻辑模型的差异，动态确定待调整的数据流，并根据待调整的数据流生成相应的升级指令下发给工作节点，从而在不需要中断业务的情况下，实现流计算系统中流式应用的在线升级。

在本发明实施例中，流式应用的逻辑模型用于表示处理该流式应用的数据的多个PE以及该多个PE之间的数据流走向；当流式应用发生升级或更新后，其逻辑模型也相应地发生更新，通常情况下，更新后的逻辑模型与初始的逻辑模型的差异主要分为两种类型：(1)初始逻辑模型所表示的PE与更新后的逻辑模型所表示的PE完全相同，仅仅是PE之间的数据流走向发生变化；(2)初始逻辑模型所表示的PE与更新后的逻辑模型所表示的PE不完全相同，同时PE之间的数据流走向也发生变化；针对上述两种类型的差异，下面分别介绍相应的处理流程。

在一个具体的实施例中，如图6所示，流式应用的初始逻辑模型所表示的PE与该流式应用更新后的逻辑模型所表示的PE完全相同，而PE之间的数据流走向发生变化，根据图6，流式应用更新前后，其逻辑模型中的PE均为PE1-PE7，完全相同，但是数据流走向发生了变化，即原来由PE4流向PE6的数据流变为由PE4流向PE7的数据流S11，同时新增了从PE2流向PE6的数据流S12。在这种情况下，流式应用升级方法的主要流程如下：

步骤1：通过比较流式应用的初始逻辑模型以及该流式应用更新后的逻辑模型，确定待调整的数据流；其中，该待调整的数据流包括一条或多条数据流；具体地，在一个优选的实施例中，待调整的数据流可以包括：待新增的数据流、待删除的数据流或待更新的数据流中的至少一种，其中待更新的数据流是指流式应用的逻辑模型更新后目的节点或者源节点之一发生变化的数据流；具体到图6所示的情形，待调整的数据流包括：待新增的数据流S12、待更新的数据流S11。

步骤2：根据待调整的数据流，生成升级指令；其中，升级指令可以包括一条或多条指令，且升级指令与待调整的数据流的类型相关，例如，若待待调整的数据流包括待新增的数据流和待更新的数据流，则生成的升级指令包括：用于新增数据流的指令和用于更新数据流的指令；其中不同类型的升级指令可以可以为单独的指令，也可以集成到一条指令当中，也本发明不做特别限定。具体到图6所示的情形，生成的升级指令包括：新增数据流S12的指令和将数据流S6更新为S11的指令。

步骤3：将生成的升级指令下发给第一工作节点，第一工作节点是与待调整的数据流相关的PE所在的工作节点；可以理解的是，第一工作节点可能为一个或多个，第一工作节点在接收到该升级指令后，执行升级指令所指示的操作，比如新增数据流S12，以及将数据流S6更新为S11，从而使得第一工作节点上分布的PE之间的数据流走向发生调整，并且调整之后的数据流走向与更新后的逻辑模型相匹配。

进一步的，由于在第一工作节点对其上分布的PE之间的数据流进行调整时，可能会使正在处理的数据发生丢失，因此需要对数据进行恢复，具体地，在一个实施例中，在第一工作节点对其上分布的PE之间的数据流进行调整之前，主控节点根据与待调整的数据流相关的PE的输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE和该目标PE执行数据恢复的检查点checkpoint；向该目标PE所在工作节点下发数据恢复指令，该数据恢复指令用于指示该目标PE根据该checkpoint恢复数据；当主控节点确定第一工作节点完成调整，且第一工作节点上分布的PE准备就绪之后，主控节点触发该目标PE将恢复的数据输入该目标PE的下游PE进行处理。

需要说明的是，主控节点可以通过主动发送询问消息的方式感知流计算系统中各个工作节点上PE的状态，也可以由工作节点将自身分布的各个PE的状态上报给主控节点，PE的状态包括：运行状态、就绪状态和停止状态；当PE与上下游的PE的通道建立成功，就表示PE出于就绪状态，可以接收数据流并进行处理了。

可选地，主控节点在执行上述流式应用升级方法步骤之前，还可以根据上述流式应用的初始逻辑模型配置多个PE对流式应用的数据进行处理。

本发明实施例提供的流式应用升级方法，通过对比流式应用发生更新前后逻辑模型的差异，动态确定待调整的数据流，并生成相应的升级指令下发给工作节点，以完成流式应用的在线升级，从而可以保证应用升级过程中不需要中断原先业务；进一步的，通过在升级的过程中对数据进行恢复，以确保不会造成关键数据丢失，影响业务运行。

在另一个具体的实施例中，如图7所示，流式应用的初始逻辑模型所表示的PE与该流式应用更新后的逻辑模型所表示的PE不完全相同，且PE之间的数据流走向也发生了变化，根据图7，流式应用更新前后，其逻辑模型中的PE数目发生了变化(PE2、PE3、PE4和PE6被删除，新增了PE9-PE13)，数据流走向也发生了变化，即原来的数据流S4、S5、S6和S7被删除，同时新增了数据流S11-S16，原来的数据流S3的目的PE发生了更新，原来的数据流S9的源PE发生了更新。在这种情况下，如图8所示，流式应用升级方法的主要流程如下：

S801：主控节点通过比较流式应用的初始逻辑模型以及该流式应用更新后的逻辑模型，确定待调整的PE和待调整的数据流；其中，该待调整的PE包括一个或多个PE，该待调整的数据流包括一条或多条数据流；具体地，在一个优选的实施例中，该待调整的PE包括：待新增的PE或待删除的PE中的至少一种，待调整的数据流可以包括：待新增的数据流、待删除的数据流或待更新的数据流中的至少一种。

具体地，如图9所示，主控节点通过对比流式应用更新前后的逻辑模型，可以确定需要将原始逻辑模型中PE2、PE3、PE4和PE6组成的子逻辑模型替换成由PE9-PE13组成的子逻辑模型，才能与更新后的逻辑模型相同；因此，确定PE2、PE3、PE4、PE6，以及PE9-PE13为待调整的PE(其中，PE2、PE3、PE4和PE6为待删除的PE，PE9-PE13为待新增的PE)，以及确定与待调整的PE相关的数据流，即待调整的PE的所有输入流和输出流为待调整的流，如图9中的虚线部分所指示的流为待删除的数据流，黑色加粗部分所指示的流为待新增的数据流，浅色加粗部分所指示的流为待更新的数据流。

S802：主控节点根据待调整的数据流，生成第一升级指令；根据待调整的PE生成第二升级指令；其中，第一升级指令和第二升级指令分别可以包括一条或多条指令，且第一升级指令与待调整的数据流的类型相关，第二升级指令与待调整的PE的类型相关，例如，若待调整的数据流包括待新增的数据流和待更新的数据流，则生成的第一升级指令包括：用于新增数据流的指令和用于更新数据流的指令；若待调整的PE包括待新增的PE，则生成的第二升级指令包括：用于新增PE的指令；其中，第一升级指令和第二升级指令可以为单独的指令，也可以集成到一条指令中，也本发明不做特别限定。具体到图7所示的情形，生成的第一升级指令包括：删除数据流的指令、新增数据流的指令和更新数据流的指令，第二升级指令包括：新增PE的指令，删除PE的指令。

在一个具体的实施例中，如图9所示，主控节点通过对比流式应用更新前后的逻辑模型，确定出待调整的PE和待调整的流之后，可以进一步确定调整策略，即如何对PE和流进行调整，才能使得调整之后PE的部署情况(包括PE的个数以及PE之间数据流的依赖关系)与流式应用更新后的逻辑模型相匹配。调整策略包含两部分内容：(1)PE数目的调整策略，即需要新增哪些PE和/或需要删除哪些PE；(2)PE之间数据流走向的调整策略，即哪些PE的数据流走向需要更新，哪些数据流需要增加，以及哪些数据流需要删除。

在一个优选的实施例中，调整策略主要包括如下情形中的至少一种：

(1)更新流:数据流的目的节点或者源节点之一发生变化；

(2)删除流:数据流流在应用更新后需废弃；

(3)新增流:数据流原先不存在，应用更新后新增的流；

(4)删除PE:应用更新后需废弃的PE；

(5)新增PE:应用更新后新增的PE。

具体到图7和图9所示的逻辑模型，结合图10可以看出，需要新增5个PE(PE9-PE13)，以及新增PE9-PE13之间的数据流；需要删除PE2、PE3、PE4和PE6，以及删除PE2、PE3、PE4和PE6之间的数据流；同时，由于PE1的输出流的目的PE发生了变化(由PE2变为PE9)，PE7的输入流也发生了变化(由PE6的输出流变为PE13的输出流，即流的源节点发生变化)，因此，需要对PE1的输出流和PE7的输入流进行更新。基于上述分析，可以得出调整策略为：

(1)新增PE9-PE13；

(2)新增PE9-PE13之间的流；其中，PE9-PE13之间的数据流走向是由更新后的逻辑模型决定的；

(3)删除PE2、PE3、PE4和PE6；

(4)删除PE2、PE3、PE4和PE6之间的流；

(5)将PE1的输出流的目的PE由PE2改为PE9；将PE7的输入流的源PE由PE6改为PE13。

调整策略确定之后，基于确定出的调整策略，主控节点即可生成升级指令，升级指令用于指示工作节点(具体而言是待调整的PE所在的工作节点和待调整的数据流所涉及的PE所在的工作节点)实施确定出的调整策略。与调整策略相对应，升级指令包括：新增PE指令、删除PE指令、更新流指令、删除流指令或新增流指令中的至少一个。具体到图7和图9所示的逻辑模型，升级指令具体包括：

(1)新增PE9-PE13的指令；

(2)新增PE9-PE13之间的流的指令；

(3)删除PE2、PE3、PE4和PE6的指令；

(4)删除PE2、PE3、PE4和PE6之间的流的指令；

(5)将PE1的输出流的目的PE由PE2改为PE9的指令，以及将PE7的输入流的源PE由PE6改为PE13的指令。

S803：主控节点将生成的第一升级指令下发给第一工作节点，将生成的第二升级指令下发给第二工作节点，其中，第一工作节点是与待调整的数据流相关的PE所在的工作节点，第二工作节点包括待调整的PE所在的工作节点；可以理解的是，第一工作节点和第二工作节点均可能为一个或多个，并且第一工作节点和第二工作节点可以存在重叠，即一个工作节点可能即属于第一工作节点，也同时属于第二工作节点；第一升级指令用于指示第一工作节点调整其上分布的PE之间的数据流走向，第二升级指令用于指示所述第二工作节点调整其上分布的PE的数目；第一工作节点和第二工作节点在接收到升级指令后，执行升级指令所指示的操作，从而使得第一工作节点和第二工作节点上分布的PE以及PE之间的数据流走向得到调整。可以理解的是，第二工作节点调整其上分布的PE的数目具体可以是创建新的PE和/或删除已创建的PE。

可选地，在一个具体的实施例中，如果待调整的PE包括待删除的PE；则第二工作节点包括该待删除的PE所在的工作节点；第二升级指令用于指示该第二工作节点删除该待删除的PE。

可选地，在另一个具体的实施例中，如果待调整的PE包括待新增的PE；则第二工作节点可以为主控节点根据流计算系统中各个工作节点的负载状况选择的工作节点，也可以为主控节点随机选择的工作节点；第二升级指令用于指示第二工作节点创建该待新增的PE。

具体到图7和图9所示的逻辑模型，如图11所示，主控节点将新增PE9指令发送给worker2，将新增PE10的指令发送给worker3，将新增PE11和PE11的指令发送给worker4，将新增PE13的指令发送给worker6；将删除PE2、PE3的指令发送给worker3，将删除PE4、PE6的指令发送给worker4；将删除PE2和PE3之间流的指令发送给PE2和PE3初始所在的工作节点worker3，将删除PE3和PE6之间数据流的指令发送给PE3所在的工作节点worker3和PE6所在的工作节点worker4；其余的指令以此类推，此处不再赘述。需要说明的是，每个工作节点都维护了该工作节点上所有PE的数据流配置信息，每个PE的数据流配置信息包括源地址、目的地址、端口号等信息，因此对数据流的删除和更新，实质上是通过修改数据流配置信息来实现的。

如图11所示，根据主控节点下发的升级指令，worker 2新增了PE9，worker3删除了PE2、PE3，新增了PE10，worker 4删除了PE6、PE4，新增了PE11， PE12，worker 6新增了PE13；同时，worker1-6通过删除流、新增流、更新流等操作，对PE之间的数据流走向也进行了调整，具体而言：新增了PE9-PE13之间的流，删除了PE2、PE3、PE4和PE6之间的流，将PE1的输出流的目的PE由PE2改为PE9；将PE7的输入流的源PE由PE6改为PE13。从图11可以看出，调整之后PE的部署情况(包括PE的个数以及PE之间数据流的依赖关系)与流式应用A更新后的逻辑模型相匹配。

进一步的，由于在第一工作节点和第二工作节点对其上分布的PE以及PE之间的数据流进行调整时，可能会使正在处理的数据发生丢失，因此需要对数据进行恢复，具体地，在一个实施例中，该流式应用升级方法还包括：

S804：主控节点根据与待调整的数据流相关的PE的输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE和该目标PE执行数据恢复的检查点checkpoint；向该目标PE所在工作节点下发数据恢复指令，该数据恢复指令用于指示该目标PE根据该checkpoint恢复数据；当主控节点确定第一工作节点和第二工作节点完成调整，且第一工作节点和第二工作节点上分布的PE准备就绪之后，主控节点触发该目标PE将恢复的数据输入该目标PE的下游PE进行处理。需要说明的是，主控节点可以通过主动发送询问消息的方式感知流计算系统中各个工作节点上PE的状态，也可以由工作节点将自身分布的各个PE的状态上报给主控节点，PE的状态包括：运行状态、就绪状态和停止状态；当PE与上下游的PE的通道建立成功，就表示PE出于就绪状态，可以接收数据流并进行处理了。

在流式应用更新或升级过程中，因为调整PE的部署需要涉及数据流的调整，而在对PE的部署进行调整时，可能有些数据正在处理，为了保证升级过程中数据不丢失，需要根据待调整的数据流相关的PE的的原始输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE和所述目标PE执行数据恢复的检查点checkpoint，以保证在应用升级之前尚未被PE处理完毕的数据在升级完成之后能够继续被重新处理；其中，这里所说的需要恢复的数据，通常是指元组。

在一个具体的实施例中，如图12所示，待调整的数据流相关的{PE1，PE2,PE3,PE4,PE6,PE7}组成的子逻辑模型的输入/输出关系如下:元组i₁、i₂、i₃和i₄由PE1输入PE2之后，经PE2处理之后得到元组k₁、k₂、k₃和j₁，然后元组k₁、k₂、k₃被输入PE4进行处理，得到m₁，元组j₁被输入PE3进行处理，得到l₁，PE6对m₁处理之后得到O₂，对l₁处理之后得到O₁。基于上述输入/输出关系，可分析得到待调整的PE的输入流和输出流的依赖关系，如图13所示：

O₁依赖于PE6的输入l₁，而l₁依赖于j₁，j₁又依赖于i₂，所以对于整个子逻辑模型而言，PE6的输出O₁依赖于PE2的输入i₂；

O₂依赖于PE6的输入m₁，而m₁依赖于PE4的输入k₁、k₂和k₃，k₁、k₂和k₃又依赖于i₁、i₃和i₄，所以对于整个子逻辑模型而言，PE6的输出O₂依赖于PE2的输入i₁、i₃和i₄。通过分析得出的上述依赖关系可知，PE2,PE3,PE4和PE6均依赖于PE1的输出，因此，当第一工作节点和第二工作节点对其上分布的PE以及PE之间的数据流进行调整时，PE2,PE3,PE4和PE6中尚有数据未被处理完毕，则PE1需要对数据恢复，即PE1为目标PE。

进一步地，根据第一工作节点和第二工作节点对其上分布的PE以及PE之间的数据流进行调整时，待调整的数据流相关的PE备份的最新的状态数据，可以确定输入待调整的数据流相关的PE的数据当前是否已经处理完毕并输出给下游PE，进而可以确定目标PE执行数据恢复的检查点checkpoint。需要说明的是，PE的状态数据用于表示PE的处理数据状态，其具体包含的内容是本领域技术人员熟知的，例如状态数据可包括：元组接收队列中的缓存数据、消息通道中的缓存数据、PE在处理自身接收队列中的一个或多个普通元组的过程中产生的数据(比如当前处理的普通元组的处理结果及中间过程数据)中的一种或多种数据。需要说明的是，由于新增数据流并不需要进行数据恢复，因此在确定执行数据恢复的checkpoint，以及需要进行数据恢复的目标PE时，不需要用到待新增数据流相关的PE的状态信息，以及待新增数据流相关的PE的输入流和输出流的依赖关系。例如在一个实施例中，因此如果待调整的数据流中包括：待更新的数据流、待删除的数据流和待新增的数据流，则只需要根据待更新的数据流以及待删除的数据流相关的PE的状态数据，就可以确定执行数据恢复的checkpoint，根据待更新的数据流以及待删除的数据流相关的PE的输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE；类似的，如果待调整的数据流中包括：待更新的数据流和待新增的数据流，则只需要根据待更新的数据流相关的PE的状态数据，以及待更新的数据流相关的PE的输入流和输出流的依赖关系，就可以确定执行数据恢复的checkpoint，以及需要进行数据恢复的目标PE。

需要说明的是，在本发明的一个实施例中，PE的状态数据是周期性备份的，即流计算系统周期性地触发各个PE对自身的状态数据进行备份，PE在收到检查点(checkpoint)事件之后，进行将自身当前的状态数据进行备份，并记录checkpoint，同时清理过期的数据。本领域技术人员可以理解的是，checkpoint可以理解为数据备份的记录点或者是备份数据的索引，一个checkpoint对应于一次数据备份操作，在不同的时候备份的数据具有不同的checkpoint，且通过checkpoint可以查询并得到在该checkpoint下备份的数据。在本发明的另一个实施例中，可以使用输出触发机制(由PE输出触发)来进行状态数据的备份，如图14所示，当PE完成对输入流Input_Stream1-5的处理，并输出处理结果Output_Stream1时，触发模块触发状态数据处理模块，状态数据处理模块进而启动新的checkpoint记录PE最新的状态数据至内存或磁盘，这样的触发方式精准有效，相比于周期性触发的方式，效率更好，可避免过多的资源消耗；进一步地，状态数据处理模块还可以清理上一个checkpoint记录的历史数据，从而减少中间数据，有效节省存储空间。

下面以图12所示的情形为例，详细说明根据PE的输入流和输出流的依赖关系和状态数据来确定需要进行数据恢复的目标PE和该目标PE执行数据恢复的检查点checkpoint的过程：若根据待调整的数据流相关的{PE1，PE2,PE3,PE4,PE6,PE7}的状态数据判断出输入PE6尚未完成对元组m₁的处理，或者对元组m₁处理之后得到的O₂尚未送达PE6的下游PE：PE7，则根据上述输入流和输出流的依赖关系可以确定出：O₂所依赖的i₁、i₃和i₄需要被恢复，且应该由输出i₁、i₃和i₄的PE1来完成数据恢复，即需要恢复数据的目标PE为PE1，从而可以确定出可以恢复出i₁、i₃和i₄的checkpoint。这样，在第一工作节点和第二工作节点调整自身PE的部署情况之前，目标PE可以根据确定出的checkpoint恢复数据i₁、i₃和i₄，且当第一工作节点和所述第二工作节点完成调整，且第一工作节点和第二工作节点上分布的PE准备就绪之后，目标PE重新将恢复的数据i₁、i₃和i₄其下游PE进行处理，从而确保升级过程中不会发生数据的丢失，达到无损升级的目的。

基于上述方法及系统实施例，本发明实施例还提供一种流计算系统中的主控节点，该主控节点可以为一台计算机或服务器；该流计算系统还包括至少一个工作节点；假设该流计算系统上部署有流式应用A，多个执行单元(PE)分布于上述至少一个工作节点中的一个或多个工作节点上，用于对流式应用A的数据进行处理，其中流式应用A的逻辑模型用于表示处理该流式应用的数据的多个PE以及该多个PE之间的数据流走向；假设流式应用A的初始逻辑模型为D1，当流式应用A发生升级或更新后，其逻辑模型也相应地发生更新(假设更新后的逻辑模型为D2)，如图15所示，主控节点30包括：

获取及确定模块301，用于在流式应用A发生更新的情况下，获取流式应用A更新后的逻辑模型D2，并通过对比更新后的逻辑模型D2以及初始逻辑模型D1，以确定待调整的数据流；

升级指令生成模块302，用于根据待调整的流，生成升级指令；

发送模块303，用于将生成的升级指令下发给第一工作节点，以使第一工作节点根据该升级指令的指示，调整第一工作节点上分布的PE之间的数据流走向；其中第一工作节点是流计算系统包含的工作节点中的一个或多个工作节点，且第一工作节点是与待调整的数据流相关的PE所在的工作节点。

本发明实施例提供的流计算系统中的主控节点，通过对比流式应用发生更新前后逻辑模型的差异，动态确定待调整的数据流，并根据待调整的数据流生成相应的升级指令下发给工作节点，从而在不需要中断业务的情况下，实现流计算系统中流式应用的在线升级。

进一步地，根据更新后的逻辑模型与初始的逻辑模型的差异的类型，获取及确定模块301的在具体的处理细节上也存在一定差异。例如，在一个优选的实施例中，获取及比较模块301具体用于：

比较流式应用A的初始逻辑模型以及所述更新后的逻辑模型，以确定待调整的数据流，其中流式应用A的初始逻辑模型D1所表示的PE与更新后的逻辑模型D2所表示的PE相同。

在另一个优选的实施例中，获取及比较模块301具体用于：比较初始逻辑模型D1以及更新后的逻辑模型D2，以确定待调整的PE以及待调整的数据流，其中流式应用A的初始逻辑模型D1所表示的PE与更新后的逻辑模型D2所表示的PE不完全相同。相应地，在这种情况下，升级指令生成模块302具体用于，根据获取及比较模块301确定的待调整的数据流，生成第一升级指令；根据获取及比较模块301确定的待调整的PE生成第二升级指令；发送模块303具体用于：将:第一升级指令下发给第一工作节点，将第二升级指令下发给第二工作节点，其中第二工作节点包括待调整的PE所在的工作节点，第一升级指令用于指示第一工作节点调整其上分布的PE之间的数据流走向，第二升级指令用于指示第二工作节点调整其上分布的PE的数目。

进一步地，在一个优选的实施例中，主控节点30还包括：

数据恢复模块304，用于根据与待调整的数据流相关的PE的输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE和该目标PE执行数据恢复的checkpoint；

发送模块303还用于，在数据恢复模块304确定出目标PE和checkpoint之后，向所述目标PE所在工作节点下发数据恢复指令，所述数据恢复指令用于指示所述目标PE根据所述checkpoint恢复数据；可以理解的是，该数据恢复指令是根据数据恢复模块304确定出的目标PE和checkpoint中来构造的，其包含有指示该checkpoint的信息。

相应地，主控节点30还包括：输入触发模块305，用于当确定第一工作节点完成调整，且第一工作节点上分布的PE均准备就绪之后，触发数据恢复模块304确定出的目标PE将恢复的数据输入所述目标PE的下游PE进行处理。

本发明实施例提供的流计算系统中的主控节点，通过对比流式应用发生更新前后逻辑模型的差异，动态确定待调整的数据流，并生成相应的升级指令下发给工作节点，以完成流式应用的在线升级，从而可以保证应用升级过程中不需要中断原先业务；进一步的，由于在升级的过程中对数据进行了恢复，因此不会造成关键数据丢失，影响业务运行。

本发明提供的流计算系统中的主控节点用于实施上述方法实施例中的流式应用升级方法，其具体实现细节，可以参照上述方法实施例，此处不再赘述。

本发明实施例还提供一种流计算系统，用于实现本发明实施例提供的流式应用升级方法，如图16所示，该流计算系统包括：主控节点30和至少一个工作节点(如图16中的工作节点31-34)；主控节点30根据流式应用的初始逻辑模型配置多个执行单元(PE)来对该流式应用的数据流进行处理，流式应用的初始逻辑模型用于表示处理所述流式应用的数据的多个PE以及该多个PE之间的数据流走向；其中，如图16所示，配置的多个PE分布于一个或多个工作节点上；主控节点30用于：在流式应用A发生更新的情况下，获取流式应用更新后的逻辑模型，并通过对比更新后的逻辑模型以及初始逻辑模型，以确定待调整的数据流；根据待调整的流，生成升级指令；将生成的升级指令下发给第一工作节点，其中第一工作节点是该流计算系统包含的工作节点中的一个或多个工作节点，且第一工作节点是与待调整的数据流相关的PE所在的工作节点。

第一工作节点，用于接收主控节点30发送的升级指令，根据该升级指令的指示，调整第一工作节点上分布的PE之间的数据流走向。

本发明实施例提供的流计算系统，通过对比流式应用发生更新前后逻辑模型的差异，动态确定待调整的数据流，并生成相应的升级指令下发给工作节点，以完成流式应用的在线升级，从而可以保证应用升级过程中不需要中断原先业务。

具体地，在一个实施例中，升级指令包括：新增PE指令、删除PE指令、更新流指令、删除流指令或新增流指令中的至少一个。相应地，第一工作节点在接收到升级指令后执行：新增执行单元、删除执行单元、更新流、删除流或新增流中的至少一项操作，使得执行上述操作之后PE的部署情况(包括PE的个数以及PE之间数据流的依赖关系)与流式应用A更新后的逻辑模型相匹配。

优选地，在一个实施例中，主控节点具体用于：比较流式应用的初始逻辑模型以及所述更新后的逻辑模型，以确定待调整的数据流，其中流式应用的初始逻辑模型所表示的PE与更新后的逻辑模型所表示的PE相同。

优选地，在另一个实施例中，主控节点具体用于：比较流式应用的初始逻辑模型以及更新后的逻辑模型，以确定待调整的PE以及待调整的数据流，其中流式应用的初始逻辑模型所表示的PE与更新后的逻辑模型所表示的PE不完全相同；根据待调整的数据流，生成第一升级指令；根据待调整的PE生成第二升级指令；将第一升级指令下发给第一工作节点，将第二升级指令下发给第二工作节点；其中，第一工作节点是与待调整的数据流相关的PE所在的工作节点，第二工作节点包括待调整的PE所在的工作节点。相应地，第一工作节点具体用于，接收主控节点30发送的第一升级指令，根据第一升级指令的指示，调整第一工作节点上分布的PE之间的数据流走向；第二工作节点用于，接收主控节点30发送的第二升级指令，根据第二升级指令的指示，调整第二工作节点上分布的PE的数目。

优选地，在另一个实施例中，主控节点30还用于，根据与待调整的数据流相关的PE的输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE和该目标PE执行数据恢复的检查点checkpoint；向该目标PE所在工作节点下发数据恢复指令，该数据恢复指令用于指示该目标PE根据该checkpoint恢复数据；当确定第一工作节点完成调整，且第一工作节点上分布的PE均准备就绪之后，触发该目标PE将恢复的数据输入该目标PE的下游PE进行处理。

需要说明的是，本发明提供的流计算系统用于实施上述方法实施例这种的流式应用升级方法，其具体实现细节，可以参照上述方法实施例，此处不再赘述。本发明实施例中的执行单元(PE)可以以软件形态存在，例如进程、线程或软件功能模块，也可以以硬件的形态存在，比如处理器核，或具有数据处理能力的逻辑电路等，通过读取存储器中的可执行代码或业务处理逻辑，实现本发明实施例所描述的功能，本发明不做特别限定。

本发明实施例还提供一种流计算系统中的主控节点，该主控节点可以为一台计算机或服务器。图17是本发明实施例提供的主控节点40的结构示意图。主控节点40可包括输入设备410、输出设备420、处理器430和存储器440。

本发明实施例提供的主控节点40应用于流计算系统，所述流计算系统还包括工作节点，所述流计算系统部署有流式应用。

存储器440可以包括只读存储器和随机存取存储器，并向处理器430提供指令和数据。存储器440的一部分还可以包括非易失性随机存取存储器(NVRAM)。

存储器440存储了操作指令、操作系统(包括各种系统程序，用于实现各种基础业务以及处理基于硬件的任务)、可执行模块或者数据结构，或者它们的子集，或者它们的扩展集。

在本发明实施例中，当该流式应用发生更新后，处理器430通过调用存储器440存储的操作指令(该操作指令可存储在操作系统中)，执行如下操作：

通过输入设备410获取该流式应用更新后的逻辑模型，通过对比更新后的逻辑模型以及初始逻辑模型，以确定待调整的数据流；根据待调整的流，生成升级指令；将生成的升级指令下发给第一工作节点，其中第一工作节点是该流计算系统包含的工作节点中的一个或多个工作节点，且第一工作节点是与待调整的数据流相关的PE所在的工作节点。

本发明实施例提供的主控节点，对比流式应用发生更新前后逻辑模型的差异，动态确定待调整的数据流，并生成相应的升级指令下发给工作节点，以完成流式应用的在线升级，从而可以保证应用升级过程中不需要中断原先业务。

处理器430控制业务处理的装置40的操作，处理器430还可以称为CPU(Central Processing Unit，中央处理单元)。存储器440可以包括只读存储器和随机存取存储器，并向处理器430提供指令和数据。存储器440的一部分还可以包括非易失性随机存取存储器(NVRAM)。具体的应用中，业务处理的装置40的各个组件通过总线系统450耦合在一起，其中总线系统450除包括数据总线之外，还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见，在图中将各种总线都标为总线系统450。

上述本发明实施例揭示的方法可以应用于处理器430中，或者由处理器430实现。处理器430可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器430中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器430可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器440，处理器430读取存储器440中的信息，结合其硬件完成上述方法的步骤。

应该理解，在本申请所提供的几个实施例所揭露数据备份和流计算系统还可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例提供的网络设备中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

一种流式应用升级方法，其特征在于，应用于流计算系统中的主控节点，所述流计算系统包括所述主控节点和至少一个工作节点，其中，多个执行单元PE分布于所述至少一个工作节点中的一个或多个工作节点上，用于对所述流计算系统上部署的流式应用的数据进行处理，其中所述流式应用的初始逻辑模型用于表示处理所述流式应用的数据的所述多个PE以及所述多个PE之间的数据流走向；所述方法包括：

在所述流式应用更新的情况下，所述主控节点获取所述流式应用更新后的逻辑模型，并通过比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，确定待调整的数据流；

根据所述待调整的数据流，生成升级指令；

将所述升级指令下发给第一工作节点，所述第一工作节点是与所述待调整的数据流相关的PE所在的工作节点，所述升级指令用于指示所述第一工作节点调整所述第一工作节点上分布的PE之间的数据流走向。
根据权利要求1所述的升级方法，其特征在于，所述比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，确定待调整的数据流包括：

比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，以确定所述待调整的数据流，其中所述流式应用的初始逻辑模型所表示的PE与所述更新后的逻辑模型所表示的PE相同。
根据权利要求1所述的升级方法，其特征在于，所述通过比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，确定待调整的数据流包括：

比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，以确定待调整的PE以及所述待调整的数据流，其中所述流式应用的初始逻辑模型所表示的PE与所述更新后的逻辑模型所表示的PE不完全相同；

所述根据所述待调整的数据流，生成升级指令包括：

根据所述待调整的数据流，生成第一升级指令；根据所述待调整的PE生成第二升级指令；

所述将所述升级指令下发给第一工作节点包括：

将所述第一升级指令下发给所述第一工作节点，将所述第二升级指令下发给第二工作节点，所述第二工作节点包括所述待调整的PE所在的工作节点；所述第一升级指令用于指示所述第一工作节点调整所述第一工作节点上分布的PE之间的数据流走向，所述第二升级指令用于指示所述第二工作节点调整所述第二工作节点上分布的PE的数目。
根据权利要求1-3任一项所述的升级方法，其特征在于，还包括：

所述主控节点根据与所述待调整的数据流相关的PE的输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE和所述目标PE执行数据恢复的检查点checkpoint；

向所述目标PE所在工作节点下发数据恢复指令，所述数据恢复指令用于指示所述目标PE根据所述checkpoint恢复数据；

当确定所述第一工作节点完成调整，且所述第一工作节点上分布的PE准备就绪之后，所述主控节点触发所述目标PE将恢复的数据输入所述目标PE的下游PE进行处理。
根据权利要求4所述的升级方法，其特征在于，所述待调整的数据流包括：待更新的数据流和待删除的数据流；所述主控节点根据与所述待调整的数据流相关的PE的输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE和所述目标PE执行数据恢复的检查点checkpoint，包括：

所述主控节点根据与所述待更新的数据流和待删除的数据流相关的PE的状态数据，确定执行数据恢复的checkpoint；根据与所述待更新的数据流和待删除的数据流相关的PE的输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE；其中，每个PE的状态数据是该PE在输出事件的触发下备份的，用于指示该PE处理数据的状态。
根据权利要求3至5任一项所述的升级方法，其特征在于，所述待调整的PE包括待新增的PE；所述第二工作节点为所述主控节点根据所述流计算系统中各个工作节点的负载状况选择的工作节点；所述第二升级指令用于指示所述第二工作节点创建所述待新增的PE。
根据权利要求3至6任一项所述的升级方法，其特征在于，所述待调整的PE包括待删除的PE；所述第二工作节点为所述待删除的PE所在的工作节点；所述第二升级指令用于指示所述第二工作节点删除所述待删除的PE。
根据权利要求1至7任一项所述的升级方法，其特征在于，还包括：

根据所述流式应用的初始逻辑模型配置所述多个PE对所述流式应用的数据进行处理。
根据权利要求1至8任一项所述的升级方法，其特征在于，所述流式应用的初始逻辑模型是用有向无环图DAG表示的。
一种流计算系统中的主控节点，其特征在于，所述流计算系统包括所述主控节点和至少一个工作节点；其中，多个执行单元PE分布于所述至少一个工作节点中的一个或多个工作节点上，用于对所述流计算系统上部署的流式应用的数据进行处理，其中所述流式应用的初始逻辑模型用于表示处理所述流式应用的数据的所述多个PE以及所述多个PE之间的数据流走向；所述主控节点包括：

获取及比较模块，用于在所述流式应用更新的情况下，获取所述流式应用更新后的逻辑模型，并通过比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，确定待调整的数据流；

升级指令生成模块，用于根据所述待调整的数据流，生成升级指令；

发送模块，用于将所述升级指令下发给第一工作节点，所述第一工作节点是与所述待调整的数据流相关的PE所在的工作节点，所述升级指令用于指示所述第一工作节点调整所述第一工作节点上分布的PE之间的数据流走向。
根据权利要求10所述的主控节点，其特征在于，所述获取及比较模块具体用于：

比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，以确定所述待调整的数据流，其中所述流式应用的初始逻辑模型所表示的PE与所述更新后的逻辑模型所表示的PE相同。
根据权利要求10所述的主控节点，其特征在于，所述获取及比较模块具体用于：比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，以确定待调整的PE以及所述待调整的数据流，其中所述流式应用的初始逻辑模型所表示的PE与所述更新后的逻辑模型所表示的PE不完全相同；

所述升级指令生成模块具体用于，根据所述待调整的数据流，生成第一升级指令；根据所述待调整的PE生成第二升级指令；

所述发送模块具体用于，将所述第一升级指令下发给所述第一工作节点，将所述第二升级指令下发给第二工作节点，所述第二工作节点包括所述待调整的PE所在的工作节点；所述第一升级指令用于指示所述第一工作节点调整所述第一工作节点上分布的PE之间的数据流走向，所述第二升级指令用于指示所述第二工作节点调整所述第二工作节点上分布的PE的数目。
根据权利要求10至12任一项所述的主控节点，其特征在于，还包括：

数据恢复模块，用于根据与所述待调整的数据流相关的PE的输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE和所述目标PE执行数据恢复的检查点checkpoint；

所述发送模块还用于，向所述目标PE所在工作节点下发数据恢复指令，所述数据恢复指令用于指示所述目标PE根据所述checkpoint恢复数据；

所述主控节点还包括：输入触发模块，用于当确定所述第一工作节点完成调整，且所述第一工作节点上分布的PE准备就绪之后，触发所述目标PE将恢复的数据输入所述目标PE的下游PE进行处理。
根据权利要求13所述的主控节点，其特征在于，所述待调整的数据流包括：待更新的数据流和待删除的数据流；所述数据恢复模块具体用于：

所述主控节点根据与所述待更新的数据流和待删除的数据流相关的PE的状态数据，确定执行数据恢复的checkpoint；根据与所述待更新的数据流和待删除的数据流相关的PE的输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE；其中，每个PE的状态数据是该PE在输出事件的触发下备份的，用于指示该PE处理数据的状态。
根据权利要求12至14任一项所述的主控节点，其特征在于，所述待调整的PE包括待删除的PE；所述第二工作节点为所述待删除的PE所在的工作节点；所述第二升级指令用于指示所述第二工作节点删除所述待删除的PE。
根据权利要求12至15任一项所述的主控节点，其特征在于，所述待调整的PE包括待新增的PE；所述第二工作节点为所述主控节点根据所述流计算系统中各个工作节点的负载状况选择的工作节点；所述第二升级指令用于指示所述第二工作节点创建所述待新增的PE。
一种流计算系统，其特征在于，包括：主控节点和至少一个工作节点，其中，多个执行单元PE分布于所述至少一个工作节点中的一个或多个工作节点上，用于对所述流计算系统上部署的流式应用的数据进行处理，其中所述流式应用的初始逻辑模型用于表示处理所述流式应用的数据的所述多个PE以及所述多个PE之间的数据流走向；

所述主控节点用于：在所述流式应用更新的情况下，获取所述流式应用更新后的逻辑模型，并通过比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，确定待调整的数据流；根据所述待调整的数据流，生成升级指令；将所述升级指令下发给第一工作节点，所述第一工作节点是与所述待调整的数据流相关的PE所在的工作节点，所述升级指令用于指示所述第一工作节点调整所述第一工作节点上分布的PE之间的数据流走向；

所述第一工作节点，用于接收所述主控节点发送的升级指令，根据所述升级指令的指示，调整所述第一工作节点上分布的PE之间的数据流走向。
根据权利要求17所述的流计算系统，其特征在于，在比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，确定待调整的数据流的方面，所述主控节点具体用于：比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，以确定所述待调整的数据流，其中所述流式应用的初始逻辑模型所表示的PE与所述更新后的逻辑模型所表示的PE相同。
根据权利要求17所述的流计算系统，其特征在于，所述主控节点具体用于，比较所述流式应用的初始逻辑模型以及所述更新后的逻辑模型，以确定待调整的PE以及所述待调整的数据流，其中所述流式应用的初始逻辑模型所表示的PE与所述更新后的逻辑模型所表示的PE不完全相同；根据所述待调整的数据流，生成第一升级指令；根据所述待调整的PE生成第二升级指令；

将所述第一升级指令下发给所述第一工作节点，将所述第二升级指令下发给第二工作节点，所述第二工作节点包括所述待调整的PE所在的工作节点；

所述第一工作节点具体用于，接收所述主控节点发送的所述第一升级指令，根据所述第一升级指令的指示，调整所述第一工作节点上分布的PE之间的数据流走向；

所述第二工作节点具体用于，接收所述主控节点发送的所述第二升级指令，根据所述第二升级指令的指示调整所述第二工作节点上分布的PE的数目。
根据权利要求17至19任一项所述的流计算系统，其特征在于，所述主控节点还用于，根据与所述待调整的数据流相关的PE的输入流和输出流的依赖关系，确定需要进行数据恢复的目标PE和所述目标PE执行数据恢复的检查点checkpoint；向所述目标PE所在工作节点下发数据恢复指令，所述数据恢复指令用于指示所述目标PE根据所述checkpoint恢复数据；当确定所述第一工作节点完成调整，且所述第一工作节点上分布的PE准备就绪之后，触

发所述目标PE将恢复的数据输入所述目标PE的下游PE进行处理。