WO2023005590A1

WO2023005590A1 - 用于图计算的自适应控制

Info

Publication number: WO2023005590A1
Application number: PCT/CN2022/102927
Authority: WO
Inventors: 成强; 游东海; 刘志臻; 梁磊
Original assignee: 支付宝(杭州)信息技术有限公司
Priority date: 2021-07-27
Filing date: 2022-06-30
Publication date: 2023-02-02
Also published as: CN113434702A

Abstract

本说明书实施例公开了一种用于图计算的自适应控制方法和系统。该方法包括控制图计算引擎对待处理图数据执行多轮图计算操作，以完成对待处理图数据的处理。其中，一轮控制，包括：获取当前轮以前的一轮或多轮图计算操作的历史计算任务量以及历史执行信息；历史执行信息反映图计算引擎执行相应轮图计算操作时的性能状态；基于历史计算任务量、历史执行信息以及待处理图数据的剩余计算任务，确定当前轮计算任务；将当前轮计算任务发送给图计算引擎，使得图计算引擎基于待处理图数据执行当前轮计算任务对应的图计算操作。

Description

用于图计算的自适应控制

技术领域

本说明书实施例涉及图计算技术领域，特别涉及一种用于图计算的自适应控制方法及系统。

背景技术

目前，知识图谱作为一种典型的图数据，在不同领域有着广泛的应用，例如，医疗、金融、社交分析、自然科学以及交通领域。图计算是在这种数据结构上的计算模式。对于知识图谱而言，图计算可以包括规则推理、图表示学习等。近年来，图数据规模呈指数级增长，可能达到数十亿的节点和数万亿的边，随着图数据规模的不断增大，对于图计算能力的要求越来越高。

为此，在大规模图数据的图计算场景下，如何高效地利用图计算设备的计算资源是亟待解决的问题。

发明内容

本说明书实施例的一个方面提供一种用于图计算的自适应控制方法，所述方法包括控制图计算引擎对待处理图数据执行多轮图计算操作，以完成对待处理图数据的处理。其中，一轮控制包括：获取当前轮以前的一轮或多轮图计算操作的历史计算任务量以及历史执行信息；所述历史执行信息反映图计算引擎执行相应轮图计算操作时的性能状态；基于所述历史计算任务量、历史执行信息以及待处理图数据的剩余计算任务，确定当前轮计算任务；将所述当前轮计算任务发送给图计算引擎，使得图计算引擎基于所述待处理图数据执行所述当前轮计算任务对应的图计算操作。

本说明书实施例的一个方面提供一种用于图计算的自适应控制系统，所述系统用于控制图计算引擎对待处理图数据执行多轮图计算操作，以完成对待处理图数据的处理，所述系统包括：第一获取模块，用于在一轮控制中获取当前轮以前的一轮或多轮图计算操作的历史计算任务量以及历史执行信息；所述历史执行信息反映图计算引擎执行相应轮图计算操作时的性能状态；当前轮计算任务确定模块，用于在一轮控制中基于所述历史计算任务量、历史执行信息以及待处理图数据的剩余计算任务，确定当前轮计算任务；第一发送模块，用于在一轮控制中将所述当前轮计算任务发送给图计算引擎，使得图计算引擎基于所述待处理图数据执行所述当前轮计算任务对应的图计算操作。

本说明书实施例的一个方面提供一种用于图计算的自适应控制方法，所述方法包括控制图计算引擎对待处理图数据执行多轮图计算操作，以完成对待处理图数据的处理，其中的一轮控制，包括：获取当前轮以前的一轮或多轮图计算操作的历史计算任务量以及历史执行信息；所述历史执行信息反映图计算引擎执行相应轮图计算操作时的性能状态；至少基于所述历史计算任务量以及历史执行信息，确定当前轮计算任务量；将所述当前轮计算任务量发送给图计算引擎，使得图计算引擎基于所述待处理图数据执行所述当前轮计算任务量的图计算操作。

本说明书实施例的一个方面提供一种用于图计算的自适应控制系统，所述系统用于控制图计算引擎对待处理图数据执行多轮图计算操作，以完成对待处理图数据的处理，所述系统包括：第二获取模块，用于获取当前轮以前的一轮或多轮图计算操作的历史计算任务量以及历史执行信息；所述历史执行信息反映图计算引擎执行相应轮图计算操作时的性能状态；当前轮计算任务量确定模块，用于至少基于所述历史计算任务量以及历史执行信息，确定当前轮计算任务量；第二发送模块，用于将所述当前轮计算任务量发送给图计算引擎，使得图计算引擎基于所述待处理图数据执行所述当前轮计算任务量的图计算操作。

本说明书实施例的一个方面提供一种图计算的自适应控制装置，所述装置包括至少一个处理器和至少一个存储设备，所述存储设备用于存储指令，当所述至少一个处理器执行所述指令时，导致所述装置实现如前任意一项所述的方法。

本说明书实施例的一个方面提供一种图计算设备，包括图计算引擎与自适应控制装置；所述图计算引擎用于图计算操作；所述自适应控制装置用于控制图计算引擎对待处理图数据执行多轮图计算操作，以完成对待处理图数据的处理，其中每轮图计算操作的计算任务或计算任务量由所述自适应控制装置指定。

附图说明

本说明书将以示例性实施例的方式进一步描述，这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的，在这些实施例中，相同的编号表示相同的结构，其中：

图1是根据本说明书的一些实施例所示的图计算设备的示例性示意图；

图2是根据本说明书的一些实施例所示的用于图计算的自适应控制方法的示例性流程图；

图3是根据本说明书的一些实施例所示的确定计算任务量的示例性流程图；

图4是根据本说明书的一些实施例所示的用于图计算的自适应控制方法的示例性流程图。

具体实施方式

为了更清楚地说明本说明书实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地，下面描述中的附图仅仅是本说明书的一些示例或实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明，图中相同标号代表相同结构或操作。

应当理解，本说明书中所使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而，如果其他词语可实现相同的目的，则可通过其他表达来替换所述词语。

如本说明书和权利要求书中所示，除非上下文明确提示例外情形，“一”、“一个”、“一种”和/或“该”等词并非特指单数，也可包括复数。一般说来，术语“包括”与“包含”仅提示包括已明确标识的步骤和元素，而这些步骤和元素不构成一个排它性的罗列，方法或者设备也可能包含其它的步骤或元素。

本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是，前面或后面操作不一定按照顺序来精确地执行。相反，可以按照倒序或同时处理各个步骤。同时，也可以将其他操作添加到这些过程中，或从这些过程移除某一步或数步操作。

本说明书的一个或多个实施例所披露的技术方案可以应用于图计算场景。一般地，图计算可以包括图谱推理或图表示学习等。知识图谱是图数据的一种典型应用，本说明书将以知识图谱为主进行介绍，在无特别说明的情况下，知识图谱的相关内容亦适用于其他图数据。知识图谱(或简称为图谱)可以是指将对象(例如，实体，其包括概念、属性值)表示为图中的节点，对象之间的关联关系表示为图中的节点之间连接的边，进而以一个网络化的结构表征所获得的知识。图谱推理可以是指根据现有的知识图谱中的已知事实，推断出新的事实，例如，给定一个实体和关系，确定与该实体有此关系的另一个实体。图表示学习可以是指学习实体和关系的向量化表示。在一些实施例中，图计算可以通过利用图计算引擎对全图的节点进行运算实现，不同的图计算框架(即图计算引擎)约定了图计算的不同计算单元，该计算单元可以包括节点、边或子图。图计算框架基于计算单元完成图计算。以节点为计算单元的图计算框架为例，在这种图计算框架下，图算法会被细粒度划分为每个节点上的计算操作，所有节点独立的并行执行计算操作。又例如，可以将知识图谱拆分为以每个节点为中心的n跳子图，将各n跳子图作为计算单元，通过对各子图的处理，进而完成对全图数据的处理。

在一些实施例中，可以通过以下方法实现全图的图计算操作：(1)利用图计算引擎直接对全图进行计算；(2)将全图中的所有计算单元分成固定的N份，逐一触发图计算引擎的图计算操作。然而，上述方法(1)并不适用于大规模的图数据场景，当数据量巨大时，图计算的计算过程中会产生大量的中间结果，导致计算性能低下甚至导致计算任务崩溃。上述方法(2)由于每次迭代计算时计算相同数量的计算单元，无法很好地适应计算资源的波动，例如，在集群计算高峰期时由于资源抢占严重，图计算引擎的计算性能下降，而无法及时反压(如减少计算任务以适应计算压力的增加)；集群计算低谷期时又无法充分利用图计算引擎的计算资源，进而无法充分利用集群资源。本说明书的一个或多个实施例披露了一种用于图计算的自适应控制方法，基于历史计算任务量和历史执行信息，自适应的确定每一轮迭代的计算任务量，以动态调整每一轮迭代计算时图计算引擎的计算任务。进而避免由于图数据过多、图结构过稠密导致的中间结果过多的问题；且通过该动态调整可以在高峰期任务产出时效性低于期望时反压，增加计算系统的稳定性，在低峰期资源充足时自动增加计算单元的数量以充分利用计算资源，近似地达到全局最优的计算效果。以下结合附图，以对本说明书所披露的技术方案进行详细阐述。

图1是根据本说明书的一些实施例所示的图计算设备的示例性示意图。在一些实施例中，该图计算设备100可以用于实现本说明书的一个或多个实施例披露了一种用于图计算的自适应控制方法。

图计算设备100可以是对图结构数据(即图数据)进行数据处理的设备，例如，图数据存储、图数据分析等。图计算设备可以用于挖掘数据之间潜在的行为和联系。例如，用户的转账关系或用户的购买行为等。在一些实施例中，图计算设备100可以基于全图进行多轮迭代计算，通过持续迭代可以实现对全图所有节点的计算，并通过每轮的迭代得到其计算的结果，进而得到全图的计算结果。如图1所示，图计算设备100可以包括图计算引擎110与自适应控制装置120。

在一些实施例中，图计算引擎可以用于执行图计算操作。在一些实施例中，图计算引擎可以对待处理图数据执行多轮图计算操作，通过多轮图计算操作可以实现对待处理图数据中所有节点的计算，以完成对待处理图数据的处理。关于待处理图数据的具体细节可以参见步骤202及其相关描述，在此不再赘述。

在一些实施例中，图计算引擎可以包括但不限于以下的一种或多种组合：单机全内存图计算引擎、单机内存+磁盘图计算引擎、分布式内存图计算引擎等。在一些实施例中，不同的图计算引擎可以利用不同的图算法执行图计算操作。例如，单机全内存图计算引擎可以包括Page Rank算法，分布式内存图计算引擎可以包括标签传播算法(Label Propagation Algorithm,LPA)等。对于单机图计算引擎而言，图计算引擎110的物理载体可以是单个服务器，对于分布式图计算引擎而言，图计算引擎110的物理载体可以是多个服务器或多个计算节点，多个计算节点可以是部署在一个或多个服务器上的程序。在一些实施例中，图计算引擎可以基于待处理图数据执行每轮计算任务对应的图计算操作。关于执行每轮计算任务对应的图计算操作的具体细节可以参见下述步骤206及其相关描述，在此不再赘述。

在一些实施例中，自适应控制装置可以用于控制图计算引擎对待处图理数据执行多轮图计算操作，以完成对待处理图数据的处理。在一些实施例中，自适应控制装置可以指定每轮图计算操作的计算任务或计算任务量。关于自适应控制装置的控制方法及指定计算任务或计算任务量的具体细节可以参见图2或图4及其相关描述，在此不再赘述。

图2是根据本说明书的一些实施例所示的用于图计算的自适应控制方法的示例性流程图。在一些实施例中，所述方法可以包括控制图计算引擎对待处理图数据执行多轮图计算操作，以完成对待处理图数据的处理。如图2所示，其中的一轮控制200可以包括步骤202至步骤206。在一些实施例中，步骤202至步骤206可以由自适应控制装置执行，例如，由自适应控制装置中的自适应控制系统实现。

步骤202，获取当前轮以前的一轮或多轮图计算操作的历史计算任务量以及历史执行信息。在一些实施例中，步骤202可以由第一获取模块执行。

在一些实施例中，待处理图数据可以是当前需要进行图计算的图数据。在一些实施例中，待处理图数据可以是大规模图数据。例如，待处理图数据可以是包括千万级别的边或亿级别的边的图数据。在一些实施例，计算任务量可以反映图数据中参与计算任务的数据的数量。计算任务可以通过两个角度来反映，其一是执行计算的目标，可由实际应用场景具体确定，其二可以表征为为达到前述目标需要处理的数据，例如图数据中参与计算的数据。例如，计算任务可以是确定图数据中具有转账关系的用户，在另一个层面，计算任务可以是需要遍历图数据中所有边，找出转账关系的边进而得到与转账关系的边连接的用户节点。计算任务在本说明书中主要取其第二中含义。在一些实施例中，可以用计算单元表征计算任务，对应的，在一些实施例中，计算任务量可以反映计算单元的数量。

在一些实施例中，计算单元可以为以下的一种或多种的组合：节点、边、子图。对应的，计算任务量可以反映以下的一种或多种的组合：参与当前计算的节点的数量、边的数量、子图的数量。

在一些实施例中，历史计算任务量可以是当前轮以前的一轮或多轮图计算操作的计算单元的数量，例如，节点或边的数量。当前轮以前的一轮或多轮图计算操作可以是对待处理图数据的图计算操作。关于图计算操作的具体细节可以参见图1及其相关描述，在此不再赘述。

在一些实施例中，历史执行信息可以反映图计算引擎执行相应轮图计算操作时的性能状态。在一些实施例中，性能状态可以与计算任务相关的计算量或复杂度相关。在相同计算对象(例如，相同的图数据)的条件下，可以具备不同的计算任务，不同计算任务的计算复杂度可能不同。例如，以表示商品购买关系的图数据为例，若某轮计算任务为确定用户购买商品的行为，其为一度传播计算，若某轮计算任务为基于邻居用户的购物行为确定当前用户可能的购物行为，其为二度传播计算，可以理解的，二度传播计算的复杂度大于一度传播计算。

在一些实施例中，性能状态可以通过执行时间或执行速度来反映。当执行时间越长，可以认为性能状态越差，反之则越好。在一些实施例中，执行速度可以间接反映执行时间，可以理解的，自适应控制装置通过获取历史计算任务量和执行时间，得到执行速度。在一些实施例中，自适应控制装置也可以从图计算引擎获取其执行速度，如从图计算引擎的执行日志中获取。

在一些实施例中，自适应控制装置自身可以确定每轮计算任务，进而得到图计算引擎在每轮图计算中的历史计算任务量。且自适应控制装置可以将每轮计算任务发送给图计算引擎，进而触发图计算引擎的图计算操作，因此，自适应控制装置自身可以知晓图计算引擎执行每轮图计算操作的起始时间和结束时间(图计算引擎返回计算结果的时间)，进而，其自身可以获得执行时间，且可以通过计算得到执行速度。

步骤204，基于所述历史计算任务量、历史执行信息以及待处理图数据的剩余计算任务，确定当前轮计算任务。在一些实施例中，步骤204可以由当前轮计算任务确定模块执行。

关于计算任务量的具体细节可以参见上述步骤202及其相关描述，在此不再赘述。

在一些实施例中，若当前轮不是对待处理图数据的第一轮图计算操作，则自适应控制装置可以基于历史计算任务量以及历史执行信息，确定计算任务量。关于计算任务量的具体细节可以参见上述步骤202及其相关描述，在此不再赘述。在一些实施例中，自适应控制装置可以基于历史计算任务量以及历史执行信息，利用预设算法确定计算任务量。在一些实施例中，预设算法可以包括但不限于梯度下降算法和/或慢启动算法等。在一些实施例中，历史计算任务量以及历史执行信息可以来自对所述待处理图数据进行的历史轮次的图计算操作，也可以来自此前对其他图数据进行的图计算操作。

梯度下降算法可以用于确定目标函数的局部最优值。在一些实施例中，目标函数可以反映完成待处理图数据的处理的总执行时间或每轮计算任务的执行时间，其与每轮计算任务或计算任务量相关。在一些实施例中，可以基于梯度下降算法确定每轮计算任务量，使得基于此计算任务量执行的当前轮图计算操作的执行时间或完成待处理图数据的处理的总执行时间在局部最小，或执行速度在局部最大。

慢启动原是传输控制协议使用的一种阻塞控制机制，在本说明书中也可以用于确定每轮图计算的计算任务量以优化图计算引擎的性能状态。关于梯度下降算法或慢启动算法确定计算任务量的具体细节，可以参见图3及其相关描述，在此不再赘述。

在一些实施例中，当前轮计算任务确定模块可以基于所述待处理图数据的剩余计算任务和所述计算任务量，确定当前轮计算任务。

在一些实施例中，待处理图数据的剩余计算任务包括待处理图数据中未进行图计算的计算单元。例如，以计算单元为节点为例，若待处理图数据包括一千万个节点，通过历史的图计算操作已对其中的八百万个节点进行了图计算，则待处理图数据的剩余计算任务可以包括两百万个节点。如前所述，节点或边可以具备不同的类别，因此，待处理数据的剩余计算任务还可以反映未进行图计算的计算单元的类别。例如，两百万个节点各自的类别。

在一些实施例中，自适应控制装置可以基于计算任务量从待处理数据的剩余计算任务中确定若干个计算单元，并作为当前轮计算任务。示例地，若计算任务量为1000个节点，待处理数据的剩余计算任务包括20000个用户节点以及40000个商户节点，此时自适应控制装置可以从剩余计算任务中确定300个用户节点和700个商品节点，作为若干个计算单元，且用户节点和商品节点的总数为1000。在一些实施例中，可以从对应类别的剩余计算任务中随机选取若干个计算单元，得到当前轮计算任务。例如，可以从剩余计算任务中的20000个用户节点中随机选取300个用户节点作为当前轮计算任务的用户节点。

在一些实施例中，自适应控制装置还可以判断计算任务量是否超出待处理图数据的剩余计算任务量；当判断结果为不超出时，则可以按照前述步骤确定当前轮计算任务，可以理解，此时当前轮计算任务中的计算单元数量与计算任务量相同；当判断结果为超出时，则可以将待处理图数据的剩余计算任务直接作为当前轮计算任务。在一些实施例中，自适应控制装置可以将计算任务量发送给图计算引擎，由图计算引擎基于计算任务量自行确定当前轮计算任务，并执行。关于这种方式的具体内容可以参见图4的相关说明。

步骤206，将所述当前轮计算任务发送给图计算引擎，使得图计算引擎基于所述待处理图数据执行所述当前轮计算任务对应的图计算操作。在一些实施例中，步骤206可以由第一发送模块执行。

关于步骤206的具体细节可以参见图1及其相关描述，在此不再赘述。

在一些实施例中，若当前轮为对待处理图数据的第一轮图计算操作，计算任务量可以基于预设规则获取，预设规则可以根据实际情况具体设置。在一些实施例中，预设规则可以是确定待处理图数据包括的计算单元所属的所有类别，在各个类别的计算节点中分别选取预设份数作为计算任务量。预设份数可以为经验取值，例如，预设份数可以是比例值，如五百分之一或八百分之一等。示例地，以图数据表示商品购买关系，其所有节点类别包括用户和商品为例，假设即用户节点的总数为一千万，商品节点的总数为两千万，预设份数为五百分之一，则计算任务量可以包括两万个用户节点和四万个商品节点，该计算任务量反映的节点(即计算单元)的数量为六万个。自适应控制装置可以从待处理图数据中取两万个用户节点和四万个商品节点，作为当前轮计算任务；将当前轮计算任务发送给图计算引擎，使得图计算引擎基于待处理图数据执行当前轮计算任务对应的图计算操作。

如前文所述，步骤202至步骤206为自适应控制装置执行的其中一轮控制。通过该轮控制，自适应控制装置可以基于历史计算任务量及历史执行信息，动态确定当前轮的计算任务量，使得在高峰期任务产出时效低于期望时反压，以增加图计算设备的稳定性，在低峰期资源充足时自动增大计算任务量，以充分利用计算资源，近似地达到图计算引擎的全局最优的计算效果。同时，在每轮中仅基于当前轮计算任务量进行图计算操作，实现对待处理图数据的分片，逐一提交给图计算引擎进行图计算，以避免待处理图数据的规模过大，图结构过稠密，导致的计算过程中的中间结果过多或无法完成计算等问题。

应当理解，流程200涉及的自适应控制系统及其模块可以利用各种方式来实现。例如，在一些实施例中，装置及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中，硬件部分可以利用专用逻辑来实现；软件部分则可以存储在存储器中，由适当的指令执行装置，例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和装置可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本说明书的装置及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用例如由各种类型的处理器所执行的软件实现，还可以由上述硬件电路和软件的结合(例如，固件)来实现。

图3是根据本说明书的一些实施例所示的确定计算任务量的示例性流程图。如图3所示，流程300可以包括步骤302、304及306。在一些实施例中，步骤302、304及306可以由自适应控制装置执行，例如，可以由自适应控制系统的当前轮计算任务确定模块实现。

步骤302，基于当前轮前两轮的历史计算任务量以及历史执行信息，确定执行信息相对于计算任务量的梯度信息。

在一些实施例中，可以构建反映任务总耗时的目标函数，示例性的目标函数可以是：T＝∑ _it(n _i)；T表示总耗时，t(n _i)表示第i轮的执行时间，n _i表示第i轮图计算操作的计算量。仅作为示例，可以认为t(n _i)是n _i的正比例函数。

自适应控制装置可以确定执行时间相对于计算任务量的梯度信息。在一些实施例中，可以通过下述公式(1)得到梯度

s表示梯度；T _i-1、T _i-2分别表示两轮历史图计算操作的执行时间；n _i-1、n _i-2分别表示对应的历史计算任务量。

在一些实施例中，可以获取当前轮的前两轮的历史计算任务量以及历史执行信息并基于公式(1)计算得到执行时间相对于计算任务量的梯度信息。

步骤304，基于所述梯度信息确定调整量。

在一些实施例中，自适应控制装置可以将梯度信息表征的数值直接确定为调整量。在一些实施例中，自适应控制装置可以基于预设学习率和梯度确定调整量。例如，将预设学习率与梯度的乘积确定为调整量。在一些实施例中，自适应控制装置可以通过公式p*s确定调整量；其中，p为预设学习率，其为(0,1)的数值，s为梯度。

步骤306，基于所述调整量更新当前轮的前一轮历史计算任务量，得到所述计算任务量。

在一些实施例中，自适应控制装置可以基于当前轮的前一轮历史计算任务量与调整量的差值，完成所述更新，得到计算任务量。仍以上述示例为例，则计算任务量可以通过该公式得到：n _i＝n _i-1-p*s；其中，n _i为计算任务量，n _i-1为当前轮的前一轮历史计算任务量，p*s为上述调整量。

在一些实施例中，自适应控制装置可以基于历史计算任务量以及历史执行信息，通过慢启动算法，确定计算任务量。

具体的，可以获取前一轮图计算的历史计算任务量及历史执行时间。当历史执行时间小于设定阈值，且历史计算任务量小于门限窗口时，则基于历史计算任务量快速增加当前轮的计算任务量，例如确定计算任务量是历史计算任务量的两倍或更多。如果历史执行时间小于设定阈值，但历史计算任务量已超出门限窗口，则基于历史计算任务量缓慢增加当前轮的计算任务量，如在历史计算任务量的基础上增加固定数量的计算单元，如增加10000个计算单元。在一些实施例中，门限窗口可以有一个预设的值，并在控制过程中动态更新。例如，当前一轮图计算的历史执行时间超出设定阈值时，则将预设比例(如0.5)的历史计算任务量作为更新后的门限窗口，同时将当前轮的计算任务量设置为一个预设的较小的起始任务量，如5000个计算单元。

图4是根据本说明书的一些实施例所示的用于图计算的自适应控制方法的示例性流程图。在一些实施例中，所述方法可以包括控制图计算引擎对待处理图数据执行多轮图计算操作，以完成对待处理图数据的处理。如图4所示，其中的一轮控制流程400可以包括步骤402、404及406。在一些实施例中，步骤402、404及406可以由自适应控制装置执行，例如由设置于自适应控制装置上的自适应控制系统实现。

步骤402，获取当前轮以前的一轮或多轮图计算操作的历史计算任务量以及历史执行信息；所述历史执行信息反映图计算引擎执行相应轮图计算操作时的性能状态。在一些实施例中，步骤402可以由第二获取模块执行。

在一些实施例中，计算任务量可以反映计算单元的数量，计算单元为以下一种或多种的组合：节点、边、子图。步骤402与步骤202类似，其具体细节可以参见步骤202及其相关描述，在此不再赘述。

步骤404，至少基于所述历史计算任务量以及历史执行信息，确定当前轮计算任务量。在一些实施例中，步骤404可以由当前轮计算任务量确定模块执行。

在一些实施例中，自适应控制装置可以基于历史计算任务量以及历史执行信息，确定计算任务量。关于确定计算任务量的具体细节可以参见步骤204及其相关描述，在此不再赘述。在一些实施例中，自适应控制装置可以直接将计算任务量确定为当前轮计算任务量，发送给图计算引擎。在又一些实施例中，自适应控制装置可以基于待处理图数据的剩余计算任务量和计算任务量，确定当前轮计算任务量。具体的，自适应控制装置可以判断计算任务量是否超出待处理图数据的剩余计算任务量；当判断结果为不超出时，则将计算任务量确定为当前轮计算任务量；当判断结果为超出时，则将待处理图数据的剩余计算任务量作为当前轮计算任务量。

步骤406，将所述当前轮计算任务量发送给图计算引擎，使得图计算引擎基于所述待处理图数据执行所述当前轮计算任务量的图计算操作。在一些实施例中，步骤406可以由第二发送模块执行。

在一些实施例中，自适应控制装置可以将当前轮计算任务量发送给图计算引擎，从而，图计算引擎可以基于当前轮计算任务量确定当前轮计算任务，并对待处理图数据中与该计算任务对应的计算单元进行图计算操作。关于图计算引擎基于当前轮任务量确定当前轮计算任务的方法类似于步骤204相关描述中的基于计算任务量确定当前轮计算任务的过程，在此不再赘述。

应当理解，流程400涉及的自适应控制系统及其模块可以利用各种方式来实现。例如，在一些实施例中，装置及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中，硬件部分可以利用专用逻辑来实现；软件部分则可以存储在存储器中，由适当的指令执行装置，例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和装置可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本说明书的装置及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用例如由各种类型的处理器所执行的软件实现，还可以由上述硬件电路和软件的结合(例如，固件)来实现。

本说明书实施例还提供一种用于图计算的自适应控制系统，所述系统用于控制图计算引擎对待处理图数据执行多轮图计算操作，以完成对待处理图数据的处理。所述系统包括第一获取模块、当前轮计算任务确定模块、及第一发送模块。所述第一获取模块可以用于在一轮控制中获取当前轮以前的一轮或多轮图计算操作的历史计算任务量以及历史执行信息；所述历史执行信息反映图计算引擎执行相应轮图计算操作时的性能状态。所述当前轮计算任务确定模块可以用于在一轮控制中基于所述历史计算任务量、历史执行信息以及待处理图数据的剩余计算任务，确定当前轮计算任务。所述第一发送模块可以用于在一轮控制中将所述当前轮计算任务发送给图计算引擎，使得图计算引擎基于所述待处理图数据执行所述当前轮计算任务对应的图计算操作。

本说明书实施例还提供一种用于图计算的自适应控制系统，所述系统用于控制图计算引擎对待处理图数据执行多轮图计算操作，以完成对待处理图数据的处理。所述系统包括第二获取模块、当前轮计算任务量确定模块、及第二发送模块。所述第二获取模块可以用于获取当前轮以前的一轮或多轮图计算操作的历史计算任务量以及历史执行信息；所述历史执行信息反映图计算引擎执行相应轮图计算操作时的性能状态。所述当前轮计算任务量确定模块可以用于至少基于所述历史计算任务量以及历史执行信息，确定当前轮计算任务量。所述第二发送模块可以用于将所述当前轮计算任务量发送给图计算引擎，使得图计算引擎基于所述待处理图数据执行所述当前轮计算任务量的图计算操作。

应当理解，图计算的自适应控制系统及其模块可以利用各种方式来实现。例如，在一些实施例中，系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中，硬件部分可以利用专用逻辑来实现；软件部分则可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本说明书的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用例如由各种类型的处理器所执行的软件实现，还可以由上述硬件电路和软件的结合(例如，固件)来实现。

本说明书实施例还提供一种用于图计算的自适应控制装置，所述装置包括至少一个处理器和至少一个存储设备，所述存储设备用于存储指令，当所述至少一个处理器执行所述指令时，导致所述装置实现如前任意一项所述的方法。

本说明书实施例还提供一种图计算设备，包括图计算引擎与自适应控制装置；所述图计算引擎用于图计算操作；所述自适应控制装置用于控制图计算引擎对待处理图数据执行多轮图计算操作，以完成对待处理图数据的处理，其中每轮图计算操作的计算任务或计算任务量由所述自适应控制装置指定。

上文已对基本概念做了描述，显然，对于本领域技术人员来说，上述详细披露仅仅作为示例，而并不构成对本说明书的限定。虽然此处并没有明确说明，本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议，所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。

同时，本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此，应强调并注意的是，本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外，本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。

此外，本领域技术人员可以理解，本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述，包括任何新的和有用的工序、机器、产品或物质的组合，或对他们的任何新的和有用的改进。相应地，本说明书的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外，本说明书的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品，该产品包括计算机可读程序编码。

计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号，例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式，包括电磁形式、光形式等，或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质，该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播，包括无线电、电缆、光纤电缆、RF、或类似介质，或任何上述介质的组合。

本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写，包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等，常规程序化编程语言如C语言、Visual Basic、Fortran2003、Perl、COBOL2002、PHP、ABAP，动态编程语言如Python、Ruby和Groovy，或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或处理设备上运行。在后种情况下，远程计算机可以通过任何网络形式与用户计算机连接，比如局域网(LAN)或广域网(WAN)，或连接至外部计算机(例如通过因特网)，或在云计算环境中，或作为服务使用如软件即服务(SaaS)。

此外，除非权利要求中明确说明，本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用，并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例，但应当理解的是，该类细节仅起到说明的目的，附加的权利要求并不仅限于披露的实施例，相反，权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如，虽然以上所描述的系统组件可以通过硬件设备实现，但是也可以只通过软件的解决方案得以实现，如在现有的处理设备或移动设备上安装所描述的系统。

同理，应当注意的是，为了简化本说明书披露的表述，从而帮助对一个或多个发明实施例的理解，前文对本说明书实施例的描述中，有时会将多种特征归并至一个实施例、附图或对其的描述中。但是，这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上，实施例的特征要少于上述披露的单个实施例的全部特征。

一些实施例中使用了描述成分、属性数量的数字，应当理解的是，此类用于实施例描述的数字，在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明，“大约”、“近似”或“大体上”表明所述数字允许有±20％的变化。相应地，在一些实施例中，说明书和权利要求中使用的数值参数均为近似值，该近似值根据个别实施例所需特点可以发生改变。在一些实施例中，数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值，在具体实施例中，此类数值的设定在可行范围内尽可能精确。

针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料，如文章、书籍、说明书、出版物、文档等，特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外，对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是，如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方，以本说明书的描述、定义和/或术语的使用为准。

最后，应当理解的是，本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此，作为示例而非限制，本说明书实施例的替代配置可视为与本说明书的教导一致。相应地，本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。

Claims

一种用于图计算的自适应控制方法，所述方法包括控制图计算引擎对待处理图数据执行多轮图计算操作，以完成对待处理图数据的处理，其中的一轮控制，包括：

获取当前轮以前的一轮或多轮图计算操作的历史计算任务量以及历史执行信息；所述历史执行信息反映图计算引擎执行相应轮图计算操作时的性能状态；

基于所述历史计算任务量、历史执行信息以及待处理图数据的剩余计算任务，确定当前轮计算任务；

将所述当前轮计算任务发送给图计算引擎，使得图计算引擎基于所述待处理图数据执行所述当前轮计算任务对应的图计算操作。
如权利要求1所述的方法，其中，计算任务量反映计算单元的数量；所述待处理图数据的剩余计算任务包括所述待处理图数据中未进行图计算的计算单元。
如权利要求2所述的方法，所述计算单元为以下一种或多种的组合：节点、边、子图。
如权利要求2所述的方法，所述基于所述历史计算任务量、历史执行信息以及待处理图数据的剩余计算任务，确定当前轮计算任务，包括：

基于所述历史计算任务量以及所述历史执行信息，确定计算任务量；

基于所述计算任务量从所述待处理数据的剩余计算任务中确定若干个计算单元，作为所述当前轮计算任务。
如权利要求4所述的方法，所述基于所述计算任务量从所述待处理数据的剩余计算任务中确定若干个计算单元，作为所述当前轮计算任务，包括：

判断所述计算任务量是否超出待处理图数据的剩余计算任务量；

当判断结果为不超出时，当前轮计算任务中的计算单元数量与所述计算任务量相同；

当判断结果为超出时，当前轮计算任务包含所述待处理图数据的剩余计算任务。
如权利要求1所述的方法，所述性能状态为执行时间或执行速度。
如权利要求4所述的方法，所述基于所述历史计算任务量以及历史执行信息，确定计算任务量，包括：

基于所述历史计算任务量以及历史执行信息，确定执行信息相对于计算任务量的梯度信息；

基于所述梯度信息确定调整量；

基于所述调整量更新当前轮的前一轮历史计算任务量，得到所述计算任务量。
如权利要求4所述的方法，所述基于所述历史计算任务量以及历史执行信息，确定计算任务量，包括：

如果当前轮前一轮的历史执行时间小于设定阈值，且历史计算任务量小于门限窗口时，则基于历史计算任务量以第一增长率确定所述计算任务量；

如果当前轮前一轮的历史执行时间小于设定阈值，但历史计算任务量超出门限窗口，则基于历史计算任务量以第二增长率确定所述计算任务量；第一增长率大于第二增长率；

如果当前轮前一轮的历史执行时间超出设定阈值，则将预设比例的历史计算任务量作为更新后的门限窗口，同时将所述计算任务量设置为预设的起始任务量。
如权利要求1所述的方法，其中第一轮控制包括：

从所述待处理图数据获取预设数量的计算单元，作为当前轮计算任务；

将所述当前轮计算任务发送给图计算引擎，使得图计算引擎基于所述待处理图数据执行所述当前轮计算任务对应的图计算操作。
一种用于图计算的自适应控制系统，所述系统用于控制图计算引擎对待处理图数据执行多轮图计算操作，以完成对待处理图数据的处理，所述系统包括：

第一获取模块，用于在一轮控制中获取当前轮以前的一轮或多轮图计算操作的历史计算任务量以及历史执行信息；所述历史执行信息反映图计算引擎执行相应轮图计算操作时的性能状态；

当前轮计算任务确定模块，用于在一轮控制中基于所述历史计算任务量、历史执行信息以及待处理图数据的剩余计算任务，确定当前轮计算任务；

第一发送模块，用于在一轮控制中将所述当前轮计算任务发送给图计算引擎，使得图计算引擎基于所述待处理图数据执行所述当前轮计算任务对应的图计算操作。
一种用于图计算的自适应控制装置，所述装置包括至少一个处理器和至少一个存储设备，所述存储设备用于存储指令，当所述至少一个处理器执行所述指令时，导致所述装置实现如权利要求1～9中任意一项所述的方法。
一种用于图计算的自适应控制方法，所述方法包括控制图计算引擎对待处理图数据执行多轮图计算操作，以完成对待处理图数据的处理，其中的一轮控制，包括：

获取当前轮以前的一轮或多轮图计算操作的历史计算任务量以及历史执行信息；所述历史执行信息反映图计算引擎执行相应轮图计算操作时的性能状态；

至少基于所述历史计算任务量以及历史执行信息，确定当前轮计算任务量；

将所述当前轮计算任务量发送给图计算引擎，使得图计算引擎基于所述待处理图数据执行所述当前轮计算任务量的图计算操作。
如权利要求12所述的方法，计算任务量反映计算单元的数量；所述计算单元为以下一种或多种的组合：节点、边、子图。
如权利要求12所述的方法，所述至少基于所述历史计算任务量以及历史执行信息，确定当前轮计算任务量，包括：

基于所述历史计算任务量以及历史执行信息，确定计算任务量；

基于所述待处理图数据的剩余计算任务量和所述计算任务量，确定当前轮计算任务量。
一种用于图计算的自适应控制系统，所述系统用于控制图计算引擎对待处理图数据执行多轮图计算操作，以完成对待处理图数据的处理，所述系统包括：

第二获取模块，用于获取当前轮以前的一轮或多轮图计算操作的历史计算任务量以及历史执行信息；所述历史执行信息反映图计算引擎执行相应轮图计算操作时的性能状态；

当前轮计算任务量确定模块，用于至少基于所述历史计算任务量以及历史执行信息，确定当前轮计算任务量；

第二发送模块，用于将所述当前轮计算任务量发送给图计算引擎，使得图计算引擎基于所述待处理图数据执行所述当前轮计算任务量的图计算操作。
一种用于图计算的自适应控制装置，所述装置包括至少一个处理器和至少一个存储设备，所述存储设备用于存储指令，当所述至少一个处理器执行所述指令时，导致所述装置实现如权利要求12～14中任意一项所述的方法。
一种图计算设备，包括图计算引擎与自适应控制装置；

所述图计算引擎用于图计算操作；

所述自适应控制装置用于控制图计算引擎对待处理图数据执行多轮图计算操作，以完成对待处理图数据的处理，其中每轮图计算操作的计算任务或计算任务量由所述自适应控制装置指定。
如权利要求17所述的设备，所述自适应控制装置通过如权利要求1～9以及权利要求12～14中任一项所述的方法控制所述图计算引擎。