WO2024020897A1

WO2024020897A1 - 在计算设备之间分配计算任务的方法、装置及存储介质

Info

Publication number: WO2024020897A1
Application number: PCT/CN2022/108402
Authority: WO
Inventors: 张海涛; 王琪; 于禾; 张跃华
Original assignee: 西门子股份公司; 西门子（中国）有限公司
Priority date: 2022-07-27
Filing date: 2022-07-27
Publication date: 2024-02-01

Abstract

本发明实施方式公开了在计算设备之间分配计算任务的方法、装置及存储介质。方法包括：基于包含m个数据点的数据点集及包含n个规则的规则集，确定关系矩阵，关系矩阵中的元素Aij表征第i个数据点与第j个规则的适用关系；重排关系矩阵，以将关系矩阵中的非零元素移至靠近对角线；基于计算设备的约束条件，对重排后的关系矩阵进行关于计算任务的均衡分块，以得到多个子块，其中每个子块的非零元素之和为衡量该子块的计算任务的衡量因子；将每个子块的计算任务，分配给对应的计算设备。利用矩阵方式映射数据点和规则，将具有许多规则的许多数据点负载均衡地划分为子集，提高资源利用率，还可以基于约束条件和资源历史记录智能地分配计算任务。

Description

在计算设备之间分配计算任务的方法、装置及存储介质

技术领域

本发明涉及数据处理技术领域，特别是在计算设备之间分配计算任务的方法、装置及存储介质。

背景技术

为了确保生产的可靠性和连续性，许多工厂开始收集现场数据(field data)，以提高生产透明度和/或对生产设备进行预测性维护。大量的现场数据点会产生巨大的数据量。同时，存在处理这些数据的过程规则，例如过滤或求和，等等。来自数据点的所有数据被命名为数据集，而处理数据的所有规则被命名为规则集。

数据集和规则集通常都很大，因此需要强大的计算能力来处理关于数据集和规则集的计算任务。单个计算设备的计算能力通常有限，经常需要在多个计算设备之间分配计算任务。

然而，如何在计算设备之间合理分配计算任务是个尚待解决的技术问题。尤其是，在计算资源宝贵的边缘设备侧，这个问题更加突出。

发明内容

本发明实施方式提出在计算设备之间分配计算任务的方法、装置及存储介质。

一种在计算设备之间分配计算任务的方法，所述方法包括：

基于包含m个数据点的数据点集及包含n个规则的规则集，确定关系矩阵，所述关系矩阵中的元素A _ij表征第i个数据点与第j个规则的适用关系，其中m、n、i和j均为正整数，i小于或等于m，j小于或等于n；

重排所述关系矩阵，以将所述关系矩阵中的非零元素移至靠近对角线；

基于计算设备的约束条件，对重排后的所述关系矩阵进行关于计算任务的均衡分块，以得到多个子块，其中每个子块的非零元素之和为衡量该子块的计算任务的衡量因子；

将每个子块的计算任务，分配给对应的计算设备。

可见，本发明实施方式利用矩阵方式映射数据点及其规则，有利于统一分配具有许多规则的许多数据点，从而提高资源利用率。而且，本发明实施方式以子块的非零元素之和作为衡量该子块的计算任务的衡量因子，有利于负载均衡地分配计算任务，从而有利于高质量执行计算任务。另外，本发明实施方式可以基于约束条件智能分配计算任务，提高了可控性。

在示范性实施方式中，当第j个规则适用于所述第i个数据点时，所述A _ij为1；当第j个规则不适用于所述第i个数据点时，所述A _ij为0。

因此，可以基于规则适用状况为关系矩阵中的元素赋值，便于实施。

在示范性实施方式中，当第j个规则适用于所述第i个数据点时，所述A _ij为k；当第j个规则不适用于所述第i个数据点时，所述A _ij为0；

其中k＝d _i*r _j，其中d _i为第i个数据点在m个数据点中的运算量权重，r _j为第j个规则在n个规则中的运算量权重。

因此，可以基于规则适用状况、数据点的运算量权重及规则的运算量权重，为关系矩阵中的元素赋值，因此元素值中还体现了数据点的运算量权重及规则的运算量权重，便于准确分配计算任务。

在示范性实施方式中，还包括：

接收包含所述约束条件的用户输入；

从所述用户输入中提取所述约束条件；

其中所述约束条件包括下列约束因子中的至少一个：

计算设备的数目；计算设备的计算能力；计算设备的地理位置；计算设备的工作进度安排；计算设备的类型。

可见，约束条件具有多种实施方式，有利于提高适用性。

在示范性实施方式中，还包括：

从资源库中检索所述计算设备的历史资源利用率；

所述基于计算设备的约束条件，对重排后的所述关系矩阵进行关于计算任务的均衡分块包括：

对于历史资源利用率高于第一资源利用率门限值的计算设备，所分配的子块的衡量因子低于预定的第一衡量因子门限值，对于历史资源利用率低于第二资源利用率门限值的计算设备，所分配的子块的衡量因子高于预定的第二衡量因子门限值。

因此，可以基于历史资源利用率进行关于计算任务的均衡分块，还考虑到历史资源利用率对当前分块的影响，从而保证了分块的准确度。

在示范性实施方式中，还包括：

从执行分配到计算任务的计算设备接收包含资源利用率的反馈消息；

当所述资源利用率超过预先设定的第三资源利用率门限值时，对重排后的所述关系矩阵再次进行分块，其中分配给所述计算设备的计算任务被减少；

当所述资源利用率低于预先设定的第四资源利用率门限值时，对重排后的所述关系矩阵再次进行分块，其中分配给所述计算设备的计算任务被增加；

在资源库中存储所述资源利用率。

可见，可以基于计算设备的反馈调整分配结果，从而提高了分配的准确度。

一种在计算设备之间分配计算任务的装置，所述装置包括：

确定模块，被配置为基于包含m个数据点的数据点集及包含n个规则的规则集，确定关系矩阵，所述关系矩阵中的元素A _ij表征第i个数据点与第j个规则的适用关系，其中m、n、i和j均为正整数，i小于或等于m，j小于或等于n；

重排模块，被配置为重排所述关系矩阵，以将所述关系矩阵中的非零元素移至靠近对角线；

分块模块，被配置为基于计算设备的约束条件，对重排后的所述关系矩阵进行关于计算任务的均衡分块，以得到多个子块，其中每个子块的非零元素之和为衡量该子块的计算任务的衡量因子；

分配模块，被配置为将每个子块的计算任务，分配给对应的计算设备。

在示范性实施方式中，所述分块模块，被配置为接收包含所述约束条件的用户输入；从所述用户输入中提取所述约束条件；其中所述约束条件包括下列约束因子中的至少一个：计算设备的数目；计算设备的计算能力；计算设备的地理位置；计算设备的工作进度安排；计算设备的类型。

可见，约束条件具有多种实施方式，有利于提高适用性。

在示范性实施方式中，所述分块模块，被配置为从资源库中检索所述计算设备的历史资源利用率；对于历史资源利用率高于第一资源利用率门限值的计算设备，所分配的子块的衡量因子低于预定的第一衡量因子门限值，对于历史资源利用率低于第二资源利用率门限值的计算设备，所分配的子块的衡量因子高于预定的第二衡量因子门限值。

在示范性实施方式中，所述分块模块，被配置为从执行分配到计算任务的计算设备接收包含资源利用率的反馈消息；当所述资源利用率超过预先设定的第三资源利用率门限值时，对重排后的所述关系矩阵再次进行分块，其中分配给所述计算设备的计算任务被减少；当所述资源利用率低于预先设定的第四资源利用率门限值时，对重排后的所述关系矩阵再次进行分块，其中分配给所述计算设备的计算任务被增加；在资源库中存储所述资源利用率。

一种电子设备，包括：

处理器；

存储器，用于存储所述处理器的可执行指令；

所述处理器，用于从所述存储器中读取所述可执行指令，并执行所述可执行指令以实施如上任一项所述的在计算设备之间分配计算任务的方法。

一种计算机可读存储介质，其上存储有计算机指令，所述计算机指令被处理器执行时实施如上任一项所述的在计算设备之间分配计算任务的方法。

一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实施如上任一项所述的在计算设备之间分配计算任务的方法。

附图说明

下面将通过参照附图详细描述本发明的优选实施例，使本领域的普通技术人员更清楚本发明的上述及其它特征和优点，附图中：

图1是根据本发明实施方式的在计算设备之间分配计算任务的方法的示范性流程图。

图2是根据本发明实施方式的关系矩阵的示范性示意图。

图3是根据本发明实施方式重排关系矩阵的示范性示意图。

图4是根据本发明实施方式对关系矩阵进行分块的示范性示意图。

图5是根据本发明实施方式具有运算量权重的关系矩阵的示范性示意图。

图6是根据本发明实施方式具有运算量权重的关系矩阵的重排和分块的示范性示意图。

图7是根据本发明实施方式计算设备之间分配计算任务的示范性过程示意图。

图8是根据本发明实施方式的在计算设备之间分配计算任务的装置的示范性结构图。

图9是根据本发明实施方式电子设备的示范性结构图。

其中，附图标记如下：

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，以下举实施例对本发明进一步详细说明。

为了描述上的简洁和直观，下文通过描述若干代表性的实施方式来对本发明的方案进行阐述。实施方式中大量的细节仅用于帮助理解本发明的方案。但是很明显，本发明的技术方案实现时可以不局限于这些细节。为了避免不必要地模糊了本发明的方案，一些实施方式没有进行细致地描述，而是仅给出了框架。下文中，“包括”是指“包括但不限于”，“根据……”是指“至少根据……，但不限于仅根据……”。由于汉语的语言习惯，下文中没有特别指出一个成分的数量时，意味着该成分可以是一个也可以是多个，或可理解为至少一个。

计算设备可以实施为具有数值计算能力和/或逻辑计算能力，优选还具有存储记忆功能。比如，计算设备可以实施为个人计算机(PC)、移动终端、个人数字助理(PDA)、掌上型电脑、服务器，等等。当计算任务具体涉及到工业场景时，计算设备可以实施为可编程逻辑器(PLC)、工业主机、云处理设备或工业边缘设备，等等。

来自数据点的所有数据被命名为数据集，而处理数据的所有规则被命名为规则集。数据集和规则集通常都很大，因此需要强大的计算能力来处理关于数据集和规则集的计算任务。例如，从WinCC OA中可以获取约40000个数据点，总共将使用约500个过程规则来处理这些数据点。对于这种场景，需要将数据集和规则集划分为多个小集，从而便于将计算任务分配给执行各自小集的多个计算设备。

如图1所示，该方法包括：

步骤101：基于包含m个数据点的数据点集及包含n个规则的规则集，确定关系矩阵，关系矩阵中的元素A _ij表征第i个数据点与第j个规则的适用关系，其中m、n、i和j均为正整数，i小于或等于m，j小于或等于n。

在示范性实施方式中，当第j个规则适用于第i个数据点时，A _ij为1；当第j个规则不适用于第i个数据点时，A _ij为0。因此，可以基于规则适用状况为关系矩阵中的每个元素赋值，便于实施。

在大多数情况下，每个数据点只需要若干个规则来处理，但对于所有数据点，总共有多条规则。同时，每一条规则都会在许多数据点中使用，因此总的规则数量也很大。但对于每个数据点，它只使用几个规则，而不是所有规则。数据点和规则的关系矩阵中，数字0的数量显著大于数字1的数量，因此关系矩阵通常表现为稀疏矩阵。从稀疏矩阵出发，可以清晰地表示了数据点和规则之间的关系。

图2是根据本发明实施方式的关系矩阵的示范性示意图。假定数据点集中包含m个数据点，分别为DP1、DP2、DP3…DPm。规则集中包含n个规则，分别为R1、R2、R3…Rn。比如，可以确定出关系矩阵A，关系矩阵A由m×n个元素A _ij排成的m行n列的矩阵，简称m×n矩阵。其中m行的排列顺序分别为第1行的DP1、第2行的DP2、第3行的DP3，直到第m行的DPm；n列的排列顺序分别为第1列的R1、第2列的R2、第3列的R3，直到第n行的Rn。其中，A _ij位于矩阵A的第i行第j列。基于第j个规则是否适用于第i个数据点，确定出A _ij的值。其中：当第j个规则适用于第i个数据点时，A _ij为1；当第j个规则不适用于第i个数据点时，A _ij为0。

比如，由图2可见，第1行第1列的A ₁₁等于1，这意味着第1个规则R1适用于第1个数据点DP1。第1行第1列的A ₁₂等于1，这意味着第2个规则R2适用于第1个数据点DP1。第1行第3列的A ₁₃等于0，这意味着第3个规则R3不适用于第1个数据点DP1。类似地，确定出关系矩阵A中的每个元素的值。

以上示范性描述了利用m×n矩阵的关系矩阵A，描述规则集与数据点集的适用关系。实际上，可以利用n×m矩阵的关系矩阵B，描述规则集与数据点集的适用关系。比如，n×m的关系矩阵B由n×m个元素B _ji排成n行m列的矩阵。其中，n行顺序分别为第1行的R1、第2行的R2、第3行的R3，直到第n行的Rn；m列顺序分别为第1列的DP1、第2列的DP2、第3列的DP3，直到第m列的DPm；其中，B _ij位于矩阵B的第i行第j列。基于第i个规则是否适用于第j个数据点，确定出B _ij的值。

在上述实施方式中，当规则适用于数据点时，元素值为1，当规则适用于数据点时，元素值为零，这种不区分规则之间的运算量差异及不区分数据点之间的运算量差异的映射方式具有实施便利的优点。

然而，考虑到在实际应用中，规则之间通常具有运算量差异(比如，指数运算的运算量通常大于乘法运算，乘法运算的运算量通常大于加法运算，等等)以及数据点之间通常具有运算量差异(比如，来自于大型运算过程中的数据点的运算量通常大于小型运算过程中的数据点)，优选进一步考虑到规则之间的运算量差异及数据点之间的运算量差异，实现关系矩阵中的每个元素的赋值。

在示范性实施方式中，当第j个规则适用于第i个数据点时，A _ij为k；当第j个规则不适用于第i个数据点时，A _ij为0；其中k＝d _i*r _j，其中d _i为第i个数据点在m个数据点中的运算量权重，r _j为第j个规则在n个规则中的运算量权重。因此，可以基于规则适用状况、数据点的运算量权重及规则的运算量权重，为关系矩阵中的元素赋值，因此元素值中还体现了数据点的运算量权重及规则的运算量权重，便于准确分配计算任务。

步骤102：重排关系矩阵，以将关系矩阵中的非零元素移至靠近对角线。

在这里，对于作为稀疏矩阵的关系矩阵，其带宽可以通过重排其元素来减少。矩阵带宽是从非零元素到矩阵对角线的最大长度。在这里，通过行、列交换，对关系矩阵进行重新排序(即重排)，以减小关系矩阵的带宽。一些算法可用于减少矩阵带宽，例如，逆卡特希尔-麦基(RCM)算法是一种流行的算法。重排后，非零元素在矩阵的对角线上对齐，其他元素为零。因此，对于稀疏矩阵，RCM算法可以减少矩阵的带宽。实际上，还有其他的带宽最小算法来减少矩阵带宽，例如列计数排序、最小度排序，等等。这些算法也可以用于重排关系矩阵。优选地，在所有这些重排算法中，选择出重排效果最好的算法以执行重排处理。在重排处理中，经常涉及行或列的置换。行或列的置换不能改变数据点之间的关系及其对应的规则。

图3是根据本发明实施方式重排关系矩阵的示范性示意图。重排前的关系矩阵31经过重排处理后，变换为重排后的关系矩阵32。由图3可见，关系矩阵32中的行和列都发生了置换。比如，关系矩阵31中的第一行D1，变换为关系矩阵32中的最后一行，关系矩阵31中的第二行R2，变换为关系矩阵32中的第三列，等等。而且，关系矩阵32中的非零元素，都尽量(以“尽力而为”方式)被移至靠近对角线。步骤103：基于计算设备的约束条件，对重排后的所述关系矩阵进行关于计算任务的均衡分块，以得到多个子块，其中每个子块的非零元素之和为衡量该子块的计算任务的衡量因子。

在示范性实施方式中，还包括：接收包含约束条件的用户输入；从用户输入中提取约束条件；其中约束条件包括下列约束因子中的至少一个：计算设备的数目；计算设备的计算能力；计算设备的地理位置；计算设备的工作进度安排；计算设备的类型，等等。可见，约束条件具有多种实施方式，有利于提高适用性。

比如，在约束条件中可以指定：

1、计算设备的数目。比如，最多10个计算设备参与分配计算任务。

2、计算设备的计算能力。比如，每个计算设备最多可以计算50个数据点及其对应规则。

3、计算设备的地理位置。比如，约束特定地理位置的计算设备参与或不参与计算任务的分配，或约束计算设备与其处理的数据点处于相同的地理位置，等等。

4、计算设备的工作进度安排。比如，约束特定时间内的计算设备参与或不参与计算任务的分配。

5、计算设备的类型。比如，约束特定类型的计算设备只处理特定类型的数据点，等等。

以上示范性描述了约束条件的典型实例，本领域技术人员可以意识到，这种描述仅是示范性的，并不用于限定本发明实施方式的保护范围。

在满足约束条件的前提下，对重排后的关系矩阵进行关于计算任务的均衡分块，以得到多个子块，其中每个子块的非零元素之和为衡量该子块的计算任务的衡量因子。比如，当约束条件为10个计算能力相同的计算设备时，则对重排后的关系矩阵进行关于均衡分块，以得到10个子块，其中以尽力而为的方式使得每个子块的非零元素之和相同。

步骤104：将每个子块的计算任务，分配给对应的计算设备。

在图4中，关系矩阵41被分为两个子块，分别为子块42和子块43，其中子块42的非零元素之和为7，子块43的非零元素之和为7。将子块42和子块73的计算任务相同。子块42的计算任务包括：对数据点D1执行规则R1、对数据点D1执行规则R2、对数据点D2执行规则R2、对数据点D2执行规则R3、对数据点D3执行规则R2、对数据点D3执行规则R3和对数据点D3执行规则R4。子块432的计算任务包括：对数据点D4执行规则R3、对数据点D4执行规则R4、对数据点D5执行规则R4、对数据点D5执行规则R5、对数据点D6执行规则R5、对数据点D6执行规则R6和对数据点D7执行规则R6。可以将子块42和子块43分别分配给两个计算设备，由计算设备具体执行各自的计算任务。

图5所示的元素关系矩阵51中，第一行为数据点D1，D1的运算量权重为d1，第二行为数据点D2，D2的运算量权重为d2…第m行为数据点Dm， Dm的运算量权重为dm；第一列为规矩R1，R1的运算量权重为r1，第二列为规矩R2，R2的运算量权重为r2…第n列为规矩Rn，Rn的运算量权重为rn。当第j个规则不适用于第i个数据点时，A _ij为0。当第j个规则适用于第i个数据点时，A _ij为k，k＝d _i*r _j，其中d _i为第i个数据点的运算量权重，r _j为第j个规则的运算量权重。关系矩阵52为元素具有权重的示范性的。

图6是根据本发明实施方式具有运算量权重的关系矩阵的重排和分块的示范性示意图。元素具有权重的关系矩阵61重排后，得到关系矩阵62。假定约束条件中指定参与分配计算任务的计算设备的数目为2，且每个计算设备的计算能力相同。利用非零元素之和作为衡量子块的计算任务的衡量因子，以尽力而为方式将关系矩阵62分块为非零元素之和近似相同的两个子块。比如，分为第一分块63和第二分块64，其中第一分块63的非零元素之和为14.5；第二分块64的非零元素之和为18。然后，将第一分块63的计算任务量分配给第一设备，第二分块64的计算任务量分配给第二设备。

在示范性实施方式中，还包括：从资源库中检索计算设备的历史资源利用率；基于计算设备的约束条件，对重排后的关系矩阵进行关于计算任务的均衡分块包括：对于历史资源利用率高于第一资源利用率门限值的计算设备，所分配的子块的衡量因子低于预定的第一衡量因子门限值；对于历史资源利用率低于第二资源利用率门限值的计算设备，所分配的子块的衡量因子高于预定的第二衡量因子门限值。因此，可以基于历史资源利用率进行关于计算任务的均衡分块，还考虑到历史资源利用率对当前分块的影响，从而保证了分块的准确度。

在示范性实施方式中，还包括：从执行分配到计算任务的计算设备接收包含资源利用率的反馈消息；当资源利用率超过预先设定的第三资源利用率门限值时，对重排后的关系矩阵再次进行分块，其中分配给计算设备的计算任务被减少；当资源利用率低于预先设定的第四资源利用率门限值时，对重排后的关系矩阵再次进行分块，其中分配给计算设备的计算任务被增加；在资源库中存储资源利用率。可见，可以基于计算设备的反馈调整分配结果，从而提高了分配的准确度。

基于上述描述，本发明实施方式中，具体包括：

步骤1：输入数据点和处理规则。首先，明确获取哪些数据点以及每个数据点应该使用的规则。所有数据点及其规则都可以通过手动或其他方法输入到文件或表中。可以为不同的数据点和规则赋予各自的权重。

步骤2：自动生成关系矩阵。从步骤1中生成的文件中，可以自动获得关系矩阵。数据点设置为行标识符，规则按顺序设置为列标识符。可以计算关系矩阵中元素的值，其中如果数据点使用哪些规则，则矩阵中相应的元素值设置为数据点和规则权重因子的乘积，否则设置为零。在大多数情况下，矩阵是稀疏矩阵。

步骤3：重排算法。在这一步中，将使用不同的重排算法并选择优化算法。然后使用所选算法重排关系矩阵。比如，通过Cuthill-McKee或RCM等算法重排关系矩阵，以减少关系矩阵的带宽，并使非零元素均匀分布在矩阵的对角线上。在重排过程中，应在每个排列中保留行和列的初始化名称，这意味着如果将第一行的初始化名称d1排列为第二行，则重排后的第二行的名称也应为d1。

步骤4：获取重排矩阵。

步骤5：资源约束输入。在分块关系矩阵之前，应获得相应的资源信息。这意味着分配的数据块将在哪个资源上运行。资源能力限制了数据块的大小。

步骤6：分配关系矩阵。此时，在步骤5中输入的资源约束下，重排矩阵被分块为不同的子块。在分块过程中，可以与资源性能库交换信息，以获得经验价值。关于所有元素的权重和块数，关系矩阵可以分为多个子块，每个子块都有相似的数据点与规则的权重之和。

步骤7：资源性能库和分块算法之间的查询和响应。资源性能库存储有关资源性能的历史数据。分块算法查询资源性能库以获取参考信息，比如获取每个计算设备的历史资源利用率。对于历史资源利用率较高的(比如高于第一资源利用率门限值的)计算设备，所分配的子块的衡量因子较少(比如低于预定的第一衡量因子门限值)；对于历史资源利用率较低(比如低于第二资源利用率门限值)的计算设备，所分配的子块的衡量因子较高(比如高于预定的第二衡量因子门限值)。可见，由此保证计算设备的负载均衡。

步骤8：输出分配的子块。将关系矩阵被分块为若干个子矩阵(即子块)，每个子矩阵是一个划分的数据块。在子矩阵中，行是数据点集，列是规则集。子矩阵的元素是数据点和规则之间的加权结果。每个子集具有相似的加权结果之和。

步骤9：将分配的子块部署到边缘设备并验证。为了验证性能，选择了一个分配的子块，并将其部署到边缘设备。如果性能良好，边缘设备将向分块算法模块发送反馈，告知分块完成。如果性能不好，边缘设备还向分块算法模块发送反馈，告诉其分块不好，重复步骤6～步骤9，直到获得良好的性能。

步骤10：记录到资源性能库。最后，将性能良好的边缘设备的信息记录到资源性能库中。信息包括边缘设备硬件信息、数据点集大小和规则等。通常规则是按顺序执行的，例如，规则1执行，然后规则3执行，但在重排矩阵中，顺序可能会更改为规则3，规则1。此时，分配后将需要规则执行顺序更改为正确顺序。

在图7中，大量的数据点及规则78被输入到计算任务分配装置80。数据解析70对数据点及规则78进行解析，以确定出哪个(些)规则适用于哪个数据点，以及每个数据点的运算量权重和每个规则的运算量权重。基于数据解析70的解析处理，得到稀疏矩阵71。稀疏矩阵71中的元素A _ij表征第i个数据点与第j个规则的适用关系，其中当第j个规则适用于第i个数据点时，A _ij为k；当第j个规则不适用于第i个数据点时，所述A _ij为0。k＝d _i*r _j，其中d _i为第i个数据点在m个数据点中的运算量权重，r _j为第j个规则在n个规则中的运算量权重。

在重排处理72中，对稀疏矩阵71进行重排以得到重排矩阵73，其中使得重排矩阵73中的非零元素以尽力而为的方式移至靠近对角线。

在分块处理74中，按照约束条件79的约束(比如，约定p个边缘设备76)，基于资源库提供的每个边缘设备的历史资源利用率，对重排矩阵73进行均衡分块，得到p个子块751、752…75p，其中每个子块的非零元素之和为衡量该子块的计算任务的衡量因子。p个子块751、752…75p一一对应到的p个边缘设备76，分别执行各自的子块。而且，每个边缘设备76向分块处理74反馈处理各自子块时的资源利用率，其中当有边缘设备的资源利用率不符合要求时，分块处理74将重新分块，并调整针对该边缘设备的计算任务。边缘设备77将各自的资源利用率发送到资源库77进行存储。

下面以工厂环境为例，对本发明实施方式的应用场景进行示范性说明。在工厂中，有许多工业边缘设备(IE)用于收集现场数据。每个IE收集多个数据点的数据。原始数据将在IE端进行预处理，然后发送到上层。由于收集的数据点数量和预处理规则不同，IE的性能通常不同。基于上述本发明实施方式，可以通过负载均衡将现场数据点重新分组并分配给不同的IE。为此，首先将每个IE的数据点和预处理规则聚合为一个IE，然后对这些数据点重新分组以实现负载均衡，最后每个边缘设备使用其规则对重新分组的数据点进行预处理。在将所有数据点和规则聚合到一个IE时，选择一个IE作为主IE(MIE)，其中部署了自动分配器和资源性能库。为了获得所有其他IE信息，运行了IE管理软件来监听其他IE请求。对于其他IE，在初始化阶段发送广播数据包以寻找MIE，MIE接收广播并向IE发送ACK，然后IE和MIE与单播数据包通信。当MIE和其他IE建立连接时，MIE将获取其他IE的数据点、规则和性能信息。MIE逐个地获取所有数据点及其规则，这意味着MIE还知道每个数据点需要哪些规则。

然后，重新划分数据点以实现负载均衡。当自动分配器获得所有数据点和规则信息时，它将通过稀疏矩阵表示数据点和规则。重排矩阵，并通过负载均衡将数据点和规则划分为多个子组。在此过程中，可以访问资源性能库以获取经验值。此外，如果数据点在一个IE中收集，但其数据在另一个IE中预处理，则在分配过程中应考虑从IE向另一个IE发送数据的成本。

接着，执行部署、运行和验证。数据点重新分组后，重新分组的子数据块将部署到边缘设备，在其上运行以进行验证。边缘设备的性能结果将反馈给自动分频器，如果性能良好，相关信息将发送到资源性能库并予以记录，如果没有，则重复上述步骤再次分配。可见，本发明实施方式可以提高IE的利用率。

实际上，本发明实施方式还适用于其他场景或产品。例如，WinCC也是一种分布式软件，它获取现场数据，处理和显示数据。对于多个WinCC服务器的场景，本发明实施方式也可以用于将现场数据分成几个部分，以确保WinCC服务器的负载均衡。

图8是根据本发明实施方式的在计算设备之间分配计算任务的装置的示范性结构图。如图8所示，在计算设备之间分配计算任务的装置800包括：

确定模块801，被配置为基于包含m个数据点的数据点集及包含n个规则的规则集，确定关系矩阵，关系矩阵中的元素A _ij表征第i个数据点与第j个规则的适用关系，其中m、n、i和j均为正整数，i小于或等于m，j小于或等于n；

重排模块802，被配置为重排关系矩阵，以将关系矩阵中的非零元素移至靠近对角线；

分块模块803，被配置为基于计算设备的约束条件，对重排后的关系矩阵进行关于计算任务的均衡分块，以得到多个子块，其中每个子块的非零元素之和为衡量该子块的计算任务的衡量因子；

分配模块804，被配置为将每个子块的计算任务，分配给对应的计算设备。

在示范性实施方式中，当第j个规则适用于第i个数据点时，A _ij为1；当第j个规则不适用于第i个数据点时，A _ij为0。

在示范性实施方式中，当第j个规则适用于第i个数据点时，A _ij为k；当第j个规则不适用于第i个数据点时，A _ij为0；其中k＝d _i*r _j，其中d _i为第i个数据点在m个数据点中的运算量权重，r _j为第j个规则在n个规则中的运算量权重。

在示范性实施方式中，分块模块803，被配置为接收包含约束条件的用户输入；从用户输入中提取约束条件；其中约束条件包括下列约束因子中的至少一个：计算设备的数目；计算设备的计算能力；计算设备的地理位置；计算设备的工作进度安排；计算设备的类型。

在示范性实施方式中，分块模块803，被配置为从资源库中检索计算设备的历史资源利用率；对于历史资源利用率高于第一资源利用率门限值的计算设备，所分配的子块的衡量因子低于预定的第一衡量因子门限值，对于历史资源利用率低于第二资源利用率门限值的计算设备，所分配的子块的衡量因子高于预定的第二衡量因子门限值。

在示范性实施方式中，分块模块803，被配置为从执行分配到计算任务的计算设备接收包含资源利用率的反馈消息；当资源利用率超过预先设定的第三资源利用率门限值时，对重排后的关系矩阵再次进行分块，其中分配给计算设备的计算任务被减少；当资源利用率低于预先设定的第四资源利用率门限值时，对重排后的关系矩阵再次进行分块，其中分配给计算设备的计算任务被增加；在资源库中存储资源利用率。

本发明实施方式还提出了一种具有处理器-存储器架构的电子设备。图9是根据本发明实施方式电子设备的示范性结构图。

如图9所示，电子设备900包括处理器901、存储器902及存储在存储器902上并可在处理器901上运行的计算机程序，计算机程序被处理器901执行时实现如上任一种的在计算设备之间分配计算任务的方法方法。其中，存储器902具体可以实施为电可擦可编程只读存储器(EEPROM)、快闪存储器(Flash memory)、可编程程序只读存储器(PROM)等多种存储介质。处理器901可以实施为包括一或多个中央处理器或一或多个现场可编程门阵列，其中现场可编程门阵列集成一或多个中央处理器核。具体地，中央处理器或中央处理器核可以实施为CPU或MCU或DSP，等等。

需要说明的是，上述各流程和各结构图中不是所有的步骤和模块都是必须的，可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的，可以根据需要进行调整。各模块的划分仅仅是为了便于描述采用的功能上的划分，实际实现时，一个模块可以分由多个模块实现，多个模块的功能也可以由同一个模块实现，这些模块可以位于同一个设备中，也可以位于不同的设备中。

各实施方式中的硬件模块可以以机械方式或电子方式实现。例如，一个硬件模块可以包括专门设计的永久性电路或逻辑器件(如专用处理器，如FPGA或ASIC)用于完成特定的操作。硬件模块也可以包括由软件临时配置的可编程逻辑器件或电路(如包括通用处理器或其它可编程处理器)用于执行特定操作。至于具体采用机械方式，或是采用专用的永久性电路，或是采用临时配置的电路(如由软件进行配置)来实现硬件模块，可以根据成本和时间上的考虑来决定。

以上所述，仅为本发明的较佳实施方式而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

一种在计算设备之间分配计算任务的方法，其特征在于，所述方法包括：

基于包含m个数据点的数据点集及包含n个规则的规则集，确定(101)关系矩阵，所述关系矩阵中的元素A _ij表征第i个数据点与第j个规则的适用关系，其中m、n、i和j均为正整数，i小于或等于m，j小于或等于n；

重排(102)所述关系矩阵，以将所述关系矩阵中的非零元素移至靠近对角线；

基于计算设备的约束条件，对重排后的所述关系矩阵进行关于计算任务的均衡分块(103)，以得到多个子块，其中每个子块的非零元素之和为衡量该子块的计算任务的衡量因子；

将每个子块的计算任务，分配(104)给对应的计算设备。
根据权利要求1所述的方法，其特征在于，当第j个规则适用于所述第i个数据点时，所述A _ij为1；当第j个规则不适用于所述第i个数据点时，所述A _ij为0。
根据权利要求1所述的方法，其特征在于，当第j个规则适用于所述第i个数据点时，所述A _ij为k；当第j个规则不适用于所述第i个数据点时，所述A _ij为0；

其中k＝d _i*r _j，其中d _i为第i个数据点在m个数据点中的运算量权重，r _j为第j个规则在n个规则中的运算量权重。
根据权利要求1所述的方法，其特征在于，还包括：

接收包含所述约束条件的用户输入；

从所述用户输入中提取所述约束条件；

其中所述约束条件包括下列约束因子中的至少一个：

计算设备的数目；计算设备的计算能力；计算设备的地理位置；计算设备的工作进度安排；计算设备的类型。
根据权利要求1所述的方法，其特征在于，还包括：

从资源库中检索所述计算设备的历史资源利用率；

所述基于计算设备的约束条件，对重排后的所述关系矩阵进行关于计算任务的均衡分块包括：

对于历史资源利用率高于第一资源利用率门限值的计算设备，所分配的子块的衡量因子低于预定的第一衡量因子门限值；

对于历史资源利用率低于第二资源利用率门限值的计算设备，所分配的子块的衡量因子高于预定的第二衡量因子门限值。
根据权利要求5所述的方法，其特征在于，还包括：

从执行分配到计算任务的计算设备接收包含资源利用率的反馈消息；

当所述资源利用率超过预先设定的第三资源利用率门限值时，对重排后的所述关系矩阵再次进行分块，其中分配给所述计算设备的计算任务被减少；

当所述资源利用率低于预先设定的第四资源利用率门限值时，对重排后的所述关系矩阵再次进行分块，其中分配给所述计算设备的计算任务被增加；

在所述资源库中存储所述资源利用率。
一种在计算设备之间分配计算任务的装置，其特征在于，所述装置包括：

确定模块(801)，被配置为基于包含m个数据点的数据点集及包含n个规则的规则集，确定关系矩阵，所述关系矩阵中的元素A _ij表征第i个数据点与第j个规则的适用关系，其中m、n、i和j均为正整数，i小于或等于m，j小于或等于n；

重排模块(802)，被配置为重排所述关系矩阵，以将所述关系矩阵中的非零元素移至靠近对角线；

分块模块(803)，被配置为基于计算设备的约束条件，对重排后的所述关系矩阵进行关于计算任务的均衡分块，以得到多个子块，其中每个子块的非零元素之和为衡量该子块的计算任务的衡量因子；

分配模块(804)，被配置为将每个子块的计算任务，分配给对应的计算设备。
根据权利要求7所述的装置，其特征在于，当第j个规则适用于所述第i个数据点时，所述A _ij为1；当第j个规则不适用于所述第i个数据点时，所述A _ij为0。
根据权利要求7所述的装置，其特征在于，当第j个规则适用于所述第i个数据点时，所述A _ij为k；当第j个规则不适用于所述第i个数据点时，所述A _ij为0；

其中k＝d _i*r _j，其中d _i为第i个数据点在m个数据点中的运算量权重，r _j为第j个规则在n个规则中的运算量权重。
根据权利要求7所述的装置，其特征在于，

所述分块模块(803)，被配置为接收包含所述约束条件的用户输入；从所述用户输入中提取所述约束条件；其中所述约束条件包括下列约束因子中的至少一个：计算设备的数目；计算设备的计算能力；计算设备的地理位置；计算设备的工作进度安排；计算设备的类型。
根据权利要求7所述的装置，其特征在于，

所述分块模块(803)，被配置为从资源库中检索所述计算设备的历史资源利用率；对于历史资源利用率高于第一资源利用率门限值的计算设备，所分配的子块的衡量因子低于预定的第一衡量因子门限值，对于历史资源利用率低于第二资源利用率门限值的计算设备，所分配的子块的衡量因子高于预定的第二衡量因子门限值。
根据权利要求11所述的装置，其特征在于，

所述分块模块(803)，被配置为从执行分配到计算任务的计算设备接收包含资源利用率的反馈消息；当所述资源利用率超过预先设定的第三资源利用率门限值时，对重排后的所述关系矩阵再次进行分块，其中分配给所述计算设备的计算任务被减少；当所述资源利用率低于预先设定的第四资源利用率门限值时，对重排后的所述关系矩阵再次进行分块，其中分配给所述计算设备的计算任务被增加；在所述资源库中存储所述资源利用率。
一种电子设备，其特征在于，包括：

处理器(901)；

存储器(902)，用于存储所述处理器(901)的可执行指令；

所述处理器(901)，用于从所述存储器(902)中读取所述可执行指令，并执行所述可执行指令以实施权利要求1-6中任一项所述的在计算设备之间分配计算任务的方法。
一种计算机可读存储介质，其上存储有计算机指令，其特征在于，所述计算机指令被处理器执行时实施权利要求1-6中任一项所述的在计算设备之间分配计算任务的方法。
一种计算机程序产品，其特征在于，包括计算机程序，所述计算机程序被处理器执行时实施权利要求1-6中任一项所述的在计算设备之间分配计算任务的方法。