WO2022012129A1

WO2022012129A1 - 云服务系统的模型处理方法及云服务系统

Info

Publication number: WO2022012129A1
Application number: PCT/CN2021/092942
Authority: WO
Inventors: 宁伟康; 杨学文
Original assignee: 华为技术有限公司
Priority date: 2020-07-17
Filing date: 2021-05-11
Publication date: 2022-01-20
Also published as: EP4174736A1; CN113946434A; EP4174736A4; US20230164030A1

Abstract

一种云服务系统的模型处理方法及云服务系统，通过在云服务器（3）和边缘设备（1）之间设置的本地服务器（5），获取边缘设备（1）使用模型进行计算时的数据后，即可通过本地服务器（5）进行更新，并将模型更新后的梯度值发送给云服务器（3），最终由云服务器（3）根据本地服务器（5）的梯度值对模型进行更新。在整个模型更新的过程中，在保证对云服务器（3）提供的模型进行更新的基础上，还能够减少边缘设备（1）与服务器之间的数据交互量，也能够降低对云服务器（3）以及边缘设备（1）的计算能力的要求，进而提高了整个云服务系统的运行效率。

Description

云服务系统的模型处理方法及云服务系统

本申请要求于2020年07月17日提交中国专利局、申请号为202010699825.2、发明名称为“云服务系统的模型处理方法及云服务系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及云计算技术领域，尤其涉及一种云服务系统的模型处理方法及云服务系统。

背景技术

边缘计算是云计算技术的一种具体实现，在云服务器的架构下，云服务器可以向终端设备提供机器学习模型等计算工具，由边缘设备使用云服务器提供的机器学习模型进行边缘计算，这种计算方式能够有效减少云服务器的计算量，从而提高整个云服务系统的运行效率。

而为了保证计算精度，供应商需要对云服务器提供的机器学习模型进行不断的更新，在一种更新技术中，所有终端设备在计算时使用的最新计算数据都会发送给云服务器，依赖云服务器根据这些计算数据对机器学习模型进行更新，但是增大了云服务器的计算量，会降低整个云服务系统的运行效率；在另一种更新技术中，终端设备和云服务器通过联邦学习的方式对机器模型进行更新，其中，终端设备上可以设置联邦学习客户端，并可以根据各自的计算数据对机器学习模型进行更新，并将更新后的梯度值发送给云服务器，云服务器上可以设置联邦学习服务端，可以根据接收到的终端设备的梯度值对机器学习模型进行更新，但是又会增加终端设备的计算量，在目前大多数终端设备的算力都无法满足的情况下，同样会影响云服务系统整体的运行。

因此，如何对云服务系统中，在能够对云服务器提供的机器学习模型进行更新的同时，又不会影响云服务系统的整体运行，是本领域亟需解决的技术问题。

发明内容

本申请提供一种云服务系统的模型处理方法及云服务系统，用于解决现有技术的云服务系统中，如何对机器学习模型进行更新时，不会影响云服务器整体运行效率的技术问题。

本申请第一方面提供一种云服务系统，包括：云服务器和多个本地服务器，所述多个本地服务器中的第一本地服务器通过网络与所述云服务器连接，所述第一本地服务器还连接至少一个边缘设备；其中，所述第一本地服务器用于，获取所述至少一个边缘设备的数据集，所述数据集包括所述至少一个边缘设备使用所述云服务器提供的第一模型进行计算时使用的数据；根据所述至少一个边缘设备的数据集，确定用于对所述第一模型进行更新的第一梯度值；并将所述第一梯度值发送至所述云服务器；所述云服务器用于，根据所述第一梯度值对所述第一模型进行更新，并向所述第一本地服务器发送更新后的所述第一模型。

综上，本实施例提供的云服务系统，在整个模型更新的过程中，既不完全依赖云服务器进行数据计算，也不依赖边缘设备本身进行模型的更新，而是通过本地服务器提供的计算能力对模型进行更新，从而在保证对云服务器提供的模型进行更新的基础上，还能够减少了边缘设备与服务器之间的数据交互量，也能够降低了对云服务器以及边缘设备的计算能力的要求，进而提高了整个云服务系统的运行效率。

在本申请第一方面一实施例中，所述云服务器还用于，向所述云服务器发送多个模型；所述第一本地服务器还用于，接收并存储所述云服务器发送的多个模型；确定所述至少一个边缘设备中第一边缘设备对应的至少一个模型；并向所述第一边缘设备发送所述至少一个模型。

综上，本实施例提供的云服务系统中，第一本地服务器还具有模型存储、以及确定不同边缘设备对应的不同模型的功能，从而进一步减少了云服务器所需要进行的计算，云服务器只需要将训练得到的模型发送给本地服务器，由本地服务器更有针对性地将模型分别下发给对应的边缘设备，还能够让第一边缘设备所使用的模型更精确，提高了第一边缘设备使用模型计算时的精准度，进而进一步提高了整个云服务系统的运行效率。

在本申请第一方面一实施例中，所述云服务器还用于，向所述第一本地服务器发送构建工具和标注工具；其中，所述构建工具用于所述第一本地服务器的搭建，所述标注工具用于对所述数据集中的数据进行标注。

综上，本实施提供的云服务系统中，云服务器可以通过向第一本地服务器发送构建工具以及标注工具，使得第一本地服务器可以根据云服务器发送的工具，进行本地服务器的构建、以及实现相关的功能，从而补充了整个云服务系统实现时的完备性，使得云服务系统的运营商通过云服务器可以完成对第一本地服务器的构建和部署。

在本申请第一方面一实施例中，所述第一本地服务器还用于，通过所述标注工具，对所述至少一个边缘设备的数据集中的第一数据进行标注得到多个标注结果；并当所述多个标注结果均相同时，将所述第一数据加入本地数据集，所述本地数据集用于确定用于对所述第一模型进行更新的第一梯度值；当所述多个标注结果不完全相同时，向第一设备发送所述第一数据，并在接收到所述第一设备发送的确认信息后，将所述第一数据加入所述本地数据集。

综上，本实施例提供的云服务系统的模型处理方法，第一本地服务器可以通过标注工具对边缘设备的数据集中的数据进行标注，并对标注结果相同的数据才加入本地数据集，从而提高了所加入的本地数据集的数据用于后续对模型进行更新时，计算的准确程度。并且在标注结果不完全相同的数据依靠人工进行标注，进一步保障了所加入本地数据集的数据的标注正确。

在本申请第一方面一实施例中，所述第一本地服务器还用于，确定所连接的所述至少一个边缘设备在使用所述第一本地服务器所存储的多个模型进行计算时的性能参数，并按照所述性能参数对所述多个模型进行排序；向所述云服务器发送所述多个模型的排序信息；所述云服务器用于，根据所述多个模型的排序信息，对所述多个模型进行排序。

综上，本实施例提供的云服务系统，第一服务器还具有排序功能，可以通过第一服务器对多个模型的排序，不断优化云服务器所提供的模型的组成，实现模型的“优胜劣汰”，提高后续边缘设备使用模型计算时的性能，从而进一步提高了整个云服务系统的运行效率。

在本申请第一方面一实施例中，所述云服务器具体用于，根据所述第一梯度值，以及所述多个本地服务器中至少一个第二本地服务器发送的梯度值，对所述第一模型进行更新。

综上，本实施例提供的云服务系统，可以通过云服务器与本地服务器协同更新的方式，对边缘设备使用的模型进行更新，而这种协同更新的结构可以实现联邦学习，在本地服务器上可以部署联邦学习客户端，使得本地服务器代替了终端设备进行模型的更新，以及与云服务器进行交互，进一步减少了终端设备所进行的计算，减少了边缘设备与服务器之间的数据交互量，进而提高了整个云服务系统的运行效率。

本申请第二方面提供一种云服务系统的模型处理方法，通过在云服务器和边缘设备之间设置的本地服务器，获取边缘设备使用模型进行计算时的数据后，即可通过本地服务器对模型进行更新，并将模型更新后的梯度值发送给云服务器，最终由云服务器根据本地服务器的梯度值对模型进行更新。

综上，本实施例提供的云服务系统的模型处理方法，在整个模型更新的过程中，既不完全依赖云服务器进行数据计算，也不依赖边缘设备本身进行模型的更新，而是通过本地服务器提供的计算能力对模型进行更新，从而在保证对云服务器提供的模型进行更新的基础上，还能够减少了边缘设备与服务器之间的数据交互量，也能够降低了对云服务器以及边缘设备的计算能力的要求，进而提高了整个云服务系统的运行效率。

在本申请第二方面一实施例中，在第一本地服务器获取至少一个边缘设备的数据集之前，还可以由云服务器通过第一本地服务器，将模型下发到边缘设备。具体地，对于第一本地服务器，当接收并存储云服务器发送的多个模型之后，分别确定至少一个边缘设备中每个边缘设备对应的模型，例如，确定第一边缘设备对应的至少一个模型后，将所确定的模型发送给第一边缘设备。

综上，本实施例提供的云服务器系统的模型处理方法中，第一本地服务器还具有模型存储、以及确定不同边缘设备对应的不同模型的功能，从而进一步减少了云服务器所需要进行的计算，云服务器只需要将训练得到的模型发送给本地服务器，由本地服务器更有针对性地将模型分别下发给对应的边缘设备，还能够让第一边缘设备所使用的模型更精确，提高了第一边缘设备使用模型计算时的精准度，进而进一步提高了整个云服务系统的运行效率。

在本申请第二方面一实施例中，为了实现云服务系统，还可以在第一本地服务器开始获取至少一个边缘设备的数据集之前，第一本地服务器接收云服务器发送的构建工具和标注工具，从而使用构建工具搭建第一本地服务器，并使用标注工具对数据集中的数据进行标注。

综上，本实施例提供的云服务系统的模型处理方法中，云服务器可以通过向第一本地服务器发送构建工具以及标注工具，使得第一本地服务器可以根据云服务器发送的工具，进行本地服务器的构建、以及实现相关的功能，从而补充了整个云服务系统实现时的完备性，使得云服务系统的运营商通过云服务器可以完成对第一本地服务器的构建和部署。

在本申请第二方面一实施例中，第一本地服务器对对数据集进行的标注具体包括：第一本地服务器通过标注工具，对至少一个边缘设备的数据集中的第一数据进行标注，当多个模型的多个标注结果均相同时，则第一本地服务器将第一数据加入本地数据集，本地数据集用于后续第一本地服务器在更新第一模型时使用；当多个模型的多个标注结果不完全相同时，则需要进入人工复检步骤，第一服务器可以向工作人员使用的第一设备发送第一数据，让工作人员对第一数据进行人工标注，并在接收到工作人员使用的第一设备发送的确认信息后，才将第一数据加入本地数据集。

在本申请第二方面一实施例中，第一本地服务器还具有对模型进行排序的功能，具体地，第一本地服务器可以根据所连接的至少一个边缘设备在使用多个模型进行计算时的性能参数，并按照性能参数对多个模型进行排序后，向云服务器发送多个模型的排序信息。

综上，本实施例提供的云服务系统的模型处理方法使得云服务器对多个模型进行排序后，可以不断优化云服务器所提供的模型的组成，实现模型的“优胜劣汰”，提高后续边缘设备使用模型计算时的性能，从而进一步提高了整个云服务系统的运行效率。

本申请第三方面提供一种云服务系统的模型处理方法，包括：云服务器接收第一本地服务器发送的第一梯度值后，根据第一梯度值对第一模型进行更新，并向本地服务器发送更新后的第一模型。

综上，本实施例提供的云服务系统的模型处理方法，作为云服务器的角度，只需要协同本地服务器对边缘设备的第一模型进行更新，在整个模型更新的过程中，既不完全依赖云服务器进行数据计算，也不依赖边缘设备本身进行模型的更新，而是通过本地服务器提供的计算能力对模型进行更新，从而在保证对云服务器提供的模型进行更新的基础上，还能够减少了边缘设备与服务器之间的数据交互量，也能够降低了对云服务器以及边缘设备的计算能力的要求，进而提高了整个云服务系统的运行效率。

在本申请第三方面一实施例中，云服务器具体通过同步更新的方式，根据第一本地服务器发送的第一梯度值，以及至少一个第二本地服务器发送的梯度值，共同对第一模型进行更新。

综上，本实施例提供的云服务系统的模型处理方法，可以通过云服务器与本地服务器协同更新的方式，对边缘设备使用的模型进行更新，而这种协同更新的结构可以实现联邦学习，在本地服务器上可以部署联邦学习客户端，使得本地服务器代替了终端设备进行模型的更新，以及与云服务器进行交互，进一步减少了终端设备所进行的计算，减少了边缘设备与服务器之间的数据交互量，进而提高了整个云服务系统的运行效率。

在本申请第三方面一实施例中，为了实现云服务系统，还可以在第一本地服务器开始获取至少一个边缘设备的数据集之前，云服务器向第一本地服务器发送的构建工具和标注工具，从而使得第一本地服务器能够根据构建工具搭建第一本地服务器，并使用标注工具对数据集中的数据进行标注。

在本申请第三方面一实施例中，第一本地服务器还具有对模型进行排序的功能，具体地，云服务器可以接收第一本地服务器发送的多个模型的排序信息。使得云服务器对多个模型进行排序后，可以不断优化云服务器所提供的模型的组成，实现模型的“优胜劣汰”，提高后续边缘设备使用模型计算时的性能，从而进一步提高了整个云服务系统的运行效率。

本申请第四方面提供一种云服务系统模型处理装置，可作为本申请第一方面和第二方面中各实施例中的第一本地服务器，并执行第一本地服务器执行的方法。所述装置包括：获取模块，用于获取至少一个边缘设备的数据集，所述数据集包括所述至少一个边缘设备使用云服务器提供的第一模型进行计算时使用的数据；处理模块，用于根据所述至少一个边缘设备的数据集，确定用于对所述第一模型进行更新的第一梯度值；传输模块，用于向所述云服务器发送所述第一梯度值。

在本申请第四方面一实施例中，所述传输模块还用于，接收所述云服务器发送的多个模型，并将多个模型存储在存储模块中；所述处理模块还用于，确定所述至少一个边缘设备中第一边缘设备对应的至少一个模型；所述传输模块还用于，向所述第一边缘设备发送所述至少一个模型。

在本申请第四方面一实施例中，所述传输模块还用于，接收所述云服务器发送的构建工具和标注工具；其中，所述构建工具用于所述第一本地服务器的搭建，所述标注工具用于对所述数据集中的数据进行标注。

在本申请第四方面一实施例中，所述处理模块还用于，通过所述标注工具，对所述至少一个边缘设备的数据集中的第一数据进行标注得到多个标注结果；并当所述多个标注结果均相同时，所述第一本地服务器将所述第一数据加入本地数据集，所述本地数据集用于确定用于对所述第一模型进行更新的第一梯度值；所述传输模块还用于，当所述多个标注结果不完全相同时，向第一设备发送所述第一数据，并在接收到所述第一设备发送的确认信息后，将所述第一数据加入所述本地数据集。

在本申请第四方面一实施例中，所述处理模块还用于，确定所连接的所述至少一个边缘设备在使用所述第一本地服务器所存储的多个模型进行计算时的性能参数，并按照所述性能参数对所述多个模型进行排序；所述传输模块还用于，向所述云服务器发送所述多个模型的排序信息。

本申请第五方面提供一种云服务系统模型处理装置，可作为本申请第一方面和第三方面中各实施例中的云服务器，并执行云服务器执行的方法。所述装置包括：传输模块，用于接收第一本地服务器发送的第一梯度值，其中，所述第一梯度值用于对云服务器提供的第一模型进行更新；处理模块，用于根据所述第一梯度值对所述第一模型进行更新；所述传输模块还用于，向所述第一本地服务器发送更新后的所述第一模型。

在本申请第五方面一实施例中，所述处理模块具体用于，根据所述第一梯度值，以及所述多个本地服务器中至少一个第二本地服务器发送的梯度值，对所述第一模型进行更新。

在本申请第五方面一实施例中，所述传输模块还用于，向所述第一本地服务器发送构建工具和标注工具；其中，所述构建工具用于所述第一本地服务器的搭建，所述标注工具用于对所述数据集中的数据进行标注。

在本申请第五方面一实施例中，所述传输模块还用于，接收所述第一本地服务器发送的多个模型的排序信息；所述处理模块还用于，根据所述多个模型的排序信息，对所述多个模型进行排序。

第六方面，本申请实施例提供一种计算装置，包括：处理器和通信接口。所述处理器通过所述通信接口发送数据；所述处理器用于实现上述第一方面或第二方面中由第一本地服务器执行的方法。

作为一种可能的设计，上述计算装置还包括：存储器；所述存储器用于存储程序代码，所述处理器执行所述存储器中存储的程序代码，以使得所述计算装置执行上述第一方面或第二方面中由第一本地服务器执行的方法。

第七方面，本申请实施例提供一种计算装置，包括：处理器和通信接口。所述处理器通过所述通信接口发送数据；所述处理器用于实现上述第一方面或第三方面中由云服务器执行的方法。

作为一种可能的设计，上述计算装置还包括：存储器；所述存储器用于存储程序代码，所述处理器执行所述存储器中存储的程序代码，以使得所述计算装置执行上述第一方面或第三方面中由云服务器执行的方法。

附图说明

图1为本申请应用场景的示意图；

图2为一种云服务系统的结构示意图；

图3为本申请提供的云服务系统一实施例的结构示意图；

图4为本申请提供的云服务系统的模型处理方法一实施例的流程示意图；

图5为本申请提供的模型同步更新的流程示意图；

图6为本申请提供的模型异步更新的流程示意图；

图7为本申请提供的云服务系统模型处理方法一实施例的流程示意图；

图8为本申请提供的云服务系统模型处理方法一实施例的流程示意图；

图9为本申请实施例提供的数据标注的流程示意图；

图10为本申请提供的云服务系统的模型处理方法一实施例的流程示意图；

图11为本申请提供的另一种云服务系统的结构示意图；

图12为本申请提供的云服务系统模型处理装置一实施例的结构示意图；

图13为本申请提供的云服务系统模型处理装置一实施例的结构示意图；

图14为本申请提供的计算装置的结构示意图。

具体实施方式

图1为本申请应用场景的示意图，其中，本申请可应用在云计算技术领域，云计算服务的供应商可以在互联网2内设置一个或多个云服务器3，由云服务器3提供云计算服务。例如，当用户所使用的终端设备1需要一定的软硬件计算资源时，可以直接使用、或者向供应商申请、或者向供应商支付一定费用来获得由云服务器3提供的软硬件资源等，实现终端设备1使用供应商提供的云计算服务。由于终端设备1使用的计算资源是由供应商设置在网络侧的云服务器3来提供，故这种使用网络资源进行计算的场景又可被称为“云计算”，云服务器3和终端设备1一起又可被称为“云服务系统”。

在如图1所示场景的一种具体实现方式中，终端设备1可以是用于实现边缘计算的边缘设备。其中，边缘计算是指云服务系统中靠近物或者数据源头的一侧的设备能够提供计算服务，也就是在图1中，终端设备1可以与云服务器3协同进行边缘计算，进行边缘计算的终端设备1又可被称为“边缘设备”。例如，终端设备1能够以较低的时延对本地数据进行处理后，将处理后的数据发送至云服务器3，从而不需要终端设备1将数据发送给云服务器3计算，减少了云服务器3的计算压力，提高了云服务系统的运行效率。

更为具体地，机器学习模型(本申请实施例中简称：模型)的训练与计算，是云服务系统中常见的一种边缘计算方式，例如，云服务器3的供应商通过采集大量的训练数据，借助较高性能的服务器，训练得到可用于识别图像中动物类别的机器学习模型31，并向需要使用该机器学习模型的终端设备1下发该机器学习模型31。如图1中，云服务器3可以将机器学习模型31下发给标号为11-13的三个终端设备1，每个终端设备1均可以通过接收到的机器学习模型31，对各自采集的图像中的动物类别进行识别，从而实现云服务器3提供的模型在终端设备1进行计算的边缘计算场景。

同时，由于供应商所采集的训练数据与终端设备1进行边缘计算时使用的计算数据可能存在差异，并且随着外部条件的变化，计算数据也随时可能变化，可能会导致机器学习模型31在进行边缘计算时的计算精度下降，因此，在上述边缘计算的场景中，在向终端设备1发送机器学习模型31后，云服务器3还可以继续对机器学习模型31进行更新，并将更新后的机器学习模型31发送给终端设备1，以提高终端设备1使用机器学习模型31进行边缘计算的计算精度。

在第一种对机器学习模型31进行更新的方式中，每个终端设备1将使用机器学习模型31进行计算的数据都发送给云服务器3，由云服务器3根据各个终端设备1所发送的数据，对机器学习模型31进行更新，并将更新后的机器学习模型31再发送给各终端设备1。但是，这种更新方式完全依赖于云服务器3的计算能力，并且给云服务器3和终端设备1增加了大量的交互数据量，增加了带宽的要求，进而降低了整个云服务系统的运行效率。同时，一些终端设备1所处理的较为敏感的数据也会直接发送给云服务器3，在这个过程中无法保证数据的安全。并且由于各个终端设备1都将数据直接上传到云服务器，不同终端设备之间，无法实现数据的共享，造成“数据孤岛”问题。

在第二种对机器学习模型31进行更新的方式中，图2为一种云服务系统的结构示意图，如图2所示的系统在如图1所示场景的基础上，通过联邦学习(federated learning)服务对机器学习模型31进行更新，其中，联邦学习服务端(federated learning service，FLS)部署在云服务器3内，联邦学习客户端(federated learning client，FLC)部署在每个终端设备1内，所有FLC可以通过前置代理(agent)服务器连接FLS，这种结构又可被称为“边云协同”更新结构。在如图2所示的云服务系统中，每个终端设备1部署的FLC可以根据终端设备1使用机器学习模型31进行计算时使用的数据，自行对机器学习模型31进行更新，并将对机器学习模型31进行更新得到的梯度值通过前置代理服务器4发送给FLS。则FLS可以根据多个FLC发送的梯度值，对机器学习模型31进行更新，并将更新后的机器学习模型31再发送给各终端设备1。但是，这种更新方式对终端设备1的计算能力提出了较高的要求，终端设备1除了使用机器学习模型31进行计算，还需要计算对机器学习模型31进行更新的梯度值，而实际使用时更多的终端设备1计算能力有限，通过有限的计算能力很难直接参与机器学习模型31的更新。

综上，基于上述两种方式对机器学习模型31进行更新时都存在各自的不足，或依赖于云服务器3进行更新而降低系统性能且造成数据孤岛问题，或者依赖于终端设备1进行更新而受到计算能力的限制不易实现，本申请提供一种云服务系统的模型处理方法及云服务系统，通过在云服务器和终端设备之间设置本地服务器，由本地服务器根据所连接的至少一个终端设备的数据，与云服务器一起对机器学习模型进行更新，从而在保证机器学习模型进行更新的同时，减少了对云服务器、终端设备的计算能力的要求以及二者之间的数据交互，进而提高了整个云服务系统的运行效率。

下面以具体地实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

图3为本申请提供的云服务系统一实施例的结构示意图，如图3所示的云服务系统包括：云服务器3和多个本地服务器5，例如，在图3中的多个本地服务器5分别与云服务器3连接。同时，本地服务器5还可以连接至少一个边缘设备1，所述边缘设备1可以是能够进行边缘计算的终端设备。例如，在图3中一个本地服务器5可以与多个边缘设备1连接作为示例。所述本地服务器2可以是设置在多个边缘设备所在地的服务器，在一个示例的场景中，位于A市的B公司在其公司内设置了云服务器，并提供机器学习模型，则位于C市的D公司使用多个边缘设备时，可以在D公司内设置本地服务器，使得D公司的多个边缘设备连接D公司内设置的本地服务器，同时，设置在D公司的本地服务器可以通过互联网连接设置在B公司的云服务器。

具体地，云服务器3可以向需要机器学习模型的边缘设备1提供机器学习模型，并且云服务器3向每个边缘设备1所提供的机器学习模型的数量可以是一个或多个。例如，在如图3所示的系统中，云服务器3可以在训练得到多个机器学习模型后，将多个机器学习模型发送给连接的本地服务器5，由本地服务器5将机器学习模型发送给对应的边缘设备1。例如，云服务器3中训练得到用于实现不同功能的机器学习模型之后，假设本地服务器5连接的至少一个边缘设备需要使用识别动物类别的机器学习模型，则云服务器3将用于识别动物类别的多个机器学习模型发送至本地服务器5后，由本地服务器5再将多个机器学习模型发送给连接的边缘设备，接收到机器学习模型的边缘设备可以根据机器学习模型进行动物类别识别的边缘计算，在这个过程中，本地服务器5可以起到网关的作用。

进一步地，本申请提供的如图3所示的云服务系统在实现上述边缘计算的基础上，还可以由本地服务器5和云服务器3协同对云服务器提供的机器学习模型进行更新，下面以云服务器连接的一个本地服务器(记为第一本地服务器)，以及第一本地服务器连接的一个边缘设备(记为第一边缘设备)为例，对本实施例提供的云服务系统的模型处理方法中，第一本地服务器和云服务器协同，对第一边缘设备使用的机器学习模型进行更新的流程说明。

图4为本申请提供的云服务系统的模型处理方法一实施例的流程示意图，如图4所示的方法的执行主体可以应用在如图3所示的云服务系统中，由云服务器3和云服务器3所连接的任一个本地服务器5执行，并且本地服务器还连接至少一个边缘设备1。

S101：第一本地服务器获取所连接的至少一个边缘设备的数据集。

具体地，本实施例提供的模型处理方法，基于云服务器已经将机器学习模型发送给本地服务器，并由本地服务器将机器学习模型发送给边缘设备进行使用。则在S101中，为了对机器学习模型进行更新，第一本地服务器所连接的所有边缘设备在使用机器学习模型进行计算时，将计算使用的数据都发送给第一本地服务器。

可以理解的是，每个边缘设备使用的机器学习模型可以有一个或多个，以其中任一个作为第一模型进行说明。则在S101中，将每个边缘设备使用第一模型进行计算时的数据记为一个数据集，第一本地服务器接收所连接的边缘设备发送的使用第一模型进行计算时的数据。

示例性地，云服务器将识别图像中动物类别为猫或者狗的第一模型发送给第一本地服务器，第一本地服务器将第一模型发送给第一本地服务器所连接的两个边缘设备后，在S101中，可以接收到一个边缘设备发送的数据集，包括使用第一模型计算时的两张猫的图像，以及接收到另一个边缘设备发送的数据集，包括使用第一模型计算时的两张狗和一张猫的图像。

S102：第一本地服务器根据S101中获取的至少一个边缘设备的数据集，计算得到用于第一模型进行更新的第一梯度值。

具体地，本实施例中提供的第一本地服务器除了能够提供网关的功能，还具有获得模型更新的参数的能力，并在获取了一定数量的数据集之后，即可计算得到第一模型进行更新的参数，例如用于更新第一模型的梯度值，这种更新方式由于没有云服务器的参与，并且所进行的计算并没有直接对第一模型进行更新，而是得到对第一模型进行更新的参数，故可被称为“本地更新”。

例如，在上述示例中，由于云服务器在训练第一模型时采集的猫和狗的图像与边缘设备实际使用第一模型计算时的图有所不同，第一本地服务器可以将接收到的两张狗和三张猫的图像后，使用这五张图像对第一模型进行本地更新，得到第一梯度值，假设第一模型中的参数为2，第一本地服务器对第一模型进行本地更新后的参数为2.1，则第一梯度值为二者的变化值0.1。

S103：第一本地服务器在S102中得到第一模型的第一梯度值后，在S103中将得到的第一梯度值发送给云服务器，则对应地，云服务器接收第一本地服务器发送的第一梯度值。

具体地，由于第一本地服务器所获取的计算数据的局限性，第一本地服务器进行的计算仅得到了对第一模型进行更新的参数，而并没有对第一模型进行更新，第一本地服务器将第一梯度值发送给云服务器后，由云服务器再根据第一梯度值对第一模型进行更新。在这个过程中，虽然第一本地服务器没有实际完成对第一模型进行更新，但是第一本地服务器也参与到了云服务器对第一模型进行更新的计算中(计算用于更新第一模型的第一梯度值)，因此这个过程也可以被称为云服务器和本地服务器对第一模型进行的“协同更新”。

S104：云服务器根据第一本地服务器发送的第一梯度值，对第一模型进行更新。

具体地，本申请实施例中，云服务器可以采用同步更新或者异步更新的方式，与本地服务器协同对第一模型进行更新。下面结合附图进行说明：

一、同步更新：

图5为本申请提供的模型同步更新的流程示意图，其中，可应用于如图3所示的云服务系统中，将云服务器所连接的除了上述示例中第一本地服务器之外的其他本地服务器都记为第二本地服务器。则当云服务器训练得到第一模型后，首先向所有本地服务器发送第一模型，随后在实际使用过程中，每个本地服务器均通过S101-S103的步骤计算用于对第一模型进行更新的梯度值。例如，第一本地服务器计算得到第一梯度值、并发送给云服务器、第二本地服务器1计算得到第二梯度值1、并发送给云服务器……。所有本地服务器可以根据各自的数据对第一模型进行计算并得到梯度值后，在同一时刻发送至云服务器。则对于云服务器，可以在同时接收到多个本地服务器发送的用于对第一模型更新的梯度值后，对所有梯度值进行梯度聚合，最终对第一模型进行更新。一种简单的示例汇总，假设第一模型中的参数为2，云服务器接收到的梯度值分别为0.1、-0.2、0.3，则云服务器可以将这些梯度相加后得到更新后的第一模型的参数为2.2。云服务器在对第一模型进行更新后，可以将第一模型再次发送给所有本地服务器，并可以继续循环执行图5所示的流程。

二、异步更新：

图6为本申请提供的模型异步更新的流程示意图，其中，与图5中执行主体相同，则当云服务器训练得到第一模型后，首先向所有本地服务器发送第一模型，随后在实际使用过程中，每个本地服务器均通过S101-S103的步骤计算用于对第一模型进行更新的梯度值后，可以分别向云服务器发送更新后的梯度值。例如，第一本地服务器计算得到第一梯度值、并发送给云服务器，此时，云服务器即可对第一模型进行更新后，向第一本地服务器返回更新后的第一模型。随后，当第二本地服务器1计算得到第二梯度值1、并发送给云服务器，此时，云服务器在已经根据第一梯度值对第一模型更新的基础上，再根据第二梯度值1对第一模型进行更新，并向第二本地服务器1返回更新后的第一模型……则当云服务器接收所有本地服务器发送的梯度值，并分别进行更新后，完成整个异步更新的流程，并可以继续循环执行图6所示的流程。

S105：云服务器将更新后的第一模型发送给第一本地服务器。对于第一本地服务器则接收云服务器发送的更新后的第一模型，并对将更新后的第一模型发送给对应的边缘设备，使得后续这些边缘设备可以使用更新后的第一模型进行计算。其中，所述对应的边缘设备可以是需要使用第一模型的边缘设备，或者是已经包括第一模型、但需要对第一模型进行更新的边缘设备。

综上，本实施例提供的云服务系统的模型处理方法，通过在云服务器和边缘设备之间设置的本地服务器，获取边缘设备使用模型进行计算时的数据后，即可通过本地服务器对模型进行更新，并将模型更新后的梯度值发送给云服务器，最终由云服务器根据本地服务器的梯度值对模型进行更新。在整个模型更新的过程中，既不完全依赖云服务器进行数据计算，也不依赖边缘设备本身进行模型的更新，而是通过本地服务器提供的计算能力对模型进行更新，从而在保证对云服务器提供的模型进行更新的基础上，还能够减少了边缘设备与服务器之间的数据交互量，也能够降低了对云服务器以及边缘设备的计算能力的要求，进而提高了整个云服务系统的运行效率。

可选地，上述实施例在一种具体的实现中，第一本地服务器中可以部署FLC、云服务器中可以部署FLC，此时，可以由第一本地服务器代替边缘设备实现如图2所示的联邦学习的更新技术，由于本实施例中提供的第一本地服务器的计算能力可以大于边缘设备，并且边缘设备可以不用进行模型的更新，与如图2所示的在边缘设备中部署FLC的技术相比，同样能够减少对边缘设备的计算能力的要求，进而提高云服务系统的运行效率。

进一步地，本实施例提供的本地服务器还可以具有存储机器学习模型的功能，并可以将存储的模型按照不同边缘设备的需要分别发送给对应的边缘设备。例如，图7为本申请提供的云服务系统模型处理方法一实施例的流程示意图，如图7所示的方法可应用于如图3所示的云服务系统中，并可以在如图4所示的实施例中S101之前执行。

S201、云服务器预训练多个模型。其中，云服务器可以根据供应商提供的训练数据集，得到多个机器学习模型。例如，供应商采集不同动物的图像，并对其中猫和狗的图像进行标注后，由云服务器训练得到的模型，可用于对图像中动物是猫或者狗进行识别。

S202、云服务器将S201中训练得到的多个模型发送给第一本地服务器。则对于第一本地服务器，则接收云服务器发送的多个模型。

S203、第一本地服务器接收多个模型后，存储在第一本地服务器的存储空间内。

S204、第一本地服务器确定与第一边缘设备对应的至少一个模型。

具体地，本实施例云服务器预训练得到的多个模型可以全部发送给第一本地服务器，或者部分发送给第一本地服务器。则第一本地服务器接收到多个模型之后，确定每个连接的边缘设备对应的至少一个模型。记第一本地服务器连接的任一边缘设备为第一边缘设备，第一本地服务器可以根据第一边缘设备的算力大小、对计算的要求或者支持的模型类型等，确定第一边缘设备对应的模型。例如，若存在多个识别图像中动物类别为猫或狗的模型，而模型的大小不同，当第一边缘设备的计算性能较好时，可以确定第一边缘设备对应较大的模型，当第一边缘设备的计算性能较差时，可以确定第一边缘设备对应较小的模型。

S205、第一本地服务器在向第一边缘设备发送在S204中所确定的至少一个模型。

可以理解的是，第一本地服务器可以确定其所连接的每一个边缘设备对应的模型，并分别向每个边缘设备发送对应的模型。同时，对于第一边缘设备，在接收到模型之后，可以使用模型进行计算。可以理解的是，第一本地服务器向第一边缘设备发送的至少一个模型中包括前述实施例中的第一模型。

综上，本实施例提供的云服务系统的模型更新方法中，第一本地服务器还具有存储模型，并确定边缘设备对应的模型的功能，从而进一步减少了云服务器所需要进行的计算，云服务器只需要将训练得到的模型发送给本地服务器，由本地服务器更有针对性地将模型分别下发给对应的边缘设备，还能够让第一边缘设备所使用的模型更精确，提高了第一边缘设备使用模型计算时的精准度，进而进一步提高了整个云服务系统的运行效率。

可选地，为了实现本申请实施例中提供的云服务系统，在实现前述方法之前，供应商还可以对整个云服务系统进行搭建。图8为本申请提供的云服务系统模型处理方法一实施例的流程示意图，如图8所示的实施例示出了如图3所示的云服务系统的搭建流程。

S301、云服务器首先进行云服务器一侧功能的搭建，例如，在一种具体实现中，云服务器可以部署联邦学习服务端。

S302、第一本地服务器向云服务器发送请求信息，请求搭建第一本地服务器。

S303、云服务器根据请求信息，对第一本地服务器进行认证注册。

S304、云服务器在认证注册成功之后，向第一本地服务器发送构建工具和标注工具。其中，构建工具用于第一本地服务器的搭建，标注工具用于对数据集中的数据进行标注。

S305、第一本地服务器根据接收到的构建工具，进行第一本地服务器一侧功能的搭建，例如，第一本地服务器可以部署联邦学习客户端。

S306、第一本地服务器在接收到构建工具之后，可以对数据进行标注，并通过S307对本地数据集进行更新。

具体地，对于S306-S307的流程可以参照图9所示的示例，其中，图9为本申请实施例提供的数据标注的流程示意图，其中，第一本地服务器在接收到所连接的至少一个边缘设备发送的数据集之后，即可开始对数据集中的数据进行标注，记第一本地服务器正在标注的数据为第一数据。

则第一本地服务器手下能通过标注工具，对第一数据进行标注得到多个标注结果。其中，所述标注工具可以是多个预训练模型，例如，云服务器训练得到的多个用于对图像中动物类别为猫或者狗的模型，第一数据为猫或者狗的图像，每个预训练模型都可以对第一数据进行标注得到猫或者狗的结果。随后，第一本地服务器可以对多个预训练模型的结果进行判读，当多个模型的多个标注结果均相同时，则第一本地服务器将第一数据加入本地数据集，本地数据集用于后续第一本地服务器在更新第一模型时使用；当多个模型的多个标注结果不完全相同时，则需要进入人工复检步骤，第一服务器可以向工作人员使用的第一设备发送第一数据，让工作人员对第一数据进行人工标注，随后第一服务器接收到工作人员通过第一设备发送的确认信息后，可以将第一数据加入本地数据集中。此外，若工作人员认为样本异常，第一服务器在接收到工作人员通过第一设备发送的异常信息后，可以将第一数据删除不做后续处理。

可选地，所述本地数据集存储在第一本地服务器中，其他本地服务器无法访问，而第一本地服务器所连接的至少一个边缘设备可以访问。因此，至少一个边缘设备可以通过第一本地服务器实现了数据共享，同时，也能保证上传至本地服务器的数据的安全性。例如，某个公司的所有边缘设备可以连接一个本地服务器，则这个公司内的所有边缘设备处理的数据可以通过上述流程加入本地数据集，本地服务器在更新每个模型时都可以使用本地数据集中的数据，而其他公司无法获取这个公司的数据。此外，本地服务器在对模型进行更新后，向云服务器发送的也只是更新的梯度值，使用的数据不会发送至网络，从而进一步保证了数据的安全性。

进一步地，本申请提供的云服务系统中，第一本地服务器还具有对模型进行排序的功能。具体地，图10为本申请提供的云服务系统的模型处理方法一实施例的流程示意图，可应用于如图3所示的云服务系统中。

S401：云服务器向第一本地服务器发送预训练的多个模型。其中，云服务器可以将预训练的多个模型全部发送给第一本地服务器，或者，云服务器将第一本地服务器所连接的边缘设备需要使用的多个模型发送给第一本地服务器。

S402：第一本地服务器确定所连接的至少一个边缘设备在使用多个模型进行计算时的性能参数。可选地，所述性能参数可以是计算精度或者计算速度。则S402中，第一本地服务器将统计所有边缘设备使用不同模型时的性能参数。例如，第一本地服务器连接了边缘设备1-5，并统计边缘设备1-3使用模型a计算得到结果的平均时间为0.1秒、统计边缘设备2-5使用模型b计算得到结果的平均时间为0.2秒……等。

S403：第一本地服务器根据S401中确定的多个模型的性能参数，对多个模型进行排序。例如，第一本地服务器计算所连接的边缘设备使用模型a计算时间为0.1秒、使用模型b计算时间为0.2秒……等，则第一本地服务器可以按照计算速度由快到慢的顺序对多个模型进行排序，例如：a，b，……。

S404：第一本地服务器向云服务器发送S402中所确定的多个模型的排序信息。

S405：云服务器根据排序信息，对多个模型进行排序。最终，云服务器可以根据所有连接的本地服务器所发送的排序信息，对云服务器提供的所有模型进行排序。并且在排序之后，可以删除一些排序靠后的模型，并用一些其他的模型替代。在此之后，云服务器可以重复S401的步骤，将更新后的多个模型发送给本地服务器。此时，由于多个模型按照顺序排列，假设边缘设备需要识别图像中动物类别的两个模型时，云服务器可以将更新后排序最前的两个用于识别图像中动物类别的模型发送给本地服务器，由本地服务器发送给边缘设备，保证了边缘设备使用的模型是排序最靠前的、也即计算性能更优的。

综上，本实施例提供的云服务系统的模型更新方法中，本地服务器可以对所连接的边缘设备使用模型的性能参数进行排序，并将排序信息发送给云服务器，云服务器对多个模型进行排序后，可以不断优化云服务器所提供的模型的组成，实现模型的“优胜劣汰”，提高后续边缘设备使用模型计算时的性能，从而进一步提高了整个云服务系统的运行效率。

可选地，如图3所示的云服务系统以云服务器连接多个本地服务作为示例，在具体实现中，云服务器也可以直接连接边缘设备，实现混合部署。例如，图11为本申请提供的另一种云服务系统的结构示意图，其中，在如图3所示实施例的基础上，云服务器3还可以直接与边缘设备1连接，例如图中以标号为6的边缘设备为例，则对于本地服务器5可以与云服务器3协同执行本申请前述实施例中对模型进行更新等处理，而对于云服务器3直接连接的边缘设备6，可以不参与模型的更新，但是在云服务器3对模型进行更新后，除了给本地服务器5发送更新后的模型，由本地服务器5将更新后的模型发送给所连接的边缘设备1，也会给直接连接的边缘设备6发送更新后的模型。因此，本实施例提供的云服务系统具有较强的部署灵活性，能够一定程度上减少云服务系统中本地服务器的数量。

在前述实施例中，对本申请实施例提供的云服务系统，以及云服务系统的模型处理方法进行了介绍，而为了实现上述本申请实施例提供的云服务系统的模型处理方法中的各功能，作为执行主体的云服务器和第一本地服务器可以包括硬件结构和/或软件模块，以硬件结构、软件模块、或硬件结构加软件模块的形式来实现上述各功能。上述各功能中的某个功能以硬件结构、软件模块、还是硬件结构加软件模块的方式来执行，取决于技术方案的特定应用和设计约束条件。

例如，图12为本申请提供的云服务系统模型处理装置一实施例的结构示意图，如图12所示的装置可作为本申请前述各实施例中的第一本地服务器，并执行第一本地服务器执行的方法。如图12所示的装置120包括：获取模块1201，处理模块1202和传输模块1203。其中，获取模块1201用于获取至少一个边缘设备的数据集，数据集包括至少一个边缘设备使用云服务器提供的第一模型进行计算时使用的数据；处理模块1202用于根据至少一个边缘设备的数据集，确定用于对第一模型进行更新的第一梯度值；传输模块1203用于向云服务器发送第一梯度值。

可选地，传输模块1203还用于，接收云服务器发送的多个模型，并将多个模型存储在存储模块中；处理模块1202还用于，确定至少一个边缘设备中第一边缘设备对应的至少一个模型；传输模块1203还用于，向第一边缘设备发送至少一个模型。

可选地，传输模块1203还用于，接收云服务器发送的构建工具和标注工具；其中，构建工具用于第一本地服务器的搭建，标注工具用于对数据集中的数据进行标注。

可选地，处理模块1202还用于，通过标注工具，对至少一个边缘设备的数据集中的第一数据进行标注得到多个标注结果；并当多个标注结果均相同时，第一本地服务器将第一数据加入本地数据集，本地数据集用于确定用于对第一模型进行更新的第一梯度值；传输模块1203还用于，当多个标注结果不完全相同时，向第一设备发送第一数据，并在接收到第一设备发送的确认信息后，将第一数据加入本地数据集。

可选地，处理模块1202还用于，确定所连接的至少一个边缘设备在使用第一本地服务器所存储的多个模型进行计算时的性能参数，并按照性能参数对多个模型进行排序；传输模块还用于，向云服务器发送多个模型的排序信息。

如图12所示的云服务系统模型处理装置的具体工作方式及原理可参照本申请前述方法中第一本地服务器的描述，不再赘述。

图13为本申请提供的云服务系统模型处理装置一实施例的结构示意图。如图13所示的装置可作为本申请前述各实施例中的云服务器，并执行云服务器执行的方法。如图13所示的装置130包括：传输模块1301，处理模块1302。其中，传输模块1301用于接收第一本地服务器发送的第一梯度值，其中，第一梯度值用于对云服务器提供的第一模型进行更新；处理模块1302用于根据第一梯度值对第一模型进行更新；传输模块还用于，向第一本地服务器发送更新后的第一模型。

可选地，处理模块1302具体用于，根据第一梯度值，以及多个本地服务器中至少一个第二本地服务器发送的梯度值，对第一模型进行更新。

可选地，传输模块1301还用于，向第一本地服务器发送构建工具和标注工具；其中，构建工具用于第一本地服务器的搭建，标注工具用于对数据集中的数据进行标注。

可选地，传输模块1301还用于，接收第一本地服务器发送的多个模型的排序信息；处理模块还用于，根据多个模型的排序信息，对多个模型进行排序。

如图13所示的云服务系统模型处理装置的具体工作方式及原理可参照本申请前述方法中云服务器的描述，不再赘述。

需要说明的是，应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。例如，处理模块可以为单独设立的处理元件，也可以集成在上述装置的某一个芯片中实现，此外，也可以以程序代码的形式存储于上述装置的存储器中，由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。这里所述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

例如，以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(application specific integrated circuit，ASIC)，或，一个或多个微处理器(digital signal processor，DSP)，或，一个或者多个现场可编程门阵列(field programmable gate array，FPGA)等。再如，当以上某个模块通过处理元件调度程序代码的形式实现时，该处理元件可以是通用处理器，例如中央处理器(central processing unit，CPU)或其它可以调用程序代码的处理器。再如，这些模块可以集成在一起，以片上系统(system-on-a-chip，SOC)的形式实现。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘solid state disk(SSD))等。

此外，本申请实施例还提供另外一种可应用于实现本申请提供的第一本地服务器或者云服务器的计算装置结构，图14为本申请提供的计算装置的结构示意图，如图14所示，计算装置1400中可以包括通信接口1410、处理器1420。可选的，计算装置1400中还可以包括存储器1430。其中，存储器1430可以设置于计算装置内部，还可以设置于计算装置外部。

示例性地，上述图4-图10中各个第一本地服务器所执行的动作均可以由处理器1420实现。处理器1420通过通信接口1410发送数据，并用于实现图4-图10中所述的第一本地服务器所执行的任一方法。在实现过程中，处理流程的各步骤可以通过处理器1420中的硬件的集成逻辑电路或者软件形式的指令完成图4-图10中所述第一本地服务器所执行的方法。为了简洁，在此不再赘述。处理器1420用于实现上述方法所执行的程序代码可以存储在存储器1430中。存储器1430和处理器1420连接，如耦合连接等。

又示例性地，上述图4-图10中各个云服务器所执行的动作均可以由处理器1420实现。处理器1420通过通信接口1410发送控制信号以及通信数据，并用于实现图4-图10中所述的云服务器所执行的任一方法。在实现过程中，处理流程的各步骤可以通过处理器1420中的硬件的集成逻辑电路或者软件形式的指令完成图4-图10中所述云服务器所执行的方法。为了简洁，在此不再赘述。处理器1420用于实现上述方法所执行的程序代码可以存储在存储器1430中。存储器1430和处理器1420连接，如耦合连接等。

本申请实施例的一些特征可以由处理器1420执行存储器1430中的程序指令或者软件代码来完成/支持。存储器1430上在加载的软件组件可以从功能或者逻辑上进行概括，例如，图12所示的获取模块1201、处理模块1202以及传输模块1302；又例如，图13所示的传输模块1301以及处理模块1302。

本申请实施例中涉及到的任一通信接口可以是电路、总线、收发器或者其它任意可以用于进行信息交互的装置。比如计算装置1400中的通信接口1410，示例性地，该其它装置可以是与该计算装置相连的设备，比如，当计算装置是第一本地服务器时，其他装置可以是云服务器；当计算装置是云服务器是云服务器时，其他装置可以是第一本地服务器。

本申请实施例中涉及的处理器可以是通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件，可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

本申请实施例中的耦合是装置、模块或模块之间的间接耦合或通信连接，可以是电性，机械或其它的形式，用于装置、模块或模块之间的信息交互。

处理器可能和存储器协同操作。存储器可以是非易失性存储器，比如硬盘(hard disk drive，HDD)或固态硬盘(solid-state drive，SSD)等，还可以是易失性存储器(volatile memory)，例如随机存取存储器(random-access memory，RAM)。存储器是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。

本申请实施例中不限定上述通信接口、处理器以及存储器之间的具体连接介质。比如存储器、处理器以及通信接口之间可以通过总线连接。所述总线可以分为地址总线、数据总线、控制总线等。当然，处理器与存储器之间的连接总线，并非为前述云服务器和第一本地服务器之间的连接总线。

在本申请实施例中，“至少一个”是指一个或者多个，“多个”是指两个或两个以上。 “和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B的情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系；在公式中，字符“/”，表示前后关联对象是一种“相除”的关系。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b，或c中的至少一项(个)，可以表示：a，b，c，a-b，a-c，b-c，或a-b-c，其中，a，b，c可以是单个，也可以是多个。

可以理解的是，在本申请实施例中涉及的各种数字编号仅为描述方便进行的区分，并不用来限制本申请实施例的范围。可以理解的是，在本申请的实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

一种云服务系统，其特征在于，包括：

云服务器和多个本地服务器，所述多个本地服务器中的第一本地服务器通过网络与所述云服务器连接，所述第一本地服务器还连接至少一个边缘设备；

所述第一本地服务器用于：获取所述至少一个边缘设备的数据集，所述数据集包括所述至少一个边缘设备使用所述云服务器提供的第一模型进行计算时使用的数据；根据所述至少一个边缘设备的数据集，确定用于对所述第一模型进行更新的第一梯度值；并将所述第一梯度值发送至所述云服务器；

所述云服务器用于：根据所述第一梯度值对所述第一模型进行更新，并向所述第一本地服务器发送更新后的所述第一模型。
根据权利要求1所述的系统，其特征在于，

所述云服务器还用于，向所述云服务器发送多个模型；

所述第一本地服务器还用于：接收并存储所述云服务器发送的多个模型；确定所述至少一个边缘设备中第一边缘设备对应的至少一个模型；并向所述第一边缘设备发送所述至少一个模型。
根据权利要求1或2所述的系统，其特征在于，

所述云服务器还用于：向所述第一本地服务器发送构建工具和标注工具；其中，所述构建工具用于所述第一本地服务器的搭建，所述标注工具用于对所述数据集中的数据进行标注。
根据权利要求3所述的系统，其特征在于，

所述第一本地服务器还用于：确定所连接的所述至少一个边缘设备在使用所述第一本地服务器所存储的多个模型进行计算时的性能参数，并按照所述性能参数对所述多个模型进行排序；向所述云服务器发送所述多个模型的排序信息；

所述云服务器用于:根据所述多个模型的排序信息，对所述多个模型进行排序。
根据权利要求1-4任一项所述的系统，其特征在于，

所述云服务器具体用于:根据所述第一梯度值，以及所述多个本地服务器中至少一个第二本地服务器发送的梯度值，对所述第一模型进行更新。
一种云服务系统的模型处理方法，其特征在于，

所述云服务系统包括云服务器和多个本地服务器，所述多个本地服务器中的第一本地服务器通过网络与所述云服务器连接，所述第一本地服务器还连接至少一个边缘设备；

所述方法包括：

所述第一本地服务器获取所述至少一个边缘设备的数据集，所述数据集包括所述至少一个边缘设备使用所述云服务器提供的第一模型进行计算时使用的数据；

所述第一本地服务器根据所述至少一个边缘设备的数据集，确定用于对所述第一模型进行更新的第一梯度值；

所述第一本地服务器向所述云服务器发送所述第一梯度值。
根据权利要求6所述的方法，其特征在于，所述第一本地服务器获取所述至少一个边缘设备的数据集之前，所述方法还包括：

所述第一本地服务器接收并存储所述云服务器发送的多个模型；

所述第一本地服务器确定所述至少一个边缘设备中第一边缘设备对应的至少一个模型；

所述第一本地服务器向所述第一边缘设备发送所述至少一个模型。
根据权利要求6或7所述的方法，其特征在于，所述第一本地服务器获取所述至少一个边缘设备的数据集之前，所述方法还包括：

所述第一本地服务器接收所述云服务器发送的构建工具和标注工具；其中，所述构建工具用于所述第一本地服务器的搭建，所述标注工具用于对所述数据集中的数据进行标注。
根据权利要求8所述的方法，其特征在于，所述第一本地服务器获取所述至少一个边缘设备的数据集之后，所述方法还包括：

所述第一本地服务器通过所述标注工具，对所述至少一个边缘设备的数据集中的第一数据进行标注得到多个标注结果；

当所述多个标注结果均相同时，所述第一本地服务器将所述第一数据加入本地数据集，所述本地数据集用于确定用于对所述第一模型进行更新的第一梯度值；

当所述多个标注结果不完全相同时，所述第一本地服务器向第一设备发送所述第一数据，并在接收到所述第一设备发送的确认信息后，将所述第一数据加入所述本地数据集。
根据权利要求9所述的方法，其特征在于，所述方法还包括：

所述第一本地服务器确定所连接的所述至少一个边缘设备在使用所述第一本地服务器所存储的多个模型进行计算时的性能参数，并按照所述性能参数对所述多个模型进行排序；

所述第一本地服务器向所述云服务器发送所述多个模型的排序信息。
一种云服务系统的模型处理方法，其特征在于，

所述云服务系统包括云服务器和多个本地服务器，所述多个本地服务器中的第一本地服务器通过网络与所述云服务器连接，所述第一本地服务器还连接至少一个边缘设备；

所述方法包括：

所述云服务器接收所述第一本地服务器发送的第一梯度值，其中，所述第一梯度值用于对所述云服务器提供的第一模型进行更新；

所述云服务器根据所述第一梯度值对所述第一模型进行更新；

所述云服务器向所述第一本地服务器发送更新后的所述第一模型。
根据权利要求11所述的方法，其特征在于，所述云服务器根据所述第一梯度值对所述第一模型进行更新，包括：

所述云服务器根据所述第一梯度值，以及所述多个本地服务器中至少一个第二本地服务器发送的梯度值，对所述第一模型进行更新。
根据权利要求11或12所述的方法，其特征在于，所述云服务器接收所述第一本地服务器发送的第一梯度值之前，所述方法还包括：

所述云服务器向所述第一本地服务器发送构建工具和标注工具；其中，所述构建工具用于所述第一本地服务器的搭建，所述标注工具用于对数据集中的数据进行标注。
根据权利要求11-13任一项所述的方法，其特征在于，所述方法还包括：

所述云服务器接收所述第一本地服务器发送的多个模型的排序信息；

所述云服务器根据所述多个模型的排序信息，对所述多个模型进行排序。
一种云服务系统的模型处理装置，其特征在于，包括：

获取模块，用于获取至少一个边缘设备的数据集，所述数据集包括所述至少一个边缘设备使用云服务器提供的第一模型进行计算时使用的数据；

处理模块，用于根据所述至少一个边缘设备的数据集，确定用于对所述第一模型进行更新的第一梯度值；

传输模块，用于向所述云服务器发送所述第一梯度值。
根据权利要求15所述的装置，其特征在于，

所述传输模块还用于，接收所述云服务器发送的构建工具和标注工具；其中，所述构建工具用于第一本地服务器的搭建，所述标注工具用于对所述数据集中的数据进行标注。
根据权利要求16所述的装置，其特征在于，

所述处理模块还用于，确定所连接的所述至少一个边缘设备在使用所述第一本地服务器所存储的多个模型进行计算时的性能参数，并按照所述性能参数对所述多个模型进行排序；

所述传输模块还用于，向所述云服务器发送所述多个模型的排序信息。
一种云服务系统的模型处理装置，其特征在于，包括：

传输模块，用于接收第一本地服务器发送的第一梯度值，其中，所述第一梯度值用于对云服务器提供的第一模型进行更新；

处理模块，用于根据所述第一梯度值对所述第一模型进行更新；

所述传输模块还用于，向所述第一本地服务器发送更新后的所述第一模型。
根据权利要求18所述的装置，其特征在于，

所述传输模块还用于，向所述第一本地服务器发送构建工具和标注工具；其中，所述构建工具用于所述第一本地服务器的搭建，所述标注工具用于对数据集中的数据进行标注。
根据权利要求18或19所述的装置，其特征在于，

所述传输模块还用于，接收所述第一本地服务器发送的多个模型的排序信息；

所述处理模块还用于，根据所述多个模型的排序信息，对所述多个模型进行排序。