CN112799680A

CN112799680A - 一种加速ai模型部署的方法和设备

Info

Publication number: CN112799680A
Application number: CN202110132071.7A
Authority: CN
Inventors: 郭乃洪; 黄瑞祺; 杨亚楠; 陈吉胜
Original assignee: Unisound Intelligent Technology Co Ltd; Xiamen Yunzhixin Intelligent Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd; Xiamen Yunzhixin Intelligent Technology Co Ltd
Priority date: 2021-01-31
Filing date: 2021-01-31
Publication date: 2021-05-14

Abstract

本发明涉及一种加速AI模型部署的方法和设备，应用于包括多个节点的P2P网络中，该方法包括：在待部署的机器上设置基于P2P算法的传输工具；将机器作为一个新的节点加入到P2P网络中；将待部署的AI模型的数据进行分片，以将数据分为多个数据片；基于Chord算法作分布式协调获取P2P中各节点和各数据片；确定每个数据片的特征码，其中，不同的数据片对应不同的特征码；在Chord环上存储特征码，以基于传输工具通过Chord环上的特征码完成AI模型在机器上的部署。本方案，基于P2P网络以及传输技术，对网络连接里面的多条链路的带宽充分利用，相比传统方式，带宽利用率更高，传输效率更高，传输时间更短，有效提高了AI模型的部署效率。

Description

一种加速AI模型部署的方法和设备

技术领域

本发明涉及AI模型部署领域，具体涉及一种加速AI模型部署的方法和设备。

背景技术

人工智能(Artificial Intelligence)，英文缩写为AI。是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

在部署AI(Artificial Intelligence，人工智能)模型时，传统的方法一般是使用scp(Secure Copy Protocol，是在Linux系统下进行远程传输文件的工具，用于进行服务器间的数据传输)或者rsync(remote sync，是类unix系统下的数据镜像备份工具)进行批量部署，AI模型越大的情况，由于需要逐个机器分别部署，导致需要每个机器都传输全部的AI模型的数据，而数据的传输需要依次进行，例如传递一个AI模型到一台机器的时间是T，传输n台机器的时间那就是n*T；这对网络的带宽浪费越严重。而目前随着AI模型的不断发展，AI模型的数据量越来越大，导致部署的效率低下。

由此，目前需要有一种更好的方案来解决现有技术中的问题

发明内容

本发明提供一种加速AI模型部署的方法和设备，能够解决现有技术中不是效率低下的技术问题。

本发明解决上述技术问题的技术方案如下：

本发明实施例提出了一种加速AI模型部署的方法，应用于包括多个节点的P2P网络中，该方法包括：

在待部署的机器上设置基于P2P算法的传输工具；

将所述机器作为一个新的节点加入到P2P网络中；

将待部署的AI模型的数据进行分片，以将所述数据分为多个数据片；

基于Chord算法作分布式协调获取所述P2P中各所述节点和各所述数据片；

确定每个所述数据片的特征码，其中，不同的所述数据片对应不同的所述特征码；

在Chord环上存储所述特征码，以基于所述传输工具通过所述Chord环上的所述特征码完成所述AI模型在所述机器上的部署。

在一个具体的实施例中，所述将所述机器作为一个新的节点加入到P2P网络中，包括：

对所述机器进行鉴权；

若鉴权通过，则通过鉴权的所述机器作为一个新的节点加入到P2P网络中。

在一个具体的实施例中，还包括：

若鉴权不通过，则基于未通过鉴权的所述机器的信息生成提示信息。

在一个具体的实施例中，所述鉴权是使用所述P2P网络中的一个或多个所述节点完成的。

在一个具体的实施例中，所述数据片的大小为240KB-280KB之间的任意值。

在一个具体的实施例中，所述特征码为hash code。

在一个具体的实施例中，完成所述AI模型在所述机器上的部署所需要的时间基于以下公式来确定：

D_p2p是基于P2P算法完成所述AI模型在所述机器上的部署的时间；

F是需要传输的数据大小；n是需要传输的份数；u_s是所述节点作为服务器上传的速率；d_min是所述节点作为客户端下载的速率；u_i是P2P的传输速率。

本发明实施例还提出了一种加速AI模型部署的设备，应用于包括多个节点的P2P网络中，该设备包括：

设置模块，用于在待部署的机器上设置基于P2P算法的传输工具；

加入模块，用于将所述机器作为一个新的节点加入到P2P网络中；

分片模块，用于将待部署的AI模型的数据进行分片，以将所述数据分为多个数据片；

获取模块，用于基于Chord算法作分布式协调获取所述P2P中各所述节点和各所述数据片；

确定模块，用于确定每个所述数据片的特征码，其中，不同的所述数据片对应不同的所述特征码；

部署模块，用于在Chord环上存储所述特征码，以基于所述传输工具通过所述Chord环上的所述特征码完成所述AI模型在所述机器上的部署。

在一个具体的实施例中，所述加入模块，包括：

鉴权模块，用于对所述机器进行鉴权；

处理模块，用于当鉴权通过时，通过鉴权的所述机器作为一个新的节点加入到P2P网络中。

在一个具体的实施例中，还包括：

提示模块，用于若鉴权不通过，则基于未通过鉴权的所述机器的信息生成提示信息。

本发明的有益效果是：

本方案，基于P2P网络以及传输技术，对网络连接里面的多条链路的带宽充分利用，相比传统方式，带宽利用率更高，传输效率更高，传输时间更短，有效提高了AI模型的部署效率。

附图说明

图1为本发明实施例提供的一种加速AI模型部署的方法的流程示意图；

图2为本发明实施例提供的一种加速AI模型部署的方法中P2P网络的结构示意图；

图3为本发明实施例提供的一种加速AI模型部署的方法中Chord的环的示意图；

图4为本发明实施例提供的一种加速AI模型部署的方法与现有方式进行部署的时间对比示意图；

图5为本发明实施例提供的一种加速AI模型部署的设备的结构示意图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

本发明实施例提供的一种加速AI模型部署的方法，应用于包括多个节点的P2P网络中，该方法包括以下步骤：

步骤101、在待部署的机器上设置基于P2P算法的传输工具；

具体的，机器可以为任何可以部署AI模型的机器，例如计算机，平板电脑，智能手机，般现有的服务器等带有计算能力的终端，首先在机器上设置上用于实现P2P(Peer toPeer，对等网络)算法的传输工具。

具体的对等网络是一种网络结构的思想。它与目前网络中占据主导地位的客户端/服务器(Client/Server)结构(也就是WWW所采用的结构方式)的一个本质区别是，整个网络结构中不存在中心节点(或中心服务器)。在P2P结构中，每一个节点(peer)大都同时具有信息消费者、信息提供者和信息通讯等三方面的功能。从计算模式上来说，P2P打破了传统的Client/Server(C/S)模式，在网络中的每个节点的地位都是对等的。每个节点既充当服务器，为其他节点提供服务，同时也享用其他节点提供的服务。

至于基于P2P算法的传输工具了例如可以为Xender，Infinit等等。

步骤102、将所述机器作为一个新的节点加入到P2P网络中；

具体的，在执行了不在101之后，将该机器作为一个新的节点加入到P2P网络中，如图2所示，P2P网络的结构由多个节点组成，每个节点既充当客户端，又充当服务器。

具体的，为了保证传输的安全，以及进行权限的控制，步骤102中的所述将所述机器作为一个新的节点加入到P2P网络中，包括：对所述机器进行鉴权；若鉴权通过，则通过鉴权的所述机器作为一个新的节点加入到P2P网络中。以此，只有通过鉴权的机器才能加入到P2P网络中，例如通过鉴权的机器对应图2中的节点5，将节点5作为一个新的节点加入到P2P网络中后形成新的P2P网络。

具体的，若鉴权不通过，则基于未通过鉴权的所述机器的信息生成提示信息。以此，若鉴权不通过，也可以生成提示信息，提示用户存在机器鉴权未通过，便于用户及时进行处理。

具体的，上述的鉴权过程是使用所述P2P网络中的一个或多个所述节点完成的。具体的，例如可以使用1-3个节点作为鉴权中心，例如以图2为例来进行说明，可以选取节点1，节点2来组成鉴权中心对节点5对应的机器进行鉴权。

具体的鉴权方式有多种，例如权限鉴权，或者基于时间来进行鉴权，或者基于机器的名称鉴权等等。

步骤103、将待部署的AI模型的数据进行分片，以将所述数据分为多个数据片；

具体的，由于待部署的AI模型的数据一般比较大，因此对该数据进行分片，具体的所述数据片的大小为240KB-280KB之间的任意值，更具体的例如每个数据片的大小为256KB或者接近256KB大小，以此，后续在进行数据传输时，可以更充分的利用P2P网络的特性，充分利用P2P网络连接里面的多条链路的带宽，加快传输，从而最终提高AI模型的部署效率。

具体的分片可以是P2P中的节点来执行的，

步骤104、基于Chord算法作分布式协调获取所述P2P网络中各所述节点和各所述数据片；

具体的，通过步骤104，可以确定如图2所示的P2P网络中的各个节点，以及进行了切片后的各个数据片。具体的，Chord算法得到的信息或数据等都存储在Chord环上，便于后续进行查找。

步骤105、确定每个所述数据片的特征码，其中，不同的所述数据片对应不同的所述特征码；

具体的，步骤105中的特征码用于唯一标记对应的数据片，在一个具体的例子中，所述特征码为hash code，也即哈希码。

步骤106、在Chord环上存储所述特征码，以基于所述传输工具通过所述Chord环上的所述特征码完成所述AI模型在所述机器上的部署。

具体的，将步骤105中获取的特征码存储在Chord环上，具体的Chord环如图3所示，基于Chord环上的特征码可以对应找到对应的节点以及相关的数据片，从而将其传输至需要部署的机器对应的节点上。

在一个具体的实施例中，采用本申请的方案，完成所述AI模型在所述机器上的部署所需要的时间基于以下公式来确定：

而与之相应的，若采用传统的方式，也即使用scp或者rsync等工具来进行AI模型的部署等，客户端上传或下载资源所需时间的计算则需要基于下列公式来进行：

在该公式中，F是需要传输的数据大小；n是需要传输的份数；u_s是所述节点作为服务器上传的速率；d_min是所述节点作为客户端下载的速率；D_cs是客户端进行上传或下载所需要的时间。

基于与传统的方式进行比对，得到如图4所示的曲线，其中，图4中的Y轴越小，效果越好(说明传输时延低)，p2p对比普通传输方式有显著效果提升。

实施例2

为了对本方案进行进一步的说明，本发明实施例2还公开了一种加速AI模型部署的设备，应用于包括多个节点的P2P网络中，如图所示，该设备包括：

设置模块201，用于在待部署的机器上设置基于P2P算法的传输工具；

加入模块202，用于将所述机器作为一个新的节点加入到P2P网络中；

分片模块203，用于将待部署的AI模型的数据进行分片，以将所述数据分为多个数据片；

获取模块204，用于基于Chord算法作分布式协调获取所述P2P网络中各所述节点和各所述数据片；

确定模块205，用于确定每个所述数据片的特征码，其中，不同的所述数据片对应不同的所述特征码；

部署模块206，用于在Chord环上存储所述特征码，以基于所述传输工具通过所述Chord环上的所述特征码完成所述AI模型在所述机器上的部署。

在一个具体的实施例中，所述加入模块202，包括：

鉴权模块2021，用于对所述机器进行鉴权；

处理模块2022，用于当鉴权通过时，通过鉴权的所述机器作为一个新的节点加入到P2P网络中。

在一个具体的实施例中，还包括：

提示模块2023，用于若鉴权不通过，则基于未通过鉴权的所述机器的信息生成提示信息。

在一个具体的实施例中，所述特征码为hash code。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种加速AI模型部署的方法，其特征在于，应用于包括多个节点的P2P网络中，该方法包括：

在待部署的机器上设置基于P2P算法的传输工具；

将所述机器作为一个新的节点加入到P2P网络中；

2.根据权利要求1所述的方法，其特征在于，所述将所述机器作为一个新的节点加入到P2P网络中，包括：

对所述机器进行鉴权；

3.根据权利要求2所述的方法，其特征在于，还包括：

4.如权利要求2所述的方法，其特征在于，所述鉴权是使用所述P2P网络中的一个或多个所述节点完成的。

5.如权利要求1所述的方法，其特征在于，所述数据片的大小为240KB-280KB之间的任意值。

6.如权利要求1所述的方法，其特征在于，所述特征码为hash code。

7.如权利要求1所述的方法，其特征在于，完成所述AI模型在所述机器上的部署所需要的时间基于以下公式来确定：

是基于P2P算法完成所述AI模型在所述机器上的部署的时间；

8.一种加速AI模型部署的设备，其特征在于，应用于包括多个节点的P2P网络中，该设备包括：

9.根据权利要求8所述的设备，其特征在于，所述加入模块，包括：

鉴权模块，用于对所述机器进行鉴权；

10.根据权利要求8所述的设备，其特征在于，还包括：