CN109905880B

CN109905880B - 一种网络划分方法、系统及电子设备和存储介质

Info

Publication number: CN109905880B
Application number: CN201910221797.0A
Authority: CN
Inventors: 李龙; 赵雅倩; 李仁刚
Original assignee: Suzhou Inspur Intelligent Technology Co Ltd
Current assignee: Suzhou Inspur Intelligent Technology Co Ltd
Priority date: 2019-03-22
Filing date: 2019-03-22
Publication date: 2020-05-29
Anticipated expiration: 2039-03-22
Also published as: CN109905880A

Abstract

本申请公开了一种网络划分方法、系统及设备和介质，包括：以深度学习网络的出口点为预设划分点，确定根据预设划分点将深度学习网络划分后的计算时间；获取边缘端和移动端的网络带宽和延迟，利用带宽和延迟确定传输时间；利用计算时间和传输时间，得到推理总时间；从所有出口点的推理总时间中选定时间最小的推理总时间的出口点，将其作为目标划分点；利用目标划分点划分深度学习网络，使边缘端利用前部分网络进行计算，将计算结果传输至移动端后移动端利用后部分网络进行计算，得到推理结果。本申请利用推理总时间为深度学习网络选择目标划分点，根据目标划分点划分深度学习网络，以利用划分后深度学习网络进行计算推理，缩短推理时间，提高效率。

Description

一种网络划分方法、系统及电子设备和存储介质

技术领域

本申请涉及深度学习技术领域，更具体地说，涉及一种网络划分方法、系统及一种电子设备和一种计算机可读存储介质。

背景技术

当前，深度学习主要用于云端和移动端。具体地讲，云端包括数万服务器节点，具有强大的计算能力，可以用于深度学习的训练和推理。移动端包括个人助理、手机等移动设备，其所具有的计算能力通常较弱，一般只用于深度学习的推理，而不适用于深度学习的训练。

当网络规模较大时，单纯在移动端进行推理所需要的时间较长。一种可选的方法是在云端进行深度学习的推理，即，将网络模型保存在云端，在需要进行推理时移动端将数据传输至云端，由云端服务器进行深度学习推理，并将推理结果返回至移动端。然而，传统上，由于移动端和云端的距离较远，导致传输延迟较大，掩盖了利用云端计算带来的益处。

因此，如何提高网络推理效率是本领域技术人员需要解决的问题。

发明内容

本申请的目的在于提供一种网络划分方法、系统及一种电子设备和一种计算机可读存储介质，缩短了深度学习推理时间。

为实现上述目的，本申请提供了一种网络划分方法，包括：

将深度学习网络中的出口点作为预设划分点，确定根据所述预设划分点将所述深度学习网络划分后，利用所述深度学习网络进行计算的计算时间；

获取边缘端和移动端之间的网络带宽和延迟信息，并利用所述网络带宽和所述延迟信息确定数据的传输时间；

利用所述计算时间和所述传输时间，得到推理总时间；

确定每个所述出口点的所述推理总时间，并从所有所述推理总时间中选定时间最小的所述推理总时间对应的出口点，将其作为目标划分点；

利用所述目标划分点对所述深度学习网络进行划分，以使所述边缘端利用所述目标划分点之前的前部分网络进行计算，并将计算结果传输至所述移动端，由所述移动端利用所述目标划分点之后的后部分网络进行计算，得到推理结果。

可选的，所述确定根据所述预设划分点将所述深度学习网络划分后，利用所述深度学习网络进行计算的计算时间，包括：

利用所述预设划分点将所述深度学习网络划分为第一部分和第二部分；

采样所述边缘端利用所述第一部分进行计算的第一计算时间以及所述移动端利用所述第二部分进行计算的第二计算时间。

可选的，所述利用所述网络带宽和所述延迟信息确定数据的传输时间，包括：

基于第一时间计算公式，利用所述网络带宽和所述延迟信息确定将所述深度学习网络的输入层获取的数据传输至所述边缘端的第一传输时间；其中，所述第一时间计算公式为：

trans_time1＝D/B+T；

其中，trans_time1为所述第一传输时间；D为所述输入层获取的数据总量；B为所述网络带宽；T为延迟时间；

基于第二时间计算公式，利用所述网络带宽和所述延迟信息确定由所述边缘端将数据传输至所述移动端的第二传输时间；其中，所述第二时间计算公式为：

trans_time2＝Di/B+T；

其中，trans_time2为所述第二传输时间；Di为第i个所述出口点传输的数据量。

可选的，所述利用所述计算时间和所述传输时间，得到推理总时间，包括：

基于第三时间计算公式，利用所述计算时间和所述传输时间，得到推理总时间；其中，所述第三时间计算公式为：

total_time＝trans_time1+trans_time2+Te+Tm；

其中，total_time为所述推理总时间；Te为所述第一计算时间；Tm为所述第二计算时间。

为实现上述目的，本申请提供了一种网络划分系统，包括：

计算时间确定模块，用于将深度学习网络中的出口点作为预设划分点，确定根据所述预设划分点将所述深度学习网络划分后，利用所述深度学习网络进行计算的计算时间；

传输时间确定模块，用于获取边缘端和移动端之间的网络带宽和延迟信息，并利用所述网络带宽和所述延迟信息确定数据的传输时间；

推理时间确定模块，用于利用所述计算时间和所述传输时间，得到推理总时间；

划分点确定模块，用于确定每个所述出口点的所述推理总时间，并从所有所述推理总时间中选定时间最小的所述推理总时间对应的出口点，将其作为目标划分点；

网络划分模块，用于利用所述目标划分点对所述深度学习网络进行划分，以使所述边缘端利用所述目标划分点之前的前部分网络进行计算，并将计算结果传输至所述移动端，由移动端利用所述目标划分点之后的后部分网络进行计算，得到推理结果。

可选的，所述计算时间确定模块，包括：

划分单元，用于利用所述预设划分点将所述深度学习网络划分为第一部分和第二部分；

采样单元，用于采样所述边缘端利用所述第一部分进行计算的第一计算时间以及所述移动端利用所述第二部分进行计算的第二计算时间。

可选的，所述传输时间确定模块，包括：

第一计算单元，用于基于第一时间计算公式，利用所述网络带宽和所述延迟信息确定将所述深度学习网络的输入层获取的数据传输至所述边缘端的第一传输时间；其中，所述第一时间计算公式为：

trans_time1＝D/B+T；

第二计算单元，用于基于第二时间计算公式，利用所述网络带宽和所述延迟信息确定由所述边缘端将数据传输至所述移动端的第二传输时间；其中，所述第二时间计算公式为：

trans_time2＝Di/B+T；

可选的，所述推理时间确定模块，包括：

第三计算单元，用于基于第三时间计算公式，利用所述计算时间和所述传输时间，得到推理总时间；其中，所述第三时间计算公式为：

total_time＝trans_time1+trans_time2+Te+Tm；

为实现上述目的，本申请提供了一种电子设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如前述公开的任一种所述网络划分方法的步骤。

为实现上述目的，本申请提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如前述公开的任一种所述网络划分方法的步骤。

通过以上方案可知，本申请提供的一种网络划分方法，包括：将深度学习网络中的出口点作为预设划分点，确定根据所述预设划分点将所述深度学习网络划分后，利用所述深度学习网络进行计算的计算时间；获取边缘端和移动端之间的网络带宽和延迟信息，并利用所述网络带宽和所述延迟信息确定数据的传输时间；利用所述计算时间和所述传输时间，得到推理总时间；确定每个所述出口点的所述推理总时间，并从所有所述推理总时间中选定时间最小的所述推理总时间对应的出口点，将其作为目标划分点；利用所述目标划分点对所述深度学习网络进行划分，以使所述边缘端利用所述目标划分点之前的前部分网络进行计算，并将计算结果传输至所述移动端，由移动端利用所述目标划分点之后的后部分网络进行计算，得到推理结果。也即，本申请利用推理总时间为深度学习网络结构选择目标划分点，并根据目标划分点划分深度学习网络，从而利用划分后深度学习网络进行计算和推理，缩短了计算推理时间，提高了深度学习的效率。本申请还公开了一种网络划分系统及一种电子设备和一种计算机可读存储介质，同样能实现上述技术效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本申请。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例公开的一种网络划分方法的流程图；

图2为本申请实施例公开的另一种网络划分方法的流程图；

图3为本申请实施例公开的一种网络划分系统的结构图；

图4为本申请实施例公开的另一种网络划分系统的结构图；

图5为本申请实施例公开的一种电子设备的结构图；

图6为本申请实施例公开的另一种电子设备的结构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在现有技术中，当网络规模较大时，单纯在移动端进行推理所需要的时间较长。一种可选的方法是在云端进行深度学习的推理，即，将网络模型保存在云端，在需要进行推理时移动端将数据传输至云端，由云端服务器进行深度学习推理，并将推理结果返回至移动端。然而，传统上，由于移动端和云端的距离较远，导致传输延迟较大，掩盖了利用云端计算带来的益处。

本申请实施例公开了一种网络划分方法，有效提高了网络推理效率，缩短了推理计算时间。

参见图1，本申请实施例公开的一种网络划分方法的流程图，如图1所示，包括：

S101：将深度学习网络中的出口点作为预设划分点，确定根据所述预设划分点将所述深度学习网络划分后，利用所述深度学习网络进行计算的计算时间；

本实施例中，深度学习网络中层与层之间为出口点。将出口点作为预设划分点，并确定以当前预设划分点将网络进行划分后的计算时间。图2为一种深度学习网络结构的示意图，如图2所示，深度学习网络包括输入层、输出层及隐藏层，层与层之间是潜在的出口点。

S102：获取边缘端和移动端之间的网络带宽和延迟信息，并利用所述网络带宽和所述延迟信息确定数据的传输时间；

进一步地，获取边缘端与移动端之间的网络带宽及传输延迟信息，从而根据网络带宽和传输延迟信息确定边缘端和移动端之间的数据传输时间。

S103：利用所述计算时间和所述传输时间，得到推理总时间；

本步骤中，利用上述步骤确定的计算时间和传输时间，得到以当前预设划分点划分网络后的推理总时间。

S104：确定每个所述出口点的所述推理总时间，并从所有所述推理总时间中选定时间最小的所述推理总时间对应的出口点，将其作为目标划分点；

可以理解的是，将各个出口点分别作为预设划分点，确定每个出口点的推理总时间，从而从所有出口点中确定最优的出口点，即推理总时间最短的出口点，将其作为目标划分点。

S105：利用所述目标划分点对所述深度学习网络进行划分，以使所述边缘端利用所述目标划分点之前的前部分网络进行计算，并将计算结果传输至所述移动端，由所述移动端利用所述目标划分点之后的后部分网络进行计算，得到推理结果。

进一步地，根据目标划分点划分深度学习网络，将深度学习网络划分为前部分网络和后部分网络，使得边缘端利用前部分网络进行计算，得到计算结果后传输至移动端，移动端进一步根据计算结果，利用后部分网络进行计算，得到最终的推理结果。

通过以上方案可知，本申请提供的一种网络划分方法，包括：将深度学习网络中的出口点作为预设划分点，确定根据所述预设划分点将所述深度学习网络划分后，利用所述深度学习网络进行计算的计算时间；获取边缘端和移动端之间的网络带宽和延迟信息，并利用所述网络带宽和所述延迟信息确定数据的传输时间；利用所述计算时间和所述传输时间，得到推理总时间；确定每个所述出口点的所述推理总时间，并从所有所述推理总时间中选定时间最小的所述推理总时间对应的出口点，将其作为目标划分点；利用所述目标划分点对所述深度学习网络进行划分，以使所述边缘端利用所述目标划分点之前的前部分网络进行计算，并将计算结果传输至所述移动端，由移动端利用所述目标划分点之后的后部分网络进行计算，得到推理结果。也即，本申请利用推理总时间为深度学习网络结构选择目标划分点，并根据目标划分点划分深度学习网络，从而利用划分后深度学习网络进行计算和推理，缩短了计算推理时间，提高了深度学习的效率。

本实施例中，针对确定根据预设划分点将深度学习网络划分后，利用深度学习网络进行计算的计算时间的过程进行详细的阐述，该过程包括：

可以理解的是，本实施例基于预设点对深度学习网络进行划分，得到划分点之前的第一部分以及划分点之后的第二部分，进一步确定边缘端利用第一部分进行计算的第一计算时间，以及移动端利用第二部分进行计算的第二计算时间。上述时间值可以通过实际在边缘端和移动端运行采样来获取。

进一步地，针对利用网络带宽和延迟信息确定数据的传输时间的过程进行详细的阐述，如图3所示，该过程包括：

S201：基于第一时间计算公式，利用所述网络带宽和所述延迟信息确定将所述深度学习网络的输入层获取的数据传输至所述边缘端的第一传输时间；其中，所述第一时间计算公式为：

trans_time1＝D/B+T；

可以理解的是，在深度学习网络开始推理之前，需要由边缘端获取输入的数据。基于网络带宽和传输延迟，确定获取数据的第一传输时间。第一时间计算公式由数据总量除以网络带宽，得到预设传输时间，再加上传输延迟，得到第一传输总时间。

S202：基于第二时间计算公式，利用所述网络带宽和所述延迟信息确定由所述边缘端将数据传输至所述移动端的第二传输时间；其中，所述第二时间计算公式为：

trans_time2＝Di/B+T；

本实施例中，在边缘端进行前部分推理计算后，需要将计算结果传输到移动端。具体地，边缘端将数据传输至移动端的第二传输时间可以基于第二时间计算公式确定。

进一步地，本实施例还包括：

total_time＝trans_time1+trans_time2+Te+Tm；

可以理解的是，确定计算时间/第一传输时间以及第二传输时间后，将上述时间进行相加，得到推理总时间。

下面对本申请实施例提供的一种网络划分系统进行介绍，下文描述的一种网络划分系统与上文描述的一种网络划分方法可以相互参照。

参见图4，本申请实施例提供的一种网络划分系统的结构图，如图4所示，包括：

计算时间确定模块100，用于将深度学习网络中的出口点作为预设划分点，确定根据所述预设划分点将所述深度学习网络划分后，利用所述深度学习网络进行计算的计算时间；

传输时间确定模块200，用于获取边缘端和移动端之间的网络带宽和延迟信息，并利用所述网络带宽和所述延迟信息确定数据的传输时间；

推理时间确定模块300，用于利用所述计算时间和所述传输时间，得到推理总时间；

划分点确定模块400，用于确定每个所述出口点的所述推理总时间，并从所有所述推理总时间中选定时间最小的所述推理总时间对应的出口点，将其作为目标划分点；

网络划分模块500，用于利用所述目标划分点对所述深度学习网络进行划分，以使所述边缘端利用所述目标划分点之前的前部分网络进行计算，并将计算结果传输至所述移动端，由移动端利用所述目标划分点之后的后部分网络进行计算，得到推理结果。

进一步地，本实施例中所述计算时间确定模块，可以具体包括：

进一步地，本实施例中所述传输时间确定模块，可以具体包括：

trans_time1＝D/B+T；

trans_time2＝Di/B+T；

进一步地，本实施例中所述推理时间确定模块，可以具体包括：

total_time＝trans_time1+trans_time2+Te+Tm；

本申请还提供了一种电子设备，参见图5，本申请实施例提供的一种电子设备的结构图，如图5所示，包括：

存储器11，用于存储计算机程序；

处理器12，用于执行所述计算机程序时可以实现上述实施例所提供的步骤。

具体的，存储器11包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机可读指令，该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。处理器12在一些实施例中可以是一中央处理器(CentralProcessing Unit，CPU)、控制器、微控制器、微处理器或其他数据处理芯片，为电子设备提供计算和控制能力。

在上述实施例的基础上，作为优选实施方式，参见图6，所述电子设备还包括：

输入接口13，与处理器12相连，用于获取外部导入的计算机程序、参数和指令，经处理器12控制保存至存储器11中。该输入接口13可以与输入装置相连，接收用户手动输入的参数或指令。该输入装置可以是显示屏上覆盖的触摸层，也可以是终端外壳上设置的按键、轨迹球或触控板，也可以是键盘、触控板或鼠标等。

显示单元14，与处理器12相连，用于显示处理器12处理的数据以及用于显示可视化的用户界面。该显示单元14可以为LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。

网络端口15，与处理器12相连，用于与外部各终端设备进行通信连接。该通信连接所采用的通信技术可以为有线通信技术或无线通信技术，如移动高清链接技术(MHL)、通用串行总线(USB)、高清多媒体接口(HDMI)、无线保真技术(WiFi)、蓝牙通信技术、低功耗蓝牙通信技术、基于IEEE802.11s的通信技术等。

图6仅示出了具有组件11-15的电子设备，本领域技术人员可以理解的是，图6示出的结构并不构成对电子设备的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

本申请还提供了一种计算机可读存储介质，该存储介质可以包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。该存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现上述实施例所提供的步骤。

本申请利用推理总时间为深度学习网络结构选择目标划分点，并根据目标划分点划分深度学习网络，从而利用划分后深度学习网络进行计算和推理，缩短了计算推理时间，提高了深度学习的效率。

说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围内。

还需要说明的是，在本说明书中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims

1.一种网络划分方法，其特征在于，包括：

将深度学习网络中的出口点作为预设划分点，确定根据所述预设划分点将所述深度学习网络划分后，利用所述深度学习网络进行计算的计算时间；深度学习网络中层与层之间为所述出口点；

利用所述计算时间和所述传输时间，得到推理总时间；

2.根据权利要求1所述的网络划分方法，其特征在于，所述确定根据所述预设划分点将所述深度学习网络划分后，利用所述深度学习网络进行计算的计算时间，包括：

3.根据权利要求2所述的网络划分方法，其特征在于，所述利用所述网络带宽和所述延迟信息确定数据的传输时间，包括：

trans_time1＝D/B+T；

trans_time2＝Di/B+T；

4.根据权利要求3所述的网络划分方法，其特征在于，所述利用所述计算时间和所述传输时间，得到推理总时间，包括：

total_time＝trans_time1+trans_time2+Te+Tm；

5.一种网络划分系统，其特征在于，包括：

计算时间确定模块，用于将深度学习网络中的出口点作为预设划分点，确定根据所述预设划分点将所述深度学习网络划分后，利用所述深度学习网络进行计算的计算时间；深度学习网络中层与层之间为所述出口点；

6.根据权利要求5所述的网络划分系统，其特征在于，所述计算时间确定模块，包括：

7.根据权利要求6所述的网络划分系统，其特征在于，所述传输时间确定模块，包括：

trans_time1＝D/B+T；

trans_time2＝Di/B+T；

8.根据权利要求7所述的网络划分系统，其特征在于，所述推理时间确定模块，包括：

total_time＝trans_time1+trans_time2+Te+Tm；

9.一种电子设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至4任一项所述网络划分方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至4任一项所述网络划分方法的步骤。