WO2021068247A1

WO2021068247A1 - 神经网络调度方法、装置、计算机设备及可读存储介质

Info

Publication number: WO2021068247A1
Application number: PCT/CN2019/110823
Authority: WO
Inventors: 黄炯凯; 蔡权雄; 牛昕宇
Original assignee: 深圳鲲云信息科技有限公司
Priority date: 2019-10-12
Filing date: 2019-10-12
Publication date: 2021-04-15
Also published as: WO2021068247A8; CN113196232A; US20230273826A1

Abstract

一种神经网络调度方法、装置、计算机设备及存储介质，该方法包括：将至少一个预训练好的神经网络模型加载到内存中的模型存储区，并获取所述神经网络模型的基地址，所述内存还包括公共数据存储区（101）；根据任务类型获取对应的所述神经网络模型的基地址，并读取所述公共数据存储区内的数据（102）；基于所述基地址调用对应的神经网络模型对所述数据进行计算，得到计算结果并输出（103）。该方法将神经网络预先加载到内存中并获得相应的基地址，调用上述基地址对应的多个神经网络对数据进行计算，并将中间结果放入一个公共数据存储区，可以减少额外的神经网络计算设备的成本，提高硬件资源的利用率。

Description

神经网络调度方法、装置、计算机设备及可读存储介质

技术领域

本申请涉及人工智能技术领域，尤其涉及神经网络调度方法、装置、计算机设备及可读存储介质。

背景技术

在人工智能的某些特定的应用场景(自动驾驶、人脸识别等)中，需要运行多个神经网络模型才能获得所需的结果。例如，在人脸识别应用场景中，需先调用一神经网络模型检测一幅图像中是否含有人的脸部图像，如果有人的脸部图像，再调度另一神经网络模型对该幅图像中人的脸部图像进行识别，最终获得所需的结果。但当前现有技术的解决方法是使用多个硬件设备，每个硬件设备运行不同的神经网络模型，这样会增加额外的设备成本，降低硬件资源的利用率。

发明内容

本申请实施例的目的在于提出一种神经网络调度方法、装置、计算机设备及可读存储介质，以减少额外的设备成本，提高硬件资源的利用率。

为了解决上述技术问题，本申请实施例提供一种神经网络调度方法，采用了如下所述的技术方案：

所述神经网络调度方法包括：

将至少一个预训练好的神经网络模型加载到内存中的模型存储区，并获取所述神经网络模型的基地址，所述内存还包括公共数据存储区；

根据任务类型获取对应的所述神经网络模型的基地址，并读取所述公共数据存储区内的数据；

基于所述基地址调用对应的神经网络模型对所述数据进行计算，得到计算结果并输出。

进一步的，所述模型存储区用于存储所述神经网络模型的网络结构及参数。

进一步的，所述基地址为一个神经网络模型在内存中的起始存放地址。

进一步的，所述基于所述基地址调用对应的神经网络模型对所述数据进行计算的步骤具体包括：

对所述数据进行预处理；

将所述预处理后的数据输入到所述调用的神经网络进行计算。

进一步的，所述将所述预处理后的数据输入到所述调用的神经网络进行计算的步骤具体包括：

根据神经网络模型的网络结构配置对应的硬件资源；

基于所述硬件资源对所述预处理后的数据进行计算。

进一步的，所述预训练好的神经网络模型的训练包括构建神经网络、选择训练数据集并进行神经网络训练、验证神经网络。

为了解决上述技术问题，本申请实施例还提供一种神经网络调度装置，采用了如下所述的技术方案：

所述神经网络调度速装置包括：

加载模块，用于将至少一个预训练好的神经网络模型加载到内存中的模型存储区，并获取所述神经网络模型的基地址，所述内存还包括公共数据存储区；

获取模块，用于根据任务类型获取对应的所述神经网络模型的基地址，并读取所述公共数据存储区内的数据；

计算模块，用于基于所述基地址调用对应的神经网络模型对所述数据进行计算，得到计算结果并输出。

进一步的，所述计算模块包括：

预处理子模块，用于对所述数据进行预处理；

计算子模块，用于将所述预处理后的数据输入到所述调用的神经网络进行计算。

为了解决上述技术问题，本申请实施例还提供一种计算机设备，采用了如下所述的技术方案：

所述计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时实现本申请实施例中提出的任一项所述的神经网络调度方法的步骤。

为了解决上述技术问题，本申请实施例还提供一种计算机可读存储介质，采用了如下所述的技术方案：

所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现本申请实施例中提出的任一项所述的神经网络调度方法的步骤。

与现有技术相比，本申请实施例主要有以下有益效果：将至少一个预训练好的神经网络模型加载到内存中的模型存储区，并获取所述神经网络模型的基地址，所述内存还包括公共数据存储区；根据任务类型获取对应的所述神经网络模型的基地址，并读取所述公共数据存储区内的数据；基于所述基地址调用对应的神经网络模型对所述数据进行计算，得到计算结果并输出。将训练好的神经网络预先加载到内存中并获得每个神经网络的基地址，然后根据任务类型依次调用上述基地址对应的多个神经网络对数据进行计算，并将中间结果放入一个公共数据存储区，即在同一计算设备上执行上述多个神经网络计算，可以减少额外的神经网络计算设备的成本，提高硬件资源的利用率。

附图说明

为了更清楚地说明本申请中的方案，下面将对本申请实施例描述中所需要使用的附图作一个简单介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了根据本申请的神经网络调度方法的一个实施例的流程图；

图2示出了图1中步骤103的一个实施例的流程图；

图3示出了图2中步骤1032的一个实施例的流程图；

图4是本申请实施例提供的一种神经网络调度装置的结构示意图；

图5是图4中计算模块203的一个实施例的结构示意图；

图6是根据本申请的实施例提供的计算机设备的一个实施例的结构示意图。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案，下面将结合附图，对本申请实施例中的技术方案进行清楚、完整地描述。

第一方面，如图1所示，图1示出了根据本申请的神经网络调度方法的一个实施例的流程图。所述的神经网络调度方法包括：

步骤101，将至少一个预训练好的神经网络模型加载到内存中的模型存储区，并获取所述神经网络模型的基地址，所述内存还包括公共数据存储区。

在本实施例中，上述神经网络模型包括不同任务类型所涉及到的神经网络，如人脸识别任务所使用的特征检测网络(CNN等)和识别网络、语音识别任务的递归神经网络RNN和长短时记忆神经网络LSTM等。首先为上述这些神经网络在内存中申请相应大小的存储空间，然后将上述神经网络模型的网络结构参数存入到上述申请的存储空间并返回各个神经网络模型的基地址(及起始地址)，利用该基地址就可以根据需要寻找到对应的神经网络。进一步的还可以为上述神经网络申请一块公共数据存储区，用来存放初始输入的数据和中间计算结果等，可以加快神经网络的计算速度并节约计算资源。

步骤102，根据任务类型获取对应的所述神经网络模型的基地址，并读取所述公共数据存储区内的数据。

在本实施例中，任务类型包括上述的人脸识别、语音识别，还可以是文字识别、对象分割、自动驾驶等任务使用到神经网络的应用场景，各种应用场景所使用的神经网络的类型和数量是不相同的。因此，需要根据任务类型来选择相应的神经网络进行组合以完成对应的任务并实现其功能。具体地，获取到任务所需要的神经网络在内存中的基地址，然后将上述基地址所存储的神经网络加载到处理器中，再读取上述公共数据存储区的数据并输入到上述加载到处理器中的神经网络中进行执行。上述任务所需要的神经网络可以包括多个，多个神经网络可以通过上述各个神经网络的基地址进行动态切换，使各个神经网络之间按照一定的调用顺序进行执行。

步骤103，基于所述基地址调用对应的神经网络模型对所述数据进行计算，得到计算结果并输出。

在本实施例中，通过上述步骤103可以根据上述基地址得到任务所需要的至少一个神经网络，然后将上述获得的神经网络依次加载到同一处理器中对从上述公共数据存储区读取到的数据进行相应的计算，即依次调用每个神经网络对数据进行计算，并将中间计算结果保存到上述公共数据存储区供下一个神经网络进行使用，也就是说，在计算过程中可以根据上述基地址切换神经网络，并可以循环使用上述公共数据存储区，直到最后一个神经网络计算结束并将最终结果输出，这样可以提高硬件计算资源的利用率。

在本发明实施例中，提供一种神经网络调度方法，包括：将至少一个预训练好的神经网络模型加载到内存中的模型存储区，并获取所述神经网络模型的基地址，所述内存还包括公共数据存储区；根据任务类型获取对应的所述神经网络模型的基地址，并读取所述公共数据存储区内的数据；基于所述基地址调用对应的神经网络模型对所述数据进行计算，得到计算结果并输出。将训练好的神经网络预先加载到内存中并获得每个神经网络的基地址，然后根据任务类型依次调用上述基地址对应的多个神经网络对数据进行计算，并将中间结果放入一个公共数据存储区，即在同一计算设备上执行上述多个神经网络计算，可以减少额外的神经网络计算设备的成本，提高硬件资源的利用率。

在本实施例中，上述神经网络模型为预训练好的神经网络，即其网络结构是最优的以及参数是使该网络误差最小的参数，其中神经网络的网络结构是以层为计算单元的，包含且不限于卷积层、池化层、ReLU(激活函数)、全连接层等。神经网络结构中的每一层除了接收上一层输出的数据流外还具有大量的参数，这些参数包含且不限于：weight(权重)、bias(偏置)等。

在本实施例中通过向操作系统申请一段内存空间用以存放上述神经网络模型，该内存空间可以是连续的用来放置多个神经网络，也可以是不连续的但每段内存空间只存放一个神经网络。然后可以从系统获得每个神经网络的基地址基地址，即该神经网络在内存中的起始地址，通过该地址可以寻找到对应的网络，就可以加载和切换神经网络。

进一步的，如图2所示，上述步骤103具体包括以下步骤：

步骤1031，对所述数据进行预处理；

步骤1032，将所述预处理后的数据输入到所述调用的神经网络进行计算。

其中，对数据进行预处理包括：

数据清理：可以用来清楚数据中的噪声，纠正不一致。

数据集成：将数据由多个数据源合并成一个一致的数据存储，如数据仓

库。

数据归约：可以通过如聚集、删除冗余特征或聚类来降低数据的规模。

数据变换：包括规范化、正则化等，例如可以用来把数据压缩到较小的

区间，如0.0到1.0。

通过以上数据预处理方法可以把数据处理成神经网络计算所需要的格式，然后输入上述调用的神经网络进行相应计算，可以提高神经网络计算的效率。

进一步的，如图3所示，上述步骤1032具体包括以下步骤：

步骤10321，根据神经网络模型的网络结构配置对应的硬件资源；

步骤10322，基于所述硬件资源对所述预处理后的数据进行计算。

在本实施例中，可以根据不同的应用场景、不同的任务类型加载不同的神经网络模型，例如，对于语音识别应用场景，可以加载语音处理的预训练好的神经网络模型，如RNN、LSTM等；对于物体检测场景可以加载图像处理的预训练好的神经网络模型，如fast-rcnn(包括多个具体的子网络)等。然后根据上述加载的神经网络模型配置对应的硬件资源，即根据上述神经网络模型的网络结构及参数，分配计算单元、存储单元、流水线加速单元等硬件资源，最后基于配置好的上述硬件资源对上述预处理后的数据进行相应的运算，如卷积运算、池化运算等。

进一步的，上述预训练好的神经网络模型的训练包括构建神经网络、选择训练数据集并进行神经网络训练、验证神经网络。

其中，根据任务类型或应用场景来构建不同的神经网络，包括网络的结构划分、层数、连接方式等；进而选择相应的数据集对构建好的神经网络进行训练，数据集可以选用网络上开放的标注好的数据集，如图像识别的MNIST数据集、声音识别的VoxCeleb数据集等；最后通过验证数据集对训练好的神经网络进行交叉验证等，从而得到上述预训练好的神经网络模型。

第二方面，请参见图4，图4是本申请实施例提供的一种神经网络调度装置的结构示意图，如图4所示，所述装置200包括：

加载模块201，用于将至少一个预训练好的神经网络模型加载到内存中的模型存储区，并获取所述神经网络模型的基地址，所述内存还包括公共数据存储区；

获取模块202，用于根据任务类型获取对应的所述神经网络模型的基地址，并读取所述公共数据存储区内的数据；

计算模块203，用于基于所述基地址调用对应的神经网络模型对所述数据进行计算，得到计算结果并输出。

进一步的，如图5所示，上述计算模块203包括：

预处理子模块2031，用于对所述数据进行预处理；

计算子模块2032，用于将所述预处理后的数据输入到所述调用的神经网络进行计算。

第三方面，本申请实施例提供一种计算机设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现本申请实施例提供的神经网络调度方法中的步骤。

第四方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现本申请实施例提供的神经网络调度方法中的步骤。即，在本发明的具体实施例中，计算机可读存储介质的计算机程序被处理器执行时实现上述的神经网络调度方法的步骤，可以减少额外的设备成本，提高硬件资源的利用率。

示例性的，计算机可读存储介质的计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的

任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。

需要说明的是，由于计算机可读存储介质的计算机程序被处理器执行时实现上述的神经网络调度方法的步骤，因此上述神经网络调度方法的所有实施例均适用于该计算机可读存储介质，且均能达到相同或相似的有益效果。

本领域普通技术人员可以理解实现上述实施例中，方法的全部或部分流程，系统的全部或部分子系统，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一计算机可读取存储介质中，该程序在执行时，可实现包括如上述各子系统的实施例的功能。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

应该理解的是，虽然附图的结构示意图中的各个子系统按照箭头的指示依次显示，但是这些子系统并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些子系统的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的结构示意图中的至少一部分子系统在执行时可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

请继续参阅图6，为解决上述技术问题，本申请实施例还提供上述计算机设备的基本结构框图，如图6所示。

所述计算机设备3包括通过系统总线相互通信连接存储器31、处理器33、网络接口33。需要指出的是，图中仅示出了具有组件31-33的计算机设备3，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器31至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器31可以是所述计算机设备3的内部存储单元，例如该计算机设备3的硬盘或内存。在另一些实施例中，所述存储器31也可以是所述计算机设备3的外部存储设备，例如该计算机设备3上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器31还可以既包括所述计算机设备3的内部存储单元也包括其外部存储设备。本实施例中，所述存储器31通常用于存储安装于所述计算机设备3的操作系统和各类应用软件，例如上述神经网络调度方法的程序代码等。此外，所述存储器31还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器33在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器33通常用于控制所述计算机设备3的总体操作。本实施例中，所述处理器33用于运行所述存储器31中存储的程序代码或者处理数据，例如运行所述神经网络调度方法的程序代码。

所述网络接口33可包括无线网络接口或有线网络接口，该网络接口33通常用于在所述计算机设备3与其他电子设备之间建立通信连接，然后传输数据等。

本申请还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质存储有神经网络调度方法的程序，所述神经网络调度方法的程序可被至少一个处理器执行，以使所述至少一个处理器执行如上述的神经网络调度方法的程序的步骤，实现相应的功能。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

显然，以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

Claims

一种神经网络调度方法，其特征在于，包括：

将至少一个预训练好的神经网络模型加载到内存中的模型存储区，并获取所述神经网络模型的基地址，所述内存还包括公共数据存储区；

根据任务类型获取对应的所述神经网络模型的基地址，并读取所述公共数据存储区内的数据；

基于所述基地址调用对应的神经网络模型对所述数据进行计算，得到计算结果并输出。
如权利要求1所述方法，其特征在于，所述模型存储区用于存储所述神经网络模型的网络结构及参数。
如权利要求3所述方法，其特征在于，所述基地址为一个神经网络模型在内存中的起始存放地址。
如权利要求3所述方法，其特征在于，所述基于所述基地址调用对应的神经网络模型对所述数据进行计算的步骤具体包括：

对所述数据进行预处理；

将所述预处理后的数据输入到所述调用的神经网络进行计算。
如权利要求4所述方法，其特征在于，所述将所述预处理后的数据输入到所述调用的神经网络进行计算的步骤具体包括：

根据神经网络模型的网络结构配置对应的硬件资源；

基于所述硬件资源对所述预处理后的数据进行计算。
如权利要求1所述方法，其特征在于，所述预训练好的神经网络模型的训练包括构建神经网络、选择训练数据集并进行神经网络训练、验证神经网络。
一种神经网络调度装置，其特征在于，包括：

加载模块，用于将至少一个预训练好的神经网络模型加载到内存中的模型存储区，并获取所述神经网络模型的基地址，所述内存还包括公共数据存储区；

获取模块，用于根据任务类型获取对应的所述神经网络模型的基地址，并读取所述公共数据存储区内的数据；

计算模块，用于基于所述基地址调用对应的神经网络模型对所述数据进行计算，得到计算结果并输出。
如权利要求7所述的装置，其特征在于，所述计算模块包括：

预处理子模块，用于对所述数据进行预处理；

计算子模块，用于将所述预处理后的数据输入到所述调用的神经网络进行计算。
一种计算机设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的神经网络调度方法的步骤。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的神经网络调度方法的步骤。