CN113159290B

CN113159290B - 一种神经网络模型网络推理的优化方法

Info

Publication number: CN113159290B
Application number: CN202110453868.7A
Authority: CN
Inventors: 邢园园; 肖偌舟
Original assignee: Qingdao Benyuan Microelectronics Co ltd
Current assignee: Qingdao Benyuan Microelectronics Co ltd
Priority date: 2021-04-26
Filing date: 2021-04-26
Publication date: 2022-08-09
Anticipated expiration: 2041-04-26
Also published as: CN113159290A

Abstract

本发明公开了一种神经网络模型网络推理的优化方法，包括：基于网络的输入数据确定预处理函数类型及参数；解析神经网络模型的网络结构，得到第一层网络节点的网络类型及参数；将预处理函数与神经网络模型中的第一层网络节点融合为新的网络节点。本发明在确定输入数据的预处理函数、神经网络模型的第一层网络节点数据后，将预处理函数优化到神经网络模型的第一层网络节点中，改变原有第一层网络节点的参数，从而将预处理函数融合到神经网络模型中，在不增加申请网络模型计算量的前提下，将神经网络输入数据预处理从通用处理器移植到人工智能处理器上完成，保证推理质量的前提下，优化了神经网络模型的网络推理效率。

Description

一种神经网络模型网络推理的优化方法

技术领域

本发明属于计算机技术领域，具体地说，是涉及一种神经网络模型网络推理的优化方法。

背景技术

在人工智能处理器运行神经网络模型前，通常需要在通用处理器上完成输入数据的预处理，然后将预处理之后的数据输入到神经网络模型进行推理。

相较于通用处理器，人工智能处理器具有多核并行计算、较高访存能力等优点，因此，如何将输入数据预处理模块放在人工智能处理器上完成，提高神经网络运行性能，成为神经网络模型运行优化的关键。。

发明内容

本发明的目的在于提供一种神经网络模型网络推理的优化方法，在不增加申请网络模型计算量的前提下，将神经网络输入数据预处理从通用处理器移植到人工智能处理器上完成，从而提升神经网络运行性能。

本发明采用以下技术方案予以实现：

提出一种神经网络模型网络推理的优化方法，包括：基于网络的输入数据确定预处理函数类型及参数；解析神经网络模型的网络结构，得到第一层网络节点的网络类型及参数；将预处理函数与神经网络模型中的第一层网络节点融合为新的网络节点。

进一步的，所述方法还包括：基于原网络节点类型设定新的网络节点类型。

进一步的，将预处理函数与神经网络模型中的第一层网络节点优化为新的网络节点，具体包括：

将预处理函数y＝k_p1*x+k_p2根据网络类型y＝k_n1*x+k_n2优化为y＝k₁x+k₂，其中k₁＝k_n1*k_p1，k₂＝k_n1*k_p2+k_n2，k_n1，k_n2是预处理函数的参数，k_p1，k_p2是网络节点的参数。

与现有技术相比，本发明的优点和积极效果是：本发明提出的神经网络模型网络推理的优化方法中，在确定输入数据的预处理函数、神经网络模型的第一层网络节点数据后，将预处理函数优化到神经网络模型的第一层网络节点中，改变原有第一层网络节点的参数，从而将预处理函数融合到神经网络模型中，在不增加申请网络模型计算量的前提下，将神经网络输入数据预处理从通用处理器移植到人工智能处理器上完成，保证推理质量的前提下，优化了神经网络模型的网络推理效率。

结合附图阅读本发明实施方式的详细描述后，本发明的其他特点和优点将变得更加清楚。

附图说明

图1为本发明提出的神经网络模型网络推理的优化方法流程图。

具体实施方式

下面结合附图对本发明的具体实施方式作进一步详细的说明。

本发明提出的神经网络模型网络推理的优化方法，如图1所示，包括如下步骤：

步骤S11：基于网络的输入数据确定预处理函数类型及参数。

获取神经网络的输入数据，根据输入数据确定预处理函数类型以及参数。

在本发明实施例中，预处理函数表示为：y＝k_p1*x+k_p2，k_p1，k_p2是预处理函数的参数：

k_p1＝1，k_p2＝b时，预处理函数为平移函数；

k_p1＝a，k_p2＝0时，预处理函数为缩放函数；

k_p1＝a，k_p2＝b时，预处理函数为归一化函数；

上述，a表示缩放量，b表示平移量。

步骤S12：解析神经网络模型的网络结构，得到第一层网络节点的网络类型及参数。

解析神经网络模型的网络结构，得到各个节点的网络类型及参数，确定第一层网络节点的网络类型及参数。

在本发明实施例中，网络类型表示为：y＝k_n1*x+k_n2，k_n1，k_n2是网络节点的参数。

k_n1＝W，k_n2＝b时，网络类型为卷积层，W是权重，b是网络的偏移，X、W、Y均表示一个向量。

时，网络类型为Batch Norm层，μ表示累计计算的均值，σ表示累计计算的标准差。

k_n1＝γ，k_n2＝β时，网络类型为Scale层，γ表示缩放量，β表示平移量。

步骤S13：将预处理函数与神经网络模型中的第一层网络节点融合为新的网络节点。

本发明通过融合方式，将预处理函数与神经网络模型的第一层网络节点进行融合，从而将输入数据的预处理函数融合到神经网络模型中，从而将数据预处理从通用处理器移植到人工智能处理上完成，以此实现网络推理的优化。

具体的融合过程中，基于不改变原有网络类型只改变节点参数的思路，也即，根据原网络节点类型设定新的网络节点类型，在参数上，将预处理函数的参数与第一层网络节点的参数进行融合，具体的融合方式采用线性或非线性方式均可。

在本发明一个具体实施例中，采用以下方式融合：

将预处理函数y＝k_p1*x+k_p2根据网络类型y＝k_n1*x+k_n2优化为y＝k₁x+k₂，其中k₁＝k_n1*k_p1，k₂＝k_n1*k_p2+k_n2。

步骤S14：删除原有的第一层网络节点。

相比现有的在优化前获取输入数据，在通用处理器上进行输入数据的预处理，在人工智能处理上进行网络推理的方式，上述本发明提出的神经网络模型网络推理的优化方法，通过上述步骤S11至S14将输入数据预处理过程从通用处理器上移到人工智能处理上完成，使得输入数据预处理在网络推理时完成，实现网络推理过程的优化。

需要说明的是，在具体实现过程中，上述的优化方法可以通过硬件形式的处理器执行存储器中存储的软件形式的计算机执行指令实现，此处不予赘述，而上述优化的动作所对应的程序均可以以软件形式存储于系统的计算机可读存储介质中，以便于处理器调用执行以上各个模块对应的操作。

上文中的计算机可读存储介质可以包括易失性存储器，例如随机存取存储器；也可以包括非易失性存储器，例如只读存储器、快闪存储器、硬盘或固态硬盘；还可以包括上述种类的存储器的组合。

上文所提到的处理器，也可以是多个处理元件的统称。例如，处理器可以为中央处理器，也可以为其他通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者可以是任何常规的处理器等等，还可以为专用处理器。

应该指出的是，上述说明并非是对本发明的限制，本发明也并不仅限于上述举例，本技术领域的普通技术人员在本发明的实质范围内所做出的变化、改型、添加或替换，也应属于本发明的保护范围。

Claims

1.一种神经网络模型网络推理的优化方法，其特征在于，包括：

基于网络的输入数据确定预处理函数类型及参数；

解析神经网络模型的网络结构，得到第一层网络节点的网络类型及参数；

将预处理函数与神经网络模型中的第一层网络节点融合为新的网络节点，从而将神经网络输入数据预处理从通用处理器移植到人工智能处理器上完成；

其中，将预处理函数与神经网络模型中的第一层网络节点优化为新的网络节点，具体包括：

将预处理函数

根据网络类型

优化为

，

是预处理函数的参数，

是网络节点的参数。

2.根据权利要求1所述的神经网络模型网络推理的优化方法，其特征在于，所述方法还包括：

基于原网络节点类型设定新的网络节点类型。