CN107480771B

CN107480771B - 基于深度学习的激活函数的实现方法及装置

Info

Publication number: CN107480771B
Application number: CN201710669937.1A
Authority: CN
Inventors: 徐祥; 艾国; 张韵东
Original assignee: Beijing Vimicro Artificial Intelligence Chip Technology Co ltd
Current assignee: Beijing Vimicro AI Chip Technology Co Ltd
Priority date: 2017-08-07
Filing date: 2017-08-07
Publication date: 2020-06-02
Anticipated expiration: 2037-08-07
Also published as: CN107480771A

Abstract

本发明提供了一种基于深度学习的激活函数的实现方法及装置。该激活函数的实现方法包括：将激活函数的区间划分为多个子区间；根据多个子区间中的每个子区间的梯度，确定每个子区间的区间类型，其中不同区间类型的子区间的采样点具有不同的步进值；根据每个子区间的区间类型，计算多个子区间所需的存储空间；以及在多个子区间所需的存储空间小于等于存储器的存储空间的情况下，对多个子区间进行存储空间分配。通过采用本发明的激活函数实现方法，在硬件资源有限的情况下，保证激活函数的实现精度，同时提高了硬件的运行效率。

Description

基于深度学习的激活函数的实现方法及装置

技术领域

本发明涉及神经网络技术领域，特别是一种基于深度学习的激活函数的实现方法。

背景技术

随着计算机及互联网技术的高速发展，数据规模呈爆发式增长，海量数据的智能化分析处理也逐渐成为有效利用数据价值的关键。作为近年来兴起的人工智能的一个典型代表，深度学习神经网络的深度学习算法模型在模式识别、人机对抗等领域得到高度发展，并取得了诸多的成果。

在神经网络中，激活函数能够引入非线性因素，使得神经网络可以更好地解决较为复杂的问题。常用的激活函数(sigmoid，tanh，softmax)被视为神经网络的核心所在。然而，激活函数的实现一直是难点。当在硬件上实现激活函数时，需要考虑实现时占据的硬件资源、运行效率，计算精度等。

发明内容

鉴于上述情况，本发明的一个方面提供了一种激活函数实现方法，所述方法包括以下步骤：将所述激活函数的区间划分为多个子区间；根据所述多个子区间中的每个子区间的梯度，确定每个子区间的区间类型，其中不同区间类型的子区间的采样点具有不同的步进值；根据所述每个子区间的区间类型，计算所述多个子区间所需的存储空间；以及在所述多个子区间所需的存储空间小于等于存储器的存储空间的情况下，对所述多个子区间进行存储空间分配。

在一个实施例中，在所述多个子区间所需的存储空间大于所述存储器的存储空间的情况下，对所述激活函数的区间进行重新划分和/或重新确定每个子区间的区间类型，直至所述多个子区间所需的存储空间小于等于所述存储器的存储空间。

在一个实施例中，所述对所述激活函数的区间进行重新划分和/或重新确定每个子区间的区间类型，包括：为所述多个子区间中的一个或多个设置步进值更大的区间类型。

在一个实施例中，所述将所述激活函数的区间划分为多个子区间，包括：根据所述激活函数的区间的梯度(计算该区间结束位置的梯度)，将所述激活函数的区间划分为多个子区间，其中不同的子区间具有不同的梯度。

在一个实施例中，所述计算所述多个子区间所需的存储空间，包括：计算多个子区间中的每个子区间所需的存储空间；将所述多个子区间中的每个子区间所需的存储空间相加得到所述多个子区间所需的存储空间。

在一个实施例中，所述步进值为2ⁿ，其中，n为自然数，(硬件不需要乘法器)。

在一个实施例中，所述激活函数为sigmoid函数、tanh函数或softmax函数。

本发明的一个方面提供了一种激活函数实现装置，所述装置包括：划分单元，用于将所述激活函数的区间划分为多个子区间；确定单元，用于根据所述多个子区间中的每个子区间的梯度，确定每个子区间的区间类型，其中不同区间类型的子区间的采样点具有不同的步进值；计算单元，用于根据所述每个子区间的区间类型，计算所述多个子区间所需的存储空间；以及分配单元，用于在所述多个子区间所需的存储空间小于等于存储器的存储空间的情况下，对所述多个子区间进行存储空间分配。

在一个实施例中，所述装置还包括再分配单元，用于在所述多个子区间所需的存储空间大于所述存储器的存储空间的情况下，对所述激活函数的区间进行重新划分和/或重新确定每个子区间的区间类型，直至所述多个子区间所需的存储空间小于等于所述存储器的存储空间。

在一个实施例中，所述再分配单元还用于为所述多个子区间中的一个或多个设置步进值更大的区间类型。

本发明的一个方面提供了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现上述激活函数实现方法。

通过采用本发明的激活函数实现方法，在硬件资源有限的情况下，保证激活函数的实现精度，同时提高了硬件的运行效率。

附图说明

从下面结合附图对本发明实施例的详细描述中，本发明的这些和/或其它方面和优点将变得更加清楚并更容易理解，其中：

图1为本发明实施例的激活函数实现方法的示意性流程图；

图2为本发明实施例的激活函数的示例函数sigmoid的示意图；

图3为本发明实施例的激活函数实现装置的示意性功能结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例的激活函数实现方法的示意性流程图。图1的方法可以由服务器来执行。该激活函数实现方法包括以下步骤。

S110：将激活函数的区间划分为多个子区间。

例如，激活函数可以是sigmoid函数、tanh函数或softmax函数等。本发明的激活函数不限于此。根据存储器的存储空间以及数据运算精度，为激活函数的区间设置多个区间类型。存储器例如可以是SRAM。SRAM的存储空间通常比较有限。根据SRAM的存储空间以及数据运算精度，为激活函数的区间设置多个步进值(步进值为2ⁿ(n为自然数))不同的区间类型，例如，步进值为2的区间类型，步进值为4的区间类型，步进值为8的区间类型。步进值是指在区间内隔多少个点取一个输出。当步进值为2时，每隔2个点取一个点。当子区间长度一定时，步进值越大，需要取的点越少。例如，当激活函数的区间为(0,1000)时，可以将激活函数的区间(0,1000)划分为(0,100)，(100,200)，(200,300)，(300,400)，(400,500)，(500,600)，(600,700)，(700,800)，(800,900)，(900,1000)。

S120：根据激活函数的每个子区间的梯度，确定每个子区间的区间类型其中不同区间类型的子区间的采样点具有不同的步进值。

在激活函数的曲线的梯度比较大情况下，需要取更多的点进行拟合。例如，在梯度比较大的子区间，可以设置步进值为2的区间类型。在激活函数的曲线的梯度比较小的情况下，可以取较少的点进行拟合。例如，可以设置步进值为32的区间类型。

S130：根据每个子区间的区间类型，计算多个子区间所需的存储空间。

具体地，每个子区间所需的存储空间为在该子区间取的点数乘以每个点所占的存储空间大小。将每个子区间所需的存储空间相加得到多个子区间所需的内存空间。多个子区间所需的存储空间小于等于存储器的存储空间的情况下，对多个子区间进行存储空间分配。

在一个实施例中，在多个子区间所需的存储空间大于存储器的存储空间的情况下，对激活函数的区间进行重新划分和/或重新确定每个子区间的区间类型，直至多个子区间所需的存储空间小于等于存储器的存储空间。

在一个实施例中，在多个子区间所需的存储空间大于存储器的存储空间的情况下，为多个子区间中的一个或多个设置步进值更大的区间类型。

在一个实施例中，根据激活函数的区间的梯度，将激活函数的区间划分为多个子区间，其中不同的子区间具有不同的梯度。

在一个实施例中，激活函数为sigmoid函数、tanh函数或softmax函数。

图2为本发明实施例的激活函数的示例函数sigmoid的示意图。Sigmoid函数

的值在(0，1)区间。考虑到查找效率，假设SRAM的空间为4KB，定点化数据位宽为16bit，因此最多取2000个点进行拟合。根据该函数的特性，只需考虑x>0的区间，x<0的区间可以由x>0的区间来计算。为该函数设置4个区间类型，具体为，步进值为8的区间类型，步进值为16的区间类型，步进值为32的区间类型，步进值为64的区间类型。假设x＝3，将该函数区间(0,3)划分为6个子区间(0,0.5)，(0.5,1)，(1,1.5)，(1.5,2)，(2,2.5)，(2.5,3)。子区间(0，0.5)的梯度较大，将该子区间的区间类型设置为步进值为8的区间类型。子区间(2.5,3)的梯度较小，将该子区间的区间类型设置为步进值为32的区间类型。根据区间类型计算每个子区间的点数，并对所有子区间的点数进行求和，如果总点数小于等于2000，则成功，否则，重新确定每个子区间的区间类型直至总点数小于等于2000。

图3为本发明实施例的激活函数实现装置的示意性功能图。该激活函数实现装置3包括：划分单元310，用于将激活函数的区间划分为多个子区间；确定单元320，用于根据多个子区间中的每个子区间的梯度，确定每个子区间的区间类型，其中不同区间类型的子区间的采样点具有不同的步进值；计算单元330，用于根据每个子区间的区间类型，计算多个子区间所需的存储空间；以及分配单元340，用于在多个子区间所需的存储空间小于等于存储器的存储空间的情况下，对多个子区间进行存储空间分配。

例如，激活函数可以是sigmoid函数、tanh函数或softmax函数等。本发明的激活函数不限于此。根据存储器的存储空间以及数据运算精度，为激活函数的区间设置多个区间类型。存储器例如可以是SRAM。根据存储器的存储空间以及数据运算精度，为激活函数的区间设置多个步进值(步进值为2ⁿ(n为自然数))不同的区间类型，例如，步进值为2的区间类型，步进值为4的区间类型，步进值为8的区间类型。步进值是指在区间内隔多少个点计算一个输出。当步进值为2时，每隔2个点取一个点。当子区间长度一定时，步进值越大，需要取的点越少。例如，当激活函数的区间为(0,1000)时，划分单元310可以将激活函数的区间(0,1000)划分为(0,100)，(100,200)，(200,300)，(300,400)，(400,500)，(500,600)，(600,700)，(700,800)，(800,900)，(900,1000)。

在激活函数的曲线的梯度比较大情况下，需要取更多的点进行拟合。例如，在梯度比较大的子区间，可以设置步进值为2的区间类型。在激活函数的曲线的梯度比较小的情况下，可以取较少的点进行拟合。例如，可以设置步进值为32的区间类型。每个子区间所需的存储空间与该子区间的区间类型相关。具体地，每个子区间所需的存储空间为在该子区间取的点数乘以每个点所占的存储空间大小。

在一个实施例中，激活函数实现装置还包括再分配单元，用于在多个子区间所需的存储空间大于存储器的存储空间的情况下，对激活函数的区间进行重新划分和/或重新确定每个子区间的区间类型，直至多个子区间所需的存储空间小于等于存储器的存储空间。

在一个实施例中，再分配单元还用于为多个子区间中的一个或多个设置步进值更大的区间类型。

本发明的实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述激活函数实现方法。

Claims

1.一种基于深度学习的激活函数实现方法，其特征在于，所述方法包括：

将所述激活函数的区间划分为多个子区间；

根据所述多个子区间中的每个子区间的梯度，确定每个子区间的区间类型，其中不同区间类型的子区间的采样点具有不同的步进值；步进值小的采样点对应的子区间的梯度大，步进值大的采样点对应的子区间的梯度小；根据所述每个子区间的区间类型，计算所述多个子区间所需的存储空间；在所述多个子区间所需的存储空间小于等于存储器的存储空间的情况下，对所述多个子区间进行存储空间分配；以及

在所述多个子区间所需的存储空间大于所述存储器的存储空间的情况下，对所述激活函数的区间进行重新划分和/或重新确定每个子区间的区间类型，直至所述多个子区间所需的存储空间小于等于所述存储器的存储空间。

2.根据权利要求1所述的激活函数实现方法，其特征在于，所述对所述激活函数的区间进行重新划分和/或重新确定每个子区间的区间类型，包括：

为所述多个子区间中的一个或多个设置步进值更大的区间类型。

3.根据权利要求1或2所述的激活函数实现方法，其特征在于，所述将所述激活函数的区间划分为多个子区间，包括：

根据所述激活函数的区间的梯度，将所述激活函数的区间划分为多个子区间，其中不同的子区间具有不同的梯度。

4.根据权利要求1或2所述的激活函数实现方法，其特征在于，所述计算所述多个子区间所需的存储空间，包括：

计算多个子区间中的每个子区间所需的存储空间；

将所述多个子区间中的每个子区间所需的存储空间相加得到所述多个子区间所需的存储空间。

5.根据权利要求1或2所述的激活函数实现方法，其特征在于，所述步进值为2ⁿ，其中，n为自然数。

6.根据权利要求1或2所述的激活函数实现方法，所述激活函数为sigmoid函数、tanh函数或softmax函数。

7.一种基于深度学习的激活函数实现装置，其特征在于，所述装置包括：

划分单元，用于将所述激活函数的区间划分为多个子区间；

确定单元，用于根据所述多个子区间中的每个子区间的梯度，确定每个子区间的区间类型，其中不同区间类型的子区间的采样点具有不同的步进值；步进值小的采样点对应的子区间的梯度大，步进值大的采样点对应的子区间的梯度小；

计算单元，用于根据所述每个子区间的区间类型，计算所述多个子区间所需的存储空间；分配单元，用于在所述多个子区间所需的存储空间小于等于存储器的存储空间的情况下，对所述多个子区间进行存储空间分配；以及

再分配单元，用于在所述多个子区间所需的存储空间大于所述存储器的存储空间的情况下，对所述激活函数的区间进行重新划分和/或重新确定每个子区间的区间类型，直至所述多个子区间所需的存储空间小于等于所述存储器的存储空间。

8.根据权利要求7所述的激活函数实现装置，其特征在于，所述再分配单元还用于为所述多个子区间中的一个或多个设置步进值更大的区间类型。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-6中任一项所述的激活函数实现方法。