WO2019119301A1

WO2019119301A1 - 在卷积神经网络模型中确定特征图像的方法和装置

Info

Publication number: WO2019119301A1
Application number: PCT/CN2017/117503
Authority: WO
Inventors: 胡慧
Original assignee: 华为技术有限公司
Priority date: 2017-12-20
Filing date: 2017-12-20
Publication date: 2019-06-27
Also published as: CN111247527A; CN111247527B

Abstract

一种在卷积神经网络模型中确定特征图像的方法和装置，属于模型训练技术领域。所述方法包括：获取卷积神经网络模型中目标处理层的多个输入图像（S210）；获取目标处理层的至少一组卷积核（S220），其中，同组中的不同卷积核包含的元素相同且元素的排列顺序不同；基于至少一组卷积核中的各卷积核，分别对不同的输入图像进行卷积计算，得到多个中间矩阵，对多个中间矩阵求和得到特征图像（S230）。所述方法通过不同卷积核包含的元素相同但元素的排列顺序不同的特性，减少存储卷积核占用的资源，减少读取卷积核的次数，减少在卷积层确定特征图像时产生的计算量，以及减少计算过程中消耗的系统运行资源。

Description

在卷积神经网络模型中确定特征图像的方法和装置

技术领域

本公开是关于模型训练技术领域，尤其是关于一种在卷积神经网络模型中确定特征图像的方法和装置。

背景技术

卷积神经网络由卷积层、全连接层、激活函数等组成，单个卷积层的输出包括多个特征图像。在对卷积神经网络模型进行训练的过程中，需要对大量的样本进行计算。其中，在卷积层产生的计算量就占整个训练过程中总计算量的90％。

对于任意一个卷积层，可以根据输入图像的数量和输出的特征图像的数量，确定卷积核的数量，并生成相应数量的卷积核，每个卷积核可以是一个小矩阵，如3×3矩阵，每个输入图像可以认为是一个大矩阵。该卷积层的处理可以如下：将一个输入图像和一个卷积核进行卷积计算，具体地，在输入图像中提取所有与卷积核大小相同的矩阵，将提取的矩阵与卷积核进行对位元素相乘再相加，得到一个数值，将得到的所有数值组成一个中间矩阵，每个输入图像与一个卷积核进行卷积计算都可以得到一个中间矩阵，这些中间矩阵相加可以得到一个特征图像。

在实现本公开的过程中，发明人发现至少存在以下问题：

由于卷积神经网络包含卷积层的数量较多，每个卷积层需要输出的特征图像较多，每个特征图像对应的卷积核的数量也较多。每个卷积核对应的计算量已经较大了，而整个训练过程中总计算量就会呈指数增长。因此，在卷积层产生的计算量巨大，需要占用大量的处理资源。

发明内容

为了克服相关技术中存在的问题，本公开提供了以下技术方案：

第一方面，提供了一种在卷积神经网络模型中确定特征图像的方法，所述方法包括：

获取卷积神经网络模型中目标处理层的多个输入图像；

获取所述目标处理层的至少一组卷积核，其中，同组中的不同卷积核包含的元素相同且元素的排列顺序不同；

基于所述至少一组卷积核中的各卷积核，分别对不同的输入图像进行卷积计算，得到多个中间矩阵，对所述多个中间矩阵求和得到特征图像，其中所述中间矩阵的每个元素是在卷积计算过程中对应的卷积核与输入图像进行对位元素相乘再相加得到的多项式。

本实施例提供的方法，获取多个输入图像；生成至少一组卷积核，其中，同组中的不同卷积核包含的元素相同且元素的排列顺序不同；基于至少一组卷积核中的各卷积核，分别对不同的输入图像进行卷积计算，得到多个中间矩阵，对多个中间矩阵求和得到特征图像。可以通过卷积核的不同卷积核包含的元素相同且元素的排列顺序不同的特性，减少存储卷积核占用的资源，减少读取卷积核的次数，减少在卷积层确定特征图像时产生的计算量，以及减少计算过程中消耗的系统运行资源。

在一种可能的实现方式中，所述对所述多个中间矩阵求和得到特征图像，包括：

将所述多个中间矩阵中相同位置的元素的多项式相加，得到所述特征图像的每个元素对应的多项式；

对所述特征图像的每个元素对应的多项式，分别进行合并同类项处理；

对每个合并同类项处理后的多项式，分别求值，得到所述特征图像。

未进行同类项合并的多项式，一共需要进行的乘法加法的次数远比进行同类项合并的多项式需要进行的乘法加法的次数多。可见，随着一组卷积核包括的卷积核的个数的增加，以及确定特征图像的整个计算过程的完成，其中涉及的可以缩减运算量的地方大大增加，最终加速了确定特征图像的速度。

在一种可能的实现方式中，在获取所述目标处理层的至少一组卷积核之前，所述方法还包括：

随机生成N个卷积核，其中，所述N为预设的组数目；

对所述N个卷积核中的每个卷积核，以行为单位进行元素位移，和/或以列为单位进行元素位移，得到M-1个不同的卷积核，M-1个卷积核与元素位移之前的卷积核组成所述目标处理层的一组卷积核，其中，所述M为预设的组中卷积核的数目。

可以通过卷积核的不同卷积核包含的元素相同且元素的排列顺序不同的特性，减少存储卷积核占用的资源，减少读取卷积核的次数，减少在卷积层确定特征图像时产生的计算量，以及减少计算过程中消耗的系统运行资源。

在一种可能的实现方式中，每个组中卷积核的数目大于2且小于卷积核的行数与列数的乘积。

在一种可能的实现方式中，对所述多个中间矩阵求和得到特征图像之后，所述方法还包括：

当得到所述卷积神经网络模型的输出结果时，根据所述卷积神经网络模型的输出结果和预设的输出结果，确定所述至少一组卷积核中每个卷积核中每个元素的调整值；

将同组中的不同卷积核包含的相同元素的调整值之和，确定为所述相同元素的调整值对应的修正后的调整值；

基于每个元素的修正后的调整值，对各卷积核进行调整。

在实施中，卷积神经网络模型中存在多层卷积层，第一层卷积层到第Z-1层卷积层输出的是特征图像，最后一层即第Z层卷积层输出的就是最终的输出结果。当得到卷积神经网络模型的输出结果时，由于卷积神经网络模型还处于训练的过程中，因此输出结果一般会和预设的输出结果之间存在误差。基于整个卷积神经网络模型产生的误差，可以确定多组卷积核中每个卷积核中每个元素的调整值。接着，将同组中的不同卷积核包含的相同元素的调整值之和，确定为相同元素的调整值对应的修正后的调整值。

第二方面，提供了一种在卷积神经网络模型中确定特征图像的装置，该装置包括至少一个模块，该至少一个模块用于实现上述第一方面所提供的在卷积神经网络模型中确定特征图像的方法。

第三方面，提供了一种终端，该终端包括处理器、存储器，处理器被配置为执行存储器中存储的指令；处理器通过执行指令来实现上述第一方面所提供的在卷积神经网络模型中确定特征图像的方法。

第四方面，提供了计算机可读存储介质，包括指令，当所述计算机可读存储介质在源服务器上运行时，使得所述源服务器执行上述第一方面所提供的在卷积神经网络模型中确定特征图像的方法。

第五方面，一种包含指令的计算机程序产品，当所述计算机程序产品在源服务器上运行时，使得所述源服务器执行上述第一方面所提供的在卷积神经网络模型中确定特征图像的方法。

本公开的实施例提供的技术方案可以包括以下有益效果：

本实施例提供的方法，获取多个输入图像；生成多组卷积核，其中，同组中的不同卷积核包含的元素相同且元素的排列顺序不同；确定多个输入图像对应的至少一个特征图像。可以通过卷积核的不同卷积核包含的元素相同且元素的排列顺序不同的特性，减少存储卷积核占用的资源，减少读取卷积核的次数，减少在卷积层确定特征图像时产生的计算量，以及减少计算过程中消耗的系统运行资源。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据一示例性实施例示出的一种终端的结构示意图；

图2是根据一示例性实施例示出的一种在卷积神经网络模型中确定特征图像的方法的流程示意图；

图3是根据一示例性实施例示出的一种在卷积神经网络模型中确定特征图像的方法的流程示意图；

图4是根据一示例性实施例示出的一种在卷积神经网络模型中确定特征图像的方法的流程示意图；

图5是根据一示例性实施例示出的一种在卷积神经网络模型中确定特征图像的方法的流程示意图；

图6是根据一示例性实施例示出的一种在卷积神经网络模型中确定特征图像的方法的流程示意图；

图7是根据一示例性实施例示出的一种在卷积神经网络模型中确定特征图像的方法的流程示意图；

图8是根据一示例性实施例示出的一种在卷积神经网络模型中确定特征图像的方法的流程示意图；

图9是根据一示例性实施例示出的一种在卷积神经网络模型中确定特征图像的方法的流程示意图；

图10是根据一示例性实施例示出的一种在卷积神经网络模型中确定特征图像的装置的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本发明实施例提供了一种在卷积神经网络模型中确定特征图像的方法，该方法的执行主体为终端。

终端可以包括处理器110、存储器120，处理器110可以与存储器120连接，如图1所示。处理器110可以包括一个或多个处理单元；处理器110可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件等。

具体地，程序可以包括程序代码，程序代码包括计算机操作指令。终端还可以包括存储器120，存储器120可用于存储软件程序以及模块，处理器110通过读取存储在存储器120的软件代码以及模块，从而执行任务。

另外，终端还可以包括接收器130和发射器140，其中，接收器130和发射器140可以分别与处理器110连接，发射器130和接收器140可以统称为收发器。发射器140可以用于发送消息或数据，发射器140可以包括但不限于至少一个放大器、调谐器、一个或多个振荡器、耦合器、LNA(Low Noise Amplifier，低噪声放大器)、双工器等。

本公开一示例性实施例提供了一种在卷积神经网络模型中确定特征图像的方法，如图2所示，该方法的处理流程可以包括如下的步骤：

步骤S210，获取卷积神经网络模型中目标处理层的多个输入图像。

在实施中，在对卷积神经网络模型进行训练的过程中，首先要设计卷积神经网络模型的结构，如卷积神经网络模型中包含的卷积层的层数，每层中输入图像、卷积核数量和输出的特征图像的数量等。在对卷积神经网络模型进行第一轮训练的过程中，用于对输入图像进行卷积计算得到输出图像的卷积核的元素的值是随机的。其中，卷积核可以是一个矩阵，卷积核的元素即为该矩阵中任意位置(通过行列决定的位置)处的数值。对于大小为3X3的卷积核，卷积核中存在3行和3列共9个数值，这9个数值即为卷积核的元素。同理，对于大小为5X5的卷积核，卷积核中存在5行和5列共25个数值，这25个数值即为卷积核的元素。其他大小的卷积核与之类似，在此不一一举例。而在第二轮训练至第N论训练的过程中，不断地通过卷积神经网络模型输出的结果与样本中的正确结果的差值，返回来去优化卷积核的元素的值，使得第N论训练后，卷积神经网络模型输出的结果尽可能地与样本中的正确结果的差值取得最低值。对于目标处理层(卷积神经网络模型中某一层卷积层)，其上一层卷积层输出的多个特征图像经过其它层如Pooling层(池化层)、RELU层(激活函数层)处理得到的多个输出图像，即为本层卷积层的多个输入图像。

卷积神经网络模型中的每一层卷积层中的每一个特征图像都可以使用本实施例提供的方法来确定。

步骤S220，获取目标处理层的至少一组卷积核。

其中，每组卷积核中的所有卷积核构成的多维的张量(包括三维或者三阶的三维以上的矩阵即为张量)，可以是按照某种规律排列的具有特殊结构的张量，其目的在于让每组卷积核中的元素可以重复，这样在用卷积核的元素进行计算时，可以通过合并同类项的方式减少计算量。卷积核的大小一般为3X3或者5X5，卷积核的高度与宽度一般是一样的数值。同组中的不同卷积核包含的元素相同且元素的排列顺序不同。

在实施中，在对卷积神经网络模型进行初始化的过程中，可以以组为单位生成多组卷积核。例如，如图3所示，在某一层卷积层中，一共有6个输入图像，分别与每个输入图像对应的卷积核也有6个。可以将这6个卷积核进行分组，例如，将卷积核1-3分为1组，将卷积核4-6分为1组。

可选地，在获取目标处理层的至少一组卷积核之前，本实施例提供的方法还可以包括：随机生成N个卷积核，其中，N为预设的组数目；对N个卷积核中的每个卷积核，以行为单位进行元素位移，和/或以列为单位进行元素位移，得到M-1个不同的卷积核，M-1个卷积核与元素位移之前的卷积核组成目标处理层的一组卷积核，其中，M为预设的组中卷积核的数目。

在实施中，在对卷积神经网络模型进行初始化的过程中，接上例，例如，将卷积核1-3分为1组，将卷积核4-6分为1组。首先，随机生成2个卷积核即卷积核1和卷积核4。接着，对卷积核1以行为单位进行元素位移，假如卷积核1的大小是3X3，则如图4所示，由卷积核1以列为单位进行元素位移得到卷积核2和卷积核3。其中，W ₁-W ₈是卷积核中的元素。卷积核4-6的生成方式同理。

可选地，每个组中卷积核的数目M大于2且小于卷积核的行数与列数的乘积。如对于大小为3X3的卷积核，M最大不超过9个。因为，一旦M超过9个，那么大小为3X3的卷积核已经以行为单位进行元素位移和以列为单位进行元素位移，位移的方式已是所有可能位移方式了，第10个卷积核一定就是重复前9个卷积核中的一个。即要保证同组中的不同卷积核包含的元素相同且元素的排列顺序不同，就要控制M最大不超过卷积核的行数与列数的乘积。

在实施中，例如，1组卷积核中存在5个卷积核1-5。如图5所示，首先，可以由卷积核1以列为单位进行元素位移得到卷积核2和卷积核3，再由卷积核1以行为单位进行元素位移得到卷积核4和卷积核5。或者由卷积核2以行为单位进行元素位移得到卷积核4和卷积核5等都可以。

步骤S230，基于至少一组卷积核中的各卷积核，分别对不同的输入图像进行卷积计算，得到多个中间矩阵，对多个中间矩阵求和得到特征图像。

其中，中间矩阵的每个元素是在卷积计算过程中对应的卷积核与输入图像进行对位元素相乘再相加得到的多项式。

在实施中，如图6所示，在同一层卷积层中，存在4个输入图像，需要该卷积层输出2个特征图像即特征图像1和特征图像2。通过4个卷积核1-4分别对这4个输入图像进行卷积计算，得到中间矩阵1-4，基于中间矩阵1-4可以得到特征图像1。通过4个卷积核5-8再次分别对这4个输入图像进行卷积计算，得到中间矩阵5-8，基于中间矩阵5-8可以得到特征图像2。

对于图6，卷积核1-4可以分为多组卷积核，卷积核5-8也可以分为多组卷积核。这里只是示例，实际中1个特征图像对应的卷积核的数量较大，可以将1个特征图像对应的卷积核分为多组卷积核。对于每组卷积核，不同卷积核包含的元素相同且元素的排列顺序不同。

如图7所示，以中间矩阵1的确定过程来说是，每次将输入图像1取出如3X3个相邻的元素，将输入图像1中的3X3个相邻的元素与对应位置上的卷积核的元素相乘再相加得到一个多项式。将卷积核在输入图像1中每次按预设行数或者预设列数进行移位，重复将得到的输入图像1中的3X3个相邻的元素与对应位置上的卷积核的元素相乘再相加得到一个多项式的操作，直到卷积核遍历输入图像上所有3X3个相邻的元素，就得到了中间矩阵1。

可选地，对多个中间矩阵求和得到特征图像的步骤可以包括：将多个中间矩阵中相同位置的元素的多项式相加，得到特征图像的每个元素对应的多项式；对特征图像的每个元素对应的多项式，分别进行合并同类项处理；对每个合并同类项处理后的多项式，分别求值，得到特征图像。

在实施中，对于本实施例提供的方法，可以通过多个通道同时将多个中间矩阵的多项式确定出，再将相同位置的多项式进行相加。

如图8所示，用卷积核1、卷积核2和卷积核3，分别对输入图像1、输入图像2和输入图像3中左上角位置的3X3个相邻的元素进行卷积计算，分别得到中间矩阵1、中间矩阵2和中间矩阵3的第一行第一列的一个元素为例。中间矩阵1的第一行第一列的一个元素对应的多项式为：W ₀×a ₀+W ₁×a ₁+W ₂×a ₂+W ₃×a ₃+W ₄×a ₄+W ₅×a ₅+W ₆×a ₆+W ₇×a ₇+W ₈×a ₈。中间矩阵2的第一行第一列的一个元素对应的多项式为：W ₂×b ₀+W ₀×b ₁+W ₁×b ₂+W ₅×b ₃+W ₃×b ₄+W ₄×b ₅+W ₈×b ₆+W ₆×b ₇+W ₇×b ₈。中间矩阵3的第一行第一列的一个元素对应的多项式为：W ₁×c ₀+W ₂×c ₁+W ₀×c ₂+W ₄×c ₃+W ₅×c ₄+W ₃×c ₅+W ₇×c ₆+W ₈×c ₇+W ₆×c ₈。

在确定特征图像时，要将与特征图像对应的所有中间矩阵的相同位置的元素的多项式相加，这其中包括将中间矩阵1、中间矩阵2和中间矩阵3的相同位置的元素的多项式相加。当然，也包括将中间矩阵1、中间矩阵2和中间矩阵3的第一行第一列的元素对应的多项式相加，得到：W ₀×a ₀+W ₁×a ₁+W ₂×a ₂+W ₃×a ₃+W ₄×a ₄+W ₅×a ₅+W ₆×a ₆+W ₇×a ₇+W ₈×a ₈+W ₂×b ₀+W ₀×b ₁+W ₁×b ₂+W ₅×b ₃+W ₃×b ₄+W ₄×b ₅+W ₈×b ₆+W ₆×b ₇+W ₇×b ₈+W ₁×c ₀+W ₂×c ₁+W ₀×c ₂+W ₄×c ₃+W ₅×c ₄+W ₃×c ₅+W ₇×c ₆+W ₈×c ₇+W ₆×c ₈。

可以看到，可以对上述式子进行合并同类项的处理，得到：W ₀×(a ₀+b ₁+c ₂)+W ₁×(a ₁+b ₂+c ₀)+W ₂×(a ₂+b ₀+c ₁)+W ₃×(a ₃+b ₄+c ₅)+W ₄×(a ₄+b ₅+c ₃)+W ₅×(a ₅+b ₃+c ₄)+W ₆×(a ₆+b ₇+c ₈)+W ₇×(a ₇+b ₈+c ₆)+W ₈×(a ₈+b ₆+c ₇)。可以看出，未进行同类项合并的多项式，一共需要进行27次乘法以及26次加法可以得到想要的结果，而进行同类项合并的多项式，一共需要进行9次乘法以及26次加法就可以得到想要的结果。

可见，对于确定特征图像中的一小部分运算就可以减少18次乘法的运算量。而随着一组卷积核包括的卷积核的个数的增加，以及确定特征图像的整个计算过程的完成，其中涉及的可以缩减运算量的地方大大增加，最终加速了确定特征图像的速度。

可选地，对多个中间矩阵求和得到特征图像之后，本实施例提供的方法还包括：当得到卷积神经网络模型的输出结果时，根据卷积神经网络模型的输出结果和预设的输出结果，确定至少一组卷积核中每个卷积核中每个元素的调整值；将同组中的不同卷积核包含的相同元素的调整值之和，确定为相同元素的调整值对应的修正后的调整值；基于每个元素的修正后的调整值，对各卷积核进行调整。

在实施中，卷积神经网络模型中存在多层卷积层，第一层卷积层到第Z-1层卷积层输出的是特征图像，最后一层即第Z层卷积层输出的就是最终的输出结果。当得到卷积神经网络模型的输出结果时，由于卷积神经网络模型还处于训练的过程中，因此输出结果一般会和预设的输出结果之间存在误差。基于整个卷积神经网络模型产生的误差，可以确定多组卷积核中每个卷积核中每个元素的调整值。接着，将同组中的不同卷积核包含的相同元素的调整值之和，确定为相同元素的调整值对应的修正后的调整值。例如，对于图8，假如通过卷积核1、卷积核2和卷积核3分别对输入图像1中的3X3个相邻元素、输入图像2中的3X3个相邻元素和输入图像3中的3X3个相邻元素通过3个通道进行卷积计算则有图9，则在计算相同元素的调整值对应的修正后的调整值时有如下公式：

其中，Δw为相同元素的调整值对应的修正后的调整值。WH为特征图像的宽度与高度的乘积。δ _Rk为灵敏度，δ _Rk中的R表示目标处理层的第R个特征图像，w_size ²为卷积核的宽度与卷积核的高度的乘积。

最终，通过本实施例提供的方法，进行试验。具体使用Cifar10数据集进行图像识别训练，设计卷积神经网络模型为3层模型，每层卷积核大小为5X5。得到试验结果如下表所示：

表1

通过本实施例提供的方法，进行试验。具体对卷积神经网络模型训练用于图像超分辨率领域，设置将原图像放大为3倍大小的新图像。设计卷积神经网络模型为3层模型，卷积核的大小为5X5。得到试验结果如下表所示：

表2

其中，PSNR是图像超分辨率应用中常用的衡量指标，PSNR越大，图像超分辨率后的效果越好。BaseHisrcnn是应用在图像超分辨率上的一种卷积神经网络结构。

本公开又一示例性实施例提供了一种在卷积神经网络模型中确定特征图像的装置，如图10所示，该装置包括：

获取模块1010，用于获取卷积神经网络模型中目标处理层的多个输入图像；获取所述目标处理层的至少一组卷积核。其中，同组中的不同卷积核包含的元素相同且元素的排列顺序不同。具体可以实现上述步骤S210和步骤S220中的获取功能，以及其他隐含步骤。

确定模块1020，用于基于所述至少一组卷积核中的各卷积核，分别对不同的输入图像进行卷积计算，得到多个中间矩阵，对所述多个中间矩阵求和得到特征图像，其中所述中间矩阵的每个元素是在卷积计算过程中对应的卷积核与输入图像进行对位元素相乘再相加得到的多项式。具体可以实现上述步骤S230中的获取功能，以及其他隐含步骤。

可选地，所述确定模块1020用于将所述多个中间矩阵中相同位置的元素的多项式相加，得到所述特征图像的每个元素对应的多项式；对所述特征图像的每个元素对应的多项式，分别进行合并同类项处理；对每个合并同类项处理后的多项式，分别求值，得到所述特征图像。

可选地，所述装置还包括：

生成模块，用于随机生成N个卷积核，其中，所述N为预设的组数目；

位移模块，用于对所述N个卷积核中的每个卷积核，以行为单位进行元素位移，和/或以列为单位进行元素位移，得到M-1个不同的卷积核，M-1个卷积核与元素位移之前的卷积核组成所述目标处理层的一组卷积核，其中，所述M为预设的组中卷积核的数目。

可选地，每个组中卷积核的数目大于2且小于卷积核的行数与列数的乘积。

可选地，所述确定模块1020还用于当得到所述卷积神经网络模型的输出结果时，根据所述卷积神经网络模型的输出结果和预设的输出结果，确定所述至少一组卷积核中每个卷积核中每个元素的调整值；将同组中的不同卷积核包含的相同元素的调整值之和，确定为所述相同元素的调整值对应的修正后的调整值；

所述装置还包括调整模块：

所述调整模块，用于基于每个元素的修正后的调整值，对各卷积核进行调整。

需要说明的是，上述获取模块1010、确定模块1020可以由处理器实现，或者处理器配合存储器来实现，或者，处理器执行存储器中的程序指令来实现。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

需要说明的是：上述实施例提供的在卷积神经网络模型中确定特征图像的装置在确定特征图像时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将终端的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的在卷积神经网络模型中确定特征图像的装置与在卷积神经网络模型中确定特征图像的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

本领域技术人员在考虑说明书及实践这里公开的公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

一种在卷积神经网络模型中确定特征图像的方法，其特征在于，所述方法包括：

获取卷积神经网络模型中目标处理层的多个输入图像；

获取所述目标处理层的至少一组卷积核，其中，同组中的不同卷积核包含的元素相同且元素的排列顺序不同；

基于所述至少一组卷积核中的各卷积核，分别对不同的输入图像进行卷积计算，得到多个中间矩阵，对所述多个中间矩阵求和得到特征图像，其中所述中间矩阵的每个元素是在卷积计算过程中对应的卷积核与输入图像进行对位元素相乘再相加得到的多项式。
根据权利要求1所述的方法，其特征在于，所述对所述多个中间矩阵求和得到特征图像，包括：

将所述多个中间矩阵中相同位置的元素的多项式相加，得到所述特征图像的每个元素对应的多项式；

对所述特征图像的每个元素对应的多项式，分别进行合并同类项处理；

对每个合并同类项处理后的多项式，分别求值，得到所述特征图像。
根据权利要求1所述的方法，其特征在于，在获取所述目标处理层的至少一组卷积核之前，所述方法还包括：

随机生成N个卷积核，其中，所述N为预设的组数目；

对所述N个卷积核中的每个卷积核，以行为单位进行元素位移，和/或以列为单位进行元素位移，得到M-1个不同的卷积核，M-1个卷积核与元素位移之前的卷积核组成所述目标处理层的一组卷积核，其中，所述M为预设的组中卷积核的数目。
根据权利要求1所述的方法，其特征在于，每个组中卷积核的数目大于2且小于卷积核的行数与列数的乘积。
根据权利要求1所述的方法，其特征在于，对所述多个中间矩阵求和得到特征图像之后，所述方法还包括：

当得到所述卷积神经网络模型的输出结果时，根据所述卷积神经网络模型的输出结果和预设的输出结果，确定所述至少一组卷积核中每个卷积核中每个元素的调整值；

将同组中的不同卷积核包含的相同元素的调整值之和，确定为所述相同元素的调整值对应的修正后的调整值；

基于每个元素的修正后的调整值，对各卷积核进行调整。
一种在卷积神经网络模型中确定特征图像的装置，其特征在于，所述装置包括：

获取模块，用于获取卷积神经网络模型中目标处理层的多个输入图像；获取所述目标处理层的至少一组卷积核，其中，同组中的不同卷积核包含的元素相同且元素的排列顺序不同；

确定模块，用于基于所述至少一组卷积核中的各卷积核，分别对不同的输入图像进行卷积计算，得到多个中间矩阵，对所述多个中间矩阵求和得到特征图像，其中所述中间矩阵的每个元素是在卷积计算过程中对应的卷积核与输入图像进行对位元素相乘再相加得到的多项式。
根据权利要求6所述的装置，其特征在于，所述确定模块用于将所述多个中间矩阵中相同位置的元素的多项式相加，得到所述特征图像的每个元素对应的多项式；对所述特征图像的每个元素对应的多项式，分别进行合并同类项处理；对每个合并同类项处理后的多项式，分别求值，得到所述特征图像。
根据权利要求6所述的装置，其特征在于，所述装置还包括：

生成模块，用于随机生成N个卷积核，其中，所述N为预设的组数目；

位移模块，用于对所述N个卷积核中的每个卷积核，以行为单位进行元素位移，和/或以列为单位进行元素位移，得到M-1个不同的卷积核，M-1个卷积核与元素位移之前的卷积核组成所述目标处理层的一组卷积核，其中，所述M为预设的组中卷积核的数目。
根据权利要求6所述的装置，其特征在于，每个组中卷积核的数目大于2且小于卷积核的行数与列数的乘积。
根据权利要求6所述的装置，其特征在于，所述确定模块还用于当得到所述卷积神经网络模型的输出结果时，根据所述卷积神经网络模型的输出结果和预设的输出结果，确定所述至少一组卷积核中每个卷积核中每个元素的调整值；将同组中的不同卷积核包含的相同元素的调整值之和，确定为所述相同元素的调整值对应的修正后的调整值；

所述装置还包括调整模块：

所述调整模块，用于基于每个元素的修正后的调整值，对各卷积核进行调整。
一种终端，其特征在于，所述终端包括处理器和存储器，其中：

所述处理器，用于获取所述存储器中存储的卷积神经网络模型中目标处理层的多个输入图像；获取所述存储器中存储的所述目标处理层的至少一组卷积核，其中，同组中的不同卷积核包含的元素相同且元素的排列顺序不同；基于所述至少一组卷积核中的各卷积核，分别对不同的输入图像进行卷积计算，得到多个中间矩阵，对所述多个中间矩阵求和得到特征图像，其中所述中间矩阵的每个元素是在卷积计算过程中对应的卷积核与输入图像进行对位元素相乘再相加得到的多项式。
根据权利要求11所述的终端，其特征在于，所述处理器用于将所述多个中间矩阵中相同位置的元素的多项式相加，得到所述特征图像的每个元素对应的多项式；对所述特征图像的每个元素对应的多项式，分别进行合并同类项处理；对每个合并同类项处理后的多项式，分别求值，得到所述特征图像。
根据权利要求11所述的终端，其特征在于，所述处理器还用于随机生成N个卷积核，其中，所述N为预设的组数目；对所述N个卷积核中的每个卷积核，以行为单位进行元素位移，和/或以列为单位进行元素位移，得到M-1个不同的卷积核，M-1个卷积核与元素位移之前的卷积核组成所述目标处理层的一组卷积核，其中，所述M为预设的组中卷积核的数目。
根据权利要求11所述的终端，其特征在于，每个组中卷积核的数目大于2且小于卷积核的行数与列数的乘积。
根据权利要求11所述的终端，其特征在于，所述处理器还用于当得到所述卷积神经网络模型的输出结果时，根据所述卷积神经网络模型的输出结果和预设的输出结果，确定所述至少一组卷积核中每个卷积核中每个元素的调整值；将同组中的不同卷积核包含的相同元素的调整值之和，确定为所述相同元素的调整值对应的修正后的调整值；基于每个元素的修正后的调整值，对各卷积核进行调整。
一种计算机可读存储介质，其特征在于，包括指令，当所述计算机可读存储介质在终端上运行时，使得所述终端执行所述权利要求1-5中任一权利要求所述的方法。
一种包含指令的计算机程序产品，其特征在于，当所述计算机程序产品在终端上运行时，使得所述终端执行所述权利要求1-5中任一权利要求所述的方法。