WO2020143302A1

WO2020143302A1 - 卷积神经网络模型优化方法、装置、计算机设备及存储介质

Info

Publication number: WO2020143302A1
Application number: PCT/CN2019/117297
Authority: WO
Inventors: 金戈; 徐亮
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-01-10
Filing date: 2019-11-12
Publication date: 2020-07-16
Also published as: CN109886390A; CN109886390B

Abstract

本申请实施例公开了一种卷积神经网络模型优化方法、装置、计算机设备及存储介质。其中，所述方法属于人工智能技术，所述方法包括：将卷积神经网络模型的输入层输出的初始特征矩阵划分为多个子初始特征矩阵；将各子初始特征矩阵逐一输入到卷积神经网络模型的卷积层中以获得各子初始特征矩阵的子特征提取矩阵；将各子初始特征矩阵的子特征提取矩阵进行叠加后获得总特征提取矩阵；将总特征提取矩阵输入到卷积神经网络模型的下一层中以得到输出结果。

Description

卷积神经网络模型优化方法、装置、计算机设备及存储介质

本申请要求于2019年1月10日提交中国专利局、申请号为201910023823.9、申请名称为“卷积神经网络模型优化方法、装置、计算机设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种卷积神经网络模型优化方法、装置、计算机设备及存储介质。

背景技术

卷积神经网络(Convolutional Neural Network，CNN)，是一种前馈神经网络，人工神经元可以响应周围单元，可以进行大型图像处理。

目前，文本分类或者是图像识别等领域常用到卷积神经网络模型。但卷积神经网络模型中的卷积层带来的计算量通常非常巨大，以至于其无法应用到计算能力较差的终端中，极大地限制了卷积神经网络模型的应用范围。

发明内容

本申请实施例提供了一种卷积神经网络模型优化方法、装置、计算机设备及存储介质，旨在解决现有卷积神经网络模型所需的计算资源较多的问题。

第一方面，本申请实施例提供了一种卷积神经网络模型优化方法，其包括：

将预设的卷积神经网络模型的输入层输出的初始特征矩阵划分为多个子初始特征矩阵；

将各所述子初始特征矩阵逐一输入到所述卷积神经网络模型的卷积层中以获得各所述子初始特征矩阵的子特征提取矩阵；

将各所述子初始特征矩阵的子特征提取矩阵进行叠加后获得总特征提取矩阵；

将所述总特征提取矩阵输入到所述卷积神经网络模型的下一层中以得到输出结果。

第二方面，本申请实施例还提供了一种卷积神经网络模型优化装置，其包括：

第一划分单元，用于将预设的卷积神经网络模型的输入层输出的初始特征矩阵划分为多个子初始特征矩阵；

第一输入单元，用于将各所述子初始特征矩阵逐一输入到所述卷积神经网络模型的卷积层中以获得各所述子初始特征矩阵的子特征提取矩阵；

第一叠加单元，用于将各所述子初始特征矩阵的子特征提取矩阵进行叠加后获得总特征提取矩阵；

第二输入单元，用于将所述总特征提取矩阵输入到所述卷积神经网络模型的下一层中以得到输出结果。

第三方面，本申请实施例还提供了一种计算机设备，包括存储器以及与所述存储器相连的处理器；所述存储器用于存储计算机程序；所述处理器用于运行所述存储器中存储的计算机程序，以执行如下步骤：

第四方面，本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器执行以下步骤：

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种卷积神经网络模型优化方法的流程示意图；

图2为本申请实施例提供的一种卷积神经网络模型优化方法的子流程示意图；

图3为本申请实施例提供的一种卷积神经网络模型优化方法的子流程示意图；

图4为本申请实施例提供的一种卷积神经网络模型优化方法的子流程示意图；

图5为本申请另一实施例提供的一种卷积神经网络模型优化方法的流程示意图；

图6为本申请实施例提供的一种卷积神经网络模型优化装置的示意性框图；

图7为本申请实施例提供的一种卷积神经网络模型优化装置的第一划分单元的示意性框图；

图8为本申请实施例提供的一种卷积神经网络模型优化装置的第一输入单元的示意性框图；

图9为本申请实施例提供的一种卷积神经网络模型优化装置的第一标记单元的示意性框图；

图10为本申请实施例提供的一种卷积神经网络模型优化装置的第一判断单元的示意性框图；

图11为本申请实施例提供的一种卷积神经网络模型优化装置的第一叠加单元的示意性框图；

图12为本申请另一实施例提供的一种卷积神经网络模型优化装置的示意性框图；以及

图13为本申请实施例提供的一种计算机设备的示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

请参阅图1，图1是本申请实施例提供的一种卷积神经网络模型优化方法的流程示意图。如图所示，该方法包括以下步骤S1-S4。

S1，将预设的卷积神经网络模型的输入层输出的初始特征矩阵划分为多个子初始特征矩阵。

在本申请实施例中，卷积神经网络模型包括输入层、卷积层、激励层、池化层、全连接层以及输出层。

具体实施中首先将待处理数据(图像数据或者文本数据等)输入到卷积神经网络模型的输入层，输入层对待处理数据进行预处理后输出初始特征矩阵。

在获取了初始特征矩阵后，本申请实施例中不直接将初始特征矩阵输入到卷积神经网络模型的卷积层中，而是预先将初始特征矩阵划分为多个子初始特征矩阵，并逐一将各子初始特征矩阵输入到卷积神经网络模型的卷积层中。

由于子初始特征矩阵的数据量要小于初始特征矩阵的数据量，由此可极大地降低卷积层中卷积计算所需的计算量，使得卷积神经网络模型能够应用到低计算能力的终端中，提高了卷积神经网络网络的应用范围。

在一实施例中，参见图2，以上步骤S1包括如下步骤S11-S12。

S11，根据预设的行数阈值以及列数阈值将所述初始特征矩阵划分为多个子初始特征矩阵，其中所述子初始特征矩阵的行数少于所述行数阈值，所述子初始特征矩阵的列数少于所述列数阈值。

具体实施中，根据预设的行数阈值以及列数阈值将所述初始特征矩阵划分为多个子初始特征矩阵。其中，划分得到的子初始特征矩阵的行数少于所述行数阈值，列数少于所述列数阈值。

需要说明的是，所述行数阈值以及列数阈值可由本领域技术人员根据终端的实际计算能力确定，本申请对此不做具体的限定。

S12，记录各所述子初始特征矩阵在所述初始特征矩阵中的坐标位置。

具体实施中，在将所述初始特征矩阵划分为多个子初始特征矩阵后，记录各所述子初始特征矩阵在所述初始特征矩阵中的坐标位置。之后，根据所述坐标位置将各所述子初始特征矩阵经过卷积层进行特征提取后获得的子特征提取矩阵叠加为总特征提取矩阵。

例如，在一具体实施例中，初始特征矩阵A为：

在本实施例中，将行数阈值设定为4，列数阈值也设定为4。

具体实施中将初始特征矩阵A均匀划分为以下4个子初始特征矩阵A1、A2、A3以及A4，其中：

A1为

A2为

A3为

A4为

子初始特征矩阵A1的坐标为(1,1)；子初始特征矩阵A2的坐标为(1,2)；子初始特征矩阵A3的坐标为(2,1)；子初始特征矩阵A1的坐标为(2,2)。

S2，将各所述子初始特征矩阵逐一输入到所述卷积神经网络模型的卷积层中以获得各所述子初始特征矩阵的子特征提取矩阵。

具体实施中，将各所述子初始特征矩阵逐一输入到所述卷积神经网络模型的卷积层中以获得各所述子初始特征矩阵的子特征提取矩阵。

卷积层用于对所述子初始特征矩阵进行卷积计算，每一次卷积可以看作为一次过滤，相当于一次特征提取的过程，各子初始特征矩阵在经过卷积层进行特征提取后得到子特征提取矩阵。

在一实施例中，参见图3，以上步骤S2具体包括如下步骤S21-S24。

S21，获取一所述子初始特征矩阵作为目标子初始特征矩阵，并将所述目标子初始特征矩阵输入到所述卷积神经网络模型的卷积层中以获得所述目标子初始特征矩阵的子特征提取矩阵。

具体实施中，获取一所述子初始特征矩阵作为目标子初始特征矩阵，并将所述目标子初始特征矩阵输入到所述卷积神经网络模型的卷积层中以获得所述目标子初始特征矩阵的子特征提取矩阵。

S22，对所述目标子初始特征矩阵进行标记。

具体实施中，在将所述目标子初始特征矩阵输入到所述卷积神经网络模型的卷积层后，对所述目标子初始特征矩阵进行标记。

在一实施例中，对所述目标子初始特征矩阵进行标记可具体为在所述目标子初始特征矩中添加预设的特征标记符。

需要说明的是，预设的特征标记符可由本领域技术人员根据实际情况进行设定，本申请对此不作具体限定，例如，在一实施例中，所述特征标记符为“#”。

S23，判断是否存在未标记的子初始特征矩阵。

具体实施中，遍历所有的子初始特征矩阵，并判断是否存在未标记的子初始特征矩阵。

在一实施例中，参见图4，以上步骤S32具体包括如下步骤S231-S233。

S231，判断是否所有的子初始特征矩阵中均包含预设的特征标记符。

具体实施中，判断是否所有的子初始特征矩阵中均包含预设的特征标记符。

S232，若所有的子初始特征矩阵中均包含预设的特征标记符，判定不存在未标记的子初始特征矩阵。

具体实施中，如果所有的子初始特征矩阵中均包含预设的特征标记符，判定不存在未标记的子初始特征矩阵。

S233，若存在不包含预设的特征标记符的子初始特征矩阵，判定存在未标记的子初始特征矩阵。

具体实施中，如果存在不包含预设的特征标记符的子初始特征矩阵，判定存在未标记的子初始特征矩阵。

S24，若存在未标记的子初始特征矩阵，获取一未标记的子初始特征矩阵作为目标子初始特征矩阵，并将所述目标子初始特征矩阵输入到所述卷积神经网络模型的卷积层中以获得所述目标子初始特征矩阵的子特征提取矩阵。

具体实施中，如果未对所有的所述子初始特征矩阵进行标记，获取一未标记的子初始特征矩阵作为目标子初始特征矩阵，并将所述目标子初始特征矩阵输入到所述卷积神经网络模型的卷积层中以获得所述目标子初始特征矩阵的子特征提取矩阵，如此循环直到以对所有的子初始特征矩阵进行标记(即输入到卷积层中进行特征提取)。

若已对所有的所述子初始特征矩阵进行标记，执行步骤S3。

具体实施中，若已对所有的所述子初始特征矩阵进行标记，则执行以下步骤S3。

S3，将各所述子初始特征矩阵的子特征提取矩阵进行叠加后获得总特征提取矩阵。

具体实施中，在获取了所有子初始特征矩阵的子特征提取矩阵后，将各所述子初始特征矩阵的子特征提取矩阵进行叠加后获得总特征提取矩阵。总特征提取矩阵为用于输入到卷积神经网络模型的下一层结构(激励层)的输入数据。

在一实施例中，以上步骤S3具体包括如下步骤：根据各所述子初始特征矩阵在所述初始特征矩阵中的坐标位置将各所述子初始特征矩阵的子特征提取矩阵叠加为总特征提取矩阵。其中，所述子初始特征矩阵的子特征提取矩阵在所述总特征提取矩阵中的坐标位置与所述子初始特征矩阵在所述初始特征矩阵中的坐标位置相同。

具体实施中，据各所述子初始特征矩阵在所述初始特征矩阵中的坐标位置将各所述子初始特征矩阵的子特征提取矩阵叠加为总特征提取矩阵，以使得所述子初始特征矩阵的子特征提取矩阵在所述总特征提取矩阵中的坐标位置与所述子初始特征矩阵在所述初始特征矩阵中的坐标位置相同，从而在将各所述子初始特征矩阵的子特征提取矩阵叠加为总特征提取矩阵的过程中，保持个子特征提取矩阵间的位置关系与各子初始特征矩阵的位置关系相同。

例如，在一具体实施例中，对四个子初始特征矩阵A1、A2、A3以及A4进行特征提取后得到，四个子特征提取矩阵分别为B1、B2、B3以及B4，其中：

B1为

B2为

B3为

子初始特征矩阵A1的坐标为(1,1)；子初始特征矩阵A2的坐标为(1,2)；子初始特征矩阵A3的坐标为(2,1)；子初始特征矩阵A1的坐标为(2,2)。因此，子特征提取矩阵B1的坐标为(1,1)；子特征提取矩阵B2的坐标为(1,2)；子特征提取矩阵B3的坐标为(2,1)；子特征提取矩阵B1的坐标为(2,2)。

通过将四个子特征提取矩阵B1、B2、B3以及B4合并得到的总特征提取矩阵B为

S4，将所述总特征提取矩阵输入到所述卷积神经网络模型的下一层中以得到输出结果。

具体实施中，所述卷积神经网络模型的下一层为激励层。具体地，将总特征提取矩阵作为输入数据输入到所述卷积神经网络模型的激励层中，将激励层的输出数据作为输入数据输入到所述卷积神经网络模型的池化层中。将池化层的输出数据作为输入数据输入到所述卷积神经网络模型的全连接层中，将全连接层的输出数据作为输入数据输入到所述卷积神经网络模型的输出层中以得到输出结果。

需要说明的是，激励层用于把卷积层输出结果做非线性映射，即增加数据的非线性特征。池化层用于压缩数据和参数的量，减小过拟合。所述全连接层主要用于将卷积层的输出转换为一个一维的向量。所述输出层用于输出结果。

通过应用本申请实施例的技术方案，将预设的卷积神经网络模型的输入层输出的初始特征矩阵划分为多个子初始特征矩阵；将各所述子初始特征矩阵逐一输入到所述卷积神经网络模型的卷积层中以获得各所述子初始特征矩阵的子特征提取矩阵；将各所述子初始特征矩阵的子特征提取矩阵进行叠加后获得总特征提取矩阵，从而能够实现将初始特征矩阵划分为多个子初始特征矩阵后逐一输入到卷积神经网络的卷积层中进行特征提取。由于子初始特征矩阵的数据量要小于初始特征矩阵的数据量，由此可极大地降低卷积层中卷积计算所需的计算量，使得卷积神经网络模型能够应用到低计算能力的终端中，提高了卷积神经网络网络的应用范围。

图5是本申请另一实施例提供的一种卷积神经网络模型优化方法的流程示意图。如图5所示，本实施例的卷积神经网络模型优化方法包括步骤S51-S55。其中步骤S52-S55与上述实施例中的步骤S1-S4类似，在此不再赘述。下面详细说明本实施例中所增加的步骤S51。

S51、将待处理数据输入到卷积神经网络模型的输入层中以得到所述初始特征矩阵。

在本方案中，卷积神经网络模型包括输入层、卷积层、激励层、池化层、全连接层以及输出层。

具体实施中，将待处理数据(图像数据或者文本数据等)输入到卷积神经网络模型的输入层，输入层对待处理数据进行预处理后输出初始特征矩阵。预处理主要包括去均值处理以及归一化处理。

去均值是指把待处理数据各个维度都中心化为0，其目的就是把样本的中心拉回到坐标系原点上。

归一化是指将待处理数据中不同维度的数据的幅度归一化到同样的范围，即减少各维度数据取值范围的差异而带来的干扰，比如，我们有两个维度的特征A和B，A范围是0到10，而B范围是0到10000，如果直接使用这两个特征是有问题的，好的做法就是归一化，即A和B的数据都变为0到1的范围。

图6是本申请实施例提供的一种卷积神经网络模型优化装置60的示意性框图。如图6所示，对应于以上卷积神经网络模型优化方法，本申请还提供一种卷积神经网络模型优化装置60。该卷积神经网络模型优化装置60包括用于执行上述卷积神经网络模型优化方法的单元，该装置可以被配置于台式电脑、平板电脑、手提电脑、等终端中。具体地，请参阅图6，该卷积神经网络模型优化装置60包括第一划分单元61、第一输入单元62、第一叠加单元63以及第二输入单元64。

第一划分单元61，用于将预设的卷积神经网络模型的输入层输出的初始特征矩阵划分为多个子初始特征矩阵。第一输入单元62，用于将各所述子初始特征矩阵逐一输入到所述卷积神经网络模型的卷积层中以获得各所述子初始特征矩阵的子特征提取矩阵。第一叠加单元63，用于将各所述子初始特征矩阵的子特征提取矩阵进行叠加后获得总特征提取矩阵。第二输入单元64，用于将所述总特征提取矩阵输入到所述卷积神经网络模型的下一层中以得到输出结果。

在一实施例中，如图7所示，所述第一划分单元61包括第二划分单元611以及记录单元612。

第二划分单元611，用于根据预设的行数阈值以及列数阈值将所述初始特征矩阵划分为多个子初始特征矩阵，其中所述子初始特征矩阵的行数少于所述行数阈值，所述子初始特征矩阵的列数少于所述列数阈值。记录单元612，用于记录各所述子初始特征矩阵在所述初始特征矩阵中的坐标位置。

在一实施例中，如图8所示，所述第一输入单元62包括第一获取单元621、标记单元622、第一判断单元623以及第二获取单元624。

第一获取单元621，用于获取一所述子初始特征矩阵作为目标子初始特征矩阵，并将所述目标子初始特征矩阵输入到所述卷积神经网络模型的卷积层中以获得所述目标子初始特征矩阵的子特征提取矩阵。标记单元622，用于对所述目标子初始特征矩阵进行标记。第一判断单元623，用于判断是否存在未标记的子初始特征矩阵。第二获取单元624，用于若存在未标记的子初始特征矩阵，获取一未标记的子初始特征矩阵作为目标子初始特征矩阵，并将所述目标子初始特征矩阵输入到所述卷积神经网络模型的卷积层中以获得所述目标子初始特征矩阵的子特征提取矩阵。

在一实施例中，如图9所示，所述标记单元622包括添加单元6221。

添加单元6221，用于在所述目标子初始特征矩中添加预设的特征标记符。

在一实施例中，如图10所示，所述第一判断单元623包括第二判断单元6231、第一判定单元6232以及第二判定单元6233。

第二判断单元6231，用于判断是否所有的子初始特征矩阵中均包含预设的特征标记符。第一判定单元6232，用于若所有的子初始特征矩阵中均包含预设的特征标记符，判定不存在未标记的子初始特征矩阵。第二判定单元6233，用于若存在不包含预设的特征标记符的子初始特征矩阵，判定存在未标记的子初始特征矩阵。

在一实施例中，如图11所示，所述第一叠加单元63包括第二叠加单元631。

第二叠加单元631，用于根据各所述子初始特征矩阵在所述初始特征矩阵中的坐标位置将各所述子初始特征矩阵的子特征提取矩阵叠加为总特征提取矩阵，其中，所述子初始特征矩阵的子特征提取矩阵在所述总特征提取矩阵中的坐标位置与所述子初始特征矩阵在所述初始特征矩阵中的坐标位置相同。

图12是本申请另一实施例提供的一种卷积神经网络模型优化装置60的示意性框图。如图12所示，本实施例的卷积神经网络模型优化装置60是上述实施例的基础上增加了第三输入单元65。

第三输入单元65，用于将待处理数据输入到卷积神经网络模型的输入层中以得到所述初始特征矩阵。

需要说明的是，所属领域的技术人员可以清楚地了解到，上述卷积神经网络模型优化装置60和各单元的具体实现过程，可以参考前述方法实施例中的相应描述，为了描述的方便和简洁，在此不再赘述。

上述卷积神经网络模型优化装置可以实现为一种计算机程序的形式，该计算机程序可以在如图13所示的计算机设备上运行。

请参阅图13，图13是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是终端，也可以是服务器，其中，终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。服务器可以是独立的服务器，也可以是多个服务器组成的服务器集群。

参阅图13，该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505，其中，存储器可以包括非易失性存储介质503和内存储器504。

该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时，可使得处理器502执行一种卷积神经网络模型优化方法。

该处理器502用于提供计算和控制能力，以支撑整个计算机设备500的运行。

该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境，该计算机程序5032被处理器502执行时，可使得处理器502执行一种卷积神经网络模型优化方法。

该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解，图13中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备500的限定，具体的计算机设备500可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器502用于运行存储在存储器中的计算机程序5032，以实现本申请的卷积神经网络模型优化方法。

应当理解，在本申请实施例中，处理器502可以是中央处理单元(Central Processing Unit，CPU)，该处理器502还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成。该计算机程序可存储于一存储介质中，该存储介质为计算机可读存储介质。该计算机程序被该计算机系统中的至少一个处理器执行，以实现上述方法的实施例的流程步骤。

因此，本申请还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序。该计算机程序被处理器执行时使处理器执行本申请的卷积神经网络模型优化方法。

所述存储介质为实体的、非瞬时性的存储介质，例如可以是U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的实体存储介质。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

以上所述，仅为本申请的具体实施方式，但本申请明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

一种卷积神经网络模型优化方法，包括：

将预设的卷积神经网络模型的输入层输出的初始特征矩阵划分为多个子初始特征矩阵；

将各所述子初始特征矩阵逐一输入到所述卷积神经网络模型的卷积层中以获得各所述子初始特征矩阵的子特征提取矩阵；

将各所述子初始特征矩阵的子特征提取矩阵进行叠加后获得总特征提取矩阵；

将所述总特征提取矩阵输入到所述卷积神经网络模型的下一层中以得到输出结果。
根据权利要求1所述的方法，其中，所述将预设的卷积神经网络模型的输入层输出的初始特征矩阵划分为多个子初始特征矩阵，包括：

根据预设的行数阈值以及列数阈值将所述初始特征矩阵划分为多个子初始特征矩阵，其中，所述子初始特征矩阵的行数少于所述行数阈值，所述子初始特征矩阵的列数少于所述列数阈值；

记录各所述子初始特征矩阵在所述初始特征矩阵中的坐标位置。
根据权利要求1所述的方法，其中，所述将各所述子初始特征矩阵逐一输入到所述卷积神经网络模型的卷积层中以获得各所述子初始特征矩阵的子特征提取矩阵，包括：

获取一所述子初始特征矩阵作为目标子初始特征矩阵，并将所述目标子初始特征矩阵输入到所述卷积神经网络模型的卷积层中以获得所述目标子初始特征矩阵的子特征提取矩阵；

对所述目标子初始特征矩阵进行标记；

判断是否存在未标记的子初始特征矩阵；

若存在未标记的子初始特征矩阵，获取一未标记的子初始特征矩阵作为目标子初始特征矩阵，并返回所述将所述目标子初始特征矩阵输入到所述卷积神经网络模型的卷积层中以获得所述目标子初始特征矩阵的子特征提取矩阵的步骤。
根据权利要求3所述的方法，其中，所述对所述目标子初始特征矩阵进行标记，包括：

在所述目标子初始特征矩中添加预设的特征标记符。
根据权利要求4所述的方法，其中，所述判断是否存在未标记的子初始特征矩阵，包括：

判断是否所有的子初始特征矩阵中均包含预设的特征标记符；

若存在不包含预设的特征标记符的子初始特征矩阵，判定存在未标记的子初始特征矩阵。
根据权利要求5所述的方法，其中，所述判断是否存在未标记的子初始特征矩阵，还包括：

若所有的子初始特征矩阵中均包含预设的特征标记符，判定不存在未标记的子初始特征矩阵。
根据权利要求2所述的方法，其中，所述将各所述子初始特征矩阵的子特征提取矩阵进行叠加后获得总特征提取矩阵，包括：

根据各所述子初始特征矩阵在所述初始特征矩阵中的坐标位置将各所述子初始特征矩阵的子特征提取矩阵叠加为总特征提取矩阵。
根据权利要求7所述的方法，其中，所述子初始特征矩阵的子特征提取矩阵在所述总特征提取矩阵中的坐标位置与所述子初始特征矩阵在所述初始特征矩阵中的坐标位置相同。
根据权利要求1所述的方法，其中，在所述将预设的卷积神经网络模型的输入层输出的初始特征矩阵划分为多个子初始特征矩阵之前，所述方法还包括：

将待处理数据输入到卷积神经网络模型的输入层中以得到所述初始特征矩阵。
一种卷积神经网络模型优化装置，包括：

第一划分单元，用于将预设的卷积神经网络模型的输入层输出的初始特征矩阵划分为多个子初始特征矩阵；

第一输入单元，用于将各所述子初始特征矩阵逐一输入到所述卷积神经网络模型的卷积层中以获得各所述子初始特征矩阵的子特征提取矩阵；

第一叠加单元，用于将各所述子初始特征矩阵的子特征提取矩阵进行叠加后获得总特征提取矩阵；

第二输入单元，用于将所述总特征提取矩阵输入到所述卷积神经网络模型的下一层中以得到输出结果。
一种计算机设备，包括存储器以及与所述存储器相连的处理器；其中，所述存储器用于存储计算机程序；所述处理器用于运行所述存储器中存储的计算机程序，以执行如下步骤：

将预设的卷积神经网络模型的输入层输出的初始特征矩阵划分为多个子初始特征矩阵；

将各所述子初始特征矩阵逐一输入到所述卷积神经网络模型的卷积层中以获得各所述子初始特征矩阵的子特征提取矩阵；

将各所述子初始特征矩阵的子特征提取矩阵进行叠加后获得总特征提取矩阵；

将所述总特征提取矩阵输入到所述卷积神经网络模型的下一层中以得到输出结果。
根据权利要求11所述的计算机设备，其中，所述将预设的卷积神经网络模型的输入层输出的初始特征矩阵划分为多个子初始特征矩阵的步骤包括：

根据预设的行数阈值以及列数阈值将所述初始特征矩阵划分为多个子初始特征矩阵，其中，所述子初始特征矩阵的行数少于所述行数阈值，所述子初始特征矩阵的列数少于所述列数阈值；

记录各所述子初始特征矩阵在所述初始特征矩阵中的坐标位置。
根据权利要求11所述的计算机设备，其中，所述将各所述子初始特征矩阵逐一输入到所述卷积神经网络模型的卷积层中以获得各所述子初始特征矩阵的子特征提取矩阵的步骤包括：

获取一所述子初始特征矩阵作为目标子初始特征矩阵，并将所述目标子初始特征矩阵输入到所述卷积神经网络模型的卷积层中以获得所述目标子初始特征矩阵的子特征提取矩阵；

对所述目标子初始特征矩阵进行标记；

判断是否存在未标记的子初始特征矩阵；

若存在未标记的子初始特征矩阵，获取一未标记的子初始特征矩阵作为目标子初始特征矩阵，并返回所述将所述目标子初始特征矩阵输入到所述卷积神经网络模型的卷积层中以获得所述目标子初始特征矩阵的子特征提取矩阵的步骤。
根据权利要求13所述的计算机设备，其中，所述对所述目标子初始特征矩阵进行标记的步骤包括：

在所述目标子初始特征矩中添加预设的特征标记符。
根据权利要求14所述的计算机设备，其中，所述判断是否存在未标记的子初始特征矩阵的步骤包括：

判断是否所有的子初始特征矩阵中均包含预设的特征标记符；

若存在不包含预设的特征标记符的子初始特征矩阵，判定存在未标记的子初始特征矩阵。
根据权利要求15所述的计算机设备，其中，所述判断是否存在未标记的子初始特征矩阵的步骤还包括：

若所有的子初始特征矩阵中均包含预设的特征标记符，判定不存在未标记的子初始特征矩阵。
根据权利要求12所述的计算机设备，其中，所述将各所述子初始特征矩阵的子特征提取矩阵进行叠加后获得总特征提取矩阵的步骤，包括：

根据各所述子初始特征矩阵在所述初始特征矩阵中的坐标位置将各所述子初始特征矩阵的子特征提取矩阵叠加为总特征提取矩阵。
根据权利要求17所述的计算机设备，其中，所述子初始特征矩阵的子特征提取矩阵在所述总特征提取矩阵中的坐标位置与所述子初始特征矩阵在所述初始特征矩阵中的坐标位置相同。
根据权利要求11所述的计算机设备，其中，在所述将预设的卷积神经网络模型的输入层输出的初始特征矩阵划分为多个子初始特征矩阵之前，所述处理器还执行如下步骤：

将待处理数据输入到卷积神经网络模型的输入层中以得到所述初始特征矩阵。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其中，所述计算机程序被处理器执行时使所述处理器执行以下步骤：

将预设的卷积神经网络模型的输入层输出的初始特征矩阵划分为多个子初始特征矩阵；

将各所述子初始特征矩阵逐一输入到所述卷积神经网络模型的卷积层中以获得各所述子初始特征矩阵的子特征提取矩阵；

将各所述子初始特征矩阵的子特征提取矩阵进行叠加后获得总特征提取矩阵；

将所述总特征提取矩阵输入到所述卷积神经网络模型的下一层中以得到输出结果。