CN109063742B

CN109063742B - 蝴蝶识别网络构建方法、装置、计算机设备及存储介质

Info

Publication number: CN109063742B
Application number: CN201810735895.1A
Authority: CN
Inventors: 刘奡智; 夏子敏; 王健宗; 肖京
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-07-06
Filing date: 2018-07-06
Publication date: 2023-04-18
Anticipated expiration: 2038-07-06
Also published as: CN109063742A; WO2020006881A1

Abstract

本发明公开了一种蝴蝶识别网络构建方法、装置、计算机设备及存储介质，所述方法包括：将原始蝴蝶影像重采样处理后得到的用作训练的目标蝴蝶影像，若经过胶囊网络的卷积层的第一卷积计算、胶囊层的第二卷积计算得到的输出向量在损失函数层中计算得到的损失函数值不大于预设阈值，则将胶囊网络作为识别蝴蝶的训练网络，否则，通过反向传播更新胶囊网络中的每个胶囊神经元，得到更新后的胶囊网络，并将用作训练的目标蝴蝶影像重新在更新后的胶囊网络中，进行第一卷积计算、第二卷积计算和损失函数计算，直到损失函数值不大于损失阈值为止，实现了蝴蝶影像的多义性表达，即能分辨不同视角的同一蝴蝶种类，从而提高胶囊网络识别蝴蝶的准确率。

Description

蝴蝶识别网络构建方法、装置、计算机设备及存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种蝴蝶识别网络构建方法、装置、计算机设备及存储介质。

背景技术

近几年，随着人工智能的发展，深度学习在语音识别、自然语言处理以及图像与视频分析等诸多领域获得了巨大的成功。目前，深度学习是一种从端到端机器学习系统，深度学习方法中的卷积神经网络(convolutional neural network，CNN)模型在大规模图像识别任务中表现出色，与传统模式识别方法最大不同在于它从图像中能自动逐层提取特征，可以包含成千上万的参数，这些良好的特征表达在深度学习中起到至关重要的作用。

提高蝴蝶识别率对实际的生物研究有着很大的实际意义，例如通过蝴蝶识别可用作生物多样性的学习和物种的分析等。由于目前已有的影像数据库中存在的蝴蝶影像数量有限，蝴蝶种类少，蝴蝶影像的尺寸太小，不利于传统卷积神经网络对蝴蝶进行识别。因为传统卷积神经网络需要大量的训练影像，而且缺少观测位置和视角信息，即不能很好地处理图像的多义性表达。因为传统卷积神经网络无法根据同一种蝴蝶的不同视角去区分得到同一蝴蝶种类的分类结果，所以导致蝴蝶识别准确率低。

发明内容

本发明实施例提供一种蝴蝶识别网络构建的方法、装置、计算机设备及存储介质，以解决由于传统卷积神经网络将不同视角的同一类蝴蝶识别为不同种类的蝴蝶，而导致识别蝴蝶准确率低的问题。

一种蝴蝶识别网络构建方法，包括：

从预设的蝴蝶数据库中获取每种蝴蝶种类对应的原始蝴蝶影像；

对所述原始蝴蝶影像进行重采样处理，得到目标蝴蝶影像；

针对每种所述蝴蝶种类，将该蝴蝶种类中用作训练的所述目标蝴蝶影像输入到胶囊网络中，并经过所述胶囊网络的卷积层的第一卷积计算和所述胶囊网络的胶囊层的第二卷积计算，得到该蝴蝶种类的输出向量；

在所述胶囊网络中的损失函数层中，对每种所述蝴蝶种类的所述输出向量进行损失函数计算，得到每个所述输出向量的损失函数值；

当每个所述输出向量的所述损失函数值均小于或者等于预设的损失阈值时，将所述胶囊网络作为识别蝴蝶的训练网络；

当所述损失函数值大于所述预设的损失阈值时，通过反向传播更新所述胶囊网络中的每个胶囊神经元，得到更新后的所述胶囊网络，并将每种所述蝴蝶种类中用作训练的所述目标蝴蝶影像重新输入到更新后的所述胶囊网络中，进行所述第一卷积计算、所述第二卷积计算和所述损失函数计算，直到所述损失函数值小于或者等于所述预设的损失阈值为止，其中，所述胶囊神经元代表所述蝴蝶种类的属性。

一种蝴蝶识别网络构建装置，包括：

获取模块，用于从预设的蝴蝶数据库中获取每种蝴蝶种类对应的原始蝴蝶影像；

重采样模块，用于对所述原始蝴蝶影像进行重采样处理，得到目标蝴蝶影像；

卷积模块，用于针对每种所述蝴蝶种类，将该蝴蝶种类中用作训练的所述目标蝴蝶影像输入到胶囊网络中，并经过所述胶囊网络的卷积层的第一卷积计算和所述胶囊网络的胶囊层的第二卷积计算，得到该蝴蝶种类的输出向量；

计算损失模块，用于在所述胶囊网络中的损失函数层中，对每种所述蝴蝶种类的所述输出向量进行损失函数计算，得到每个所述输出向量的损失函数值；

训练模块，用于当每个所述输出向量的所述损失函数值均小于或者等于预设的损失阈值时，将所述胶囊网络作为识别蝴蝶的训练网络；

更新模块，用于当所述损失函数值大于所述预设的损失阈值时，通过反向传播更新所述胶囊网络中的每个胶囊神经元，得到更新后的所述胶囊网络，并将每种所述蝴蝶种类中用作训练的所述目标蝴蝶影像重新输入到更新后的所述胶囊网络中，进行所述第一卷积计算、所述第二卷积计算和所述损失函数计算，直到所述损失函数值小于或者等于所述预设的损失阈值为止，其中，所述胶囊神经元代表所述蝴蝶种类的属性。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述蝴蝶识别网络构建方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述蝴蝶识别网络构建方法的步骤。

上述蝴蝶识别网络构建方法、装置、计算机设备及存储介质，通过从预设的蝴蝶数据库中获取每种蝴蝶种类对应的原始蝴蝶影像，将原始蝴蝶影像重采样处理后得到目标蝴蝶影像；将该蝴蝶种类中用作训练的目标蝴蝶影像输入到胶囊网络中，并经过胶囊网络的卷积层的第一卷积计算和胶囊网络的胶囊层的第二卷积计算，得到该蝴蝶种类的输出向量经过损失函数计算得到损失函数值；当损失函数值大于预设值时，通过反向传播更新胶囊网络中的每个胶囊神经元，从而得到更新后的胶囊网络，将用作训练的目标蝴蝶影像输入到更新后的胶囊网络中进行第一卷积计算、第二卷积计算和损失函数计算，直到损失函数值小于或者等于损失阈值为止，实现了采用少量的目标蝴蝶影像处理了蝴蝶影像的多义性表达，也就是能分辨不同视角的同一蝴蝶种类，从而提高了胶囊网络识别蝴蝶的准确率。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中蝴蝶识别网络构建方法的一应用环境示意图；

图2是本发明一实施例中蝴蝶识别网络构建方法的实现流程图；

图3是本发明一实施例中蝴蝶识别网络构建方法中步骤S2的一实现流程图；

图4是本发明一实施例中蝴蝶识别网络构建方法中步骤S3的的一实现图；

图5是本发明一实施例中蝴蝶识别网络构建方法中测试识别蝴蝶的训练网络的一实现图；

图6是本发明一实施例中蝴蝶识别网络构建装置的一示意图；

图7是本发明一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请提供的蝴蝶识别网络构建方法，可应用在如图1的应用环境中，其中，服务端和客户端之间通过网络进行连接，服务端将目标蝴蝶影像在胶囊网络中执行第一卷积计算，第二卷积计算以及损失函数计算处理得到识别蝴蝶的训练网络，用户通过客户端修改胶囊网络的训练参数，客户端具体可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务端具体可以用独立的服务器或者多个服务器组成的服务器集群实现。

在一实施例中，如图2所示，提供一种蝴蝶识别网络构建方法，以该方法应用在图1中的服务器为例进行说明，包括如下步骤：

S1：从预设的蝴蝶数据库中获取每种蝴蝶种类对应的原始蝴蝶影像。

具体地，预设的蝴蝶数据库存储着现有的蝴蝶数据库中的所有原始蝴影像，预设的蝴蝶数据库包括但不限于Leeds(利兹)蝴蝶数据库、Ecuador(厄瓜多尔)蝴蝶数据库、以及Costarica(哥斯达黎加)蝴蝶数据库。另外，预设的蝴蝶数据库还可以采用Fine-Grained(细粒度)蝴蝶数据库，其中，Leeds(利兹)蝴蝶数据库包括636个蝴蝶种类对应的14270张原始蝴蝶影像、Ecuador(厄瓜多尔)蝴蝶数据库包括10个蝴蝶种类蝴蝶种类对应的832张原始蝴蝶影像、Costarica(哥斯达黎加)包括675个蝴蝶种类对应的2120张原始蝴蝶影像、Fine-Grained(细粒)蝴蝶数据库包括331个蝴蝶种类对应的3224张原始蝴蝶影像，此处蝴蝶数据库不做限制。

S2：对原始蝴蝶影像进行重采样处理，得到目标蝴蝶影像。

具体地，在图像领域中，重采样是对采样后形成的由离散数据组成的数字图像按照预设的像元位置或像元间距重新采样，以构成几何变换后的新图像。

对每张原始蝴蝶影像进行重采样处理，并将得到的目标蝴蝶影像分成两部分，其中，一部分目标蝴蝶影像用作训练胶囊网络的训练样本数据，另一部分目标蝴蝶影像用作测试识别蝴蝶的训练网络的测试样本数据。

进一步地，原始蝴蝶影像经过重采样处理后得到尺寸大小一致的目标蝴蝶影像，并且目标蝴蝶影像都携带对应的蝴蝶种类标记，利于后续训练或者测试识别蝴蝶的训练网络时得到的输出结果与原来输入的目标蝴蝶影像携带对应的蝴蝶种类标记进行比较，以便判断输出结果是否正确。

S3：针对每种蝴蝶种类，将该蝴蝶种类中用作训练的目标蝴蝶影像输入到胶囊网络中，并经过胶囊网络的卷积层的第一卷积计算和胶囊网络的胶囊层的第二卷积计算，得到该蝴蝶种类的输出向量。

具体地，胶囊网络由解析树组成。胶囊网络中的每一层神经元层的神经元将会被划分为多个神经元组，每一个神经元组称为胶囊(capsule)，解析树的每一个节点将对应于一个激活的胶囊(active capsule)。一个激活的胶囊中由多个激活的胶囊神经元组成，每个胶囊神经元包含了卷积核，卷积核是一种滤波器((filter))矩阵或者叫特征检测器(feature detector)，卷积核中的权值是属性的特征表达，也就是说胶囊神经元代表了某个蝴蝶种类的属性，其中，属性可是不同角度、位置以及方向等每种蝴蝶种类对应的不同视角。总而言之，识别蝴蝶的训练网络是通过不断修改胶囊神经元中的卷积核中的权值以及其他训练参数来提高识别蝴蝶的准确率，其中，其他训练参数包括耦合系数。

进一步地，针对每种蝴蝶种类，将用作训练的该蝴蝶种类的目标蝴蝶影像输入到胶囊网络中的卷积层中执行第一卷积计算。其中，第一卷积计算是将目标蝴蝶影像与卷积层中的卷积核计算，卷积核计算是指将卷积核中的每个位置上的元素值与目标蝴蝶图像上对应的点的元素值相乘累加，即两个矩阵间的点的元素值分别进行相乘叠加后，得到输出矩阵中的每一个元素的值，并将第一卷积计算得到的结果在胶囊网络的胶囊层中执行第二卷积计算，其中，第二卷积计算是将第一卷积计算得到的结果与激活的胶囊神经元进行卷积计算，得到该蝴蝶种类的输出向量。

需要说明的是，输出向量中的向量长度表示目标蝴蝶影像在胶囊网络中被识别为对应蝴蝶种类的概率，输出向量的向量方向表示蝴蝶种类的属性，例如蝴蝶的不同视角。

S4：在胶囊网络中的损失函数层中，对每种蝴蝶种类的输出向量进行损失函数计算，得到每个输出向量的损失函数值。

具体地，损失函数(loss function)是描述训练模型在不同参数(parameter)值之下的损失，用来估量训练模型的预测值与真实值的不一致程度。对每种蝴蝶种类的输出向量执行损失函数计算，得到输出向量的损失函数值是一个非负函数值。根据损失函数值的大小，调整识别蝴蝶的训练网络的训练参数，能使损失函数值变小，损失函数值越小，识别蝴蝶的训练网络的鲁棒性越好，其中，训练参数包括卷积核中的权值。

S5：当每个输出向量的损失函数值均小于或者等于预设的损失阈值时，将胶囊网络作为识别蝴蝶的训练网络。

具体地，根据步骤S4中得到每个输出向量的的损失函数值均小于或者等于预设的损失阈值时，即此时的识别蝴蝶的训练网络的鲁棒性达到了预期的识别蝴蝶的效果，将当前的胶囊网络作为最终识别蝴蝶的训练网络。其中，预设的损失阈值可以是0.3或者是0至1的小数。

S6：当损失函数值大于预设的损失阈值时，通过反向传播更新胶囊网络中的每个胶囊神经元，得到更新后的胶囊网络，并将每种蝴蝶种类中用作训练的目标蝴蝶影像重新输入到更新后的胶囊网络中，进行第一卷积计算、第二卷积计算和损失函数计算，直到损失函数值小于或者等于预设的损失阈值为止，其中，胶囊神经元代表蝴蝶种类的属性。

具体地，当根据步骤S4中得到的损失函数值大于损失阈值时，通过反向传播更新胶囊网络中的每个胶囊神经元，其中，反向传播是通过逐层求出损失函数对各神经元权值的偏导数，从而得到损失函数对输出向量的梯量，将梯量作为修改每个胶囊神经元中的的权值的依据，使开发人员根据梯量调整胶囊网络中的各个胶囊神经元的权值，从而更新了胶囊网络，并将每种蝴蝶种类中用作训练的目标蝴蝶影像重新输入到更新后的胶囊网络中，并继续执行步骤S3，直到损失函数值小于或者等于损失阈值为止，其中，胶囊神经元代表蝴蝶种类的属性包括每个蝴蝶种类对应的不同视角。

本实施例中，通过从预设的蝴蝶数据库中获取每种蝴蝶种类对应的原始蝴蝶影像，将原始蝴蝶影像重采样处理后得到目标蝴蝶影像；将该蝴蝶种类中用作训练的目标蝴蝶影像输入到胶囊网络中，并经过胶囊网络的卷积层的第一卷积计算和胶囊网络的胶囊层的第二卷积计算，得到该蝴蝶种类的输出向量经过损失函数计算得到损失函数值；当损失函数值大于预设值时，通过反向传播更新胶囊网络中的每个胶囊神经元，从而得到更新后的胶囊网络，将用作训练的目标蝴蝶影像输入到更新后的胶囊网络中进行第一卷积计算、第二卷积计算和损失函数计算，直到损失函数值小于或者等于损失阈值为止，实现了采用少量的目标蝴蝶影像处理了蝴蝶影像的多义性表达，也就是将目标蝴蝶影像与胶囊网络中表示蝴蝶种类的属性的每个胶囊神经元进行训练处理得到的损失值满足损失阈值时，即无论输入的目标蝴蝶影像的实际属性是否为不同视角，最终得到该目标蝴蝶影像的分类结果对应的蝴蝶种类，从而实现了能分辨不同视角的同一蝴蝶种类，从而提高了胶囊网络识别蝴蝶的准确率。

在一实施例中，如图3所示，步骤S2中，即原始蝴蝶影像进行重采样处理，得到目标蝴蝶影像，具体包括如下步骤：

S21：根据预设的目标尺寸确定原始蝴蝶影像的缩放比例。

具体地，根据预设的目标尺寸确定原始蝴蝶影像的缩放比例，使得获取得到的目标蝴蝶影像具有相同的尺寸，利于胶囊网路对蝴蝶种类的识别，减少因尺寸不一致带来的干扰因素，同时防止过拟合。

例如，将所有原始蝴蝶影像全部重采样得到尺寸为32×32×3的大小，其中，沿行方向32像素，沿列方向32像素，3指RGB三个通道。当一个原始蝴蝶影像为64×64×3时，得到的缩放比例为

也就是将该原始蝴蝶影像缩小两倍尺寸大小。

具体地，通道用于表示图像的某种组成。例如，一个标准数字相机拍摄的图像会有三通道——红、绿和蓝，把它们看作是互相堆叠在一起的二维矩阵，每一个通道代表一个颜色，每个通道的像素值在0到255的范围内。

S22：按照缩放比例，获取对原始蝴蝶影像的原始像素点进行划分，得到目标蝴蝶影像的每个目标像素点在原始蝴蝶影像中对应的原始像素点的集合，并建立每个原始像素点的集合与所述目标蝴蝶影像的每个像素点之间的对应关系。

具体地，继续引用步骤S21中的例子，从目标影像出发，按照缩放比例2，获取对原始蝴蝶影像的原始像素点进行划分，得到目标蝴蝶影像的每个目标像素点在原始蝴蝶影像中对应的原始像素点的集合，并建立每个原始像素点的集合与所述目标蝴蝶影像的每个像素点之间的对应关系，例如，目标影像的左上角第一个像素，对应的是原始蝴蝶影像的左上角为2×2＝4个像素，即这4个像素为原始像素点的集合。

S23：计算原始像素点的集合中的每个原始像素点的平均RGB值，并根据对应关系，将该平均RGB值作为原始像素点的集合对应的目标像素点的RGB值。

具体地，根据步骤S22获取的原始像素点的集合，将每个原始像素点的RGB值进行累加求平均得到的平均RGB值，并根据原始像素点与目标蝴蝶影像的每个像素点的对应关系，将平均RGB值作为原始像素点的集合对应的目标像素点的RGB值，其中，平均RGB值为正整数。例如，继续引用步骤S22的例子，若4个像素的RGB值为{215,0,64,0}得平均RGB值为

在本实施例中，根据预设的目标尺寸确定原始蝴蝶影像的缩放比例，获取目标蝴蝶影像的每个目标像素点在原始蝴蝶影像中对应的原始像素点的集合，并计算原始像素点的集合中的每个原始像素点的平均RGB值，并将该平均RGB值作为原始像素点的集合对应的目标像素点的RGB值，实现了将所有不同尺寸的原始蝴蝶影像缩放到统一标准尺寸的目标蝴蝶影像，有利于后续对胶囊网络提供良好的训练样本数据，同时避免了因原始蝴蝶影像的尺寸不同引起的过拟合问题。

在一实施例中，如图4所示，步骤S3中，即针对每种所述蝴蝶种类，将该蝴蝶种类中用作训练的所述目标蝴蝶影像输入到胶囊网络中，并经过所述胶囊网络的卷积层的第一卷积计算和所述胶囊网络的胶囊层的第二卷积计算，得到该蝴蝶种类的输出向量，具体包括如下步骤：

S31：将输入到蝴蝶种类中用作训练的目标蝴蝶影像在胶囊网络的卷积层中执行第一卷积计算，得到特征向量。

具体地，将蝴蝶种类中用作训练的目标蝴蝶影像输入到胶囊网络的卷积层，并将该目标蝴蝶影像与卷积层中每个胶囊神经元的卷积核执行第一卷积计算，第一卷积计算是将卷积核中的每个位置上的元素值与目标蝴蝶图像上对应的点的元素值相乘叠加，得到的特征向量叫做卷积特征(Convolved Feature)或者特征图(Feature Map)。例如，深度为256，卷积窗口大小为9*9，即构建了256个9*9矩阵的卷积核。

需要说明的是，当第一卷积计算过程中出现越界问题时，使用0补充，也叫零填充(Zero-padding)。在目标蝴蝶图像的边缘使用零值进行填充，可以对输入目标蝴蝶图像的边缘进行滤波，方便控制特征图的大小。

S32：将特征向量代入到修正线性激活函数中，得到局部特征向量。

具体地，修正线性激活函数，即ReLU(Rectified linear unit)激活函数，是一种神经元的激活函数，也是一种分段线性函数，能将特征图中的所有小于0的像素值设置为零，而使其他像素值为正值的值不变，这种操作被称为单侧抑制，从而实现了在稀疏后的胶囊网络中能够更好地挖掘相关特征，避免过拟合。

进一步地，将特征向量代入到修正线性激活函数中，也就是将特征图的像素灰度值转化为局部特征的激活值。

S33：通过使用迭代路由处理方式，将局部特征向量与胶囊网络的胶囊层中的每个胶囊神经元进行第二卷积计算，得到蝴蝶种类的输出向量。

具体地，在本实施例中的胶囊网络的胶囊层是一个32通道(channels)的胶囊(capsule)，每个胶囊(capsule)均包含8个胶囊神经元，每个胶囊神经元包括9×9的卷积核，并且步长(stride)为2。第二卷积计算是指将每个胶囊神经元与卷积层的所有局部特征向量进行卷积计算，并通过采用迭代路由处理方式，最终由32×32×n个胶囊输出，每个胶囊为8维的输出向量，即每个胶囊实质输出的是一组输出向量。

进一步地，迭代路由处理方式(iterative dynamic routing process)通过公式(1)至公式(4)可求得输出向量，该输出向量代表了不同视角的每种蝴蝶种类出现的概率大小，具体包括：

其中，b_ij指第i个胶囊神经元和第j个胶囊神经元之间的softmax(柔性最大)激活函数，softmax激活函数是一种将多维向量的每一个值都映射成(0，1)区间的函数，在此处用于分类，c_ij为耦合系数，

为局部特征向量，W_ij为权矩阵，S_j是所有局部特征向量

的加权和，V_j是第j个胶囊神经元的输出向量。

c_ij是由迭代路由处理决定的耦合系数，Capsule与上一层的capsules之间的耦合系数和为1。该系数和其他权值一同在训练中决定，取决于两个capsules的位置和种类。迭代路由处理初始化时，胶囊层中的每个胶囊神经元对卷积层中的每个胶囊神经元都有相同的耦合系数；胶囊层中的每个胶囊神经元对每一个可能的父节点计算局部特征向量并作为父节点的输入，如果这个局部特征向量和某一个父节点的输出向量的内积很大，那么会通过一个自顶向下的反馈增大这个父节点的耦合系数，同时减小其他父节点的耦合系数，达到动态选择的结果。另外，一个胶囊神经元的所有的耦合系数的和为1。

需要说明的是，低级别的胶囊神经元倾向于向与高级别的胶囊神经元，即耦合系数高表示对蝴蝶种类的局部特征的预测倾向大，耦合系数低表示对蝴蝶种类的局部特征预测倾向小。假设胶囊神经元i对胶囊神经元j的的耦合系数c_ij为1，由于胶囊神经元i的所有耦合系数和为1，那么该胶囊神经元i对其他胶囊神经元的耦合系数为0了，也就是说，胶囊神经元i的所有局部特征向量都只传入到胶囊神经元j。

进一步地，由于向量长度代表了每种蝴蝶种类出现的概率大小，即V_j是一个概率值，因此利用一个非线性“挤压”函数来保证将短的输出向量“压缩”成长度接近0、将长的向量“压缩”成长度接近1的值。

在本实施例中，将输入到蝴蝶种类中用作训练的目标蝴蝶影像在在胶囊网络的卷积层中执行第一卷积计算，得到的特征向量代入到修正线性激活函数中，得到局部特征向量；通过使用迭代路由处理方式，将局部特征向量与胶囊网络的胶囊层中的每个胶囊神经元进行第二卷积计算，得到输出向量，利用迭代路由处理方式使得对蝴蝶种类的局部特征的预测倾向更加明显，实现了目标蝴蝶影像的泛化，例如泛化包括似度、方向以及大小等视角信息，从而提高了对同一蝴蝶种类的不同蝴蝶视角的分辨能力。

进一步地，在一实施例中，对步骤S4中提及的在胶囊网络中的损失函数层中，对每种蝴蝶种类的输出向量进行损失函数计算，得到输出向量的损失函数值的具体实现过程详述如下：

将每一个输出向量在胶囊网络中的损失函数层中，按照公式(5)计算输出向量的损失函数值：

L_c＝T_cmax(0,m⁺-||V_c||)²+λ(1-T_c)max(0,||V_c||-m^-)² (5)

其中，c为蝴蝶种类，L_c为损失函数值，T_c为蝴蝶种类的指示函数，max(0,m⁺-||V_c||)²为取0和m⁺-||V_c||两个数值中的最大值的平方，max(0,||V_c||-m^-)²为取0和||V_c||-m^-两个数值中的最大值的平方，m⁺为预设的向量长度上边界，||V_c||为输出向量V_c的向量长度，λ为预设参数值，m^-为预设的向量长度下边界。

具体地，指示函数又称为特征函数，在本实施例中指示函数是将每个蝴蝶种类各自定义为一个集合，集合中包括蝴蝶种类的各个属性的子集，当蝴蝶种类对应的的目标蝴蝶影像属于该集合中的某一个子集，子集可以是蝴蝶种类的某个属性。

进一步地，若指示函数判断输出向量与实际的目标蝴蝶影像一样时，则输出为1，否则为0，例如，用一个列向量的总长度标识为蝴蝶种类的总数，列向量的元素为1的位置代表该位置对应的蝴蝶种类的分类结果，列向量中的0代表不是该蝴蝶种类。当输出向量属于某个子集，并且该子集属于某个蝴蝶种类的集合时，则在该种类对应的列项量为1，然而在实际分类中，列向量中的值是对应的蝴蝶种类的概率大小。例如，胶囊的输出向量||V_c||的长度对应于它属于第c种蝴蝶种类的概率。

在本发明实施例中，通过将每一个输出向量在胶囊网络中的损失函数层计算得到损失函数值，根据损失函数值的大小来衡量胶囊网络对蝴蝶种类的预测效果好坏，有利于进一步调整胶囊网络中的参数。

在一实施例中，如图5所示，步骤S6之后，该蝴蝶识别网络构建方法还包括如下步骤：

S7：将用作测试的目标蝴蝶影像输入到识别蝴蝶的训练网络中，并通过第一卷积计算、第二卷积计算以及损失函数计算，得到测试输出向量的损失函数值。

具体地，将用作测试的目标蝴蝶影像，也就是将测试样本数据输入到由步骤S1至步骤S5中得到的识别蝴蝶的训练网络中，并根据步骤S3，通过第一卷积计算、第二卷积计算以及损失函数计算，输出测试输出向量的损失函数值。

S8：取大于或者等于预设的向量长度上边界的损失函数值对应的测试输出向量，并通过解码器网络将测试输出向量进行重构，得到输出图像，并将输出图像与用作测试的目标蝴蝶影像进行比较，得到识别蝴蝶的训练网络的准确率。

具体地，获取大于或者等于预设的向量长度上边界的损失函数值对应的测试输出向量，例如，若存在第c类蝴蝶种类，规定预设的向量长度为0.9，则第c类蝴蝶种类的输出一个向量长度至少为0.9的输出向量时，才能表示该输出向量对应的目标蝴蝶影像属于第c类蝴蝶种类，其中，0.9表示向量长度上边界。

进一步地，将测试输出向量通过解码器网络进行重构，解码器网络由3个全连接层组成，通过解码器网络重构得到输出图像。重构是指将测试输出向量重新构建出与该测试输出向量对应的实际图像，从而构建一个完整的输出图像。根据重构的方式，将所有测试输出向量通过解码器网络得到输出图像，并采用图像比较方式，筛选出与用作测试的目标蝴蝶影像相同的输出图像，其中，图像比较方式包括但不限于感知哈希算法、灰度直方图相似比较法或者PSNR(峰值信噪比)方法，并计算筛选出的与用作测试的目标蝴蝶影像相同的输出图像的总数与用作测试的目标蝴蝶影像的总量的占比值，该占比值就是就是识别蝴蝶的训练网络的准确率，若得到的准确率小于预设的准确率，则说明识别蝴蝶的训练网络的识别效果不佳，需要进一步改进该识别蝴蝶的训练网络，否则，无需对识别蝴蝶的训练网络进行调整。其中，预设的准确率可以设置为95％或者95％以上的百分比值。

在本实施例中，将用作测试的目标蝴蝶影像输入到识别蝴蝶的训练网络中进行测试，并取得大于或者等于向量长度上边界的损失函数值对应的测试输出向量，通过解码器网络将该测试输出向量进行重构，得到输出图像，进而得到识别蝴蝶的训练网络的准确率，通过准确率能直观地判断该识别蝴蝶的训练网络对蝴蝶种类的识别效果，根据识别效果决定是否对识别蝴蝶的训练网络做进一步的改进。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

在一实施例中，提供一种蝴蝶识别网络构建的装置，该蝴蝶识别网络构建装置与上述实施例中蝴蝶识别网络构建方法一一对应。如图6所示，该蝴蝶识别网络构建装置包括获取模块61、重采样模块62、卷积模块63、计算模块64、训练模块65和更新模块66。各功能模块详细说明如下：

获取模块61，用于从预设的蝴蝶数据库中获取每种蝴蝶种类对应的原始蝴蝶影像；

重采样模块62，用于对原始蝴蝶影像进行重采样处理，得到目标蝴蝶影像；

卷积模块63，用于针对每种蝴蝶种类，将该蝴蝶种类中用作训练的目标蝴蝶影像输入到胶囊网络中，并经过胶囊网络的卷积层的第一卷积计算和胶囊网络的胶囊层的第二卷积计算，得到该蝴蝶种类的输出向量；

计算损失模块64，用于在胶囊网络中的损失函数层中，对每种蝴蝶种类的输出向量进行损失函数计算，得到每个输出向量的损失函数值；

训练模块65，用于当每个输出向量的损失函数值均小于或者等于预设的损失阈值时，将胶囊网络作为识别蝴蝶的训练网络；

更新模块66，用于当损失函数值大于预设的损失阈值时，通过反向传播更新胶囊网络中的每个胶囊神经元，得到更新后的胶囊网络，并将每种蝴蝶种类中用作训练的目标蝴蝶影像重新输入到更新后的胶囊网络中，进行第一卷积计算、第二卷积计算和损失函数计算，直到损失函数值小于或者等于预设的损失阈值为止，其中，胶囊神经元代表蝴蝶种类的属性。

进一步地，重采样模块62包括：

缩放单元621，用于根据预设的目标尺寸确定原始蝴蝶影像的缩放比例；

获取单元622，用于按照缩放比例，获取对原始蝴蝶影像的原始像素点进行划分，得到目标蝴蝶影像的每个目标像素点在原始蝴蝶影像中对应的原始像素点的集合，并建立每个原始像素点的集合与所述目标蝴蝶影像的每个像素点之间的对应关系；

计算单元623，用于计算原始像素点的集合中的每个原始像素点的平均RGB值，并根据对应关系，将该平均RGB值作为原始像素点的集合对应的目标像素点的RGB值。

进一步地，卷积模块63包括：

第一卷积单元631，用于将输入到蝴蝶种类中用作训练的目标蝴蝶影像在胶囊网络的卷积层中执行第一卷积计算，得到特征向量；

激活单元632，用于将特征向量代入到修正线性激活函数中，得到局部特征向量；

第二卷积单元633，用于通过使用迭代路由处理方式，将局部特征向量与胶囊网络的胶囊层中的每个胶囊神经元进行第二卷积计算，得到蝴蝶种类的输出向量。

进一步地，计算损失模块64包括：

公式单元641，用于将每一个输出向量在胶囊网络中的损失函数层中，按照公式(6)计算输出向量的损失函数值：

L_c＝T_cmax(0,m⁺-||V_c||)²+λ(1-T_c)max(0,||V_c||-m^-)²公式(6)

其中，c为蝴蝶种类，L_c为损失函数值，T_c为蝴蝶种类的指示函数，max(0,m⁺-||V_c||)²为取0和m⁺-||V_c||两个数值中的最大值的平方，max(0,‖V_c‖-m^-)²为取0和‖V_c‖-m^-两个数值中的最大值的平方，m⁺为预设的向量长度上边界，||V_c‖为输出向量V_c的向量长度，λ为预设参数值，m^-为预设的向量长度下边界。

进一步地，蝴蝶识别网络构建装置还包括：

测试计算模块67，用于将用作测试的目标蝴蝶影像输入到识别蝴蝶的训练网络中，并通过第一卷积计算、第二卷积计算以及损失函数计算，得到测试输出向量的损失函数值；

重构模块68，用于取大于或者等于预设的向量长度上边界的损失函数值对应的测试输出向量，并通过解码器网络将测试输出向量进行重构，得到输出图像，并将输出图像与用作测试的目标蝴蝶影像进行比较，得到识别蝴蝶的训练网络的准确率。

关于蝴蝶识别网络构建装置的具体限定可以参见上文中对于蝴蝶识别网络构建方法的限定，在此不再赘述。上述蝴蝶识别网络构建装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储原始蝴蝶影像。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种蝴蝶识别网络构建方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述实施例蝴蝶识别网络构建方法的步骤，例如图2所示的步骤S1至步骤S6或者，处理器执行计算机程序时实现上述实施例中蝴蝶识别网络构建装置的各模块/单元的功能，例如图6所示模块61至模块66功能。为避免重复，这里不再赘述。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述方法实施例中蝴蝶识别网络构建方法，或者，该计算机程序被处理器执行时实现上述装置实施例中蝴蝶识别网络构建装置中各模块/单元的功能。为避免重复，这里不再赘述。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种蝴蝶识别网络构建方法，其特征在于，包括：

对所述原始蝴蝶影像进行重采样处理，得到目标蝴蝶影像；

2.如权利要求1所述的蝴蝶识别网络构建方法，其特征在于，所述对所述原始蝴蝶影像进行重采样处理，得到目标蝴蝶影像包括：

根据预设的目标尺寸确定所述原始蝴蝶影像的缩放比例；

按照所述缩放比例对所述原始蝴蝶影像的原始像素点进行划分，得到目标蝴蝶影像的每个目标像素点在所述原始蝴蝶影像中对应的原始像素点的集合，并建立每个所述原始像素点的集合与所述目标蝴蝶影像的每个像素点之间的对应关系；

计算所述原始像素点的集合中的每个所述原始像素点的平均RGB值，并根据所述对应关系，将该平均RGB值作为所述原始像素点的集合对应的所述目标像素点的RGB值。

3.如权利要求1所述的蝴蝶识别网络构建的方法，其特征在于，所述针对每种所述蝴蝶种类，将该蝴蝶种类中用作训练的所述目标蝴蝶影像输入到胶囊网络中，并经过所述胶囊网络的卷积层的第一卷积计算和所述胶囊网络的胶囊层的第二卷积计算，得到该蝴蝶种类的输出向量包括：

将输入到所述蝴蝶种类中用作训练的所述目标蝴蝶影像在所述胶囊网络的所述卷积层中执行所述第一卷积计算，得到特征向量；

将所述特征向量代入到修正线性激活函数中，得到局部特征向量；

通过使用迭代路由处理方式，将所述局部特征向量与所述胶囊网络的所述胶囊层中的每个所述胶囊神经元进行所述第二卷积计算，得到所述蝴蝶种类的输出向量。

4.如权利要求1所述的蝴蝶识别网络构建方法，其特征在于，所述在所述胶囊网络中的损失函数层中，对每种所述蝴蝶种类的所述输出向量进行损失函数计算，得到每个所述输出向量的损失函数值包括：

将每一个所述输出向量在所述胶囊网络中的损失函数层中，按照如下公式计算所述输出向量的所述损失函数值：

L_c＝T_cmax(0,m⁺-||V_c||)²+λ(1-T_c)max(0,||V_c||-m^-)²

其中，c为所述蝴蝶种类，L_c为所述损失函数值，T_c为所述蝴蝶种类的指示函数，max(0,m⁺-||V_c||)²为取0和m⁺-||V_c||两个数值中的最大值的平方，max(0,||V_c||-m^-)²为取0和||V_c||-m^-两个数值中的最大值的平方，m⁺为预设的向量长度上边界，||V_c||为所述输出向量V_c的所述向量长度，λ为预设参数值，m^-为预设的向量长度下边界。

5.如权利要求4所述的蝴蝶识别网络构建方法，其特征在于，所述当每个所述输出向量的所述损失函数值均小于或者等于预设的损失阈值时，将所述胶囊网络作为识别蝴蝶的训练网络之后，所述方法还包括：

将用作测试的所述目标蝴蝶影像输入到所述识别蝴蝶的训练网络中，并通过所述第一卷积计算、所述第二卷积计算以及所述损失函数计算，得到测试输出向量的所述损失函数值；

取大于或者等于所述预设的向量长度上边界的所述损失函数值对应的所述测试输出向量，并通过解码器网络将所述测试输出向量进行重构，得到输出图像，并将所述输出图像与所述用作测试的所述目标蝴蝶影像进行比较，得到所述识别蝴蝶的训练网络的准确率。

6.一种蝴蝶识别网络构建装置，其特征在于，所述蝴蝶识别网络构建装置包括：

7.如权利要求6所述的蝴蝶识别网络构建装置，其特征在于，所述重采样模块包括：

缩放单元，用于根据预设的目标尺寸确定所述原始蝴蝶影像的缩放比例；

获取单元，用于按照所述缩放比例，获取对所述原始蝴蝶影像的原始像素点进行划分，得到目标蝴蝶影像的每个目标像素点在所述原始蝴蝶影像中对应的原始像素点的集合，并建立每个所述原始像素点的集合与所述目标蝴蝶影像的每个像素点之间的对应关系；

计算单元，用于计算所述原始像素点的集合中的每个所述原始像素点的平均RGB值，并根据所述对应关系，将该平均RGB值作为所述原始像素点的集合对应的所述目标像素点的RGB值。

8.如权利要求6所述的蝴蝶识别网络构建装置，其特征在于，所述卷积模块包括：

第一卷积单元，用于将输入到所述蝴蝶种类中用作训练的所述目标蝴蝶影像在所述胶囊网络的所述卷积层中执行所述第一卷积计算，得到特征向量；

激活单元，用于将所述特征向量代入到修正线性激活函数中，得到局部特征向量；

第二卷积单元，用于通过使用迭代路由处理方式，将所述局部特征向量与所述胶囊网络的所述胶囊层中的每个所述胶囊神经元进行所述第二卷积计算，得到所述蝴蝶种类的输出向量。

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述蝴蝶识别网络构建方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述蝴蝶识别网络构建方法的步骤。