CN108805137A

CN108805137A - 牲畜特征向量的提取方法、装置、计算机设备和存储介质

Info

Publication number: CN108805137A
Application number: CN201810344668.6A
Authority: CN
Inventors: 刘奡智; 王健宗; 肖京
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-04-17
Filing date: 2018-04-17
Publication date: 2018-11-13
Also published as: WO2019200735A1

Abstract

本申请揭示了一种牲畜特征向量的提取方法、装置、计算机设备和存储介质，其中牲畜特征向量的提取方法包括：获取基于指定图片样本、以及所述图片样本对应的特征向量训练完成的第一CNN模型；冻结所述第一CNN模型的指定层的权重参数；将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量。本申请基于迁移学习的理念，利用已经训练过的第一CNN模型，结合fine‑tune方法，在识别牲畜过程中，只需要对第一CNN模型的最后几层进行处理，其它层的权重参数可以冻结，即，识别牲畜图片的过程中，第一CNN模型被冻结的层不需要参与处理的过程，进而大大地提高了牲畜图片识别的速度。

Description

牲畜特征向量的提取方法、装置、计算机设备和存储介质

技术领域

本申请涉及到牲畜识别领域，特别是涉及到一种牲畜特征向量的提取方法、装置、计算机设备和存储介质。

背景技术

在牲畜保险业务中，养殖户往往利用没有成熟的识别牲畜的技术，而使用未投保的牲畜作为已投保的牲畜进行骗保，保险公司的保险风险较大。而区别报险牲畜是否为投保牲畜，可以通过图像进行区分，因此，在投保时拍摄一组照片，报险时拍摄一组照片，然后对两组照片进行比对，以判定当前的报险牲畜是否为投保的牲畜。

由于养殖户在投保过程中要对大批量的牲畜进行拍照识别，以得到对应投保牲畜的特征向量，方便在报险时对病死牲畜的识别，判断病死牲畜是否为投保牲畜。因为需要大批量地识别牲畜，所以需要一种可以提高识别牲畜速度的方法。

发明内容

本申请的主要目的为提供一种快速识别牲畜的牲畜特征向量的提取方法、装置、计算机设备和存储介质。

为了实现本申请提出的目的，本申请提出一种牲畜特征向量的提取方法，包括：

获取基于指定图片样本、以及所述图片样本对应的特征向量训练完成的第一CNN模型；

冻结所述第一CNN模型中指定层的权重参数；

将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量。

进一步对，所述第一CNN模型包括VGG19模型，所述冻结所述第一CNN模型中指定层的权重参数的步骤，包括：

冻结所述第一CNN模型中前十八层的权重参数。

进一步地，所述将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量的步骤之前，包括：

获取所述第一CNN模型最后一层的节点数量，根据所述节点数量生成最大输入所述待识别的牲畜图片数量的提醒信息。

进一步地，所述将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量的步骤之后，包括：

对所述待识别的牲畜图片对应的特征向量进行softmax归一化处理。

将所述第一CNN模型中未冻结的各层神经网络的权重参数重置为0。

进一步地，所述获取基于指定图片样本、以及所述图片样本对应的特征向量训练完成的第一CNN模型的步骤之前，包括：

获取指定区域养殖户的名单，并根据名单分配待识别单一牲畜种类的脸部图片采集任务给各养殖户；

收集养殖户反馈的图片，并存储到指定的存储空间内形成所述图片样本；

将所述图片样本分成训练集和测试集，基于指定的第二CNN模型进行训练，得到训练完成的所述第一CNN模型。

进一步地，所述将所述图片样本分成训练集和测试集，基于指定的第二CNN模型进行训练，得到训练完成的所述第一CNN模型的步骤之前，包括：

判断所述图片样本的数量是否达到预设值；

若达到，则停止发送图片获取任务。

本申请还提供一种牲畜特征向量的提取装置，包括：

获取单元，用于获取基于指定图片样本、以及所述图片样本对应的特征向量训练完成的第一CNN模型；

冻结单元，用于冻结所述第一CNN模型中指定层的权重参数；

处理单元，用于将待识别的牲畜图片输入到所述CNN模型中进行处理，所述待识别的牲畜图片对应的特征向量。

本申请还提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本申请还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

本申请的牲畜特征向量的提取方法、装置、计算机设备和存储介质，基于迁移学习的理念，利用已经训练过的第一CNN模型，结合fine-tune方法(所谓fine-tune就是用已经训练好的模型，加上我们自己的数据，来训练新的模型，相当于使用已经训练好的的模型的前几层，来提取浅层特征，最后再落入新数据集的分类中)，在识别牲畜过程中，只需要对第一CNN模型的最后几层进行处理，其它层的权重参数可以冻结，即，识别牲畜图片的过程中，第一CNN模型被冻结的层不需要参与处理的过程，进而大大地提高了牲畜图片识别的速度。

附图说明

图1为本申请一实施例的牲畜特征向量的提取方法的流程示意图；

图2为本申请一实施例的牲畜特征向量的提取方法的流程示意图；

图3为本申请一实施例的牲畜特征向量的提取方法的流程示意图；

图4为本申请一实施例的牲畜特征向量的提取装置的结构示意框图；

图5为本申请一实施例的牲畜特征向量的提取装置的结构示意框图；

图6为本申请一实施例的牲畜特征向量的提取装置的结构示意框图；

图7为本申请一实施例的牲畜特征向量的提取装置的结构示意框图；

图8为本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

参照图1，本申请实施例提供一种牲畜特征向量的提取方法，包括步骤：

S1、获取基于指定图片样本、以及所述图片样本对应的特征向量训练完成的第一CNN模型；

S2、冻结所述第一CNN模型中指定层的权重参数；

S3、将待识别的牲畜图片输入到所述CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量。

如上述步骤S1所述，CNN(Convolutional Neural Network，卷积神经网络)模型的基本结构包括两层，其一为特征提取层，每个神经元的输入与前一层的局部接受域相连，并提取该局部的特征。一旦该局部特征被提取后，它与其它特征间的位置关系也随之确定下来；其二是特征映射层，网络的每个计算层由多个特征映射组成，每个特征映射是一个平面，平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数(Sigmoid函数是一个在生物学中常见的S型的函数，也称为S型生长曲线。在信息科学中，由于其单增以及反函数单增等性质，Sigmoid函数常被用作神经网络的阈值函数，将变量映射到0,1之间)作为卷积网络的激活函数，使得特征映射具有位移不变性。此外，由于一个映射面上的神经元共享权值，因而减少了网络自由参数的个数。卷积神经网络中的每一个卷积层都紧跟着一个用来求局部平均与二次提取的计算层，这种特有的两次特征提取结构减小了特征分辨率。上述第一CNN模型是一种训练好的模型，即，无需重新通过图片样本进行训练，而是拿来主义，将其它领域或场景下训练完成的CNN模型拿过来直接使用。本实施例中，上述第一CNN模型包括VGG19模型、VGG16模型、VGG-F模型、ResNet50模型、ResNet152模型、DPN131模型、InceptionV3模型、Xception模型、DenseNet模型和AlexNet模型中的一种。

如上述步骤S2所述，第一CNN模型中包括多层(例如，卷基层和全连接层)，根据预设规则，可以将其中至少一个层作为指定层(不包括最后一层)，并冻结指定层的权重参数。

在一种可能的实施方式中，由于第一CNN模型中的多个卷基层和多个全连接层存在先后顺序，可以按照各层之间的先后顺序，将排序前N的卷基层或/和全连接层作为指定层，其中N为大于1小于第一CNN模型总层数的正整数，且N为预设值。也就是说，将第一CNN模型的前指定层数的权重参数冻结，即，被冻结的权重参数，在之后对待识别的牲畜图片进行处理时，不会进行改变。在一具体实施例中，上述第一CNN模型是ImageNet的使用VGG19训练后得到模型。上述ImageNet是一个计算机视觉系统识别项目名称，是目前世界上图像识别最大的数据库，是美国斯坦福的计算机科学家，模拟人类的识别系统建立的，其中包含120万张图片，分别包含1000种类别的图片，其中的动物，比如猫，狗，牛等牲畜的图片数量巨大。本实施例中，上述VGG19模型一共包括19层神经网络层，其中，其前16层为卷积层，最后三层为全连接层。在一具体实施例中，冻结前16层卷积层和前2层全连接层的权重参数，即冻结VGG19模型的前十八层的权重参数。

如上述步骤S3所述，上述待识别的牲畜图片是指养殖户等按照一定要求拍摄的图片，比如，牲畜为猪，通常会拍摄猪的正面照或侧面照等含有猪的特征较多的照片，而不会拍摄猪的局部照片，比如只拍摄肚子的照片等。将待识别的牲畜图片输入到第一CNN模型中进行处理，由于其指定层数的权重值被冻结，所以只能在未被冻结的网络层进行处理，处理速度会更快。在一具体实施例中，第一CNN模型为ImageNet比赛中训练完成的VGG19模型，其冻结了前18层网络层，所以，在处理过程中，只需要将待识别的牲畜图片输入到VGG19模型的最后一层进行处理即可，处理完成输出的结果即为被识别牲畜的特征向量。在处理过程中，直到其最后一层的神经网络的损失函数变为一个接近0的阈值时，结束处理的过程，输出处理结果。可以这么理解，随着VGG19的最后一个全连接层参数的不断变化，神经网络的损失函数会越来越小，直到收敛到接近0，此时，可以认为输出的待识别的牲畜图片的特征向量为到达要求的特征向量，理论上，神经网络的损失函数的收敛值为0时，输出的特征向量最优。

本实施例中，上述将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量的步骤S3之前，包括：

S301、获取所述第一CNN模型最后一层的节点数量，根据所述节点数量生成最大输入所述待识别的牲畜图片数量的提醒信息。

如上述步骤S301所述，上述第一CNN模型的最后一层的节点数数量对应着其最大可以处理图片的张数，因为不同的第一CNN模型的最后一层的节点数量不同，其可以进行处理的图片张数也不同。在一具体实施例中，上述第一CNN模型为ImageNet比赛中训练完成的VGG19模型，其最后一层的节点数量为4096，那么其最多能对4096张图片进行处理，如果超出4096张图片，则不适用VGG19模型，需要选择其它的模型。本实施例中，在输入牲畜图片之前会先判断上述第一CNN模型的最后一层的节点数数量，并通过显示、语音等形式告知当前的操作者，以防止当前操作者输入过多的图片而无法完成相应的训练。具体的判断过程为：读取当前的第一CNN模型的网络结构，然后在预设的模型数据库中查找与该网络结构相同的模型，进而判断出具体的模型，然后根据该模型，在预设列表中查找与其对应的最后一层的节点数量。在另一实施例中，用户的计算机设备中预存有多个不同的第一CNN模型，如分别为训练后的VGG19模型、VGG16模型、VGG-F模型、ResNet50模型、ResNet152模型、DPN131模型、InceptionV3模型、Xception模型、DenseNet模型和AlexNet模型等，并给每一个模型添加一个标签，该标签对应模型的最后一层的节点数量值，当使用某一具体模型时，根据其标签查找与之对应的节点数量值，从而知道当前最多可输入多少张待识别的牲畜图片。

参照图2，本实施例中，上述将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量的步骤S3之后，包括：

S4、对所述待识别的牲畜图片对应的特征向量进行softmax归一化处理。

如上述步骤S4所述，对待识别的牲畜图片对应的特征向量进行softmax归一化处理，会得出概率分布输出，方便计算。

参照图3，本实施例中，上述将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量的步骤S3之前，包括：

S31、将所述第一CNN模型中未冻结的各层的权重参数重置为0。

如上述步骤S31所述，将第一CNN模型中最后一层的权重参数重置为0，会提高训练的速度，而对结果的准确性并没有很大的应影响，即对结果的影响在可以接受的范围之内。在一具体实施例中，第一CNN模型是为ImageNet比赛中训练完成的VGG19模型，其前18层的权重参数被冻结，那么在识别图片时，将其最后一层的权重参数重置为零，以提高处理速度。

本实施例中，上述获取基于指定图片样本、以及所述图片样本对应的特征向量训练完成的第一CNN模型的步骤S1之前，包括：

S11、获取指定区域养殖户的名单，并根据名单分配待识别单一牲畜种类的脸部图片采集任务给各养殖户；

S12、收集养殖户反馈的图片，并存储到指定的存储空间内形成所述图片样本；

S13、将所述图片样本分成训练集和测试集，基于指定的第二CNN模型进行训练，得到训练完成的所述第一CNN模型。

如上述步骤S11所述，上述指定区域的养殖户名单是指可以在一指定范围内获取到的养殖户名单。比如，投保了牲畜险的养殖户的信息会被保险公司以电子文档的形式进行备案，当获取养殖户的名单时，可以登录存储牲畜保单的数据库，然后读取数据库中电子文档的养殖户信息，以得到养殖户的联系方式。这里养殖户的联系方式包括两种，一种是手机号码，另一种是带即时通讯功能的应用程序(APP)的账户，如电子投保的APP或者如微信、QQ等即时通讯APP。如养殖户的联系方式是手机号码，则通过短信的形式发送采集任务给养殖户。如果是电子投保的APP，则通过APP发送采集任务给养殖户。在本实施例中，上述牲畜特征向量的提取方法应用于牲畜保险领域，所以会开发一款对应的应用程序，其集成有牲畜投保、报险系统，以及即时通讯系统，通过该应用程序投保的用户的信息会自动保存到预设的数据库中，当发布任务时，直接通过上述应用程序进行发布即可。上述待识别单一牲畜种类是指单一种类的牲畜，比如猪、牛、羊等中的单一物种。上述的脸部图片是指方便识别的，具有单一物种特征较多的照片，一般为牲畜的正脸照片，如猪的正脸照片等。在另一具体实施例中，还以通过众包平台发布众包任务，众包任务即为收集待识别单一牲畜种类的脸部图片，而众包用户即为上述获取的指定区域养殖户的名单上对应的养殖户。

如上述步骤S12所述，将养殖户发送的图片保存到指定的存储空间内，如指定的数据库中等。上述形成所述图片样本，是指这些图片将会作为深度神经网络学习的样本进行使用，同样其会将图片样本先先进行向量化，使其与图片对应，以便于输入到上述第二CNN模型中训练。本实施例中，在接收到养殖户的图片之后，会对图片进行简单的筛选，其帅选规律为图片的质量是否达到预设要求，具体地：

A、对图片进行边缘检测，然后是模糊确定。此处模糊确定是通过计算当前像素点与图片内像素点均值之差来确定。我们用f(x,y)表示图片，其中x∈[1，M]and y∈[1，N]。

定义水平绝对差如下：

D_h(x，y)＝|f(x，y+1)-f(x，y-1)|.

整个图片的水平绝对差的均值为：

如果当前像素点的D_h(x，y)大于D_h-mean，则该像素点就是一个候选的边缘点C_h(x，y).如果C_h(x，y)比它水平方向两个相邻的点

{C_h(x，y-1)，C_h(x，y+1)}都大，则该像素点就被确认为一个边缘点。边缘点E_h(x，y)的判断总结如下：

接下来我们检测边缘点是否模糊。定义：

同理，按照以上的步骤我们可以计算垂直方向的值BR_v。BR_h和BR_v两者之大者称作Inverse Blurriness(逆模糊强度)，用于最终的模糊判定依据。

低于阈值ThB的Inverse Blurriness被认为是模糊的。实验测试表明此处的阈值ThB取值0.1。最后，边缘模糊的均值和比率为：

其中Sun_blur和Blur_cnt分别是Inverse Blueriness和模糊点的数目，Edge_cnt是边缘总点数。

B、对图片进行噪点检测。因为沿边缘的噪点视觉上不明显，因此我们只检测边缘之外的噪点。边缘检测会被噪点影响，因此在检测边缘之前做一个噪点滤波的预处理。在本实施例中，我们应用均值滤波来消除噪点。均值滤波之后的图像g(x,y)为：

候选的噪点估计如下：

D_h(x，y)＝|g(x，y+1)-g(x，y-1)|

同理可以在垂直方向计算对应的值。然后得到候选的噪点是：

其中N_cand(x，y)表示候选噪点，它在边缘区域为0。

噪点均值和比率为：

其中Sum_Noise是N(x，y)之和，Noise_cnt是噪点总数目。

C、噪点和模糊的组合。此处我们的图像质量评价指标定义如下：

Metric＝1-(W₁Blur_mean+W₂Blur_ratio+W₃Noise_mean+W₄Noise_ratio)

其中w1、w2、w3、w4是权值。通过线性回归分析获取这些权值。本实施例中这些权值为：w₁＝1，w₂＝0.95，w₃＝0.3，w₄＝0.75。当Metric(度规)大于预设值，则认为上述的图片为质量不达标的图片等，将其删除。

如上述步骤S13所述，将上述的样本图片分成训练集和测试集，现将测试集的图片输入到上述第二CNN模型中进行训练，该第二CNN模型是指模型的初始状态，即没有输入过任何数据进行运算的模型。当第二CNN模型经过上述训练集的图片、以及图片对应特征向量训练完成后，通过测试集的图片、以及图片对应特征向量对该训练完成的模型进行检验，如果检验合格，则认定该训练完成的模型是可以使用的模型，即上述的第一CNN模型。本实施例中，通过养殖户提供待识别的牲畜种类的图片，建立的第一CNN模型会更加准确。比如，养殖户提供的图片全部是猪的图片，那么训练出来的第一CNN模型在对猪的图片识别上，相对会更加准确。

本实施例中，上述将所述图片样本分成训练集和测试集，基于到指定的第二CNN模型进行训练，得到训练完成的所述第一CNN模型的步骤S13之前，包括：

S131、判断所述图片样本的数量是否达到预设值；

S132、若达到，则停止发送图片获取任务。

如上述步骤S131和S132所述，图片样本的数量达到预设的值之后，无需继续获取图片样本，则停止发送图片获取任务。本实施例中，上述的图片获取任务一般是通过众包任务的形式进行发送的，即需要进行付费，当获取的图片达到指定数量之后，既可以停止发布任务，节约金钱等。本实施例中，可以不付众包用户(养殖户)金钱，可以根据养殖户提供图片的数量，对其投保时提供打折等优惠政策，以实现互利互惠。

本实施例中，上述的待识别单一牲畜种类的脸部图片采集任务包括专门采集病死猪的图片的任务，建立一个病死猪的猪脸图片集合；然后利用病死猪的猪脸图片集合训练针对病死猪的第一CNN模型，用于判断被识别的猪只是否是病死猪。因为，养殖户在投保过程，为了节约保费，可能只给部分猪只进行投保，而另一部分猪只不进行投保。在投保时，养殖户进行线上投保，具体地，养殖户登录投保系统，进行注册(填写养殖户的名称、商号、联系方式)，然后通过上传投保猪只的图片对投保猪只进行标记，当投保猪只发生病死状态时，拍摄其病死后的图片上传投保系统进行报险，通过上述第一CNN模型判断病死后的图片中的猪只是否为投保猪只。此时存在一种情况，即养殖户未投保的猪只发生病死情况，其将投保过的且活着的猪只进行拍照以欺骗系统，使系统认为病死的猪只是投保过的猪只，进而使保险公司赔偿保险费用。本实施例中，建立一个专门识别病死猪的第一CNN模型，当养殖户上传投保猪只的图片之后，首先判断该图片中的猪只是否为病死状态的猪只，如果是，才进行判断该猪只是否为投保猪只，降低保险公司的风险。

在一具体实施例中，设置专门针对猪只进行保险的系统，其具体操作的过程包括：

1、通过众包的方式发布猪脸图片收集任务，该任务包括两种，一种是收集任意猪脸照片，另一种是收集病死猪照片。在收集到图片之后对图片进行质量检测，将不清楚的进行删除，同时记录上传质量不过关图片的养殖的信息，以便于在后期该养殖户投保过程中降低对其优惠的程度。

2、当第一种猪脸照片达到指定数量之后，分别输入到VGG19神经网络模型中进行处理，得到初始的猪脸识别模型；当病死猪照片达到指定数量后，通过同样的方法得到初始的病死猪识别模型；

3、将上述的猪脸识别模型和病死猪识别模型配置到畜牧保险系统中；

4、当猪只进行投保时，调用猪脸识别模型，冻结上述猪脸识模型的前18层的权重参数，以及重置第19层的权重参数为零；然后输入待识别的猪脸照片(最大输入4096张图片)到猪脸识别模型中进行猪脸识别，各猪脸照片在处理过程中直到网络收敛至指定阈值后备案。

5、当投保的养殖户进行保险时，接收养殖户上传的病死猪照片，然后通过上述猪脸识别模型判断该病死猪是否为投保猪只，若是，则将该病死猪照片输入到上述的病死猪识别模型中判断该病死猪照片是否病死猪，若是，则执行后续的报险流程，否者停止当前的报险流程，并上报该养殖户可能存在骗保行为，以供调查人员进行调查。在另一实施例中，还可以先通过病死猪识别模型判断上传的病死猪照片是否是病死猪，若是病死猪，则通过上述猪脸识别模型判断该病死猪是否为投保猪只；若不是病死猪，则上报该养殖户可能存在骗保行为，以供调查人员进行调查。

本申请的实施例中的牲畜特征向量的提取方法，基于迁移学习的理念，利用已经训练过的第一CNN模型，结合fine-tune方法，在识别牲畜过程中，只需要对第一CNN模型的最后几层进行处理，其它层的权重参数可以冻结，即，识别牲畜图片的过程中，第一CNN模型被冻结的层不需要参与处理的过程，进而大大地提高了牲畜图片识别的速度。

参照图4，本申请还提供一种牲畜特征向量的提取装置，包括：

获取单元10，用于获取基于指定图片样本、以及所述图片样本对应的特征向量训练完成的第一CNN模型；

冻结单元20，用于冻结所述第一CNN模型中指定层的权重参数；

处理单元30，用于将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量

在上述获取单元10中，CNN(Convolutional Neural Network，卷积神经网络)模型的基本结构包括两层，其一为特征提取层，每个神经元的输入与前一层的局部接受域相连，并提取该局部的特征。一旦该局部特征被提取后，它与其它特征间的位置关系也随之确定下来；其二是特征映射层，网络的每个计算层由多个特征映射组成，每个特征映射是一个平面，平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数(Sigmoid函数是一个在生物学中常见的S型的函数，也称为S型生长曲线。在信息科学中，由于其单增以及反函数单增等性质，Sigmoid函数常被用作神经网络的阈值函数，将变量映射到0,1之间)作为卷积网络的激活函数，使得特征映射具有位移不变性。此外，由于一个映射面上的神经元共享权值，因而减少了网络自由参数的个数。卷积神经网络中的每一个卷积层都紧跟着一个用来求局部平均与二次提取的计算层，这种特有的两次特征提取结构减小了特征分辨率。上述第一CNN模型是一种训练好的模型，即，无需重新通过图片样本进行训练，而是拿来主义，将其它领域或场景下训练完成的CNN模型拿过来直接使用。本实施例中，上述第一CNN模型包括VGG19模型、VGG16模型、VGG-F模型、ResNet50模型、ResNet152模型、DPN131模型、InceptionV3模型、Xception模型、DenseNet模型和AlexNet模型中的一种。

在上述冻结单元20中，第一CNN模型中包括多层(例如，卷基层和全连接层)，根据预设规则，可以将其中至少一个层作为指定层(不包括最后一层)，并冻结指定层的权重参数。

在一种可能的实施方式中，由于第一CNN模型中的多个卷基层和多个全连接层存在先后顺序，可以按照各层之间的先后顺序，将排序前N的卷基层或/和全连接层作为指定层，其中N为大于1小于第一CNN模型总层数的正整数，且N为预设值。也就是说，将第一CNN模型的前指定层数的权重参数冻结，即，被冻结的权重参数，在之后对牲畜图片进行处理时，不会进行改变。在一具体实施例中，上述第一CNN模型是ImageNet的使用VGG19训练后得到模型。上述ImageNet是一个计算机视觉系统识别项目名称，是目前世界上图像识别最大的数据库，是美国斯坦福的计算机科学家，模拟人类的识别系统建立的，其中包含120万张图片，分别包含1000种类别的图片，其中的动物，比如猫，狗，牛等牲畜的图片数量巨大。本实施例中，上述VGG19模型一共包括19层神经网络层，其中，其前16层为卷积层，最后三层为全连接层。在一具体实施例中，冻结前16层卷积层和前2层全连接层的权重参数，即冻结VGG19模型的前十八层的权重参数。

在上述处理单元30中，上述待识别的牲畜图片是指养殖户等按照一定要求拍摄的图片，比如，牲畜为猪，通常会拍摄猪的正面照或侧面照等含有猪的特征较多的照片，而不会拍摄猪的局部照片，比如只拍摄肚子的照片等。将待识别的牲畜图片输入到第一CNN模型中进行处理，由于其指定层数的权重值被冻结，所以只能在未被冻结的网络层进行处理，处理速度会更快。在一具体实施例中，第一CNN模型为ImageNet比赛中训练完成的VGG19模型，其冻结了前18层网络层，所以，在处理过程中，只需要将待识别的牲畜图片输入到VGG19模型的最后一层进行处理即可，训练完成输出的结果即为被识别牲畜的特征向量。在处理过程中，直到其最后一层的神经网络的损失函数变为一个接近0的阈值时，结束识别的过程，输出识别结果。可以这么理解，随着VGG19的最后一个全连接层参数的不断变化，神经网络的损失函数会越来越小，直到收敛到接近0，此时，可以认为输出的待识别牲畜图片的特征向量为到达要求的特征向量，理论上，神经网络的损失函数的收敛值为0时，输出的特征向量最优。

参照图5，本实施例中，上述牲畜特征向量的提取装置，还包括：

获取节点单元301，用于获取所述第一CNN模型最后一层的节点数量，根据所述节点数量生成最大输入所述待识别的牲畜图片数量的提醒信息。

在上述获取节点单元101中，上述第一CNN模型的最后一层的节点数数量对应着其最大可以处理图片的张数，因为不同的第一CNN模型的最后一层的节点数量不同，其可以进行处理的图片张数也不同。在一具体实施例中，上述第一CNN模型为ImageNet比赛中训练完成的VGG19模型，其最后一层的节点数量为4096，那么其最多能对4096张图片进行处理，如果超出4096张图片，则不适用VGG19模型，需要选择其它的模型。本实施例中，在输入牲畜图片之前会见先判断上述第一CNN模型的最后一层的节点数数量，并通过显示、语音等形式告知当前的操作者，以防止当前操作者输入过多的图片而无法完成相应的训练。具体的判断过程为：读取当前的第一CNN模型的网络结构，然后在预设的模型数据库中查找与该网络结构相同的模型，进而判断出具体的模型，然后根据该模型，在预设列表中查找与其对应的最后一层的节点数量。在另一实施例中，用户的计算机设备中预存有多个不同的第一CNN模型，如分别为训练后的VGG19模型、VGG16模型、VGG-F模型、ResNet50模型、ResNet152模型、DPN131模型、InceptionV3模型、Xception模型、DenseNet模型和AlexNet模型等，并给每一个模型添加一个标签，该标签对应模型的最后一层的节点数量值，当使用某一具体模型时，根据其标签查找与之对应的节点数量值，从而知道当前最多可输入多少张待识别的牲畜图片。

归一单元40，用于对待识别的牲畜图片对应的特征向量进行softmax归一化处理。

在归一单元40中，对待识别的牲畜图片对应的特征向量进行softmax归一化处理，会得出概率分布输出，方便计算。

参照图6，本实施例中，上述牲畜特征向量的提取装置，还包括：

重置单元31，用于将所述第一CNN模型中未冻结的各层的权重参数重置为0。

在重置单元301中，将第一CNN模型中未冻结的各层神经网络的权重参数重置为0，会提高训练的速度，而对结果的准确性并没有很大的应影响，即对结果的影响在可以接受的范围之内。在一具体实施例中，第一CNN模型是为ImageNet比赛中训练完成的VGG19模型，其前18层的权重参数被冻结，那么在识别图片时，将其最后一层的权重参数重置为零，以提高处理速度。

参照图7，本实施例中，上述牲畜特征向量的提取装置，还包括：

获取发布单元11，用于获取指定区域养殖户的名单，并根据名单分配待识别单一牲畜种类的脸部图片采集任务给各养殖户；

收集存储单元12、收集养殖户反馈的图片，并存储到指定的存储空间内形成所述图片样本；

分类训练单元13、用于将所述图片样本分成训练集和测试集，基于指定的第二CNN模型进行训练，得到训练完成的所述第一CNN模型。

在上述获取发布单元11中，上述指定区域的养殖户名单是指可以在一指定范围内获取到的养殖户名单。比如，投保了牲畜险的养殖户的信息会被保险公司以电子文档的形式进行备案，当获取养殖户的名单时，可以登录存储牲畜保单的数据库，然后读取数据库中电子文档的养殖户信息，以得到养殖户的联系方式。这里养殖户的联系方式包括两种，一种是手机号码，另一种是带即时通讯功能的应用程序(APP)的账户，如电子投保的APP或者如微信、QQ等即时通讯APP。如养殖户的联系方式是手机号码，则通过短信的形式发送采集任务给养殖户。如果是电子投保的APP，则通过APP发送采集任务给养殖户。在本实施例中，上述牲畜特征向量的提取装置应用于牲畜保险领域，所以会开发一款对应的应用程序，其集成有牲畜投保、报险系统，以及即时通讯系统，通过该应用程序投保的用户的信息会自动保存到预设的数据库中，当发布任务时，直接通过上述应用程序进行发布即可。上述待识别单一牲畜种类是指单一种类的牲畜，比如猪、牛、羊等中的单一物种。上述的脸部图片是指方便识别的，具有单一物种特征较多的照片，一般为牲畜的正脸照片，如猪的正脸照片等。在另一具体实施例中，还以通过众包平台发布众包任务，众包任务即为收集待识别单一牲畜种类的脸部图片，而众包用户即为上述获取的指定区域养殖户的名单上对应的养殖户。

在上述收集存储单元12中，将养殖户发送的图片保存到指定的存储空间内，如指定的数据库中等。上述形成所述图片样本，是指这些图片将会作为深度神经网络处理的样本进行使用，同样其会将图片样本先先进行向量化，使其与图片对应，以便于输入到上述第二CNN模型中训练。本实施例中，在接收到养殖户的图片之后，会对图片进行简单的筛选，其帅选规律为图片的质量是否达到预设要求，具体地：

A、对图片进行边缘检测，然后是模糊确定。此处模糊确定是通过计算当前像素点与图片内像素点均值之差来确定。我们用f(x,y)表示图片，其中x∈[1，M]andy∈[1，N].。

定义水平绝对差如下：

D_h(x，y)＝|f(x，y+1)-f(x，y-1)|.

整个图片的水平绝对差的均值为：

接下来我们检测边缘点是否模糊。定义：

其中Sun_blur和Blur_cnt分别是Inverse Bluer iness和模糊点的数目，Edge_cnt是边缘总点数。

B、对图片进行噪点检测。因为沿边缘的噪点视觉上不明显，因此我们只检测边缘之外的噪点。边缘检测会被噪点影响，因此在检测边缘之前做一个噪点滤波的预处理。在本实施例中，我们应用均值滤波来消除噪点。均值滤波之后的图像g(x，y)为：

候选的噪点估计如下：

D_h(x，y)＝|g(x，y+1)-g(x，y-1)|

其中N_cand(x，y)表示候选噪点，它在边缘区域为0。

噪点均值和比率为：

其中Sum_Noise是N(x，y)之和，Noise_cnt是噪点总数目。

Metric＝1-(W₁Blur_mean+W₂Blur_ratio+W₃Noise_mean+W₄Noise_ratio)

在上述分类训练单元13中，将上述的样本图片分成训练集和测试集，现将测试集的图片输入到上述第二CNN模型中进行训练，该第二CNN模型是指模型的初始状态，即没有输入过任何数据进行运算的模型。当第二CNN模型经过上述训练集的图片、以及图片对应特征向量训练完成后，通过测试集的图片、以及图片对应特征向量对该训练完成的模型进行检验，如果检验合格，则认定该训练完成的模型是可以使用的模型，即上述的第一CNN模型。本实施例中，通过养殖户提供待识别的牲畜种类的图片，建立的第一CNN模型会更加准确。比如，养殖户提供的图片全部是猪的图片，那么训练出来的第一CNN模型在对猪的图片识别上，相对会更加准确。

判断阈值单元131，用于判断所述图片样本的数量是否达到预设值；

停止发布单元132、用于若达到预设值，则停止发送图片获取任务。

在上述判断阈值单元131和停止发布单元132中，图片样本的数量达到预设的值之后，无需继续获取图片样本，则停止发送图片获取任务。本实施例中，上述的图片获取任务一般是通过众包任务的形式进行发送的，即需要进行付费，当获取的图片达到指定数量之后，既可以停止发布任务，节约金钱等。本实施例中，可以不付众包用户(养殖户)金钱，可以根据养殖户提供图片的数量，对其投保时提供打折等优惠政策，以实现互利互惠。

本实施例中，上述的待识别单一牲畜种类的脸部图片采集任务包括专门采集病死猪的图片的任务，建立一个病死猪的猪脸图片集合；然后利用病死猪的猪脸图片集合训练针对病死猪的第一CNN模型，用于判断被识别的猪只是否是病死猪。因为，养殖户在投保过程，为了节约保费，可能只给部分猪只进行投保，而另一部分猪只不进行投保。在投保时，养殖户进行线上投保，具体地，养殖户登录投保系统，进行注册(填写养殖户的名称、商号、联系方式等)，然后通过上传投保猪只的图片对投保猪只进行标记，当投保猪只发生病死状态时，拍摄其病死后的图片上传投保系统进行报险，通过上述第一CNN模型判断病死后的图片中的猪只是否为投保猪只。此时存在一种情况，即养殖户未投保的猪只发生病死情况，其将投保过的且活着的猪只进行拍照以欺骗系统，使系统认为病死的猪只是投保过的猪只，进而使保险公司赔偿保险费用。本实施例中，建立一个专门识别病死猪的第一CNN模型，当养殖户上传投保猪只的图片之后，首先判断该图片中的猪只是否为病死状态的猪只，如果是，才进行判断该猪只是否为投保猪只，降低保险公司的风险。

2、当第一种猪脸照片达到指定数量之后，分别输入到VGG19神经网络模型中进行处理，得到猪脸识别模型；当病死猪照片达到指定数量后，通过同样的方法得到病死猪识别模型；

本申请的实施例中的牲畜特征向量的提取装置，基于迁移学习的理念，利用已经训练过的第一CNN模型，结合fine-tune方法，在识别牲畜过程中，只需要对第一CNN模型的最后几层进行处理，其它层的权重参数可以冻结，即，识别牲畜图片的过程中，第一CNN模型被冻结的层不需要参与处理的过程，进而大大地提高了牲畜图片识别的速度。

参照图8，本申请实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储识别牲畜的第一CNN模型等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种牲畜特征向量的提取方法。

上述处理器执行上述牲畜特征向量的提取方法的步骤：获取基于指定图片样本、以及所述图片样本对应的特征向量训练完成的第一CNN模型；冻结所述第一CNN模型中指定层的权重参数；

在一个实施例中，上述第一CNN模型包括VGG19模型，所述冻结所述第一CNN模型中指定层的权重参数的步骤，包括：冻结所述第一CNN模型中前十八层的权重参数。

在一个实施例中，上述将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量的步骤之前，包括：获取所述第一CNN模型最后一层的节点数量，根据所述节点数量生成最大输入所述待识别的牲畜图片数量的提醒信息。

在一个实施例中，上述将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量的步骤之后，包括：对所述待识别的牲畜图片对应的特征向量进行softmax归一化处理。

在一个实施例中，上述将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量的步骤之前，包括：将所述第一CNN模型中未冻结的各层神经网络的权重参数重置为0。

在一个实施例中，上述获取基于指定图片样本、以及所述图片样本对应的特征向量训练完成的第一CNN模型的步骤之前，包括：获取指定区域养殖户的名单，并根据名单分配待识别单一牲畜种类的脸部图片采集任务给各养殖户；收集养殖户反馈的图片，并存储到指定的存储空间内形成所述图片样本；将所述图片样本分成训练集和测试集，基于指定的第二CNN模型进行训练，得到训练完成的所述第一CNN模型。

在一个实施例中，上述将所述图片样本分成训练集和测试集，基于到指定的第二CNN模型进行训练，得到训练完成的所述第一CNN模型的步骤之前，包括：判断所述图片样本的数量是否达到预设值；若达到，则停止发送图片获取任务。

本领域技术人员可以理解，图8中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定。

本申请实施例的计算机设备，基于迁移学习的理念，利用已经训练过的第一CNN模型，结合fine-tune方法，在识别牲畜过程中，只需要对第一CNN模型的最后几层进行处理，其它层的权重参数可以冻结，即，识别牲畜图片的过程中，第一CNN模型被冻结的层不需要参与处理的过程，进而大大地提高了牲畜图片识别的速度。

本申请一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现一种牲畜特征向量的提取方法，具体为：获取基于指定图片样本、以及所述图片样本对应的特征向量训练完成的第一CNN模型；

冻结所述第一CNN模型中指定层的权重参数；

上述牲畜保险理赔方法，基于迁移学习的理念，利用已经训练过的第一CNN模型，结合fine-tune方法，在识别牲畜过程中，只需要对第一CNN模型的最后几层进行处理，其它层的权重参数可以冻结，即，识别牲畜图片的过程中，第一CNN模型被冻结的层不需要参与处理的过程，进而大大地提高了牲畜图片识别的速度。

在一个实施例中，上述所述第一CNN模型包括VGG19模型，处理器冻结所述第一CNN模型中指定层的权重参数的步骤，包括：冻结所述第一CNN模型中前十八层的权重参数。

在一个实施例中，上述处理器将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量的步骤之前，包括：获取所述第一CNN模型最后一层的节点数量，根据所述节点数量生成最大输入所述待识别的牲畜图片数量的提醒信息。

在一个实施例中，上述处理器将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量的步骤之后，包括：对所述待识别的牲畜图片对应的特征向量进行softmax归一化处理。

在一个实施例中，上述处理器将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量的步骤之前，包括：将所述第一CNN模型中未冻结的各层神经网络的权重参数重置为0。

在一个实施例中，上述处理器获取基于指定图片样本、以及所述图片样本对应的特征向量训练完成的第一CNN模型的步骤之前，包括：获取指定区域养殖户的名单，并根据名单分配待识别单一牲畜种类的脸部图片采集任务给各养殖户；收集养殖户反馈的图片，并存储到指定的存储空间内形成所述图片样本；将所述图片样本分成训练集和测试集，基于指定的第二CNN模型进行训练，得到训练完成的所述第一CNN模型。

在一个实施例中，上述处理器将所述图片样本分成训练集和测试集，基于到指定的第二CNN模型进行训练，得到训练完成的所述第一CNN模型的步骤之前，包括：判断所述图片样本的数量是否达到预设值；若达到，则停止发送图片获取任务。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种牲畜特征向量的提取方法，其特征在于，包括：

冻结所述第一CNN模型中指定层的权重参数；

2.根据权利要求1所述的牲畜特征向量的提取方法，其特征在于，所述第一CNN模型包括VGG19模型，所述冻结所述第一CNN模型中指定层的权重参数的步骤，包括：

冻结所述第一CNN模型中前十八层的权重参数。

3.根据权利要求1所述的牲畜特征向量的提取方法，其特征在于，所述将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量的步骤之前，包括：

4.根据权利要求1所述的牲畜特征向量的提取方法，其特征在于，所述将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量的步骤之后，包括：

5.根据权利要求1所述的牲畜特征向量的提取方法，其特征在于，所述将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量的步骤之前，包括：

将所述第一CNN模型中未冻结的各层的权重参数重置为0。

6.根据权利要求1所述的牲畜特征向量的提取方法，其特征在于，所述获取基于指定图片样本、以及所述图片样本对应的特征向量训练完成的第一CNN模型的步骤之前，包括：

7.根据权利要求6所述的牲畜特征向量的提取方法，其特征在于，所述将所述图片样本分成训练集和测试集，基于到指定的第二CNN模型进行训练，得到训练完成的所述第一CNN模型的步骤之前，包括：

判断所述图片样本的数量是否达到预设值；

若达到，则停止发送图片获取任务。

8.一种牲畜特征向量的提取装置，其特征在于，包括：

冻结单元，用于冻结所述第一CNN模型的前指定层数的权重参数；

处理单元，用于将待识别的牲畜图片输入到所述第一CNN模型中进行处理，得出所述待识别的牲畜图片对应的特征向量。

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。