CN108399454A

CN108399454A - 一种全新的分段卷积神经网络目标识别方法

Info

Publication number: CN108399454A
Application number: CN201810179102.2A
Authority: CN
Inventors: 朱顺意
Original assignee: Shandong Leading Electronic Technology Co Ltd
Current assignee: Shandong Leading Electronic Technology Co Ltd
Priority date: 2018-03-05
Filing date: 2018-03-05
Publication date: 2018-08-14

Abstract

本发明涉及一种全新的分段卷积神经网络目标识别方法，包括：A、训练过程(1)通过反向传播算法训练框架识别网络；(2)通过反向传播算法训练细节识别网络；B、目标识别过程(3)通过步骤A训练出的框架识别网络对输入图片进行处理，得到识别目标的位置信息；(4)锁定识别目标的位置，裁剪无用区域，所述无用区域是指所述输入图片中排出识别目标以外的区域，得到目标区域；(5)通过细节识别网络对目标区域进行高级识别。由于裁剪了无用区域，本发明方法有效降低了卷积神经网络的参数数量，降低其对存储空间、数据传输带宽的需求，大幅提高识别速度。

Description

一种全新的分段卷积神经网络目标识别方法

技术领域

本发明涉及一种全新的分段卷积神经网络目标识别方法，属于人工智能深度学习领域。

背景技术

伴随着人工智能技术的快速发展，深度卷积神经网络已经发展成一种先进的计算机视觉目标识别算法，在特征提取、目标识别、人脸识别等领域有着广泛的应用。

虽然卷积神经网络的应用十分广泛，但在处理图像时，众多的权重参数消耗了相当大的存储空间与传输带宽，在处理一张高清图片时，为识别出目标，卷积神经网络需要对全部图片的所有像素点进行卷积、池化等多层操作，由于输入图片的尺寸很大，导致卷积神经网络的参数数量十分巨大，存储该算法就需要大量的内存资源与传输带宽，这使其无法在对功耗敏感的嵌入式平台上运行。

中国专利文献CN105512680A公开了一种基于深度神经网络的多视SAR图像目标识别方法，包括图像预处理、基于CAE的特征提取、基于RNN的多视SAR图像识别三个步骤。首先对输入图形进行裁剪，能量归一化等预处理过程，然后通过对CAE进行无监督训练提取到原始图像的特征，而后先利用上述特征构建多视SAR图像特征序列。之后，用训练集特征序列对RNN进行有监督训练。训练完成后，RNN可用于对测试集特征序列进行识别。但是，该专利网络在硬件实现时的传输带宽较高，且不能满足网络对移动平台功耗的需求。

发明内容

针对目标识别卷积神经网络参数过于庞大导致其无法在有限的嵌入式硬件平台实现的问题，本发明创新性的提出了一种双框架的识别算法。

术语解释：

卷积运算、feature map：数码摄像头所拍摄的图片，是以二维数组的形式存储的(如680*480，横向680个像素点，竖向480个像素点)。像素点内存储的，是某数字值。卷积神经网络提取图片的信息，是依靠滤波器来完成的。这里的滤波器是指一个n*n的矩形参数矩阵框，矩形框内的每一个参数都是神经网络的权值(weights)。所谓卷积运算，是指滤波器中的值与原图片对应相乘(从输入图片的最左上角的一个像素点开始)，然后再将滤波器n*n个参数与图像n*n个像素点对性相乘的点积和相加，作为滤波处理后输出图片的一个像素点，然后滤波器移动到下一个位置，再次执行卷积运算(输入图片与滤波器参数对应相乘)，直到处理完所有像素。所有的滤波器输出值组成了一个新的图片，称之为feature map。

本发明的技术方案为：

一种全新的分段卷积神经网络目标识别方法，包括：

A、训练过程

(1)通过反向传播算法训练框架识别网络；训练好的框架识别网络用来判断输入图片内是否存在识别目标；

框架识别网络的本质是一个特殊的CNN(Convolutional Nerul Network)。在使用一个神经网络时，首先要训练该网络，比如，如果想让某神经网络识别出人脸，那么在训练神经网络时，就要喂给网络大量的人脸图片，告诉它什么是人脸，人脸有哪些特征，并通过反向传播算法(对于一个神经网络来说，给输入数据，求出识别结果，叫正向传播；由输出结果与理想值之间的差距来返回去修改神经网络的参数来帮助网络更精准的识别人脸，这一过程叫反向传播)在训练框架识别网络时，将训练图片输入框架网络，经过正向传播，输出的可能存在待检测目标的位置信息，将输出的位置信息与目标实际所在的位置(这里就是label值)进行比对，然后求出差值，利用反向传播算法对框架识别网络的参数求出最优值，来降低输出结果，这一过程叫做神经网络的训练。网络训练好了以后，就可以用来识别目标了。

与细节识别网络不同，框架识别网络只是判断该区域是否存在目标，而不需要对该区域进行计算量巨大的细节识别。

(2)通过反向传播算法训练细节识别网络；

细节识别网本质上就是一个卷积神经网络。

B、目标识别过程

(3)通过步骤A训练出的框架识别网络对输入图片进行处理，判断输入图片中是否存在识别目标，如果存在，获取识别目标的框架位置信息，框架位置信息包括：识别目标所在区域框的最左上角像素坐标(X，Y)、识别目标所在区域框的宽度W、识别目标所在区域框的高度H；X表示识别目标所在区域框的最左上角像素点为输入图片的横着的第X个像素点；Y表示识别目标所在区域框的最左上角像素点为输入图片的竖着的第Y个像素点；例如，如输出位置坐标为(50，60).W＝20.H＝20表示该区域框的最左上角像素点在输入图片的横着第50，竖着第50个像素点，框框的长是20，高也是20。否则，输入下一张图片，返回步骤(3)；

(4)锁定识别目标的位置，裁剪无用区域，所述无用区域是指所述输入图片中排出识别目标以外的区域，得到目标区域；

(5)通过细节识别网络对目标区域进行高级识别，识别出识别目标的详细特征。

由于裁剪了无用区域，本发明方法有效降低了卷积神经网络的参数数量，降低其对存储空间、数据传输带宽的需求，大幅提高识别速度。

根据本发明优选的，所述步骤(1)，通过反向传播算法训练框架识别网络，包括：

a、向框架识别网络输入训练图片集，输出识别目标的框架位置信息，框架位置信息包括：识别目标所在区域框的最左上角像素坐标(X1，Y1)、识别目标所在区域框的宽度W1、识别目标所在区域框的高度H1；X1表示识别目标所在区域框的最左上角像素点为输入图片的横着的第X1个像素点；Y1表示识别目标所在区域框的最左上角像素点为输入图片的竖着的第Y1个像素点；

b、将步骤a得到的识别目标的框架位置信息与预设标准值label比较，即：用正确识别出目标位置信息的图片个数除以训练图片总个数，计算框架识别成功率s，当框架识别成功率s达到预设要求时(如99％)进入步骤(2)，否则，进入步骤C；预设label值是指识别目标所在区域框的实际框架位置信息，包括：识别目标所在区域框的最左上角像素坐标(X2，Y2)、识别目标所在区域框的宽度W2、识别目标所在区域框的高度H2；训练神经网络的意义就在于，通过反向传播算法，调整神经网络的参数，从而将实际输出值与label值之间的差将到最低。

c、利用反向传播算法训练框架识别网络。利用反向传播算法对框架识别网络的参数求出最优值，来降低输出差值。提高框架识别准确率。

根据本发明优选的，所述步骤(2)，通过反向传播算法训练细节识别网络，包括：

d、向细节识别网络输入训练图片集，输出识别目标的框架位置信息，框架位置信息包括：识别目标所在区域框的最左上角像素坐标(X’，Y’)、识别目标所在区域框的宽度W’、识别目标所在区域框的高度H’；X’表示识别目标所在区域框的最左上角像素点为输入图片的横着的第X’个像素点；Y’表示识别目标所在区域框的最左上角像素点为输入图片的竖着的第Y’个像素点；

e、将步骤d得到的识别目标的框架位置信息与预设标准值label’比较，即：用正确识别出目标位置信息的图片个数除以训练图片总个数，计算细节识别成功率s’，当细节识别成功率s’达到预设要求时(如99％)进入步骤(2)，否则，进入步骤f；预设标准值label’是指识别目标所在区域框的实际框架位置信息，包括：识别目标所在区域框的最左上角像素坐标(X”，Y”)、识别目标所在区域框的宽度W”、识别目标所在区域框的高度H”；

f、利用反向传播算法训练细节识别网络。

根据本发明优选的，所述步骤(5)，通过细节识别网络对目标区域进行高级识别，包括：

g、将步骤(4)得到的目标区域作为输入图片输入至所述细节识别网络；

h、通过第一层卷积层进行卷积运算，提取出输入图片的高阶特征(纯数据特征，无视觉意义)，生成特征图feature map；

i、将生成的特征图feature map输入到池化层进行池化运算；缩减图片尺寸；

j、将池化后的图片输入第二层卷积层进行卷积运算；进一步提取输入图片的特征；

k、将第二层卷积层的输出图片输入全连接层；

l、将全连接层的输出图片送入sofemax层(其他分类出亦可)，得到输入图片的详细信息。

本发明的有益效果为：

1、本发明分段识别、分段训练，提高识别准确率；

2、本发明框架识别网络对输入图片进行裁剪，可以减小算法运算量；有效降低数据传输带宽。

3、本发明目标识别算法基于CNN网络，且本目标识别算法分阶段、分开训练与使用框架识别网络与细节识别网络，首先训练框架识别网络，然后依靠框架识别网络提取出目标位置，然后依靠细节识别网络识别目标区域，与专利文献CN105512680A提到的方法相比，可以有效降低网络在硬件实现时的传输带宽，降低网络对移动平台功耗的需求。

附图说明

图1为本发明全新的分段卷积神经网络目标识别方法流程示意图；

图2为采用本发明全新的分段卷积神经网络目标识别方法的效果演示图；

具体实施方式

下面结合说明书附图和实施例对本发明作进一步限定，但不限于此。

实施例1

一种全新的分段卷积神经网络目标识别方法，如图1、图2所示，包括：

A、训练过程

(1)通过反向传播算法训练框架识别网络；训练好的框架识别网络用来判断输入图片内是否存在识别目标；包括：

(2)通过反向传播算法训练细节识别网络；包括：

f、利用反向传播算法训练细节识别网络。

细节识别网本质上就是一个卷积神经网络。

B、目标识别过程

(5)通过细节识别网络对目标区域进行高级识别，识别出识别目标的详细特征。包括：

k、将第二层卷积层的输出图片输入全连接层；

Claims

1.一种全新的分段卷积神经网络目标识别方法，其特征在于，包括：

A、训练过程

(2)通过反向传播算法训练细节识别网络；

B、目标识别过程

(3)通过步骤A训练出的框架识别网络对输入图片进行处理，判断输入图片中是否存在识别目标，如果存在，获取识别目标的框架位置信息，框架位置信息包括：识别目标所在区域框的最左上角像素坐标(X，Y)、识别目标所在区域框的宽度W、识别目标所在区域框的高度H；X表示识别目标所在区域框的最左上角像素点为输入图片的横着的第X个像素点；Y表示识别目标所在区域框的最左上角像素点为输入图片的竖着的第Y个像素点；否则，输入下一张图片，返回步骤(3)；

2.根据权利要求1所述的一种全新的分段卷积神经网络目标识别方法，其特征在于，所述步骤(1)，通过反向传播算法训练框架识别网络，包括：

b、将步骤a得到的识别目标的框架位置信息与预设标准值label比较，即：用正确识别出目标位置信息的图片个数除以训练图片总个数，计算框架识别成功率s，当框架识别成功率s达到预设要求时(如99％)进入步骤(2)，否则，进入步骤C；预设label值是指识别目标所在区域框的实际框架位置信息，包括：识别目标所在区域框的最左上角像素坐标(X2，Y2)、识别目标所在区域框的宽度W2、识别目标所在区域框的高度H2；

c、利用反向传播算法训练框架识别网络。

3.根据权利要求1所述的一种全新的分段卷积神经网络目标识别方法，其特征在于，所述步骤(2)，通过反向传播算法训练细节识别网络，包括：

f、利用反向传播算法训练细节识别网络。

4.根据权利要求1-3任一所述的一种全新的分段卷积神经网络目标识别方法，其特征在于，所述步骤(5)，通过细节识别网络对目标区域进行高级识别，包括：

h、通过第一层卷积层进行卷积运算，提取出输入图片的高阶特征，生成特征图featuremap；

i、将生成的特征图feature map输入到池化层进行池化运算；

j、将池化后的图片输入第二层卷积层进行卷积运算；

k、将第二层卷积层的输出图片输入全连接层；

l、将全连接层的输出图片送入sofemax层，得到输入图片的详细信息。