CN112990225B

CN112990225B - 一种复杂环境下的图像目标识别方法及装置

Info

Publication number: CN112990225B
Application number: CN202110531977.6A
Authority: CN
Inventors: 纪培端
Original assignee: Shenzhen Dimension Data Technology Co Ltd
Current assignee: Shenzhen Dimension Data Technology Co Ltd
Priority date: 2021-05-17
Filing date: 2021-05-17
Publication date: 2021-08-27
Anticipated expiration: 2041-05-17
Also published as: CN112990225A

Abstract

本发明公开了一种复杂环境下的图像目标识别方法及装置，其中，所述方法包括：获得复杂背景下的目标图像信息；对所述复杂背景下的目标图像信息进行目标边界确认预处理，获得预处理后的目标图像信息；基于卷积神经网络模型对所述预处理后的目标图像信息进行目标提取处理，获得提取目标信息；基于所述提取目标信息进行提取目标特征矩阵构建处理，获得提取目标特征矩阵；基于所述提取目标特征矩阵与预设的目标标准特征矩阵进行匹配处理，获得匹配分数矩阵；基于贝叶斯决策模型对所述匹配分数矩阵进行目标图像信息内的目标匹配识别处理，获得匹配识别结果。在本发明实施例中，可以实现高精度的识别图像中的目标信息，提高识别应用的安全性。

Description

一种复杂环境下的图像目标识别方法及装置

技术领域

本发明涉及计算机视觉技术领域，尤其涉及一种复杂环境下的图像目标识别方法及装置。

背景技术

随着计算机技术的发展以及监控识别技术的日渐成熟，应用监控识别技术对目标的识别应用越来越广泛，因为应用的场景的不同，对目标识别的精度要求就有所不同，比如一般情况下的公共场所的监控识别，或者要求更加精确和高安全性的门禁识别，又或者一些应用安全性要求较高的人脸识别等；在需要就高安全的图像目标的识别时，现有技术一般是通过采集图像目标上传至后台服务器中进行匹配识别，又或者在终端配备较高计算能力的处理器进行处理识别，这样一来，要么需要进行连网，要么需要配置较高的终端设备，在用户需要实现高精度目标识别时，需要给用户带来了较大的使用成本要求。

发明内容

本发明的目的在于克服现有技术的不足，本发明提供了一种复杂环境下的图像目标识别方法及装置，可以实现高精度的识别图像中的目标信息，提高识别应用的安全性，并且降低用户的使用成本。

为了解决上述技术问题，本发明实施例通过了一种复杂环境下的图像目标识别方法，所述方法包括：

获得复杂背景下的目标图像信息；

对所述复杂背景下的目标图像信息进行目标边界确认预处理，获得预处理后的目标图像信息；

基于卷积神经网络模型对所述预处理后的目标图像信息进行目标提取处理，获得提取目标信息；

基于所述提取目标信息进行提取目标特征矩阵构建处理，获得提取目标特征矩阵；

基于所述提取目标特征矩阵与预设的目标标准特征矩阵进行匹配处理，获得匹配分数矩阵；

基于贝叶斯决策模型对所述匹配分数矩阵进行目标图像信息内的目标匹配识别处理，获得匹配识别结果。

可选的，所述对所述复杂背景下的目标图像信息进行目标边界确认预处理，获得预处理后的目标图像信息，包括：

基于灰度等级直方图对所述复杂背景下的目标图像信息进行灰度化处理，获得灰度图像信息；

基于低通滤波对所述灰度图像信息进行可识别的小点噪声消除处理，获得消噪后的灰度图像信息；

依次基于高通滤波和差分运算对所述消噪后的灰度图像信息进行目标边界确认处理，获得预处理后的目标图像信息。

可选的，所述卷积神经网络模型包括向前传播网络、RPN网络、反卷积网络和全连接网络与全连接层，并且在所述反卷积网络中具有图像校正模块。

可选的，所述基于卷积神经网络模型对所述预处理后的目标图像信息进行目标提取处理，获得提取目标信息，包括：

将所述预处理后的目标图像信息输入所述卷积神经网络模型中，在所述卷积神经网络模型中的向前传播网络中进行不同维度的目标特征提取处理，获得不同维度的目标特征；

将不同维度的目标特征通过RPN网络进行初次候选框的筛选和定位，去除不包含类似目标的候选框；

初次候选框的筛选和定位结果通过反卷积网络，输出与原始目标图像信息相同大小的校正图像；

将所述校正图像输入全连接网络与全连接层进行目标提取处理，获得提取目标信息。

可选的，所述在所述卷积神经网络模型中的向前传播网络中进行不同维度的目标特征提取处理，获得不同维度的目标特征，包括：

所述预处理后的目标图像信息在所述卷积神经网络模型中的向前传播网络中进行向前传播时，依次对所述预处理后的目标图像信息进行批归一化、实例归一化处理，并提取不同维度的目标特征，获得不同维度的目标特征。

可选的，所述基于所述提取目标信息进行提取目标特征矩阵构建处理，获得提取目标特征矩阵，包括：

基于灰度等级直方图对所述提取目标信息进行灰度化处理，获得灰度化提取目标信息；

基于灰度化提取目标信息的灰度像素值进行提取目标特征矩阵的构建处理，获得提取目标特征矩阵。

可选的，所述基于所述提取目标特征矩阵与预设的目标标准特征矩阵进行匹配处理，获得匹配分数矩阵，包括：

将所述提取目标特征矩阵中的每一个矩阵元素与所述预设的目标标准特征矩阵对应的每一个矩阵元素进行一一对应匹配处理，形成匹配分数矩阵。

可选的，所述将所述提取目标特征矩阵中的每一个矩阵元素与所述预设的目标标准特征矩阵对应的每一个矩阵元素进行一一对应匹配处理，形成匹配分数矩阵，包括：

将所述提取目标特征矩阵中的矩阵元素减去所述预设的目标标准特征矩阵对应的矩阵元素，获得对应的元素差值；

基于所述对应的元素差值除以所述预设的目标标准特征矩阵对应的矩阵元素，获得矩阵元素的匹配分数；

基于所述矩阵元素的匹配分数形成匹配分数矩阵。

可选的，所述基于贝叶斯决策模型对所述匹配分数矩阵进行目标图像信息内的目标匹配识别处理，获得匹配识别结果，包括：

将所述匹配分数矩阵中的每一个匹配分数元素在所述贝叶斯决策模型中进行每个匹配分数决策识别，形成决策识别结果矩阵；

基于所述决策识别结果矩阵对所述目标图像信息内的目标进行识别，获得识别结果。

另外，本发明实施例还提供了一种复杂环境下的图像目标识别装置，所述装置包括：

获得模块：用于获得复杂背景下的目标图像信息；

预处理模块：用于对所述复杂背景下的目标图像信息进行目标边界确认预处理，获得预处理后的目标图像信息；

目标提取模块：用于基于卷积神经网络模型对所述预处理后的目标图像信息进行目标提取处理，获得提取目标信息；

矩阵构建模块：用于基于所述提取目标信息进行提取目标特征矩阵构建处理，获得提取目标特征矩阵；

匹配处理模块：用于基于所述提取目标特征矩阵与预设的目标标准特征矩阵进行匹配处理，获得匹配分数矩阵；

匹配识别模块：用于基于贝叶斯决策模型对所述匹配分数矩阵进行目标图像信息内的目标匹配识别处理，获得匹配识别结果。

在本发明实施例中，通过获得复杂背景下的目标图像信息；对所述复杂背景下的目标图像信息进行目标边界确认预处理，获得预处理后的目标图像信息；基于卷积神经网络模型对所述预处理后的目标图像信息进行目标提取处理，获得提取目标信息；基于所述提取目标信息进行提取目标特征矩阵构建处理，获得提取目标特征矩阵；基于所述提取目标特征矩阵与预设的目标标准特征矩阵进行匹配处理，获得匹配分数矩阵；基于贝叶斯决策模型对所述匹配分数矩阵进行目标图像信息内的目标匹配识别处理，获得匹配识别结果；对于计算要求相对较小，可以有普通的终端即可完成，并且可以实现高精度的识别图像中的目标信息，提高识别应用的安全性，同时降低用户的使用成本。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见的，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明实施例中的复杂环境下的图像目标识别方法的流程示意图；

图2是本发明实施例中的复杂环境下的图像目标识别装置的结构组成示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

实施例一

请参阅图1，图1是本发明实施例中的复杂环境下的图像目标识别方法的流程示意图。

如图1所示，一种复杂环境下的图像目标识别方法，所述方法包括：

S11：获得复杂背景下的目标图像信息；

在本发明具体实施过程中，通过运行该复杂环境下的图像目标识别方法的终端设备上的摄像头设备采集，得到复杂背景下的目标图像信息，也可以由该终端设备接收用户输入而得到复杂背景下的目标图像信息。

S12：对所述复杂背景下的目标图像信息进行目标边界确认预处理，获得预处理后的目标图像信息；

在本发明具体实施过程中，所述对所述复杂背景下的目标图像信息进行目标边界确认预处理，获得预处理后的目标图像信息，包括：基于灰度等级直方图对所述复杂背景下的目标图像信息进行灰度化处理，获得灰度图像信息；基于低通滤波对所述灰度图像信息进行可识别的小点噪声消除处理，获得消噪后的灰度图像信息；依次基于高通滤波和差分运算对所述消噪后的灰度图像信息进行目标边界确认处理，获得预处理后的目标图像信息。

具体的，对复杂背景下的目标图像信息进行目标边界确认预处理一般为图像增强处理，采用图像增强的方法进行，首先，采用灰度等级直方图来对复杂背景下的目标图像信息进行灰度化处理，获得灰度图像信息；然后通过低通滤波对灰度图像信息进行可识别的小点噪声消除处理，获得消噪后的灰度图像信息，这样可以有效的消除灰度等级直方图处理带来的一些可识别的小点噪声，起到降噪的作用；最后，依次通过高通滤波和差分运算算法对消噪后的灰度图像信息进行目标边界确认处理，获得预处理后的目标图像信息；这样可以使得目标图像的轮廓线增强，起到确定图像信息的上下左右边界。

S13：基于卷积神经网络模型对所述预处理后的目标图像信息进行目标提取处理，获得提取目标信息；

在本发明具体实施过程中，所述卷积神经网络模型包括向前传播网络、RPN网络、反卷积网络和全连接网络与全连接层，并且在所述反卷积网络中具有图像校正模块。

进一步的，所述基于卷积神经网络模型对所述预处理后的目标图像信息进行目标提取处理，获得提取目标信息，包括：将所述预处理后的目标图像信息输入所述卷积神经网络模型中，在所述卷积神经网络模型中的向前传播网络中进行不同维度的目标特征提取处理，获得不同维度的目标特征；将不同维度的目标特征通过RPN网络进行初次候选框的筛选和定位，去除不包含类似目标的候选框；初次候选框的筛选和定位结果通过反卷积网络，输出与原始目标图像信息相同大小的校正图像；将所述校正图像输入全连接网络与全连接层进行目标提取处理，获得提取目标信息。

进一步的，所述在所述卷积神经网络模型中的向前传播网络中进行不同维度的目标特征提取处理，获得不同维度的目标特征，包括：所述预处理后的目标图像信息在所述卷积神经网络模型中的向前传播网络中进行向前传播时，依次对所述预处理后的目标图像信息进行批归一化、实例归一化处理，并提取不同维度的目标特征，获得不同维度的目标特征。

具体的，首先搭建一个卷积神经网络模型，该卷积神经网络模型包括有向前传播网络、RPN网络、反卷积网络和全连接网络与全连接层，其中，反卷积网络中具有图像校正模块，该校正模块具有对图像进行校正功能。

在进行目标提取处理时，将预处理后的目标图像信息通过卷积神经网络的输入层输入到卷积神经网络模型中，然后在卷积神经网络模型中的向前传播网络中进行不同维度的目标特征提取处理，获得不同维度的目标特征；然后将不同维度的目标特征通过RPN网络进行初次候选框的筛选和定位，去除不包含类似目标的候选框；初次候选框的筛选和定位结果通过反卷积网络，输出与原始目标图像信息相同大小的校正图像；将校正图像输入全连接网络与全连接层进行目标提取处理，获得提取目标信息。

在进行不同维度的目标特征提取处理的过程中，需要该预处理后的目标图像信息在卷积神经网络模型中的向前传播网络中进行向前传播时，依次对预处理后的目标图像信息进行批归一化、实例归一化处理，并提取不同维度的目标特征，获得不同维度的目标特征；实例归一化的目的是降低光照对卷积神经网络模型进行提取不同维度的目标特征的干扰，提高卷积神经网络模型对复杂环境下目标图像的提取目标信息的精确度。

S14：基于所述提取目标信息进行提取目标特征矩阵构建处理，获得提取目标特征矩阵；

在本发明具体实施过程中，所述基于所述提取目标信息进行提取目标特征矩阵构建处理，获得提取目标特征矩阵，包括：基于灰度等级直方图对所述提取目标信息进行灰度化处理，获得灰度化提取目标信息；基于灰度化提取目标信息的灰度像素值进行提取目标特征矩阵的构建处理，获得提取目标特征矩阵。

具体的，先对提取目标信息进行灰度处理，然后提取灰度化后的提取目标信息的灰度像素值，利用提取的灰度像素值来构建提取目标特征矩阵，最终得到提取目标特征矩阵；在本实施例中，对提取目标信息进行灰度化是采用灰度等级直方图的方式进行，当然也可以采用其他的方式进行；采用灰度等级直方图的方式，可以有效的保存提取目标图像信息中的像素特征，更有利于后续的识别处理。

S15：基于所述提取目标特征矩阵与预设的目标标准特征矩阵进行匹配处理，获得匹配分数矩阵；

在本发明具体实施过程中，所述基于所述提取目标特征矩阵与预设的目标标准特征矩阵进行匹配处理，获得匹配分数矩阵，包括：将所述提取目标特征矩阵中的每一个矩阵元素与所述预设的目标标准特征矩阵对应的每一个矩阵元素进行一一对应匹配处理，形成匹配分数矩阵。

进一步的，所述将所述提取目标特征矩阵中的每一个矩阵元素与所述预设的目标标准特征矩阵对应的每一个矩阵元素进行一一对应匹配处理，形成匹配分数矩阵，包括：将所述提取目标特征矩阵中的矩阵元素减去所述预设的目标标准特征矩阵对应的矩阵元素，获得对应的元素差值；基于所述对应的元素差值除以所述预设的目标标准特征矩阵对应的矩阵元素，获得矩阵元素的匹配分数；基于所述矩阵元素的匹配分数形成匹配分数矩阵。

具体的，将提取目标特征矩阵中的每一个矩阵元素与该预设的目标标准特征矩阵对应的每一个矩阵元素进行一一对应的匹配分数的匹配处理，从而得到对应的匹配分数，并那个对应的匹配分数形成匹配分数矩阵。

即将提取目标特征矩阵中的矩阵元素减去预设的目标标准特征矩阵对应的矩阵元素，获得对应的元素差值；然后利用对应的元素差值除以预设的目标标准特征矩阵对应的矩阵元素，获得矩阵元素的匹配分数；最终利用矩阵元素的匹配分数形成匹配分数矩阵；具体公式如下：S_ij=(d_ij-e_ij)/ e_ij；其中，d_ij表示提取目标特征矩阵中的第i行第j列的矩阵元素；e_ij表示预设的目标标准特征矩阵中的第i行第j列的矩阵元素；S_ij表示第i行第j列的矩阵元素对应的匹配分数，匹配分数矩阵S=S_ij，i，j=1,2,3,…,N。

S16：基于贝叶斯决策模型对所述匹配分数矩阵进行目标图像信息内的目标匹配识别处理，获得匹配识别结果。

在本发明具体实施过程中，所述基于贝叶斯决策模型对所述匹配分数矩阵进行目标图像信息内的目标匹配识别处理，获得匹配识别结果，包括：将所述匹配分数矩阵中的每一个匹配分数元素在所述贝叶斯决策模型中进行每个匹配分数决策识别，形成决策识别结果矩阵；基于所述决策识别结果矩阵对所述目标图像信息内的目标进行识别，获得识别结果。

具体的，将匹配分数矩阵中的每一个匹配分数元素在贝叶斯决策模型中进行每个匹配分数决策识别，形成决策识别结果矩阵；然后根据决策识别结果矩阵对目标图像信息内的目标进行识别，获得识别结果。

在匹配识别过程中，可以将识别结果分为两类，一种是识别通过，一种是识别不通过；利用H=1表示识别通过，H=0表示识别不通过；则已知贝叶斯先验概率g=P（H=1），由于互斥关系，P（H=0）=1-g，即根据贝叶斯理论，后验概率为：p=P（H=1| S_ij）=（P（S_ij | H=1）g）/（P（S_ij | H=0）（1-g）+（S_ij | H=1）g）。

定义决策识别时的正确决策和错误决策的风险函数为E_nm；其中，n,m为0或1，则当n=m时，E_nm=0，当n不等于m时，E_nm=1，则贝叶斯条件风险为：F=F{E_nm}=E₀₀P（G=0，H=0）+ E₀₁P（G=0，H=1）+ E₁₀P（G=1，H=0）+ E₁₁P（G=1，H=1）。

根据最小风险贝叶斯决策规则得到，识别认证决策行为：

G=1时，P（S_ij | H=1）/ P（S_ij | H=0）>（（1-g）/g）*（（E₁₀- E₀₀）/（E₀₁- E₁₁））;在其他的情况下，G=0。

为了简化阈值，确定采用0至1风险函数，其正确判断是，风险为0，错误判断时，风险为1；令g=P（H=1）=1/2；即认为识别通过和识别不通过的概率相等，此时，决策函数为：G=1时，P（S_ij | H=1）/ P（S_ij | H=0）>1;在其他的情况下，G=0。

实施例二

请参阅图2，图2是本发明实施例中的复杂环境下的图像目标识别装置的结构组成示意图。

如图2所示，一种复杂环境下的图像目标识别装置，所述装置包括：

获得模块21：用于获得复杂背景下的目标图像信息；

预处理模块22：用于对所述复杂背景下的目标图像信息进行目标边界确认预处理，获得预处理后的目标图像信息；

目标提取模块23：用于基于卷积神经网络模型对所述预处理后的目标图像信息进行目标提取处理，获得提取目标信息；

矩阵构建模块24：用于基于所述提取目标信息进行提取目标特征矩阵构建处理，获得提取目标特征矩阵；

匹配处理模块25：用于基于所述提取目标特征矩阵与预设的目标标准特征矩阵进行匹配处理，获得匹配分数矩阵；

匹配识别模块26：用于基于贝叶斯决策模型对所述匹配分数矩阵进行目标图像信息内的目标匹配识别处理，获得匹配识别结果。

根据最小风险贝叶斯决策规则得到，识别认证决策行为：

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器（ROM，Read Only Memory）、随机存取存储器（RAM，RandomAccess Memory）、磁盘或光盘等。

另外，以上对本发明实施例所提供的一种复杂环境下的图像目标识别方法及装置进行了详细介绍，本文中应采用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种复杂环境下的图像目标识别方法，其特征在于，所述方法包括：

获得复杂背景下的目标图像信息；

基于贝叶斯决策模型对所述匹配分数矩阵进行目标图像信息内的目标匹配识别处理，获得匹配识别结果；

所述基于卷积神经网络模型对所述预处理后的目标图像信息进行目标提取处理，获得提取目标信息，包括：

将所述校正图像输入全连接网络与全连接层进行目标提取处理，获得提取目标信息；

所述在所述卷积神经网络模型中的向前传播网络中进行不同维度的目标特征提取处理，获得不同维度的目标特征，包括：

2.根据权利要求1所述的图像目标识别方法，其特征在于，所述对所述复杂背景下的目标图像信息进行目标边界确认预处理，获得预处理后的目标图像信息，包括：

3.根据权利要求1所述的图像目标识别方法，其特征在于，所述卷积神经网络模型包括向前传播网络、RPN网络、反卷积网络和全连接网络与全连接层，并且在所述反卷积网络中具有图像校正模块。

4.根据权利要求1所述的图像目标识别方法，其特征在于，所述基于所述提取目标信息进行提取目标特征矩阵构建处理，获得提取目标特征矩阵，包括：

5.根据权利要求1所述的图像目标识别方法，其特征在于，所述基于所述提取目标特征矩阵与预设的目标标准特征矩阵进行匹配处理，获得匹配分数矩阵，包括：

6.根据权利要求5所述的图像目标识别方法，其特征在于，所述将所述提取目标特征矩阵中的每一个矩阵元素与所述预设的目标标准特征矩阵对应的每一个矩阵元素进行一一对应匹配处理，形成匹配分数矩阵，包括：

基于所述矩阵元素的匹配分数形成匹配分数矩阵。

7.根据权利要求1所述的图像目标识别方法，其特征在于，所述基于贝叶斯决策模型对所述匹配分数矩阵进行目标图像信息内的目标匹配识别处理，获得匹配识别结果，包括：

8.一种复杂环境下的图像目标识别装置，其特征在于，所述装置包括：

获得模块：用于获得复杂背景下的目标图像信息；

匹配识别模块：用于基于贝叶斯决策模型对所述匹配分数矩阵进行目标图像信息内的目标匹配识别处理，获得匹配识别结果；

所述目标提取模块：还用于将所述预处理后的目标图像信息输入所述卷积神经网络模型中，在所述卷积神经网络模型中的向前传播网络中进行不同维度的目标特征提取处理，获得不同维度的目标特征；将不同维度的目标特征通过RPN网络进行初次候选框的筛选和定位，去除不包含类似目标的候选框；初次候选框的筛选和定位结果通过反卷积网络，输出与原始目标图像信息相同大小的校正图像；将所述校正图像输入全连接网络与全连接层进行目标提取处理，获得提取目标信息；