CN112052856A

CN112052856A - 一种基于图像特征编码的目标检测方法

Info

Publication number: CN112052856A
Application number: CN201910520470.3A
Authority: CN
Inventors: 邓毅华; 李少辉
Original assignee: Individual
Current assignee: Individual
Priority date: 2019-06-05
Filing date: 2019-06-05
Publication date: 2020-12-08

Abstract

一种基于图像特征编码的目标检测方法，包括以下步骤：(1)训练变分自编码器；(2)获得检测目标的特征编码；(3)切割待分析图像，计算各分割图块的特征编码；(4)计算目标图像特征编码与分割图块特征编码的距离；(5)判别切割图块是否包含目标，由此完成图像目标检测。本发明对检测目标仅需要少量图像样本，而且对新增目标检测类别，无需重新训练检测模型。

Description

一种基于图像特征编码的目标检测方法

技术领域

本发明涉及一种基于图像特征编码的目标检测方法。

背景技术

本发明的一种基于图像特征编码的目标检测方法主要是面向目标图像样本数量少或极少的图像目标检测领域。

本发明所述目标检测是指计算机图像处理的一个领域，目标检测技术大致可以分为两类：第一类是利用人工设计提取图像特征技术，一方面提取目标特征，另一方面提取待分析图像特征，两者进行比对，从而完成目标对象在分析图像中定位和类别判定；第二类是利用深度神经网络自动提取图像的特征，输入待分析图像，上述神经网络能够直接给出目标位置信息和类别信息。这两种方法各有优缺点，上述第一类方法，不需要样本学习，没有繁琐的样本标注过程，但鲁棒性不够，图像一经变化，目标检测错误率就会急剧增加；上述第二类方法则需要大量的学习样本，但对图像变化的适应度远远超过上述第一类方法。在本发明所面对的场合下，只有少数目标样本，而待分析图像变化大，则上述两种方法均不合适。

为解决上述问题，本发明提出一种通过变分自编码技术提取目标特征编码的方法，结合计算图像特征编码间距离的方法，既可解决了目标样本数量少的问题，又实现了目标检测。

发明内容

本发明所解决问题在于提供一种基于图像特征编码的目标检测方法，以解决上述背景技术中的缺点。

一种基于图像特征编码的目标检测方法，包括以下步骤：

为详细介绍本发明内容，下面对一些概念进行阐述或定义：

定义一：变分自编码器(Variational Auto-Encoder)，是深度学习神经网络的一个分支，由三部分构成：第一部分为由深度神经网络构成的编码器；第二部分为随机分布的隐变量，一般该随机分布为多维正态随机分布，各维相互独立；第三部分为深度神经网络构成的解码器；

一种基于图像特征编码的目标检测方法包括如下步骤：

步骤一：训练变分自编码器(上述定义一)，即说明书附图1模块1，变分自编码器训练时采用的损失函数是：

其中，N是小批次(mini-batch)样本的数量；D_z是隐变量正态分布的为数；

和

是第i样本对应的隐变量第j维的期望和方差；xⁱ是小批次样本的第i个样本；N是隐随机变量的抽样次数；z^l是隐随机变量的第l个抽样；p(xⁱ|z^l)是给定 z^l条件下xⁱ的条件分布，通过上述损失函数，对变分自编码器进行训练，直至收敛；

步骤二：获得检测目标的特征编码，即说明书附图1模块2，将图像输入步骤一训练好的变分自编码器，在变分自编码器的第一个部分，即深度神经网络构成的编码器的输出是一个实数序列，该序列构成了目标的特征编码，其特征编码矢量是：

C＝[μ₁ σ₁ μ₂ σ₂ … μ_n σ_n]^T

其中，μ_i和σ_i分别表示隐变量的第i维的正态分布的期望和均方差；

步骤三：切割待分析图像，计算各分割后图块的特征编码，即说明书附图 1模块3，将图像均匀分割成若干个图块，图块尺寸大小根据实际图像大小决定，将分割后图块处理成变分自编码器输入图像尺寸要求，逐一输入编码器，由此得到各图块的特征编码矢量；

步骤四：计算目标图像特征编码与分割图块特征编码的距离，即说明书附图1模块4，所述编码距离是两个特征编码矢量的距离，可采用欧拉距离定义两个编码矢量的距离，如下：

其中C₁和C₂分别对应两个特征编码矢量，用步骤二得到的目标特征编码与步骤三所得的各切割图块特征编码代入上述距离公式，计算特征编码间距离；

步骤五：根据步骤4计算的距离，判别步骤三的切割图块是否包含目标，即说明书附图1模块5，通过将步骤四得到的各特征编码矢量距离分别与门限距离做比较，小于门限的，表示所述分割图块包含目标，大于门限的，表示该切割图块不包含目标，由此，包含目标的图块原来在待分析图像中的位置就是目标位置；

完成上述五个步骤即可实现目标在待分析图像中的检测。

有益效果：

本发明对新检测目标仅需要少量图像样本，在增加新目标检测类别时，无需重新训练变分自编码器。

附图说明：

图1为本发明的处理流程

具体实施方式：

为了使本发明的技术手段、创作特征、工作流程、使用方法达到目的，以及功效易于明白了解，下面结合具体实施例，进一步阐述本发明。

一种基于图像特征编码的目标检测方法，包括以下步骤：

步骤一：训练变分自编码器(上述定义一)，即说明书附图1模块1，变分自编码器的编码器部分可以通过常见的深度神经网络来构建，比如ResNet模型，本发明所述变分自编码器的编码器部分的输出可以选择为40维，但不限定；变分自编码器的解码器可以由反卷积深度神经网络组成；变分自编码器训练时采用的损失函数是：

其中，N是小批次(mini-batch)样本的数量；D_z是隐变量正态分布的维数；

和

是第i样本对应的隐变量第j维的期望和方差；xⁱ是小批次样本的第i个样本；N是隐随机变量的抽样次数，在本发明中N可取12，但不限定；z^l是隐随机变量的第1个抽样；p(xⁱ|z^l)是给定z^l条件下xⁱ的条件分布，通过上述损失函数，对变分自编码器进行训练，直至收敛；

C＝[μ₁ σ₁ μ₂ σ₂ … μ_n σ_n]^T

本发明所述特征编码矢量可取20组(μ_i，σ_i)作为特征矢量，即特征矢量的长度这时为40，但不限定；

步骤三：切割待分析图像，计算各切割后图块的特征编码，即说明书附图 1模块3，本发明可将图像横切成n块，竖切成n块，n的大小根据实际图像大小决定，这样待分析图像就被切割成n*n个图块，将分割后图块处理成变分自编码器输入图像尺寸要求，本发明输入图块要求的大小可选择200*200像素，但不限定，经尺寸变换后的图块逐一输入编码器，由此得到各图块的特征编码矢量；

步骤五：根据步骤4计算的距离，判别步骤三的切割图块是否包含目标，即说明书附图1模块5，通过将步骤四得到的各特征编码矢量距离分别与门限距离做比较，小于门限的，表示所述分割图块包含目标，大于门限的，表示该切割图块不包含目标，由此，包含目标的图块在待分析图像中的位置为目标位置。

Claims

1.一种基于图像特征编码的目标检测方法，其特征在于，包括以下步骤：

(1)训练变分自编码器，训练时采用的损失函数是：

其中，L表示隐变量的抽样次数，为适应目标图像样本数较少，它应该大于1，对变分自编码器进行训练，直至收敛；

(2)获得检测目标的特征编码，将目标图像输入训练好的变分自编码器，在编码器的输出端得到一个实数序列，该序列构成了目标的特征编码，其特征编码矢量是：

C＝[μ₁ σ₁ μ₂ σ₂ … μ_n σ_n]^T；

(3)切割待分析图像，计算各分割后图块的特征编码；

(4)计算目标图像特征编码与分割图块特征编码的距离，特征编码矢量间的距离可采用欧拉距离定义：

其中C₁和C₂分别对应两个特征编码矢量，分别计算目标特征编码与各切割图块特征编码的距离；

(5)判别步骤(3)得到的切割图块是否包含目标对象：将步骤(4)得到的目标编码与各图块编码的距离分别与门限距离比较，小于门限的，表示该图块包含目标，大于门限的，表示该图块不包含目标，由此，包含目标的图块原来所在图像中的位置就是目标对象的位置，由此就完成了目标检测任务。