CN105488502B

CN105488502B - 目标检测方法与装置

Info

Publication number: CN105488502B
Application number: CN201510847630.7A
Authority: CN
Inventors: 曹先彬; 任存; 任一存; 单昊天; 纪晓芃; 李岩
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2015-11-27
Filing date: 2015-11-27
Publication date: 2018-12-21
Anticipated expiration: 2035-11-27
Also published as: CN105488502A

Abstract

本发明提供一种目标检测方法与装置，该方法中：基于初始训练样本集学习码本，基于码本构建视觉词网络模型，提取当前训练样本集中各样本的词频直方图特征，通过网络调节操作得到各视觉词的权重，根据权重确定k近邻分类器的核函数，确定k近邻分类器，根据k近邻分类器对待检测区域进行检测，进而判定待检测区域是否为目标。若未完成检测任务，则在线获取训练样本后，更新训练样本集，再通过网络操作更新视觉词权重，根据权重调整核函数，然后再对待检测区域进行检测。该过程中，k近邻分类器能够根据当前情况随时进行自我调整，维持其对当前目标与背景外观规律的适应性，从而实现变化场景下可靠、实时的目标检测。

Description

目标检测方法与装置

技术领域

本发明涉及图像检测技术，尤其涉及一种目标检测方法与装置。

背景技术

目标检测是指对图像或图像序列中感兴趣的物体进行识别与定位的技术，该技术以计算机视觉为理论基础，被广泛应用于军用、民用等领域。

目标检测技术中所采用的检测算法也被称之为检测器。从结构的角度来讲，检测器包括特征提取模块和特征分类模块。其中，特征提取模块用于按照某种规则将待检测区域的外观抽象描述为“特征”，特征分类模块用于根据特征提取模块提取出的特征，将待检测区域分类为某一类目标或背景。目标检测过程中，设计好检测器的特征分类模块与特征提取模块，采用检测器对目标进行检测。

然而，目标检测过程中，检测场景，例如光照条件、摄像机方位、背景环境、待检测目标的外观规律等，并不是一成不变的。检测场景的改变，使得原先设计好的检测器并不适应改变后的检测场景中的目标检测，导致检测准确度低。

发明内容

本发明提供一种目标检测方法与装置，实现在检测场景变化的情况下，提高目标检测准确度的目的。

第一个方面，本发明实施例提供一种目标检测方法，包括：

步骤1、基于初始训练样本集得到视觉词集合，将所述视觉词集合作为码本；

步骤2、基于所述码本构建视觉词网络模型；

步骤3、提取所述初始训练样本集中各样本的词频直方图特征；

步骤4、根据所述词频直方图特征，经过网络调节确定所述视觉词网络模型中的各网络节点的权重；

步骤5、根据所述权重，确定核函数，并根据所述核函数确定k近邻分类器；

步骤6、采用所述k近邻分类器检测待检测区域，得到检测结果，根据所述检测结果确定所述待检测区域是否为目标，所述待检测区域为检测任务包括的需要检测的区域之一；

步骤7、判断是否完成所述检测任务，若完成，则结束目标检测；否则，判断是否在线获取训练样本，若是，则根据所述在线获取的训练样本更新所述步骤3中的所述初始训练样本集，并对所述检测任务包括的下一个待检测区域执行所述步骤3～步骤7；若未在线获取训练样本，则对所述检测任务包括的下一个待检测区域执行所述步骤6。

在第一个方面的第一种可能的实现方式中，所述步骤1具体包括：

步骤1.1、对所述初始训练样本集采样，获得所述局部特征；

步骤1.2、对所述局部特征聚类，得到所述视觉词集合。

在第一个方面的第二种可能的实现方式中，所述步骤2具体为：

将所述码本中的各视觉词作为网络节点，将各所述网络节点两两连接构成所述视觉词网络模型的网络拓扑结构。

在第一个方面的第三种可能的实现方式中，所述步骤4中，对于各所述网络节点中的任意一个网络节点i，所述网络节点i对应的视觉词对所述网络节点i的权重具有激励作用，所述网络节点i的权重对其他网络节点的权重具有抑制作用，所述其他网络节点表示所述码本中除所述网络节点i所对应的视觉词之外的其他视觉词。

结合第一个方面的第三种可能的实现方式，在第一个方面的第四种可能的实现方式中，所述步骤4中，所述网络调节的第t次迭代过程包括：

步骤4.1、确定所述网络节点i受到的所述激励作用的激励强度；

步骤4.2、确定所述网络节点i受到的抑制作用的抑制强度；

步骤4.3、根据所述激励强度与所述抑制强度，确定所述网络节点i的激活度，所述激活度与所述激励强度正相关，与所述抑制强度负相关；

步骤4.4、根据所述激活度与所述网络节点i的权重增长系数，更新所述网络节点i的权重。

结合第一个方面的第四种可能的实现方式，在第一个方面的第五种可能的实现方式中，所述网络节点i的权重增长系数，与所述网络节点i的当前权重以及所述码本中所有网络节点的平均权重负相关。

第二个方面，本发明实施例提供一种目标检测装置，包括：

码本获取模块，用于基于初始训练样本集得到视觉词集合，将所述视觉词集合作为码本；

构建模块，用于基于所述码本获取模块得到的所述码本构建视觉词网络模型；

提取模块，用于提取所述初始训练样本集中各样本的词频直方图特征；

权重确定模块，用于根据所述提取模块提取的所述词频直方图特征，经过网络调节确定所述视觉词网络模型中的各网络节点的权重；

确定模块，用于根据所述权重确定模块确定的所述权重，确定核函数，并根据所述核函数确定k近邻分类器；

检测模块，用于采用所述k近邻分类器检测待检测区域，得到检测结果，根据所述检测结果确定所述待检测区域是否为目标，所述待检测区域为检测任务包括的需要检测的区域之一；

执行模块，用于判断是否完成所述检测任务，若完成，则结束目标检测；否则，判断是否在线获取训练样本，若是，则根据所述在线获取的训练样本更新所述提取模块中的所述初始训练样本集，并对所述检测任务包括的下一个待检测区域执行提取模块、所述权重确定模块、所述确定模块、所述执行模块对应的动作；若所述执行模块确定出未在线获取训练样本，则对所述检测任务包括的下一个待检测区域执行所述确定模块对应的动作。

在第二个方面的第一种可能的实现方式中，所述码本获取模块，具体用于对所述初始训练样本集采样，获得所述局部特征；对所述局部特征聚类，得到所述视觉词集合。

在第二个方面的第二种可能的实现方式中，所述构建模块，具体用于将所述码本中的各视觉词作为网络节点，将各所述网络节点两两连接构成所述视觉词网络模型的网络拓扑结构。

在第二个方面的第三种可能的实现方式中，对于各所述网络节点中的任意一个网络节点i，所述网络节点i对应的视觉词对所述网络节点i的权重具有激励作用，所述网络节点i的权重对其他网络节点的权重具有抑制作用，所述其他网络节点表示所述码本中除所述网络节点i所对应的视觉词之外的其他视觉词。

本发明实施例提供的目标检测方法与装置，基于初始训练样本集学习码本，基于码本构建视觉词网络模型，提取当前训练样本集中各样本的词频直方图特征，根据词频直方图特征，通过网络调节操作得到各视觉词的权重，根据权重确定k近邻分类器的核函数，进而确定出k近邻分类器，根据该k近邻分类器对待检测区域进行检测并得到检测结果，根据检测结果判定待检测区域是否为目标，然后，若未完成检测任务，则在线获取训练样本后，更新训练样本集，继续通过网络操作更新视觉词权重，根据更新后的权重调整k近邻分类器所用的核函数，然后再对待检测区域进行检测。该过程中，k近邻分类器能够根据当前情况随时进行自我调整，维持其对当前目标与背景外观规律的适应性，从而实现变化场景下可靠、实时的目标检测。

附图说明

图1为本发明目标检测方法实施例一的流程图；

图2为本发明目标检测装置实施例一的结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明目标检测方法实施例一的流程图。本实施例的执行主体为目标检测装置，适用于检测场景变化情况下的目标检测。具体的，本实施例包括如下步骤：

步骤1、基于初始训练样本集得到视觉词集合，将所述视觉词集合作为码本。

本步骤中，采用视觉词袋模型等，将初始训练样本集中的局部特征聚类，得到视觉词集合，将该视觉词集合称之为码本，并将初始训练样本集作为当前训练样本集。

步骤2、基于所述码本构建视觉词网络模型。

本步骤中，将码本中各视觉词作为网络节点，将各节点两两连接构成视觉词网络模型的拓扑结构。

需要说明的是，该视觉词网络模型中，各网络节点具有权重。对于每一网络节点，其权重的物理意义为：该网络节点对应的视觉词对目标的区辨能力的大小；视觉词网络模型中的“边”是网络节点之间相互影响关系的表征，“边”不具有权重。

步骤3、提取所述初始训练样本集中各样本的词频直方图特征。

本步骤中，基于码本提取当前训练样本集中各样本的词频直方图特征。具体的，用描述子，如尺度不变特征变换(Scale-invariant feature transform，SIFT)描述子提取某一样本各处的局部特征，并量化为码本中与该局部特征相似度最高的视觉词。然后，统计该样本中各个视觉词的出现频率，作为该样本的词频直方图特征向量中各分量的值。

步骤4、根据所述词频直方图特征，经过网络调节确定所述视觉词网络模型中的各网络节点的权重。

本步骤中，根据词频直方图特征，进过网络调节得到各个视觉词的权重。其中，网络调节是迭代运算直至权重收敛的过程。

步骤5、根据所述权重，确定核函数，并根据所述核函数确定k近邻分类器。

核函数是k近邻分类器的一个重要元素，其与检测场景密切相关，不同的检测场景对应的核函数不同，进而导致不同的检测场景对应的k近邻分类器不同。本步骤中，根据权重确定出核函数，进而确定出k近邻分类器。

步骤6、采用所述k近邻分类器检测待检测区域，得到检测结果，根据所述检测结果确定所述待检测区域是否为目标，所述待检测区域为检测任务包括的需要检测的区域之一。

本步骤中，对于待检测区域，提取出当前待检测区域的词频直方图特征，将提取出的词频直方图特征输入至k近邻分类器得到检测结果。其中，待检测区域为检测任务包括的至少一个待检测区域中的一个。该过程中，确定出与待检测区域的词频直方图具有较高相似度的k个词频直方图，该k个词频直方图来自目标(正样本)或背景(负样本)。若来自正样本的比较多，则将待检测区域判定为目标；否则，若来自负样本的比较多，则将待检测区域判定为背景。

具体的，本步骤中，令待检测区域的词频直方图特征为f_x，k近邻分类器的k值为5，对前五个与f_x最相似的样本赋予相同的投票权重。使用核函数依次计算f_x与各个训练样本特征的相似度，得到与f_x相似度最高的五个训练样本特征，其中三个来自正样本，两个来自负样本，因此判定待检测区域为目标。

需要说明的是，可以根据检测任务对检测准确度与检测速度的要求为k近邻分类器选用不同的k值和投票权重赋予准则，本实施例对此不进行限制。

步骤7、在对当前待检测区域完成检测后，若未完成检测任务，则判断是否在线获取训练样本，若是，则根据所述在线获取的训练样本更新所述步骤3中的所述初始训练样本集，并对所述检测任务包括的下一个待检测区域执行所述步骤3～步骤7；若未在线获取训练样本，则对所述检测任务包括的下一个待检测区域执行所述步骤6；。具体的，步骤7包括：

步骤7.1、判断是否完成所述检测任务，若是，则执行步骤7.2；若否，则执行步骤7.3；

步骤7.2、结束目标检测；

步骤7.3：判断是否在线获取训练样本，若是，则执行步骤7.4；若否，则返回步骤6，对下一个待检测区域进行检测，即采用k近邻分类器对下一个待检测区域进行检测。

步骤7.4、根据所述在线获取的训练样本更新所述步骤3中的所述初始训练样本集，并对所述检测任务包括的下一个待检测区域执行所述步骤3～步骤7。

上述更新过程中，由于当前训练样本集采用队列式结构，即在更新时采取先进先出原则，用最新获取的训练样本替换当前训练样本集中同等数量的最老的训练样本集。由此可知，该更新过程相当于k近邻分类器根据当前情况进行自我调整的过程，避免了由于检测场景的变化导致的检测器性能下降的弊端，并且检测器对场景改变的适应通过增量式调整实现，即每次调整只需在现有结构上做少量计算，从而保证了检测器的实时性。

本发明实施例提供的目标检测方法，基于初始训练样本集学习码本，基于码本构建视觉词网络模型，提取当前训练样本集中各样本的词频直方图特征，根据词频直方图特征，通过网络调节操作得到各视觉词的权重，根据权重确定k近邻分类器的核函数，进而确定出k近邻分类器，根据该k近邻分类器对待检测区域进行检测并得到检测结果，根据检测结果判定待检测区域是否为目标，然后，若未完成检测任务，则在线获取训练样本后，更新训练样本集，继续通过网络操作更新视觉词权重，根据更新后的权重调整k近邻分类器所用的核函数，然后再对待检测区域进行检测。该过程中，k近邻分类器能够根据当前情况随时进行自我调整，维持其对当前目标与背景外观规律的适应性，从而实现变化场景下可靠、实时的目标检测。

可选的，在本发明一实施例中，上述的步骤1具体包括：

步骤1.1、对所述初始训练样本集采样，获得所述局部特征。

具体的，可采用描述子，如SIFT描述子、梯度直方图(Histogram of gradient，HOG)描述子等对初始训练样本集进行采用，从而获得大量的局部特征。其中，采用方式可以为稠密采用，即在图像上所有局部区域采用，也可以采用稀疏采用，即在少量兴趣点上进行采样等。

需要说明的是，本步骤中，描述子的选择取决于待检测目标的类别，本实施例并不对此进行限制；而且，采样方式取决于检测任务对检测准确度和检测速度的要求，本发明实施例并不对此进行限制。

步骤1.2、对所述局部特征聚类，得到所述视觉词集合。

具体的，可采用k均值聚类算法等，将步骤1.1中得到的大量局部特征聚类为多个类别，如100个类别，在特征空间中将各个类别的中心所对应的特征作为代表该类别的视觉词，由此得到大小为100的码本。

需要说明的是，本步骤中，聚类采用的具体算法和码本大小可根据具体情况确定，本发明并不以此为限制。

可选的，在本发明一实施例中，上述的步骤2具体为：将所述码本中的各视觉词作为网络节点，将各所述网络节点两两连接构成所述视觉词网络模型的网络拓扑结构。

可选的，在本发明一实施例中，上述的步骤4中，对于所述各所述网络节点中的任意一个网络节点i，所述网络节点i对应的视觉词对所述网络节点i的权重具有激励作用，所述网络节点i的权重对其他网络节点的权重具有抑制作用，所述其他网络节点表示所述码本中除所述网络节点i所对应的视觉词之外的其他视觉词。

进一步的可选的，所述步骤4中，所述网络调节的第t次迭代过程包括：

步骤4.1、确定所述网络节点i受到的所述激励作用的激励强度。

具体的，用S(i)表示节点i受到的激励强度，P(i)与N(i)分别表示在当前训练样本集中视觉词i在正样本和负样本上出现的次数，则激励强度的计算公式如下：

步骤4.2、确定所述网络节点i受到的抑制作用的抑制强度。

具体的，用D(i,t)表示第t次迭代时其他所有节点对节点i权值的抑制强度，则抑制强度的具体计算公式如下：

其中，dist(i,j)表示网络节点i与网络节点j各自对应的视觉词在特征空间中的距离，即网络节点i与网络节点j各自对应的视觉词的特征向量的差异度，σ为常数。

步骤4.3、根据所述激励强度与所述抑制强度，确定所述网络节点i的激活度，所述激活度与所述激励强度正相关，与所述抑制强度负相关。

具体的，激活度的计算公式如下：

其中，α(i,t)表示网络节点i在第t次迭代时的激活度。

具体的，权重更新公式如下：

其中，

w(i,t)：网络节点i在第t次迭代时的权重；

λ₀：权重增长常数；

d：权重下降系数；

α(i,t)：网络节点i在第t次迭代时的激活度；

w(i,t))：权重增长系数与网络节点权重负相关，计算公式为：r(B(t),w(i,t))＝r₀exp{-λ₁W(t)-λ₂w(i,t)}。

由上述可知：所述网络节点i的权重增长系数，与所述网络节点i的当前权重以及所述码本中所有网络节点的平均权重负相关。

可选的，上述各实施例中，所述步骤7中，完成对当前待检测区域的检测后，确定是否完成目标检测任务，若完成，则结束；否则，返回所述步骤6，对所述目标检测任务中的其他待检测区域进行检测。

可选的，在本发明一实施例中，上述步骤5中的核函数由直方图交叉核函数改进而来。核函数公式如下：

其中，f_j与f_k表示任意两个样本的词频直方图特征，与表示这两个特征的第i维分量，l表示特征向量长度，w_i表示视觉词i的权重。

需要说明的是，可以根据具体情况设计各种满足本发明原则的核函数，本实施例对此不进行限制。

图2为本发明目标检测装置实施例一的结构图。本实施例提供的目标检测装置，本实施例提供的目标检测装置是与本发明图1实施例对应的装置实施例，具体实现过程在此不再赘述。具体的，本实施例提供的目标检测装置包括：

码本获取模块11，用于基于初始训练样本集得到视觉词集合，将所述视觉词集合作为码本；

构建模块12，用于基于所述码本获取模块11得到的所述码本构建视觉词网络模型；

提取模块13，用于提取所述初始训练样本集中各样本的词频直方图特征；

权重确定模块14，用于根据所述提取模块13提取的所述词频直方图特征，经过网络调节确定所述视觉词网络模型中的各网络节点的权重；

确定模块15，用于根据所述权重确定模块14确定的所述权重，确定核函数，并根据所述核函数确定k近邻分类器；

检测模块16，用于采用所述k近邻分类器检测待检测区域，得到检测结果，根据所述检测结果确定所述待检测区域是否为目标，所述待检测区域为检测任务包括的需要检测的区域之一；

执行模块17，用于判断是否完成所述检测任务，若完成，则结束目标检测；否则，判断是否在线获取训练样本，若是，则根据所述在线获取的训练样本更新所述提取模块13中的所述初始训练样本集，并对所述检测任务包括的下一个待检测区域执行提取模块13、所述权重确定模块14、所述确定模块15、所述检测模块16、所述执行模块17对应的动作；若所述执行模块17确定出未在线获取训练样本，则对所述检测任务包括的下一个待检测区域执行所述确定模块15对应的动作。

本发明实施例提供的目标检测装置，基于初始训练样本集学习码本，基于码本构建视觉词网络模型，提取当前训练样本集中各样本的词频直方图特征，根据词频直方图特征，通过网络调节操作得到各视觉词的权重，根据权重确定k近邻分类器的核函数，进而确定出k近邻分类器，根据该k近邻分类器对待检测区域进行检测并得到检测结果，根据检测结果判定待检测区域是否为目标，然后，若未完成检测任务，则在线获取训练样本后，更新训练样本集，继续通过网络操作更新视觉词权重，根据更新后的权重调整k近邻分类器所用的核函数，然后再对待检测区域进行检测。该过程中，k近邻分类器能够根据当前情况随时进行自我调整，维持其对当前目标与背景外观规律的适应性，从而实现变化场景下可靠、实时的目标检测。

可选的，在本发明一实施例中，所述码本获取模块11，具体用于对所述初始训练样本集采样，获得所述局部特征；对所述局部特征聚类，得到所述视觉词集合。

可选的，在本发明一实施例中，所述构建模块12，具体用于将所述码本中的各视觉词作为网络节点，将各所述网络节点两两连接构成所述视觉词网络模型的网络拓扑结构。

可选的，在本发明一实施例中，对于各所述网络节点中的任意一个网络节点i，所述网络节点i对应的视觉词对所述网络节点i的权重具有激励作用，所述网络节点i的权重对其他网络节点的权重具有抑制作用，所述其他网络节点表示所述码本中除所述网络节点i所对应的视觉词之外的其他视觉词。

可选的，在本发明一实施例中，所述权重确定模块14用于在网络调节的第t次迭代过程中，确定所述网络节点i受到的所述激励作用的激励强度；确定所述网络节点i受到的抑制作用的抑制强度；根据所述激励强度与所述抑制强度，确定所述网络节点i的激活度，所述激活度与所述激励强度正相关，与所述抑制强度负相关；根据所述激活度与所述网络节点i的权重增长系数，更新所述网络节点i的权重。

可选的，在本发明一实施例中，所述网络节点i的权重增长系数，与所述网络节点i的当前权重以及所述码本中所有网络节点的平均权重负相关。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种目标检测方法，其特征在于，包括：

步骤2、基于所述码本构建视觉词网络模型；

步骤7、判断是否完成所述检测任务，若完成，则结束目标检测；否则，判断是否在线获取训练样本，若是，则根据所述在线获取的训练样本更新所述步骤3中的所述初始训练样本集，并对所述检测任务包括的下一个待检测区域执行所述步骤3～步骤7；若未在线获取训练样本，则对所述检测任务包括的下一个待检测区域执行所述步骤6；

其中，所述步骤4中，对于各所述网络节点中的任意一个网络节点i，所述网络节点i对应的视觉词对所述网络节点i的权重具有激励作用，所述网络节点i的权重对其他网络节点的权重具有抑制作用，所述其他网络节点表示所述码本中除所述网络节点i所对应的视觉词之外的其他视觉词。

2.根据权利要求1所述的方法，其特征在于，所述步骤1具体包括：

步骤1.1、对所述初始训练样本集采样，获得局部特征；

步骤1.2、对所述局部特征聚类，得到所述视觉词集合。

3.根据权利要求1所述的方法，其特征在于，所述步骤2具体为：

4.根据权利要求1所述的方法，其特征在于，所述步骤4中，所述网络调节的第t次迭代过程包括：

步骤4.2、确定所述网络节点i受到的抑制作用的抑制强度；

5.根据权利要求4所述的方法，其特征在于，所述网络节点i的权重增长系数，与所述网络节点i的当前权重以及所述码本中所有网络节点的平均权重负相关。

6.一种目标检测装置，其特征在于，包括：

执行模块，用于判断是否完成所述检测任务，若完成，则结束目标检测；否则，判断是否在线获取训练样本，若是，则根据所述在线获取的训练样本更新所述提取模块中的所述初始训练样本集，并对所述检测任务包括的下一个待检测区域执行提取模块、所述权重确定模块、所述确定模块、所述执行模块对应的动作；若所述执行模块确定出未在线获取训练样本，则对所述检测任务包括的下一个待检测区域执行所述确定模块对应的动作；

其中，对于各所述网络节点中的任意一个网络节点i，所述网络节点i对应的视觉词对所述网络节点i的权重具有激励作用，所述网络节点i的权重对其他网络节点的权重具有抑制作用，所述其他网络节点表示所述码本中除所述网络节点i所对应的视觉词之外的其他视觉词。

7.根据权利要求6所述的装置，其特征在于，所述码本获取模块，具体用于对所述初始训练样本集采样，获得局部特征；对所述局部特征聚类，得到所述视觉词集合。

8.根据权利要求6所述的装置，其特征在于，所述构建模块，具体用于将所述码本中的各视觉词作为网络节点，将各所述网络节点两两连接构成所述视觉词网络模型的网络拓扑结构。