CN111914754B

CN111914754B - 一种图像内容相似度度量方法、装置及计算机设备

Info

Publication number: CN111914754B
Application number: CN202010768550.3A
Authority: CN
Inventors: 满庆奎; 徐晓刚; 毕海; 焦振秋
Original assignee: Hangzhou Yunqi Smart Vision Technology Co ltd
Current assignee: Hangzhou Yunqi Smart Vision Technology Co ltd
Priority date: 2020-08-03
Filing date: 2020-08-03
Publication date: 2023-06-30
Anticipated expiration: 2040-08-03
Also published as: CN111914754A

Abstract

本发明公开了一种图像内容相似度度量方法、装置及计算机设备,一种图像内容相似度度量方法，其特征在于：按照时间先后顺序，缓冲N帧历史轨迹信息：信息内容包括：N帧图像特征信息，以及对应的尺寸信息：接着进行如下步骤：计算输入图片与第n个缓冲信息的尺寸变化情况，遍历所有的缓冲信息，寻找合适的历史轨迹目标特征；计算上步骤中的目标特征与输入查询图像特征Feature₀的距离，得出相似度。本发明通过进行已有的尺寸信息约束的方式，对进行距离计算的特征进行有效的过滤，明显提升了准确度，算法效率高，对轨迹连接实时性方面几乎没有影响。

Description

一种图像内容相似度度量方法、装置及计算机设备

技术领域

本发明涉及视频监控技术领域，特别涉及一种图像内容相似度度量方法、装置及计算机设备。

背景技术

视频图像中目标检测完成以后，需要对检测的目标，根据图像的内容、位置、尺寸等信息进行跟踪串联，组成目标运动轨迹，为后续的视频图像内容理解做准备。目标在匹配过程中，需要考虑当前图像与历史轨迹的内容进行相似度的比对，如果能有效判别图像与轨迹的历史内容相似，会对最终轨迹连接起到很重要的作用。

虽然很多技术文章都在一些有效图像内容特征抽取工作，传统的技术比如颜色直方图，ColorName等技术不考虑图像的尺寸信息；强如深度学习技术，如果要考虑学习图像内容的尺寸位置信息，要设计复杂的网络进行关键点、部件检测进行对齐才可以有效的减少图像尺寸问题对计算结果准确性影响。这种方法对效率要求比较高的工程应用领域，太复杂的算法会导致效率不高。

为了有效的克服尺寸不对等导致计算结果不准确的影响，有几种工程实现的计算方式，(1)遍历所有的历史轨迹内容，计算每帧内容的相似度，时间复杂度比较高，缺点是：行人在整个轨迹运动的过程中是时刻变化的，如果时间太久的历史来计算相似度会比较容易产生误判，最终导致轨迹误匹配；(2)按照时间距离最近的历史进行特征计算匹配，考虑多个历史进行相似度的加权处理减少误差。正常场景下，时间上最近的内容是最近的，但是如果是该历史帧被其他物体遮挡了，容易得到一个尺寸不合适的历史轨迹图像进行了计算相似度，那么计算的轨迹相似度偏低，导致轨迹没有连接成功。

发明内容

本发明的目的在于，提供一种图像内容相似度度量方法。

轨迹连接过程中，很多跟踪算法中，图像内容是进行匹配区分的很关键的因素，如果从图像中特征选择的合适，就可以有效的进行时间上相邻的前后多帧数据匹配连接。由于视频图像目标检测时，场景复杂，同一个目标在不同时刻，位置、光照等因素都会检测出不同尺寸的目标，会存在，头部，上半身、半身，全身，腿部等图像。这些图像在进行相似度计算的时候，不同的尺寸、位置的图像进行计算相似度，很难做到准确。通过实验对比发现：同一个目标来说，尺寸比例比较相近时，进行相似度比较可靠，简单的说，头部对头部，上半身对上半身是比较科学的减小相似度度量误差的方法。

本发明从真实应用场景中的问题出发，考虑时间上、空间尺寸信息，提出一个有效的得到最优尺寸的目标图片的对应方法。

本发明的技术方案：一种图像内容相似度度量方法，按照时间先后顺序，缓冲N帧历史轨迹信息：

信息内容包括：N帧图像特征信息，以及对应的尺寸信息：

接着进行如下步骤：

计算输入图片与第n个缓冲信息的尺寸变化情况，遍历所有的缓冲信息，寻找合适的历史轨迹目标特征；

计算上步骤中的目标特征与输入查询图像特征Feature₀的距离，得出相似度。

A、所述步骤一中找到最合适的历史轨迹目标特征包括如下步骤：

B、比较分析输入图片与第n帧图片两者高度的比例；

上述比例在(Thresh_L,Thresh_H)之间的，该帧图片便为合适的历史轨迹目标特征。

进一步的，如果缓冲区N帧历史轨迹都遍历完成，没有找到合适的轨迹信息，FindFirstFlag的值为False，那此时对应采用第一个的历史轨迹Feature₁作为最优的特征Feature_1st进行后续距离计算使用， FindFirstFlag置为True，FindSecondFlag置为False。

进一步的，所述步骤二中计算方法为，记两个K维的图像内容特征X，Y描述分别为：X(x₁,x₂,...,x_K)，Y(y₁,y₂,...,y_K)，对应的X，Y之间的图像内容相似度计算公式为：

输入图片与轨迹的最优特征距离计算公式为：所有合适的历史轨迹帧图片与输入图片内容相似度的和。

本发明的优点在于：本发明分析目前处理轨迹图像相似度的流行技术的不足原因所在是，在提取特征是对整个图进行提取特征，没有了尺寸信息，考虑用深度学习的方式进行尺寸信息学习，需要进行部件分割等进行对齐操作；本发明考虑到同一个轨迹下的几帧历史之间目标尺寸坐标系，分辨率变化不大的特点，时间上从近到远，充分考虑到了真实视频跟踪场景中的应用需求。通过进行已有的尺寸信息约束的方式，对进行距离计算的特征进行有效的过滤，明显提升了准确度，算法效率高，对轨迹连接实时性方面几乎没有影响。

具体实施方式

下面结合实施例对本发明作进一步的说明，但并不作为对本发明限制的依据。

实施例：按照时间先后顺序，缓冲N帧历史轨迹信息，信息内容包括：N帧图像特征信息{Feature_N,Feature_N-1,...,Feature₂,Feature₁}，以及对应的尺寸信息{(x_N,y_N,w_N,h_N),(x_N-1,y_N-1,w_N-1,h_N-1),...,(x₁,y₁,w₁,h₁)}；其中， Feature_n,x_n,y_n,w_n,h_n对应历史轨迹缓冲区中第n个特征和尺寸信息， n∈(1,N)。考虑到正常场景下目标一般都是容易下部被遮挡，对应的特征缓冲区的尺寸信息(x_n,y_n,w_n)几乎是相对固定，可以认为与h_n是独立不相关的信息，那么从算法效率考虑，只分析目标的高度变化情况。

步骤一、记输入查询的图片的特征、尺寸信息 Feature₀,x₀,y₀,w₀,h₀，是否找到有效历史缓冲帧信息标志FindFirstFlag、 FindSecondFlag都置为False；

步骤二、计算输入图片与第n个缓冲信息的尺寸变化情况，n的初始值为1；分析h₀与h_n的比例关系：

如果，h₀/h_n的值在(Thresh_L,Thresh_H)之间，那么认为第n个轨迹缓冲信息是有效的，可以进行用来特征相似的计算，FindFirstFlag置为True，记录当前的Feature_n为Feature_1st,记录n的值为firstID，对应的 FindFirstFlag置为True。优选的，Thresh_L＝0.66，Thresh_H＝1.5。遍历结束，跳转步骤三。

否则，跳转步骤二，计算第n+1个的历史缓冲图像h_n+1，计算h₀/h_n+1的值是否满足区间(Thresh_L,Thresh_H)约束，如果满足，FindFirstFlag置为True，记录当前的Feature_n为Feature_1st，n+1的值为firstID；

步骤三、如果FindFirstFlag为True，且firstID+1＜N，否则，跳转步骤四。

分析第firstID+1个的历史缓冲图像h_n+1，计算h₀/h_firstID+1的值是否满足区间(Thresh_L,Thresh_H)约束：

如果满足区间(Thresh_L,Thresh_H)约束，Feature_firstID+1为Feature_2nd， secondID的值为firstID+1，FindSecondFlag置为True，遍历结束，跳转步骤五；

否则，跳转步骤三，分析第firstID+2个的历史缓冲图像h_firstID+2，计算h₀/h_firstID+2的值是否满足区间(Thresh_L,Thresh_H)约束，如果满足， Feature_firstID+2赋值给Feature_2nd，secondID的值为firstID+2，FindSecondFlag 置为True；

考虑到算法的复杂程度并结合实际应用中案例，本实施例寻找“合适的轨迹信息”只需两条便可；当然，该数量越多，处理结果会更精确，但是运算量大，运算速度慢。

步骤四、如果缓冲区N帧历史轨迹都遍历完成，没有找到合适的轨迹信息，FindFirstFlag的值为False，那此时对应采用第一个的历史轨迹Feature₁作为最优的特征Feature_1st进行后续距离计算使用， FindFirstFlag置为True，FindSecondFlag置为False；

步骤五、通过遍历找到最合适的历史轨迹目标特征，得到对应的特征Feature_1st，Feature_2nd。计算该特征与输入查询图像特征Feature₀的距离。优先的，记两个K维的图像内容特征X，Y描述分别为： X(x₁,x₂,...,x_K)，Y(y₁,y₂,...,y_K)，对应的X，Y之间的图像内容相似度计算公式为：

对应的输入图像与轨迹的最优特征距离计算公式为：

dist＝w₁*simi(Feature₀,Feature_1st)+w₂*simi(Feature₀,Feature_2nd)

其中，当FindSecondFlag值为False时，w₁＝1,w₂＝0，模块 simi(Feature₀,Feature_2nd)不用计算，当FindSecondFlag值为True时， w₁＝0.7,w₂＝0.3。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请实施例的可选实施例，并不用以限制本申请实施例，凡在本申请实施例的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。