CN113112527A - 一种基于h264视频码流的运动小目标检测方法 - Google Patents

一种基于h264视频码流的运动小目标检测方法 Download PDF

Info

Publication number
CN113112527A
CN113112527A CN202110324939.3A CN202110324939A CN113112527A CN 113112527 A CN113112527 A CN 113112527A CN 202110324939 A CN202110324939 A CN 202110324939A CN 113112527 A CN113112527 A CN 113112527A
Authority
CN
China
Prior art keywords
significance
coeff
frame
block
motion vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110324939.3A
Other languages
English (en)
Other versions
CN113112527B (zh
Inventor
王靖宇
张国俊
张科
苏雨
谭明虎
李浩宇
张烨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202110324939.3A priority Critical patent/CN113112527B/zh
Publication of CN113112527A publication Critical patent/CN113112527A/zh
Application granted granted Critical
Publication of CN113112527B publication Critical patent/CN113112527B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/277Analysis of motion involving stochastic approaches, e.g. using Kalman filters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/262Analysis of motion using transform domain methods, e.g. Fourier domain methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20052Discrete cosine transform [DCT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20076Probabilistic image processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于H.264视频码流的运动小目标检测方法,首先依据H.264码流信息计算量化参数显著性,即QP显著性;然后建立全局运动估计模型,并补偿原始运动矢量数据;接下来依据补偿后的运动矢量,计算运动矢量显著性,即MV显著性;然后再依据H.264码流信息计算变换因子显著性,即Coeff显著性;利用点乘、加乘的方式实现QP显著性、MV显著性和Coeff显著性的融合;最后利用马尔可夫随机场计算当前帧运动矢量、当前帧变换因子矩阵与前序帧检测结果的后验估计,实现对可见光视频码流中运动小目标的检测。本发明克服了目标所含像素小与环境相似可能引入的检测精度问题,最终检测得到的目标完整性好,降低了漏检率,提高了检测精度,实现了对运动小目标的精确检测。

Description

一种基于H264视频码流的运动小目标检测方法
技术领域
本发明属于图像处理技术领域,具体涉及一种运动小目标检测方法。
背景技术
运动目标检测是计算机视觉领域的一个重要研究课题。其目的是利用视频序列间的相关性,快速、准确地从视频中检测出运动目标,以降低后续行为分析等环节的处理难度。随着视频监视系统中普及,运动小目标检测在许多计算机视觉领域逐渐扮演重要角色,包括预警系统,防御措施安全,遥感和视觉跟踪等应用。
陈明生,梁光明等人(《复杂背景下H.264压缩域运动目标检测算法》,通信学报,2011,32-3,91-97)中针对H.264/AVC压缩码流中的运动目标检测问题,提出了一种基于马尔可夫随机场的最大后验概率(MAP-MRF,Maximum A Posterior-Markov Random Field)下的H.264压缩域运动目标检测方法。方法首先将大小各异的宏块(Macroblock)归一化为4×4像素大小,针对各宏块运动矢量(MV,Motion Vector)场建立高斯混合模型(GMM,GaussianMixture Model),结合MV幅度、帧间宏块分割模式、MV相位背景模型和运动目标时空约束建立马尔可夫随机场(MRF,Markov Random Field)模型。通过求解模型判断每个4×4大小宏块是否属于运动目标。但该算法未考虑H.264码流中的残差因素,故在检测效果中,存在漏检,且随着方法的运行,检测的准确性会逐渐下降。
发明内容
为了克服现有技术的不足,本发明提供了一种基于H.264视频码流的运动小目标检测方法,首先依据H.264码流信息计算量化参数显著性,即QP显著性;然后建立全局运动估计模型,并补偿原始运动矢量数据;接下来依据补偿后的运动矢量,计算运动矢量显著性,即MV显著性;然后再依据H.264码流信息计算变换因子显著性,即Coeff显著性;利用点乘、加乘的方式实现QP显著性、MV显著性和Coeff显著性的融合;最后利用马尔可夫随机场计算当前帧运动矢量、当前帧变换因子矩阵与前序帧检测结果的后验估计,实现对可见光视频码流中运动小目标的检测。本发明克服了目标所含像素小与环境相似可能引入的检测精度问题,最终检测得到的目标完整性好,降低了漏检率,提高了检测精度,实现了对运动小目标的精确检测。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1:依据H.264码流信息计算量化参数显著性,即QP显著性;
步骤2:依据H.264码流中原始运动矢量数据,建立全局运动估计模型,并补偿原始运动矢量数据;
步骤3:依据补偿后的运动矢量,计算运动矢量显著性,即MV显著性;
步骤4:依据H.264码流信息计算变换因子显著性,即Coeff显著性;
步骤5:利用点乘、加乘的方式实现QP显著性、MV显著性和Coeff显著性的融合;
步骤6:利用马尔可夫随机场MRF计算当前帧运动矢量、当前帧变换因子矩阵与前序帧检测结果的后验估计,实现对可见光视频码流中运动小目标的检测。
进一步地,所述步骤1中依据H.264码流信息计算量化参数显著性的方法如下:
设序列图像F,帧长度为m,其中各帧由ft,t=1,2,...,m表示;将第t帧ft划分为多个a1×a1大小的像素块,将该像素块定义为宏块,每一个宏块共用一个QP值,第j个宏块的量化参数显著性SaliencyQPj为:
Figure BDA0002994237800000021
其中,QPmax和QPmin分别为帧ft中最大QP值和最小QP值,j=1,…,n,n为帧ft中宏块的个数,QPj为第j个宏块的QP值;
计算图像帧ft中所有宏块的量化参数显著性,再将计算出的所有量化参数显著性按照各宏块在图像帧中的位置排列,从而获得SaliencyQP,即QP显著图;
进一步地,所述步骤2中建立全局运动估计模型,并补偿原始运动矢量数据的步骤如下:
步骤2-1:采用稳健回归估计的方式,利用迭代加权最小二乘估计参数,实现全局运动模型估计;
(MVxi,MVyi)=(xi'-xi,yi'-yi)
exi=xi+MVxi-xi' (2)
eyi=xi+MVyi-yi'
其中,(MVxi,MVyi)表示当前帧中宏块i的运动矢量MV,(xi,yi)表示当前帧中宏块i的坐标,(xi',yi')表示参考帧中宏块i的坐标;ei=[exi,eyi]表示运动矢量MV与真实坐标间存在的误差,运动矢量MV被视作(xi-xi',yi-yi');
步骤2-2:建立全局运动模型:
Figure BDA0002994237800000036
其中a,b,c,d,e,f为模型参数,则根据最小二乘法将全局运动模型写为:
Figure BDA0002994237800000031
Figure BDA0002994237800000032
其中,x1…xn表示第1个到第n个图像块;
步骤2-3:式(4)的求解过程采用矩阵形式,如式(5):
Figure BDA0002994237800000033
其中B为左式,A为右式含(xi yi 1)的矩阵,X为全局运动模型模型参数矩阵:
采用迭代加权最小二乘估计参数,则矩阵解法为:
X=(ATWA)-1ATWB (6)
其中,权重矩阵为:
Figure BDA0002994237800000034
矩阵中,各权重采用下式计算:
Figure BDA0002994237800000035
其中,ε(i)为第i个宏块的运动矢量与由全局运动模型估计的运动矢量的棋盘距离,με为所有ε(i)的均值,σε为ε(i)的方差;
在解得全局运动模型后,ε(i)即为完成补偿后的第i个宏块的运动矢量MV;计算图像帧中所有宏块补偿后的运动矢量,从而完成全局运动的补偿;
进一步地,所述步骤3中计算运动矢量显著性的方法如下:
步骤3-1:遍历图像帧ft内各宏块,计算每个宏块的8-邻域内宏块MV的中值MVmedian
中值MVmedian的计算方法为:对于宏块i,计算宏块i的8-邻域内所有宏块MV的夹角∠θj,并将夹角∠θj进行排序,若宏块i的8-邻域内宏块数为偶数,则取中间两个夹角对应MV的加权和;否则,若宏块i的8-邻域内宏块数为奇数,取中间夹角对应的MV;
Figure BDA0002994237800000041
步骤3-2:记录宏块的8-邻域内宏块个数,记为cnt_adjacency_number;cnt_adjacency_number的取值有3、5、8三种;记录宏块的8-邻域内各宏块MVmedian为零的个数,记为cnt_adjacency_mv_zero;
运动矢量显著性具体逻辑如下:
(1)若当前宏块MV为0,且cnt_adjacency_mv_zero大于等于4,将当前宏块的显著性赋值为0;否则若当前宏块MV为0,且cnt_adjacency_mv_zero小于4,则将当前宏块的显著性赋值为0.1;
(2)若当前宏块MV非0,计算当前宏块8-邻域内宏块MV的中值MVmedian,进而计算当前宏块MV与MVmedian的余弦相似度:
Figure BDA0002994237800000042
则各非零运动矢量的宏块的显著性由下式表示:
SaliencyMV=1-cos_sim(MV,MVmedian) (9)
最终,由当前帧内各宏块MV计算得到的SaliencyMV组成当前帧的运动矢量显著图,即MV显著图;
进一步地,所述步骤4中依据H.264码流信息计算变换因子显著性的方法如下:
H.264视频编码标准通过应用整数离散余弦变换DCT,将视频帧中真实块与预测块像素间的差异变换为频域信号;统一H.264标准中8×8与4×4两类变换方式,规定两类变换的直流DC、低频LF、中频MF、高频HF的界限:
Figure BDA0002994237800000051
Figure BDA0002994237800000052
其中,i,j分别为每个8×8与4×4块的横纵坐标:由于每个8×8块可以包含4个4×4块,则统一后:
Figure BDA0002994237800000053
其中,用#表示对应分量的非零元素数目,round()函数表示四舍五入;
定义变换因子显著性模型:
numCoeff=#DC+1.1·(#LF)+1.2·(#MF)+1.3·(#HF) (11)
其中,numCoeff表示对应分量的加权非零元素的数目总和;
将numCoeff进行归一化:
Figure BDA0002994237800000054
其中,tempCoeff为numCoeff归一化后的结果,numCoeffmin、numCoeffmax分别为8X8变换块或由4X4变换块融合成的8X8变换块的8-邻域内的加权非零元素数目最小值与最大值:
对tempCoeff进行高斯平滑:
SaliencyCoeff=gaussian(tempCoeff) (13)
由此得到的SaliencyCoeff为最终的变换因子显著图,即Coeff显著图;
进一步地,所述步骤五利用点乘、加乘的方式实现QP显著性、MV显著性和Coeff显著性的融合的方法如下:
Figure BDA0002994237800000061
将QP显著图作为统领项,将MV显著图与Coeff显著图进行加权相加与对应元素相乘,式(14)中的βitem总和为0.6,用来平衡MV与Coeff两种显著性的取舍程度,γ取0.4;
进一步地,所述步骤6实现对可见光视频码流中运动小目标的检测的具体步骤如下:
步骤6-1:通过MRF进行再检测,即把检测获得的Saliencyfinal作为先验知识,设置MRF中的各能量项与当前帧运动矢量、当前帧变换矩阵与前序帧检测结果进行关联,实现后验估计;
后验估计通常为处理贝叶斯问题,设当前帧检测结果为Lt∈{0,1},前序帧检测结果为Lt-1∈{0,1},则最大后验概率表示为:
Figure BDA0002994237800000062
其中,MVt表示当前帧的MV场,Coefft表示当前帧的由各Coeff数目组成的场;则最大后验概率转化为求解使得分子取最大值时的Lt,Ω表示为当前帧所有检测结果,即标签的组合:
Figure BDA0002994237800000063
由于MRF与服从Gibbs分布的随机场等价,因此将上述公式求对数,同时设计能量函数进行求解,各能量函数的表达如下:
Figure BDA0002994237800000064
Figure BDA0002994237800000071
Figure BDA0002994237800000072
Figure BDA0002994237800000073
等价于:
Figure BDA0002994237800000074
式(18)中右边第一项:时域连续性;E1(ψ;Lt-1,MVt,Coefft)中在时间连续中直接相关的变量仅为MV,因此将能量函数退化为E1(ψ;Lt-1,MVt);设当前帧ft中某4X4分块b标记为1,则由其MV反推至前序帧ft-1中的对应区域,通过统计对应区域中标记为1的数目,则获得当前分块b为目标的概率p(b):标记为1的数目除以16,则E1(ψ;Lt-1,MVt)为所有标记为1的分块b的概率总和;
式(18)中右边第二项:显著区域继承性;E2(ψ;MVt,Coefft)能量函数仅取决于MV、Coeff:
Figure BDA0002994237800000075
式中,c块为b块的邻域块,包含b块本身;若b块处的Saliencyfinal与其邻域内的最大值相差大于预设阈值,且其值大于0.5,则认为块b为目标区域,否则,认为b块仍为背景;
式(18)中右边第三项:邻域关联性;在E3(ψ)中,采用具有不同权重的8-邻域区域,计算邻域相关性,则此分块权重通过当前块邻域标记加权和计算:
Figure BDA0002994237800000076
其中N1(b)和N2(b)分别为块b的一阶即上下左右和二阶即左上、右上、右下、左下邻域;相邻块中标记为1的块的数量与能量项呈负相关,块b属于目标的概率越大,从而保证
Figure BDA0002994237800000081
可以取更小的值;
在MRF开始前,前一帧的标签作为当前帧的初始标签,若当前帧为第一帧,则此时初始标签全设置为0;在迭代MRF至能量函数前后两次变化量小于0.01后退出迭代,输出结果,完成最终的运动小目标检测。
进一步地,所述a1=16。
本发明的有益效果如下:
1、本发明通过利用H.264视频码流中包含的量化参数、运动矢量、变换因子矩阵刻画三类显著性指标,并根据马尔可夫随机场实现显著区域的后验估计,提高了视频数据中运动小目标的检测准确性。
2、本发明提出的针对运动小目标检测的方法在含有多个目标的场景中,克服了目标所含像素小与环境相似可能引入的检测精度问题,最终检测得到的目标完整性好,降低了漏检率,提高了检测精度,实现了对运动小目标的精确检测。
附图说明
图1为本发明方法流程图。
图2为本发明方法的效果图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
本发明针对目前已有的依靠H.264视频码流数据进行运动小目标检测方法,大多存在漏检的问题,采用码流信息中量化参数(QP,Quantitation Parameter)、运动矢量、变换矩阵(Coeff,Coefficient Matrix)等信息建立显著性图。在此基础上,结合时域连续性、显著区域继承性、邻域关联性约束马尔可夫随机场实现对H.264标准下视频的运动小目标准确检测。
如图1所示,一种基于H.264视频码流的运动小目标检测方法,包括以下步骤:
步骤1:依据H.264码流信息计算量化参数显著性,即QP显著性;
步骤2:依据H.264码流中原始运动矢量数据,建立全局运动估计模型,并补偿原始运动矢量数据;
步骤3:依据补偿后的运动矢量,计算运动矢量显著性,即MV显著性;
步骤4:依据H.264码流信息计算变换因子显著性,即Coeff显著性;
步骤5:利用点乘、加乘的方式实现QP显著性、MV显著性和Coeff显著性的融合;
步骤6:利用马尔可夫随机场MRF计算当前帧运动矢量、当前帧变换因子矩阵与前序帧检测结果的后验估计,实现对可见光视频码流中运动小目标的检测。
进一步地,所述步骤1中依据H.264码流信息计算量化参数显著性的方法如下:
H.264依靠量化参数(QP,Quantitation Parameter)控制视频区域的细节刻画程度。当摄像设备参数恒定时,运动物体在视场中运动速度越快,在成像结果中保留的细节越少。反之,如静止的区域,其在结果中保留了大量的细节。因此在H.264视频数据中,运动区域通常会由高QP值刻画,即量化更粗略,而静止区域由低QP值,即量化更精细。
设序列图像F,帧长度为m,其中各帧由ft,t=1,2,...,m表示;将第t帧ft划分为多个16×16大小的像素块,将该像素块定义为宏块,每一个宏块共用一个QP值,第j个宏块的量化参数显著性SaliencyQPj为:
Figure BDA0002994237800000091
其中,QPmax和QPmin分别为帧ft中最大QP值和最小QP值,j=1,…,n,n为帧ft中宏块的个数,QPj为第j个宏块的QP值;
计算图像帧ft中所有宏块的量化参数显著性,再将计算出的所有量化参数显著性按照各宏块在图像帧中的位置排列,从而获得SaliencyQP,即QP显著图;
进一步地,所述步骤2中建立全局运动估计模型,并补偿原始运动矢量数据的步骤如下:
步骤2-1:由于无法准确刻画视频编码标准所计算的各宏块运动矢量与各像素真实运动方向之间的误差分布模型,采用稳健回归估计的方式,利用迭代加权最小二乘估计参数,实现全局运动模型估计;
(MVxi,MVyi)=(xi'-xi,yi'-yi)
exi=xi+MVxi-xi' (2)
eyi=xi+MVyi-yi'
其中,(MVxi,MVyi)表示当前帧中宏块i的运动矢量MV,(xi,yi)表示当前帧中宏块i的坐标,(xi',yi')表示参考帧中宏块i的坐标;ei=[exi,eyi]表示运动矢量MV与真实坐标间存在的误差,运动矢量MV被视作(xi-xi',yi-yi');
步骤2-2:建立全局运动模型:
Figure BDA0002994237800000101
其中a,b,c,d,e,f为模型参数,则根据最小二乘法将全局运动模型写为:
Figure BDA0002994237800000102
Figure BDA0002994237800000103
其中,x1…xn表示第1个到第n个图像块;
步骤2-3:式(4)的求解过程采用矩阵形式,如式(5):
Figure BDA0002994237800000104
其中B为左式,A为右式含(xi yi 1)的矩阵,X为全局运动模型模型参数矩阵:
而稳健回归,采用迭代加权最小二乘估计参数。根据前一次计算结果中回归残差的大小来确定各宏块MV的权重,其中ωi为权重,则矩阵解法为:
X=(ATWA)-1ATWB (6)
其中,权重矩阵为:
Figure BDA0002994237800000105
矩阵中,各权重采用下式计算:
Figure BDA0002994237800000106
其中,ε(i)为第i个宏块的运动矢量与由全局运动模型估计的运动矢量的棋盘距离,με为所有ε(i)的均值,σε为ε(i)的方差;
在解得全局运动模型后,ε(i)即为完成补偿后的第i个宏块的运动矢量MV;计算图像帧中所有宏块补偿后的运动矢量,从而完成全局运动的补偿;
进一步地,所述步骤3中计算运动矢量显著性的方法如下:
步骤3-1:在完成全局运动补偿后,需要进一步提取剩余MV中与各邻域内MV差异显著的成分,并将此区域初步判定为包含目标的区域。
遍历图像帧ft内各宏块,计算每个宏块的8-邻域内宏块MV的中值MVmedian
中值MVmedian的计算方法为:对于宏块i,计算宏块i的8-邻域内所有宏块MV的夹角∠θj,并将夹角∠θj进行排序,若宏块i的8-邻域内宏块数为偶数,则取中间两个夹角对应MV的加权和;否则,若宏块i的8-邻域内宏块数为奇数,取中间夹角对应的MV;
Figure BDA0002994237800000111
步骤3-2:记录宏块的8-邻域内宏块个数,记为cnt_adjacency_number;cnt_adjacency_number的取值有3、5、8三种;记录宏块的8-邻域内各宏块MVmedian为零的个数,记为cnt_adjacency_mv_zero;
运动矢量显著性具体逻辑如下:
(1)若当前宏块MV为0,且cnt_adjacency_mv_zero大于等于4,说明当前区域无运动的概率高,将当前宏块的显著性赋值为0;否则若当前宏块MV为0,且cnt_adjacency_mv_zero小于4,说明与周围运动不匹配,可能包含实际运动目标,则将当前宏块的显著性赋值为0.1;
(2)若当前宏块MV非0,计算当前宏块8-邻域内宏块MV的中值MVmedian,进而计算当前宏块MV与MVmedian的余弦相似度:
Figure BDA0002994237800000112
则各非零运动矢量的宏块的显著性由下式表示:
SaliencyMV=1-cos_sim(MV,MVmedian) (9)
最终,由当前帧内各宏块MV计算得到的SaliencyMV组成当前帧的运动矢量显著图,即MV显著图;
进一步地,所述步骤4中依据H.264码流信息计算变换因子显著性的方法如下:
H.264视频编码标准通过应用整数离散余弦变换(DCT,DiscreteCosineTransformation),将视频帧中真实块与预测块像素间的差异变换为频域信号;统一H.264标准中8×8与4×4两类变换方式,规定两类变换的直流DC、低频LF、中频MF、高频HF的界限:
Figure BDA0002994237800000121
Figure BDA0002994237800000122
其中,i,j分别为每个8×8与4×4块的横纵坐标:由于每个8×8块可以包含4个4×4块,则统一后:
Figure BDA0002994237800000123
其中,用#表示对应分量的非零元素数目,round()函数表示四舍五入;
设计变换因子显著性模型为基于加权统计各分量非零元素总数的模型,式(11)中为了更为突出直流以外的频率分量,增加了加权系数,同时保证越高频其权重越高。因高频分量的数目更为突出地反映了实际宏块与预测宏块之间像素域上悬殊差异,下标Coeff即为因子的简写:
定义变换因子显著性模型:
numCoeff=#DC+1.1·(#LF)+1.2·(#MF)+1.3·(#HF) (11)
其中,numCoeff表示对应分量的加权非零元素的数目总和;
将numCoeff进行归一化:
Figure BDA0002994237800000131
其中,tempCoeff为numCoeff归一化后的结果,numCoeffmin、numCoeffmax分别为8X8变换块或由4X4变换块融合成的8X8变换块的8-邻域内的加权非零元素数目最小值与最大值:
然而,当目标发生运动时,部分变换矩阵通常反映出前后帧中目标边缘与背景间的变化差异,故为确保变换因子显著性能覆盖小目标,需将由各处tempCoeff组成的信息进行平滑(如高斯平滑),从而确保tempCoeff能最终囊括目标本体,确保小目标的完整性(gaussian()为高斯平滑函数):对tempCoeff进行高斯平滑:
SaliencyCoeff=gaussian(tempCoeff) (13)
由此得到的SaliencyCoeff为最终的变换因子显著图,即Coeff显著图;
进一步地,所述步骤五利用点乘、加乘的方式实现QP显著性、MV显著性和Coeff显著性的融合的方法如下:
Figure BDA0002994237800000132
将QP显著图作为统领项,将MV显著图与Coeff显著图进行加权相加与对应元素相乘,式(14)中的βitem总和为0.6,用来平衡MV与Coeff两种显著性的取舍程度,γ取0.4;
进一步地,所述步骤6实现对可见光视频码流中运动小目标的检测的具体步骤如下:
步骤6-1:为降低仅由各类显著性检测运动小目标而造成的漏检问题,通过MRF进行再检测,即把检测获得的Saliencyfinal作为先验知识,设置MRF中的各能量项与当前帧运动矢量、当前帧变换矩阵与前序帧检测结果进行关联,实现后验估计;
后验估计通常为处理贝叶斯问题,设当前帧检测结果为Lt∈{0,1},前序帧检测结果为Lt-1∈{0,1},则最大后验概率表示为:
Figure BDA0002994237800000141
其中,MVt表示当前帧的MV场,Coefft表示当前帧的由各Coeff数目组成的场;则最大后验概率转化为求解使得分子取最大值时的Lt,Ω表示为当前帧所有检测结果,即标签的组合:
Figure BDA0002994237800000142
由于MRF与服从Gibbs分布的随机场等价,因此将上述公式求对数,同时设计能量函数进行求解,各能量函数的表达如下:
Figure BDA0002994237800000143
Figure BDA0002994237800000144
Figure BDA0002994237800000145
Figure BDA0002994237800000146
等价于:
Figure BDA0002994237800000147
式(18)中右边第一项:时域连续性;E1(ψ;Lt-1,MVt,Coefft)中在时间连续中直接相关的变量仅为MV,因此将能量函数退化为E1(ψ;Lt-1,MVt);考虑到标记为0的分块对当前检测结果没有影响,故仅需考虑上一帧中标记为1的分块。设当前帧ft中某4X4分块b标记为1,则由其MV反推至前序帧ft-1中的对应区域,通过统计对应区域中标记为1的数目,则获得当前分块b为目标的概率p(b):标记为1的数目除以16,则E1(ψ;Lt-1,MVt)为所有标记为1的分块b的概率总和;
式(18)中右边第二项:显著区域继承性;E2(ψ;MVt,Coefft)能量函数仅取决于MV、Coeff:由最终的显著性Saliencyfinal充分考虑了两者,故E2(ψ;MVt,Coefft)以Saliencyfinal为基础,通过下述方法将其取值范围[0,1]映射至各位置对应的能量函数。从而保证最终检测结果为Lt∈{0,1}。与此同时,在初始帧进行检测时,由于不存在L0,故时域连续性在第一帧中无法进行运用,此时显著区域继承性承担了初始化的任务。
Figure BDA0002994237800000151
式中,c块为b块的邻域块,包含b块本身;若b块处的Saliencyfinal与其邻域内的最大值相差大于预设阈值,且其值大于0.5,则认为块b为目标区域,否则,认为b块仍为背景;
式(18)中右边第三项:邻域关联性;一般视频中的运动目标具有区域相关性,即已知帧中某块邻域块属于目标,则该块从属于同一目标的概率有所增加。在E3(ψ)中,采用具有不同权重的8-邻域区域,计算邻域相关性,则此分块权重通过当前块邻域标记加权和计算:
Figure BDA0002994237800000152
其中N1(b)和N2(b)分别为块b的一阶即上下左右和二阶即左上、右上、右下、左下邻域;相邻块中标记为1的块的数量与能量项呈负相关,块b属于目标的概率越大,从而保证
Figure BDA0002994237800000153
可以取更小的值;在实验中设定α=1/6和β=1/12,以增大一阶邻域的权重。
在MRF开始前,前一帧的标签作为当前帧的初始标签,若当前帧为第一帧,则此时初始标签全设置为0;在迭代MRF至能量函数前后两次变化量小于0.01后退出迭代,输出结果,完成最终的运动小目标检测。
从最终的检测结果图2中看出,本发明提出的针对运动小目标检测的方法在含有多个目标的场景中,克服了目标所含像素小与环境相似可能引入的检测精度问题,最终检测得到的目标完整性好,降低了漏检率,提高了检测精度,实现了对运动小目标的精确检测。

Claims (8)

1.一种基于H.264视频码流的运动小目标检测方法,其特征在于,包括以下步骤:
步骤1:依据H.264码流信息计算量化参数显著性,即QP显著性;
步骤2:依据H.264码流中原始运动矢量数据,建立全局运动估计模型,并补偿原始运动矢量数据;
步骤3:依据补偿后的运动矢量,计算运动矢量显著性,即MV显著性;
步骤4:依据H.264码流信息计算变换因子显著性,即Coeff显著性;
步骤5:利用点乘、加乘的方式实现QP显著性、MV显著性和Coeff显著性的融合;
步骤6:利用马尔可夫随机场MRF计算当前帧运动矢量、当前帧变换因子矩阵与前序帧检测结果的后验估计,实现对可见光视频码流中运动小目标的检测。
2.根据权利要求1所述的一种基于H.264视频码流的运动小目标检测方法,其特征在于,所述步骤1中依据H.264码流信息计算量化参数显著性的方法如下:
设序列图像F,帧长度为m,其中各帧由ft,t=1,2,...,m表示;将第t帧ft划分为多个a1×a1大小的像素块,将该像素块定义为宏块,每一个宏块共用一个QP值,第j个宏块的量化参数显著性SaliencyQPj为:
Figure FDA0002994237790000011
其中,QPmax和QP min分别为帧ft中最大QP值和最小QP值,j=1,…,n,n为帧ft中宏块的个数,QPj为第j个宏块的QP值;
计算图像帧ft中所有宏块的量化参数显著性,再将计算出的所有量化参数显著性按照各宏块在图像帧中的位置排列,从而获得SaliencyQP,即QP显著图。
3.根据权利要求2所述的一种基于H.264视频码流的运动小目标检测方法,其特征在于,所述步骤2中建立全局运动估计模型,并补偿原始运动矢量数据的步骤如下:
步骤2-1:采用稳健回归估计的方式,利用迭代加权最小二乘估计参数,实现全局运动模型估计;
Figure FDA0002994237790000012
其中,(MVxi,MVyi)表示当前帧中宏块i的运动矢量MV,(xi,yi)表示当前帧中宏块i的坐标,(xi',yi')表示参考帧中宏块i的坐标;ei=[exi,eyi]表示运动矢量MV与真实坐标间存在的误差,运动矢量MV被视作(xi-xi',yi-yi');
步骤2-2:建立全局运动模型:
Figure FDA0002994237790000021
其中a,b,c,d,e,f为模型参数,则根据最小二乘法将全局运动模型写为:
Figure FDA0002994237790000022
其中,x1…xn表示第1个到第n个图像块;
步骤2-3:式(4)的求解过程采用矩阵形式,如式(5):
Figure FDA0002994237790000023
其中B为左式,A为右式含(xi yi 1)的矩阵,X为全局运动模型模型参数矩阵:
采用迭代加权最小二乘估计参数,则矩阵解法为:
X=(ATWA)-1ATWB (6)
其中,权重矩阵为:
Figure FDA0002994237790000024
矩阵中,各权重采用下式计算:
Figure FDA0002994237790000025
其中,ε(i)为第i个宏块的运动矢量与由全局运动模型估计的运动矢量的棋盘距离,με为所有ε(i)的均值,σε为ε(i)的方差;
在解得全局运动模型后,ε(i)即为完成补偿后的第i个宏块的运动矢量MV;计算图像帧中所有宏块补偿后的运动矢量,从而完成全局运动的补偿。
4.根据权利要求3所述的一种基于H.264视频码流的运动小目标检测方法,其特征在于,所述步骤3中计算运动矢量显著性的方法如下:
步骤3-1:遍历图像帧ft内各宏块,计算每个宏块的8-邻域内宏块MV的中值MVmedian
中值MVmedian的计算方法为:对于宏块i,计算宏块i的8-邻域内所有宏块MV的夹角∠θj,并将夹角∠θj进行排序,若宏块i的8-邻域内宏块数为偶数,则取中间两个夹角对应MV的加权和;否则,若宏块i的8-邻域内宏块数为奇数,取中间夹角对应的MV;
Figure FDA0002994237790000031
步骤3-2:记录宏块的8-邻域内宏块个数,记为cnt_adjacency_number;cnt_adjacency_number的取值有3、5、8三种;记录宏块的8-邻域内各宏块MVmedian为零的个数,记为cnt_adjacency_mv_zero;
运动矢量显著性具体逻辑如下:
(1)若当前宏块MV为0,且cnt_adjacency_mv_zero大于等于4,将当前宏块的显著性赋值为0;否则若当前宏块MV为0,且cnt_adjacency_mv_zero小于4,则将当前宏块的显著性赋值为0.1;
(2)若当前宏块MV非0,计算当前宏块8-邻域内宏块MV的中值MVmedian,进而计算当前宏块MV与MVmedian的余弦相似度:
Figure FDA0002994237790000032
则各非零运动矢量的宏块的显著性由下式表示:
SaliencyMV=1-cos_sim(MV,MVmedian) (9)
最终,由当前帧内各宏块MV计算得到的SaliencyMV组成当前帧的运动矢量显著图,即MV显著图。
5.根据权利要求4所述的一种基于H.264视频码流的运动小目标检测方法,其特征在于,所述步骤4中依据H.264码流信息计算变换因子显著性的方法如下:
H.264视频编码标准通过应用整数离散余弦变换DCT,将视频帧中真实块与预测块像素间的差异变换为频域信号;统一H.264标准中8×8与4×4两类变换方式,规定两类变换的直流DC、低频LF、中频MF、高频HF的界限:
Figure FDA0002994237790000041
Figure FDA0002994237790000042
其中,i,j分别为每个8×8与4×4块的横纵坐标:由于每个8×8块可以包含4个4×4块,则统一后:
Figure FDA0002994237790000043
其中,用#表示对应分量的非零元素数目,round()函数表示四舍五入;
定义变换因子显著性模型:
numCoeff=#DC+1.1·(#LF)+1.2·(#MF)+1.3·(#HF) (11)
其中,numCoeff表示对应分量的加权非零元素的数目总和;
将numCoeff进行归一化:
Figure FDA0002994237790000044
其中,tempCoeff为numCoeff归一化后的结果,numCoeffmin、numCoeffmax分别为8X8变换块或由4X4变换块融合成的8X8变换块的8-邻域内的加权非零元素数目最小值与最大值:
对tempCoeff进行高斯平滑:
SaliencyCoeff=gaussian(tempCoeff) (13)
由此得到的SaliencyCoeff为最终的变换因子显著图,即Coeff显著图。
6.根据权利要求5所述的一种基于H.264视频码流的运动小目标检测方法,其特征在于,所述步骤五利用点乘、加乘的方式实现QP显著性、MV显著性和Coeff显著性的融合的方法如下:
Figure FDA0002994237790000051
将QP显著图作为统领项,将MV显著图与Coeff显著图进行加权相加与对应元素相乘,式(14)中的βitem总和为0.6,用来平衡MV与Coeff两种显著性的取舍程度,γ取0.4。
7.根据权利要求6所述的一种基于H.264视频码流的运动小目标检测方法,其特征在于,所述步骤6实现对可见光视频码流中运动小目标的检测的具体步骤如下:
步骤6-1:通过MRF进行再检测,即把检测获得的Saliencyfinal作为先验知识,设置MRF中的各能量项与当前帧运动矢量、当前帧变换矩阵与前序帧检测结果进行关联,实现后验估计;
后验估计通常为处理贝叶斯问题,设当前帧检测结果为Lt∈{0,1},前序帧检测结果为Lt-1∈{0,1},则最大后验概率表示为:
Figure FDA0002994237790000052
其中,MVt表示当前帧的MV场,Coefft表示当前帧的由各Coeff数目组成的场;则最大后验概率转化为求解使得分子取最大值时的Lt,Ω表示为当前帧所有检测结果,即标签的组合:
Figure FDA0002994237790000053
由于MRF与服从Gibbs分布的随机场等价,因此将上述公式求对数,同时设计能量函数进行求解,各能量函数的表达如下:
Figure FDA0002994237790000061
Figure FDA0002994237790000062
Figure FDA0002994237790000063
Figure FDA0002994237790000064
等价于:
Figure FDA0002994237790000065
式(18)中右边第一项:时域连续性;E1(ψ;Lt-1,MVt,Coefft)中在时间连续中直接相关的变量仅为MV,因此将能量函数退化为E1(ψ;Lt-1,MVt);设当前帧ft中某4X4分块b标记为1,则由其MV反推至前序帧ft-1中的对应区域,通过统计对应区域中标记为1的数目,则获得当前分块b为目标的概率p(b):标记为1的数目除以16,则E1(ψ;Lt-1,MVt)为所有标记为1的分块b的概率总和;
式(18)中右边第二项:显著区域继承性;E2(ψ;MVt,Coefft)能量函数仅取决于MV、Coeff:
Figure FDA0002994237790000066
式中,c块为b块的邻域块,包含b块本身;若b块处的Saliencyfinal与其邻域内的最大值相差大于预设阈值,且其值大于0.5,则认为块b为目标区域,否则,认为b块仍为背景;
式(18)中右边第三项:邻域关联性;在E3(ψ)中,采用具有不同权重的8-邻域区域,计算邻域相关性,则此分块权重通过当前块邻域标记加权和计算:
Figure FDA0002994237790000067
其中N1(b)和N2(b)分别为块b的一阶即上下左右和二阶即左上、右上、右下、左下邻域;相邻块中标记为1的块的数量与能量项呈负相关,块b属于目标的概率越大,从而保证
Figure FDA0002994237790000071
可以取更小的值;
在MRF开始前,前一帧的标签作为当前帧的初始标签,若当前帧为第一帧,则此时初始标签全设置为0;在迭代MRF至能量函数前后两次变化量小于0.01后退出迭代,输出结果,完成最终的运动小目标检测。
8.根据权利要求2所述的一种基于H.264视频码流的运动小目标检测方法,其特征在于,所述a1=16。
CN202110324939.3A 2021-03-26 2021-03-26 一种基于h264视频码流的运动小目标检测方法 Active CN113112527B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110324939.3A CN113112527B (zh) 2021-03-26 2021-03-26 一种基于h264视频码流的运动小目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110324939.3A CN113112527B (zh) 2021-03-26 2021-03-26 一种基于h264视频码流的运动小目标检测方法

Publications (2)

Publication Number Publication Date
CN113112527A true CN113112527A (zh) 2021-07-13
CN113112527B CN113112527B (zh) 2024-01-09

Family

ID=76712266

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110324939.3A Active CN113112527B (zh) 2021-03-26 2021-03-26 一种基于h264视频码流的运动小目标检测方法

Country Status (1)

Country Link
CN (1) CN113112527B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114155425A (zh) * 2021-12-13 2022-03-08 中国科学院光电技术研究所 基于高斯马尔可夫随机场运动方向估计的弱小目标检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110300977A (zh) * 2017-02-17 2019-10-01 考吉森公司 用于图像处理和视频压缩的方法
CN110910417A (zh) * 2019-10-29 2020-03-24 西北工业大学 一种基于超像素邻帧特征对比的弱小运动目标检测方法
CN110910421A (zh) * 2019-11-11 2020-03-24 西北工业大学 基于分块表征和可变邻域聚类的弱小运动目标检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110300977A (zh) * 2017-02-17 2019-10-01 考吉森公司 用于图像处理和视频压缩的方法
CN110910417A (zh) * 2019-10-29 2020-03-24 西北工业大学 一种基于超像素邻帧特征对比的弱小运动目标检测方法
CN110910421A (zh) * 2019-11-11 2020-03-24 西北工业大学 基于分块表征和可变邻域聚类的弱小运动目标检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GAOSHENG FANG: "Phase-Sensitive Optical Time Domain Reflectometer Based on Phase-Generated Carrier Algorithm", JOURNAL OF LIGHTWAVE TECHNOLOGY, vol. 33, no. 13, XP011583107, DOI: 10.1109/JLT.2015.2414416 *
陈明生: "复杂背景下 H.264 压缩域运动目标检测算法", 通信学报, vol. 32, no. 3 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114155425A (zh) * 2021-12-13 2022-03-08 中国科学院光电技术研究所 基于高斯马尔可夫随机场运动方向估计的弱小目标检测方法
CN114155425B (zh) * 2021-12-13 2023-04-07 中国科学院光电技术研究所 基于高斯马尔可夫随机场运动方向估计的弱小目标检测方法

Also Published As

Publication number Publication date
CN113112527B (zh) 2024-01-09

Similar Documents

Publication Publication Date Title
Arias et al. Video denoising via empirical bayesian estimation of space-time patches
EP1639829B1 (en) Optical flow estimation method
CN107680120A (zh) 基于稀疏表示和转移受限粒子滤波的红外小目标跟踪方法
US20150104062A1 (en) Probabilistic neural network based moving object detection method and an apparatus using the same
CN104408742A (zh) 一种基于空间-时间频谱联合分析的运动目标检测方法
US20160225161A1 (en) Method and apparatus for hierachical motion estimation in the presence of more than one moving object in a search window
CN102014281A (zh) 具有非线性运动场平滑的运动估计的方法和系统
CN108270945B (zh) 一种运动补偿去噪方法及装置
Biswas et al. Anomaly detection in compressed H. 264/AVC video
Santamaria et al. Estimation of rate control parameters for video coding using CNN
CN113112527A (zh) 一种基于h264视频码流的运动小目标检测方法
Roy et al. A comprehensive survey on computer vision based approaches for moving object detection
CN101127121A (zh) 一种基于自适应初始搜索点预测的目标跟踪算法
Zhang et al. An edge and color oriented optical flow estimation using block matching
Coelho et al. Data-driven motion estimation with spatial adaptation
Zheng et al. Local-to-global background modeling for moving object detection from non-static cameras
CN108319970B (zh) 基于压缩感知的声纳图像超分辨率重建目标跟踪和检测方法
Sridevi et al. Efficient motion compensation and detection algorithm using modified Kalman filtering
Sarode et al. Image sequence denoising with motion estimation in color image sequences
Walha et al. Moving object detection system in aerial video surveillance
Yousaf et al. Real time video stabilization methods in IR domain for UAVs—A review
Tanakian et al. Digital video stabilizer by adaptive fuzzy filtering
Li et al. Video signal-dependent noise estimation via inter-frame prediction
Aswini et al. Video Stabilization for Drone Surveillance System
Bakkouri et al. FCM-based fast texture CU size decision algorithm for 3D-HEVC inter-coding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant