CN110287819A - 动态背景下基于低秩及稀疏分解的动目标检测方法 - Google Patents

动态背景下基于低秩及稀疏分解的动目标检测方法 Download PDF

Info

Publication number
CN110287819A
CN110287819A CN201910485971.2A CN201910485971A CN110287819A CN 110287819 A CN110287819 A CN 110287819A CN 201910485971 A CN201910485971 A CN 201910485971A CN 110287819 A CN110287819 A CN 110287819A
Authority
CN
China
Prior art keywords
norm
matrix
foreground
target detection
rank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910485971.2A
Other languages
English (en)
Other versions
CN110287819B (zh
Inventor
王洪雁
张海坤
伊林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University
Original Assignee
Dalian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University filed Critical Dalian University
Priority to CN201910485971.2A priority Critical patent/CN110287819B/zh
Publication of CN110287819A publication Critical patent/CN110287819A/zh
Application granted granted Critical
Publication of CN110287819B publication Critical patent/CN110287819B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于计算机视觉领域,涉及动态背景下基于低秩及稀疏分解的动目标检测方法,该方法首先引入伽马范数(γ‑norm)近乎无偏地逼近秩函数以解决核范数过度惩罚较大奇异值导致所得最小化问题无法获得最优解进而降低检测性能的问题,利用L1/2范数抽取稀疏前景目标以增强对噪声的稳健性。基于虚警像素具有稀疏且空间不连续特性提出空间连续性约束以抑制动态背景像素,进而构建目标检测模型。利用基于交替方向最小化策略扩展的增广拉格朗日乘子法对所得优化问题求解。本发明显著改善动态背景情况下动目标检测精度。

Description

动态背景下基于低秩及稀疏分解的动目标检测方法
技术领域
本发明属于计算机视觉领域,涉及动态背景下基于低秩及稀疏分解的动目标检测方法。
背景技术
动目标检测是计算机视觉领域极具活力的研究方向之一,在交通监控,车流量检测,增强现实等方面具有广泛应用。作为自动视频分析的第一步,动目标检测旨在确定和分割感兴趣目标,据此为后续目标追踪和行为识别提供依据。
近年来,众多基于视频的动目标检测方法相继被提出,相关算法大致可分为以下三类:帧差法,光流法和背景减除(background subtraction,BS)法。其中,帧差法快速简单,但其仅在相邻帧间比较动目标与背景差异导致无法提取完整目标区域。光流法依据视频序列时空梯度估算运动场,无需场景任何先验信息,然而需计算整幅图像光流信息,因而计算开销较大,通常无法满足实时性需求。BS法作为动目标检测常用方法,其将建模所得背景模板和视频帧对比,把变化部分视为运动目标。BS法关键在于背景模型构建,其中传统中值模型、均值模型和单高斯模型等构建方法虽较为简单,但存在大量环境噪声或运动背景时目标检测效果不甚理想。针对此问题,Stauffer等提出高斯混合(mixture of Gaussian,MoG)模型,该模型未将所有像素建模为特定分布,而利用MoG对逐个像素建模,因而可获得相对稳定且精确的模型,然而由于模型参数固定导致其难以适应场景变化。针对此缺点,Zivkovic提出一种改进自适应高斯混合模型,各像素MoG参数及数量均自适应场景变化,但建模时间较长,不利于实时处理。针对此问题,Candès等提出稳健主分量分析(robustprincipal component analysis,RPCA)模型,将观测矩阵分解为低秩与稀疏矩阵,分别对背景和前景建模,而后利用主分量追踪(principal component pursuit,PCP)方法求解该问题。由于RPCA模型不存在参数更新问题,因而可显著改善目标检测实时性能,然而其未考虑观测噪声影响,使得噪声环境下动目标检测精度显著下降。基于此,Ding等提出贝叶斯稳健主分量分析(Bayesian robust principal component analysis,BRPCA)模型,将观测矩阵表示为低秩矩阵、稀疏矩阵和噪声矩阵的叠加,同时引入贝叶斯方法以增强模型对噪声的稳健性。然而,实际场景中,当观测矩阵出现数据丢失时,该模型所使用的L2损失项将导致检测性能下降。针对此问题,Wang等提出稳健矩阵分解的概率(probabilistic robustmatrix factorization,PRMF)方法,基于L1损失项及L2正则项以改善数据丢失情况下矩阵分解的稳健性。然而,由于其未能利用前景像素空间分布特性从而导致算法虚警率较高,进而使得动态背景下动目标检测性能较低。针对此问题,Zhou等提出低秩表示检测连续前景(detecting contiguous outliers in the low-rank representation,DECOLOR)方法,利用视频序列中稀疏前景聚类特性解决动态背景下PRMF方法动目标检测性能不佳问题,然而由于该模型的贪婪特性,强运动背景场景下动目标周围部分背景像素被分类为前景,从而导致动目标检测精度显著降低。
发明内容
针对背景运动引起动目标检测精度显著下降的问题,本发明提出动态背景下基于低秩及稀疏分解的动目标检测方法。
实现本发明的基本思路是,基于RPCA检测模型,首先引入γ范数近似矩阵秩函数以解决核范数过度惩罚较大奇异值导致有偏估计,致使最小化问题无法获得最优解进而降低动目标检测性能的问题;而后针对L1范数孤立处理各元素未充分使用前景像素空域先验信息导致检测性能不佳的问题,本发明利用L1/2范数对前景进行稀疏约束以抑制动态背景引起的虚警现象;进而,基于虚警像素的稀疏及空间不连续特性,对前景施加空间连续性约束;最后,利用基于交替方向最小化(ADM)策略扩展的增广拉格朗日乘子(ALM)法求解所得模型。
本发明解决其技术问题的步骤是:
步骤1:RPCA检测模型
设存在图像序列其中m为图像高度,n为图像宽度,s为帧数。将该图像序列重构为则动目标检测可建模为如下RPCA问题:
其中,分别为低秩背景和稀疏前景矩阵,||·||*表示核范数,||·||1为L1范数,λ为权衡低秩和稀疏度的正则因子。
尽管RPCA模型在某些简单场景下可较好实现动目标检测,但当真实视频序列中前景受到噪声和动态背景影响时该模型很难精确抽取前景目标。使用CDnet-2014数据集中包含动态背景的Fountain01和Canoe视频序列验证RPCA模型在背景运动情况下的动目标检测性能,其中RPCA模型参数均使用Candès等提出模型的默认值。动态背景下利用RPCA模型进行动目标检测结果如图2所示。由图2可知,RPCA模型无法完整检测动目标,且前景中充斥大量动态背景像素,因而动目标检测性能较差。主要原因在于核范数为有偏估计,用其近似矩阵秩函数会过度惩罚矩阵较大奇异值,从而导致核范数最小化问题无法获得最优解进而降低动目标检测性能。针对此问题,本发明采用非凸γ范数代替核范数以获得秩函数近乎无偏估计从而使得所得最小化问题获得最优解,进而改善动目标检测性能。此外,L1范数单独处理各元素未考虑前景像素之间空域先验信息,使其难以在动态背景中取得较好效果。相较于L1范数,L1/2范数可抽取更加稀疏前景矩阵,因此由动态背景造成的虚警率更低。同时,根据虚警像素稀疏且空域不连续特性,对前景施加空间连续性约束可较好抑制动态背景像素的影响。综上所述,本发明提出基于γ和L1/2范数空间连续性正则化低秩近似(γ-norm&L1/2-normand Spatial Continuity regularized Low-Rank approximation,SCLR-γ&L1/2)动目标检测方法以改善动态背景下目标检测精度。
步骤2:基于SCLR-γ&L1/2的目标检测方法
(1)γ范数
由于核范数会过度惩罚大奇异值,从而导致有偏估计,而非凸MCP(MinmaxConcave Plus)函数可近似无偏估计矩阵秩函数,因而作为MCP矩阵扩展形式的γ范数在秩最小化问题中可获得更好近似解。给定向量λ>0,γ>1,则MCP函数可定义如下:
其中,
其中,(z)+=max{z,0}。基于式(2),给定矩阵其矩阵MCP范数可定义为:
设矩阵A奇异值分解可表示为A=U∑VT,其中,U=[u1,u2,…,un],V=[v1,v2,…,vn],∑=diag(σ12,…,σn),且σ1≥σ2≥…≥σn≥0,σi(A)表示A的第i个奇异值,令σ(A)=(σ1(A),…,σr(A))T,r=min{m,n}。为便于后续表述,定义Ωγ(t)=Ω1,γ(t),Mγ(A)=M1,γ(A),则矩阵A的γ范数可定义如下:
(2)L1/2范数
处理图像时为得到更加稀疏近似解,近年来许多研究将L1范数正则化扩展至Lq范数(0<q<1)。Lq正则化问题中,由于q≤1时矩阵稀疏特性较为明显,因而其相较于q>1更适用于低秩模型。此外,当时,q值越小,Lq正则化解越稀疏;当时,Lq正则化解稀疏性无显著差异。由此可知,L1/2范数相较于L1范数具有较好稀疏特性。假设矩阵A划分为{A1,A2,…,As},则L1/2范数定义为:
(3)空间连续性约束
现实场景中动态背景不可避免,RPCA模型未利用稀疏前景像素间空间先验信息,因而所得前景矩阵K包含前景像素及动态背景像素。值得注意的是,前景矩阵K中由动态背景造成的虚警像素虽具有稀疏性但并不具有空域连续数。基于此观察,对前景施加空间连续性约束以抑制动态背景像素可使所得前景更加完整平滑,进而降低检测虚警率。设前景矩阵由视频序列{K1,K2,…,Ks}构成,其中为序列第k帧。则空间连续性约束可表示如下:
其中,||Kk||SC为第k帧所有像素值之和,即:
其中,分别定义为图像水平和垂直方向上的操作:
其中,Kk(i,j)为第k帧图像i行j列位置的像素值。
(4)构建SCLR-γ&L1/2动目标检测模型
综上所述,为提高秩函数近似精度且在抽取稀疏前景目标同时抑制动态背景的影响,本发明提出如下动目标检测模型:
其中,为矩阵K的L1/2正则化,||·||2为欧式范数,Φ(K)为空间连续性约束,已在式(7)中定义。参数λ1用于限制前景稀疏性,参数λ2用于控制空间连续性约束的强度。
(5)所提模型求解
在求解RPCA相关模型时,由于ALM法可获得较好Q线性收敛速度,而加速近端梯度(accelerated proximal gradient,APG)法理论上只能达到次线性收敛速度,同时ALM法可较好平衡准确性和计算效率,用ALM法求解式(11)动目标检测优化问题。
为方便后续使用交替最小化策略求解,此处引入辅助变量G对其进行空间连续性约束,此时式(11)转化为如下等价问题:
则增广拉格朗日函数可表示为:
其中,Y1和Y2为拉格朗日乘子,μ1和μ2为惩罚参数。
为求解上述优化问题,采用ADM方法迭代优化变量。因此,式(13)最优化问题可划分为如下四个子问题:
1)更新Hk+1
由WANG Shusen等人所提方法可知,由于||H||γ关于σ(H)非凸,可对矩阵MCP范数局部线性逼近(locally linear approximation,LLA)进行凸松弛求解,即在每次迭代时使用||H||γ在σ(Hold)的LLA进行近似求解,其中Hold为上一次迭代值。因此,式(14)可进一步表示为:
其中,为给定Aold时Mγ(A)的LLA。
式(15)最优解可通过下式得到:
其中,为广义奇异值收缩算子,Ι为单位矩阵。[Dτ,Λ(A)]ij=sgn(Aij)(|Aij|-τΛij)为广义收缩算子,其中sgn(·)为符号函数,定义为:
2)更新Kk+1
上式可通过Xu Z等人所提出方法中的半阈值化算子(half-thresholdingoperator,HTO)求解。在进行式(18)的求解前,先由L1/2正则化问题推导出HTO:
其中,为给定矩阵,y为观测数据,为待恢复稀疏结构,||·||定义为欧几里得范数,λ>0为正则化参数。对于式(19),由x一阶最优性条件可得:
其中,为惩罚项的梯度。在式(20)两端同乘正参数μ得到:
只要的预解式存在,即算子:
对于任意正实数λ均被很好定义,则:
定义Bμ(x)=x+μAT(y-Ax),则得到:
x=Rλμ,1/2(Bμ(x)) (24)
由Xu Z等人所提方法可知,对角非线性解析表示算子:
Rλ,1/2(x)=((fλ,1/2(x1),fλ,1/2(x2),…,fλ,1/2(xN)))T (25)
其中,
且,
由此,可得L1/2正则化问题阈值化函数如下所示:
则式(19)L1/2正则化问题阈值可表示为:
x=Hλμ,1/2(Bμ(x)) (29)
其中,
Hλμ,1/2(x)=(hλμ,1/2(x1),hλμ,1/2(x2),…,hλμ,1/2(xN))T (30)
式(28)称为半阈值化函数,Hλμ,1/2称为半阈值化算子。
综上所述,基于半阈值化算子,可得问题(18)最优解为:
3)更新Gk+1
式(32)可等价为:
假设基于式(7),问题(33)可重新表示为:
其中,将Gj和Wj重塑为二维形式,即:
式(35)的最优化问题可拆分为s个子问题,且每个子问题都可使用Beck A等人所提方法中的快速梯度投影(fast gradient projection)法求解,即:
其中,(p,q)为矩阵对,且满足以下条件:
L为线性算子:定义如下:
L(p,q)i,j=pi,j+qi,j-pi-1,j-qi,j-1,i=1,…,m;j=1,…,n (38)
PC表示集合上的正交投影算子。对于n维空间若C=Bl,u,则
获得各子问题最优解后,将其重塑为则Gk+1可通过下式更新:
4)更新拉格朗日乘子:
Y2 k+1=Y2 k2(Gk+1-Kk+1) (42)
综上所述,在已知观测矩阵Z条件下,通过式(16),(31)和(40)交替优化H,K和G直至满足以下迭代收敛条件:
从而可获得最稀疏前景及低秩背景矩阵,其中参数为控制误差的常数,依据实验本发明选取
基于上述讨论,本发明所提基于低秩与稀疏分解的动目标检测方法步骤如表1所示:
表1低秩与稀疏分解动目标检测方法
本发明与现有技术相比具有以下优点:
本发明引入γ范数代替核范数以获得秩函数近乎无偏估计以提高检测准确率;此外本发明利用L1/2范数抽取稀疏前景目标以增强对噪声的稳健性;同时,基于虚警像素具有稀疏且空间不连续特性提出空间连续性约束以抑制动态背景像素。
附图说明
图1为本发明实现的流程图;
图2为RPCA检测结果;
图3为所提方法与PCP,MoG,PRMF,DEC及BRPCA算法检测结果对比;
图4为动目标检测定量分析对比图。(a)-(e)为Boats,Bottle,Rain,Fountain及Fall场景下检测结果定量分析对比。(f)为6种算法在5个场景下三个性能指标的平均值对比图。
具体实施方式
下面结合附图1对本发明的实现步骤做进一步详细描述:
步骤1:RPCA检测模型
设存在图像序列其中m为图像高度,n为图像宽度,s为帧数。将该图像序列重构为则动目标检测可建模为如下RPCA问题:
其中,分别为低秩背景和稀疏前景矩阵,||·||*表示核范数,||·||1为L1范数,λ为权衡低秩和稀疏度的正则因子。
尽管RPCA模型在某些简单场景下可较好实现动目标检测,但当真实视频序列中前景受到噪声和动态背景影响时该模型很难精确抽取前景目标。使用CDnet-2014数据集中包含动态背景的Fountain01和Canoe视频序列验证RPCA模型在背景运动情况下的动目标检测性能,其中RPCA模型参数均使用Candès等提出模型的默认值。动态背景下利用RPCA模型进行动目标检测结果如图2所示。由图2可知,RPCA模型无法完整检测动目标,且前景中充斥大量动态背景像素,因而动目标检测性能较差。主要原因在于核范数为有偏估计,用其近似矩阵秩函数会过度惩罚矩阵较大奇异值,从而导致核范数最小化问题无法获得最优解进而降低动目标检测性能。针对此问题,本发明采用非凸γ范数代替核范数以获得秩函数近乎无偏估计从而使得所得最小化问题获得最优解,进而改善动目标检测性能。此外,L1范数单独处理各元素未考虑前景像素之间空域先验信息,使其难以在动态背景中取得较好效果。相较于L1范数,L1/2范数可抽取更加稀疏前景矩阵,因此由动态背景造成的虚警率更低。同时,根据虚警像素稀疏且空域不连续特性,对前景施加空间连续性约束可较好抑制动态背景像素的影响。综上所述,本发明提出基于γ和L1/2范数空间连续性正则化低秩近似(γ-norm&L1/2-normand Spatial Continuity regularized Low-Rank approximation,SCLR-γ&L1/2)动目标检测方法以改善动态背景下目标检测精度。
步骤2:基于SCLR-γ&L1/2的目标检测方法
(1)γ范数
由于核范数会过度惩罚大奇异值,从而导致有偏估计,而非凸MCP(MinmaxConcave Plus)函数可近似无偏估计矩阵秩函数,因而作为MCP矩阵扩展形式的γ范数在秩最小化问题中可获得更好近似解。给定向量λ>0,γ>1,MCP函数可定义如下:
其中,
其中,(z)+=max{z,0}。基于式(45),给定矩阵其MCP范数可定义为:
设矩阵A奇异值分解可表示为A=U∑VT,其中,U=[u1,u2,…,un],V=[v1,v2,…,vn],∑=diag(σ12,…,σn),且σ1≥σ2≥…≥σn≥0,σi(A)表示A的第i个奇异值,令σ(A)=(σ1(A),…,σr(A))T,r=min{m,n}。为便于后续表述,定义Ωγ(t)=Ω1,γ(t),Mγ(A)=M1,γ(A),则矩阵A的γ范数可定义如下:
(2)L1/2范数
处理图像时为得到更加稀疏近似解,近年来许多研究将L1范数正则化扩展至Lq范数(0<q<1)。Lq正则化问题中,由于q≤1时矩阵稀疏特性较为明显,因而其相较于q>1更适用于低秩模型。此外,当时,q值越小,Lq正则化解越稀疏;当时,Lq正则化解稀疏性无显著差异。由此可知,L1/2范数相较于L1范数具有较好稀疏特性。假设矩阵A划分为{A1,A2,…,As},则L1/2范数定义为:
(3)空间连续性约束
现实场景中动态背景不可避免,RPCA模型未利用稀疏前景像素间空间先验信息,因而所得前景矩阵K包含前景像素及动态背景像素。值得注意的是,前景矩阵K中由动态背景造成的虚警像素虽具有稀疏性但并不具有空域连续数。基于此观察,对前景施加空间连续性约束以抑制动态背景像素可使所得前景更加完整平滑,进而降低检测虚警率。设前景矩阵由视频序列{K1,K2,…,Ks}构成,其中为序列第k帧。则空间连续性约束可表示如下:
其中,||Kk||SC为第k帧所有像素值之和,即:
其中,分别定义为图像水平和垂直方向上的操作:
其中,Kk(i,j)为第k帧图像i行j列位置的像素值。
(4)构建SCLR-γ&L1/2动目标检测模型
综上所述,为提高秩函数近似精度且在抽取稀疏前景目标同时抑制动态背景的影响,本发明提出如下动目标检测模型:
其中,为矩阵K的L1/2正则化,||·||2为欧式范数,Φ(K)为空间连续性约束,已在式(50)中定义。参数λ1用于限制前景稀疏性,参数λ2用于控制空间连续性约束的强度。
(5)所提模型求解
在求解RPCA相关模型时,由于ALM法可获得较好Q线性收敛速度,而加速近端梯度(accelerated proximal gradient,APG)法理论上只能达到次线性收敛速度,同时ALM法可较好平衡准确性和计算效率,用ALM法求解式(54)动目标检测优化问题。
为方便后续使用交替最小化策略求解,此处引入辅助变量G对其进行空间连续性约束,此时式(54)转化为如下等价问题:
则增广拉格朗日函数可表示为:
其中,Y1和Y2为拉格朗日乘子,μ1和μ2为惩罚参数。
为求解上述优化问题,采用ADM方法迭代优化变量。因此,式(56)最优化问题可划分为如下四个子问题:
1)更新Hk+1
由WANG Shusen等人所提方法可知,由于||H||γ关于σ(H)非凸,可对矩阵MCP范数局部线性逼近(locally linear approximation,LLA)进行凸松弛求解,即在每次迭代时使用||H||γ在σ(Hold)的LLA进行近似求解,其中Hold为上一次迭代值。因此,式(57)可进一步表示为:
其中,为给定Aold时Mγ(A)的LLA。
式(58)最优解通过下式得到:
其中,为广义奇异值收缩算子,Ι为单位矩阵。[Dτ,Λ(A)]ij=sgn(Aij)(|Aij|-τΛij)为广义收缩算子,其中sgn(·)为符号函数,定义为:
2)更新Kk+1
上式可通过Xu Z等人所提出方法中的半阈值化算子(half-thresholdingoperator,HTO)求解。在进行式(61)的求解前,先由L1/2正则化问题推导出HTO:
其中,为给定矩阵,y为观测数据,为待恢复稀疏结构,||·||定义为欧几里得范数,λ>0为正则化参数。对于式(62),由x一阶最优性条件可得:
其中,为惩罚项的梯度。在式(63)两端同乘正参数μ得到:
只要的预解式存在,即算子:
对于任意正实数λ均被很好定义,则:
定义Bμ(x)=x+μAT(y-Ax),则得到:
x=Rλμ,1/2(Bμ(x)) (67)
由Xu Z等人所提方法可知,对角非线性解析表示算子:
Rλ,1/2(x)=((fλ,1/2(x1),fλ,1/2(x2),…,fλ,1/2(xN)))T (68)
其中,
且,
由此,可得L1/2正则化问题阈值化函数如下所示:
则式(62)L1/2正则化问题阈值可表示为:
x=Hλμ,1/2(Bμ(x)) (72)
其中,
Hλμ,1/2(x)=(hλμ,1/2(x1),hλμ,1/2(x2),…,hλμ,1/2(xN))T (73)
式(71)称为半阈值化函数,Hλμ,1/2称为半阈值化算子。
综上所述,基于半阈值化算子,可得问题(61)最优解为:
3)更新Gk+1
式(75)可等价为:
假设基于式(50),问题(76)可重新表示为:
其中,将Gj和Wj重塑为二维形式,即:
式(78)的最优化问题可拆分为s个子问题,且每个子问题都可使用Beck A等人所提方法中的快速梯度投影(fast gradient projection)法求解,即
其中,(p,q)为矩阵对,且满足以下条件:
L为线性算子:定义如下:
L(p,q)i,j=pi,j+qi,j-pi-1,j-qi,j-1,i=1,…,m;j=1,…,n (81)
PC表示集合上的正交投影算子。对于n维空间若C=Bl,u,则
获得各子问题最优解后,将其重塑为则Gk+1可通过下式更新:
4)更新拉格朗日乘子:
Y1 k+1=Y1 k1(Z-Hk+1-Kk+1) (84)
Y2 k+1=Y2 k2(Gk+1-Kk+1) (85)
综上所述,在已知观测矩阵Z条件下,通过式(59),(74)和(83)交替优化H,K和G直至满足以下迭代收敛条件:
从而可获得最稀疏前景及低秩背景矩阵,其中参数为控制误差的常数,依据实验本发明选取
基于上述讨论,本发明所提基于低秩与稀疏分解的动目标检测方法步骤如表1所示:
表1低秩与稀疏分解动目标检测方法
本发明的效果可通过以下仿真进一步说明:
仿真条件:本发明利用如表2所示的CDnet-2014和UCSD数据集的5个视频序列作为测试集,并与如下主流算法MoG,PCP,BRPCA,PRMF和DECOLOR(DEC)对比以验证动态背景下所提方法动目标检测的有效性。实验环境如下:处理器Intel Core i7-7700,主频3.60Ghz,内存8GB,操作系统为64位Windows 10,仿真软件MATLAB R2017b。
表2视频序列及其基本信息
参数设置:经过大量重复试验可知,参数γ取值在较大范围内变动时对实验结果影响不大,但其应当被设置为严格大于1的实数,因而依据经验本发明设置γ=4。此外,为使模型适应不同动态背景场景及获得较好动目标检测精度,本发明设置μ=1×10-3
定性分析:
图3为6种算法在5个动态背景场景下部分目标检测结果对此。由图3(c)可知,当环境存在不同程度动态背景干扰时,所提方法均可较好抑制动态背景,同时目标检测结果较为完整,从而表明所提算法具有较高检测精度和稳健性,其可归因于所提方法引入γ和L1/2范数并使用空间连续性约束这一先验信息。由图3(d)可知,PCP算法在Boats,Fountain和Fall场景下对动态背景抑制较差,且其虽在Bottle和Rain场景下可抑制大部分动态背景,然而虚警率较高。由图3(e)可知,MoG算法在不同动态场景下均存在较严重误检,原本无前景像素存在区域被检测为前景,检测精度较差。由图3(f),3(g)和3(h)可知,PRMF,DEC和BRPCA算法在Rain场景下可较好抑制动态背景,然而均存在目标细节不同程度丢失,检测结果不够完整的问题,且在Boats,Bottle,Fountain和Fall场景下均不能较好抑制动态背景。造成以上结果的主要原因在于PCP,PRMF,DEC和BRPCA作为RPCA相关算法,未使用前景像素空间连续性约束先验信息,因而无法有效抑制动态背景。
定量分析:
为定量评估所提方法目标检测性能,本发明采用准确率(Precision),召回率(Recall)和F值(F-measure)作为评价指标。其中,Precision表示正确检测前景像素与所有检测出前景像素的比例,Recall表示正确检测前景像素与所有前景像素的比例,F-measure为综合评价参数,是评估检测结果高低的重要指标。三者分别定义如下:
其中,TP(True Positive)为被正确分类为前景像素点的数目;FP(FalsePositive)为被错误分类为前景像素而实际为背景像素的数目;FN(False Negative)为被错误分类为背景像素而实际为前景像素的数目。
所提方法及五种对比算法在五个场景下的Precision,Recall和F-measure对比如图4示。其中,图4(a)-4(e)分别为Boats,Bottle,Rain,Fountain和Fall五个不同场景下评价指标对比图,图4(f)为6种算法在5个场景下三个性能指标的平均值对比图。为使对比结果更加直观,图4(f)对应的数据指标如表3所示。其中,加粗字体标识Precision,Recall和F-measure之最大值,下划线标识对应次小值。由图4可知,所提算法在不同场景下均有较高Precision,Recall和F-measure。此外,由表3可知,所提算法在所有场景下均具有最高Precision和F-measure,相对于次最大值分别高出约13.4%和8.3%。
表3不同场景下六种算法评价指标平均值
综上所述,基于低秩与稀疏分解理论,本发明提出一种基于γ和L1/2范数空间连续性正则化低秩近似动目标检测方法。所提方法通过引入γ范数获得秩函数近乎无偏估计进而得到最小化问题最优解以提高检测准确率,同时利用L1/2范数获得更加稀疏前景矩阵。为抑制动态背景,基于其稀疏且空域不连续特性对前景施加空间连续性约束以抽取更为完整和平滑前景,进而构建SCLR-γ&L1/2模型。最后,利用基于ADM扩展的ALM法求解约束最小化问题。在公开数据集上的仿真结果表明,5种动态背景场景下,与现有MoG,PCP,BRPCA,PRMF和DECOLOR算法对比,本发明所提方法可显著改善动目标检测精度。同时,所提算法在所有场景下均具有最高准确率和F值,相对于次最大值分别高出约13.4%和8.3%。由此,本发明所提算法可以为工程应用中计算机视觉领域的动目标检测性能研究提供坚实的理论与实现依据。

Claims (1)

1.动态背景下基于低秩及稀疏分解的动目标检测方法,其特征在于,该方法包括如下步骤:
步骤1:RPCA检测模型
设存在图像序列其中m为图像高度,n为图像宽度,s为帧数,将该图像序列重构为则动目标检测可建模为如下RPCA问题:
其中,分别为低秩背景和稀疏前景矩阵,||·||*表示核范数,||·||1为L1范数,λ为权衡低秩和稀疏度的正则因子,
采用非凸γ范数代替核范数以获得秩函数近乎无偏估计从而使得所得最小化问题获得最优解,进而改善动目标检测性能,此外,L1范数单独处理各元素未考虑前景像素之间空域先验信息,使其难以在动态背景中取得较好效果,相较于L1范数,L1/2范数可抽取更加稀疏前景矩阵,因此由动态背景造成的虚警率更低,同时,根据虚警像素稀疏且空域不连续特性,对前景施加空间连续性约束可较好抑制动态背景像素的影响,基于γ和L1/2范数空间连续性正则化低秩近似(γ-norm&L1/2-norm and Spatial Continuity regularized Low-Rank approximation,SCLR-γ&L1/2)动目标检测方法以改善动态背景下目标检测精度;
步骤2:基于SCLR-γ&L1/2的目标检测方法
(1)γ范数
由于核范数会过度惩罚大奇异值,从而导致有偏估计,而非凸MCP(Minmax ConcavePlus)函数可近似无偏估计矩阵秩函数,因而作为MCP矩阵扩展形式的γ范数在秩最小化问题中可获得更好近似解,给定向量λ>0,γ>1,则MCP函数可定义如下:
其中,
其中,(z)+=max{z,0},基于式(2),给定矩阵其矩阵MCP范数可定义为:
设矩阵A奇异值分解可表示为A=U∑VT,其中,U=[u1,u2,…,un],V=[v1,v2,…,vn],∑=diag(σ12,…,σn),且σ1≥σ2≥…≥σn≥0,σi(A)表示A的第i个奇异值,令σ(A)=(σ1(A),…,σr(A))T,r=min{m,n},为便于后续表述,定义Ωγ(t)=Ω1,γ(t),Mγ(A)=M1,γ(A),则矩阵A的γ范数可定义如下:
(2)L1/2范数
为得到更加稀疏近似解,将L1范数正则化扩展至Lq范数(0<q<1),Lq正则化问题中,由于q≤1时矩阵稀疏特性较为明显,因而其相较于q>1更适用于低秩模型,此外,当时,q值越小,Lq正则化所得解越稀疏;当时,Lq正则化解稀疏性无明显差异,由此可知,L1/2相较于L1范数具有较好稀疏特性,假设矩阵A划分为{A1,A2,…,As},则L1/2范数可定义为:
(3)空间连续性约束
现实场景中动态背景不可避免,RPCA模型未利用稀疏前景像素间空间先验信息,因而所得前景矩阵K包含前景像素及动态背景像素,前景矩阵K中由动态背景造成的虚警像素虽具有稀疏性但通常并不具有空域连续性,对前景施加空间连续性约束以抑制动态背景像素可使所得前景更加完整平滑,进而降低检测虚警率,设前景矩阵由视频序列{K1,K2,…,Ks}构成,其中为第k帧,则空间连续性约束可表示如下:
其中,||Kk||SC为第k帧所有像素值之和,即:
其中,分别定义为图像水平和垂直方向上的操作:
其中,Kk(i,j)为第k帧图像i行j列位置的像素值;
(4)构建SCLR-γ&L1/2动目标检测模型
动目标检测模型:
其中,为矩阵K的L1/2正则化,||·||2为欧式范数,Φ(K)为空间连续性约束,已在式(7)中定义,参数λ1用于权衡前景稀疏性,参数λ2用于控制空间连续性约束的强度;
(5)所提模型求解
采用增广拉格朗日乘子(augmented Lagrange multiplier,ALM)法求解式(11)动目标检测优化问题,
为方便后续使用交替最小化策略求解,此处引入辅助变量G对其进行空间连续性约束,此时式(11)转化为如下等价问题:
则增广拉格朗日函数可表示为:
其中,Y1和Y2为拉格朗日乘子,μ1和μ2为惩罚参数,
为求解上述优化问题,采用交替方向最小化(alternating direction minimizing,ADM)方法迭代优化变量,因此,式(13)最优化问题可划分为如下四个子问题:
1)更新Hk+1
由于||H||γ关于σ(H)非凸,可对矩阵MCP范数局部线性逼近(locally linearapproximation,LLA)进行凸松弛求解,即在每次迭代时使用||H||γ在σ(Hold)的LLA进行近似求解,其中Hold为上一次迭代值,因此,式(14)可进一步表示为:
其中,为给定Aold时Mγ(A)的LLA,
式(15)最优解可通过下式得到:
其中, 为广义奇异值收缩算子,Ι为单位矩阵,[Dτ,Λ(A)]ij=sgn(Aij)(|Aij|-τΛij)为广义收缩算子,其中sgn(·)为符号函数,定义为:
2)更新Kk+1
上式可通过Xu Z等人所提出方法中的半阈值化算子(half-thresholding operator,HTO)求解,求解式(18)之前,先由L1/2正则化问题推导出如下HTO:
其中,为给定矩阵,y为观测数据,为待恢复稀疏结构,λ>0为正则化参数,对于式(19),由x一阶最优条件可得:
其中,为惩罚项的梯度,在式(20)两端同乘正参数μ得到:
只要的预解式存在,即算子:
对于任意正实数λ均被很好定义,则可得:
定义Bμ(x)=x+μAT(y-Ax),则得到:
x=Rλμ,1/2(Bμ(x)) (24)
由Xu Z等人所提方法可知,对角非线性解析表示算子:
Rλ,1/2(x)=((fλ,1/2(x1),fλ,1/2(x2),…,fλ,1/2(xN)))T (25)
其中,
且,
由此,可得L1/2正则化问题阈值化函数如下所示:
则式(19)L1/2正则化问题阈值可表示为:
x=Hλμ,1/2(Bμ(x)) (29)
其中,
Hλμ,1/2(x)=(hλμ,1/2(x1),hλμ,1/2(x2),…,hλμ,1/2(xN))T (30)
式(28)称为半阈值化函数,Hλμ,1/2称为半阈值化算子,
综上所述,基于半阈值化算子,可得问题(18)最优解为:
3)更新Gk+1
式(32)可等价为:
假设基于式(7),问题(33)可重新表示为:
其中,将Gj和Wj重塑为二维形式,即:
式(35)的最优化问题可拆分为s个子问题,且每个子问题都可使用Beck A等人所提方法中的快速梯度投影(fast gradient projection)法求解,即:
其中,(p,q)为矩阵对,且满足以下条件:
L为线性算子:定义如下:
L(p,q)i,j=pi,j+qi,j-pi-1,j-qi,j-1,i=1,…,m;j=1,…,n (38)
PC表示集合上的正交投影算子,对于n维空间若C=Bl,u,则
获得各子问题最优解后,将其重塑为则Gk+1可通过下式更新:
4)更新拉格朗日乘子:
Y1 k+1=Y1 k1(Z-Hk+1-Kk+1) (41)
Y2 k+1=Y2 k2(Gk+1-Kk+1) (42)
综上所述,在已知观测矩阵Z条件下,通过式(16),(31)和(40)交替优化H,K和G直至满足以下迭代收敛条件:
从而可获得最稀疏前景及低秩背景矩阵,其中参数为控制误差的常数,选取
CN201910485971.2A 2019-06-05 2019-06-05 动态背景下基于低秩及稀疏分解的动目标检测方法 Active CN110287819B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910485971.2A CN110287819B (zh) 2019-06-05 2019-06-05 动态背景下基于低秩及稀疏分解的动目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910485971.2A CN110287819B (zh) 2019-06-05 2019-06-05 动态背景下基于低秩及稀疏分解的动目标检测方法

Publications (2)

Publication Number Publication Date
CN110287819A true CN110287819A (zh) 2019-09-27
CN110287819B CN110287819B (zh) 2023-06-02

Family

ID=68003350

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910485971.2A Active CN110287819B (zh) 2019-06-05 2019-06-05 动态背景下基于低秩及稀疏分解的动目标检测方法

Country Status (1)

Country Link
CN (1) CN110287819B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110675422A (zh) * 2019-09-29 2020-01-10 南京信息职业技术学院 一种基于广义非凸鲁棒主成分分析的视频前背景分离方法
CN111161184A (zh) * 2019-12-27 2020-05-15 广东工业大学 一种基于mcp稀疏约束的快速mr图像去噪方法
CN111340120A (zh) * 2020-02-28 2020-06-26 南京林业大学 一种基于实用鲁棒pca的图像表示方法
CN111476748A (zh) * 2020-04-01 2020-07-31 广东工业大学 一种基于mcp约束卷积稀疏表示的mr图像融合方法
CN111814654A (zh) * 2020-07-03 2020-10-23 南京莱斯信息技术股份有限公司 基于马尔可夫随机场的远程塔台视频目标挂标牌方法
CN112287794A (zh) * 2020-10-22 2021-01-29 中国电子科技集团公司第三十八研究所 一种视频图像自动识别目标的编号一致性管理方法
CN112465713A (zh) * 2020-11-24 2021-03-09 北京大学 基于流形优化的张量低秩模型非平滑三维图像补全方法
CN113050098A (zh) * 2021-03-08 2021-06-29 西北工业大学 基于块稀疏稳健主成分分析的反蛙人声呐混响抑制方法
CN114859115A (zh) * 2022-07-08 2022-08-05 四川大学 一种基于快速交替算法的宽频密集频率信号分析方法
CN114913100A (zh) * 2022-05-16 2022-08-16 中国烟草总公司四川省公司 一种基于图像分析的烟叶烘烤程度检测方法
CN114998799A (zh) * 2022-06-07 2022-09-02 山东省人工智能研究院 基于全局知识挖掘和前景注意力的交互视频动作检测方法
CN116047461A (zh) * 2023-03-08 2023-05-02 中国科学院空天信息创新研究院 基于视频合成孔径雷达的动目标检测方法及装置
CN118151157A (zh) * 2024-03-08 2024-06-07 哈尔滨工程大学 深海混响背景下移动目标多帧联合检测方法、系统及终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105761251A (zh) * 2016-02-02 2016-07-13 天津大学 一种基于低秩和结构稀疏的视频前景背景分离方法
CN109345563A (zh) * 2018-09-14 2019-02-15 南京邮电大学 基于低秩稀疏分解的运动目标检测方法
CN109671029A (zh) * 2018-12-07 2019-04-23 大连大学 基于伽马范数最小化的图像去噪算法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105761251A (zh) * 2016-02-02 2016-07-13 天津大学 一种基于低秩和结构稀疏的视频前景背景分离方法
CN109345563A (zh) * 2018-09-14 2019-02-15 南京邮电大学 基于低秩稀疏分解的运动目标检测方法
CN109671029A (zh) * 2018-12-07 2019-04-23 大连大学 基于伽马范数最小化的图像去噪算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HENGMIN ZHANG 等: "Weighted sparse coding regularized nonconvex matrix regression for robust face recognition" *
LIN ZHU 等: "L1/2 Norm and Spatial Continuity Regularized Low-Rank Approximation for Moving Object Detection in Dynamic Background" *

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110675422A (zh) * 2019-09-29 2020-01-10 南京信息职业技术学院 一种基于广义非凸鲁棒主成分分析的视频前背景分离方法
CN110675422B (zh) * 2019-09-29 2023-03-03 南京信息职业技术学院 一种基于广义非凸鲁棒主成分分析的视频前背景分离方法
CN111161184A (zh) * 2019-12-27 2020-05-15 广东工业大学 一种基于mcp稀疏约束的快速mr图像去噪方法
CN111161184B (zh) * 2019-12-27 2022-03-25 广东工业大学 一种基于mcp稀疏约束的快速mr图像去噪方法
CN111340120A (zh) * 2020-02-28 2020-06-26 南京林业大学 一种基于实用鲁棒pca的图像表示方法
CN111340120B (zh) * 2020-02-28 2021-05-07 南京林业大学 一种基于实用鲁棒pca的图像表示方法
CN111476748A (zh) * 2020-04-01 2020-07-31 广东工业大学 一种基于mcp约束卷积稀疏表示的mr图像融合方法
CN111476748B (zh) * 2020-04-01 2022-03-25 广东工业大学 一种基于mcp约束卷积稀疏表示的mr图像融合方法
CN111814654A (zh) * 2020-07-03 2020-10-23 南京莱斯信息技术股份有限公司 基于马尔可夫随机场的远程塔台视频目标挂标牌方法
CN111814654B (zh) * 2020-07-03 2023-01-24 南京莱斯信息技术股份有限公司 基于马尔可夫随机场的远程塔台视频目标挂标牌方法
CN112287794B (zh) * 2020-10-22 2022-09-16 中国电子科技集团公司第三十八研究所 一种视频图像自动识别目标的编号一致性管理方法
CN112287794A (zh) * 2020-10-22 2021-01-29 中国电子科技集团公司第三十八研究所 一种视频图像自动识别目标的编号一致性管理方法
CN112465713A (zh) * 2020-11-24 2021-03-09 北京大学 基于流形优化的张量低秩模型非平滑三维图像补全方法
CN112465713B (zh) * 2020-11-24 2022-07-01 北京大学 基于流形优化的张量低秩模型非平滑三维图像补全方法
CN113050098A (zh) * 2021-03-08 2021-06-29 西北工业大学 基于块稀疏稳健主成分分析的反蛙人声呐混响抑制方法
CN113050098B (zh) * 2021-03-08 2024-04-16 西北工业大学 基于块稀疏稳健主成分分析的反蛙人声呐混响抑制方法
CN114913100A (zh) * 2022-05-16 2022-08-16 中国烟草总公司四川省公司 一种基于图像分析的烟叶烘烤程度检测方法
CN114913100B (zh) * 2022-05-16 2023-09-15 中国烟草总公司四川省公司 一种基于图像分析的烟叶烘烤程度检测方法
CN114998799A (zh) * 2022-06-07 2022-09-02 山东省人工智能研究院 基于全局知识挖掘和前景注意力的交互视频动作检测方法
CN114998799B (zh) * 2022-06-07 2023-01-13 山东省人工智能研究院 基于全局知识挖掘和前景注意力的交互视频动作检测方法
CN114859115A (zh) * 2022-07-08 2022-08-05 四川大学 一种基于快速交替算法的宽频密集频率信号分析方法
CN114859115B (zh) * 2022-07-08 2022-09-16 四川大学 一种基于快速交替算法的宽频密集频率信号分析方法
CN116047461A (zh) * 2023-03-08 2023-05-02 中国科学院空天信息创新研究院 基于视频合成孔径雷达的动目标检测方法及装置
CN118151157A (zh) * 2024-03-08 2024-06-07 哈尔滨工程大学 深海混响背景下移动目标多帧联合检测方法、系统及终端

Also Published As

Publication number Publication date
CN110287819B (zh) 2023-06-02

Similar Documents

Publication Publication Date Title
CN110287819B (zh) 动态背景下基于低秩及稀疏分解的动目标检测方法
Shakeri et al. COROLA: A sequential solution to moving object detection using low-rank approximation
CN109671029B (zh) 基于伽马范数最小化的图像去噪方法
US9247139B2 (en) Method for video background subtraction using factorized matrix completion
CN111080675B (zh) 一种基于时空约束相关滤波的目标跟踪方法
CN110210282B (zh) 一种基于非凸低秩稀疏分解的运动目标检测方法
CN108510013B (zh) 基于低秩核心矩阵的改进稳健张量主成分分析的背景建模方法
CN109685045B (zh) 一种运动目标视频跟踪方法及系统
CN110135344B (zh) 基于加权固定秩表示的红外弱小目标检测方法
CN108492312B (zh) 光照变化下基于逆向稀疏表示的视觉跟踪方法
CN109215025B (zh) 一种基于非凸秩逼近极小化的红外弱小目标检测方法
CN110490894B (zh) 基于改进的低秩稀疏分解的视频前背景分离方法
CN110827262A (zh) 一种基于连续有限帧红外图像的弱小目标检测方法
CN111709359A (zh) 复杂动态背景下基于群稀疏的运动目标检测方法
CN105261043A (zh) 基于显著性检测的视频运动物体检测方法
CN109145738B (zh) 基于加权非凸正则化和迭代重约束低秩表示的动态视频分割方法
CN111191680A (zh) 一种基于非凸运动辅助的目标检测方法
Wang et al. Underwater self-supervised monocular depth estimation and its application in image enhancement
CN111369449A (zh) 基于生成式对抗网络的红外盲元补偿方法
CN113256585B (zh) 基于时空张量分解的红外视频运动小目标实时检测方法
CN110136164B (zh) 基于在线透射变换、低秩稀疏矩阵分解去除动态背景的方法
Dutta et al. Weighted low rank approximation for background estimation problems
CN109002802B (zh) 基于自适应鲁棒主成分分析的视频前景分离方法和系统
CN111563547A (zh) 一种基于改进的截断核范数的鲁棒主成分分析方法
CN111062291A (zh) 一种机器人视觉跟踪方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant