CN110610508A - 一种静态视频分析方法及系统 - Google Patents
一种静态视频分析方法及系统 Download PDFInfo
- Publication number
- CN110610508A CN110610508A CN201910767893.5A CN201910767893A CN110610508A CN 110610508 A CN110610508 A CN 110610508A CN 201910767893 A CN201910767893 A CN 201910767893A CN 110610508 A CN110610508 A CN 110610508A
- Authority
- CN
- China
- Prior art keywords
- background
- foreground
- sparse
- matrix
- video data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 44
- 230000003068 static effect Effects 0.000 title claims abstract description 33
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 40
- 238000000034 method Methods 0.000 claims abstract description 39
- 238000005457 optimization Methods 0.000 claims abstract description 18
- 238000000926 separation method Methods 0.000 claims abstract description 8
- 239000011159 matrix material Substances 0.000 claims description 69
- 230000015654 memory Effects 0.000 claims description 27
- 238000012512 characterization method Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 abstract description 17
- 230000008901 benefit Effects 0.000 abstract description 4
- 238000005286 illumination Methods 0.000 abstract description 3
- 230000002411 adverse Effects 0.000 abstract description 2
- 230000007547 defect Effects 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000009826 distribution Methods 0.000 description 8
- 238000011084 recovery Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种静态视频分析方法及系统,其中方法包括:获取视频数据;获取所述视频数据背景的线性动态正则项;获取所述视频数据前景的结构化稀疏正则项;获取噪声的稀疏正则项;根据所述线性动态正则项、所述前景的结构化稀疏正则项及噪声的稀疏正则项,构建结合动态背景和结构稀疏的分解模型;对所述分解模型进行优化求解,得到所述视频数据的前景和背景的分离结果。本发明所提供的静态视频分析方法在大多数具有挑战性的情况下具有很好的背景重构能力和前景检测性能,具有检测通用性、准确率高和鲁棒性强的优点,对数据采集环境具有自适应能力,能有效消除噪声、光照等不利因素的影响。
Description
技术领域
本发明涉及机器视觉技术领域,具体涉及一种静态视频分析方法及系统。
背景技术
智能监控在城市安防、交通安全等领域起着举足轻重的作用,其中的智能算法能加强对各种突发状况的动态检测、对危险状况及时预警、指导养护维修安全设施等。近年来,在静态视频中的运动检测算法的研究吸引了广泛研究者的兴趣,像素独立处理的方法被广泛运用,同时低秩背景重建/稀疏成分恢复的运动检测算法也被纳入进背景模型建立和前景检测中。在早期的工作中,Wright等人提出使用l1范数约束稀疏矩阵并假设背景图像彼此线性相关形成低秩矩阵。与传统的基于像素的建模方法不同,假设背景矩阵是低秩矩阵,但前景区域不能适应低秩背景模型的强度变化,因此应被视为异常值。然而,实际场景中的前景部分具有空间连续性,即呈现结构化分布的小块区域。为了解决这个问题,基于混合范数约束的组稀疏、块稀疏、树形结构的稀疏成分正则约束等则被用于强制将低秩和稀疏成分分离,鼓励非零元素实现结构性分布,因此可以更好地模拟前景元素的真实分布。
虽然基于低秩/稀疏的恢复理论在前景检测中取得了长足的进步,但仍然面临两方面的不足:(1)根据低秩矩阵恢复理论,当低秩和稀疏成分之间存在高度相关性时,观察矩阵的分解性能会降低。因此,当背景杂乱或具有与检测对象类似的外观时,先前低秩矩阵恢复模型难以将它们分开;(2)由于噪声、光照、振动等因素,背景呈现动态性,而低秩约束则不能很好地刻画背景的动态变化,同时背景中的杂质元素由于不满足低秩约束而被强行分解进稀疏成分中。
发明内容
因此,本发明要解决的技术问题在于克服现有技术中的背景和前景目标难以分离的缺陷,从而提供一种静态视频分析方法及系统。
第一方面,本发明实施例提供一种静态视频分析方法,包括如下步骤:获取视频数据;获取所述视频数据背景的线性动态正则项;获取所述视频数据前景的结构化稀疏正则项;获取噪声的稀疏正则项;根据所述线性动态正则项、所述前景的结构化稀疏正则项及噪声的稀疏正则项,构建结合动态背景和结构稀疏的分解模型;对所述分解模型进行优化求解,得到所述视频数据的前景和背景的分离结果。
在一实施例中,所述静态视频分析方法,还包括:利用线性动态策略对所述视频数据进行背景重构;根据所述背景的动态性能获取背景的线性动态正则项。
在一实施例中,所述静态视频分析方法,背景的线性动态正则项通过以下公式计算:
其中,B为背景矩阵,τ为帧数据矩阵Bk的长度,n为数据矩阵的列数,bt与bt+τ为背景子数据,W为线性动态刻画矩阵,ut,t+τ为观测数据xt与xt+τ之间的相关性权重。
在一实施例中,所述静态视频分析方法,获取所述视频数据前景的结构化稀疏正则项的步骤,包括:获取所述视频数据的超像素块;对所述超像素块进行不同层次的聚类,得到索引树;将所述索引树约束编码为稀疏范数,以规范矩阵分解,得到第一前景的结构稀疏正则项;利用l∞范数对所述第一前景的结构稀疏正则项进行约束,得到第二前景的结构化稀疏正则项。
在一实施例中,所述静态视频分析方法,所述第二前景的结构化稀疏正则项通过以下公式计算:
其中,d为索引树的深度,Gi为第i层次中所有节点,集合为第i层节点集合中某一节点包含的所有像素集合。
在一实施例中,所述静态视频分析方法,所述分解模型为:
s.t.X=B+S+N.
s.t.X=B+S+N.
其中,B为背景矩阵,S为前景矩阵,N为噪声矩阵,λ1为前景的结构稀疏正则项的权重,λ2为噪声的稀疏正则项的权重,τ为帧数据矩阵Bk的长度,n为数据矩阵的列数,bt与bt+τ为背景子数据,W为线性动态刻画矩阵,ut,t+τ为观测数据xt与xt+τ之间的相关性权重,d为索引树的深度,Gi为第i层次中所有节点,集合为第i层节点集合中某一节点包含的所有像素集合。
在一实施例中,所述静态视频分析方法,采用交替方向法求解分解模型。
第二方面,本发明实施例提供一种静态视频分析系统,包括:视频数据获取模块,用于获取视频数据;背景的线性动态正则项获取模块,用于获取所述视频数据背景的线性动态正则项;前景的结构化稀疏正则项获取模块,用于获取所述视频数据前景的结构化稀疏正则项;噪声的稀疏正则项获取模块,用于获取噪声的稀疏正则项;分解模型构建模块,用于根据所述线性动态正则项、所述前景的结构化稀疏正则项及噪声的稀疏正则项,构建结合动态背景和结构稀疏的分解模型;模型优化模块,用于对所述分解模型进行优化,得到所述视频数据的前景和背景的分离结果。
第三方面,本发明实施例提供一种计算机设备,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行本发明实施例第一方面所述的静态视频分析方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行本发明实施例第一方面所述的静态视频分析方法。
本发明技术方案,具有如下优点:
1.本发明提供的静态视频分析方法及系统,基于背景的线性动态正则项、前景的结构化稀疏正则项和噪声的稀疏正则项,搭建了一种结合动态背景和结构稀疏的用于视频分析的分解模型,能很好捕捉背景因噪声等引起的演变,重构动态背景,更容易将背景和前景分离。
2.本发明提供的静态视频分析方法及系统,利用线性动态刻画矩阵来刻画背景的动态性能,对视频采集环境具有自适应能力,能有效消除噪声、光照等不利因素的影响。利用超像素分割的层次结构来规范稀疏成分,使前景区域分解更加紧凑和完整。利用交替方向法优化求解分解模型,将复杂的高维分解模型转化分为多个低维子问题求解,加快了求解速度,简化了分解模型。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的静态视频分析方法的一个具体示例的流程图;
图2为本发明实施例中提供的静态视频分析方法的分解模型图;
图3为本发明实施例提供的获取所述视频数据背景的线性动态正则项的一个具体示例的流程图;
图4为本发明实施例提供的获取所述视频数据前景的结构化稀疏正则项的一个具体示例的流程图;
图5为本发明实施例提供的静态视频分析方法的索引树的建立示意图;
图6为本发明实施例提供的静态视频分析方法的8×8图像中的两种不同的稀疏成分分布图;
图7为本发明实施例提供的对所述分解模型进行优化求解的一个具体示例的流程图;
图8为本发明实施例提供的静态视频分析方法的模型优化步骤图;
图9为本发明实施例提供的静态视频分析方法的l∞范数求解的详细步骤图;
图10为本发明实施例提供的静态视频分析方法的轨道表面缺陷检测模型图;
图11为本发明实施例提供的静态视频分析系统的一个具体示例的组成图;
图12为本发明实施例提供的计算机设备一个具体示例的组成图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
实施例1
本发明实施例提供一种静态视频分析方法,可以应用于交通监控、工业监控(例如具有匀质性的工业产品的缺陷检测)、数字图像处理和模式识别领域,如图1所示,包括如下步骤:
步骤S1:获取视频数据。
本发明实施例中,可以从摄像设备中获取待处理的数据视频,将待处理的数据视频用X=[...,Xk,...]∈Rm×n表示。
步骤S2:获取所述视频数据背景的线性动态正则项。
本发明实施例中,用背景矩阵B=[...,Bk,...]∈Rm×n表示重构出的背景,其中Bk∈Rm×τ表示视频中的某一帧的背景。用线性动态刻画矩阵W来刻画数据随时间变化的时变性,并在此基础上获取背景的线性动态正则项。
步骤S3:获取所述视频数据前景的结构化稀疏正则项。
本发明实施例中,利用一种新颖的树状结构稀疏诱导规范来模拟图像块之间的空间连续性和特征相似性,对得到的一系列超像素块进行不同层次的聚类,得到索引树,对索引树约束编码为稀疏范数,以规范矩阵分解,得到第一前景的结构化稀疏正则项,并用l∞范数约束第一前景的结构化稀疏正则项,得到第二前景的结构化稀疏正则项。
步骤S4:获取噪声的稀疏正则项。
本发明实施例中,由于噪声是离散的,需要对噪声矩阵进行稀疏正则化,得到噪声的稀疏正则项Φ(N)。
步骤S5:根据所述线性动态正则项、所述前景的结构化稀疏正则项及所述噪声的稀疏正则项,构建结合动态背景和结构稀疏的分解模型,如图2所示。
本发明实施例中,基于低秩恢复理论可以将视频数据分为背景、前景和噪声的组合,根据所述线性动态正则项、所述前景的结构化稀疏正则项及噪声的稀疏正则项,构建结合动态背景和结构稀疏的分解模型。
步骤S6:对所述分解模型进行优化求解,得到所述视频数据的前景和背景的分离结果。
本发明实施例中,考虑到效率和准确性之间的平衡,可以采用交替方向法来优化求解最终的分解模型,求得背景矩阵B及前景矩阵S,得到所述视频数据的背景和前景的分离结果。
本发明实施例提供的静态视频分析方法,基于背景的线性动态正则项、前景的结构化稀疏正则项和噪声的稀疏正则项,搭建了一种结合动态背景和结构稀疏的用于静态视频分析的分解模型,将视频中的某一帧的背景数据可视为时变状态的变量,能很好捕捉背景因噪声等引起的演变,重构动态背景,使得模型能够处理更具挑战性的场景演变,更容易将背景和前景分开。
在一具体实施例中,如图3所示,执行步骤S2的过程可以具体包括如下步骤:
步骤S21:利用线性动态策略对所述视频数据进行背景重构;
在计算机视觉领域,经常将场景视为一个整体,并利用线性动态系统(LinearDynamic System,LDS)进行全局子空间学习;进一步表明由白色零均值高斯噪声驱动的一阶模型可以捕获各种动态纹理,并在具有均匀纹理的自然场景上运行良好,因此LDS用一组线性组合的组件来表征子空间。然而,在视频序列找到全局子空间是棘手的。因此,在本发明实施例中,引入线性动态刻画矩阵W来刻画数据随时间变化的时变性,则背景矩阵B形式化如下:
Bk=WBk-1+ηk (1)
其中,W为线性动态刻画矩阵,Bk为第k时刻的帧数据矩阵,Bk-1为第k-1时刻的帧数据矩阵,ηk为残差项。
步骤S22:根据所述背景的动态性能获取背景的线性动态正则项。
本发明实施例在背景的动态性能的基础上,提出背景的线性动态正则项:
其中,W为线性动态刻画矩阵,τ为帧数据矩阵Bk的长度,ut,t+τ表示观测数据xt与xt+τ之间的相关性权重。当数据xt与xt+τ之间不相似时(即其中的一个观测数据中可能存在异常),则最小化问题Ψ(B)时能重构出动态的背景,即使得背景子数据bt与bt+τ相似。因此相关性权重ut,t+τ定义为:
ut,t+τ=exp(γ||xt-xt+τ||2) (3)
其中,γ为超参数,||*||2为向量的l2范数。为了增加鲁棒性,对相关性权重进行最大值归一化。
在一具体实施例中,如图4所示,执行步骤S3的过程可以具体包括如下步骤:
步骤S31:获取所述视频数据的超像素块。
在实际中,利用结构化稀疏度范数对前景区域建模,可以反映非零的空间分布,本申请利用一种新颖的树状结构稀疏诱导规范来模拟图像块之间的空间连续性和特征相似性,从而产生更精确和结构一致的结果。前景中所要处理的图像数据很大,参数估计收敛速度慢,可以使用SLIC算法得到前景的一系列超像素块,有利于提高后续的处理速度。
步骤S32:对所述超像素块进行不同层次的聚类,得到索引树。
本发明实施例中,采用k-means算法对得到的一系列超像素块进行不同层次的聚类,得到的层次分割结果(仅以此举例,不以此为限,在其他实施例中,可以采取其他聚类算法)如图5(a)所示。从图5(a)中可以看出,每个像素块构成一颗树的节点,节点索引之间没有重叠,使用索引树来编码超像素块间的空间关系,索引树构造如图5(b)所示。索引树是层次结构,使得每个节点包含一组超像素块,并且该集合是其子节点的超像素块的并集。从图5(b)可以看出,对于一个具有深度d的索引树,其中Gi表示第i层次中所有节点集合,例如对于根节点,G1包含四个节点集合对于G3则表示得到的原始一系列超像素块集合。
步骤S33:将所述索引树约束编码为稀疏范数,以规范矩阵分解,得到第一前景的结构稀疏正则项。
本发明实施例中,通过具有层次树结构约束的索引树,诱导同一组内的超像素块共享相似的表示,并且索引树还表示组之间的从属或坐标关系,具体形式化为:
其中,表示第i层节点集合中某一节点包含的所有像素集合,即为一个向量。
步骤S34:利用l∞范数对所述第一前景的结构稀疏正则项进行约束,得到第二前景的结构化稀疏正则项。
本发明实施例中,l1范数可以独立地处理对应的超像素块,其忽略了超像素块的空间结构信息;而l∞范数是组中像素的最大值,允许其余像素采用任意值,因此可以预期类似的误差区域具有相似的大幅值,同时最小化目标函数能促进稀疏异常值的结构性分布。l1范数独立地处理每个像素,而基于l∞范数的结构化稀疏可以考虑条目的各子集之间的可能关系,如图6所示,假设8×8大小的图像中有稀疏前景的两种不同分布,其中白色像素对应于具有高值的前景,黑色像素对应背景。对图像进行了简单的3个超像素块划分,由于l1范数总和了所有像素的绝对值,因此在这两种稀疏分布情况下这种稀疏范数约束将具有相似的值,如图6(a)所示;然而,在l∞范数中,只总计每个预先设计的组中最大的一个值,则导致在这两种稀疏分布情况下它具有明显不同的值,如图6(b)所示。
本发明实施例中,基于l∞范数的结构化稀疏可以考虑条目的各子集之间的可能关系,利用l∞范数对所述第一前景的结构稀疏正则项进行约束,得到第二前景的结构化稀疏正则项:
其中,d为索引树的深度,Gi为第i层次中所有节点,集合为第i层节点集合中某一节点包含的所有像素集合。
在一具体实施例中,执行步骤S5的过程可以具体包括如下:
通过前述的定义,最终模型具体的形式为:
其中,B为背景矩阵,S为前景数据矩阵,N为噪声矩阵,λ1为前景的结构稀疏正则项的权重,λ2为噪声的稀疏正则项的权重,τ为帧数据矩阵Bk的长度,n为数据矩阵的列数,bt与bt+τ为背景子数据,W为线性动态刻画矩阵,ut,t+τ为观测数据xt与xt+τ之间的相关性权重,d为索引树的深度,Gi为第i层次中所有节点,集合为第i层节点集合中某一节点包含的所有像素集合。
在一具体实施例中,如图7所示,执行步骤S6的过程可以具体包括如下步骤:
考虑到效率和准确性之间的平衡实践中,本发明实施例用交替方向法来优化求解分解模型。模型的优化问题变为最小化如下形式:
其中,Y是拉格朗日乘数,μ>0为线性约束惩罚。为了优化求解分解模型,需要利用不断迭代的交替优化策略优化求解B、S、N、W。在一实施例中,整个优化求解过程具体如图8所示。
在本发明实施例中,具体的优化求解步骤如下:
步骤S61:更新背景矩阵B。
本发明实施例当固定S,N,W时,在第k+1次迭代更新Bk+1,优化方法如下:
为了方便求解B,引入两个辅助变量
其中,0τ∈Rτ×(n-τ)为全0矩阵,In-τ,-In-τ分别为n-τ阶单位方阵和负单位方阵。则Bk +1可简化为如下形式:
其中,U=diag([u1,1+τ,u2,2+τ,...,un-τ,n])和TB=X-Sk-Nk+(μk)-1Yk。
由于U是关于权重(所有权值均大于0)的正定对角矩阵,因此成立,带入式(11)进一步简化为:
其中,由上式可知Bk+1是关于B的凸函数,式(12)第二项对B求导后,不能得到关于B的闭式解,因此,本发明利用堆叠操作符(VecOperator)和kro积(Kronecker Product)进行处理,堆叠操作符和kro积的定理如下:
使用定理再次简化Bk+1,得到:
其中,vec(B)=β,vec(TB)=βB,那么对于βk+1的优化求解,有如下闭式解:
βk+1=(μk Imn+2RTR)+μkβB (15)
其中,Imn为mn阶的单位阵,(*)+表示矩阵的伪逆。有了堆叠向量βk+1,只需要在此拉伸为原形状(Rm×n)便能得到Bk+1。
步骤S62:更新线性动态刻画矩阵W。
当固定S、N、B时,在第k+1次迭代更新Wk+1,优化方法如下:
其中,
U=diag([u1,1+τ,u2,2+τ,…,un-τ,n])。上述问题实质为关于W一个线性问题,则其闭式解如下:
其中,(*)+表示矩阵的伪逆。
步骤S63:更新前景矩阵S。
当固定B、N、W时,在第k+1次迭代更新Sk+1,优化方法如下:
其中,Ts=X-Bk+1-Nk+(μk)-1Yk。运用通过层次近似算子进行求解前景数据S,具体通过将矩阵投影到对偶lp范数的单位球上来计算一个特定的残差序列进行优化求解。在一实施例中,关于l∞范数求解的详细步骤如图9所示。
步骤S64:更新噪声矩阵N。
当固定B,S,W时,在第k+1次迭代更新Nk+1,优化方法如下:
其中,TN=X-Bk+1-Sk+1+(μk)-1Yk。运用软阈值算子进行求解噪声矩阵N。具体的,
其中,Sλ(v)=sign(v)max(0,|v-λ|)。
在一具体实施例中,执行步骤S6的过程可以具体包括:
算法的收敛条件是输入矩阵X的分解相对误差小于容忍度ε且分解的背景矩阵B、前景矩阵S和噪声矩阵N分别对应的相对变化都小于容忍度ε,形式化为:
本发明提供的静态视频分析方法可以应用在匀质工业产品中缺陷检测的应用,本发明实施例以轨道表面缺陷检测为例说明:
在轨道表面检测领域,由于轨道特殊的工作方式,使得轨道表面采集图像在纵向上具有一致性。从矩阵角度分析,轨道表面图像的灰度矩阵之间存在相关性,并且轨道表面中的缺陷区域跟背景之间也存在潜在的相关性。因此可以认为轨道表面具有灰度值上的相对一致性,但往往被小部分缺陷或其它异常所打破,表现出较大的差异。即待检测图像背景一般是规则的,而轨道表面中的缺陷可以认为是一个异常区域。由于轨道表面相对一致的背景,使得轨道表面缺陷检测问题与前述的视频分析中的前景检测主题有关。轨道表面缺陷检测模型建立如图10所示。任何轨道表面数据X都可以进一步分割成任何长度τ的子数据块;则轨道表面数据的空间序列可表示为X=[...,Xk,...]∈Rm×n。X的长度理论上可以是任何值,即任意的一段钢轨。因此,X可以表示任何先前工作中采集系统所捕获的轨道图像,甚至是铁路线路的整个轨道表面采集数据。我们将观测到的钢轨表面数据X∈Rm×n视为连续信号,用数据矩阵B=[...,Bk,...]∈Rm×n表示重构出的背景,其中Bk∈Rm×τ表示子块背景矩阵。因此使用结构化稀疏度范数对缺陷区域建模非常合适,其实现步骤与上述实施例中的描述相似,在此不再赘述。
实施例2
本施例提供一种静态视频分析系统,如图11所示,包括:
视频数据获取模块1,用于获取视频数据;此模块执行实施例1中的步骤S1所描述的方法,在此不再赘述。
背景的线性动态正则项获取模块2,用于获取所述视频数据背景的线性动态正则项;此模块执行实施例1中的步骤S2所描述的方法,在此不再赘述。
前景的结构化稀疏正则项获取模块3,用于获取所述视频数据前景的结构化稀疏正则项;此模块执行实施例1中的步骤S3所描述的方法,在此不再赘述。
噪声的稀疏正则项获取模块4,用于获取噪声的稀疏正则项;此模块执行实施例1中的步骤S4所描述的方法,在此不再赘述。
分解模型构建模块5,用于根据所述线性动态正则项、所述前景的结构化稀疏正则项及噪声的稀疏正则项,构建结合动态背景和结构稀疏的分解模型;此模块执行实施例1中的步骤S5所描述的方法,在此不再赘述。
模型优化模块6,用于对所述分解模型进行优化,得到所述视频数据的前景和背景的分离结果。此模块执行实施例1中的步骤S6所描述的方法,在此不再赘述。
本发明提供的静态视频分析系统,基于背景的线性动态正则项、前景的结构化稀疏正则项和噪声的稀疏正则项,搭建了一种结合动态背景和结构稀疏的用于视频分析的分解模型,能很好捕捉背景因噪声等引起的演变,重构动态背景,更容易地将背景和前景分开,具有很好的背景重构能力和前景检测性能。
实施例3
本发明实施例提供一种计算机设备,如图12所示,包括:至少一个处理器401,例如CPU(Central Processing Unit,中央处理器),至少一个通信接口403,存储器404,至少一个通信总线402。其中,通信总线402用于实现这些组件之间的连接通信。其中,通信接口403可以包括显示屏(Display)、键盘(Keyboard),可选通信接口403还可以包括标准的有线接口、无线接口。存储器404可以是高速RAM存储器(Ramdom Access Memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器404可选的还可以是至少一个位于远离前述处理器401的存储装置。其中处理器401可以执行实施例1的静态视频分析方法。存储器404中存储一组程序代码,且处理器401调用存储器404中存储的程序代码,以用于执行实施例1的静态视频分析方法。
其中,通信总线402可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。通信总线402可以分为地址总线、数据总线、控制总线等。为便于表示,图12中仅用一条线表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器404可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard diskdrive,缩写:HDD)或固降硬盘(英文:solid-state drive,缩写:SSD);存储器404还可以包括上述种类的存储器的组合。
其中,处理器401可以是中央处理器(英文:central processing unit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU和NP的组合。
其中,处理器401还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:ASIC),可编程逻辑器件(英文:programmable logic device,缩写:PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(英文:complex programmable logic device,缩写:CPLD),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:FPGA),通用阵列逻辑(英文:generic arraylogic,缩写:GAL)或其任意组合。
可选地,存储器404还用于存储程序指令。处理器401可以调用程序指令,实现如本申请执行实施例1中的静态视频分析方法。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机可执行指令,该计算机可执行指令可执行实施例1的静态视频分析方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固降硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (10)
1.一种静态视频分析方法,其特征在于,包括如下步骤:
获取视频数据;
获取所述视频数据背景的线性动态正则项;
获取所述视频数据前景的结构化稀疏正则项;
获取噪声的稀疏正则项;
根据所述线性动态正则项、所述前景的结构化稀疏正则项及噪声的稀疏正则项,构建结合动态背景和结构稀疏的分解模型;
对所述分解模型进行优化求解,得到所述视频数据的前景和背景的分离结果。
2.根据权利要求1所述的静态视频分析方法,其特征在于,所述获取所述视频数据背景的线性动态正则项的步骤,包括:
利用线性动态策略对所述视频数据进行背景重构;
根据所述背景的动态性能获取背景的线性动态正则项。
3.根据权利要求2所述的静态视频分析方法,其特征在于,所述背景的线性动态正则项通过以下公式计算:
其中,B为背景矩阵,τ为帧数据矩阵Bk的长度,n为数据矩阵的列数,bt与bt+τ为背景子数据,W为线性动态刻画矩阵,ut,t+τ为观测数据xt与xt+τ之间的相关性权重。
4.根据权利要求1所述的静态视频分析方法,其特征在于,获取所述视频数据前景的结构化稀疏正则项的步骤,包括:
获取所述视频数据的超像素块;
对所述超像素块进行不同层次的聚类,得到索引树;
将所述索引树约束编码为稀疏范数,以规范矩阵分解,得到第一前景的结构稀疏正则项;
利用l∞范数对所述第一前景的结构稀疏正则项进行约束,得到第二前景的结构化稀疏正则项。
5.根据权利要求4所述的静态视频分析方法,其特征在于,所述第二前景的结构化稀疏正则项通过以下公式计算:
其中,d为索引树的深度,Gi为第i层次中所有节点,集合为第i层节点集合中某一节点包含的所有像素集合。
6.根据权利要求1所述的静态视频分析方法,其特征在于,所述分解模型为:
s.t.X=B+S+N.
s.t.X=B+S+N.
其中,B为背景矩阵,S为前景矩阵,N为噪声矩阵,λ1为前景的结构稀疏正则项的权重,λ2为噪声的稀疏正则项的权重,τ为帧数据矩阵Bk的长度,n为数据矩阵的列数,bt与bt+τ为背景子数据,W为线性动态刻画矩阵,ut,t+τ为观测数据xt与xt+τ之间的相关性权重,d为索引树的深度,Gi为第i层次中所有节点,集合为第i层节点集合中某一节点包含的所有像素集合。
7.根据权利要求6所述的静态视频分析方法,其特征在于,采用交替方向法求解分解模型。
8.一种静态视频分析系统,其特征在于,包括:
视频数据获取模块,用于获取视频数据;
背景的线性动态正则项获取模块,用于获取所述视频数据背景的线性动态正则项;
前景的结构化稀疏正则项获取模块,用于获取所述视频数据前景的结构化稀疏正则项;
噪声的稀疏正则项获取模块,用于获取噪声的稀疏正则项;
分解模型构建模块,用于根据所述线性动态正则项、所述前景的结构化稀疏正则项及噪声的稀疏正则项,构建结合动态背景和结构稀疏的分解模型;
模型优化模块,用于对所述分解模型进行优化,得到所述视频数据的前景和背景的分离结果。
9.一种计算机设备,其特征在于,包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-7中任一所述的静态视频分析方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-7中任一所述的静态视频分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910767893.5A CN110610508B (zh) | 2019-08-20 | 2019-08-20 | 一种静态视频分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910767893.5A CN110610508B (zh) | 2019-08-20 | 2019-08-20 | 一种静态视频分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110610508A true CN110610508A (zh) | 2019-12-24 |
CN110610508B CN110610508B (zh) | 2021-11-09 |
Family
ID=68890479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910767893.5A Active CN110610508B (zh) | 2019-08-20 | 2019-08-20 | 一种静态视频分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110610508B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112883929A (zh) * | 2021-03-26 | 2021-06-01 | 全球能源互联网研究院有限公司 | 在线视频异常行为检测模型训练、异常检测方法及系统 |
CN114172871A (zh) * | 2021-12-13 | 2022-03-11 | 以萨技术股份有限公司 | 一种基于视频违法检测的数据处理系统、方法及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103617637A (zh) * | 2013-12-16 | 2014-03-05 | 中国人民解放军国防科学技术大学 | 一种基于字典学习的低照度运动检测方法 |
CN104599292A (zh) * | 2015-02-03 | 2015-05-06 | 中国人民解放军国防科学技术大学 | 一种基于低秩矩阵分解的抗噪运动目标检测算法 |
US20160055124A1 (en) * | 2014-08-21 | 2016-02-25 | Massachusetts Institute Of Technology | Systems and methods for low-rank matrix approximation |
CN105761251A (zh) * | 2016-02-02 | 2016-07-13 | 天津大学 | 一种基于低秩和结构稀疏的视频前景背景分离方法 |
CN108764177A (zh) * | 2018-05-31 | 2018-11-06 | 安徽大学 | 一种基于低秩分解和表示联合学习的运动目标检测方法 |
CN109241843A (zh) * | 2018-08-02 | 2019-01-18 | 南京理工大学 | 空谱联合多约束优化非负矩阵解混方法 |
US20190050372A1 (en) * | 2017-08-14 | 2019-02-14 | City University Of Hong Kong | Systems and methods for robust low-rank matrix approximation |
CN110136164A (zh) * | 2019-05-21 | 2019-08-16 | 电子科技大学 | 基于在线透射变换、低秩稀疏矩阵分解去除动态背景的方法 |
-
2019
- 2019-08-20 CN CN201910767893.5A patent/CN110610508B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103617637A (zh) * | 2013-12-16 | 2014-03-05 | 中国人民解放军国防科学技术大学 | 一种基于字典学习的低照度运动检测方法 |
US20160055124A1 (en) * | 2014-08-21 | 2016-02-25 | Massachusetts Institute Of Technology | Systems and methods for low-rank matrix approximation |
CN104599292A (zh) * | 2015-02-03 | 2015-05-06 | 中国人民解放军国防科学技术大学 | 一种基于低秩矩阵分解的抗噪运动目标检测算法 |
CN105761251A (zh) * | 2016-02-02 | 2016-07-13 | 天津大学 | 一种基于低秩和结构稀疏的视频前景背景分离方法 |
US20190050372A1 (en) * | 2017-08-14 | 2019-02-14 | City University Of Hong Kong | Systems and methods for robust low-rank matrix approximation |
CN108764177A (zh) * | 2018-05-31 | 2018-11-06 | 安徽大学 | 一种基于低秩分解和表示联合学习的运动目标检测方法 |
CN109241843A (zh) * | 2018-08-02 | 2019-01-18 | 南京理工大学 | 空谱联合多约束优化非负矩阵解混方法 |
CN110136164A (zh) * | 2019-05-21 | 2019-08-16 | 电子科技大学 | 基于在线透射变换、低秩稀疏矩阵分解去除动态背景的方法 |
Non-Patent Citations (2)
Title |
---|
JINRUI G.等: "Cloud Type Classification of Total-Sky Images Using Duplex Norm-Bounded Sparse Coding", 《IEEE JOURNAL OF SELECTED TOPICS IN APPLIED EARTH OBSERVATIONS AND REMOTE SENSING》 * |
周密 等: "基于稀疏与低秩矩阵分解的视频背景建模", 《计算机应用研究》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112883929A (zh) * | 2021-03-26 | 2021-06-01 | 全球能源互联网研究院有限公司 | 在线视频异常行为检测模型训练、异常检测方法及系统 |
CN112883929B (zh) * | 2021-03-26 | 2023-08-08 | 全球能源互联网研究院有限公司 | 在线视频异常行为检测模型训练、异常检测方法及系统 |
CN114172871A (zh) * | 2021-12-13 | 2022-03-11 | 以萨技术股份有限公司 | 一种基于视频违法检测的数据处理系统、方法及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110610508B (zh) | 2021-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Höft et al. | Fast semantic segmentation of RGB-D scenes with GPU-accelerated deep neural networks | |
JP2018513507A5 (zh) | ||
JP6100300B2 (ja) | 階層グラフに基づく画像マッティングおよび前景推定の方法およびシステム | |
CN111882040A (zh) | 基于通道数量搜索的卷积神经网络压缩方法 | |
CN108510013B (zh) | 基于低秩核心矩阵的改进稳健张量主成分分析的背景建模方法 | |
CN106529419A (zh) | 视频显著性堆栈式聚合的对象自动检测方法 | |
CN114005085B (zh) | 一种视频中密集人群分布检测与计数方法 | |
CN107463932B (zh) | 一种使用二进制瓶颈神经网络来抽取图片特征的方法 | |
CN112766062B (zh) | 一种基于双流深度神经网络的人体行为识别方法 | |
CN105279485B (zh) | 激光夜视下监控目标异常行为的检测方法 | |
CN110610508B (zh) | 一种静态视频分析方法及系统 | |
Gkillas et al. | Connections between deep equilibrium and sparse representation models with application to hyperspectral image denoising | |
CN112580662A (zh) | 一种基于图像特征识别鱼体方向的方法及系统 | |
CN112906813A (zh) | 一种基于密度聚类和胶囊神经网络的浮选工况识别方法 | |
CN114743027B (zh) | 弱监督学习引导的协同显著性检测方法 | |
CN116229323A (zh) | 一种基于改进的深度残差网络的人体行为识别方法 | |
CN114612709A (zh) | 图像金字塔特征指导的多尺度目标检测方法 | |
Wang et al. | A multiscale gradient fusion method for edge detection in color images utilizing the cbm3d filter | |
Park et al. | AN EFFECTIVE COLOR QUANTIZATION METHOD USING COLOR IMPORTANCE-BASED SELF-ORGANIZING MAPS. | |
Shen et al. | Graph-Represented Distribution Similarity Index for Full-Reference Image Quality Assessment | |
CN113128455A (zh) | 一种细胞图像重构模型训练方法和系统 | |
Li et al. | CDMY: A lightweight object detection model based on coordinate attention | |
CN116758349A (zh) | 基于多尺度超像素节点聚合图卷积残差网络的高光谱图像分类方法 | |
CN111047654A (zh) | 一种基于色彩信息的高清高速视频背景建模方法 | |
CN112580442B (zh) | 一种基于多维金字塔层次模型的行为识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |