CN103136730A - 视频图像中内容的光流和轮廓特征动态结构融合方法 - Google Patents
视频图像中内容的光流和轮廓特征动态结构融合方法 Download PDFInfo
- Publication number
- CN103136730A CN103136730A CN2013100304017A CN201310030401A CN103136730A CN 103136730 A CN103136730 A CN 103136730A CN 2013100304017 A CN2013100304017 A CN 2013100304017A CN 201310030401 A CN201310030401 A CN 201310030401A CN 103136730 A CN103136730 A CN 103136730A
- Authority
- CN
- China
- Prior art keywords
- sequence
- matrix
- feature
- sigma
- behavioral characteristics
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种视频图像中内容特征动态结构融合方法,采用空间分布直方图特征描述光流和轮廓,提取各自特征序列的动态模型的不变参数构建动态特征,然后通过子空间度量的方法求出各自的结构表征,最后通过广义矩阵分解的方法求得融合结构,得出分类判别能力强的特征表征,获得了分类判别能力强的特征表征,解决了现有的方法无法进行特征的动态结构融合,无法准确的表征特定内容特征的问题。
Description
技术领域
本发明属于视频监控图像处理技术领域,涉及一种视频图像中内容的光流和轮廓特征动态结构融合方法。
背景技术
近年来,基于内容分析的智能监控系统、视频检索、运动分析和高级人机交互的应用越来越多,要智能分析和识别目标,特征表征与认知是需要解决的关键问题,因为视频图像中特定内容的光流和轮廓表征的序列中的动态性和多样性,使得单一特征表征不充分,序列动态特征和结构融合难以描述和获取,不能显现特征的分辨特性,对于这种情况当前的方法无法进行特征的动态结构融合,进而无法更加准确的表征特定内容的特征。
发明内容
本发明的目的是提供一种视频图像中内容的光流和轮廓特征动态结构融合方法,以解决现有的方法无法进行特征的动态结构融合,无法准确的表征特定内容特征的问题。
本发明所采用的技术方案是,视频图像中内容特征动态结构融合方法,采用空间分布直方图特征描述光流和轮廓,提取各自特征序列的动态模型的不变参数构建动态特征,然后通过子空间度量的方法求出各自的结构表征,最后通过广义矩阵分解的方法求得融合结构,得出分类判别能力强的特征表征。
本发明的特点还在于,具体按照以下步骤实施:
步骤1,特定内容的光流和轮廓特征描述
设I(x,y)为图像在点(x,y)处的像素值,其中,x和y分别表示点的横纵坐标,令有光流矢量起点坐标的图像像素值为1,有轮廓坐标的图像像素值为1,其它图像的像素值为0;
令c(xc,yc)为图像的重心,xc和yc分别是重心的横纵坐标,
特征表征为光流或轮廓空间点分布的特征,以距离重心c(xc,yc)最远光流或轮廓上非零信息点的欧氏距离为半径形成轮廓外接圆,外接圆的中心在重心c(xc,yc)上,以c(xc,yc)建立极坐标,在角度上分18等份,径向上分等5份,在外接圆上会形成90个区域,统计在每个区域上的非零信息点个数,根据角度从小到大和径向距离从小到大形成90维的向量,统计的起点为极坐标角度为0方向,光流或轮廓分别表征为90维的特征向量f1和f2;
步骤2,光流和轮廓特征序列动态特征获取
(2.1)光流特征序列为{f1(t)}1<t<τ,τ为视频序列的帧数,t为序列数;
对光流特征序列进行奇异值分解得下式,
其中,U1、V1和S1分别为式(3)左边奇异值分解的行正交矩阵、列正交矩阵和对角矩阵;
C1=U1 (4)
其中,C1和A1分别为光流特征序列的测量矩阵和转换矩阵,D11=[00;Iτ-10],D12=[Iτ-10;00],Iτ-1为τ-1维单位矩阵;
(2.2)轮廓特征序列为{f2(t)}1<t<τ,τ为视频序列的帧数,t为序列数;
对轮廓特征序列进行奇异值分解得下式,
其中,U2、V2和S2分别为式(7)左边奇异值分解的行正交矩阵、列正交矩阵和对角矩阵;
C2=U2 (8)
其中,C2和A2分别为轮廓特征序列的测量矩阵和转换矩阵,D21=[00;Iτ-10],D22=[Iτ-10;00],Iτ-1为τ-1维单位矩阵;
步骤3,动态特征结构的度量
其中,
其中,
步骤4,动态特征结构融合映射
定义 和 特征结构测度相似矩阵,以步骤3计算度量的相似矩阵为W1={W1i,j}和W2={W2i,j}(i=1,2,...,m j=1,2,...,m)如下式:
其中,
Wi,j=W1i,j+W2i,j (16)
其中,Wi,j为W矩阵在i行j列的元素;
可以通过以下两式求解,
(DU-WU)v=λDUv (17)
(DV-WV)u=λDVu (18)
其中, v为求解式(17)最小的d个广义特征值λ1<λ2<...<λd对应的特征向量v1,v2,...,vd,u为求解式(18)最小的d个广义特征值λ1<λ2<...<λd对应的特征向量u1,u2,...,ud;
求解U和V矩阵过程如下:
①设U为单位矩阵,求解式(17)最小的d个广义特征值λ1<λ2<...<λd对应的特征向量v1,v2,...,vd,则
V=[v1,v2,...,vd] (19)
②将V带入式(18),求解最小的d个广义特征值λ1<λ2<...<λd对应的特征向量u1,u2,...,ud,则
U=[u1,u2,...,ud] (20)
再将U带入式(17)求解,重复以上①和②过程20次,最终求得U和V矩阵;
最终结构融合的特征为Y,
Y=UTPV (21)。
本发明的有益效果是,通过本发明的针对视频图像中特定内容对象,分别描述光流和轮廓特征,在各自的特征序列上获取动态模型的不变参数组成特征向量空间,然后通过子空间度量的方法求出各自的结构表征,最后通过广义矩阵分解的方法求得融合结构,得出分类判别能力强的特征表征的方 法,获得了分类判别能力强的特征表征,解决了现有的方法无法进行特征的动态结构融合,无法准确的表征特定内容特征的问题。
具体实施方式
下面结合具体实施方式对本发明进行详细说明。
本发明提供了一种视频图像中内容特征动态结构融合方法,采用空间分布直方图特征描述光流和轮廓,提取各自特征序列的动态模型的不变参数构建动态特征,然后通过子空间度量的方法求出各自的结构表征,最后通过广义矩阵分解的方法求得融合结构,得出分类判别能力强的特征表征,按照以下步骤实施:
步骤1,特定内容的光流和轮廓特征描述
光流和轮廓特征表征有多种方法,能充分表现空间点分布的特征为光流矢量起点和轮廓点分布直方图,因为其在特征描述时不仅考虑到相对距离,还考虑到了相关角度和空间位置分布信息。
设I(x,y)为图像在点(x,y)处的像素值,其中,x和y分别表示点的横纵坐标,令有光流矢量起点坐标的图像像素值为1,有轮廓坐标的图像像素值为1,其它图像的像素值为0;
令c(xc,yc)为图像的重心,xc和yc分别是重心的横纵坐标:
特征表征为光流或轮廓空间点分布的特征,以距离重心c(xc,yc)最远光流 或轮廓上非零信息点的欧氏距离为半径形成轮廓外接圆,外接圆的中心在重心c(xc,yc)上,以c(xc,yc)建立极坐标,在角度上分18等份,径向上分等5份。在外接圆上会形成90个区域,统计在每个区域上的非零信息点个数,根据角度从小到大和径向距离从小到大形成90维的向量,统计的起点为极坐标角度为0方向。光流或轮廓分别表征为90维的特征向量f1和f2。为了保证尺度不变,向量除以向量的均值来归一化。因为参考点在光流或轮廓的非零信息点上,所以特征具有天然的平移不变性。
步骤2,光流和轮廓特征序列动态特征获取
(2.1)光流特征序列为{f1(t)}1<t<τ,τ为视频序列的帧数,t为序列数,
对光流特征序列进行奇异值分解得下式,
其中,U1、V1和S1分别为式(3)左边奇异值分解的行正交矩阵、列正交矩阵和对角矩阵;
C1=U1 (4)
其中,D11=[00;Iτ-10],D12=[Iτ-10;00],Iτ-1为τ-1维单位矩阵,C1和A1分别为光流特征序列的测量矩阵和转换矩阵,
(2.2)轮廓特征序列为{f2(t)}1<t<τ,τ为视频序列的帧数,t为序列数,对轮廓特征序列进行奇异值分解得下式,
其中U2、V2和S2分别为式(7)左边奇异值分解的行正交矩阵、列正交矩阵和对角矩阵;
C2=U2 (8)
其中,D21=[00;Iτ-10],D22=[Iτ-10;00],Iτ-1为τ-1维单位矩阵,C2和A2分别为轮廓特征序列的测量矩阵和转换矩阵,
步骤3,动态特征结构的度量
当一个视频数据集的数目为m时,为光流的序列动态特征集,其中为的第m段视频序列的光流特征的序列动态特征; 为轮廓的序列动态特征集,其中为的第m段视频序列的轮廓特征的序列动态特征;因为P1和P2分别为向量空间的集合,所以各特征集的内在结构通过向量空间的距离进行度量;
其中,
其中,
步骤4,动态特征结构融合映射
定义 和 特征结构测度相似矩阵,以步骤3计算度量的相似矩阵为W1={W1i,j}和W2={W2i,j}(i=1,2,...,m j=1,2,...,m)如下式:
其中,
Wi,j=W1i,j+W2i,j (16)
其中,Wi,j为W矩阵在i行j列的元素;
可以通过以下两式求解,
(DU-WU)v=λDUv (17)
(DV-WV)u=λDVu (18)
其中, v为求解式(17)最小的d个广义特征值λ1<λ2<...<λd对应的特征向量v1,v2,...,vd,u为求解式(18)最小的d个广义特征值λ1<λ2<...<λd对应的特征向量u1,u2,...,ud;
求解U和V矩阵过程如下:
①最初设U为单位矩阵,求解式(17)最小的d个广义特征值λ1<λ2<...<λd对应的特征向量v1,v2,...,vd,则
V=[v1,v2,...,vd] (19)
②带入求解式(18)最小的d个广义特征值λ1<λ2<...<λd对应的特征向量u1,u2,...,ud,则
U=[u1,u2,...,ud] (20)
再带入求解式(17),重复以上①和②过程20次,最终求得U和V矩阵。
最终结构融合的特征为Y,
Y=UTPV (21)。
本发明的方法首先通过全局建立相对极坐标和局部统计计数,对人体动作空间分布进行描述,获取了各个轮廓以及光流特征的空间结构,然后利用ARMA(自回归滑动平均)对各个特征的空间分布特征时序建立模型,分别获得模型参数特征,最后对模型参数计算动作相似矩阵,对相似矩阵关系进行线性假设,建立统一的融合优化式,求取结构融合参数,识别时直接利用融合后的映射特征进行最近邻分类。
Weizmann人体动作数据库是被广泛应用到人体动作识别中的数据库之一,这个数据库包含了9个人执行的10个动作类(bend,jack,jump,pjump,run,side,skip,walk,wave1和wave2),一共93个视频序列。
参见表1,可看出本发明的方法在Weizmann人体动作数据库中的识别率达到了100%,高于现有的方法,即使对于容易混淆的jump和skip,仍然具有很好的识别精度,虽然这些动作在表面轮廓特征表征时很相近,但是运 动光流特征和动态建模取得的时间结构有较大差异,所以本发明的方法达到了很好的识别率。
表1Weizmann数据库中不同特征的人体动作ARMA动态建模识别结果
Claims (2)
1.视频图像中内容特征动态结构融合方法,其特征在于,采用空间分布直方图特征描述光流和轮廓,提取各自特征序列的动态模型的不变参数构建动态特征,然后通过子空间度量的方法求出各自的结构表征,最后通过广义矩阵分解的方法求得融合结构,得出分类判别能力强的特征表征。
2.如权利要求1中的视频图像中内容特征动态结构融合方法,其特征在于,具体按照以下步骤实施:
步骤1,特定内容的光流和轮廓特征描述
设I(x,y)为图像在点(x,y)处的像素值,其中,x和y分别表示点的横纵坐标,令有光流矢量起点坐标的图像像素值为1,有轮廓坐标的图像像素值为1,其它图像的像素值为0;
令c(xc,yc)为图像的重心,xc和yc分别是重心的横纵坐标,
特征表征为光流或轮廓空间点分布的特征,以距离重心c(xc,yc)最远光流或轮廓上非零信息点的欧氏距离为半径形成轮廓外接圆,外接圆的中心在重心c(xc,yc)上,以c(xc,yc)建立极坐标,在角度上分18等份,径向上分等5份,在外接圆上会形成90个区域,统计在每个区域上的非零信息点个数,根据角度从小到大和径向距离从小到大形成90维的向量,统计的起点为极坐标角度为0方向,光流或轮廓分别表征为90维的特征向量f1和f2;
步骤2,光流和轮廓特征序列动态特征获取
(2.1)光流特征序列为{f1(t)}1<t<τ,τ为视频序列的帧数,t为序列数;
对光流特征序列进行奇异值分解得下式,
其中,U1、V1和S1分别为式(3)左边奇异值分解的行正交矩阵、列正交矩阵和对角矩阵;
C1=U1 (4)
其中,C1和A1分别为光流特征序列的测量矩阵和转换矩阵,D11=[00;Iτ-10],D12=[Iτ-10;00],Iτ-1为τ-1维单位矩阵;
(2.2)轮廓特征序列为{f2(t)}1<t<τ,τ为视频序列的帧数,t为序列数;
对轮廓特征序列进行奇异值分解得下式,
其中,U2、V2和S2分别为式(7)左边奇异值分解的行正交矩阵、列正交矩阵和对角矩阵;
C2=U2 (8)
其中,C2和A2分别为轮廓特征序列的测量矩阵和转换矩阵,D21=[00;Iτ-10],D22=[Iτ-10;00],Iτ-1为τ-1维单位矩阵;
步骤3,动态特征结构的度量
其中,
其中,
步骤4,动态特征结构融合映射
定义 和 特征结构测度相似矩阵,以步骤3计算度量的相似矩阵为W1={W1i,j}和W2={W2i,j}(i=1,2,...,m j=1,2,...,m)如下式:
其中,
Wi,j=W1i,j+W2i,j (16)
其中,Wi,j为W矩阵在i行j列的元素;
可以通过以下两式求解,
(DU-WU)v=λDUv (17)
(DV-WV)u=λDVu (18)
其中, v为求解式(17)最小的d个广义特征值λ1<λ2<...<λd对应的特征向量v1,v2,...,vd,u为求解式(18)最小的d个广义特征值λ1<λ2<...<λd对应的特征向量u1,u2,...,ud;
求解U和V矩阵过程如下:
①设U为单位矩阵,求解式(17)最小的d个广义特征值λ1<λ2<...<λd对应的特征向量v1,v2,...,vd,则
V=[v1,v2,...,vd] (19)
②将V带入式(18),求解最小的d个广义特征值λ1<λ2<...<λd对应的特征向量u1,u2,...,ud,则
U=[u1,u2,...,ud] (20)
再将U带入式(17)求解,重复以上①和②过程20次,最终求得U和V矩阵;
最终结构融合的特征为Y,
Y=UTPV (21)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310030401.7A CN103136730B (zh) | 2013-01-25 | 2013-01-25 | 视频图像中内容的光流和轮廓特征动态结构融合方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310030401.7A CN103136730B (zh) | 2013-01-25 | 2013-01-25 | 视频图像中内容的光流和轮廓特征动态结构融合方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103136730A true CN103136730A (zh) | 2013-06-05 |
CN103136730B CN103136730B (zh) | 2015-06-03 |
Family
ID=48496526
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310030401.7A Active CN103136730B (zh) | 2013-01-25 | 2013-01-25 | 视频图像中内容的光流和轮廓特征动态结构融合方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103136730B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103412909A (zh) * | 2013-08-01 | 2013-11-27 | 西北工业大学 | 一种基于特征融合的视频数据检索方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446601B (zh) * | 2018-02-27 | 2021-07-13 | 东南大学 | 一种基于动静特征融合的人脸识别方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040208341A1 (en) * | 2003-03-07 | 2004-10-21 | Zhou Xiang Sean | System and method for tracking a global shape of an object in motion |
CN101673403A (zh) * | 2009-10-10 | 2010-03-17 | 安防制造(中国)有限公司 | 复杂干扰场景下的目标跟踪方法 |
-
2013
- 2013-01-25 CN CN201310030401.7A patent/CN103136730B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040208341A1 (en) * | 2003-03-07 | 2004-10-21 | Zhou Xiang Sean | System and method for tracking a global shape of an object in motion |
CN101673403A (zh) * | 2009-10-10 | 2010-03-17 | 安防制造(中国)有限公司 | 复杂干扰场景下的目标跟踪方法 |
Non-Patent Citations (1)
Title |
---|
XIN SHU ET AL: "《A novel contour descriptor for 2D shape matching and its application to image retrieval》", 《IMAGE AND VISION COMPUTING》, vol. 29, no. 4, 29 November 2010 (2010-11-29), pages 286 - 294, XP028150030, DOI: 10.1016/j.imavis.2010.11.001 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103412909A (zh) * | 2013-08-01 | 2013-11-27 | 西北工业大学 | 一种基于特征融合的视频数据检索方法 |
CN103412909B (zh) * | 2013-08-01 | 2016-08-24 | 西北工业大学 | 一种基于特征融合的视频数据检索方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103136730B (zh) | 2015-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108549846B (zh) | 一种结合运动特征和头肩结构的行人检测与统计方法 | |
Li et al. | Activity recognition using dynamic subspace angles | |
CN102034096B (zh) | 基于自顶向下运动注意机制的视频事件识别方法 | |
CN104063719A (zh) | 基于深度卷积网络的行人检测方法及装置 | |
Zheng et al. | Prompt vision transformer for domain generalization | |
CN102663401B (zh) | 一种图像特征提取和描述方法 | |
CN102945517B (zh) | 一种基于聚类分析的服装标准工时的数据挖掘方法 | |
CN105046714A (zh) | 一种非监督的基于超像素和目标发现机制的图像分割方法 | |
CN105574642A (zh) | 一种基于智能电网大数据的电价执行稽查方法 | |
CN105975932A (zh) | 基于时间序列shapelet的步态识别分类方法 | |
CN105389326A (zh) | 基于弱匹配概率典型相关性模型的图像标注方法 | |
CN103699874A (zh) | 基于surf流和lle稀疏表示的人群异常行为识别方法 | |
CN103020658B (zh) | 二维图像中的物体识别方法 | |
Huang et al. | Human action recognition based on self organizing map | |
CN102663447A (zh) | 基于判别相关分析的跨媒体检索方法 | |
CN104008394A (zh) | 基于近邻边界最大的半监督高光谱数据降维方法 | |
CN102930291B (zh) | 用于图形图像的k近邻局部搜索遗传自动聚类方法 | |
Chen et al. | Robust vehicle detection and viewpoint estimation with soft discriminative mixture model | |
CN105447506A (zh) | 一种基于区间分布概率特征的手势识别方法 | |
CN107423697B (zh) | 基于非线性融合深度3d卷积描述子的行为识别方法 | |
CN109324595B (zh) | 一种基于增量pca的工业监测数据分类方法 | |
Yao | RETRACTED ARTICLE: Deep learning analysis of human behaviour recognition based on convolutional neural network analysis | |
CN103136730B (zh) | 视频图像中内容的光流和轮廓特征动态结构融合方法 | |
CN102609733B (zh) | 海量人脸库应用环境下的人脸快速识别方法 | |
CN103177264A (zh) | 基于视觉词典全局拓扑表达的图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |