CN101751679A - 运动目标的分类方法和检测方法及其装置 - Google Patents

运动目标的分类方法和检测方法及其装置 Download PDF

Info

Publication number
CN101751679A
CN101751679A CN200910243873A CN200910243873A CN101751679A CN 101751679 A CN101751679 A CN 101751679A CN 200910243873 A CN200910243873 A CN 200910243873A CN 200910243873 A CN200910243873 A CN 200910243873A CN 101751679 A CN101751679 A CN 101751679A
Authority
CN
China
Prior art keywords
moving target
target
image
moving
gaussian kernel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910243873A
Other languages
English (en)
Inventor
王磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vimicro Corp
Original Assignee
Vimicro Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vimicro Corp filed Critical Vimicro Corp
Priority to CN200910243873A priority Critical patent/CN101751679A/zh
Publication of CN101751679A publication Critical patent/CN101751679A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种运动目标的分类方法,包括:利用收集到的视频图像建立背景模型,得到背景图像;计算当前帧视频图像与背景图像的差异,将图像划分为背景区域和前景区域,并将所述前景区域作为运动目标;将不同帧视频图像中的同一运动目标关联起来,得到各个运动目标完整的运动轨迹以及各个运动目标的特征参数;根据所述运动目标特征参数对已收集到的运动目标分为m类,并计算出每一类运动目标特征参数的统计信息,所述m为自然数。本发明还公开了基于上述分类方法的运动目标检测方法,以及用于实现上述方法的装置。本发明方案不需要根据不同的监控场景进行训练,也不需要制定规则,使用起来非常方便,可以广泛应用。

Description

运动目标的分类方法和检测方法及其装置
技术领域
本发明涉及视频监控技术领域,特别涉及一种运动目标的分类方法和检测方法及其装置。
背景技术
众所周知,视频监控系统的发展经历了第一代的全模拟系统,第二代的半数字化的系统,第三代的全数字化的系统(网络摄像机和视频服务器)三个阶段的发展演变,现在整个行业正在酝酿视频监控新的革命——智能视频监控。
传统的视频监控技术把远程的目标图像(原始数据)传送到监控中心,由监控人员根据目视到的视频图像对现场情况做出判断。而智能化视频监控系统则是通过嵌入在前端视频设备(网络摄像机或视频服务器)中的智能视频模块对所监控的画面进行分析,一旦发现安全威胁立刻向监控中心报警。
运动目标检测技术是智能化视频分析的基础。运动目标检测主要针对包含各种运动目标的视频图像序列进行处理,从场景中检测、跟踪、分类识别目标,并对其行为进行理解和描述。
现有的运动目标检测方法主要是采用收集样本进行训练的方法或者指定规则的方法。前者需要根据不同的监控场景,进行人工标定目标数据样本再进行训练,使智能视频模块能够识别符合目标数据样本特征的物体。但这种方法识别的准确度很大程度上依赖样本的数量和质量,并且如果更换监控场景还要重新训练,应用难度较大。后者需要根据不同场景指定不同的识别规则,制定出合适的规则难度较大,检测效果很大程度上依赖于规则制定者的经验和操作水平。因此现有的这两种运动目标监测方法的局限性都很大,难以广泛应用。
发明内容
有鉴于此,本发明的目的在于,提出一种运动目标分类方法和装置,可以根据实际监控场景自适应地形成运动目标的分类结果,所述分类结果可以用来对运动目标进行检测。
本发明实施例提出的一种运动目标的分类方法,包括如下步骤:
背景建模步骤:利用收集到的视频图像建立背景模型,得到背景图像;
运动检测步骤:计算当前帧视频图像与背景图像的差异,将图像划分为背景区域和前景区域,并将所述前景区域作为运动目标;
目标跟踪步骤:将不同帧视频图像中的同一运动目标关联起来,得到各个运动目标完整的运动轨迹以及各个运动目标的特征参数;
目标分类步骤:根据所述运动目标特征参数对已收集到的运动目标分为m类,并计算出每一类运动目标特征参数的统计信息,所述m为自然数。
所述背景建模步骤包括:
收集N帧图像{I0,I1,…,IN},N为自然数,提取每一帧图像中像素Y分量,得到{Y0,Y1,…,YN},所述Y分量是指YUV色彩空间的第一颜色通道的数值;设定更新速率γ,按照如下公式建立背景图像Bt
Figure G2009102438734D00021
其中γ为大于0且小于1的常数。
所述运动检测步骤包括:
将当前输入图像与背景图像相减并取绝对值得到差分图像;
使用阈值化方法对差分图像进行二值化处理,将图像划分为背景区域和前景区域;
对当前二值化图像进行滤波处理,填充前景区域中的空洞,将前景区域中面积大于给定阈值的连通区域作为运动目标。
所述目标跟踪步骤包括:
对运动检测步骤中的得到运动目标进行边界跟踪或者边缘点连接,得到每个运动目标的外接矩形框;
计算当前帧运动目标的外接矩形框与已经记录的运动目标的外接矩形框的重合区域的周长,将周长最大值对应的当前帧运动目标与已经记录的运动目标建立匹配关系;
根据所建立的匹配关系更新已经记录的运动目标信息。
所述运动目标的特征参数包括:运动目标的区域面积v1、速度v2和紧密性v3,所述m值等于3;
所述目标分类步骤包括:
A、设置3个初始的高斯核;
B、计算任一运动目标的特征向量v=(v1,v2,v3);
C、计算特征向量v属于三个高斯核的概率,找出概率最大的高斯核k,判断最大概率是否大于预先设置的概率阈值T,若是,则执行D,否则将权值和标准差之比w/σ最小的高斯核删除,以v的值建立一个新的高斯核,并转至步骤E;
D、按照如下公式更新第k个高斯核的参数:
w′k=(1-α)wk+α;
μ′k=(1-α)μk+αv;
∑′k=(1-α)∑k+α(v-μk)T(v-μk);其中,k为小于或等于3的自然数,α是一个0到1之间的常数;
按照如下公式更新另外两个高斯核的权重:
w′j=(1-α)wj,j≠k;
E、对三个高斯核的权重进行归一化处理,并判断是否还有未统计的运动目标,若是返回步骤B,否则结束目标分类步骤。
所述目标分类步骤之后,进一步包括:
将新的运动目标特征参数与所述已得到的统计信息进行匹配,确定所述新运动目标所属的类别。
本发明实施例提出的一种运动目标的分类装置包括:
背景建模模块:用于接收外部设备采集的视频图像,利用所接收的视频图像建立背景模型,得到背景图像;
运动检测模块:用于计算当前帧视频图像与所述背景图像的差异,将图像划分为背景区域和前景区域,并将所述前景区域作为运动目标;
目标跟踪模块:将不同帧图像中的同一运动目标关联起来,得到各个运动目标完整的运动轨迹以及各个运动目标的特征参数;
目标分类模块:用于根据所述运动目标特征参数对已收集到的运动目标分为m类,并计算出每一类运动目标特征参数的统计信息,所述m为自然数。
所述背景建模模块包括:
收集N帧图像{I0,I1,…,IN},N为自然数,提取每一帧图像中像素Y分量,得到{Y0,Y1,…,YN},所述Y分量是指YUV色彩空间的第一颜色通道的数值;设定更新速率γ,按照如下公式建立背景图像Bt
Figure G2009102438734D00041
其中γ为大于0且小于1的常数。
所述运动检测模块包括:
将当前输入图像与背景图像相减并取绝对值得到差分图像的单元;
使用阈值化方法对差分图像进行二值化处理,将图像划分为背景区域和前景区域的单元;
对当前二值化图像进行滤波处理,填充前景区域中的空洞,将前景区域中面积大于给定阈值的连通区域作为运动目标的单元。
所述目标跟踪模块包括:
对运动检测步骤中的得到运动目标进行边界跟踪或者边缘点连接,得到每个运动目标的外接矩形框的单元;
计算当前帧运动目标的外接矩形框与已经记录的运动目标的外接矩形框的重合区域的周长,将周长最大值对应的当前帧运动目标与已经记录的运动目标建立匹配关系的单元;
根据所建立的匹配关系更新已经记录的运动目标信息的单元。
所述运动目标的特征参数包括:运动目标的区域面积v1、速度v2和紧密性v3,所述m值等于3;
所述目标分类模块包括:
初始化单元,用于设置3个初始的高斯核;
特征提取单元,用于计算任一运动目标的特征向量v=(v1,v2,v3);
距离计算单元,用于计算特征向量v属于三个高斯核的概率,找出概率最大的高斯核k,判断最大概率是否大于预先设置的概率阈值T,并将判断结果以及特征向量v发送至模型更新单元;
模型更新单元,用于当距离计算单元的判断结果为是,按照如下公式更新第k个高斯核的参数:
w′k=(1-α)wk+α;
μ′k=(1-α)μk+αv;
∑′k=(1-α)∑k+α(v-μk)T(v-μk);其中,k为小于或等于3的自然数,α是一个0到1之间的常数;
按照如下公式更新另外两个高斯核的权重:
w′j=(1-α)wj,j≠k;
或者,当距离计算单元的判断结果为否,将权值和标准差之比w/σ最小的高斯核删除,以v的值建立一个新的高斯核;
高斯核更新完毕后,模型更新单元对三个高斯核的权重进行归一化处理;
判断单元,用于判断是否还有未统计的运动目标,若是将高斯核的相关参数发送至输出单元;
输出单元,用于对外输出三个高斯核的相关参数。
本发明的目的还在于,提出一种运动目标检测方法和装置,基于上述运动目标分类方案实现运动目标检测,可以无需人工标定样本进行训练以及人为制定规则,使用方便,便于广泛应用。
本发明实施例提出的一种运动目标的检测方法,包括:
进行运动目标的分类过程,得到每一类运动目标特征参数的统计信息;
将新的运动目标特征参数与所述已得到的统计信息进行匹配,确定所述新运动目标所属的类别。
所述分类过程包括:
背景建模步骤:利用收集到的视频图像建立背景模型,得到背景图像;
运动检测步骤:计算当前帧视频图像与背景图像的差异,将图像划分为背景区域和前景区域,并将所述前景区域作为运动目标;
目标跟踪步骤:将不同帧视频图像中的同一运动目标关联起来,得到各个运动目标完整的运动轨迹以及各个运动目标的特征参数;
目标分类步骤:根据所述运动目标特征参数对已收集到的运动目标分为m类,并计算出每一类运动目标特征参数的统计信息,所述m为自然数。
本发明实施例提出的一种运动目标的检测装置,包括一运动目标的分类装置以及目标检测模块;所述运动目标的分类装置包括:
背景建模模块:用于接收外部设备采集的视频图像,利用所接收的视频图像建立背景模型,得到背景图像;
运动检测模块:用于计算当前帧视频图像与所述背景图像的差异,将图像划分为背景区域和前景区域,并将所述前景区域作为运动目标;
目标跟踪模块:将不同帧图像中的同一运动目标关联起来,得到各个运动目标完整的运动轨迹以及各个运动目标的特征参数;
目标分类模块:用于根据所述运动目标特征参数对已收集到的运动目标分为m类,并计算出每一类运动目标特征参数的统计信息,所述m为自然数;
所述目标检测模块用于将所述目标跟踪模块得到的新运动目标特征参数与所述目标分类模块已得到的统计信息进行匹配,确定所述新运动目标所属的类别。
从以上技术方案可以看出,本发明提出的运动目标分类方法对所有的运动目标进行无需人工监督的自动学习,将运动特征相似的目标聚成一类。在分类的基础上可以进行运动目标检测,根据聚类结果来判断每个运动目标的类别。本发明方案不需要根据不同的监控场景进行训练,也不需要制定规则,使用起来非常方便,可以广泛应用。
附图说明
图1为本发明实施例提出的一种运动目标检测装置的框图;
图2为图1所示运动目标检测装置框图中的目标分类模块105的内部结构框图;
图3为运动检测模块103得到的运动目标的边界的示意图;
图4为本发明实施例提出的运动目标的分类方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细阐述。
图1为本发明实施例提出的一种运动目标检测装置的框图,该运动目标检测装置100接收前端视频模块101(摄像头、网络摄像机或视频服务器)所采集的视频图像,首先识别出一段时间内的视频图像中的运动目标,并对运动目标加以分类;然后根据分类结果对后续的视频图像中的运动目标进行识别。
运动目标检测装置100包括:背景建模及更新模块102、运动检测模块103、目标跟踪模块104、目标分类模块105和目标识别模块106。下面对各个模块的功能分别加以介绍。
背景建模及更新模块102主要功能是利用收集到的图像建立背景模型、得到背景图像;以及每隔一定的时间或者根据其他触发条件,根据新获取的图像对背景模型进行修改以应对监控环境的变化。
运动检测模块103主要功能是通过计算当前图像与背景图像的差异,将图像划分为背景区域和前景区域,并将所述前景区域作为运动目标。
目标跟踪模块104用于计算出目标在每帧图像上的二维位置坐标,并根据不同的特征,将不同帧图像中的同一运动目标关联起来,得到各个运动目标完整的运动轨迹以及各个运动目标的特征参数。在初始阶段,所述运动轨迹和特征参数输出至目标分类模块105;在工作阶段,所述运动轨迹和特征参数输出至目标检测模块106,同时也可以输出至目标分类模块105,以便目标分类模块105进一步对运动目标的统计信息进行调整。
目标分类模块105用于根据目标跟踪模块104得到的运动目标特征参数,对已收集到的运动目标分为m类(m为自然数),并计算出每一类运动目标特征参数的统计信息。当收集到足够的运动目标后,将统计信息输出至目标检测模块106。
目标检测模块106用于将来自目标跟踪模块104的运动目标的运动轨迹和特征参数与来自目标分类模块105的统计信息进行匹配,确定该运动目标所属的类别。
为使技术人员更加清楚地了解本发明技术方案,下面给出各个模块的具体实现方式。但需要说明的是,所属具体实现方式仅是一种示例,并不用以限制本发明。
背景建模及更新模块102可以采用任一种背景建模的实现方法,比如混合高斯背景建模方法、核密度估计背景建模方法等。这里仅介绍一种最简单的建模方法。
收集N帧图像{I0,I1,…,IN}(N为自然数),提取每一帧图像中像素Y分量(所述Y分量是指YUV色彩空间的第一颜色通道的数值,表示图像中像素点亮度),得到{Y0,Y1,…,YN},设定更新速率γ(0~1之间的小常数,一般取0.01~0.05),按照公式1建立背景图像Bt:
B t = Y 0 t = 0 γ Y t + ( 1 - γ ) Y t - 1 t ∈ [ 1 , N ] - - - ( 1 )
运动检测模块103的一种实现方式如下:
将当前输入图像与背景图像相减并取绝对值得到差分图像;
使用阈值化方法对差分图像进行二值化处理,将图像划分为背景区域和前景区域,背景区域和前景区域分别用不同的像素值表示。可以选用各种阈值化方法如大津法、最大类间方差法、直方图法等。较佳地,背景区域像素值为0,前景区域像素值为255。
使用数学形态学方法(比如膨胀运算、腐蚀运算、开运算、关运算等)对二值化图像进行滤波处理,填充前景区域中的空洞,同时去除面积较小的孤立区域、非连通区域,只保留前景区域中面积大于给定阈值的连通区域作为运动目标。
目标跟踪模块104的实现方式可以使用多种现有技术,比如均值偏移、粒子滤波等。以下这里介绍一种具有较佳实施效果的实现方式:
对运动检测模块103得到的二值图像进行边界跟踪(Bound Tracking)或者边缘点连接(Edge Point Linking),得到图像中每个运动目标的边界,用一个外接矩形框表示一个独立的运动目标,如图3所示。
构造一个用以描述运动目标信息的数据结构str_TrkInfo,负责记录所有运动目标特征参数,所述特征参数包括但不限于位置、大小、运动方向、瞬时速度、运动轨迹以及运动目标的图像特征等,可以根据实际需要适当的设置需要记录的特征参数。
设当前帧检测到的运动目标为{Ai}i=1 M,已经记录的运动目标信息为{Bj}j=1 N,分别计算Ai与Bj的相似性度量:例如,所述相似性度量可以是{Ai}i=1 M与{Bj}j=1 N之间的相似性距离:d(Ai,Bj),i=1,2,…M,j=1,2,…N,M表示当前帧运动目标的数量,N表示已经记录的运动目标的数量。
相似性距离的具体定义可以有多种选择,比如一种最简单的方法就是将其定义为Ai与Bj所在的外接矩形的重合程度,如两者无重叠部分,则认为Ai与Bj相似度为零,如有重叠部分,则Ai与Bj相似度定义为重合部分的周长。显而易见,重合区域越大,相似度越大。
求出所有相似度中的最大值,
Figure G2009102438734D00101
则Ax和By匹配。然后,去除Ax和By,在剩余的运动区域和运动目标中不断继续上述匹配过程直至没有剩余的运动目标。
完成上述信息匹配过程后,需要根据匹配结果更新已经记录的运动目标信息{Bj}j=1 N的相关信息。主要考虑三种情况:
1)M=N且{Ai}i=1 M和{Bj}j=1 N都分别匹配上了。这表明所有目标都在监控范围内运动,只需要更新{Ai}i=1 M的运动目标的相关信息即可。
2)M≠N且{Ai}i=1 M中有若干运动目标没有匹配上。这表明有新的物体出现,需要将这些未匹配的运动区域作为新出现的运动目标添加到数据结构str_TrkInfo中。
3)M≠N且数据结构str_TrkInfo中有若干运动目标没有得到匹配。这表明有运动目标离开了监控范围,需要将这些未匹配的运动目标从数据结构str_TrkInfo中删除。
实际情况下,由于误差和噪声的存在,对于当前没有匹配的运动区域或者运动目标,可以先暂时保留其相关信息,并在以后连续几帧(一般5到10帧)图像中进行匹配,如果一直都没有匹配,就认为是新的运动目标出现(上述情况2)或者现有运动目标离开视野(上述情况3)。
基于上述目标跟踪模块104的实施方式,目标分类模块105的具体实施方式如下:
用数据结构str_TrkInfo中每个运动目标的区域面积(area)、速度(speed)、紧密性(compactness),作为每个运动目标的特征参数,来判定运动目标的种类,定义运动向量v=(v1,v2,v3)。
其中,分量v1代表面积,其数值为运动目标所在区域中像素值为1的象素点的个数;分量v2代表速度,其数值为运动目标在一段时间位移的平均值;分量v3代表紧密性,其数值为运动目标的区域面积与区域周长的平方商即
Figure G2009102438734D00111
使用这三个特征是因为他们在区别车辆、自行车和行人这三类目标时具有很好的判别性,在这三类目标中,一般情况下,车辆区域面积最大、速度最快、紧密性最好;行人速度面积最小、速度最慢、紧密性居中;自行车的面积居中、速度居中、紧密性最差。
由于视频中,所有的运动目标的特征聚集成三个类别,可以用一个由三个高斯核组成的混合高斯分布来描述任意一个运动目标的特征参数分布,即该运动目标的特征参数属于每个类别的概率:
P ( v ) = Σ i = 1 K w i G ( v , μ i , Σ i ) - - - ( 2 )
其中,wi表示的第i个高斯分布的权重,μi,∑i分别表示第i个高斯分布的均值和均方差。
Figure G2009102438734D00113
K=3,分别对应车辆、自行车和行人三个类别。一般可以假设v的三个分量(v1,v2,v3)相互独立,即∑i为一对角矩阵。
使用视频中的N帧进行初始化,即计算出每个运动目标的特征v,使用最大期望算法(EM)算法或者K均值聚类算法计算初始的混合高斯模型:
P ( v ) = Σ i = 1 K w i G ( v , μ i , Σ i )
随着目标运动状态的不断变化以及新目标的不断出现,上述混合高斯模型的参数应该及时更新,估计参数的经典方法是EM算法,但是如果使用原始的EM算法在运动目标很多的情况下,运算量太大,所以可以采用在线EM算法来近似地估计出参数,以降低运算量,提高运行速度。这种方法的思想是对于当前运动目标的特征v,用上述混合模型的K个高斯分布去和v匹配,如果有某个高斯分布和它匹配,则用v去更新这个高斯分布的各项参数;如果没有任何一项高斯分布和它匹配,就用一个代表v的新分布去代替现有混合分布中的权重最小的一个高斯分布项。
具体算法如下:
设置三个初始的高斯核,其初始数值可以随意指定,不会影响到最后的统计结果。当然较佳地是根据经验设置较为合适的高斯核数值,这样可以加快统计收敛的速度。将视频的每个跟踪到的运动目标作为输入,重复以下过程:
1、计算每个运动目标的特征向量v:包括运动目标的区域面积、速度和紧密性。
2、对于每个运动目标,计算其特征v属于三个高斯核的可能性:
d1=w1G(v,μ1,∑1),d2=w2G(v,μ2,∑2),d3=w3G(v,μ3,∑3)
其中,w1、w2和w3分别为这三个高斯核的权重,找出可能性最大的那个高斯核,即计算出d1,d2,d3的最大值dmax=max(d1,d2,d3)对应的高斯核k。另外,考虑到可能与三个高斯核都匹配不上,预先设置的概率阈值T,如果dmax>T则认为v与高斯核k匹配上了,v的类别即为k。否则就认为没有匹配,将权值和标准差之比w/σ最小的高斯核删除,以v的值建立一个新的高斯核,v的类别即为删除的最小高斯核的类别。
2)更新混合高斯模型:
假设特征v与第k个高斯核匹配上了,则属于第k个高斯核的数据增加了,需要进行相应的调整,按照如下公式更新:
w′k=(1-α)wk+α(3)
μ′k=(1-α)μk+αv(4)
∑′k=(1-α)∑k+α(v-μk)T(v-μk)(5)
对于其他的两个核,数据没有增加,但是相对于第k个高斯核,其均值和方差保持不变、权重降低,于是将其权重更新为:
w′j=(1-α)wj,j≠k(6)
完成上述更新后,再对三个高斯核的权重进行一次归一化处理,即保证三个高斯核的权重之和为1。
w i ′ = w i w 1 + w 2 + w 3 , i=1,2,3(7)
3、返回步骤1。
基于上述具体实施方式,图2给出了目标分类模块105的内部结构框图,目标分类模块105包括:
初始化单元201,用于设置3个初始的高斯核;
特征提取单元202,用于计算任一运动目标的特征向量v=(v1,v2,v3);
距离计算单元203,用于计算特征向量v属于三个高斯核的概率,找出概率最大的高斯核k,判断最大概率是否大于预先设置的概率阈值T,并将判断结果以及特征向量v发送至模型更新单元206;
模型更新单元206,用于当距离计算单元的判断结果为是,按照如下公式更新第k个高斯核的参数:
w′k=(1-α)wk+α;
μ′k=(1-α)μk+αv;
∑′k(1-α)∑k+α(v-μk)T(v-μk);其中,k为小于或等于3的自然数,α是一个0到1之间的常数;
按照如下公式更新另外两个高斯核的权重:
w′j=(1-α)wj,j≠k;
或者,当距离计算单元的判断结果为否,将权值和标准差之比w/σ最小的高斯核删除,以v的值建立一个新的高斯核;
高斯核更新完毕后,模型更新单元206对三个高斯核的权重进行归一化处理;
判断单元204,用于判断是否还有未统计的运动目标,若是将高斯核的相关参数发送至输出单元205;
输出单元205,用于对外输出三个高斯核的相关参数。
本发明实施例还提出一种运动目标的分类方法,其流程如图3所示,包括如下步骤:
背景建模步骤401:利用收集到的视频图像建立背景模型,得到背景图像;
运动检测步骤402:计算当前帧视频图像与背景图像的差异,将图像划分为背景区域和前景区域,并将所述前景区域作为运动目标;
目标跟踪步骤403:将不同帧视频图像中的同一运动目标关联起来,得到各个运动目标完整的运动轨迹以及各个运动目标的特征参数;
目标分类步骤404:根据所述运动目标特征参数对已收集到的运动目标分为m类,并计算出每一类运动目标特征参数的统计信息,所述m为自然数。
较佳地,所述背景建模步骤401包括:
收集N帧图像{I0,I1,…,IN},N为自然数,提取每一帧图像中像素Y分量,得到{Y0,Y1,…,YN},所述Y分量是指YUV色彩空间的第一颜色通道的数值;设定更新速率γ,按照如下公式建立背景图像Bt
Figure G2009102438734D00141
其中γ为大于0且小于1的常数。
较佳地,所述运动检测步骤402包括:
将当前输入图像与背景图像相减并取绝对值得到差分图像;
使用阈值化方法对差分图像进行二值化处理,将图像划分为背景区域和前景区域;
对当前二值化图像进行滤波处理,填充前景区域中的空洞,将前景区域中面积大于给定阈值的连通区域作为运动目标。
较佳地,所述目标跟踪步骤403包括:
对运动检测步骤中的得到运动目标进行边界跟踪或者边缘点连接,得到每个运动目标的外接矩形框;
计算当前帧运动目标的外接矩形框与已经记录的运动目标的外接矩形框的重合区域的周长,将周长最大值对应的当前帧运动目标与已经记录的运动目标建立匹配关系;
根据所建立的匹配关系更新已经记录的运动目标信息。
较佳地,所述运动目标的特征参数包括:运动目标的区域面积v1、速度v2和紧密性v3,所述m值等于3;
所述目标分类步骤404包括:
A、设置3个初始的高斯核;
B、计算任一运动目标的特征向量v=(v1,v2,v3);
C、计算特征向量v属于三个高斯核的概率,找出概率最大的高斯核k,判断最大概率是否大于预先设置的概率阈值T,若是,则执行D,否则将权值和标准差之比w/σ最小的高斯核删除,以v的值建立一个新的高斯核,并转至步骤E;
D、按照如下公式更新第k个高斯核的参数:
w′k=(1-α)wk+α;
μ′k=(1-α)μk+αv;
∑′k=(1-α)∑k+α(v-μk)T(v-μk);其中,k为小于或等于3的自然数,α是一个0到1之间的常数;
按照如下公式更新另外两个高斯核的权重:
w′j=(1-α)wj,j≠k;
E、对三个高斯核的权重进行归一化处理,并判断是否还有未统计的运动目标,若是返回步骤B,否则结束目标分类步骤。
本发明提出得运动目标分类的方法对所有的运动目标进行非监督学习,将运动特征相似的目标聚成一类,然后根据聚类结果来判断每个运动目标的类别。不需要根据不同的监控场景进行训练,也不需要制定规则,使用起来非常方便,可以广泛应用。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (13)

1.一种运动目标的分类方法,其特征在于,包括如下步骤:
背景建模步骤:利用收集到的视频图像建立背景模型,得到背景图像;
运动检测步骤:计算当前帧视频图像与背景图像的差异,将图像划分为背景区域和前景区域,并将所述前景区域作为运动目标;
目标跟踪步骤:将不同帧视频图像中的同一运动目标关联起来,得到各个运动目标完整的运动轨迹以及各个运动目标的特征参数;
目标分类步骤:根据所述运动目标特征参数对已收集到的运动目标分为m类,并计算出每一类运动目标特征参数的统计信息,所述m为自然数。
2.根据权利要求1所述的运动目标的分类方法,其特征在于,所述背景建模步骤包括:
收集N帧图像{I0,I1,…,IN},N为自然数,提取每一帧图像中像素Y分量,得到{Y0,Y1,…,YN},所述Y分量是指YUV色彩空间的第一颜色通道的数值;设定更新速率γ,按照如下公式建立背景图像Bi
Figure F2009102438734C00011
其中γ为大于0且小于1的常数。
3.根据权利要求1所述的运动目标的分类方法,其特征在于,所述运动检测步骤包括:
将当前输入图像与背景图像相减并取绝对值得到差分图像;
使用阈值化方法对差分图像进行二值化处理,将图像划分为背景区域和前景区域;
对当前二值化图像进行滤波处理,填充前景区域中的空洞,将前景区域中面积大于给定阈值的连通区域作为运动目标。
4.根据权利要求3所述的运动目标的分类方法,其特征在于,所述目标跟踪步骤包括:
对运动检测步骤中的得到运动目标进行边界跟踪或者边缘点连接,得到每个运动目标的外接矩形框;
计算当前帧运动目标的外接矩形框与已经记录的运动目标的外接矩形框的重合区域的周长,将周长最大值对应的当前帧运动目标与已经记录的运动目标建立匹配关系;
根据所建立的匹配关系更新已经记录的运动目标信息。
5.根据权利要求4所述的运动目标的分类方法,其特征在于,所述运动目标的特征参数包括:运动目标的区域面积v1、速度v2和紧密性v3,所述m值等于3;
所述目标分类步骤包括:
A、设置3个初始的高斯核;
B、计算任一运动目标的特征向量v=(v1,v2,v3);
C、计算特征向量v属于三个高斯核的概率,找出概率最大的高斯核k,判断最大概率是否大于预先设置的概率阈值T,若是,则执行D,否则将权值和标准差之比w/σ最小的高斯核删除,以v的值建立一个新的高斯核,并转至步骤E;
D、按照如下公式更新第k个高斯核的参数:
W′k=(1-α)wk+α;
μ′k=(1-α)μk+αv;
∑′k=(1-α)∑k+α(v-μk)T(v-μk);其中,k为小于或等于3的自然数,α是一个0到1之间的常数;
按照如下公式更新另外两个高斯核的权重:
w′j=(1-α)wj,j≠k;
E、对三个高斯核的权重进行归一化处理,并判断是否还有未统计的运动目标,若是返回步骤B,否则结束目标分类步骤。
6.根据权利要求1至5任一项所述的运动目标的分类方法,其特征在于,所述目标分类步骤之后,进一步包括:
将新的运动目标特征参数与所述已得到的统计信息进行匹配,确定所述新运动目标所属的类别。
7.一种运动目标的检测方法,其特征在于,包括:
进行运动目标的分类过程,得到每一类运动目标特征参数的统计信息;
将新的运动目标特征参数与所述已得到的统计信息进行匹配,确定所述新运动目标所属的类别。
所述分类过程包括:
背景建模步骤:利用收集到的视频图像建立背景模型,得到背景图像;
运动检测步骤:计算当前帧视频图像与背景图像的差异,将图像划分为背景区域和前景区域,,并将所述前景区域作为运动目标;
目标跟踪步骤:将不同帧视频图像中的同一运动目标关联起来,得到各个运动目标完整的运动轨迹以及各个运动目标的特征参数;
目标分类步骤:根据所述运动目标特征参数对已收集到的运动目标分为m类,并计算出每一类运动目标特征参数的统计信息,所述m为自然数。
8.一种运动目标的分类装置,其特征在于,包括
背景建模模块:用于接收外部设备采集的视频图像,利用所接收的视频图像建立背景模型,得到背景图像;
运动检测模块:用于计算当前帧视频图像与所述背景图像的差异,将图像划分为背景区域和前景区域,并将所述前景区域作为运动目标;
目标跟踪模块:将不同帧图像中的同一运动目标关联起来,得到各个运动目标完整的运动轨迹以及各个运动目标的特征参数;
目标分类模块:用于根据所述运动目标特征参数对已收集到的运动目标分为m类,并计算出每一类运动目标特征参数的统计信息,所述m为自然数。
9.根据权利要求8所述的运动目标的分类装置,其特征在于,所述背景建模模块包括:
收集N帧图像{I0,I1,…,IN},N为自然数,提取每一帧图像中像素Y分量,得到{Y0,Y1,…,TN},所述Y分量是指YUV色彩空间的第一颜色通道的数值;设定更新速率γ,按照如下公式建立背景图像Bt
Figure F2009102438734C00041
其中γ为大于0且小于1的常数。
10.根据权利要求8所述的运动目标的分类装置,其特征在于,所述运动检测模块包括:
将当前输入图像与背景图像相减并取绝对值得到差分图像的单元;
使用阈值化方法对差分图像进行二值化处理,将图像划分为背景区域和前景区域的单元;
对当前二值化图像进行滤波处理,填充前景区域中的空洞,将前景区域中面积大于给定阈值的连通区域作为运动目标的单元。
11.根据权利要求10所述的运动目标的分类装置,其特征在于,所述目标跟踪模块包括:
对运动检测步骤中的得到运动目标进行边界跟踪或者边缘点连接,得到每个运动目标的外接矩形框的单元;
计算当前帧运动目标的外接矩形框与已经记录的运动目标的外接矩形框的重合区域的周长,将周长最大值对应的当前帧运动目标与已经记录的运动目标建立匹配关系的单元;
根据所建立的匹配关系更新已经记录的运动目标信息的单元。
12.根据权利要求11所述的运动目标的分类装置,其特征在于,所述运动目标的特征参数包括:运动目标的区域面积v1、速度v2和紧密性v3,所述m值等于3;
所述目标分类模块包括:
初始化单元,用于设置3个初始的高斯核;
特征提取单元,用于计算任一运动目标的特征向量v=(v1,v2,v3);
距离计算单元,用于计算特征向量v属于三个高斯核的概率,找出概率最大的高斯核k,判断最大概率是否大于预先设置的概率阈值T,并将判断结果以及特征向量v发送至模型更新单元;
模型更新单元,用于当距离计算单元的判断结果为是,按照如下公式更新第k个高斯核的参数:
w′k=(1-α)wk+α;
μ′k=(1-α)μk+αv;
∑′k=(1-α)∑k+α(v-μk)T(v-μk);其中,k为小于或等于3的自然数,α是一个0到1之间的常数;
按照如下公式更新另外两个高斯核的权重:
w′j=(1-α)wj,j≠k;
或者,当距离计算单元的判断结果为否,将权值和标准差之比w/σ最小的高斯核删除,以v的值建立一个新的高斯核;
高斯核更新完毕后,模型更新单元对三个高斯核的权重进行归一化处理;
判断单元,用于判断是否还有未统计的运动目标,若是将高斯核的相关参数发送至输出单元;
输出单元,用于对外输出三个高斯核的相关参数。
13.一种运动目标的检测装置,其特征在于,包括一运动目标的分类装置以及目标检测模块;所述运动目标的分类装置包括:
背景建模模块:用于接收外部设备采集的视频图像,利用所接收的视频图像建立背景模型,得到背景图像;
运动检测模块:用于计算当前帧视频图像与所述背景图像的差异,将图像划分为背景区域和前景区域,并将所述前景区域作为运动目标;
目标跟踪模块:将不同帧图像中的同一运动目标关联起来,得到各个运动目标完整的运动轨迹以及各个运动目标的特征参数;
目标分类模块:用于根据所述运动目标特征参数对已收集到的运动目标分为m类,并计算出每一类运动目标特征参数的统计信息,所述m为自然数;
所述目标检测模块用于将所述目标跟踪模块得到的新运动目标特征参数与所述目标分类模块已得到的统计信息进行匹配,确定所述新运动目标所属的类别。
CN200910243873A 2009-12-24 2009-12-24 运动目标的分类方法和检测方法及其装置 Pending CN101751679A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910243873A CN101751679A (zh) 2009-12-24 2009-12-24 运动目标的分类方法和检测方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910243873A CN101751679A (zh) 2009-12-24 2009-12-24 运动目标的分类方法和检测方法及其装置

Publications (1)

Publication Number Publication Date
CN101751679A true CN101751679A (zh) 2010-06-23

Family

ID=42478622

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910243873A Pending CN101751679A (zh) 2009-12-24 2009-12-24 运动目标的分类方法和检测方法及其装置

Country Status (1)

Country Link
CN (1) CN101751679A (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004925A (zh) * 2010-11-09 2011-04-06 无锡中星微电子有限公司 物体分类模型的训练方法及利用该模型的识别方法
CN102354422A (zh) * 2011-10-19 2012-02-15 湖南德顺电子科技有限公司 一种面向周界防护的可疑目标监测方法
CN102663776A (zh) * 2012-03-31 2012-09-12 北京智安邦科技有限公司 基于特征点分析的剧烈运动检测的方法及装置
CN102789573A (zh) * 2011-05-16 2012-11-21 索尼公司 目标检测设备和方法及分类器训练设备和方法
CN103996051A (zh) * 2014-05-12 2014-08-20 上海大学 基于运动特征变化的视频运动对象异常行为自动检测方法
CN104063740A (zh) * 2013-03-21 2014-09-24 日电(中国)有限公司 办公室实体组识别系统、方法及装置
CN104475344A (zh) * 2014-11-04 2015-04-01 上海维宏电子科技股份有限公司 基于机器视觉实现纺织纱管分拣的方法
CN104525501A (zh) * 2014-12-01 2015-04-22 上海维宏电子科技股份有限公司 基于计算机软件提高纱管分拣精度的纱管分拣控制方法
CN104809720A (zh) * 2015-04-08 2015-07-29 西北工业大学 基于小交叉视场的两相机目标关联方法
CN105469429A (zh) * 2015-11-27 2016-04-06 北京航空航天大学 目标跟踪方法和装置
CN105809710A (zh) * 2015-01-19 2016-07-27 韩华泰科株式会社 检测运动目标的系统和方法
CN106980658A (zh) * 2017-03-15 2017-07-25 北京旷视科技有限公司 视频标注方法及装置
CN107301653A (zh) * 2017-05-18 2017-10-27 常州市武进区半导体照明应用技术研究院 基于bp神经网络的视频图像火灾火焰检测方法
CN107644529A (zh) * 2017-08-03 2018-01-30 浙江浩腾电子科技股份有限公司 一种基于运动检测的车辆排队长度检测方法
CN107644528A (zh) * 2017-08-02 2018-01-30 浙江工业大学 一种基于车辆跟踪的车辆排队长度检测方法
CN108198208A (zh) * 2017-12-27 2018-06-22 浩云科技股份有限公司 一种基于目标跟踪的移动侦测方法
CN109191494A (zh) * 2018-07-13 2019-01-11 深圳大学 润滑油磨粒在线监测方法、终端及存储介质
CN109215047A (zh) * 2018-08-16 2019-01-15 中国科学院深海科学与工程研究所 基于深海视频的运动目标检测方法和装置
CN109409243A (zh) * 2018-09-29 2019-03-01 江南大学 一种移动目标中人体视觉检测方法
CN110059591A (zh) * 2019-04-01 2019-07-26 北京中科晶上超媒体信息技术有限公司 运动目标区域的识别方法
CN110677619A (zh) * 2019-08-20 2020-01-10 青岛萨纳斯智能科技股份有限公司 一种智能监控视频处理方法
CN112037266A (zh) * 2020-11-05 2020-12-04 北京软通智慧城市科技有限公司 一种下落物体的识别方法、装置、终端设备及存储介质
CN112581489A (zh) * 2019-09-29 2021-03-30 RealMe重庆移动通信有限公司 一种视频压缩方法、装置及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101017573A (zh) * 2007-02-09 2007-08-15 南京大学 一种基于视频监控的运动目标检测与识别方法
CN101159855A (zh) * 2007-11-14 2008-04-09 南京优科漫科技有限公司 基于特征点分析的多目标分离预测方法
CN101159859A (zh) * 2007-11-29 2008-04-09 北京中星微电子有限公司 一种运动检测方法、装置以及一种智能监控系统
CN101261681A (zh) * 2008-03-31 2008-09-10 北京中星微电子有限公司 智能视频监控中的路面图像提取方法及装置
CN101266689A (zh) * 2008-04-23 2008-09-17 北京中星微电子有限公司 一种运动目标检测方法及装置
CN101389004A (zh) * 2007-09-13 2009-03-18 中国科学院自动化研究所 一种基于在线学习的运动目标分类方法
CN101493944A (zh) * 2009-03-06 2009-07-29 北京中星微电子有限公司 一种运动目标检测与跟踪的方法和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101017573A (zh) * 2007-02-09 2007-08-15 南京大学 一种基于视频监控的运动目标检测与识别方法
CN101389004A (zh) * 2007-09-13 2009-03-18 中国科学院自动化研究所 一种基于在线学习的运动目标分类方法
CN101159855A (zh) * 2007-11-14 2008-04-09 南京优科漫科技有限公司 基于特征点分析的多目标分离预测方法
CN101159859A (zh) * 2007-11-29 2008-04-09 北京中星微电子有限公司 一种运动检测方法、装置以及一种智能监控系统
CN101261681A (zh) * 2008-03-31 2008-09-10 北京中星微电子有限公司 智能视频监控中的路面图像提取方法及装置
CN101266689A (zh) * 2008-04-23 2008-09-17 北京中星微电子有限公司 一种运动目标检测方法及装置
CN101493944A (zh) * 2009-03-06 2009-07-29 北京中星微电子有限公司 一种运动目标检测与跟踪的方法和系统

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004925A (zh) * 2010-11-09 2011-04-06 无锡中星微电子有限公司 物体分类模型的训练方法及利用该模型的识别方法
CN102004925B (zh) * 2010-11-09 2012-08-29 无锡中星微电子有限公司 物体分类模型的训练方法及利用该模型的识别方法
CN102789573A (zh) * 2011-05-16 2012-11-21 索尼公司 目标检测设备和方法及分类器训练设备和方法
CN102354422A (zh) * 2011-10-19 2012-02-15 湖南德顺电子科技有限公司 一种面向周界防护的可疑目标监测方法
CN102354422B (zh) * 2011-10-19 2013-09-25 北京国创科视科技有限公司 一种面向周界防护的可疑目标监测方法
CN102663776A (zh) * 2012-03-31 2012-09-12 北京智安邦科技有限公司 基于特征点分析的剧烈运动检测的方法及装置
CN104063740A (zh) * 2013-03-21 2014-09-24 日电(中国)有限公司 办公室实体组识别系统、方法及装置
CN104063740B (zh) * 2013-03-21 2017-11-17 日电(中国)有限公司 办公室实体组识别系统、方法及装置
CN103996051A (zh) * 2014-05-12 2014-08-20 上海大学 基于运动特征变化的视频运动对象异常行为自动检测方法
CN104475344A (zh) * 2014-11-04 2015-04-01 上海维宏电子科技股份有限公司 基于机器视觉实现纺织纱管分拣的方法
CN104525501A (zh) * 2014-12-01 2015-04-22 上海维宏电子科技股份有限公司 基于计算机软件提高纱管分拣精度的纱管分拣控制方法
CN105809710A (zh) * 2015-01-19 2016-07-27 韩华泰科株式会社 检测运动目标的系统和方法
CN105809710B (zh) * 2015-01-19 2021-06-15 韩华泰科株式会社 检测运动目标的系统和方法
CN104809720A (zh) * 2015-04-08 2015-07-29 西北工业大学 基于小交叉视场的两相机目标关联方法
CN104809720B (zh) * 2015-04-08 2017-07-14 西北工业大学 基于小交叉视场的两相机目标关联方法
CN105469429A (zh) * 2015-11-27 2016-04-06 北京航空航天大学 目标跟踪方法和装置
CN106980658A (zh) * 2017-03-15 2017-07-25 北京旷视科技有限公司 视频标注方法及装置
CN107301653A (zh) * 2017-05-18 2017-10-27 常州市武进区半导体照明应用技术研究院 基于bp神经网络的视频图像火灾火焰检测方法
CN107644528A (zh) * 2017-08-02 2018-01-30 浙江工业大学 一种基于车辆跟踪的车辆排队长度检测方法
CN107644529A (zh) * 2017-08-03 2018-01-30 浙江浩腾电子科技股份有限公司 一种基于运动检测的车辆排队长度检测方法
CN108198208A (zh) * 2017-12-27 2018-06-22 浩云科技股份有限公司 一种基于目标跟踪的移动侦测方法
CN108198208B (zh) * 2017-12-27 2021-08-24 浩云科技股份有限公司 一种基于目标跟踪的移动侦测方法
CN109191494A (zh) * 2018-07-13 2019-01-11 深圳大学 润滑油磨粒在线监测方法、终端及存储介质
CN109215047B (zh) * 2018-08-16 2021-02-12 中国科学院深海科学与工程研究所 基于深海视频的运动目标检测方法和装置
CN109215047A (zh) * 2018-08-16 2019-01-15 中国科学院深海科学与工程研究所 基于深海视频的运动目标检测方法和装置
CN109409243A (zh) * 2018-09-29 2019-03-01 江南大学 一种移动目标中人体视觉检测方法
CN110059591A (zh) * 2019-04-01 2019-07-26 北京中科晶上超媒体信息技术有限公司 运动目标区域的识别方法
CN110677619A (zh) * 2019-08-20 2020-01-10 青岛萨纳斯智能科技股份有限公司 一种智能监控视频处理方法
CN112581489A (zh) * 2019-09-29 2021-03-30 RealMe重庆移动通信有限公司 一种视频压缩方法、装置及存储介质
CN112037266B (zh) * 2020-11-05 2021-02-05 北京软通智慧城市科技有限公司 一种下落物体的识别方法、装置、终端设备及存储介质
CN112037266A (zh) * 2020-11-05 2020-12-04 北京软通智慧城市科技有限公司 一种下落物体的识别方法、装置、终端设备及存储介质

Similar Documents

Publication Publication Date Title
CN101751679A (zh) 运动目标的分类方法和检测方法及其装置
CN102542289B (zh) 一种基于多高斯计数模型的人流量统计方法
CN101120382B (zh) 跟踪用相机获得的场景视频中的移动物体的方法
US20230289979A1 (en) A method for video moving object detection based on relative statistical characteristics of image pixels
CN104268583B (zh) 基于颜色区域特征的行人重识别方法及系统
CN103279737B (zh) 一种基于时空兴趣点的打架行为检测方法
CN102903122A (zh) 基于特征光流与在线集成学习的视频目标跟踪方法
CN105469105A (zh) 一种基于视频监控的香烟烟雾检测方法
CN105404847A (zh) 一种遗留物实时检测方法
CN101635835A (zh) 智能视频监控方法及系统
CN110991274B (zh) 一种基于混合高斯模型和神经网络的行人摔倒检测方法
CN102496001A (zh) 一种视频监控目标自动检测的方法和系统
CN101017573A (zh) 一种基于视频监控的运动目标检测与识别方法
CN107909081A (zh) 一种深度学习中图像数据集的快速获取和快速标定方法
CN101814144A (zh) 遥感图像中无水桥梁目标识别方法
CN101216943B (zh) 一种视频运动目标分割的方法
CN103714181A (zh) 一种层级化的特定人物检索方法
CN102034240A (zh) 一种静态前景检测和跟踪方法
CN106204586A (zh) 一种基于跟踪的复杂场景下的运动目标检测方法
CN103593679A (zh) 一种基于在线机器学习的视觉人手跟踪方法
CN104966305A (zh) 基于运动矢量划分的前景检测方法
CN102663405A (zh) 基于显著度和混合高斯模型的监控视频前景提取方法
CN112750147A (zh) 一种行人多目标跟踪方法、装置、智能终端及存储介质
CN109241814A (zh) 基于yolo神经网络的行人检测方法
CN106570885A (zh) 基于亮度和纹理融合阈值的背景建模方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100623