CN1312638C - 基于分水岭算法的视频对象提取方法 - Google Patents

基于分水岭算法的视频对象提取方法 Download PDF

Info

Publication number
CN1312638C
CN1312638C CNB031514057A CN03151405A CN1312638C CN 1312638 C CN1312638 C CN 1312638C CN B031514057 A CNB031514057 A CN B031514057A CN 03151405 A CN03151405 A CN 03151405A CN 1312638 C CN1312638 C CN 1312638C
Authority
CN
China
Prior art keywords
video
image
piece
watershed
present
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB031514057A
Other languages
English (en)
Other versions
CN1529284A (zh
Inventor
杨树堂
李建华
须泽中
郭礼华
袁晓彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CNB031514057A priority Critical patent/CN1312638C/zh
Publication of CN1529284A publication Critical patent/CN1529284A/zh
Application granted granted Critical
Publication of CN1312638C publication Critical patent/CN1312638C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

一种基于分水岭算法的视频对象提取方法,属于计算机视觉研究领域。本发明步骤为:(1)视频帧读取:以RGB的格式读入图象数据,然后根据监控区域配置文件获取局部矩形区域图像,将该图像分别转换为灰度,YUV12和HSI格式的数据以待后续处理;(2)预处理:采用Roberts算子计算原图象的梯度图象,然后用中值滤波的方法对梯度图象去噪声;(3)图象分割:在灰度空间上采用分水岭算法对图象进行块分割;(4)颜色分析和区域聚合:设一幅灰度图象经过分水岭算法处理后被分为多个区域,根据块邻接关系图,根据YUV12和HSI空间信息进行相邻块的合并;(5)弱边界的处理:经过颜色聚类处理后,再消除弱边界;(6)视频对象保存。本发明使视频监控的效率和实用性大大提高。

Description

基于分水岭算法的视频对象提取方法
技术领域
本发明涉及一种视频对象提取和视频信号处理方法,具体讲是一种基于分水岭算法的视频对象提取方法。属于计算机视觉研究领域。
背景技术
视频对象提取技术是计算机视觉和模式识别的重要研究对象之一,不仅具有很高的理论价值,而且在许多实际问题中,如基于内容的视频监控、运动检测等方面都得到了广泛的应用。同时,视频对象提取也是一项比较复杂的技术,牵涉到几何学、数学形态学、计算技术等许多领域,研究至今已经提出了很多算法,这些算法一般从视频对象的某些关键属性出发,建立相应的数学模型,使模型以视频对象的这些属性为唯一解或者局部最优解。然后就利用数值计算或计算机模拟的方法对模型进行求解,从而完成对视频对象的提取。
分水岭(watershed segmentation)算法是一种基于块的静态图象分割算法,也是一种常用的视频对象提取算法。在水线分割算法中,通过得到聚水盆就可以划分出相应的不同的图象区域,这种思想时比较直观的。经文献检索发现,图象的水线分割有两类方法,第一类方法(S H Collins.Terrain parameters directly from a digital terrainmodel.Canadian Surveyor,加拿大测量29(5):507-518,1975)是从每个象素出发获得到达拓扑曲面局部最低区域的下降路线,一个聚水盆就是由所有汇到同一个局部最低区域的下降路线组成,这种方法计算量非常大,而且精度不高。第二类方法(L Vincentand P Soille.Watershed in digital spaces:An efficient algorithm based on immersionsimulations.IEEE Transactions on Pattem Analysis and Machine Intelligence,IEEE模式识别与机器视觉杂志13(6):583-598,1991)与第一类方法正好相反,是从聚水盆的盆底出发,采用模拟注水的方法(盆底看作是连通的)当相邻的聚水盆中的水溢出时相遇点连成线就形成了分水岭,该算法效率高,精度好,是比较普遍使用的一种分水岭算法。但是传统的分水岭算法最大的缺点就是过分割现象,即有时会出现大量的分割图象块,这主要是噪声和图象内容本身比较复杂造成的,也是分水岭算法本身无法克服的。
发明内容
本发明目的在于克服现有视频内容监控技术的缺陷,提供一种高效,准确的基于分水岭算法的视频对象提取方法。使其解决视频对象提取计算量大,准确性不高的问题,从而使视频监控的效率和实用性大大提高,为进一步进行的视频对象跟踪,监控视频对象状态提供可靠的依据。
本发明是通过以下技术方案实现的,本发明首先获得视频输入的初始帧,然后根据用户事先生成的监控区域配置文件确定需要提取的视频对象所在的局部矩形区域,接着在已经确定的各矩形区域中分别进行预处理(滤波去噪)、分水岭分割以及颜色分析和区域聚类处理,最后存储提取的视频对象。方法包括如下步骤:
(1)视频帧读取:以RGB的格式读入图象数据,然后分别转换为YUV12和HSI格式的数据保存;
(2)预处理:采用Roberts算子计算原图象的梯度图象,然后用中值滤波的方法对梯度图象去噪声,减少由于噪声引起的过分割;中值滤波器窗口大小的选择应兼顾滤波效果和运算速度。
(3)图象分割:采用分水岭算法对图象进行块分割。具体说以图象的灰度作为第三维建立三维拓扑图,用Vincent和Soille提出的模拟注水的方法提取拓扑图表面的分水岭,自然形成不同的区域,完成图象的块分割;
(4)颜色分析和区域聚合:对每一对相邻块,首先计算它们的颜色相似度。一般来说,彩色数字图象的颜色空间取RGB空间,但是就子色彩空间的区分度来说,其它颜色空间,如HSV,HSI和CIE更加便于分析和计算。在本发明中选取YUV12和HSI作为颜色空间,H表示色调,S表示饱和度,I表示亮度。图象中的每一个块的灰度均值可以计算出来,块合并的阈值由人的视觉特征-JND(Just NoticeableDifference)来确定:
设在某一个子色彩空间中相邻两个块各自的灰度均值分别为I1和I2,相应的视觉特征值为JND(I1)和JND(I2)。如果|I1-I2|<min(JDN(I1),JND(I2))。则将这两个块合并成一个块。
(5)弱边界的处理:经过颜色聚类处理后,再消除弱边界,即对每一条相邻块之间的边界,检验边界上的梯度大于某一设定阈值的象素的比例,若该比例超过50%则认为是强边界予以保留,反之则认为是弱边界,相应的邻块进行合并;
(6)视频对象保存:以象素链表的数据结构实现视频对象的存储。
由于视频监控的实时性要求,本发明采用了局部对象提取技术,即由用户首先采用配置文件的方式向程序提供需要监控的物体所在的矩形区域,程序就在该局部范围内进行对象提取。与从整帧范围进行全局对象提取相比,这种局部对象提取方法不仅准确性高而且计算量显著下降,分割、聚类的速度完全可以达到实时监控的要求。
本发明的针对传统的分水岭算法易产生过分割的缺陷,采用基于颜色信息的象素块聚合的方法,结合弱边界检测和消除技术,很好的解决了过分割的问题,进一步提高了视频对象提取的准确性。提取出来的视频对象以像素链表的数据结构存储,非常便于数据的分析和使用。在象素块聚类的过程中需要用到的阈值将根据人类视觉特性来确定,可以在程序执行过程中由计算机计算得到,不需要用户事先取定,因此使本技术的智能化水平进一步提高。
本发明具有实质性特点和显著进步,本发明采用基于颜色信息的块聚类算法,能够较好的减轻过分割现象,比较准确地提取出视频对象,该方法在基于内容的视频监控领域尚数首创,可以解决视频对象提取计算量大,准确性不高的问题,从而使视频监控的效率和实用性大大提高。本发明被用于对场景中的指定监控物体进行提取,实验表明,算法的实时性强,经过聚类处理后得到的象素块与被监控物体基本一致,为进一步进行视频对象的跟踪奠定了很好的基础。
具体实施方式
下面结合本发明在“设备实时视频监控”实验中的应用,具体阐述其实施方式。在该实施例中,用户首先采用配置文件的方式向程序提供以上三个监控的物体所在的矩形区域,程序就在该局部范围内进行对象提取,具体步骤如下:
(1)视频帧读取。输入的视频帧的格式是320*240的RGB图象,根据相应变换矩阵的分别将RGB格式转换为YUV12和HSI格式的数据保存;
(2)预处理。对视频帧的亮度灰度图,采用Roberts算子计算梯度图象,然后用中值滤波的方法对得到的梯度图象去噪声,中值滤波器采用5*5正方型滤波窗口,能够有效满足滤波效果和实时性要求。
(3)图象分割。对滤波后的梯度图象用模拟注水的方法进行块分割,分割结果表明的确存在过分割现象,三个监控对象本身都被分成了许多小块,为了使被监控对象尽量以一个块或少数几个相邻块的形式出现,必须进行聚合处理;
(4)颜色分析和区域聚合。利用步骤1中得到的YUV12和HSI格式的图象数据进行颜色分析和块聚类;
(5)弱边界的处理。在步骤(4)的同时结合弱边界消除技术进一步减少图象块的个数,使分割结果更加精确;
(6)视频对象保存,以象素链表的数据结构实现三个视频监控对象的存储。
实际监控效果表明,采用以上方法能够精确地提取出指定对象的轮廓,而且效率很高,可以满足实时监控的要求。提取出的对象用于跟踪,当对象状态发生一定变化后程序会及时报警,当对象状态恢复后程序也会发出相应的提示信息,这反映出对象提取的效果是显著的。

Claims (1)

1、一种基于分水岭算法的视频对象提取方法,其特征在于,首先获得视频输入的初始帧,然后根据用户事先生成的监控区域配置文件确定需要提取的视频对象所在的局部矩形区域,接着在已经确定的各矩形区域中分别进行预处理、分水岭分割以及颜色分析和区域聚类处理,最后存储提取的视频对象;包括以下步骤:
(1)视频帧读取:以RGB的格式读入图象数据,然后根据监控区域配置文件获取局部矩形区域图像,将该图像分别转换为灰度,YUV12和HSI格式的数据以待后续处理;
(2)预处理:采用Roberts算子计算原图象的梯度图象,然后用中值滤波的方法对梯度图象去噪声,减少由于噪声引起的过分割,中值滤波器窗口大小的选择兼顾滤波效果和运算速度;
(3)图象分割:在灰度空间上采用分水岭算法对图象进行块分割,即以图象的灰度作为第三维建立三维拓扑图,用Vincent和Soille提出的模拟注水的方法提取拓扑图表面的分水岭,自然形成各区域,完成图象的块分割;
(4)颜色分析和区域聚合:设一幅灰度图象经过分水岭算法处理后被分为多个区域,根据块邻接关系图,根据YUV12和HSI空间信息进行相邻块的合并,具体实现如下:首先计算相邻块的颜色相似度,选取YUV12和HSI作为颜色空间,图象中的每一个块的色彩均值即一个6维向量计算出来,块合并的阈值由人的视觉特征-JND来确定:设在YUV12和HSI色彩空间中相邻两个块各自的均值分别为I1和I2,相应的视觉特征值为JND(I1)和JND(I2),当且仅当||I1-I2||<min(JND(I1),JND(I2)),则将这两个块合并成一个块;
(5)弱边界的处理:经过颜色聚类处理后,再消除弱边界,即对每一条相邻块之间的边界,检验边界上的梯度大于某一设定阈值的象素的比例,若该比例超过50%则认为是强边界予以保留,反之则认为是弱边界,相应的邻块进行合并;
(6)视频对象保存:以象素链表的数据结构实现视频对象的存储。
CNB031514057A 2003-09-29 2003-09-29 基于分水岭算法的视频对象提取方法 Expired - Fee Related CN1312638C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB031514057A CN1312638C (zh) 2003-09-29 2003-09-29 基于分水岭算法的视频对象提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB031514057A CN1312638C (zh) 2003-09-29 2003-09-29 基于分水岭算法的视频对象提取方法

Publications (2)

Publication Number Publication Date
CN1529284A CN1529284A (zh) 2004-09-15
CN1312638C true CN1312638C (zh) 2007-04-25

Family

ID=34287015

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB031514057A Expired - Fee Related CN1312638C (zh) 2003-09-29 2003-09-29 基于分水岭算法的视频对象提取方法

Country Status (1)

Country Link
CN (1) CN1312638C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI616843B (zh) * 2016-09-12 2018-03-01 粉迷科技股份有限公司 動態影像去背方法、系統與電腦可讀取儲存裝置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101702236B (zh) * 2009-10-30 2011-09-21 无锡景象数字技术有限公司 一种多目标前景分割方法
CN102457733B (zh) * 2010-10-18 2014-04-09 满景资讯股份有限公司 增强辨识立体对象的方法
CN102693535B (zh) * 2011-03-24 2015-09-23 深圳市蓝韵实业有限公司 一种检测dr图像中束光器区域的方法
CN102800091B (zh) * 2012-07-10 2014-09-03 深圳市捷顺科技实业股份有限公司 一种运动目标分割方法、装置和系统
CN103279494A (zh) * 2013-05-03 2013-09-04 吴军 动态视频分析运动目标检索系统
CN105303531B (zh) * 2015-10-15 2018-01-26 深圳市华星光电技术有限公司 一种对比度调整方法及装置
CN106127735B (zh) * 2016-06-14 2018-12-04 中国农业大学 一种设施蔬菜边缘清晰类叶面病斑分割方法及装置
CN108269260B (zh) * 2016-12-30 2021-08-27 粉迷科技股份有限公司 动态影像去背方法、系统与计算机可读取存储装置
CN107133599A (zh) * 2017-05-11 2017-09-05 南宁市正祥科技有限公司 一种田间道路检测方法
CN108322788B (zh) * 2018-02-09 2021-03-16 武汉斗鱼网络科技有限公司 一种视频直播中的广告展示方法及装置
CN108648199B (zh) * 2018-05-21 2022-07-19 上海工程技术大学 基于分水岭和cv模型的超声相控阵ndt图像分割方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1225541A2 (en) * 2000-11-22 2002-07-24 General Electric Company Method for automatic segmentation of medical images
US20030179824A1 (en) * 2002-03-22 2003-09-25 Ming-Cheng Kan Hierarchical video object segmentation based on MPEG standard

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1225541A2 (en) * 2000-11-22 2002-07-24 General Electric Company Method for automatic segmentation of medical images
US20030179824A1 (en) * 2002-03-22 2003-09-25 Ming-Cheng Kan Hierarchical video object segmentation based on MPEG standard

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于人眼视觉特性的彩色图像分割方法 詹劲峰,戚飞虎,王海龙,计算机工程,第27卷第2期 2001 *
基于递归高阶统计和改进分水岭算法的运动对象分割 王圣男,蒋刚毅,郁梅,朱仲杰,宁波大学学报(理工版),第16卷第2期 2003 *
基于递归高阶统计和改进分水岭算法的运动对象分割 王圣男,蒋刚毅,郁梅,朱仲杰,宁波大学学报(理工版),第16卷第2期 2003;基于人眼视觉特性的彩色图像分割方法 詹劲峰,戚飞虎,王海龙,计算机工程,第27卷第2期 2001 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI616843B (zh) * 2016-09-12 2018-03-01 粉迷科技股份有限公司 動態影像去背方法、系統與電腦可讀取儲存裝置
US9934439B1 (en) 2016-09-12 2018-04-03 Framy Inc. Method, system for removing background of a video, and a computer-readable storage device

Also Published As

Publication number Publication date
CN1529284A (zh) 2004-09-15

Similar Documents

Publication Publication Date Title
CN102663382B (zh) 基于子网格特征自适应加权的视频图像文字识别方法
CN104268583B (zh) 基于颜色区域特征的行人重识别方法及系统
CN103714181B (zh) 一种层级化的特定人物检索方法
CN102542289B (zh) 一种基于多高斯计数模型的人流量统计方法
CN102289948B (zh) 高速公路场景下一种多特征融合的多车辆视频跟踪方法
CN1312638C (zh) 基于分水岭算法的视频对象提取方法
CN103279737B (zh) 一种基于时空兴趣点的打架行为检测方法
CN102194108B (zh) 一种聚类线性鉴别分析特征选择的笑脸表情识别方法
US8385654B2 (en) Salience estimation for object-based visual attention model
WO2021082168A1 (zh) 一种场景图像中特定目标对象的匹配方法
CN103824059A (zh) 一种基于视频图像序列的人脸表情识别方法
CN102496001A (zh) 一种视频监控目标自动检测的方法和系统
Duan et al. A WBC segmentation methord based on HSI color space
CN101216943B (zh) 一种视频运动目标分割的方法
CN103996046A (zh) 基于多视觉特征融合的人员识别方法
CN102568003A (zh) 一种基于视频结构化描述的多摄像机目标跟踪方法
CN109344842A (zh) 一种基于语义区域表达的行人重识别方法
CN106127812A (zh) 一种基于视频监控的客运站非出入口区域的客流统计方法
CN105243356A (zh) 一种建立行人检测模型的方法及装置及行人检测方法
CN112509009B (zh) 一种基于自然语言信息辅助的目标追踪方法
CN103400113A (zh) 基于图像处理的高速公路隧道行人检测方法
CN105957103B (zh) 一种基于视觉的运动特征提取方法
CN105809699B (zh) 一种基于图分割的车窗提取方法及系统
CN103456012B (zh) 基于最大稳定曲率区域的视觉人手检测跟踪方法及系统
CN103049788A (zh) 基于计算机视觉的待过行人数目的检测系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070425

Termination date: 20150929

EXPY Termination of patent right or utility model