CN1529284A - 基于分水岭算法的视频对象提取方法 - Google Patents

基于分水岭算法的视频对象提取方法 Download PDF

Info

Publication number
CN1529284A
CN1529284A CNA031514057A CN03151405A CN1529284A CN 1529284 A CN1529284 A CN 1529284A CN A031514057 A CNA031514057 A CN A031514057A CN 03151405 A CN03151405 A CN 03151405A CN 1529284 A CN1529284 A CN 1529284A
Authority
CN
China
Prior art keywords
video
image
piece
watershed algorithm
watershed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA031514057A
Other languages
English (en)
Other versions
CN1312638C (zh
Inventor
杨树堂
李建华
须泽中
郭礼华
袁晓彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CNB031514057A priority Critical patent/CN1312638C/zh
Publication of CN1529284A publication Critical patent/CN1529284A/zh
Application granted granted Critical
Publication of CN1312638C publication Critical patent/CN1312638C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

一种基于分水岭算法的视频对象提取方法,属于计算机视觉研究领域。本发明首先获得视频输入的初始帧,然后根据用户事先生成的监控区域配置文件确定需要提取的视频对象所在的局部矩形区域,接着在已经确定的各矩形区域中分别进行预处理、分水岭分割以及颜色分析和区域聚类处理,最后存储提取的视频对象。本发明方法在基于内容的视频监控领域尚数首创,可以解决视频对象提取计算量大,准确性不高的问题,从而使视频监控的效率和实用性大大提高。本发明被用于对场景中的指定监控物体进行提取,实验表明,算法的实时性强,经过聚类处理后得到的象素块与被监控物体基本一致,为进一步进行视频对象的跟踪奠定了很好的基础。

Description

基于分水岭算法的视频对象提取方法
技术领域
本发明涉及一种视频对象提取和视频信号处理方法,具体讲是一种基于分水岭算法的视频对象提取方法。属于计算机视觉研究领域。
背景技术
视频对象提取技术是计算机视觉和模式识别的重要研究对象之一,不仅具有很高的理论价值,而且在许多实际问题中,如基于内容的视频监控、运动检测等方面都得到了广泛的应用。同时,视频对象提取也是一项比较复杂的技术,牵涉到几何学、数学形态学、计算技术等许多领域,研究至今已经提出了很多算法,这些算法一般从视频对象的某些关键属性出发,建立相应的数学模型,使模型以视频对象的这些属性为唯一解或者局部最优解。然后就利用数值计算或计算机模拟的方法对模型进行求解,从而完成对视频对象的提取。
分水岭(watershed segmentation)算法是一种基于块的静态图象分割算法,也是一种常用的视频对象提取算法。在水线分割算法中,通过得到聚水盆就可以划分出相应的不同的图象区域,这种思想时比较直观的。经文献检索发现,图象的水线分割有两类方法,第一类方法(S H Collins.Terrain parameters directly from a digitalterrain model.Canadian Surveyor,加拿大测量29(5):507-518,1975)是从每个象素出发获得到达拓扑曲面局部最低区域的下降路线,一个聚水盆就是由所有汇到同一个局部最低区域的下降路线组成,这种方法计算量非常大,而且精度不高。第二类方法(L Vincent and P Soille.Watershed in digital spaces:An efficient algorithm basedon immersion simulations.IEEE Transactions on Pattern Analysis and MachineIntelligence,IEEE模式识别与机器视觉杂志13(6):583-598,1991)与第一类方法正好相反,是从聚水盆的盆底出发,采用模拟注水的方法(盆底看作是连通的)当相邻的聚水盆中的水溢出时相遇点连成线就形成了分水岭,该算法效率高,精度好,是比较普遍使用的一种分水岭算法。但是传统的分水岭算法最大的缺点就是过分割现象,即有时会出现大量的分割图象块,这主要是噪声和图象内容本身比较复杂造成的,也是分水岭算法本身无法克服的。
发明内容
本发明目的在于克服现有视频内容监控技术的缺陷,提供一种高效,准确的基于分水岭算法的视频对象提取方法。使其解决视频对象提取计算量大,准确性不高的问题,从而使视频监控的效率和实用性大大提高,为进一步进行的视频对象跟踪,监控视频对象状态提供可靠的依据。
本发明是通过以下技术方案实现的,本发明首先获得视频输入的初始帧,然后根据用户事先生成的监控区域配置文件确定需要提取的视频对象所在的局部矩形区域,接着在已经确定的各矩形区域中分别进行预处理(滤波去噪)、分水岭分割以及颜色分析和区域聚类处理,最后存储提取的视频对象。
以下对本发明作进一步的说明,方法包括如下步骤:
(1)视频帧读取:以RGB的格式读入图象数据,然后分别转换为YUV12和HSI格式的数据保存;
(2)预处理:采用Roberts算子计算原图象的梯度图象,然后用中值滤波的方法对梯度图象去噪声,减少由于噪声引起的过分割;中值滤波器窗口大小的选择应兼顾滤波效果和运算速度。
(3)图象分割:采用分水岭算法对图象进行块分割。具体说以图象的灰度作为第三维建立三维拓扑图,用Vincent和Soille提出的模拟注水的方法提取拓扑图表面的分水岭,自然形成不同的区域,完成图象的块分割;
(4)颜色分析和区域聚合:对每一对相邻块,首先计算它们的颜色相似度。一般来说,彩色数字图象的颜色空间取RGB空间,但是就子色彩空间的区分度来说,其它颜色空间,如HSV,HSI和CIE更加便于分析和计算。在本发明中选取HSI作为颜色空间,H表示色调,S表示饱和度,I表示亮度。图象中的每一个块的灰度均值可以计算出来,块合并的阈值由人的视觉特征一JND(Just Noticeable Difference)来确定:
设在某一个子色彩空间中相邻两个块各自的灰度均值分别为I1和I2,如果|I1-I2|<min(JDN(I1),JND(I2))。则将这两个块合并成一个块。
(5)弱边界的处理:经过颜色聚类处理后,再消除弱边界,即对每一条相邻块之间的边界,检验边界上的梯度大于某一设定阈值的象素的比例,若该比例超过50%则认为是强边界予以保留,反之则认为是弱边界,相应的邻块进行合并;
(6)视频对象保存:以象素链表的数据结构实现视频对象的存储。
由于视频监控的实时性要求,本发明采用了局部对象提取技术,即由用户首先采用配置文件的方式向程序提供需要监控的物体所在的矩形区域,程序就在该局部范围内进行对象提取。与从整帧范围进行全局对象提取相比,这种局部对象提取方法不仅准确性高而且计算量显著下降,分割、聚类的速度完全可以达到实时监控的要求。
本发明的针对传统的分水岭算法易产生过分割的缺陷,采用基于颜色信息的象素块聚合的方法,结合弱边界检测和消除技术,很好的解决了过分割的问题,进一步提高了视频对象提取的准确性。提取出来的视频对象以像素链表的数据结构存储,非常便于数据的分析和使用。在象素块聚类的过程中需要用到的阈值将根据人类视觉特性来确定,可以在程序执行过程中由计算机计算得到,不需要用户事先取定,因此使本技术的智能化水平进一步提高。
本发明具有实质性特点和显著进步,本发明采用基于颜色信息的块聚类算法,能够较好的减轻过分割现象,比较准确地提取出视频对象,该方法在基于内容的视频监控领域尚数首创,可以解决视频对象提取计算量大,准确性不高的问题,从而使视频监控的效率和实用性大大提高。本发明被用于对场景中的指定监控物体进行提取,实验表明,算法的实时性强,经过聚类处理后得到的象素块与被监控物体基本一致,为进一步进行视频对象的跟踪奠定了很好的基础。
具体实施方式
下面结合本发明在“设备实时视频监控”实验中的应用,具体阐述其实施方式。在该实施例中,用户首先采用配置文件的方式向程序提供以上三个监控的物体所在的矩形区域,程序就在该局部范围内进行对象提取,具体步骤如下:
(1)视频帧读取。输入的视频帧的格式是320*240的RGB图象,根据相应变换矩阵的分别将RGB格式转换为YUV12和HSI格式的数据保存;
(2)预处理。对视频帧的亮度灰度图,采用Roberts算子计算梯度图象,然后用中值滤波的方法对得到的梯度图象去噪声,中值滤波器采用5*5正方型滤波窗口,能够有效满足滤波效果和实时性要求。
(3)图象分割。对滤波后的梯度图象用模拟注水的方法进行块分割,分割结果表明的确存在过分割现象,三个监控对象本身都被分成了许多小块,为了使被监控对象尽量以一个块或少数几个相邻块的形式出现,必须进行聚合处理;
(4)颜色分析和区域聚合。利用步骤1中得到的HSI格式的图象数据进行颜色分析和块聚类;
(5)弱边界的处理。在步骤(4)的同时结合弱边界消除技术进一步减少图象块的个数,使分割结果更加精确;
(6)视频对象保存,以象素链表的数据结构实现三个视频监控对象的存储。
实际监控效果表明,采用以上方法能够精确地提取出指定对象的轮廓,而且效率很高,可以满足实时监控的要求。提取出的对象用于跟踪,当对象状态发生一定变化后程序会及时报警,当对象状态恢复后程序也会发出相应的提示信息,这反映出对象提取的效果是显著的。

Claims (4)

1、一种基于分水岭算法的视频对象提取方法,其特征在于,首先获得视频输入的初始帧,然后根据用户事先生成的监控区域配置文件确定需要提取的视频对象所在的局部矩形区域,接着在已经确定的各矩形区域中分别进行预处理、分水岭分割以及颜色分析和区域聚类处理,最后存储提取的视频对象。
2、根据权利要求1所述的基于分水岭算法的视频对象提取方法,其特征是,对本发明的方法限定如下:
(1)视频帧读取,(2)预处理,(3)图象分割,(4)颜色分析和区域聚合,(5)弱边界的处理,(6)视频对象保存。
3、根据权利要求2所述的基于分水岭算法的视频对象提取方法,其特征是,对本发明的方法进一步限定如下:
(1)视频帧读取:以RGB的格式读入图象数据,然后分别转换为YUV12和HSI格式的数据保存;
(2)预处理:采用Roberts算子计算原图象的梯度图象,然后用中值滤波的方法对梯度图象去噪声,减少由于噪声引起的过分割,中值滤波器窗口大小的选择兼顾滤波效果和运算速度;
(3)图象分割:采用分水岭算法对图象进行块分割,即以图象的灰度作为第三维建立三维拓扑图,用Vincent和Soille提出的模拟注水的方法提取拓扑图表面的分水岭,自然形成各区域,完成图象的块分割;
(4)颜色分析和区域聚合:设一幅灰度图象经过分水岭算法处理后被分为k个区域,得到块邻接关系图;
(5)弱边界的处理:经过颜色聚类处理后,再消除弱边界,即对每一条相邻块之间的边界,检验边界上的梯度大于某一设定阈值的象素的比例,若该比例超过50%则认为是强边界予以保留,反之则认为是弱边界,相应的邻块进行合并;
(6)视频对象保存:以象素链表的数据结构实现视频对象的存储。
4、根据权利要求3所述的基于分水岭算法的视频对象提取方法,其特征是,步骤(4)具体实现如下:
首先计算相邻块的颜色相似度,选取HSI作为颜色空间,H表示色调,S表示饱和度,I表示亮度,图象中的每一个块的灰度均值计算出来,块合并的阈值由人的视觉特征一JND来确定:设在某一个子色彩空间中相邻两个块各自的灰度均值分别为I1和I2,如果|I1-I2|<min(JDN(I1),JND(I2)),则将这两个块合并成一个块。
CNB031514057A 2003-09-29 2003-09-29 基于分水岭算法的视频对象提取方法 Expired - Fee Related CN1312638C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB031514057A CN1312638C (zh) 2003-09-29 2003-09-29 基于分水岭算法的视频对象提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB031514057A CN1312638C (zh) 2003-09-29 2003-09-29 基于分水岭算法的视频对象提取方法

Publications (2)

Publication Number Publication Date
CN1529284A true CN1529284A (zh) 2004-09-15
CN1312638C CN1312638C (zh) 2007-04-25

Family

ID=34287015

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB031514057A Expired - Fee Related CN1312638C (zh) 2003-09-29 2003-09-29 基于分水岭算法的视频对象提取方法

Country Status (1)

Country Link
CN (1) CN1312638C (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101702236B (zh) * 2009-10-30 2011-09-21 无锡景象数字技术有限公司 一种多目标前景分割方法
CN102457733A (zh) * 2010-10-18 2012-05-16 满景资讯股份有限公司 增强辨识立体对象的方法
CN102693535A (zh) * 2011-03-24 2012-09-26 深圳市蓝韵实业有限公司 一种检测dr图像中束光器区域的方法
CN102800091A (zh) * 2012-07-10 2012-11-28 深圳市捷顺科技实业股份有限公司 一种运动目标分割方法、装置和系统
CN103279494A (zh) * 2013-05-03 2013-09-04 吴军 动态视频分析运动目标检索系统
CN106127735A (zh) * 2016-06-14 2016-11-16 中国农业大学 一种设施蔬菜边缘清晰类叶面病斑分割方法及装置
WO2017063299A1 (zh) * 2015-10-15 2017-04-20 深圳市华星光电技术有限公司 一种对比度调整方法及装置
CN107133599A (zh) * 2017-05-11 2017-09-05 南宁市正祥科技有限公司 一种田间道路检测方法
CN108269260A (zh) * 2016-12-30 2018-07-10 粉迷科技股份有限公司 动态影像去背方法、系统与计算机可读取存储装置
CN108322788A (zh) * 2018-02-09 2018-07-24 武汉斗鱼网络科技有限公司 一种视频直播中的广告展示方法及装置
CN108648199A (zh) * 2018-05-21 2018-10-12 上海工程技术大学 基于分水岭和cv模型的超声相控阵ndt图像分割方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI616843B (zh) 2016-09-12 2018-03-01 粉迷科技股份有限公司 動態影像去背方法、系統與電腦可讀取儲存裝置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6754376B1 (en) * 2000-11-22 2004-06-22 General Electric Company Method for automatic segmentation of medical images
TW554629B (en) * 2002-03-22 2003-09-21 Ind Tech Res Inst Layered object segmentation method based on motion picture compression standard

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101702236B (zh) * 2009-10-30 2011-09-21 无锡景象数字技术有限公司 一种多目标前景分割方法
CN102457733A (zh) * 2010-10-18 2012-05-16 满景资讯股份有限公司 增强辨识立体对象的方法
CN102457733B (zh) * 2010-10-18 2014-04-09 满景资讯股份有限公司 增强辨识立体对象的方法
CN102693535A (zh) * 2011-03-24 2012-09-26 深圳市蓝韵实业有限公司 一种检测dr图像中束光器区域的方法
CN102693535B (zh) * 2011-03-24 2015-09-23 深圳市蓝韵实业有限公司 一种检测dr图像中束光器区域的方法
CN102800091A (zh) * 2012-07-10 2012-11-28 深圳市捷顺科技实业股份有限公司 一种运动目标分割方法、装置和系统
CN102800091B (zh) * 2012-07-10 2014-09-03 深圳市捷顺科技实业股份有限公司 一种运动目标分割方法、装置和系统
CN103279494A (zh) * 2013-05-03 2013-09-04 吴军 动态视频分析运动目标检索系统
WO2017063299A1 (zh) * 2015-10-15 2017-04-20 深圳市华星光电技术有限公司 一种对比度调整方法及装置
CN106127735A (zh) * 2016-06-14 2016-11-16 中国农业大学 一种设施蔬菜边缘清晰类叶面病斑分割方法及装置
CN106127735B (zh) * 2016-06-14 2018-12-04 中国农业大学 一种设施蔬菜边缘清晰类叶面病斑分割方法及装置
CN108269260A (zh) * 2016-12-30 2018-07-10 粉迷科技股份有限公司 动态影像去背方法、系统与计算机可读取存储装置
CN107133599A (zh) * 2017-05-11 2017-09-05 南宁市正祥科技有限公司 一种田间道路检测方法
CN108322788A (zh) * 2018-02-09 2018-07-24 武汉斗鱼网络科技有限公司 一种视频直播中的广告展示方法及装置
CN108322788B (zh) * 2018-02-09 2021-03-16 武汉斗鱼网络科技有限公司 一种视频直播中的广告展示方法及装置
CN108648199A (zh) * 2018-05-21 2018-10-12 上海工程技术大学 基于分水岭和cv模型的超声相控阵ndt图像分割方法
CN108648199B (zh) * 2018-05-21 2022-07-19 上海工程技术大学 基于分水岭和cv模型的超声相控阵ndt图像分割方法

Also Published As

Publication number Publication date
CN1312638C (zh) 2007-04-25

Similar Documents

Publication Publication Date Title
CN102663382B (zh) 基于子网格特征自适应加权的视频图像文字识别方法
CN104268583B (zh) 基于颜色区域特征的行人重识别方法及系统
CN103279737B (zh) 一种基于时空兴趣点的打架行为检测方法
CN103714181B (zh) 一种层级化的特定人物检索方法
CN1312638C (zh) 基于分水岭算法的视频对象提取方法
CN110874592B (zh) 一种基于总有界变分的森林火灾烟雾图像检测方法
CN106856002A (zh) 一种无人机拍摄图像质量评价方法
CN102136059A (zh) 一种基于视频分析的烟雾检测方法
CN112380982A (zh) 一种电力行业基建项目进度与质量的一体化监测方法
CN102289948A (zh) 高速公路场景下一种多特征融合的多车辆视频跟踪方法
CN105243356B (zh) 一种建立行人检测模型的方法及装置及行人检测方法
CN101216943B (zh) 一种视频运动目标分割的方法
CN102496001A (zh) 一种视频监控目标自动检测的方法和系统
CN113409267B (zh) 一种基于深度学习的路面裂缝检测与分割方法
CN105005759B (zh) 多特征融合的卡口图像前车窗的定位与提取方法
CN107688830B (zh) 一种用于案件串并的现勘视觉信息关联图层生成方法
CN109344842A (zh) 一种基于语义区域表达的行人重识别方法
CN103870834A (zh) 基于分层分割的滑动窗搜索方法
CN102568003A (zh) 一种基于视频结构化描述的多摄像机目标跟踪方法
CN103400113A (zh) 基于图像处理的高速公路隧道行人检测方法
CN102938053A (zh) 一种基于计算机视觉的甘蔗特征提取与识别方法
CN105809699B (zh) 一种基于图分割的车窗提取方法及系统
CN103456012B (zh) 基于最大稳定曲率区域的视觉人手检测跟踪方法及系统
CN1556506A (zh) 视频监控系统的智能化报警处理方法
CN110443142A (zh) 一种基于路面提取与分割的深度学习车辆计数方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070425

Termination date: 20150929

EXPY Termination of patent right or utility model