CN106651898A - 一种基于蒙版插值的快速Grabcut算法 - Google Patents

一种基于蒙版插值的快速Grabcut算法 Download PDF

Info

Publication number
CN106651898A
CN106651898A CN201610980793.7A CN201610980793A CN106651898A CN 106651898 A CN106651898 A CN 106651898A CN 201610980793 A CN201610980793 A CN 201610980793A CN 106651898 A CN106651898 A CN 106651898A
Authority
CN
China
Prior art keywords
image
masking
matrix
mask3
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610980793.7A
Other languages
English (en)
Other versions
CN106651898B (zh
Inventor
鹿浩
徐娟
梁苍
李昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Bishi Security Technology Co ltd
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN201610980793.7A priority Critical patent/CN106651898B/zh
Publication of CN106651898A publication Critical patent/CN106651898A/zh
Application granted granted Critical
Publication of CN106651898B publication Critical patent/CN106651898B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于蒙版插值的快速Grabcut算法,其特征是,包括如下步骤:1)输入原始图像M,对其进行压缩处理得到图像M1;2)对压缩后的图像M1进行处理,获得与压缩图像M1尺寸相对应的Grabcut算法处理产生的蒙版矩阵Mask1;3)对蒙版矩阵Mask1进行扩展处理;4)对蒙版矩阵Mask2的元素进行数值修正;5)调整Mask3的长宽尺寸与原图像一致;6)对Mask3进行二值化处理得到Mask,并利用Mask对原图像进行分割。本发明所达到的有益效果:本方法对于高分辨率的图像,本方法计算效率更高,且随着图像像素数的增加,改进算法的执行效率优势越大,同时获得与Grabcut算法相近的图像分割效果。

Description

一种基于蒙版插值的快速Grabcut算法
技术领域
本发明涉及一种快速Grabcut算法,属于图像处理技术领域。
背景技术
图像分割是当今一个比较热门的研究课题,有着广阔的应用前景。它广泛应用于医学、交通、军事等领域,研究它可以为我们进一步理解、分析图像相关信息提供非常重要的帮助。图像分割实质上即是对目标区域的分离,也是对目标特征的提取。通过对这些分离和提取的数据进行处理,使得更高层次的理解与分析成为可能。这同时也使得图像分割成为图像处理到图像分析的重要部分。图像分割结果的准确性将直接影响到后期数据分析与内容理解的效果。图像分割本身是一门十分复杂和棘手的技术,由于现有图像分割算法的一些不足也促进研究者们不断创新和改进,使图像分割技术不断完善,以便使其在实际应用中发挥更好的作用。
GrabCut是一种人工交互式彩色图像分割方法,是基于图论的图像分割方法。其基本原理是源自graph cuts算法。Graph cuts是将图割的理论引入图像分割中,使图像的最佳分割问题转化为能量函数最小化的问题,并采用最小割算法使能量最小化,并结合像素标记来完成分割的N维图像分割方法,由Boykov等人于2001年提出。在Graph Cuts给出的实现中,求解能量函数所用网络图是通过灰度直方图模型来构建的。Blake等将高斯混合模型(GMM)引入来代替灰度直方图,为彩色图像的前景和背景建模,将该方法应用于彩色图像进行分割的问题中。随后Rother和Blake等通过研究高斯混合模型的随机场理论,提出了GrabCut方法。该方法以引入了高斯混合模型的Graph cuts为原型,使用人工交互来选取图像中的感兴趣目标,同时使用迭代的方式来最小化能量函数,使分割结果更加精确。
GrabCut算法与其他图像分割算法相比,交互方式简单且分割效果好,在图像分割、图像识别等领域被广泛运用。但是该算法对于前景和背景具有很高相似度的图片分割效果不理想,同时由于GMM模型的迭代求解过程复杂,使得算法时间花销大。特别在处理高分辨率图像时,处理需要花销大量时间。
发明内容
为解决现有技术的不足,本发明的目的在于提供一种基于蒙版插值的快速Grabcut算法,解决对高分辨率图像利用常规Grabcut算法进行图像分割时计算量大的问题。
为了实现上述目标,本发明采用如下的技术方案:
一种基于蒙版插值的快速Grabcut算法,其特征是,包括如下步骤:
1)输入原始图像M,对其进行压缩处理得到图像M1,本步骤中所经历的压缩次数记为N;
2)对压缩后的图像M1进行处理,获得与压缩图像M1尺寸相对应的Grabcut算法处理产生的蒙版矩阵Mask1;同时,初始化计数变量n=1;
3)对蒙版矩阵Mask1进行扩展处理:将蒙版矩阵Mask1通过与扩展矩阵作Kronecker积,将蒙版矩阵Mask1尺寸扩展到原来的2倍得到蒙版矩阵其中表示矩阵的Kronecker积;
4)对蒙版矩阵Mask2的元素进行数值修正:建立与Mask2相同尺寸的空矩阵Mask3,将Mask3中每个元素的数值修正为Mask2矩阵中相对应元素周边相邻的所有元素数值的算术平均值,完成一次扩展插值,更新n=n+1;
5)如若n<M,将Mask3的值赋给Mask1,重新进入步骤3);
如若n≥N,此时Mask3的长宽尺寸已经与原图像一致,则进行下一步;
6)对Mask3进行二值化处理得到Mask,并利用Mask对原图像进行分割。
进一步地,所述步骤1)的具体内容为:
1.1)输入原始图像M,并建立原始图像的副本图像M′,获得其像素宽度为W,高度为H,其总像素数为W×H;
1.2)初始化压缩次数N=0;
1.3)判断图像M′的总像素数是否大于像素数门限G:
若W×H>G,则将图像M′的长、宽分别压缩为W/2和H/2,更新图像M′,压缩次数计数变量N=N+1,重复本步骤直到W×H≤G,将最终得到的图像记为M1。
进一步地,所述步骤6)具体内容为:依据经验值设定一个门限值Vg,将Mask3中值大于或等于门限值Vg的元素值更换为1,将Mask3中值小于门限值Vg的元素值更换为0,得到蒙版矩阵Mask,利用蒙版矩阵Mask对原图像进行图像分割。
本发明所达到的有益效果:本发明给出的方法与现有的Grabcut方法相比,对于高分辨率的图像,本方法计算效率更高,且随着图像像素数的增加,改进算法的执行效率优势越大,同时获得与Grabcut算法相近的图像分割效果。
附图说明
图1是本发明的算法流程图;
图2(a)(b)(c)(d)分别是本发明的一个实施例中蒙版矩阵Mask1、Mask2、Mask3、Mask的示例图;
图3(a)(b)分别是本发明和常规Grabcut算法对图像分割的效果比较图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明的算法如图1所示,具体步骤为:
步骤1)输入大尺寸原始图像M,对其进行压缩处理得到图像M1,本步骤中所经历的压缩次数记为N,具体过程如下:
1.1)输入原始图像M,并建立原始图像的副本图像M′,获得其像素宽度为W,高度为H,其总像素数为W×H;
1.2)初始化压缩次数N=0;
1.3)判断图像M′的总像素数是否大于像素数门限G(门限G根据经验值设定):
若W×H>G,则将图像M′的长、宽分别压缩为W/2和H/2,更新图像M′,压缩次数计数变量N=N+1,重复本步骤直到W×H≤G,将最终得到的图像记为M1。
步骤2)对压缩后的图像M1进行处理,获得与压缩图像M1尺寸相对应的Grabcut算法处理产生的蒙版矩阵Mask1;同时,初始化计数变量n=1。
步骤3)对蒙版矩阵Mask1进行扩展处理:将蒙版矩阵Mask1通过与扩展矩阵作Kronecker积,将蒙版矩阵Mask1尺寸扩展到原来的2倍得到蒙版矩阵其中表示矩阵的Kronecker积。
步骤4)对蒙版矩阵Mask2的元素进行数值修正:建立与Mask2相同尺寸的空矩阵Mask3,将Mask3中每个元素的数值修正为Mask2矩阵中相对应元素周边相邻的所有元素数值的算术平均值,完成一次扩展插值,更新n=n+1。
步骤5)如若n<N,将Mask3的值赋给Mask1,重新进入步骤3);
如若n≥N,此时Mask3的长宽尺寸已经与原图像一致,则进行下一步;
步骤6)对Mask3进行二值化处理得到Mask,并利用Mask对原图像进行分割:依据经验值设定一个门限值Vg,将Mask3中值大于或等于门限值Vg的元素值更换为1,将Mask3中值小于门限值Vg的元素值更换为0,得到蒙版矩阵Mask,利用蒙版矩阵Mask对原图像进行图像分割。
下面结合实施例来进行说明:如图2,以一个4×4的蒙版矩阵为例,进行一次扩展插值,其处理方法如下:
将矩阵4×4矩阵Mask1如图2(a)与扩展矩阵H(2×2维的全1矩阵)作Kronecker积,将矩阵Mask1尺寸扩展到原来的2倍获得8×8的矩阵Mask2,如图2(b)。
将扩展后的8×8的矩阵Mask2的元素进行数值修正,建立与Mask2相同尺寸的空矩阵,将空矩阵中每个元素的数值修正为8×8矩阵中相对应元素周边相邻的所有元素数值的算术平均值获得Mask3,如图2(c)。
最后,对插值后的Mask3矩阵做阈值判断成0,1矩阵,门限值Vg定为0.45,获得蒙版矩阵Mask,如图2(d)。
如图3,选用“Lena”图像进行对比,利用本发明的算法与常规Grabcut算法同时对同一尺寸800×800的图像进行图像分割处理。图3(a)为本算法对lena图像的分割结果图,图3(b)为常规Grabcut算法对“Lena”图像的分割结果图。
本算法所设图像总像素门限值G=30000,对蒙版矩阵所设门限值Vg=0.45。选取图中方框区进行放大,可以看出对于相同分辨率的图像,基于蒙版插值的快速Grabcut算法与常规Grabcut算法对图像分割处理结果相近。
本发明的执行效率通过以下实验进一步说明:
1、实验条件和内容:
实验仿真环境为:Visual Studio 2013+opencv 3.0,CPU intel CORE i5,内存4.0G,64位操作系统,Window7 Professional。
实验内容包括:使用尺寸大小为400×400,600×600,800×800,1000×1000,1200×1200的图像,该实验是分别利用基于蒙版插值的快速Grabcut算法与常规Grabcut算法同时对不同尺寸的图像进行图像分割处理。
基于蒙版插值的快速Grabcut算法的测试中所设图像总像素门限值G=30000,对蒙版矩阵所设门限值Vg=0.45。
2、实验结果:本发明的一种基于蒙版插值的快速Grabcut算法和常规Grabcut算法对不同尺寸的图像进行图像分割处理的时间开销如表1所示。
表1给出了对于处理相同分辨率的图像,基于蒙版插值的快速Grabcut算法与常规Grabcut算法所用时间。从表1中可知,本发明对图像进行分割处理的效率比常规Grabcut算法相比有明显的提高。
序号 图像尺寸大小 改进算法用时(s) grab cut算法用时(s)
1 400*400 0.436 3.807
2 600*600 0.936 11.122
3 800*800 1.108 17.55
4 1000*1000 1.606 53.25
5 1200*1200 2.324 56.133
6 1600*1600 3.572 308.261
表1实验结果
综上,本发明提出的一种基于蒙版插值的快速Grabcut算法,对于高分辨率的图像,在获得与常规Grabcut算法相近的图像分割质量的情况下,具有更高的计算效率,且随着图像总像素数的增加,本发明算法的执行效率优势越大。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (3)

1.一种基于蒙版插值的快速Grabcut算法,其特征是,包括如下步骤:
1)输入原始图像M,对其进行压缩处理得到图像M1,本步骤中所经历的压缩次数记为N;
2)对压缩后的图像M1进行处理,获得与压缩图像M1尺寸相对应的Grabcut算法处理产生的蒙版矩阵Mask1;同时,初始化计数变量n=1;
3)对蒙版矩阵Mask1进行扩展处理:将蒙版矩阵Mask1通过与扩展矩阵作Kronecker积,将蒙版矩阵Mask1尺寸扩展到原来的2倍得到蒙版矩阵其中表示矩阵的Kronecker积;
4)对蒙版矩阵Mask2的元素进行数值修正:建立与Mask2相同尺寸的空矩阵Mask3,将Mask3中每个元素的数值修正为Mask2矩阵中相对应元素周边相邻的所有元素数值的算术平均值,完成一次扩展插值,更新n=n+1;
5)如若n<N,将Mask3的值赋给Mask1,重新进入步骤3);
如若n≥N,此时Mask3的长宽尺寸已经与原图像一致,则进行下一步;
6)对Mask3进行二值化处理得到Mask,并利用Mask对原图像进行分割。
2.根据权利要求1所述的一种基于蒙版插值的快速Grabcut算法,其特征是,所述步骤1)的具体内容为:
1.1)输入原始图像M,并建立原始图像的副本图像M′,获得其像素宽度为W,高度为H,其总像素数为W×H;
1.2)初始化压缩次数N=0;
1.3)判断图像M′的总像素数是否大于像素数门限G:
若W×H>G,则将图像M′的长、宽分别压缩为W/2和H/2,更新图像M′,压缩次数计数变量N=N+1,重复本步骤直到W×H≤G,将最终得到的图像记为M1。
3.根据权利要求1所述的一种基于蒙版插值的快速Grabcut算法,其特征是,所述步骤6)具体内容为:依据经验值设定一个门限值Vg,将Mask3中值大于或等于门限值Vg的元素值更换为1,将Mask3中值小于门限值Vg的元素值更换为0,得到蒙版矩阵Mask,利用蒙版矩阵Mask对原图像进行图像分割。
CN201610980793.7A 2016-11-08 2016-11-08 一种基于蒙版插值的快速Grabcut算法 Active CN106651898B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610980793.7A CN106651898B (zh) 2016-11-08 2016-11-08 一种基于蒙版插值的快速Grabcut算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610980793.7A CN106651898B (zh) 2016-11-08 2016-11-08 一种基于蒙版插值的快速Grabcut算法

Publications (2)

Publication Number Publication Date
CN106651898A true CN106651898A (zh) 2017-05-10
CN106651898B CN106651898B (zh) 2019-05-28

Family

ID=58805308

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610980793.7A Active CN106651898B (zh) 2016-11-08 2016-11-08 一种基于蒙版插值的快速Grabcut算法

Country Status (1)

Country Link
CN (1) CN106651898B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115984126A (zh) * 2022-12-05 2023-04-18 北京拙河科技有限公司 一种基于输入指令的光图像修正方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101945203A (zh) * 2009-07-01 2011-01-12 夏普株式会社 图像压缩方法、图像压缩装置以及图像形成装置
KR20140047331A (ko) * 2012-10-12 2014-04-22 전남대학교산학협력단 Block Clustering 을 이용한 관심영역기반 자동객체분할방법 및 자동객체분할시스템
CN105787948A (zh) * 2016-03-23 2016-07-20 华中科技大学 一种基于多变形分辨率的快速图像分割方法
CN106055653A (zh) * 2016-06-01 2016-10-26 深圳市唯特视科技有限公司 基于图像语义注释的视频浓缩对象检索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101945203A (zh) * 2009-07-01 2011-01-12 夏普株式会社 图像压缩方法、图像压缩装置以及图像形成装置
KR20140047331A (ko) * 2012-10-12 2014-04-22 전남대학교산학협력단 Block Clustering 을 이용한 관심영역기반 자동객체분할방법 및 자동객체분할시스템
CN105787948A (zh) * 2016-03-23 2016-07-20 华中科技大学 一种基于多变形分辨率的快速图像分割方法
CN106055653A (zh) * 2016-06-01 2016-10-26 深圳市唯特视科技有限公司 基于图像语义注释的视频浓缩对象检索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
房稳 等: ""基于立体视觉系统的手势分割算法研究"", 《四川理工学院学报》 *
柳欢欢 等: ""基于小波变换的GrabCut图像分割"", 《计算机系统应用》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115984126A (zh) * 2022-12-05 2023-04-18 北京拙河科技有限公司 一种基于输入指令的光图像修正方法及装置

Also Published As

Publication number Publication date
CN106651898B (zh) 2019-05-28

Similar Documents

Publication Publication Date Title
CN104573731B (zh) 基于卷积神经网络的快速目标检测方法
CN105740945B (zh) 一种基于视频分析的人群计数方法
CN108764041B (zh) 用于下部遮挡人脸图像的人脸识别方法
CN105354581B (zh) 融合颜色特征与卷积神经网络的彩色图像特征提取方法
CN102663757A (zh) 基于核传递的半自动图像分割方法
CN103996195A (zh) 一种图像显著性检测方法
CN107123130B (zh) 一种基于超像素和混合哈希的核相关滤波目标跟踪方法
CN110827312B (zh) 一种基于协同视觉注意力神经网络的学习方法
CN105184772A (zh) 一种基于超像素的自适应彩色图像分割方法
CN109753996A (zh) 基于三维轻量化深度网络的高光谱图像分类方法
CN109886391A (zh) 一种基于空间正反对角卷积的神经网络压缩方法
CN109544564A (zh) 一种医疗图像分割方法
CN111242181B (zh) 基于图像语义和细节的rgb-d显著性物体检测器
CN110415250A (zh) 一种基于深度学习的重叠染色体分割方法及装置
CN105740915A (zh) 一种融合感知信息的协同分割方法
WO2022183805A1 (zh) 视频分类方法、装置及设备
CN105118051A (zh) 一种应用于静态图像人体分割的显著性检测方法
CN111008642A (zh) 基于卷积神经网络的高分辨率遥感影像分类方法及系统
CN111062274B (zh) 上下文感知嵌入的人群计数方法、系统、介质及电子设备
CN111160107B (zh) 一种基于特征匹配的动态区域检测方法
CN112528947A (zh) 一种通过增加方向维度的假菌丝检测方法、设备及存储介质
CN103778430A (zh) 一种基于肤色分割和AdaBoost相结合的快速人脸检测方法
CN107832753A (zh) 一种基于四值权重与多重分类的人脸特征提取方法
CN110175548A (zh) 基于注意力机制和通道信息的遥感图像建筑物提取方法
CN110472567A (zh) 一种适用于非配合场景下的人脸识别方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220711

Address after: 221000 Room 401, building a16, national security science and Technology Industrial Park, Lijiang Road, Xuzhou high tech Industrial Development Zone, Xuzhou City, Jiangsu Province

Patentee after: Jiangsu Bishi Security Technology Co.,Ltd.

Address before: 211100 No. 8 West Buddha Road, Jiangning District, Jiangsu, Nanjing

Patentee before: HOHAI University