CN116342466A - 一种图像抠图的方法及相关装置 - Google Patents
一种图像抠图的方法及相关装置 Download PDFInfo
- Publication number
- CN116342466A CN116342466A CN202210893060.5A CN202210893060A CN116342466A CN 116342466 A CN116342466 A CN 116342466A CN 202210893060 A CN202210893060 A CN 202210893060A CN 116342466 A CN116342466 A CN 116342466A
- Authority
- CN
- China
- Prior art keywords
- pixel
- objective function
- foreground
- group
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 230000006870 function Effects 0.000 claims abstract description 259
- 238000004364 calculation method Methods 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 33
- 238000005457 optimization Methods 0.000 claims abstract description 18
- 239000011159 matrix material Substances 0.000 claims description 96
- 238000004422 calculation algorithm Methods 0.000 claims description 26
- 239000013598 vector Substances 0.000 claims description 10
- 238000003064 k means clustering Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 7
- 238000003860 storage Methods 0.000 claims description 7
- 238000011160 research Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 238000007621 cluster analysis Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000002792 vascular Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种图像抠图的方法及相关装置,用于降低图像抠图的计算难度。本申请方法包括:获取目标图像的三分图;对未知区域的像素点进行聚类;根据第一组超像素和前景区域、背景区域计算颜色适应度函数;根据第一组超像素、前景区域和背景区域计算第一和第二空间适应度函数;根据颜色适应度函数、第一和第二空间适应度函数生成目标函数;选取的N个像素对;根据目标函数计算并对比N个像素对的目标函数值,对N个像素对中达到优化条件的像素对进行学习;当满足迭代终止条件时,将目标函数值最小的像素对的前景遮罩值设为第一组超像素中所有像素点的前景遮罩值;根据上述方式生成未知区域的最优前景遮罩值,并对目标图像进行抠图处理。
Description
技术领域
本申请实施例涉及图像处理领域,尤其涉及一种图像抠图的方法及相关装置。
背景技术
抠图是一种从图像或视频中精确提取前景信息的数字图像处理技术,其目的是准确获取目标图像中指定前景区域对应的前景遮罩值,前景遮罩值的精度影响着前景区域与指定背景区域合成新图像的精度。
当未知区域像素对应的前景像素颜色和背景像素颜色已知,即可利用抠图数学模型计算出的前景遮罩值、前景目标图像和新的背景图像来获得全新的图像。由于新合成的图像质量与前景遮罩值的精度密切相关,所以抠图技术成为图像合成的关键。随着人们对高层次视觉信息的追求,抠图技术被广泛应用于视频背景替换、视频会议、影视作品制作等。尤其是随着以手机直播为代表的自媒体行业兴起,绿幕抠图成为了新兴的抠图方式,绿幕抠图需要在指定的背景才能拍摄,在影视作品等制作过程中需要花费较多的物力和人力,因此限制了绿幕抠图方法的应用。为了避免在抠图过程中使用绿幕辅助抠图带来较高的成本,自然图像抠图技术不需要绿幕作为抠图的辅助工具而成为目前抠图研究的重点。自然图像抠图技术已被广泛应用于视觉任务,比如目标的分类和跟踪、医学影像处理、增强现实等。抠图技术还作为其他研究领域的辅助工具,降低其他研究方向的研究难度,比如重建高光谱超分辨图像、血管特征和模糊特征提取、图像颜色校正、多焦点图像融合等。自然图像抠图由于不需要绿幕作为辅助工具增加了抠图难度,为了准确提取前景透明度遮罩值,通常需要引入三分图作为辅助降低了抠图难度。
但是,随着图像像素量级以及图像语义信息的不断增大,使得图像抠图的计算复杂性高,即当前的图像抠图计算难度随着图像像素量级以及图像语义信息的不断增大而增大。
发明内容
为解决上述技术问题,本申请第一方面提供了一种图像抠图的方法,包括:
获取目标图像的三分图,三分图由目标图像划分为前景区域、背景区域和未知区域;
根据聚类算法对未知区域的像素点进行聚类,生成至少一组超像素,每一组超像素都标记有对应的类别;
选取第一组超像素,根据第一组超像素和前景区域、背景区域上的像素点计算第一组超像素的颜色适应度函数;
根据第一组超像素、前景区域和背景区域上的像素点计算第一空间适应度函数和第二空间适应度函数;
根据颜色适应度函数、第一空间适应度函数和第二空间适应度函数生成目标函数;
从前景区域和背景区域中选取的N个像素对;
根据目标函数计算并对比N个像素对的目标函数值,对N个像素对中目标函数值达到优化条件的像素对进行学习;
当N个像素对的目标函数值之和小于预设阈值时,将N个像素对中目标函数值最小的像素对的前景遮罩值作为最优前景遮罩值;
将最优遮罩值设为第一组超像素中所有像素点的前景遮罩值;
根据上述方式生成未知区域中每一组超像素的最优前景遮罩值,并通过最优前景遮罩值对目标图像进行抠图处理。
可选的,根据聚类算法对未知区域的像素点进行聚类,生成至少一组超像素,包括:
根据未知区域中的像素坐标生成相似度矩阵,相似度矩阵表征未知区域的像素点之间的相似度;
根据相似度矩阵生成度矩阵,度矩阵上对角线上元素为相似度矩阵一行所有元素之和;
根据相似度矩阵和度矩阵计算标准化的拉普拉斯矩阵;
计算拉普拉斯矩阵特征向量集;
根据特征向量集进行标准化处理生成特征矩阵;
根据K-means聚类算法对特征矩阵每一行元素进行聚类分组,以使得特征矩阵对应的像素点进行聚类分组,生成至少一组超像素。
可选的,根据目标函数计算并对比N个像素对的目标函数值,对N个像素对中目标函数值达到优化条件的像素对进行学习,包括:
根据N个像素对的空间坐标确定对应的颜色值,并将空间坐标和颜色值分别代入目标函数,生成N个目标函数值;
将N个目标函数值进行两两比对,通过目标函数值小的像素对的空间坐标更新目标函数值大的像素对的空间坐标。
可选的,在根据目标函数计算并对比N个像素对的目标函数值,对N个像素对中目标函数值达到优化条件的像素对进行学习之后,方法还包括:
当N个像素对的目标函数值之和不小于预设阈值时,根据更新后的的空间坐标确定新的像素对;
将目标函数值小的像素对的空间坐标和新的像素对分别代入目标函数,计算生成N个目标函数值,并重新进行两两对比以及像素对空间坐标的学习。
可选的,选取第一组超像素,根据第一组超像素和前景区域、背景区域上的像素点计算第一组超像素的颜色适应度函数,包括:
选取第一组超像素,确定第一组超像素的颜色均值和前景区域、背景区域上的像素点的颜色值;
根据颜色均值和前景区域、背景区域上的像素点的颜色值计算前景遮罩值;
根据前景遮罩值、颜色均值和前景区域、背景区域上的像素点的颜色值计算第一组超像素的颜色适应度函数。
可选的,根据第一组超像素的空间坐标和前景区域、背景区域上的像素点的空间坐标计算第一空间适应度函数和第二空间适应度函数,包括:
确定第一组超像素中像素点的空间坐标;
确定前景区域、背景区域上的像素点的空间坐标;
根据第一组超像素的空间坐标和前景区域、背景区域上的像素点的空间坐标计算第一空间适应度函数和第二空间适应度函数。
可选的,在获取目标图像的三分图之后,根据聚类算法对未知区域的像素点进行聚类,生成至少一组超像素之前,方法还包括:
对未知区域的像素点的空间坐标进行归一化处理。
本申请第二方面提供了一种图像抠图的装置,包括:
获取单元,用于获取目标图像的三分图,三分图由目标图像划分为前景区域、背景区域和未知区域;
聚类单元,用于根据聚类算法对未知区域的像素点进行聚类,生成至少一组超像素,每一组超像素都标记有对应的类别;
第一计算单元,用于选取第一组超像素,根据第一组超像素和前景区域、背景区域上的像素点计算第一组超像素的颜色适应度函数;
第二计算单元,用于根据第一组超像素、前景区域和背景区域上的像素点计算第一空间适应度函数和第二空间适应度函数;
生成单元,用于根据颜色适应度函数、第一空间适应度函数和第二空间适应度函数生成目标函数;
选取单元,用于从前景区域和背景区域中选取的N个像素对;
第三计算单元,用于根据目标函数计算并对比N个像素对的目标函数值,对N个像素对中目标函数值达到优化条件的像素对进行学习;
第一确定单元,用于当N个像素对的目标函数值之和小于预设阈值时,将N个像素对中目标函数值最小的像素对的前景遮罩值作为最优前景遮罩值;
第二确定单元,用于将最优遮罩值设为第一组超像素中所有像素点的前景遮罩值;
抠图单元,用于根据上述方式生成未知区域中每一组超像素的最优前景遮罩值,并通过最优前景遮罩值对目标图像进行抠图处理。
可选的,聚类单元,具体为:
根据未知区域中的像素坐标生成相似度矩阵,相似度矩阵表征未知区域的像素点之间的相似度;
根据相似度矩阵生成度矩阵,度矩阵上对角线上元素为相似度矩阵一行所有元素之和;
根据相似度矩阵和度矩阵计算标准化的拉普拉斯矩阵;
计算拉普拉斯矩阵特征向量集;
根据特征向量集进行标准化处理生成特征矩阵;
根据K-means聚类算法对特征矩阵每一行元素进行聚类分组,以使得特征矩阵对应的像素点进行聚类分组,生成至少一组超像素。
可选的,第三计算单元,包括:
根据N个像素对的空间坐标确定对应的颜色值,并将空间坐标和颜色值分别代入目标函数,生成N个目标函数值;
将N个目标函数值进行两两比对,通过目标函数值小的像素对的空间坐标更新目标函数值大的像素对的空间坐标。
可选的,装置还包括:
更新单元,用于当N个像素对的目标函数值之和不小于预设阈值时,根据更新后的的空间坐标确定新的像素对;
迭代单元,用于将目标函数值小的像素对的空间坐标和新的像素对分别代入目标函数,计算生成N个目标函数值,并重新进行两两对比以及像素对空间坐标的学习。
可选的,第一计算单元,包括:
选取第一组超像素,确定第一组超像素的颜色均值和前景区域、背景区域上的像素点的颜色值;
根据颜色均值和前景区域、背景区域上的像素点的颜色值计算前景遮罩值;
根据前景遮罩值、颜色均值和前景区域、背景区域上的像素点的颜色值计算第一组超像素的颜色适应度函数。
可选的,第二计算单元,包括:
确定第一组超像素中像素点的空间坐标;
确定前景区域、背景区域上的像素点的空间坐标;
根据第一组超像素的空间坐标和前景区域、背景区域上的像素点的空间坐标计算第一空间适应度函数和第二空间适应度函数。
可选的,装置还包括:
归一化单元,用于对未知区域的像素点的空间坐标进行归一化处理。
本申请第三方面提供了一种电子设备,包括:
处理器、存储器、输入输出单元以及总线;
处理器与存储器、输入输出单元以及总线相连;
存储器保存有程序,处理器调用程序以执行如第一方面以及第一方面的任意可选的方法。
本申请第四方面提供了一种计算机可读存储介质,计算机可读存储介质上保存有程序,程序在计算机上执行时执行如第一方面以及第一方面的任意可选的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请方案中,首先获取目标图像的三分图,三分图由目标图像划分为前景区域、背景区域和未知区域,需要将未知区域的精确的前景遮罩值计算出。根据聚类算法对未知区域的像素点进行聚类,生成至少一组超像素,每一组超像素都标记有对应的类别,使得整个计算过程得到降维处理,降低了计算复杂程度。选取第一组超像素,根据第一组超像素和前景区域、背景区域上的像素点计算第一组超像素的颜色适应度函数。根据第一组超像素、前景区域和背景区域上的像素点计算第一空间适应度函数和第二空间适应度函数。根据颜色适应度函数、第一空间适应度函数和第二空间适应度函数生成目标函数。从前景区域和背景区域中选取的N个像素对。根据目标函数计算并对比N个像素对的目标函数值,对N个像素对中目标函数值达到优化条件的像素对进行学习。当N个像素对的目标函数值之和小于预设阈值时,将N个像素对中目标函数值最小的像素对的前景遮罩值作为最优前景遮罩值。将最优遮罩值设为第一组超像素中所有像素点的前景遮罩值。根据上述方式生成未知区域中每一组超像素的最优前景遮罩值,并通过最优前景遮罩值对目标图像进行抠图处理。本实施例中,通过聚类算法对未知区域的像素点进行聚类,使得整体的对未知区域前景遮罩值的计算由整体像素点计算转换成分组计算,通过将相似的像素点进行聚类,在对分好类的像素点分别进行前景遮罩值的计算,降低了维度,并且每一组中的像素点都是相似的,可以提高精度,从整体上降低图像抠图的计算难度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请中图像抠图的方法的一个实施例示意图;
图2-1为本申请图像抠图的方法的另一个实施例第一阶段示意图;
图2-2为本申请图像抠图的方法的另一个实施例第二阶段示意图;
图2-3为本申请图像抠图的方法的另一个实施例第三阶段示意图;
图3为本申请中图像抠图的装置的一个实施例示意图;
图4为本申请中图像抠图的装置的另一个实施例示意图;
图5为本申请电子设备的一个实施例示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
在现有的绿幕抠图技术中,需要在指定的背景才能拍摄,在影视作品等制作过程中需要花费较多的物力和人力,因此限制了绿幕抠图方法的应用。为了避免在抠图过程中使用绿幕辅助抠图带来较高的成本,自然图像抠图技术不需要绿幕作为抠图的辅助工具而成为目前抠图研究的重点。自然图像抠图技术已被广泛应用于视觉任务,比如目标的分类和跟踪、医学影像处理、增强现实等。抠图技术还作为其他研究领域的辅助工具,降低其他研究方向的研究难度,比如重建高光谱超分辨图像、血管特征和模糊特征提取、图像颜色校正、多焦点图像融合等。自然图像抠图由于不需要绿幕作为辅助工具增加了抠图难度,为了准确提取前景透明度遮罩值,通常需要引入三分图作为辅助降低了抠图难度。但是,随着图像像素量级以及图像语义信息的不断增大,使得图像抠图的计算复杂性高,即当前的图像抠图计算难度随着图像像素量级以及图像语义信息的不断增大而增大。
基于此,本申请公开了一种图像抠图的方法及相关装置,用于降低图像抠图的计算难度。
下面将结合本申请实施例中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的方法可以应用于服务器、设备、终端或者其它具备逻辑处理能力的设备,对此,本申请不作限定。为方便描述,下面以执行主体为终端为例进行描述。
请参阅图1,本申请提供了一种图像抠图的方法的一个实施例,包括:
101、获取目标图像的三分图,三分图由目标图像划分为前景区域、背景区域和未知区域;
三分图指将目标图像I由用户手动划分为前景区域F、背景区域B和未知区域U三个区域,其中前景区域和背景区域的透明度遮罩值已知。未知区域的像素点不能确定是属于前景还是背景,故被称为未知区域,未知区域的前景遮罩值为待求解的前景遮罩值。
在基于像素对优化的抠图方法中,一般将寻找前景区域和背景区域最优像素对问题建模为像素对的组合优化抠图问题,确定最优像素对后即可计算对应的未知区域的前景遮罩值。
102、根据聚类算法对未知区域的像素点进行聚类,生成至少一组超像素,每一组超像素都标记有对应的类别;
聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Measurement)的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。
终端通过聚类算法首先将超像素根据相似程度进行分类,并且进行分组,同一类别的超像素可以有至少一组。通过聚类算法将原本的未知区域像素分解成多组同类像素,类内像素点具备较高相似性,类间像素点差异性较大。使得原本需要一起计算的未知区域的像素点可以分组计算,通过降低了计算维度从而降低了总的计算难度,并且由于类内素点具备较高相似性,计算过程中能够得到更准确的前景遮罩值。
103、选取第一组超像素,根据第一组超像素和前景区域、背景区域上的像素点计算第一组超像素的颜色适应度函数;
终端选取某个类别,从该类别中选取一组超像素,称为第一组超像素,计算第一组超像素以及前景区域、背景区域的像素点的颜色适应度函数,具体需要对第一组超像素的RGB颜色值进行组合运算,形成颜色适应度函数,此时的颜色适应度函数中只需要知道前景区域和背景区域的像素对,即可确定对应的RGB像素值,再通过RGB颜色值和颜色适应度函数即可计算出该函数的结果。
104、根据第一组超像素、前景区域和背景区域上的像素点计算第一空间适应度函数和第二空间适应度函数;
终端根据第一组超像素、前景区域和背景区域上的像素点计算第一空间适应度函数和第二空间适应度函数,具体需要对第一组超像素的对应的空间坐标进行组合运算,分别形成前景区域与第一组超像素的第一空间适应度函数,以及背景区域与第一组超像素的第二空间适应度函数。
105、根据颜色适应度函数、第一空间适应度函数和第二空间适应度函数生成目标函数;
终端根据颜色适应度函数、第一空间适应度函数和第二空间适应度函数生成目标函数,目的是组合出适应度函数对前景区域和背景区域的像素对进行对比判别,将前景区域和背景区域的像素对代入,即可确定该像素对的适配程度。
106、从前景区域和背景区域中选取的N个像素对;
终端从前景区域和背景区域中选取的N个像素对,具体是确定N个像素点的空间坐标位置,进而确定像素对。具体的,本实施例中需要从前景区域和背景区域中随机选取的N个位置的像素对。
107、根据目标函数计算并对比N个像素对的目标函数值,对N个像素对中目标函数值达到优化条件的像素对进行学习;
终端将选取的N个像素对对应的参数信息输入目标函数,得到对应的目标函数值,并且每一个像素对通过对应的目标函数值与其他像素对的目标函数值进行对比,目标函数值越小的越符合,对比后,达到优化条件(目标函数值较大的)的像素对需要进行学习优化,具体是优化空间坐标位置,使得像素对与原像素对发生改变。
108、当N个像素对的目标函数值之和小于预设阈值时,将N个像素对中目标函数值最小的像素对的前景遮罩值作为最优前景遮罩值;
在进行了学习优化之后,需要判断是否完成了迭代,需要对比总的误差,重新计算目标函数值,并且将N个像素对的目标函数值进行相加,当N个像素对的目标函数值之和小于预设阈值时,表示整体的像素对已经达到一个整体较优的水平,此时计算N个像素对中目标函数值最小的像素对的前景遮罩值,并且将这个前景遮罩值作为最优前景遮罩值。
109、将最优遮罩值设为第一组超像素中所有像素点的前景遮罩值;
终端将最优遮罩值设置为第一组超像素中所有像素点的前景遮罩值,通过该前景遮罩值对该组未知区域的像素点进行抠图处理。
110、根据上述方式生成未知区域中每一组超像素的最优前景遮罩值,并通过最优前景遮罩值对目标图像进行抠图处理。
终端根据上述方式生成未知区域中每一组超像素的最优前景遮罩值,并通过最优前景遮罩值对目标图像进行抠图处理。
本实施例中,终端首先获取目标图像的三分图,三分图由目标图像划分为前景区域、背景区域和未知区域,终端需要将未知区域的精确的前景遮罩值计算出。终端根据聚类算法对未知区域的像素点进行聚类,生成至少一组超像素,每一组超像素都标记有对应的类别,使得整个计算过程得到降维处理,降低了计算复杂程度。终端选取第一组超像素,根据第一组超像素和前景区域、背景区域上的像素点计算第一组超像素的颜色适应度函数。终端根据第一组超像素、前景区域和背景区域上的像素点计算第一空间适应度函数和第二空间适应度函数。终端根据颜色适应度函数、第一空间适应度函数和第二空间适应度函数生成目标函数。终端从前景区域和背景区域中选取的N个像素对。终端根据目标函数计算并对比N个像素对的目标函数值,对N个像素对中目标函数值达到优化条件的像素对进行学习。当N个像素对的目标函数值之和小于预设阈值时,终端将N个像素对中目标函数值最小的像素对的前景遮罩值作为最优前景遮罩值。终端将最优遮罩值设为第一组超像素中所有像素点的前景遮罩值。终端根据上述方式生成未知区域中每一组超像素的最优前景遮罩值,并通过最优前景遮罩值对目标图像进行抠图处理。本实施例中,通过聚类算法对未知区域的像素点进行聚类,使得整体的对未知区域前景遮罩值的计算由整体像素点计算转换成分组计算,通过将相似的像素点进行聚类,在对分好类的像素点分别进行前景遮罩值的计算,降低了维度,并且每一组中的像素点都是相似的,可以提高精度,从整体上降低图像抠图的计算难度。
请参阅图2-1、图2-2和图2-3,本申请提供了一种图像抠图的方法的一个实施例,包括:
201、获取目标图像的三分图,三分图由目标图像划分为前景区域、背景区域和未知区域;
本实施例中的步骤201与前述实施例中步骤101类似,此处不再赘述。
202、对未知区域的像素点的空间坐标进行归一化处理;
终端对未知区域的像素点的空间坐标进行归一化处理,分组之前对未知区域的像素点的空间坐标信息进行归一化处理,假设未知区域有T个像素可以表示为pz(xpz,ypz),i为大于0小于等于T的整数,大小为WxH,其中W与H为目标图像分辨率。任意一个像素点由5个维度{R,G,B,x,y}组成,其中前三维表示该像素点的颜色在RGB空间上的颜色坐标,后两维表示其在目标图像上的空间平面坐标。对像素的空间平面坐标进行归一化处理。
归一化后的坐标值其范围在[0,255]。
203、根据未知区域中的像素坐标生成相似度矩阵,相似度矩阵表征未知区域的像素点之间的相似度;
204、根据相似度矩阵生成度矩阵,度矩阵上对角线上元素为相似度矩阵一行所有元素之和;
205、根据相似度矩阵和度矩阵计算标准化的拉普拉斯矩阵;
206、计算拉普拉斯矩阵特征向量集;
207、根据特征向量集进行标准化处理生成特征矩阵;
208、根据K-means聚类算法对特征矩阵每一行元素进行聚类分组,以使得特征矩阵对应的像素点进行聚类分组,生成至少一组超像素;
由于未知区域有T个像素大小为WxH。将未知区域上的所有像素点看成一个整体,每个像素点作为网络中的各个节点,而连接像素点的是各个节点之间的边的权重值表示像素点间的相似度值,可以得到像素点之间的相似度矩阵。
可以看出S(pi,pj)为一个矩阵,下面简写为相似度矩阵“S”,其中1≤i≤W,1≤j≤H,|| ||为向量元素绝对值之和,即1-范数运算,σ为已知常数。在相似度矩阵S的基础上构建度矩阵D,度矩阵D在对角线上的元素是相似度矩阵一行所有元素的和,可以表示为Di,j,可以进行如下表示。
根据相似度矩阵S和度矩阵D计算出拉普拉斯矩阵L。
L=D-S
再对拉普拉斯矩阵L进行标准化,得到标准化后的拉普拉斯矩阵L1。
L1=D-1/2LD-1/2
计算拉普拉斯矩阵L1的前个特征值(特征值从小到大排列),再根据特征值计算拉普拉斯矩阵L1其对应的特征向量,生成特征向量集。
将各自对应的特征向量组成的矩阵进行标准化,最终组成特征矩阵F,该特征矩阵F为n×k维的矩阵。
将特征矩阵F中的每一行作为一个k维的样本,这样的样本大小为n,再用k-means聚类算法进行聚类分组,聚类维数为k。聚类结果中每一行所属的类别就是原来目标图像中的顶点即像素点所属的类别。
209、选取第一组超像素,确定第一组超像素的颜色均值和前景区域、背景区域上的像素点的颜色值;
210、根据颜色均值和前景区域、背景区域上的像素点的颜色值计算前景遮罩值;
211、根据前景遮罩值、颜色均值和前景区域、背景区域上的像素点的颜色值计算第一组超像素的颜色适应度函数;
212、确定第一组超像素中像素点的空间坐标;
213、确定前景区域、背景区域上的像素点的空间坐标;
214、根据第一组超像素的空间坐标和前景区域、背景区域上的像素点的空间坐标计算第一空间适应度函数和第二空间适应度函数;
215、根据颜色适应度函数、第一空间适应度函数和第二空间适应度函数生成目标函数;
选取第一组超像素,确定第一组超像素的颜色均值和前景区域、背景区域上的像素点的颜色值。假设第一组超像素为第h类第v组的超像素,则第一组超像素的颜色均值设置为前景区域上第p个像素点的颜色值设置为背景区域上第q个像素点的颜色值设置为
其中,|| ||2为向量元素绝对值的平方和再开方,即2-范数的运算。
终端根据前景遮罩值、颜色均值和前景区域、背景区域上的像素点的颜色值计算第一组超像素的颜色适应度函数。
终端根据颜色适应度函数、第一空间适应度函数和第二空间适应度函数生成目标函数。
216、从前景区域和背景区域w中选取的N个像素对;
本实施例中的步骤216与前述实施例中步骤106类似,此处不再赘述。
217、根据N个像素对的空间坐标确定对应的颜色值,并将空间坐标和颜色值分别代入目标函数,生成N个目标函数值;
218、将N个目标函数值进行两两比对,通过目标函数值小的像素对的空间坐标更新目标函数值大的像素对的空间坐标;
终端根据N个像素对(X1,X2,....XN)的空间坐标确定对应的颜色值,并将空间坐标和颜色值分别代入目标函数,生成N个目标函数值,并且将N个目标函数值进行两两比对,通过目标函数值小的像素对的空间坐标更新目标函数值大的像素对的空间坐标。N设置为偶数,使得可以两两比较并且学习。
如果fhv(X2)<fhv(X1),则假设X1=Xl,X2=Xw,假设在第t代第k轮比赛中获胜者和失败者的速度表示为Vw,k(t),Vl,k(t),位置表示为Xw,k(t),Xl,k(t),在k轮竞争后。失败者X1将根据下列公式的学习机制来更新位置和速度。
Xl,k(t+1)=Xl,k(t)+Vl,k(t+1)
其中,R1,R2和R3为随机产生的三个向量,取值范围在0到1区间。
X2直接进入下一代P(t+1),X1利用上述公式学习机制进入下一代P(t+1),在P(t+1)的粒子两两组队进行比较。
219、当N个像素对的目标函数值之和不小于预设阈值时,根据更新后的的空间坐标确定新的像素对;
220、将目标函数值小的像素对的空间坐标和新的像素对分别代入目标函数,计算生成N个目标函数值,并重新进行两两对比以及像素对空间坐标的学习;
当N个像素对的目标函数值之和不小于预设阈值时,表示当前所选取的像素对并不是整体最优,终端根据更新后的的空间坐标确定新的像素对,具体是更新前景区域和背景区域所选取的像素对的位置,选出新的像素对。
221、当N个像素对的目标函数值之和小于预设阈值时,将N个像素对中目标函数值最小的像素对的前景遮罩值作为最优前景遮罩值;
222、将最优遮罩值设为第一组超像素中所有像素点的前景遮罩值;
223、根据上述方式生成未知区域中每一组超像素的最优前景遮罩值,并通过最优前景遮罩值对目标图像进行抠图处理。
本实施例中的步骤221至223与前述实施例中步骤108至110类似,此处不再赘述。
本实施例中,终端首先获取目标图像的三分图,三分图由目标图像划分为前景区域、背景区域和未知区域,终端需要将未知区域的精确的前景遮罩值计算出。终端对未知区域的像素点的空间坐标进行归一化处理。终端根据未知区域中的像素坐标生成相似度矩阵,相似度矩阵表征未知区域的像素点之间的相似度,根据相似度矩阵生成度矩阵,度矩阵上对角线上元素为相似度矩阵一行所有元素之和,再根据相似度矩阵和度矩阵计算标准化的拉普拉斯矩阵。终端计算拉普拉斯矩阵特征向量集,根据特征向量集进行标准化处理生成特征矩阵。根据K-means聚类算法对特征矩阵每一行元素进行聚类分组,以使得特征矩阵对应的像素点进行聚类分组,生成至少一组超像素,使得整个计算过程得到降维处理,降低了计算复杂程度。终端选取第一组超像素,确定第一组超像素的颜色均值和前景区域、背景区域上的像素点的颜色值,根据颜色均值和前景区域、背景区域上的像素点的颜色值计算前景遮罩值,根据前景遮罩值、颜色均值和前景区域、背景区域上的像素点的颜色值计算第一组超像素的颜色适应度函数。
终端确定第一组超像素中像素点的空间坐标,确定前景区域、背景区域上的像素点的空间坐标,根据第一组超像素的空间坐标和前景区域、背景区域上的像素点的空间坐标计算第一空间适应度函数和第二空间适应度函数,根据颜色适应度函数、第一空间适应度函数和第二空间适应度函数生成目标函数。终端从前景区域和背景区域中选取的N个像素对。终端根据N个像素对的空间坐标确定对应的颜色值,并将空间坐标和颜色值分别代入目标函数,生成N个目标函数值,终端将N个目标函数值进行两两比对,通过目标函数值小的像素对的空间坐标更新目标函数值大的像素对的空间坐标。
当N个像素对的目标函数值之和不小于预设阈值时,根据更新后的的空间坐标确定新的像素对,将目标函数值小的像素对的空间坐标和新的像素对分别代入目标函数,计算生成N个目标函数值,并重新进行两两对比以及像素对空间坐标的学习。
当N个像素对的目标函数值之和小于预设阈值时,终端将N个像素对中目标函数值最小的像素对的前景遮罩值作为最优前景遮罩值。终端将最优遮罩值设为第一组超像素中所有像素点的前景遮罩值。终端根据上述方式生成未知区域中每一组超像素的最优前景遮罩值,并通过最优前景遮罩值对目标图像进行抠图处理。本实施例中,通过聚类算法对未知区域的像素点进行聚类,使得整体的对未知区域前景遮罩值的计算由整体像素点计算转换成分组计算,通过将相似的像素点进行聚类,在对分好类的像素点分别进行前景遮罩值的计算,降低了维度,并且每一组中的像素点都是相似的,可以提高精度,从整体上降低图像抠图的计算难度。
其次,通过迭代,使得像素对逐渐成学习优化成理想的位置。
请参阅图3,本申请提供了一种曲面屏图像中点阵坐标修正与填补的装置的一个实施例,包括:
获取单元301,用于获取目标图像的三分图,三分图由目标图像划分为前景区域、背景区域和未知区域;
聚类单元302,用于根据聚类算法对未知区域的像素点进行聚类,生成至少一组超像素,每一组超像素都标记有对应的类别;
第一计算单元303,用于选取第一组超像素,根据第一组超像素和前景区域、背景区域上的像素点计算第一组超像素的颜色适应度函数;
第二计算单元304,用于根据第一组超像素、前景区域和背景区域上的像素点计算第一空间适应度函数和第二空间适应度函数;
生成单元305,用于根据颜色适应度函数、第一空间适应度函数和第二空间适应度函数生成目标函数;
选取单元306,用于从前景区域和背景区域中选取的N个像素对;
第三计算单元307,用于根据目标函数计算并对比N个像素对的目标函数值,对N个像素对中目标函数值达到优化条件的像素对进行学习;
第一确定单元308,用于当N个像素对的目标函数值之和小于预设阈值时,将N个像素对中目标函数值最小的像素对的前景遮罩值作为最优前景遮罩值;
第二确定单元309,用于将最优遮罩值设为第一组超像素中所有像素点的前景遮罩值;
抠图单元310,用于根据上述方式生成未知区域中每一组超像素的最优前景遮罩值,并通过最优前景遮罩值对目标图像进行抠图处理。
请参阅图4,本申请提供了一种曲面屏图像中点阵坐标修正与填补的装置的一个实施例,包括:
获取单元401,用于获取目标图像的三分图,三分图由目标图像划分为前景区域、背景区域和未知区域;
归一化单元402,用于对未知区域的像素点的空间坐标进行归一化处理;
聚类单元403,用于根据聚类算法对未知区域的像素点进行聚类,生成至少一组超像素,每一组超像素都标记有对应的类别;
可选的,聚类单元403,具体为:
根据未知区域中的像素坐标生成相似度矩阵,相似度矩阵表征未知区域的像素点之间的相似度;
根据相似度矩阵生成度矩阵,度矩阵上对角线上元素为相似度矩阵一行所有元素之和;
根据相似度矩阵和度矩阵计算标准化的拉普拉斯矩阵;
计算拉普拉斯矩阵特征向量集;
根据特征向量集进行标准化处理生成特征矩阵;
根据K-means聚类算法对特征矩阵每一行元素进行聚类分组,以使得特征矩阵对应的像素点进行聚类分组,生成至少一组超像素。
第一计算单元404,用于选取第一组超像素,根据第一组超像素和前景区域、背景区域上的像素点计算第一组超像素的颜色适应度函数;
可选的,第一计算单元404,包括:
选取第一组超像素,确定第一组超像素的颜色均值和前景区域、背景区域上的像素点的颜色值;
根据颜色均值和前景区域、背景区域上的像素点的颜色值计算前景遮罩值;
根据前景遮罩值、颜色均值和前景区域、背景区域上的像素点的颜色值计算第一组超像素的颜色适应度函数。
第二计算单元405,用于根据第一组超像素、前景区域和背景区域上的像素点计算第一空间适应度函数和第二空间适应度函数;
可选的,第二计算单元405,包括:
确定第一组超像素中像素点的空间坐标;
确定前景区域、背景区域上的像素点的空间坐标;
根据第一组超像素的空间坐标和前景区域、背景区域上的像素点的空间坐标计算第一空间适应度函数和第二空间适应度函数。
生成单元406,用于根据颜色适应度函数、第一空间适应度函数和第二空间适应度函数生成目标函数;
选取单元407,用于从前景区域和背景区域中选取的N个像素对;
第三计算单元408,用于根据目标函数计算并对比N个像素对的目标函数值,对N个像素对中目标函数值达到优化条件的像素对进行学习;
可选的,第三计算单元408,包括:
根据N个像素对的空间坐标确定对应的颜色值,并将空间坐标和颜色值分别代入目标函数,生成N个目标函数值;
将N个目标函数值进行两两比对,通过目标函数值小的像素对的空间坐标更新目标函数值大的像素对的空间坐标。
更新单元409,用于当N个像素对的目标函数值之和不小于预设阈值时,根据更新后的的空间坐标确定新的像素对;
迭代单元410,用于将目标函数值小的像素对的空间坐标和新的像素对分别代入目标函数,计算生成N个目标函数值,并重新进行两两对比以及像素对空间坐标的学习;
第一确定单元411,用于当N个像素对的目标函数值之和小于预设阈值时,将N个像素对中目标函数值最小的像素对的前景遮罩值作为最优前景遮罩值;
第二确定单元412,用于将最优遮罩值设为第一组超像素中所有像素点的前景遮罩值;
抠图单元413,用于根据上述方式生成未知区域中每一组超像素的最优前景遮罩值,并通过最优前景遮罩值对目标图像进行抠图处理。
请参阅图5,本申请提供了一种电子设备,包括:
处理器501、存储器502、输入输出单元503以及总线504。
处理器501与存储器502、输入输出单元503以及总线504相连。
存储器502保存有程序,处理器501调用程序以执行如图1、图2-1、图2-2和图2-3中的方法。
本申请提供了一种计算机可读存储介质,计算机可读存储介质上保存有程序,程序在计算机上执行时执行如图1、图2-1、图2-2和图2-3中的方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,read-onlymemory)、随机存取存储器(RAM,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (10)
1.一种图像抠图的方法,其特征在于,包括:
获取目标图像的三分图,所述三分图由所述目标图像划分为前景区域、背景区域和未知区域;
根据聚类算法对所述未知区域的像素点进行聚类,生成至少一组超像素,每一组超像素都标记有对应的类别;
选取第一组超像素,根据所述第一组超像素和所述前景区域、所述背景区域上的像素点计算所述第一组超像素的颜色适应度函数;
根据所述第一组超像素、所述前景区域和所述背景区域上的像素点计算第一空间适应度函数和第二空间适应度函数;
根据颜色适应度函数、第一空间适应度函数和第二空间适应度函数生成目标函数;
从所述前景区域和所述背景区域中选取的N个像素对;
根据所述目标函数计算并对比所述N个像素对的目标函数值,对所述N个像素对中目标函数值达到优化条件的像素对进行学习;
当所述N个像素对的目标函数值之和小于预设阈值时,将所述N个像素对中目标函数值最小的像素对的前景遮罩值作为最优前景遮罩值;
将所述最优遮罩值设为所述第一组超像素中所有像素点的前景遮罩值;
根据上述方式生成所述未知区域中每一组超像素的最优前景遮罩值,并通过所述最优前景遮罩值对所述目标图像进行抠图处理。
2.根据权利要求1所述的方法,其特征在于,所述根据聚类算法对所述未知区域的像素点进行聚类,生成至少一组超像素,包括:
根据所述未知区域中的像素坐标生成相似度矩阵,所述相似度矩阵表征所述未知区域的像素点之间的相似度;
根据所述相似度矩阵生成度矩阵,所述度矩阵上对角线上元素为所述相似度矩阵一行所有元素之和;
根据所述相似度矩阵和所述度矩阵计算标准化的拉普拉斯矩阵;
计算所述拉普拉斯矩阵特征向量集;
根据所述特征向量集进行标准化处理生成特征矩阵;
根据K-means聚类算法对所述特征矩阵每一行元素进行聚类分组,以使得所述特征矩阵对应的像素点进行聚类分组,生成至少一组超像素。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标函数计算并对比所述N个像素对的目标函数值,对所述N个像素对中目标函数值达到优化条件的像素对进行学习,包括:
根据所述N个像素对的空间坐标确定对应的颜色值,并将所述空间坐标和颜色值分别代入所述目标函数,生成N个目标函数值;
将所述N个目标函数值进行两两比对,通过目标函数值小的像素对的空间坐标更新目标函数值大的像素对的空间坐标。
4.根据权利要求3所述的方法,其特征在于,在所述根据所述目标函数计算并对比所述N个像素对的目标函数值,对所述N个像素对中目标函数值达到优化条件的像素对进行学习之后,所述方法还包括:
当所述N个像素对的目标函数值之和不小于预设阈值时,根据更新后的的空间坐标确定新的像素对;
将目标函数值小的像素对的空间坐标和所述新的像素对分别代入所述目标函数,计算生成N个目标函数值,并重新进行两两对比以及像素对空间坐标的学习。
5.根据权利要求1所述的方法,其特征在于,所述选取第一组超像素,根据所述第一组超像素和所述前景区域、所述背景区域上的像素点计算所述第一组超像素的颜色适应度函数,包括:
选取第一组超像素,确定所述第一组超像素的颜色均值和所述前景区域、所述背景区域上的像素点的颜色值;
根据所述颜色均值和所述前景区域、所述背景区域上的像素点的颜色值计算前景遮罩值;
根据所述前景遮罩值、所述颜色均值和所述前景区域、所述背景区域上的像素点的颜色值计算所述第一组超像素的颜色适应度函数。
6.根据权利要求1所述的方法,其特征在于,根据所述第一组超像素的空间坐标和所述前景区域、所述背景区域上的像素点的空间坐标计算第一空间适应度函数和第二空间适应度函数,包括:
确定所述第一组超像素中像素点的空间坐标;
确定所述前景区域、所述背景区域上的像素点的空间坐标;
根据所述第一组超像素的空间坐标和所述前景区域、所述背景区域上的像素点的空间坐标计算第一空间适应度函数和第二空间适应度函数。
7.根据权利要求1至6中任一项所述的方法,其特征在于,在所述获取目标图像的三分图之后,所述根据聚类算法对所述未知区域的像素点进行聚类,生成至少一组超像素之前,所述方法还包括:
对所述未知区域的像素点的空间坐标进行归一化处理。
8.一种图像抠图的装置,其特征在于,包括:
获取单元,用于获取目标图像的三分图,所述三分图由所述目标图像划分为前景区域、背景区域和未知区域;
聚类单元,用于根据聚类算法对所述未知区域的像素点进行聚类,生成至少一组超像素,每一组超像素都标记有对应的类别;
第一计算单元,用于选取第一组超像素,根据所述第一组超像素和所述前景区域、所述背景区域上的像素点计算所述第一组超像素的颜色适应度函数;
第二计算单元,用于根据所述第一组超像素、所述前景区域和所述背景区域上的像素点计算第一空间适应度函数和第二空间适应度函数;
生成单元,用于根据颜色适应度函数、第一空间适应度函数和第二空间适应度函数生成目标函数;
选取单元,用于从所述前景区域和所述背景区域中选取的N个像素对;
第三计算单元,用于根据所述目标函数计算并对比所述N个像素对的目标函数值,对所述N个像素对中目标函数值达到优化条件的像素对进行学习;
第一确定单元,用于当所述N个像素对的目标函数值之和小于预设阈值时,将所述N个像素对中目标函数值最小的像素对的前景遮罩值作为最优前景遮罩值;
第二确定单元,用于将所述最优遮罩值设为所述第一组超像素中所有像素点的前景遮罩值;
抠图单元,用于根据上述方式生成所述未知区域中每一组超像素的最优前景遮罩值,并通过所述最优前景遮罩值对所述目标图像进行抠图处理。
9.一种电子设备,其特征在于,包括:
处理器、存储器、输入输出单元以及总线;
所述处理器与所述存储器、所述输入输出单元以及所述总线相连;
所述存储器保存有程序,所述处理器调用所述程序以执行如权利要求1至7任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上保存有程序,所述程序在计算机上执行时执行如权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210893060.5A CN116342466A (zh) | 2022-07-27 | 2022-07-27 | 一种图像抠图的方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210893060.5A CN116342466A (zh) | 2022-07-27 | 2022-07-27 | 一种图像抠图的方法及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116342466A true CN116342466A (zh) | 2023-06-27 |
Family
ID=86891791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210893060.5A Pending CN116342466A (zh) | 2022-07-27 | 2022-07-27 | 一种图像抠图的方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116342466A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116912284A (zh) * | 2023-09-15 | 2023-10-20 | 电子科技大学中山学院 | 抠图方法、装置、电子设备和计算机可读存储介质 |
-
2022
- 2022-07-27 CN CN202210893060.5A patent/CN116342466A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116912284A (zh) * | 2023-09-15 | 2023-10-20 | 电子科技大学中山学院 | 抠图方法、装置、电子设备和计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108229381B (zh) | 人脸图像生成方法、装置、存储介质和计算机设备 | |
JP2894113B2 (ja) | 画像クラスタリング装置 | |
CN107633522B (zh) | 基于局部相似性活动轮廓模型的脑部图像分割方法和系统 | |
CN108389211B (zh) | 基于改进鲸鱼优化模糊聚类的图像分割方法 | |
CN108198207A (zh) | 基于改进的Vibe模型和BP神经网络的多运动目标跟踪方法 | |
CN109448015B (zh) | 基于显著图融合的图像协同分割方法 | |
CN105740915B (zh) | 一种融合感知信息的协同分割方法 | |
CN112784929B (zh) | 一种基于双元组扩充的小样本图像分类方法及装置 | |
CN112364881B (zh) | 一种进阶采样一致性图像匹配方法 | |
CN111080592B (zh) | 一种基于深度学习的肋骨提取方法及装置 | |
CN107358172B (zh) | 一种基于人脸朝向分类的人脸特征点初始化方法 | |
CN112802054A (zh) | 一种融合图像分割的混合高斯模型前景检测方法 | |
CN113870157A (zh) | 一种基于CycleGAN的SAR图像合成方法 | |
CN110008844A (zh) | 一种融合slic算法的kcf长期手势跟踪方法 | |
CN109711442B (zh) | 无监督逐层生成对抗特征表示学习方法 | |
CN111985488B (zh) | 一种基于离线高斯模型的目标检测分割方法及系统 | |
CN111898571A (zh) | 动作识别系统及方法 | |
CN112329662A (zh) | 基于无监督学习的多视角显著性估计方法 | |
CN107274425B (zh) | 一种基于脉冲耦合神经网络的彩色图像分割方法及装置 | |
CN116342466A (zh) | 一种图像抠图的方法及相关装置 | |
CN107784664B (zh) | 一种基于k稀疏的快速鲁棒目标跟踪方法 | |
CN111553250B (zh) | 一种基于人脸特征点的精准面瘫程度评测方法及装置 | |
CN110599518B (zh) | 一种基于视觉显著度的超像素分割与条件数分块的目标跟踪方法 | |
CN113554685A (zh) | 遥感卫星运动目标检测方法、装置、电子设备及存储介质 | |
CN110599517A (zh) | 一种基于局部特征和全局hsv特征组合的目标特征描述方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |