CN111179276B - 一种图像处理方法和装置 - Google Patents
一种图像处理方法和装置 Download PDFInfo
- Publication number
- CN111179276B CN111179276B CN201811339830.1A CN201811339830A CN111179276B CN 111179276 B CN111179276 B CN 111179276B CN 201811339830 A CN201811339830 A CN 201811339830A CN 111179276 B CN111179276 B CN 111179276B
- Authority
- CN
- China
- Prior art keywords
- pixel
- color
- foreground
- image
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 82
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000003709 image segmentation Methods 0.000 claims abstract description 24
- 239000013598 vector Substances 0.000 claims description 182
- 238000005070 sampling Methods 0.000 claims description 167
- 238000010586 diagram Methods 0.000 claims description 57
- 238000013136 deep learning model Methods 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 238000007621 cluster analysis Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000003062 neural network model Methods 0.000 description 5
- 230000003749 cleanliness Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- PENWAFASUFITRC-UHFFFAOYSA-N 2-(4-chlorophenyl)imidazo[2,1-a]isoquinoline Chemical compound C1=CC(Cl)=CC=C1C1=CN(C=CC=2C3=CC=CC=2)C3=N1 PENWAFASUFITRC-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图像处理方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:对待处理图像进行前景预测,得到第一掩码图;利用图像分割算法对所述第一掩码图进行处理,得到第二掩码图;对所述第二掩码图中选定区域的像素标量值进行修正,以生成所述待处理图像的掩码图像。该实施方式能够在优化时间复杂度的情况下提高对细节的处理精度,并提高初始区域标记的准确度,进而提高图像分割的准确度,且对于各种干净程度的背景下的图像处理均可以适用。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种图像处理方法和装置。
背景技术
随着技术发展,通过图像处理技术可以实现将前景从图像中提取出来以与背景分割开,以及进行背景替换等后续的处理。以人像处理为例,现有方案包括如下几种:一是通过轮廓检测技术在原图中寻找人像轮廓,此方案在图像分割时为了保证时间复杂度高而没有描述对于头发等细节区域的处理方式,此外其应用范围受限于背景的干净程度(如背景没有明显纹理的情况)。二是初始步骤是根据人脸检测得到下巴的位置,然后通过下巴的位置去标记人体区域,此方案对人体区域的标记不够直接且精度不够高,会直接影响到下一步图像分割的准确度。三是初始步骤的标记需要依靠人脸检测,由于人脸检测实际上只能得到人脸轮廓或者人脸框,因而很难准确的得到人体区域的掩码图,另外采用了一种基于直方图的分割方案,分割准确度不高。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
对细节的处理精度差,初始标记以及图像分割的准确度低,且应用范围受限于背景的干净程度(如背景纹理特征的显著度等)。
发明内容
有鉴于此,本发明实施例提供一种图像处理方法和装置,能够在优化时间复杂度的情况下提高对细节的处理精度,并提高初始区域标记的准确度,进而提高图像分割的准确度,且对于各种干净程度的背景下的图像处理均可以适用。
为实现上述目的,根据本发明实施例的一个方面,提供了一种图像处理方法。
一种图像处理方法,包括:对待处理图像进行前景预测,得到第一掩码图;利用图像分割算法对所述第一掩码图进行处理,得到第二掩码图;对所述第二掩码图中选定区域的像素标量值进行修正,以生成所述待处理图像的掩码图像。
可选地,通过深度学习模型对所述待处理图像进行前景预测,以得到所述第一掩码图。
可选地,对所述第二掩码图中选定区域的像素标量值进行修正的步骤之前,包括:在所述第二掩码图中,将前景像素与前景边界的距离与第一距离阈值比较,以及将背景像素与所述前景边界的距离与第二距离阈值比较,以筛选出属于前景和背景交错区域的像素;将筛选出的像素所属的区域划分为所述选定区域。
可选地,对所述第二掩码图中选定区域的像素标量值进行修正的步骤,包括:对于所述选定区域内的每一个像素,根据该像素的最近前景采样点的邻域像素的颜色统计信息,得到该像素对应的颜色统计信息;根据所述最近前景采样点的颜色向量与所述最近前景采样点对应的默认背景颜色向量,得到第一颜色差向量;根据该像素的颜色向量与所述最近前景采样点对应的默认背景颜色向量,得到第二颜色差向量;根据该像素对应的颜色统计信息、所述第一颜色差向量、所述第二颜色差向量,对该像素的标量值进行修正。
可选地,根据该像素的最近前景采样点的邻域像素的颜色统计信息,得到该像素对应的颜色统计信息的步骤,包括:对该像素的最近前景采样点的每一邻域像素,根据该邻域像素的颜色向量与该邻域像素的最近背景采样点的颜色期望值,得到该邻域像素对应的颜色差向量;对该像素的最近前景采样点的所有邻域像素对应的颜色差向量进行聚类分析,得到该像素的最近前景采样点的邻域像素的分类;根据各邻域像素对应的颜色差向量,计算每一分类内邻域像素的的颜色统计信息;根据与该像素的颜色向量最接近的分类内邻域像素的颜色统计信息,得到该像素对应的颜色统计信息。
可选地,一分类内邻域像素的颜色统计信息包括:该分类内邻域像素对应的颜色差向量的均值向量,以及所述均值向量的范数,根据与该像素的颜色向量最接近的分类内邻域像素的颜色统计信息,得到该像素对应的颜色统计信息的步骤,包括:根据该像素的最近前景采样点的邻域像素各分类内,邻域像素对应的颜色差向量的均值向量与该像素的颜色向量的欧式距离,确定与该像素的颜色向量最接近的分类;将与该像素的颜色向量最接近的分类内,邻域像素对应的颜色差向量的均值向量的范数,作为该像素对应的颜色统计信息。
可选地,对所述第二掩码图中选定区域的像素标量值进行修正的步骤之前,包括:在所述第二掩码图中,分别从除所述选定区域之外的前景像素所属区域中筛选出前景采样点的集合,以及从除所述选定区域之外的背景像素所属区域中筛选出背景采样点的集合;根据每个所述背景采样点的邻域像素的平均像素值,得到所述背景采样点的颜色期望值;将与所述前景采样点距离最近的背景采样点的颜色期望值,作为所述前景采样点对应的默认背景颜色向量。
可选地,对所述第二掩码图中选定区域的像素标量值进行修正,以生成所述待处理图像的掩码图像的步骤之后,包括:根据所述待处理图像、所述待处理图像的掩码图像以及预设的三通道背景图像,按照预设规则生成所述待处理图像的三通道结果图像。
根据本发明实施例的另一方面,提供了一种图像处理装置。
一种图像处理装置,包括:前景预测模块,用于对待处理图像进行前景预测,得到第一掩码图;第一处理模块,用于利用图像分割算法对所述第一掩码图进行处理,得到第二掩码图;第二处理模块,用于对所述第二掩码图中选定区域的像素标量值进行修正,以生成所述待处理图像的掩码图像。
可选地,所述前景预测模块还用于:通过深度学习模型对所述待处理图像进行前景预测,以得到所述第一掩码图。
可选地,还包括选定区域生成模块,用于:在所述第二掩码图中,将前景像素与前景边界的距离与第一距离阈值比较,以及将背景像素与所述前景边界的距离与第二距离阈值比较,以筛选出属于前景和背景交错区域的像素;将筛选出的像素所属的区域划分为所述选定区域。
可选地,所述第二处理模块还用于:对于所述选定区域内的每一个像素,根据该像素的最近前景采样点的邻域像素的颜色统计信息,得到该像素对应的颜色统计信息;根据所述最近前景采样点的颜色向量与所述最近前景采样点对应的默认背景颜色向量,得到第一颜色差向量;根据该像素的颜色向量与所述最近前景采样点对应的默认背景颜色向量,得到第二颜色差向量;根据该像素对应的颜色统计信息、所述第一颜色差向量、所述第二颜色差向量,对该像素的标量值进行修正。
可选地,所述第二处理模块包括运算和确定子模块,用于:对该像素的最近前景采样点的每一邻域像素,根据该邻域像素的颜色向量与该邻域像素的最近背景采样点的颜色期望值,得到该邻域像素对应的颜色差向量;对该像素的最近前景采样点的所有邻域像素对应的颜色差向量进行聚类分析,得到该像素的最近前景采样点的邻域像素的分类;根据各邻域像素对应的颜色差向量,计算每一分类内邻域像素的的颜色统计信息;根据与该像素的颜色向量最接近的分类内邻域像素的颜色统计信息,得到该像素对应的颜色统计信息。
可选地,一分类内邻域像素的颜色统计信息包括:该分类内邻域像素对应的颜色差向量的均值向量,以及所述均值向量的范数,所述运算和确定子模块包括像素颜色统计信息确定单元,用于:根据该像素的最近前景采样点的邻域像素各分类内,邻域像素对应的颜色差向量的均值向量与该像素的颜色向量的欧式距离,确定与该像素的颜色向量最接近的分类;将与该像素的颜色向量最接近的分类内,邻域像素对应的颜色差向量的均值向量的范数,作为该像素对应的颜色统计信息。
可选地,还包括默认背景颜色确定模块,用于:在所述第二掩码图中,分别从除所述选定区域之外的前景像素所属区域中筛选出前景采样点的集合,以及从除所述选定区域之外的背景像素所属区域中筛选出背景采样点的集合;根据每个所述背景采样点的邻域像素的平均像素值,得到所述背景采样点的颜色期望值;将与所述前景采样点距离最近的背景采样点的颜色期望值,作为所述前景采样点对应的默认背景颜色向量。
可选地,还包括第三处理模块,用于:根据所述待处理图像、所述待处理图像的掩码图像以及预设的三通道背景图像,按照预设规则生成所述待处理图像的三通道结果图像。
根据本发明实施例的又一方面,提供了一种电子设备。
一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现本发明提供的图像处理方法。
根据本发明实施例的又一方面,提供了一种计算机可读介质。
一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明提供的图像处理方法。
上述发明中的一个实施例具有如下优点或有益效果:对待处理图像进行前景预测,得到第一掩码图;利用图像分割算法对第一掩码图进行处理,得到第二掩码图;对第二掩码图中选定区域的像素标量值进行修正,以生成待处理图像的掩码图像,能够在优化时间复杂度的情况下提高对细节的处理精度,通过深度学习模型对待处理图像进行前景预测,可以提高初始区域标记的准确度,进而提高图像分割的准确度,本发明方案对于各种干净程度的背景下的图像处理均可以适用。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明一个实施例的图像处理方法的主要步骤示意图;
图2是根据本发明另一个实施例的图像处理方法的主要步骤示意图;
图3是根据本发明实施例的深度学习模型预测得到的人像轮廓掩码图的示意图;
图4为本发明实施例与现有技术通过grabcut算法处理得到的人像轮廓掩码图的对照示意图;
图5为本发明实施例通过grabcut算法处理得到的人像轮廓掩码图的前景边界示意图;
图6为本发明实施例的通过grabcut算法处理得到的人像轮廓掩码图中未知区域的示意图;
图7为本发明实施例的通过grabcut算法处理得到的人像轮廓掩码图中前景采样边界和背景采样边界的示意图;
图8为通过本发明实施例的图像处理方法对原始彩色图像处理后的掩码图像示意图;
图9为根据本发明实施例的通过导向滤波进一步处理的原始彩色图像的掩码图像的示意图;
图10根据本发明实施例的图像处理装置的主要模块示意图;
图11是本发明实施例可以应用于其中的示例性系统架构图;
图12是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本领域技术技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
图1是根据本发明一个实施例的图像处理方法的主要步骤示意图。
如图1所示,本发明一个实施例的图像处理方法主要包括如下的步骤S101至步骤S103。
步骤S101:对待处理图像进行前景预测,得到第一掩码图。
待处理图像即原始的彩色图像,待处理图像中每个位置对应一个像素,每个像素的像素值为三通道RGB(RGB表示红绿蓝,三个通道的颜色)向量。
其中,可以通过深度学习模型对待处理图像进行前景预测,以得到第一掩码图。
深度学习模型具体可以为深度神经网络模型,采用深度神经网络来初始化下述步骤S102的图像分割算法的初始掩码设置,将模型预测出的第一掩码图作为图像分割算法的初始化参数传入,既可以保证算法输出的准确度,也无需用户手动标记,从而省去用户的交互步骤。
步骤S102:利用图像分割算法对第一掩码图进行处理,得到第二掩码图。
具体地,即将待处理图像和第一掩码图通过图像分割算法进行迭代估计,得到边界比第一掩码图更为精确的第二掩码图。图像分割算法可以为grabcut算法(一种图像分割算法),也可以为其他通用的图像分割算法。其中,为优化处理的时间复杂度,通常的grabcut算法是对原始的grabcut算法进行了简化的算法。
第一掩码图和第二掩码图中每个位置对应一个像素,每个像素的像素值为单通道标量值。
第二掩码图的边界是将前景和背景分割得到的比第一掩码图更为精确的一条硬边界,该硬边界上的像素具有如下特点:像素本身是绝对前景像素,但其邻域像素中至少有一个是背景像素。把该硬边界上的各像素确定出来,即得到一条边界线,称之为第二掩码图的前景边界。
前景边界可以通过如下方法确定:计算原始彩色图上所有像素(像素也可称像素点,或简称点)与第二掩码图硬边界的最小距离(或称最小空间距离),如果最小距离超过一定门限,则可认为该点距离硬边界很远,可设定其距离为无穷大,这样,对于原始彩色图上所有的点,都计算得到距离硬边界最近的点以及相应的最小距离值,这些点是位于硬边界上的点,这些点构成的边界线即前景边界。
步骤S103:对第二掩码图中选定区域的像素标量值进行修正,以生成待处理图像的掩码图像。
第二掩码图中选定区域的像素标量值是指该选定区域的每个位置的像素的像素值,该值为单通道标量值。
对第二掩码图中选定区域的像素标量值进行修正之前,可在第二掩码图中,将前景像素与前景边界的距离与第一距离阈值比较,以及将背景像素与前景边界的距离与第二距离阈值比较,以筛选出属于前景和背景交错区域的像素,具体地,将前景像素中距离前景边界小于第一距离阈值的,和背景像素中距离前景边界小于第二距离阈值的点(像素)筛选出来,这些像素位于前景和背景交错区域;将筛选出的像素所属的区域划分为选定区域。
对第二掩码图中选定区域的像素标量值进行修正之前,还可在第二掩码图中,根据预先设定的第三距离阈值和第四距离阈值,分别从除选定区域之外的前景像素所属区域中筛选出前景采样点的集合,以及从除选定区域之外的背景像素所属区域中筛选出背景采样点的集合。具体地,筛选出前景像素中距离前景边界等于第三距离阈值的采样点,以得到前景采样点的集合,以及筛选出背景像素中距离前景边界等于第四距离阈值的采样点,以得到背景采样点的集合,其中,为保证参与筛选的前景像素、背景像素是除选定区域之外的像素(前景像素或背景像素),应使得第四距离阈值大于第二距离阈值,且第三距离阈值大于第一距离阈值。
前景采样点的集合构成的边界线称为前景采样边界;背景采样点的集合构成的边界线称为背景采样边界。
还可根据每个背景采样点的邻域像素的平均像素值,得到每个背景采样点的颜色期望值;将与前景采样点距离最近的背景采样点的颜色期望值,作为前景采样点对应的默认背景颜色向量。
对第二掩码图中选定区域的像素标量值进行修正的步骤,具体可以包括:
对于选定区域内的每一个像素,
根据该像素的最近前景采样点的邻域像素的颜色统计信息,得到该像素对应的颜色统计信息;根据最近前景采样点的颜色向量与最近前景采样点对应的默认背景颜色向量,得到第一颜色差向量,具体地,该第一颜色差向量为该最近前景采样点的颜色向量与该最近前景采样点对应的默认背景颜色向量的差值;根据该像素的颜色向量与最近前景采样点对应的默认背景颜色向量,得到第二颜色差向量,具体地,该第二颜色差向量为该像素的颜色向量与该最近前景采样点对应的默认背景颜色向量的差值;根据该像素对应的颜色统计信息、第一颜色差向量、第二颜色差向量,对该像素的标量值进行修正。
其中,根据该像素的最近前景采样点的邻域像素的颜色统计信息,得到该像素对应的颜色统计信息的步骤,具体可以包括:
对该像素的最近前景采样点的每一邻域像素,根据该邻域像素的颜色向量与该邻域像素的最近背景采样点的颜色期望值,得到该邻域像素对应的颜色差向量;对该像素的最近前景采样点的所有邻域像素对应的颜色差向量进行聚类分析,得到该像素的最近前景采样点的邻域像素的分类;根据各邻域像素对应的颜色差向量,计算每一分类内邻域像素的的颜色统计信息;根据与该像素的颜色向量最接近的分类内邻域像素的颜色统计信息,得到该像素对应的颜色统计信息。
某一个分类内邻域像素的颜色统计信息包括:该分类内邻域像素对应的颜色差向量的均值向量,以及该均值向量的范数。
根据与该像素的颜色向量最接近的分类内邻域像素的颜色统计信息,得到该像素对应的颜色统计信息的步骤,具体可以包括:
根据该像素的最近前景采样点的邻域像素各分类内,邻域像素对应的颜色差向量的均值向量与该像素的颜色向量的欧式距离,确定与该像素的颜色向量最接近的分类;将与该像素的颜色向量最接近的分类内,邻域像素对应的颜色差向量的均值向量的范数,作为该像素对应的颜色统计信息。
根据该像素对应的颜色统计信息、第一颜色差向量、第二颜色差向量,对该像素的标量值进行修正,具体地,对像素(位置为(x,y))的修正后的标量值M(x,y)的计算方法为:
dot_product(fgcolor,icolor-bgcolor)/||mean(k)||。
其中,dot_product表示向量点积,fgcolor为第一颜色差向量,icolor-bgcolor为第二颜色差向量,||mean(k)||为该像素(位置为(x,y))对应的颜色统计信息,即上述与该像素的颜色向量最接近的分类内,邻域像素对应的颜色差向量的均值向量的范数。
图2是根据本发明另一个实施例的图像处理方法的主要步骤示意图。
如图2所示,本发明另一个实施例的图像处理方法主要如下的步骤S201至步骤S204。
其中步骤S201与步骤S101相同,步骤S202与步骤S102相同,步骤S203与步骤S103相同,因此,步骤S201至步骤S203的具体实现可以参见步骤S101至步骤S103。
步骤S204:根据待处理图像、待处理图像的掩码图像以及预设的三通道背景图像,按照预设规则生成待处理图像的三通道结果图像。
通过步骤S204,可以利用步骤S203得到的待处理图像的掩码图像,对原始图像进行背景替换或者前景背景的分割,得到三通道结果图像。
具体的,待处理图像以I表示,待处理图像的掩码图像以M表示,预设的三通道背景图像以B表示,待处理图像的三通道结果图像以O表示,I(x,y)表示I中(x,y)位置的像素值,M(x,y)表示M中(x,y)位置的像素标量值,B(x,y)表示B中(x,y)位置的像素值,O(x,y)表示O中(x,y)位置的像素值,可以按照如下的规则生成待处理图像的三通道结果图像:
O(x,y)=M(x,y)/255*I(x,y)+(1-M(x,y)/255)*B(x,y)。
并且,上述的步骤S103和步骤S203之后,还可以对生成的待处理图像的掩码图像中前景部分的区域采用导向滤波(guided filter),以进一步提升对待处理图像的掩码图像中的细节的处理效果。
通过grabcut原始算法简化的grabcut算法进行图像处理,优化了处理的时间复杂度,但是对于图像细节的处理精度降低,本发明实施例通过步骤S103进行进一步的处理,生成待处理图像的掩码图像,使得在优化时间复杂度的情况下提高了对细节的处理精度,得到的掩码图像更加精准。并且,采用导向滤波还可以再进一步提升对待处理图像的掩码图像中的细节的处理效果。
下面以人像处理为例,介绍本发明实施例的图像处理方法。本发明实施例的图像处理方法不仅限于人像处理,可以适用于对各种对象(包括人像或其他对象)的图像处理。
将原始图像(即待处理图像)输入深度学习模型,该深度学习模型为一个基于深度神经网络的人体轮廓检测模型(可简称深度神经网络模型),通过该模型可以对原始图像进行前景预测,模型的输出为人像轮廓掩码图,即第一掩码图,记作M1。
在使用该模型预测得到M1之前,需要对模型进行训练。主要是准备人像的标注数据,实现深度神经网络模型,用标注数据对深度神经网络模型的参数进行训练,以得到深度神经网络模型的参数。对模型训练完毕之后,可以对任何输入的人像图像预测出人像轮廓掩码图。本实施例的深度学习模型预测得到的人像轮廓掩码图如图3所示。由图3可以看出,通过该模型预测出的人像轮廓掩码图在头发等区域不够细致,在身体等绝对前景区域(绝对前景区域是指真实的前景区域)会有误判。
将原始图像和模型预测出的人像轮廓掩码图,通过grabcut算法进行迭代估计,得到边界比预测出的人像轮廓掩码图更为精确的另一个人像轮廓掩码图,即第二掩码图,记作M2。
grabcut算法实际分为两个步骤,第一步为基于混合高斯模型的硬分割,得到一个硬边界,这一步的结果在边界特别是头发区域效果较差;第二步为边界抠图,grabcut原始算法是基于能量函数最小化的动态规划算法,其时间复杂度较高,因而实际使用的grabcut算法需要在原始算法基础上做出一定的简化。由于grabcut等图像分割算法中初始掩码设置对算法输出的最终结果至关重要,现有的图像处理方案由用户手动标出初始化区域,如果用户标记错误,通过grabcut算法就会输出较差的结果,因此,本发明实施例采用深度神经网络来初始化grabcut算法的初始掩码设置,将模型预测出的人像轮廓掩码图作为grabcut算法的初始化参数传入,提高了初始标记的准确度,这样,既可以保证算法输出的准确度,并且保证grabcut算法的稳定性,而且无需用户手动标记,从而省去用户的交互步骤。
本发明实施例与现有技术通过grabcut算法处理得到的人像轮廓掩码图的对照示意图如图4所示。图4中,左侧为本发明实施例通过grabcut算法处理得到的人像轮廓掩码图的示意图,右侧为现有技术通过grabcut算法处理得到的人像轮廓掩码图的示意图。
如图4所示,本发明实施例通过grabcut算法处理得到的人像轮廓掩码图具有比图3的人像轮廓掩码图更为精确的一条人像轮廓的硬边界。构成该硬边界的像素集合HardBorderSet具有如下特点:该集合中像素的定义为本身是绝对前景像素(即人像部分),但其邻域像素中至少有一个是背景像素。可以通过如下方式筛选出属于像素集合HardBorderSet中的点:计算原始彩色图上所有点与第二掩码图硬边界的最小距离,如果最小距离超过一定门限(具体门限值可以自定义),则可认为该点距离硬边界很远,可设定其距离为无穷大,这样,对于原始彩色图上所有的点,都计算得到距离硬边界最近的点以及相应的最小距离值,这些点即像素集合HardBorderSet中的点,这些点构成的边界线可称为前景边界,本发明实施例通过grabcut算法处理得到的人像轮廓掩码图的前景边界示意图如图5所示,图5中这条白色的边界线即人像轮廓掩码图M2的前景边界,即像素集合HardBorderSet构成的边界线。
通过图4可以看出,通过grabcut算法处理得到的人像轮廓掩码图如果直接用于图像处理的结果,细节仍不够好,也会有分割错误的区域,因此还需要对该人像轮廓掩码图作进一步的处理。
沿着人像轮廓掩码图M2的前景边界(即图5中白色边界线)内外,可以选出一定宽度的unknown(未知)区域(未知区域即上文的选定区域),该unknown区域为背景和前景交错的区域。前景区域的值为255,背景为0,unknown区域的值位于0到255之间。通过grabcut算法处理得到的人像轮廓掩码图中未知区域的示意图如图6所示。图6中灰色部分对应的区域即为未知区域。
例如,可以通过如下方式筛选出属于unknown区域的点:预先定义距离阈值d1(第一距离阈值)和d2(第二距离阈值),将前景像素中距离图5中的前景边界小于d1的,和背景像素中距离图5中的前景边界小于d2的点划定为unknown区域。在后续步骤中将重点恢复上述Unknown区域内的灰度像素,目的是得到更为自然的人像边界过度区域,特别是针对头发等需要非常细致分割的区域可以得到较好的效果。
沿着人像轮廓掩码图M2的前景边界(即图5中白色边界线)内外,还可以分别确定一前景采样边界和一背景采样边界,其中,前景采样边界是前景采样点的集合,记作F_SampleSet;背景采样边界是背景采样点的集合,记作B_SampleSet。前景采样点是位于绝对前景区域(即人像区域)的采样点,背景采样点是位于背景区域(即非人像区域)的采样点。通过grabcut算法处理得到的人像轮廓掩码图中前景采样边界和背景采样边界的示意图如图7所示。图7中包括三条线:位于中间的白色的线为图5中的前景边界,位于前景边界内外的两条灰色的线中,位于最内侧的灰色线为前景采样边界,位于最外侧的灰色线为背景采样边界。
可以通过如下方式确定筛选出F_SampleSet和B_SampleSet中的点:预先定义的前景点采样边界距离d3(即第三距离阈值)和背景点采样边界距离d4(即第四距离阈值),将前景像素中距离图5中的前景边界等于d3的采样点作为F_SampleSet中的点,将背景像素中距离图5中的前景边界等于d4的采样点作为B_SampleSet中的点,其中,F_SampleSet和B_SampleSet中的点应位于unknown区域之外,因此,在设置d3和d4的值时,应使得d4大于d2,且d3大于d1,以使得F_SampleSet和B_SampleSet在unknown区域之外。筛选出的F_SampleSet代表了前景像素的所有信息,B_SampleSet反应了背景像素的所有信息。
遍历背景采样边界(背景采样点的集合)B_SampleSet中的所有点,统计每个点的平均像素值,每个背景采样点的平均像素值即该背景采样点的颜色期望值,其反映了该背景采样点的颜色期望,该值具体可以根据该背景采样点的邻域内所有像素值求平均而得到。背景采样点的邻域可以通过如下方式确定一个N领域:以该背景采样点为中心,确定正方形边长N的像素区域,例如N=5,则该像素区域中有25个像素(点),其中中心为该背景采样点,除中心之外其他24个点都是该背景采样点的邻域像素。该确定领域的方式不构成对本发明的限定,也可以根据需要设置其他的定义邻域的规则。
遍历前景采样边界(前景采样点的集合)F_SampleSet中的各点,对于F_SampleSet中每个前景采样点,以下以某个前景采样点Y为例进行说明。
首先找到与该前景采样点Y距离最近的背景采样边界B_SampleSet中的某个点(记作背景采样点X),并获取背景采样点X的背景色(即颜色期望值)作为该前景采样点Y对应的默认背景色(或称默认背景颜色向量)bgcolor。
针对该前景采样点(例如Y),用其像素值(即Y的颜色向量)减去Y对应的默认背景色bgcolor,得到差值fgcolor,fgcolor反映了前景采样点Y和其空间距离最近的背景采样点在颜色上的区别。
对于前景采样点Y的邻域像素集合内的每一邻域像素(邻域像素即邻域中的一个像素),采用上述相同方式计算出该邻域像素的像素值(即颜色向量)与该邻域像素对应的默认背景颜色向量的差值,得到该邻域像素对应的颜色差向量。其中,该邻域像素对应的默认背景颜色向量是与该邻域像素空间距离最近的背景采样点的颜色期望值。
前景采样点的邻域可以通过如下方式确定一个N领域:以该前景采样点为中心,确定正方形边长N的像素区域,例如N=5,则该像素区域中有25个像素(点),其中中心为该前景采样点,除中心之外其他24个点都是该前景采样点的邻域像素。该确定领域的方式不构成对本发明的限定,也可以根据需要设置其他的定义邻域的规则。
前景采样点Y计算得到的差值fgcolor和各邻域像素对应的颜色差向量均为三通道的颜色差向量,称之为三通道差数据。对前景采样点Y的邻域像素集合内计算得到的所有三通道差数据,在三维空间内进行k-mean聚类分析,得到前景采样点Y的邻域像素的K个分类。计算其中每一分类内的邻域像素的颜色统计信息,第k(k可以为1至K之间的任一整数值)个分类内邻域像素的颜色统计信息可以包括该分类内邻域像素对应的颜色差向量的平均值向量mean(k)=(r_k,g_k,b_k),以及该均值向量的p2范数(即p-范数,p=2)||mean(k)||。其中,r_k、g_k、b_k分别表示第k个分类内邻域像素在RGB三个通道的平均值。该均值向量的p2范数||mean(k)||的计算公式为:
||mean(k)||=(|(r_k)|2+|(g_k)|2+|(b_k)|2)1/2
针对前景采样边界F_SampleSet中的每一个点,均按照上述过程统计出它的邻域像素中可能出现的K种不同的颜色情况,最后得到相应的mean(k)和||mean(k)||。
遍历unknown区域内部的每一个点(即像素),以下以像素W为例进行说明。
从原始图像获取像素W的三通道像素向量(即像素W的颜色向量)为icolor,首先找到与之空间距离最近的前景采样点(即该像素W的最近前景采样点),记作pf。上述在遍历前景采样边界(前景采样点的集合)F_SampleSet中的各点的过程中,已经计算出每个前景采样点对应的默认背景色bgcolor和差值fgcolor,那么,获取前景采样点pf的默认背景色(或称默认背景颜色向量)bgcolor和差值fgcolor,像素W的最近前景采样点pf对应的差值fgcolor,即第一颜色差向量。
从上述计算出的前景采样点pf的邻域像素的K个分类中,各分类内邻域像素的颜色统计信息,包括mean(k)和||mean(k)||,主要是找到与像素W颜色上最接近的那个分类k,并读取上述计算出的与该k对应的||mean(k)||,可认为该点可能属于该前景采样点pf的邻域像素的K分类中的第k个分类。其中,根据前景采样点pf的邻域像素各分类内,邻域像素对应的颜色差向量的均值向量mean(k)与像素W的颜色向量icolor的欧式距离,确定与像素W的颜色向量最接近的分类,即与像素W颜色上最接近的分类k。与像素W颜色上最接近的分类k对应的||mean(k)||可作为像素W对应的颜色统计信息。
将像素W的颜色向量与最近前景采样点pf对应的默认背景颜色向量bgcolor相减,得到第二颜色差向量(icolor-bgcolor)。
通过上述方法得到unknown区域内部的每一个点(即像素)对应的fgcolor(第一颜色差向量)、icolor-bgcolor(第二颜色差向量)以及||mean(k)||(该像素对应的颜色统计信息),重新计算人像轮廓掩码图M2中unknown区域内每个像素(位置记作(x,y))的标量值(像素标量值)M(x,y)(即修正后的像素标量值)。
像素(x,y)的M(x,y)计算方法为:
dot_product(fgcolor,icolor-bgcolor)/||mean(k)||。dot_product表示向量点积。
对人像轮廓掩码图M2中unknown区域的像素标量值进行修正之后,得到原始彩色图像的处理后的掩码图像,记作M。对原始彩色图像处理后的掩码图像M的示意图如图8所示。
在掩码图像M的基础上,还可以对头发等细节区域采用导向滤波guided filter进一步提升掩码图像M在头发部分的细节。通过导向滤波进一步处理的原始彩色图像的掩码图像的示意图如图9所示。
利用掩码图像M或采用导向滤波进一步提升掩码图像M的细节后得到的图像,可以对原始图像进行背景替换或者前景背景的分割,得到三通道结果图像。
本发明实施例的图像处理方法应用范围不受背景的干净程度的限制,对于背景干净程度较低,例如背景明显纹理明显的图像也可以进行处理。
图10根据本发明实施例的图像处理装置的主要模块示意图。
如图10所示,本发明实施例的图像处理装置1000包括:前景预测模块1001、第一处理模块1002、第二处理模块1003。
前景预测模块1001,用于对待处理图像进行前景预测,得到第一掩码图。
前景预测模块1001具体可以用于:通过深度学习模型对待处理图像进行前景预测,以得到第一掩码图。
第一处理模块1002,用于利用图像分割算法对第一掩码图进行处理,得到第二掩码图。
第二处理模块1003,用于对第二掩码图中选定区域的像素标量值进行修正,以生成待处理图像的掩码图像。
图像处理装置1000还可以包括选定区域生成模块,用于:
在第二掩码图中,将前景像素与前景边界的距离与第一距离阈值比较,以及将背景像素与所述前景边界的距离与第二距离阈值比较,以筛选出属于前景和背景交错区域的像素;将筛选出的像素所属的区域划分为选定区域。
图像处理装置1000还可以包括默认背景颜色确定模块,用于:在第二掩码图中,根据第三距离阈值和第四距离阈值,分别从除选定区域之外的前景像素所属区域中筛选出前景采样点的集合,以及从除选定区域之外的背景像素所属区域中筛选出背景采样点的集合;根据每个背景采样点的邻域像素的平均像素值,得到该背景采样点的颜色期望值;将与前景采样点距离最近的背景采样点的颜色期望值,作为该前景采样点对应的默认背景颜色向量。
第二处理模块1003具体可以用于:对于选定区域内的每一个像素,
根据该像素的最近前景采样点的邻域像素的颜色统计信息,得到该像素对应的颜色统计信息;根据该最近前景采样点的颜色向量与该最近前景采样点对应的默认背景颜色向量,得到第一颜色差向量;根据该像素的颜色向量与该最近前景采样点对应的默认背景颜色向量,得到第二颜色差向量;根据该像素对应的颜色统计信息、第一颜色差向量、第二颜色差向量,对该像素的标量值进行修正。
第二处理模块1003可以包括运算和确定子模块,用于:对该像素的最近前景采样点的每一邻域像素,根据该邻域像素的颜色向量与该邻域像素的最近背景采样点的颜色期望值,得到该邻域像素对应的颜色差向量;对该像素的最近前景采样点的所有邻域像素对应的颜色差向量进行聚类分析,得到该像素的最近前景采样点的邻域像素的分类;根据各邻域像素对应的颜色差向量,计算每一分类内邻域像素的的颜色统计信息;根据与该像素的颜色向量最接近的分类内邻域像素的颜色统计信息,得到该像素对应的颜色统计信息。
某一分类内邻域像素的颜色统计信息可以包括:该分类内邻域像素对应的颜色差向量的均值向量,以及该均值向量的范数。
运算和确定子模块可以包括像素颜色统计信息确定单元,用于:根据该像素的最近前景采样点的邻域像素各分类内,邻域像素对应的颜色差向量的均值向量与该像素的颜色向量的欧式距离,确定与该像素的颜色向量最接近的分类;将与该像素的颜色向量最接近的分类内,邻域像素对应的颜色差向量的均值向量的范数,作为该像素对应的颜色统计信息。
图像处理装置1000还可以包括导向滤波模块,用于对生成的待处理图像的掩码图像中前景部分的区域采用导向滤波(guided filter),以进一步提升对待处理图像的掩码图像中的细节的处理效果。
在另一实施例中,图像处理装置1000还可以包括第三处理模块,用于:根据待处理图像、待处理图像的掩码图像以及预设的三通道背景图像,按照预设规则生成待处理图像的三通道结果图像。
另外,在本发明实施例中所述图像处理装置的具体实施内容,在上面所述图像处理方法中已经详细说明了,故在此重复内容不再说明。
图11示出了可以应用本发明实施例的图像处理方法或图像处理装置的示例性系统架构1100。
如图11所示,系统架构1100可以包括终端设备1101、1102、1103,网络1104和服务器1105。网络1104用以在终端设备1101、1102、1103和服务器1105之间提供通信链路的介质。网络1104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备1101、1102、1103通过网络1104与服务器1105交互,以接收或发送消息等。终端设备1101、1102、1103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备1101、1102、1103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器1105可以是提供各种服务的服务器,例如对用户利用终端设备1101、1102、1103所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的图像处理方法一般由服务器1105执行,相应地,图像处理装置一般设置于服务器1105中。
应该理解,图11中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图12,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统1200的结构示意图。图12示出的终端设备或服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图12所示,计算机系统1200包括中央处理单元(CPU)1201,其可以根据存储在只读存储器(ROM)1202中的程序或者从存储部分1208加载到随机访问存储器(RAM)1203中的程序而执行各种适当的动作和处理。在RAM 1203中,还存储有系统1200操作所需的各种程序和数据。CPU 1201、ROM 1202以及RAM 1203通过总线1204彼此相连。输入/输出(I/O)接口1205也连接至总线1204。
以下部件连接至I/O接口1205:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至I/O接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入存储部分1208。
特别地,根据本发明公开的实施例,上文参考主要步骤示意图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行主要步骤示意图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。在该计算机程序被中央处理单元(CPU)1201执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的主要步骤示意图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,主要步骤示意图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或主要步骤示意图中的每个方框、以及框图或主要步骤示意图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括前景预测模块、第一处理模块、第二处理模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,前景预测模块还可以被描述为“用于对待处理图像进行前景预测,得到第一掩码图的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:对待处理图像进行前景预测,得到第一掩码图;利用图像分割算法对所述第一掩码图进行处理,得到第二掩码图;对所述第二掩码图中选定区域的像素标量值进行修正,以生成所述待处理图像的掩码图像。
根据本发明实施例的技术方案,对待处理图像进行前景预测,得到第一掩码图;利用图像分割算法对第一掩码图进行处理,得到第二掩码图;对第二掩码图中选定区域的像素标量值进行修正,以生成待处理图像的掩码图像,能够在优化时间复杂度的情况下提高对细节的处理精度,通过深度学习模型对待处理图像进行前景预测,可以提高初始区域标记的准确度,进而提高图像分割的准确度,本发明方案对于各种干净程度的背景下的图像处理均可以适用。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (16)
1.一种图像处理方法,其特征在于,包括:
对待处理图像进行前景预测,得到第一掩码图;
利用图像分割算法对所述第一掩码图进行处理,得到第二掩码图;
对所述第二掩码图中选定区域的像素标量值进行修正,以生成所述待处理图像的掩码图像;
所述第二掩码图的前景边界上的像素具有如下特点:像素本身是绝对前景像素,但其邻域像素中至少有一个是背景像素;
对所述第二掩码图中选定区域的像素标量值进行修正的步骤,包括:对于所述选定区域内的每一个像素,根据该像素的最近前景采样点的邻域像素的颜色统计信息,得到该像素对应的颜色统计信息;根据所述最近前景采样点的颜色向量与所述最近前景采样点对应的默认背景颜色向量,得到第一颜色差向量;根据该像素的颜色向量与所述最近前景采样点对应的默认背景颜色向量,得到第二颜色差向量;根据该像素对应的颜色统计信息、所述第一颜色差向量、所述第二颜色差向量,对该像素的标量值进行修正。
2.根据权利要求1所述的方法,其特征在于,通过深度学习模型对所述待处理图像进行前景预测,以得到所述第一掩码图。
3.根据权利要求1所述的方法,其特征在于,对所述第二掩码图中选定区域的像素标量值进行修正的步骤之前,包括:
在所述第二掩码图中,将前景像素与前景边界的距离与第一距离阈值比较,以及将背景像素与所述前景边界的距离与第二距离阈值比较,以筛选出属于前景和背景交错区域的像素;
将筛选出的像素所属的区域划分为所述选定区域。
4.根据权利要求1所述的方法,其特征在于,根据该像素的最近前景采样点的邻域像素的颜色统计信息,得到该像素对应的颜色统计信息的步骤,包括:
对该像素的最近前景采样点的每一邻域像素,根据该邻域像素的颜色向量与该邻域像素的最近背景采样点的颜色期望值,得到该邻域像素对应的颜色差向量;
对该像素的最近前景采样点的所有邻域像素对应的颜色差向量进行聚类分析,得到该像素的最近前景采样点的邻域像素的分类;
根据各邻域像素对应的颜色差向量,计算每一分类内邻域像素的颜色统计信息;
根据与该像素的颜色向量最接近的分类内邻域像素的颜色统计信息,得到该像素对应的颜色统计信息。
5.根据权利要求4所述的方法,其特征在于,一分类内邻域像素的颜色统计信息包括:该分类内邻域像素对应的颜色差向量的均值向量,以及所述均值向量的范数,
根据与该像素的颜色向量最接近的分类内邻域像素的颜色统计信息,得到该像素对应的颜色统计信息的步骤,包括:
根据该像素的最近前景采样点的邻域像素各分类内,邻域像素对应的颜色差向量的均值向量与该像素的颜色向量的欧式距离,确定与该像素的颜色向量最接近的分类;
将与该像素的颜色向量最接近的分类内,邻域像素对应的颜色差向量的均值向量的范数,作为该像素对应的颜色统计信息。
6.根据权利要求4所述的方法,其特征在于,对所述第二掩码图中选定区域的像素标量值进行修正的步骤之前,包括:
在所述第二掩码图中,分别从除所述选定区域之外的前景像素所属区域中筛选出前景采样点的集合,以及从除所述选定区域之外的背景像素所属区域中筛选出背景采样点的集合;
根据每个所述背景采样点的邻域像素的平均像素值,得到所述背景采样点的颜色期望值;
将与所述前景采样点距离最近的背景采样点的颜色期望值,作为所述前景采样点对应的默认背景颜色向量。
7.根据权利要求1所述的方法,其特征在于,对所述第二掩码图中选定区域的像素标量值进行修正,以生成所述待处理图像的掩码图像的步骤之后,包括:
根据所述待处理图像、所述待处理图像的掩码图像以及预设的三通道背景图像,按照预设规则生成所述待处理图像的三通道结果图像。
8.一种图像处理装置,其特征在于,包括:
前景预测模块,用于对待处理图像进行前景预测,得到第一掩码图;
第一处理模块,用于利用图像分割算法对所述第一掩码图进行处理,得到第二掩码图;
第二处理模块,用于对所述第二掩码图中选定区域的像素标量值进行修正,以生成所述待处理图像的掩码图像;
第二掩码图的前景边界上的像素具有如下特点:像素本身是绝对前景像素,但其邻域像素中至少有一个是背景像素;
所述第二处理模块还用于:对于所述选定区域内的每一个像素,根据该像素的最近前景采样点的邻域像素的颜色统计信息,得到该像素对应的颜色统计信息;根据所述最近前景采样点的颜色向量与所述最近前景采样点对应的默认背景颜色向量,得到第一颜色差向量;根据该像素的颜色向量与所述最近前景采样点对应的默认背景颜色向量,得到第二颜色差向量;根据该像素对应的颜色统计信息、所述第一颜色差向量、所述第二颜色差向量,对该像素的标量值进行修正。
9.根据权利要求8所述的装置,其特征在于,所述前景预测模块还用于:
通过深度学习模型对所述待处理图像进行前景预测,以得到所述第一掩码图。
10.根据权利要求8所述的装置,其特征在于,还包括选定区域生成模块,用于:
在所述第二掩码图中,将前景像素与前景边界的距离与第一距离阈值比较,以及将背景像素与所述前景边界的距离与第二距离阈值比较,以筛选出属于前景和背景交错区域的像素;
将筛选出的像素所属的区域划分为所述选定区域。
11.根据权利要求8所述的装置,其特征在于,所述第二处理模块包括运算和确定子模块,用于:
对该像素的最近前景采样点的每一邻域像素,根据该邻域像素的颜色向量与该邻域像素的最近背景采样点的颜色期望值,得到该邻域像素对应的颜色差向量;
对该像素的最近前景采样点的所有邻域像素对应的颜色差向量进行聚类分析,得到该像素的最近前景采样点的邻域像素的分类;
根据各邻域像素对应的颜色差向量,计算每一分类内邻域像素的颜色统计信息;
根据与该像素的颜色向量最接近的分类内邻域像素的颜色统计信息,得到该像素对应的颜色统计信息。
12.根据权利要求11所述的装置,其特征在于,一分类内邻域像素的颜色统计信息包括:该分类内邻域像素对应的颜色差向量的均值向量,以及所述均值向量的范数,
所述运算和确定子模块包括像素颜色统计信息确定单元,用于:
根据该像素的最近前景采样点的邻域像素各分类内,邻域像素对应的颜色差向量的均值向量与该像素的颜色向量的欧式距离,确定与该像素的颜色向量最接近的分类;
将与该像素的颜色向量最接近的分类内,邻域像素对应的颜色差向量的均值向量的范数,作为该像素对应的颜色统计信息。
13.根据权利要求11所述的装置,其特征在于,还包括默认背景颜色确定模块,用于:
在所述第二掩码图中,分别从除所述选定区域之外的前景像素所属区域中筛选出前景采样点的集合,以及从除所述选定区域之外的背景像素所属区域中筛选出背景采样点的集合;
根据每个所述背景采样点的邻域像素的平均像素值,得到所述背景采样点的颜色期望值;
将与所述前景采样点距离最近的背景采样点的颜色期望值,作为所述前景采样点对应的默认背景颜色向量。
14.根据权利要求8所述的装置,其特征在于,还包括第三处理模块,用于:
根据所述待处理图像、所述待处理图像的掩码图像以及预设的三通道背景图像,按照预设规则生成所述待处理图像的三通道结果图像。
15.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
16.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811339830.1A CN111179276B (zh) | 2018-11-12 | 2018-11-12 | 一种图像处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811339830.1A CN111179276B (zh) | 2018-11-12 | 2018-11-12 | 一种图像处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111179276A CN111179276A (zh) | 2020-05-19 |
CN111179276B true CN111179276B (zh) | 2024-02-06 |
Family
ID=70655531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811339830.1A Active CN111179276B (zh) | 2018-11-12 | 2018-11-12 | 一种图像处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111179276B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112330709A (zh) * | 2020-10-29 | 2021-02-05 | 奥比中光科技集团股份有限公司 | 一种前景图像提取方法、装置、可读存储介质及终端设备 |
US11636796B2 (en) * | 2020-12-03 | 2023-04-25 | Black Sesame Technologies Inc. | Subject segmentation for motion control and textured display |
CN112861661B (zh) * | 2021-01-22 | 2022-11-08 | 深圳市慧鲤科技有限公司 | 图像处理方法及装置、电子设备及计算机可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101510304A (zh) * | 2009-03-30 | 2009-08-19 | 北京中星微电子有限公司 | 一种分割获取前景图像的方法、装置和摄像头 |
CN103218600A (zh) * | 2013-03-29 | 2013-07-24 | 四川长虹电器股份有限公司 | 一种实时人脸检测算法 |
CN106204567A (zh) * | 2016-07-05 | 2016-12-07 | 华南理工大学 | 一种自然背景视频抠图方法 |
CN106570838A (zh) * | 2016-10-28 | 2017-04-19 | 成都西纬科技有限公司 | 一种图像亮度优化方法及装置 |
JP2018124890A (ja) * | 2017-02-03 | 2018-08-09 | 日本電信電話株式会社 | 画像処理装置、画像処理方法及び画像処理プログラム |
CN108694719A (zh) * | 2017-04-05 | 2018-10-23 | 北京京东尚科信息技术有限公司 | 图像输出方法和装置 |
-
2018
- 2018-11-12 CN CN201811339830.1A patent/CN111179276B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101510304A (zh) * | 2009-03-30 | 2009-08-19 | 北京中星微电子有限公司 | 一种分割获取前景图像的方法、装置和摄像头 |
CN103218600A (zh) * | 2013-03-29 | 2013-07-24 | 四川长虹电器股份有限公司 | 一种实时人脸检测算法 |
CN106204567A (zh) * | 2016-07-05 | 2016-12-07 | 华南理工大学 | 一种自然背景视频抠图方法 |
CN106570838A (zh) * | 2016-10-28 | 2017-04-19 | 成都西纬科技有限公司 | 一种图像亮度优化方法及装置 |
JP2018124890A (ja) * | 2017-02-03 | 2018-08-09 | 日本電信電話株式会社 | 画像処理装置、画像処理方法及び画像処理プログラム |
CN108694719A (zh) * | 2017-04-05 | 2018-10-23 | 北京京东尚科信息技术有限公司 | 图像输出方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111179276A (zh) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110188760B (zh) | 一种图像处理模型训练方法、图像处理方法及电子设备 | |
CN109325954B (zh) | 图像分割方法、装置及电子设备 | |
JP5045619B2 (ja) | 画像処理装置および方法、並びにプログラム | |
CN111179276B (zh) | 一种图像处理方法和装置 | |
CN107679466B (zh) | 信息输出方法和装置 | |
KR102075088B1 (ko) | 객체 추출 장치 및 방법 | |
US9053540B2 (en) | Stereo matching by census transform and support weight cost aggregation | |
WO2020253127A1 (zh) | 脸部特征提取模型训练方法、脸部特征提取方法、装置、设备及存储介质 | |
CN108182421A (zh) | 视频分割方法和装置 | |
WO2020052270A1 (zh) | 一种视频审核的方法、装置和设备 | |
CN108694719B (zh) | 图像输出方法和装置 | |
CN107871321B (zh) | 图像分割方法及装置 | |
CN114677565B (zh) | 特征提取网络的训练方法和图像处理方法、装置 | |
CN114511041B (zh) | 模型训练方法、图像处理方法、装置、设备和存储介质 | |
CN110147816B (zh) | 一种彩色深度图像的获取方法、设备、计算机存储介质 | |
WO2021175040A1 (zh) | 视频处理方法及相关装置 | |
CN114092576A (zh) | 图像处理方法、装置、设备和存储介质 | |
CN112581355A (zh) | 图像处理方法、装置、电子设备和计算机可读介质 | |
Zhu et al. | Fast superpixel segmentation by iterative edge refinement | |
CN111260596A (zh) | 一种具有抗噪的快速图像超像素自动生成方法,设备以及可读存储介质 | |
CN112967191B (zh) | 图像处理方法、装置、电子设备和存储介质 | |
CN111382760B (zh) | 图片类别的识别方法、装置及计算机可读存储介质 | |
CN110310341B (zh) | 颜色算法中默认参数的生成方法、装置、设备和存储介质 | |
US20140355959A1 (en) | Multi-frame patch correspondence identification in video | |
CN109598206B (zh) | 动态手势识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |