CN114078139A - 基于人像分割模型生成结果的图像后处理方法 - Google Patents

基于人像分割模型生成结果的图像后处理方法 Download PDF

Info

Publication number
CN114078139A
CN114078139A CN202111415157.7A CN202111415157A CN114078139A CN 114078139 A CN114078139 A CN 114078139A CN 202111415157 A CN202111415157 A CN 202111415157A CN 114078139 A CN114078139 A CN 114078139A
Authority
CN
China
Prior art keywords
area
measurement
test
point
foreground
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111415157.7A
Other languages
English (en)
Other versions
CN114078139B (zh
Inventor
李家乾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Changhong Electric Co Ltd
Original Assignee
Sichuan Changhong Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Changhong Electric Co Ltd filed Critical Sichuan Changhong Electric Co Ltd
Priority to CN202111415157.7A priority Critical patent/CN114078139B/zh
Publication of CN114078139A publication Critical patent/CN114078139A/zh
Application granted granted Critical
Publication of CN114078139B publication Critical patent/CN114078139B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于人像分割模型生成结果的图像后处理方法,将原始图片压缩后输入人像分割模型,根据人像分割模型生成结果将图片划分为背景区、待确定区和前景区;对待确定区采用颜色梯度分析,确定待确定区每一个像素属于前景区还是背景区;将图片放大至与原始图片大小匹配,再进行二值化与滤波,得到处理后的图片数据。本发明采用图像后处理技术,解决小模型处理结果精度不佳及放大存在锯齿感的问题,使得硬件性能不够强的设备通过小模型加模型后处理得到的结果达到与硬件性能较强的设备运行的较复杂的模型得到的结果在表现上相仿的程度,降低人像抠图对硬件的要求。

Description

基于人像分割模型生成结果的图像后处理方法
技术领域
本发明涉及图像处理技术领域,具体的说,是一种基于人像分割模型生成结果的图像后处理方法。
背景技术
抠图是指准确提取静止图片或者视频图片序列中的前景目标,它是许多图像编辑中的关键技术之一。抠图问题也可以被定义为每一个图片像素估计alpha值(前背景色比例)的任务。在该任务中,输入为原图像,输出将是每个像素点的alpha值。目前抠图问题往往通过深度学习模型直接得到结果即每一个图片像素的alpha值,模型复杂度决定着抠图结果的好坏,通常较好的抠图结果往往需要较复杂的模型。然而要达到实时抠图的话,模型越复杂对设备的计算能力要求就越高,往往在有限的计算能力的情况下无法部署足够复杂的模型。而如果部署较为简单的模型,虽能满足实时处理的需求,得到的人像抠图结果只能得到一个准确度较低,且输出放大后会有锯齿感的模型。还有,深度学习模型对输入数据与输出数据的大小有要求,如果输入输出数据的太大,那么模型运行时间会变长,而如果输入输出数据的大小,虽然模型运行时间会缩短,但是匹配到原图像之后会存在锯齿感,影响精度。
发明内容
本发明的目的在于提供一种基于人像分割模型生成结果的图像后处理方法,用于解决现有技术中深度学习模型处理人像抠图问题存在处理时间与模型精度的矛盾的问题,以及解决现有技术中输入输出数据大小影响模型运行时间或者导致精度降低的问题。
本发明通过下述技术方案解决上述问题:
一种基于人像分割模型生成结果的图像后处理方法,包括:
步骤S100、将原始图片压缩后输入人像分割模型,根据人像分割模型生成结果将图片划分为背景区、待确定区和前景区;
步骤S200、对待确定区采用颜色梯度分析,确定待确定区每一个像素属于前景区还是背景区;
步骤S300、将图片放大至与原始图片大小匹配,再进行二值化与滤波,得到处理后的图片数据。
对待确定区采用颜色梯度分析,确定待确定区每一个像素属于前景区还是背景区的方法为:遍历待确定区的每个点,执行以下步骤:
步骤S210、以选中的点I(x,y)为原点,生成检测框,检测框的左下角坐标(x-5,y-5)与右上角(x+5,y+5);
步骤S220、统计检测框内所有点的r,g,b的平均值得到r测,g测,b测;
步骤S230、以点I(x,y)做十字线,找到十字线与确定区域最近的两个交点,确定区域为前景区和背景区,判断这两个交点:
若这两个交点均在前景区,则点I(x,y)在前景区,结束;
若这两个交点均在背景区,则点I(x,y)在背景区,结束;
若一个交点在前景区即前景交点,一个交点在背景区即背景交点,则分别以前景交点、背景交点为原点,生成与步骤S210中同样大小的两个检测框,分别计算两个检测框内所有点的r,g,b的平均值,得到r前,g前,b前和r背,g背,b背;比较[(r前-r测)^2+(g前-g测)^2+(b前-b测)^2]与[(r背-r测)^2+(g背-g测)^2+(b背-b测)^2],若[(r前-r测)^2+(g前-g测)^2+(b前-b测)^2]小于[(r背-r测)^2+(g背-g测)^2+(b背-b测)^2],则点I(x,y)在前景区,若[(r前-r测)^2+(g前-g测)^2+(b前-b测)^2]大于[(r背-r测)^2+(g背-g测)^2+(b背-b测)^2],则点I(x,y)在背景区;根据[(r前-r测)^2+(g前-g测)^2+(b前-b测)^2]、[(r背-r测)^2+(g背-g测)^2+(b背-b测)^2]的计算结果对点I(x,y)在人像分割模型的生成结果进行加权,结束。
出于准确性的考量,我们用结合颜色梯度分析结果对模型生成结果进行加权,既对颜色梯度分析结果中得到为背景结果的在模型生成结果中进行减小操作使其趋近0,而对颜色梯度分析结果中得到为前景结果的在模型生成结果中进行加大操作使其趋近1。这一步的操作有助于结果更趋向0与1,从而减小二分划后的误差。
所述步骤S300具体包括:
将人像分割模型的生成结果更新为(255-255*生成结果),得到alpha的值,采用插值方法INTER_CUBIC将图片放大至与原始图片大小匹配,再进行二值化和高频滤波,得到图片压缩前的图片数据。
如果需要放大操作,则需要把放大操作放在二值化操作之前。原因是如果二值化后再放大会损失更多的边缘细节,会导致结果锯齿感非常明显。而关于放大操作是因为,为了保证模型速度,模型的输入输出的大小通常都会进行压缩,需要对生成结果进行放大从而匹配原始图片。二值化操作则可根据情况,在0~1之间任取一值α,而α越趋近于1,前景缺少的可能性会增大,但背景混入前景的可能性减小,α越趋近于0,前景缺少的可能性会减小,但背景混入前景的可能性增大。因此α的取值需根据模型及场景进行调整,才可找到最合适的值。二值化后,再将生成结果转换为(255-255*生成结果),得到的结果即为该像素对应的透明度alpha。
最后将上一步的透明度进行高频滤波,因此边缘锯齿说到底也就是一个高频信号,对高频信号进行滤波即可减少锯齿感的影响。滤波器的大小可以根据时间要求,图片大小以及效果进行自主调节。
本发明与现有技术相比,具有以下优点及有益效果:
(1)本发明采用图像后处理技术,解决小模型处理结果精度不佳及放大存在锯齿感的问题,使得在硬件性能不够强的设备通过小模型以及模型后处理得到的结果,与在硬件性能较强的设备运行的较复杂的模型得到的结果效果相同或接近,降低人像抠图对硬件的要求。
(2)本发明保留了小模型的速度优势,同时运用了相关的图像后处理技术使其精度得到进一步提升,以及放大后消除了抠图锯齿感的影响。
(3)本发明采用传统图像处理方法来取代增加深度学习模型复杂度的情况,和现有技术相比,可以在低性能机器上对低精度结果进行处理,使其放大后锯齿感减少以及精度提升。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合实施例对本发明作进一步地详细说明,但本发明的实施方式不限于此。
实施例:
结合附图1所示,一种基于人像分割模型生成结果的图像后处理方法,包括步骤:
首先确认单帧图像为1280*720*3的图片,由于人像分割模型输入输出分别为224*224*3与224*224*1。因此,需要对原始图片进行压缩至224*224*3,再对224*224*3进行三分图划分即将224*224*3输入人像分割模型,生成结果为224*224*1的像素数组,数值范围为0~1,在三分图中对应的224*224*1中进行颜色梯度分析,再将颜色分析加权的结果放大到1280*720,接着二值化,最后高频滤波得到匹配1280*720*3的结果图。
在三分图划分中为减少时间消耗,可将0.5及以下均设为背景,0.5~0.7设的待确定区,0.7及以上设为前景。操作方法为遍历224*224的结果(即数组中224*224个0~1的结果),对每个结果进行判断,将0.7及以上改为1,0.5及以下改为0,其余保持不变。
在颜色梯度分析中,遍历处理过的224*224的结果,若为0(为背景区)或1(为前景区)则跳过,若其他情况则说明此点为待确定区,即待测点。
一,以该待测点(x,y)为圆点,生成左下角坐标(x-5,y-5)与右上角(x+5,y+5)的检测框;
二,统计该检测框内所有点的r,g,b的平均值得到r测,g测,b测;
三,以该待测点做一个十字线(本实施例采用的是横平竖直的十字线),找到十字线与确定区域(确定的前景或确定的背景)最近的两个交点。若这两个点均为确定的前景,则该点为前景。若这两个点均为确定的背景,则该点为背景。若一个交点为前景点,一个交点为背景点,则进行下一步;
四,分别对该前景交点和背景交点为中心生成与步骤一里等大的检测框,接着如步骤二一样分别计算两个框内的r,g,b的平均值,得到r前,g前,b前和r背,g背,b背;
五,比较[(r前-r测)^2+(g前-g测)^2+(b前-b测)^2]与[(r背-r测)^2+(g背-g测)^2+(b背-b测)^2]。如果前者小则该点为前景,如果后者小,则该点为背景;
根据[(r前-r测)^2+(g前-g测)^2+(b前-b测)^2]、[(r背-r测)^2+(g背-g测)^2+(b背-b测)^2]的计算结果对点I(x,y)在人像分割模型的生成结果进行加权,使待测点的模型生成结果与颜色分析结果一致。
六,接着将该结果进行255-255*结果的操作,得到alpha的值(即将归一化结果转换为alpha的值),再放大到1280*720,放大用到的插值方法为INTER_CUBIC。再进行二值化,最后进行高频滤波,选择7*7的低通滤波器,即可得到数组中1280*720个像素值。
尽管这里参照本发明的解释性实施例对本发明进行了描述,上述实施例仅为本发明较佳的实施方式,本发明的实施方式并不受上述实施例的限制,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在本申请公开的原则范围和精神之内。

Claims (3)

1.一种基于人像分割模型生成结果的图像后处理方法,其特征在于,包括:
步骤S100、将原始图片压缩后输入人像分割模型,根据人像分割模型生成结果将图片划分为背景区、待确定区和前景区;
步骤S200、对待确定区采用颜色梯度分析,确定待确定区每一个像素属于前景区还是背景区;
步骤S300、将图片放大至与原始图片大小匹配,再进行二值化与滤波,得到处理后的图片数据。
2.根据权利要求1所述的基于人像分割模型生成结果的图像后处理方法,其特征在于,对待确定区采用颜色梯度分析,确定待确定区每一个像素属于前景区还是背景区的方法为:遍历待确定区的每个点,执行以下步骤:
步骤S210、以选中的点I(x,y)为原点,生成检测框,检测框的左下角坐标(x-5,y-5)与右上角(x+5,y+5);
步骤S220、统计检测框内所有点的r,g,b的平均值得到r测,g测,b测;
步骤S230、以点I(x,y)做十字线,找到十字线与确定区域最近的两个交点,确定区域为前景区和背景区,判断这两个交点:
若这两个交点均在前景区,则点I(x,y)在前景区,结束;
若这两个交点均在背景区,则点I(x,y)在背景区,结束;
若一个交点在前景区即前景交点,一个交点在背景区即背景交点,则分别以前景交点、背景交点为原点,生成与步骤S210中同样大小的两个检测框,分别计算两个检测框内所有点的r,g,b的平均值,得到r前,g前,b前和r背,g背,b背;比较[(r前-r测)^2+(g前-g测)^2+(b前-b测)^2]与[(r背-r测)^2+(g背-g测)^2+(b背-b测)^2],若[(r前-r测)^2+(g前-g测)^2+(b前-b测)^2]小于[(r背-r测)^2+(g背-g测)^2+(b背-b测)^2],则点I(x,y)在前景区,若[(r前-r测)^2+(g前-g测)^2+(b前-b测)^2]大于[(r背-r测)^2+(g背-g测)^2+(b背-b测)^2],则点I(x,y)在背景区;根据[(r前-r测)^2+(g前-g测)^2+(b前-b测)^2]、[(r背-r测)^2+(g背-g测)^2+(b背-b测)^2]的计算结果对点I(x,y)在人像分割模型的生成结果进行加权,结束。
3.根据权利要求2所述的基于人像分割模型生成结果的图像后处理方法,其特征在于,所述步骤S300具体包括:
将人像分割模型的生成结果更新为(255-255*生成结果),得到alpha的值,采用插值方法INTER_CUBIC将图片放大至与原始图片大小匹配,再进行二值化和高频滤波,得到图片压缩前的图片数据。
CN202111415157.7A 2021-11-25 2021-11-25 基于人像分割模型生成结果的图像后处理方法 Active CN114078139B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111415157.7A CN114078139B (zh) 2021-11-25 2021-11-25 基于人像分割模型生成结果的图像后处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111415157.7A CN114078139B (zh) 2021-11-25 2021-11-25 基于人像分割模型生成结果的图像后处理方法

Publications (2)

Publication Number Publication Date
CN114078139A true CN114078139A (zh) 2022-02-22
CN114078139B CN114078139B (zh) 2024-04-16

Family

ID=80284284

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111415157.7A Active CN114078139B (zh) 2021-11-25 2021-11-25 基于人像分割模型生成结果的图像后处理方法

Country Status (1)

Country Link
CN (1) CN114078139B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101447076A (zh) * 2008-12-02 2009-06-03 浙江大学 一种web图像中感兴趣区域的分割方法
US20100183225A1 (en) * 2009-01-09 2010-07-22 Rochester Institute Of Technology Methods for adaptive and progressive gradient-based multi-resolution color image segmentation and systems thereof
US20110293180A1 (en) * 2010-05-28 2011-12-01 Microsoft Corporation Foreground and Background Image Segmentation
CN106373168A (zh) * 2016-11-24 2017-02-01 北京三体高创科技有限公司 一种基于医疗图像的分割与三维重建方法、3d打印系统
CN106952270A (zh) * 2017-03-01 2017-07-14 湖南大学 一种单一背景图像的快速抠图方法
CN107452010A (zh) * 2017-07-31 2017-12-08 中国科学院长春光学精密机械与物理研究所 一种自动抠图算法和装置
CN107481261A (zh) * 2017-07-31 2017-12-15 中国科学院长春光学精密机械与物理研究所 一种基于深度前景跟踪的彩色视频抠图方法
CN109658441A (zh) * 2018-12-14 2019-04-19 四川长虹电器股份有限公司 基于深度信息的前景检测方法及装置
CN110033465A (zh) * 2019-04-18 2019-07-19 天津工业大学 一种应用于双目内窥镜医学图像的实时三维重建方法
CN110619648A (zh) * 2019-09-19 2019-12-27 四川长虹电器股份有限公司 一种基于rgb变化趋势划分图像区域的方法
CN111369525A (zh) * 2020-03-02 2020-07-03 联影智能医疗科技(北京)有限公司 图像分析方法、设备和存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101447076A (zh) * 2008-12-02 2009-06-03 浙江大学 一种web图像中感兴趣区域的分割方法
US20100183225A1 (en) * 2009-01-09 2010-07-22 Rochester Institute Of Technology Methods for adaptive and progressive gradient-based multi-resolution color image segmentation and systems thereof
US20110293180A1 (en) * 2010-05-28 2011-12-01 Microsoft Corporation Foreground and Background Image Segmentation
CN106373168A (zh) * 2016-11-24 2017-02-01 北京三体高创科技有限公司 一种基于医疗图像的分割与三维重建方法、3d打印系统
CN106952270A (zh) * 2017-03-01 2017-07-14 湖南大学 一种单一背景图像的快速抠图方法
CN107452010A (zh) * 2017-07-31 2017-12-08 中国科学院长春光学精密机械与物理研究所 一种自动抠图算法和装置
CN107481261A (zh) * 2017-07-31 2017-12-15 中国科学院长春光学精密机械与物理研究所 一种基于深度前景跟踪的彩色视频抠图方法
CN109658441A (zh) * 2018-12-14 2019-04-19 四川长虹电器股份有限公司 基于深度信息的前景检测方法及装置
CN110033465A (zh) * 2019-04-18 2019-07-19 天津工业大学 一种应用于双目内窥镜医学图像的实时三维重建方法
CN110619648A (zh) * 2019-09-19 2019-12-27 四川长虹电器股份有限公司 一种基于rgb变化趋势划分图像区域的方法
CN111369525A (zh) * 2020-03-02 2020-07-03 联影智能医疗科技(北京)有限公司 图像分析方法、设备和存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHANDAN YESHWANTH等: "Estimation of intersection traffic density on decentralized architectures with deep networks", 《2017 INTERNATIONAL SMART CITIES CONFERENCE (ISC2)》, 2 November 2017 (2017-11-02), pages 1 - 6 *
姜明新;王培昌;王洪玉;: "基于视频多目标跟踪的高度测量算法", 电子学报, no. 03, 15 March 2015 (2015-03-15), pages 177 - 182 *
王静文;刘弘;: "基于Snake模型的植物叶片面积计算方法", 计算机工程, no. 01, 15 January 2013 (2013-01-15), pages 240 - 244 *
董瑞;梁栋;唐俊;鲍文霞;何韬;: "基于颜色梯度的图像特征点匹配算法", 计算机工程, no. 16, 20 August 2007 (2007-08-20), pages 184 - 186 *

Also Published As

Publication number Publication date
CN114078139B (zh) 2024-04-16

Similar Documents

Publication Publication Date Title
US7860311B2 (en) Video object segmentation method applied for rainy situations
CN110599486A (zh) 一种视频抄袭的检测方法及系统
CN107749987B (zh) 一种基于块运动估计的数字视频稳像方法
CN113537211B (zh) 一种基于非对称iou的深度学习车牌框定位方法
CN111401293A (zh) 一种基于Head轻量化Mask Scoring R-CNN的手势识别方法
US11551336B2 (en) Chrominance and luminance enhancing systems and methods
WO2020108010A1 (zh) 视频处理方法、装置、电子设备以及存储介质
CN114298985B (zh) 缺陷检测方法、装置、设备及存储介质
CN111127358B (zh) 图像处理方法、装置及存储介质
CN116542991A (zh) 一种用于裂缝图像分割的网络架构及其训练方法和分割方法
CN103313068A (zh) 基于灰边缘约束灰世界的白平衡校正图像处理方法及装置
CN103514610A (zh) 一种背景静止的运动目标分割方法
US11941785B2 (en) Directional scaling systems and methods
CN113542868A (zh) 视频关键帧选取方法、装置、电子设备、存储介质
CN114078139B (zh) 基于人像分割模型生成结果的图像后处理方法
CN107784269A (zh) 一种3d视频帧特征点提取的方法及系统
JPH11312243A (ja) 顔領域検出装置
CN105069764A (zh) 一种基于边缘跟踪的图像去噪方法及系统
CN115619618A (zh) 一种基于高层次综合工具的图像处理方法及系统
CN110418195B (zh) 一种基于最佳裁剪的实时视频缩略方法
CN109033969B (zh) 基于贝叶斯显著图计算模型的红外目标检测方法
US10719916B2 (en) Statistical noise estimation systems and methods
CN108830166B (zh) 一种公交车客流量实时统计方法
WO2020056688A1 (zh) 提取图像关键点的方法及装置
CN106934812A (zh) 图像信号处理器及其图像信号处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant