CN108389208A - 一种基于语义分割的图像智能适配显示方法 - Google Patents

一种基于语义分割的图像智能适配显示方法 Download PDF

Info

Publication number
CN108389208A
CN108389208A CN201810047724.XA CN201810047724A CN108389208A CN 108389208 A CN108389208 A CN 108389208A CN 201810047724 A CN201810047724 A CN 201810047724A CN 108389208 A CN108389208 A CN 108389208A
Authority
CN
China
Prior art keywords
pixel
image
group
scale factor
row
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810047724.XA
Other languages
English (en)
Other versions
CN108389208B (zh
Inventor
颜波
牛雪静
李可
巴合提亚尔·巴热
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN201810047724.XA priority Critical patent/CN108389208B/zh
Publication of CN108389208A publication Critical patent/CN108389208A/zh
Application granted granted Critical
Publication of CN108389208B publication Critical patent/CN108389208B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/04Context-preserving transformations, e.g. by using an importance map
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Geometry (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于数字图像处理技术领域,具体为一种基于语义分割的图像智能适配显示方法。图像智能适配显示技术用于保护图像中的重要物体,使得图像放大或缩小时重要物体的尺寸变化尽量小。本发明依次包括以下步骤:使用线裁剪对图像进行分组;根据图像的能量图为每个分组分配比例因子;结合语义分割,重新分配比例因子,使得属于同一物体的像素比例因子接近,减少扭曲;根据比例因子进行像素融合。实验结果表明,放大或缩小图像时,本发明能够使得重要物体尺寸变化小,同时减少重要物体以及背景的畸变。

Description

一种基于语义分割的图像智能适配显示方法
技术领域
本发明属于数字图像处理技术领域,具体涉及一种适配显示方法,更具体的说,涉及一种基于语义分割的图像智能适配显示方法。
背景技术
近年来,随着数字媒体与计算机的不断地发展,各种智能设备涌入人们的生活。图像作为一种包含丰富信息的常见交流媒介,需要适应不同分辨率、宽高比的屏幕。而传统的图像处理方法,比如均匀缩放、剪切将会引起图像失真或者丢失重要的信息。当图像在不同分辨率、宽高比的屏幕出现时,图像智能适配显示方法(Image Retargeting)可以调整图像,使得图像的显著区域发生较少的失真,在提升用户视觉体验方面发挥着越来越重要的作用。
适配显示方法主要可以分为两类:像素删除的方法(离散的方法)和像素融合的方法(连续的方法);线裁剪(Seam Carving)[1]是一种经典的像素删除的方法,它的主要思想是每次从一行或者一列中最多移除一个像素,减少图像失真,但是当图像缩小或放大比例很大时,图像会出现明显的失真,非常不自然。相比之下,像素融合的方法获得的图像更加自然、平滑。像素融合方法把原始图像中每个像素当成单位长度,融合时,使用比例因子为每个像素设定新的长度,通过线性加权的方式将各个像素融合成新的单位长度的像素。基于像素线搜索和像素融合的适配显示方法[2]使用显著性检测结果[3]作为能量图。用线裁剪的方法搜索像素线,按照搜索结果,将图片分为若干组,根据每组的能量,按比例为各组分配比例因子并矫正不合理的比例因子,最后使用像素融合达到了很好的适配显示效果。文献[2]使用能量图计算比例因子后,同一个组的像素有统一的比例因子,但是并不能保证经过重要物体的每个组的比例因子都相同,仍然会有一定的扭曲。如果能修正比例因子,使得同一物体比例因子接近,则可以减少扭曲。
发明内容
为了克服现有技术的不足,本发明的目的在于提供一种基于语义分割的图像智能适配显示方法,它主要针对图片中重要物体的保护,使图片大小发生变化时,重要物体尺寸不发生太大变化,其借助语义分割的结果,给重要物体和背景分别重新分配比例因子,达到减少扭曲的目的。
本发明提供的基于语义分割的图像智能适配显示方法,具体步骤如下:
(1)借助线裁剪将图像分成若干组
计算图像的梯度,在图像中找到一条穿过整幅图像且梯度总和最小的像素线,从图像中裁剪掉该像素线,将每次裁剪掉的像素线分为一组。具体的线裁剪方法参考文献[1]。根据缩放因子,重复上述过程,直到满足缩放因子的要求;剩余的像素按每行或每列分为一组。当图像水平方向适配显示时,一组像素的数量等于图像中一列像素的数量,线裁剪过程结束后,将剩余的像素每列分为一组;当图像竖直方向适配显示时,一组像素的数量等于图像中一行像素的数量,线裁剪过程结束后,将剩余的像素每行分为一组。
(2)计算能量图,分配比例因子
给定大小为H×W的图像,能量图由显著性检测结果和语义分割结果加权获得,能量图的计算公式如下:
E(x,y)=αSD(x,y)+(1-α)SC(x,y) (1)
其中,1≤x≤H,1≤y≤W,0≤α≤1,0≤SD(x,y)≤1,0≤SC(x,y)≤1,0≤E(x,y)≤1,SD(x,y)表示图像中第x行y列像素的显著性检测结果,越大说明该像素对人的视觉影响越大;SC(x,y)表示第x行y列像素的得分,由语义分割的得分图处理获得,越大说明该像素不是背景的可能性越大;α用于平衡SD(x,y)和SC(x,y)对能量图E(x,y)的贡献,一般宜取值为0.6—0.9,实施例中α取值为0.8;能量图中的值越大,说明对应像素越重要。显著性检测结果由Itti等人的方法获得,具体参考文献[3],语义分割结果由Lin等人的方法获得,具体参考文献[4]。
根据缩放因子和能量图E(x,y),使用Yan等人[2]的方法为每组像素分配比例因子。计算每组像素能量的平均值,对于能量较高的组,分配较大的比例因子。比例因子S(x,y)表示第x行y列像素在像素融合中的贡献度;若比例因子大于1(减小宽度时)或小于1(增大宽度时),还需要矫正。
(3)重新分配比例因子
不失一般性,以水平方向的适配显示为例,重新分配图像中物体的比例因子:
计算各组所包含的第l类像素的个数其中表示第k组包含的第l类像素的个数;根据第l类的阈值Tl,给的组重新分配比例因子:
其中,当1[·]的方括号中内容为真时,它的值为1,否则为0;CO(i,j)表示第j组第i个像素所在的列;用同样的方法处理图像中的其他物体的类,直至图像中所有的物体的类处理完成。若图像中包含同一类多个物体且物体间不相邻,可以选择把不相邻的同一类的多个物体当成多个类处理,防止一个物体的比例因子被均衡到另一个物体。
阈值Tl的计算方法为:
降序排列为阈值Tl为:
其中,参数γ为调控参数,通常设置为0.1—0.4,实施例中γ设置为0.2。
对于垂直方向的适配显示,重新分配图像中物体的比例因子的方法与上述一样。
这样设置第l类的阈值Tl的原因是:如果直接重新分配包含第l类物体像素的所有组的比例因子,有些组包含的目标物体的像素非常少且比例因子较低,当它们和包含目标物体像素非常多、比例因子较大的组一起重新分配时,会导致目标物体的比例因子接近背景的比例因子,起不到保护目标物体的作用;如果将阈值Tl设置成固定的值,图片中目标物体大小和形状不定,当阈值设置太大,会导致较小的物体无法重新分配比例因子;当阈值设置太小,会导致较大的物体比例因子接近背景,而按照本发明的方法将阈值设成自适应的方式,可以较有效地避免上述情况。
重新分配图像中背景的比例因子:
计算各组包含的背景像素的个数其中表示第k组包含的背景像素的个数;将降序排列为σ是{1,…,W}→{1,…,W}的双射函数,使得设置阈值β∈[0,1],重新分配比例因子:
一般地,阈值β为阈值,一般可取0.3-0.5;实施例中取值为0.4。
背景像素作为一种特别的类,在图像中占有很大的比例。如果重新分配所有背景像素所在组的比例因子,可能会导致整个图像比例因子相同,相当于普通的图像缩小或放大操作,无法起到保护重要物体的作用;如果使用物体比例因子的重新分配方法,一般情况下,因此很难起到自适应调整阈值的作用。而在本发明中,重新分配背景的比例因子时,组数被限制在合适的范围内,只有当额外的组全部由背景像素构成时,组数才可以超出限定范围。实验结果表明,这样可以防止分配背景的比例因子时,过度影响物体的比例因子,同时可以使背景和物体的衔接部分更加自然。
(4)像素融合
获得重新分配的比例因子后,通过像素融合的方式获得目标图像的适配显示;以水平方向适配显示为例,假设原始图像中每个像素宽度为1;比例因子为每个像素设定新的宽度,通过线性加权的方式将各个像素融合成新的宽度为1的像素,最终构成特定大小的图像。对于垂直方向适配显示,作类似处理。
本发明步骤(2)中,第x行y列像素的得分SC(x,y)计算方式如下:
语义分割将图像中的像素分为L类,获得图像中每个像素的分类C∈RH×W和得分图SM∈RH×W×L,其中背景是一个特殊的类,C∈{0,1,2,…,L-1},SM∈{0,1,…,255};计算SC(x,y):
其中,第0类表示背景;
本发明的有益效果在于:不仅考虑了放大或缩小图像时保护重要物体,还考虑了物体整体尺寸变化不大时,物体内部各区域相对比例接近原图,减少扭曲的发生。本发明使用图像语义分割技术提供的语义信息,在能量图计算的比例因子基础上,重新分配各类物体的比例因子,使得同一类物体比例因子接近,最后用像素融合的方式,使得目标图像平滑自然。
附图说明
图1为本发明的流程图。
图2为使用本发明将图片水平方向缩小为原来的50%后智能适配显示的结果。
具体实施方式
对于一张待缩放的图片,从水平方向上将其缩小为原来的50%,按图1所示方法进行适配显示。具体步骤为:
(1)计算图像的梯度,用线裁剪的方法,找到一条梯度总和最小的像素线,该像素线被分为一组。上述过程迭代0.5W次,得到0.5W组。剩余像素组成的图像大小为H×0.5W,每列分为一组。至此,整张图像被分为W组,每组像素数为H;
(2)计算能量图,能量图由语义分割结果和显著性检测结果线性加权获得,将参数α设置为0.8。使用文献[2]的方法计算各个像素的比例因子。同一组像素的比例因子相同;
(3)根据语义分割结果,先为背景像素重新分配比例因子,然后依次为每一类物体重新分配比例因子,分配的顺序影响不大;参数β设为0.4,γ设为0.2;
(4)根据像素融合方法,使用重新分配的比例因子融合像素,生成新的图像;
图2为本发明的实例,其中图2(a)为原图,图2(b)为适配显示结果,图2(c)为均匀缩放结果;可以看出,本发明的方法在水平方向缩放50%时,可以保持人的尺寸较大,同时背景未发生明显丢失和扭曲。
参考文献
[1]S.Avidan and A.Shamir,“Seam carving for content-aware imageresizing”,ACM Trans.Graph.(TOG),vol.26,no.3,pp.10,2007.
[2]B.Yan,K.Li,X.Yang and T.Hu,“Seam Searching based Pixel Fusion forImage Retargeting”,IEEE Transactions on Circuits and Systems for VideoTechnology,vol.25,no.1,pp.15-23,Jan.2015.
[3]L.Itti,C.Koch,and E.Niebur,“A model of saliency-based visualattention for rapid scene analysis,”IEEE Transactions on Pattern Analysis andMachine Intelligence,vol.20,no.11,pp.1254–1259,Nov.1998.
[4]G.Lin,A.Milan,C.Shen,and I.Reid,“RefineNet:Multi-Path RefinementNetworks for High-Resolution Semantic Segmentation”,IEEE Conference onComputer Vision and Pattern Recognition,July 2017.。

Claims (5)

1.一种基于语义分割的图像智能适配显示方法,其特征在于,具体步骤如下:
(1)借助线裁剪将图像分成若干组
计算图像的梯度,在图像中找到一条穿过整幅图像且梯度总和最小的像素线,从图像中裁剪掉该像素线,将每次裁剪掉的像素线分为一组;根据缩放因子,重复上述过程,直到满足缩放因子的要求;剩余的像素按每行或每列分为一组:当图像水平方向适配显示时,一组像素的数量等于图像中一列像素的数量,线裁剪过程结束后,将剩余的像素每列分为一组;当图像竖直方向适配显示时,一组像素的数量等于图像中一行像素的数量,线裁剪过程结束后,将剩余的像素每行分为一组;
(2)计算能量图,分配比例因子
给定大小为H×W的图像,能量图由显著性检测结果和语义分割结果加权获得,能量图的计算公式如下:
E(x,y)=αSD(x,y)+(1-α)SC(x,y) (1)
其中,1≤x≤H,1≤y≤W,0≤α≤1,0≤SD(x,y)≤1,0≤SC(x,y)≤1,0≤E(x,y)≤1,SD(x,y)表示图像中第x行y列像素的显著性检测结果,越大说明该像素对人的视觉影响越大;SC(x,y)表示第x行y列像素的得分,由语义分割的得分图处理获得,越大说明该像素不是背景的可能性越大;α用于平衡SD(x,y)和SC(x,y)对能量图E(x,y)的贡献;能量图中的值越大,说明对应像素越重要;
根据缩放因子和能量图E(x,y),为每组像素分配比例因子:计算每组像素能量的平均值,对于能量较高的组,分配较大的比例因子;比例因子S(x,y)表示第x行y列像素在像素融合中的贡献度;
(3)重新分配比例因子
对于水平方向的适配显示,重新分配图像中物体的比例因子:
计算各组所包含的第l类像素的个数其中表示第k组包含的第l类像素的个数;根据第l类的阈值Tl,给的组重新分配比例因子:
其中,当1[·]的方括号中内容为真时,它的值为1,否则为0;CO(i,j)表示第j组第i个像素所在的列;用同样的方法处理图像中的其他物体的类,直至图像中所有的物体的类处理完成;若图像中包含同一类多个物体且物体间不相邻,选择把不相邻的同一类的多个物体当成多个类处理,防止一个物体的比例因子被均衡到另一个物体;
重新分配图像中背景的比例因子:
计算各组包含的背景像素的个数其中表示第k组包含的背景像素的个数;将降序排列为σ是{1,…,W}→{1,,W}的双射函数,使得设置阈值β∈[0,1],重新分配比例因子:
(4)像素融合
获得重新分配的比例因子后,通过像素融合的方式获得目标图像的适配显示;对于水平方向适配显示,假设原始图像中每个像素宽度为1;比例因子为每个像素设定新的宽度,通过线性加权的方式将各个像素融合成新的宽度为1的像素,最终构成特定大小的图像;对于垂直方向适配显示,作类似处理。
2.根据权利要求1所述的基于语义分割的图像智能适配显示方法,其特征在于,步骤(2)中,第x行y列像素的得分SC(x,y)计算方式如下:
语义分割将图像中的像素分为L类,获得图像中每个像素的分类C∈RH×W和得分图SM∈RH×W×L,其中背景是一个特殊的类,C∈{0,1,2,…,L-1},SM∈{0,1,…,255};计算SC(x,y):
其中,第0类表示背景。
3.根据权利要求1所述的方法,其特征在于,步骤(2)中,参数取值为0.6—0.9。
4.根据权利要求1所述的方法,其特征在于,步骤(3)中,阈值Tl的计算方法为:
降序排列为阈值Tl为:
其中,参数γ设置为0.1—0.4。
5.根据权利要求1所述的方法,其特征在于,步骤(3)中,阈值β设置为0.3-0.5。
CN201810047724.XA 2018-01-18 2018-01-18 一种基于语义分割的图像智能适配显示方法 Active CN108389208B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810047724.XA CN108389208B (zh) 2018-01-18 2018-01-18 一种基于语义分割的图像智能适配显示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810047724.XA CN108389208B (zh) 2018-01-18 2018-01-18 一种基于语义分割的图像智能适配显示方法

Publications (2)

Publication Number Publication Date
CN108389208A true CN108389208A (zh) 2018-08-10
CN108389208B CN108389208B (zh) 2021-06-04

Family

ID=63077167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810047724.XA Active CN108389208B (zh) 2018-01-18 2018-01-18 一种基于语义分割的图像智能适配显示方法

Country Status (1)

Country Link
CN (1) CN108389208B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009712A (zh) * 2019-03-01 2019-07-12 华为技术有限公司 一种图文排版方法及其相关装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100183243A1 (en) * 2009-01-20 2010-07-22 Brand Matthew E Method for Temporally Editing Videos
CN101923703A (zh) * 2010-08-27 2010-12-22 北京工业大学 基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法
CN103955887A (zh) * 2014-04-11 2014-07-30 北京工业大学 基于内容的快速细缝裁剪与非均匀映射相结合的图像自适应方法
CN105830014A (zh) * 2013-12-20 2016-08-03 惠普发展公司,有限责任合伙企业 确定图像比例重设因子
CN106447702A (zh) * 2016-08-31 2017-02-22 天津大学 一种立体图像匹配图计算方法
CN106504186A (zh) * 2016-09-30 2017-03-15 天津大学 一种立体图像重定向方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100183243A1 (en) * 2009-01-20 2010-07-22 Brand Matthew E Method for Temporally Editing Videos
CN101923703A (zh) * 2010-08-27 2010-12-22 北京工业大学 基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法
CN105830014A (zh) * 2013-12-20 2016-08-03 惠普发展公司,有限责任合伙企业 确定图像比例重设因子
CN103955887A (zh) * 2014-04-11 2014-07-30 北京工业大学 基于内容的快速细缝裁剪与非均匀映射相结合的图像自适应方法
CN106447702A (zh) * 2016-08-31 2017-02-22 天津大学 一种立体图像匹配图计算方法
CN106504186A (zh) * 2016-09-30 2017-03-15 天津大学 一种立体图像重定向方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
KE LI ET AL.: "Improved seam carving for image retargeting with sift feature preservation", 《IEEE XPLORER》 *
李可等: "基于学习的图像智能适配显示技术", 《北京航空航天大学学报》 *
李姝蓁等: "融合显著物体检测的图像显示适配", 《中国图像图形学报》 *
江少锋等: "一种简单高效的图象缩小算法", 《南昌航空工业学院学报(自然科学版)》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009712A (zh) * 2019-03-01 2019-07-12 华为技术有限公司 一种图文排版方法及其相关装置
US11790584B2 (en) 2019-03-01 2023-10-17 Huawei Technologies Co., Ltd. Image and text typesetting method and related apparatus thereof

Also Published As

Publication number Publication date
CN108389208B (zh) 2021-06-04

Similar Documents

Publication Publication Date Title
Guo et al. Image retargeting using mesh parametrization
CN110807448B (zh) 人脸关键点数据增强方法
CN109978788B (zh) 卷积神经网络生成方法、图像去马赛克方法及相关装置
Jiao et al. Dilateformer: Multi-scale dilated transformer for visual recognition
CN109493350A (zh) 人像分割方法及装置
CN104159120B (zh) 一种视频稳像方法、装置及系统
CN105890768B (zh) 一种红外图像非均匀性校正的方法及装置
CN110706151B (zh) 一种面向视频的非均匀风格迁移方法
Yan et al. Seam searching-based pixel fusion for image retargeting
CN103902730B (zh) 一种缩略图生成方法和系统
CN106504186A (zh) 一种立体图像重定向方法
CN109816763A (zh) 一种图形渲染方法
CN110853071A (zh) 图像编辑方法及终端设备
Lv Smart watermark to defend against deepfake image manipulation
Xie et al. Non-local nested residual attention network for stereo image super-resolution
CN108389208A (zh) 一种基于语义分割的图像智能适配显示方法
CN105427242B (zh) 基于内容感知的交互式网格约束变形图像自适应缩放方法
Song et al. A direction-decoupled non-local attention network for single image super-resolution
CN107154027B (zh) 一种畸变图像复原的补偿方法及装置
Shi et al. Context saliency based image summarization
CN107918926B (zh) 一种基于四边形和三角形面片的数字图像放大方法
CN113139899A (zh) 高质量轻量级超分辨率重建网络模型设计方法
CN108449588B (zh) 一种立体图像重定位方法
CN111242140A (zh) 一种非均匀光照下快速提取轮廓线的方法
CN107977929A (zh) 图像超分辨率处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant