CN101923703A - 基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法 - Google Patents
基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法 Download PDFInfo
- Publication number
- CN101923703A CN101923703A CN 201010264739 CN201010264739A CN101923703A CN 101923703 A CN101923703 A CN 101923703A CN 201010264739 CN201010264739 CN 201010264739 CN 201010264739 A CN201010264739 A CN 201010264739A CN 101923703 A CN101923703 A CN 101923703A
- Authority
- CN
- China
- Prior art keywords
- image
- semantic
- edge
- important
- scoreboard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
一种基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法,该方法包括:结合体育视频中间层语义分析结果,针对图像帧提取用户对语义区域重要性主观评价的统计特征,并用来对基于底层特征的能量函数进行加权,得到语义加权的能量函数;利用前向能量的细缝裁减方法去除图像中的不重要信息,同时用重要语义边缘的变化度量重要信息变形,当变形超过设定指标时终止细缝裁减方法,采用非均匀映射方法得到目标大小的图像。方法框架如摘要附图所示。本发明将目前比较好的两种方法——细缝裁减方法和非均匀映射方法有机结合,充分发挥各自的优点,实现综合最优的图像视频自适应结果;并且引入了语义加权的能量函数计算,实现基于语义内容的图像大小自适应。
Description
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于语义的细缝裁剪和非均匀映射相结合的图像自适应的方法的研究及实现。
背景技术
随着移动设备的普及,电视、笔记本电脑、PDA、手机等适用于不同网络的终端设备不断换代更新,不同类型不同尺寸的显示终端不断涌现以适应各种不用的用户需求。为了保证持不同设备的用户都能够舒适地观看同样的图像内容,这就要求图像内容能够自适应于不同尺寸、不同比例的用户终端,研究保持图像主要内容的自适应技术具有重要的应用意义。
目前主要的图像大小自适应方法有线性变形(Scaling)方法,裁切(Cropping)方法,非均匀映射(Non-homogeneous Warping)方法,基于细缝裁切的方法、基于前景对象的方法等。
线性变形方法是最简单的图像大小自适应方法,该方法没有考虑图片内容,一旦由不同比例缩放,往往会造成图片的变形,或者关键对象由于挤压或拉长带来的比例失真等。
裁切方法是将图像的重要区域标定后再进行等比例缩放。这一方法通常和图像感兴趣区检测相结合,先确定出哪些区域属于重要区域,然后裁切并移除不重要的内容,使感兴趣区域的比例变大。其中重要内容区域的检测十分重要,脸部的检测等常作为检测的重点。另外,该方法只能保留局部内容,当重要区域位于图像两端时,其必然要保留一边而舍弃另一边,导致重要信息丢失。
二维的非均匀映射方法首先由用户设定一些需要保持形状的感兴趣区域,在进行图像缩放时,感兴趣区基本上采取相似变换,而其它区域则采取非线性变换,当然感兴趣区形状保持的代价是其它背景区域更大的变形。
基于细缝裁减方法是自动寻找图像中的水平或垂直方向单调、连通的最低能量线,通过去除/增加最低能量线来压缩/放大图像,这一方法的特点是能够最大限度的保持图像中的重要区域,去除最低能量区域。在此基础上,2008年Rubinstein等人提出了改进方案,将能量计算由原来的后向能量改为前向能量,这一改进较好的保持了图像中的边缘和细节。
基于对象的(Object-Based)图像或视频的编辑方法,分离出图像中的前景和背景分别进行缩放后再合成新的图像。这类方法的瓶颈在于普适的对象分割技术和鲁棒性的前景背景分类技术还不成熟,这也导致该类方法推广应用存在局限性。
目前各种方法有各自的优缺点和局限性,我们发明一种图像大小自适应方法,它融合了细缝裁切方法和非均匀映射方法的优点,首先采取细缝裁减方法,同时监测重要信息变形的度量值,当变形超过设定指标时,终止细缝裁减方法,切换为非均匀映射方法,不仅能够实现图像大小的自适应,同时能够更多的保持图像的语义内容。
发明内容
本发明的目的在于,通过提供一种基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法,适用于不同尺寸用户终端的图像自适应技术,使图像能够自适应地在不同终端上显示图像内容,尽可能多的保持原始图像中语义内容,保持关键对象无畸变,保持图像中的重要结构即空间位置关系相对不变,以保证最佳主观观赏质量。
本发明是采用以下技术手段实现的:
本发明提供了一种基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法。该方法包括:
A、读入视频序列图像,接下来分别对每一帧M*N大小的图像做细缝裁切和非均匀映。
B、针对图像帧提取用户对语义区域重要性主观评价的统计特征,并用来对基于底层特征的能量函数进行加权,得到语义加权的能量函数。
进一步地,所述步骤B具体包括:
B1、对输入的当前图像帧划分语义区域并标定重要区和非重要区的语义边缘。语义区域包括场地区域、运动员区域、记分牌区域、关键对象区域、观众区域、广告牌区域等常用体育视频语义区域。然后根据语义重要性自动确定各个不同的语义区及边缘区内的权值,得到当前帧的语义权值函数。语义边缘用来检测重要信息变形以判定何时结束细缝裁切方法。
B2、计算当前图像帧中每一个像素点的灰度值,得到图像帧的灰度函数。计算源图像每一个像素点灰度值和加权值的乘积,得到帧图像的加权灰度函数。
B3、计算源图像每一个像素点的能量值,能量值采用梯度能量来计算,得到帧图像的能量函数。根据梯度能量值计算前向能量值。计算当前图像帧中每一个像素点前向能量值和语义权值的乘积,得到当前图像帧的加权能量函数。
进一步地,所述步骤B1具体包括:
31、请用户给各语义区域重要性打分(1-10),统计共m处语义区域重要性的分布pSi(Im),i=1,2,...m,并计算其均值{Ave_ImS1,Ave_ImS2,......Ave_ImSm}和方差{vmS1,vmS2,......vmSm}。确定语义区域Si的有效范围[Ave_ImSi-3vmSi,Ave_ImSi+3vmSi]。
32、根据语义重要性自动确定语义加权值。设底层能量函数计算公式Φ(p),随机选取一些训练视频帧,统计语义区域Si的能量分布值pSi(Eng)
语义区域Si的重要性权值通过如下公式计算:
至此,我们得到图像中的相应像素点的语义重要性权值
w(i,j)={WeightSi,(i,j)∈Si}。
C、逐步去除或者增加当前图像帧中的细缝即低能量线来实现图像大小的自适应。根据重要区和非重要区的语义边缘随时监测重要信息变形,当这一度量达到某个阈值时即停止细缝算法。
进一步地,所述步骤C具体包括:
C1、设定输出目标图像的长宽大小。
C2、初始化图像宽度和高度,迭代次数k=0。然后进行第k次迭代,计算图像的行代价函数和列代价函数。将所有行/列的代价函数进行对比,得到最小代价函数,设第l行为CostRl。代价函数CostRl对应的路径path(xy,y)即为低能量线,去除图像I(x,y)和语义加权图w(i,j)中低能量线对应位置的像素点。
C3、进一步根据低能量线path(xy,y)修正重要边缘描述子。对重要边缘Edge_imt的第k个点(sk,yk),如果y=yk且xk=xy则删除该点,边缘长度减1;如果y=yk且xk>xy,则xk=xk-1。
C4、计算重要信息变形的度量值。如果重要信息变形的度量值超过设定阈值指标,则终止细缝裁减算法,否则迭代次数k=k+1,修改图像宽度或高度,跳至C1中进行第k+1次迭代计算。
进一步地,所述步骤C4具体包括:
重要信息变形采取重要区域边缘即场地边缘变形来度量。设场地边缘描述子为
Edge_imt={(x1,y1),(x2,y2),......,(xn,yn)},t=1,2...T
随着图像放大或缩小,边缘Edge_imt的方向应该保持不变,而是平行移动。换句话讲,在边缘对应的直线方程Lt:Atx+Bty+Ct=0中,At和Bt保持不变,Ct随着图像的缩放而变化。用当前图像中边缘Edge_imt上的所有象素点采用最小均方误差方法计算Ct即可确定直线方程。进一步,计算边缘Edge_imt所有点与拟合直线Lt的垂直距离(即点与拟合直线的偏移量):
寻找最大偏移量作为重要信息变形指标
变形度量准则采用阈值法,通过综合各种类型的直线变形训练得到阈值。如果重要信息的度量值变形大于设定阈值,停止细缝裁减。
D、当重要信息变形的度量值大于设定阈值时细缝裁减停止,接下来采用非均匀映射方法完成图像大小的自适应,使图像大小自适应为C1中设定的目标。非均匀映射过程分为两个层次,先处理不包含记分牌的图像区域即自然图像,然后处理记分牌区域即记分牌图像。细缝裁减方法的随机变形对以文字为主的记分牌区域有很大影响,记分牌区域直接从原始图像的记分牌图像进行映射。自然图像则从细缝裁减后的图像进行映射。
进一步地,所述步骤D具体包括:
D1、根据A步骤中得到的语义重要性统计值将自然图像分为重要区域和不重要区域,设定阈值将各语义区域重要性值二值化为重要区域和不重要区域。
D2、通过边缘检测来得到记分牌图像的重要区域即文字区域,剩下的部分为记分牌图像的非重要区域。
D3、对包含重要区域和非重要区域的自然图像和记分牌图像分别进行非均匀映射。先处理自然图像,得到记分牌区域的目标大小。以此为目标,采用相同的方法对原始记分牌图像进行非均匀映射,实现记分牌图像自适应。最后将其叠加到自然图像的自适应结果中,得到最终的自适应图像。
进一步地,所述步骤D3具体包括:
D31、图像共包含d个重要区域F=F1∪F2∪,...UFd。将图像分为K个矩形栅格区域,自然图像对应的栅格较大,记分牌图像对应的栅格较小。
D32、设原始栅格顶点经过非均匀映射后为V′={v′1,v′2,...v′N},重要区域比例因子为SFIm,不重要区域比例因子为SFNIm。结合两个比例因子和重要区域F,得到相应顶点的重要性权值SI(vi)。
D33、计算V′={v′1,v′2,...v′N},使其在重要性权值SI(vi)的作用下尽可能接近原始图像中的栅格顶点V={v1,v2,...vN}。
本发明与现有技术相比,具有以下明显的优势和有益效果。
本发明一种基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法,将目前比较好的两种方法——细缝裁减方法和非均匀映射方法有机结合,充分发挥各自的优点,实现综合最优的图像视频自适应结果;并且引入了语义加权的能量函数计算,实现基于语义内容的图像大小自适应。使图像能够自适应地在不同终端上显示图像内容,尽可能多的保持了原始图像中语义内容,保持关键对象无畸变,保持图像中的重要结构即空间位置关系相对不变,保证了最佳的主观观赏质量。
附图说明
图1为实施例中基于语义的细缝与非均匀映射方法结合方法的流程图;
图2为实施例中方法的详细流程图;
图3为实施例中前向能量三种可能的路径和相应能量值变化;
图4为实施例中细缝方法操作步骤;
图5为实施例中输入图像帧。
具体实施方式
下面将结合附图及实施例对本发明的技术方案进行更详细的说明。
技术方案的整体流程如说明书附图1所示,本实施例是针对体育视频中的篮球视频进行的,源篮球图像帧大小为288*352像素的BMP位图。结合体育视频中间层语义分析结果,针对图像帧提取用户对语义区域重要性主观评价的统计特征,并用来对基于底层特征的能量函数进行加权,得到语义加权的能量函数。接下来利用前向能量的细缝裁减方法去除图像中的不重要信息,同时用重要语义边缘的变化度量重要信息变形,当变形超过设定指标时终止细缝裁减方法,采用非均匀映射方法得到目标大小的图像。技术方案的详细流程图如说明书附图2所示。
A、读入篮球视频序列图像,其高为288像素,宽为352像素。
B、语义加权能量函数计算。
首先阐述一下语义的概念。人们提出了体育视频的三层语义结构:底层特征、中间层特征和高层语义。此底层特征就是直接由图像像素值提取的颜色、形状、纹理等特征及其组合。高层语义即人们理解的图像内容,目前还没有达到自动提取的程度。中间层特征可以归结为简单的语义特征,他们基于底层特征、结合领域知识而得到,一般可以自动提取。
本实施例中采用的是中间层语义。体育视频中比赛场地一般都包含较少细节信息,用传统的能量函数往往会产生与人们的理解不完全一致的结果。我们提出了一种语义加权能量函数计算方法,结合中间层语义特征对传统的能量函数进行修正,以得到的能量函数能够更好的表示图像语义。
所述步骤B具体包括:
B1、对输入的当前图像帧划分语义区域并标定重要区和非重要区的语义边缘。本实施例中语义区域包括场地区域、运动员区域、记分牌区域、观众区和广告牌区域,见说明书附图5(黑色三角和白色三角为两队球员,黑色圆点为篮球,白色菱形为裁判人员)。然后根据语义重要性自动确定各个不同的语义区及边缘区内的权值,场地区域权值为5、运动员区域权值为6、记分牌区域为7、观众区和广告牌区域为1,得到当前帧的语义权值函数。
B2、根据当前图像帧中每一个像素点的R、G、B分量值计算灰度值,根据灰度计算公式为gray=0.299*R+0.587*G+0.114*B,可以得到图像帧的灰度函数。计算源图像每一个像素点灰度值和加权值的乘积,得到帧图像的加权灰度函数。
B3、计算源图像每一个像素点的能量值,我们希望能量值能够表征图像中像素点的重要程度,本实施方式采用梯度值这种简单有效的方式来计算能量值并再进一步用语义权值对其修正。图像中像素的灰度值为I(i,j),该点的梯度能量即:梯度值越大,能量值越大。
为了更好的表征像素点的重要程度,我们提出采用语义加权的能量函数改进算法,在图像大小缩放的过程中更加有助于保护图像当中的重要语义区域及边缘。计算当前图像帧中每一个像素点能量值和语义权值的乘积,得到当前图像帧的加权能量函数。语义加权能量值=梯度能量值*语义权值
进一步地,所述步骤B1具体包括:
31、人们对于不同语义区域重要性理解有一定的共性,但也存在差别。忽略较小差别,提取共性,并将其与图像内容重要性关联起来以得到与人类理解相符合的结果。基于此我们发放调查问卷请用户给各语义区域重要性打分(1-10),统计共m处语义区域重要性的分布pSi(Im),i=1,2,...m,并计算其均值{Ave_ImS1,Ave_ImS2,......Ave_ImSm}和方差{vmS1,vmS2,......vmSm}。确定语义区域Si的有效范围[Ave_ImSi-3vmSi,Ave_ImSi+3vmSi]。
32、根据语义重要性自动确定语义加权值。设底层能量函数计算公式Φ(p),随机选取一些训练视频帧,统计语义区域Si的能量分布值pSi(Eng)
语义区域Si的重要性权值通过公式(1)计算:
至此,得到图像中的相应像素点的语义重要性权值
w(i,j)={WeightSi,(i,j)∈Si}。
C、采用细缝增删方法逐步去除或者增加当前图像帧中的细缝即低能量线来实现图像大小的自适应。随时监测重要信息变形的度量值,当这一度量达到某个阈值时即停止细缝算法,方法如说明书附图4所示,具体说明见下面步骤。
进一步地,所述步骤C具体包括:
C1、设定输出目标图像的长宽大小。通过目标图像和源图像长宽的比对,我们可以得到我们将在水平方向和垂直方向改变多少尺寸。本实施例设定输出目标图像大小为176*144,即长度和宽度各减少一半。
C2、细缝方法的思想是从图像中寻找一条能量最小的垂直或水平缝隙,将找到的缝隙上所有的像素点删除或复制以实现图像尺寸减小或增大。
其中垂直或水平缝隙是指图像中一条自顶向下或自左向右的曲线,图像中的每一行或列有且仅有一个像素点在这条曲线上,且曲线上任何相邻两行的像素点是邻接的。缝隙的能量被定义为缝隙上所有像素点的能量之和。
如何寻找这条细缝是很重要的一个步骤。以寻找垂直方向细缝为例,基于内容的一般方法采用的是,寻找一条自顶向下的曲线即细缝,它的能量为所有它上面能量的和,删除或者复制它。我们计算图像中所有像素点的能量的平均值为当我们任意移出像素的时候,这个图像中的能量平均值应该保持不变。当移出地能量线上的像素的时候,基于内容的一般方法会使能量平均值增加。基于内容的一般方法对大部分图像是可用的,但是忽略了能量的增加。我们注意到这样的变化,当细缝移出了,原来不相邻的像素变成了邻居,新的邻居产生了新的边缘。于是本实施例采用了如下方法,即前向能量方法。
寻找细缝,当它移出后图像增加的能量最小。这样的细缝的能量不一定是最小的,但是当它删除或者复制后引起最小的假象,更好的保护图像的语义内容。
新的边缘的能量为新邻居的能量差。考虑到细缝的连续性,以及算垂直细缝为例列出了所有的三种情况,如说明说附图3所示:
移出像素pi,j有三种路径可以实现,从pi-1,j-1pi-1,j或者pi-1,j+1到pi,j即从左上方、正上方、右上方到pi,j三种路径。当移出两个像素点后,产生新的边缘,边缘值分别为:
CLeft(i,j)=|I(i,j+1)-I(i,j-1)|+|)I(i-1,j)-I(i,j-1)|
CUp(i,j)=|I(i,j+1)-I(i,j-1)|
CRight(i,j)=|I(i,j+1)-I(i,j-1)|+|I(i-1,j)-I(i,j+1)|
当然,会将上述的语义权值与其加权,来更好的保护图像的语义内容,即将像素的每一点的语义权值w(i,j)与该点的边缘值点积,如下:
CLeft(i,j)=|w(i,j+1)I(i,j+1)-w(i,j-1)I(i,j-1)|+|w(i-1,j)I(i-1,j)-w(i,j-1)I(i,j-1)|
CUp(i,j)=|w(i,j+1)I(i,j+1)-w(i,j-1)I(i,j-1)|
CRight(i,j)=|w(i,j+1)I(i,j+1)-w(i,j-1)I(i,j-1)|+|w(i-1,j)I(i-1,j)-w(i,j+1)I(i,j+1)|
需要说明的是,要特别考虑一些特殊的点,当计算水平的缝隙时,图像的起始点、第一行、第一列以及最后一行;当计算垂直的缝隙的时候,图像的起始点、第一行、第一列以及最后一列。例如在计算垂直缝隙的时候,图像的第一行,用相邻的点的权值和灰度值代替不存在的邻居点的权值和灰度值。即:
CLeft(i,j)=|w(i,j+1)I(i,j+1)-w(i,j)I(i,j)|+|w(i-1,j)I(i-1,j)-w(i,j)I(i,j)|
CUp(i,j)=|w(i,j+1)I(i,j+1)-w(i,j)I(i,j)|
CRight(i,j)=|w(i,j+1)I(i,j+1)-w(i,j)I(i,j)|+|w(i-1,j)I(i-1,j)-w(i,j+1)I(i,j+1)|
三条路径中的CLeft(i,j),CUp(i,j),CRight(i,j),接下来就要寻找一条水平或者垂直的细缝,这条细缝上的能量值为自顶向下或者自左向右的CLeft(i,j),CUp(i,j),CRight(i,j)的叠加的最小值记为M(i,j)。即采用动态规划的方法求解前向能量最小细缝,具体做法为:
初始化图像宽度和高度,迭代次数k=0。然后进行第k次迭代,计算图像的行代价函数和列代价函数,以列为例,代价函数的计算通过以下公式循环迭代得到:
求解后我们得到最小的列代价函数,我们记住它的列号。同理计算水平方向的细缝的代价函数,记住它得行号。将所有行/列的代价函数进行对比,得到最小代价函数,设第l行为CostRl,设第l行为CostRl。代价函数CostRl对应的路径path(xy,y)即为低能量线,去除图像I(x,y)和语义加权图w(i,j)中低能量线对应位置的像素点。
C3、进一步根据低能量线path(xy,y)修正重要边缘描述子。对重要边缘Edge_imt的第k个点(xk,yk),如果y=yk且xk=xy则删除该点,边缘长度减1;如果y=yk且xk>xy,则xk=xk-1。
C4、计算重要信息变形的度量值。如果重要信息变形的度量值超过设定阈值指标,则终止细缝裁减算法,否则迭代次数k=k+1,修改图像宽度或高度,跳至C1中进行第k+1次迭代计算。
进一步地,所述步骤C4具体包括:
重要信息变形采取重要区域边缘即场地边缘变形来度量。设场地边缘描述子为
Edge_imt={(x1,y1),(x2,y2),......,(xn,yn)},t=1,2...T
根据本实施例中采用的图像的特点,我们采用两条场地边缘Edge_im1和Edge_im2,他们的坐标点分别为:A(119,102),B(351,131);C(0,169),A(119,102)。
根据坐标点A,B,C我们计算得到直线AB即L1:A1x+B1y+C1=0,直线AC即L2:A2x+B2y+C2=0。
随着图像放大或缩小,两条边缘的方向保持不变,而是平行移动。换句话讲,在边缘对应的直线方程L1:A1x+B1y+C1=0,L2:A2x+B2y+C2=0中,A1,A2和B1,B2保持不变,C1,,C2随着图像的缩放而变化。
用当前图像中边缘Edge_imt上的所有象素点采用最小均方误差方法计算Ct确定直线方程。
进一步,计算边缘Edge_imt所有点与拟合直线Lt的垂直距离(即点与拟合直线的偏移量):
寻找最大偏移量作为重要信息变形指标
变形度量准则采用阈值法,通过综合各种类型的直线变形训练得到阈值。本实施例中的阈值通过实验设定为1.5。如果重要信息变形的度量值大于设定阈值,停止细缝裁减。
D、当重要信息变形的度量值大于设定阈值时细缝裁减停止,接下来采用非均匀映射方法完成图像大小的自适应,使图像大小自适应为C1中设定的目标。将非均匀映射过程分为两个层次,首先处理不包含记分牌的图像区域即自然图像,然后处理记分牌区域即记分牌图像。细缝裁减方法的随机变形对以文字为主的记分牌区域有很大影响,记分牌区域直接从原始图像的记分牌图像进行映射。自然图像则从细缝裁减后的图像进行映射。
进一步地,所述步骤D具体包括:
D1、根据A步骤中得到的语义重要性统计值将自然图像分为重要区域和不重要区域,设定阈值将各语义区域重要性值二值化为重要区域和不重要区域。
D2、通过边缘检测来得到记分牌图像的重要区域即文字区域,剩下的部分为记分牌图像的非重要区域。
D3、对包含重要区域和非重要区域的自然图像和记分牌图像分别进行非均匀映射。先处理自然图像,得到记分牌区域的目标大小。以此为目标,采用相同的方法对原始记分牌图像进行非均匀映射,实现记分牌图像自适应。最后将其叠加到自然图像的自适应结果中,得到最终的自适应图像。
进一步地,所述步骤D3具体包括:
D31、图像共包含d个重要区域F=F1∪F2∪,...∪Fd。将图像分为K个矩形栅格区域,自然图像对应的栅格较大,记分牌图像对应的栅格较小。
D32、设原始栅格顶点经过非均匀映射后为V′={v′1,v′2.v′N},重要区域比例因子为SFIm,不重要区域比例因子为SFNIm。重要区域的比例因子分为行重要比例因子和列重要比例因子;行重要比例因子为目标图像宽度除以每行的重要区域象素数,列重要比例因子为目标图像高度除以每列的重要区域象素数。综合行与列重要比例因子综合求最大得到重要区域比例因子为SFIm,同理得到不重要区域比例因子。结合两个比例因子和重要区域F,得到相应顶点的重要性权值SI(vi)。
D33、计算V′={v′1,v′2,...v′N},使其在重要性权值SI(vi)的作用下尽可能接近原始图像中的栅格顶点V={v1,v2,...vN}。
Claims (6)
1.一种基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法,包括以下步骤:
A、读入视频序列图像,对当前图像帧提取用户对语义区域重要性主观评价的统计特征,并用来对基于底层特征的能量函数进行加权,得到语义加权的能量函数;
B、采用细缝裁剪方法逐步去除或者增加当前语义加权的图像帧中的细缝即低能量线来实现图像大小的自适应;随时监测重要信息变形,当这一度量达到某个阈值时即停止细缝算法;
C、当重要信息变形大于设定阈值时细缝裁减停止,采用非均匀映射方法完成图像大小的自适应,使图像大小自适应为设定的目标;非均匀映射过程分为两个层次,首先处理不包含记分牌的图像区域即自然图像,从细缝裁减后的图像进行映射;然后处理记分牌区域即记分牌图像,直接从原始图像的记分牌图像进行映射。
2.根据权利要求1所述的基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法,其特征在于,所述步骤A具体包括:
A1、对输入的当前图像帧划分语义区域并标定重要区和非重要区的语义边缘;语义区域包括场地区域、运动员区域、记分牌区域、关键对象区域、观众区域、广告牌区域等常用体育视频语义区域;根据语义重要性自动确定各个不同的语义区及边缘区内的权值,得到当前帧的语义权值函数;
A2、计算当前图像帧中每一个像素点的灰度值,得到图像帧的灰度函数;计算源图像每一个像素点灰度值和加权值的乘积,得到帧图像的加权灰度函数;
A3、计算源图像每一个像素点的能量值,能量值采用梯度能量来计算,得到帧图像的能量函数;根据梯度能量值计算前向能量值;计算当前图像帧中每一个像素点前向能量值和语义权值的乘积,得到当前图像帧的加权能量函数。
3.根据权利要求2所述的基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法,其特征在于,所述步骤A1具体包括:
31、请用户给各语义区域重要性打分,统计共m处语义区域重要性的分布,并计算其均值和方差,根据均值和方差确定语义区域Si的有效范围;
32、根据语义重要性自动确定语义加权值;设底层能量函数计算公式Φ(p),随机选取一些训练视频帧,统计语义区域Si的能量分布值pSi(Eng),
语义区域Si的重要性权值通过公式计算,
求出图像中的相应像素点的语义重要性权值为w(i,j)。
4.根据权利要求1所述的基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法,其特征在于,所述步骤B具体包括:
B1、设定输出目标图像的长宽大小;
B2、计算图像的行代价函数和列代价函数;将所有行/列的代价函数进行对比,得到最小代价函数,其对应的路径即为低能量线,去除图像和语义加权图w(i,j)中低能量线对应位置的像素点;
B3、根据低能量线path(xy,y)修正重要边缘描述子;对重要边缘Edge_imt的第k个点(xk,yk),如果y=yk且xk=xy则删除该点,边缘长度减1;如果y=yk且xk>xy,则xk=xk-1;
B4、计算重要信息变形的度量值;如果重要信息度量值超过设定阈值指标,则终止细缝裁减算法,否则迭代次数k=k+1,修改图像宽度或高度,跳至B1中进行第k+1次迭代计算。
5.根据权利要求4所述的基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法,其特征在于,所述步骤B4具体包括:
重要信息变形的度量值采取重要区域边缘即场地边缘变形来度量;设场地边缘描述子为
Edge_imt={(x1,y1),(x2,y2),......,(xn,yn)},t=1,2...T
随着图像放大或缩小,边缘Edge_imt的方向保持不变,而是平行移动;在边缘对应的直线方程It:Atx+Bty+Ct=0中,At和Bt保持不变,Ct随着图像的缩放而变化;用当前图像中边缘Edge_imt上的所有象素点采用最小均方误差方法计算Ct确定直线方程;进一步,计算边缘Edge_imt所有点与拟合直线Lt的垂直距离(即点与拟合直线的偏移量):
寻找最大偏移量作为重要信息变形指标
变形度量准则采用阈值法,通过综合各种类型的直线变形训练得到阈值;如果重要信息变形大于设定阈值,停止细缝裁减。
6.根据权利要求1所述的基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法,其特征在于,所述步骤C具体包括:
C1、根据A步骤中得到的语义重要性统计值将自然图像分为重要区域和不重要区域,设定阈值将各语义区域重要性值二值化为重要区域和不重要区域;
C2、通过边缘检测来得到记分牌图像的重要区域即文字区域,剩下的部分为记分牌图像的非重要区域;
C3、对包含重要区域和非重要区域的自然图像和记分牌图像分别进行非均匀映射;先处理自然图像,得到记分牌区域的目标大小;以此为目标,采用相同的方法对原始记分牌图像进行非均匀映射,实现记分牌图像自适应;最后将其叠加到自然图像的自适应结果中,得到最终的自适应图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102647395A CN101923703B (zh) | 2010-08-27 | 2010-08-27 | 基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102647395A CN101923703B (zh) | 2010-08-27 | 2010-08-27 | 基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101923703A true CN101923703A (zh) | 2010-12-22 |
CN101923703B CN101923703B (zh) | 2012-09-05 |
Family
ID=43338614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010102647395A Expired - Fee Related CN101923703B (zh) | 2010-08-27 | 2010-08-27 | 基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101923703B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102254300A (zh) * | 2011-07-04 | 2011-11-23 | 北京工业大学 | 一种基于内容的图像自适应缩放方法 |
CN102253800A (zh) * | 2011-06-15 | 2011-11-23 | 北京工业大学 | 一种有效的图像自适应方法 |
CN102354388A (zh) * | 2011-09-22 | 2012-02-15 | 北京航空航天大学 | 一种自适应计算图像底层特征重要性权重的方法 |
CN103226824A (zh) * | 2013-03-18 | 2013-07-31 | 上海交通大学 | 维持视觉显著性的视频重定向系统 |
CN103955887A (zh) * | 2014-04-11 | 2014-07-30 | 北京工业大学 | 基于内容的快速细缝裁剪与非均匀映射相结合的图像自适应方法 |
CN103974068A (zh) * | 2014-05-07 | 2014-08-06 | 电子科技大学 | 一种基于内容的视频尺寸缩小的方法 |
CN108389208A (zh) * | 2018-01-18 | 2018-08-10 | 复旦大学 | 一种基于语义分割的图像智能适配显示方法 |
CN109961078A (zh) * | 2017-12-22 | 2019-07-02 | 展讯通信(上海)有限公司 | 图像匹配及拼接方法、装置、系统、可读介质 |
CN116071357A (zh) * | 2023-03-07 | 2023-05-05 | 飞杨电源技术(深圳)有限公司 | 一种大功率充电器表面缺陷检测方法 |
CN116612389A (zh) * | 2023-07-20 | 2023-08-18 | 青建国际集团有限公司 | 一种建筑施工进度管理方法及系统 |
WO2023169318A1 (zh) * | 2022-03-11 | 2023-09-14 | 百果园技术(新加坡)有限公司 | 图像质量确定方法、装置、设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009070449A1 (en) * | 2007-11-30 | 2009-06-04 | Mitsubishi Electric Research Laboratories, Inc. | Content aware resizing of images and videos |
US20100142853A1 (en) * | 2008-12-09 | 2010-06-10 | Xerox Corporation | Iterative selection of pixel paths for content aware image resizing |
JP2010187376A (ja) * | 2009-02-12 | 2010-08-26 | Xerox Corp | 文書画像サイズ変更方法 |
-
2010
- 2010-08-27 CN CN2010102647395A patent/CN101923703B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009070449A1 (en) * | 2007-11-30 | 2009-06-04 | Mitsubishi Electric Research Laboratories, Inc. | Content aware resizing of images and videos |
US20100142853A1 (en) * | 2008-12-09 | 2010-06-10 | Xerox Corporation | Iterative selection of pixel paths for content aware image resizing |
JP2010187376A (ja) * | 2009-02-12 | 2010-08-26 | Xerox Corp | 文書画像サイズ変更方法 |
Non-Patent Citations (2)
Title |
---|
《ACM Transactions on Graphics》 20091231 Weiming Dong et al. Optimized Image Resizing Using Seam Carving and Scaling 全文 1-6 第28卷, 第5期 2 * |
《SIGGRAPH "08: SIGGRAPH 2008 》 20080831 Michael Rubinstein et al Improved Seam Carving for Video Retargeting 1-9 1-6 , 2 * |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102253800A (zh) * | 2011-06-15 | 2011-11-23 | 北京工业大学 | 一种有效的图像自适应方法 |
CN102253800B (zh) * | 2011-06-15 | 2013-03-06 | 北京工业大学 | 一种有效的图像自适应方法 |
CN102254300A (zh) * | 2011-07-04 | 2011-11-23 | 北京工业大学 | 一种基于内容的图像自适应缩放方法 |
CN102354388A (zh) * | 2011-09-22 | 2012-02-15 | 北京航空航天大学 | 一种自适应计算图像底层特征重要性权重的方法 |
CN102354388B (zh) * | 2011-09-22 | 2013-03-20 | 北京航空航天大学 | 一种自适应计算图像底层特征重要性权重的方法 |
CN103226824B (zh) * | 2013-03-18 | 2016-07-06 | 上海交通大学 | 维持视觉显著性的视频重定向系统 |
CN103226824A (zh) * | 2013-03-18 | 2013-07-31 | 上海交通大学 | 维持视觉显著性的视频重定向系统 |
CN103955887A (zh) * | 2014-04-11 | 2014-07-30 | 北京工业大学 | 基于内容的快速细缝裁剪与非均匀映射相结合的图像自适应方法 |
CN103974068A (zh) * | 2014-05-07 | 2014-08-06 | 电子科技大学 | 一种基于内容的视频尺寸缩小的方法 |
CN103974068B (zh) * | 2014-05-07 | 2017-07-07 | 电子科技大学 | 一种基于内容的视频尺寸缩小的方法 |
CN110490271A (zh) * | 2017-12-22 | 2019-11-22 | 展讯通信(上海)有限公司 | 图像匹配及拼接方法、装置、系统、可读介质 |
CN109961078A (zh) * | 2017-12-22 | 2019-07-02 | 展讯通信(上海)有限公司 | 图像匹配及拼接方法、装置、系统、可读介质 |
CN110490271B (zh) * | 2017-12-22 | 2021-09-21 | 展讯通信(上海)有限公司 | 图像匹配及拼接方法、装置、系统、可读介质 |
CN108389208A (zh) * | 2018-01-18 | 2018-08-10 | 复旦大学 | 一种基于语义分割的图像智能适配显示方法 |
CN108389208B (zh) * | 2018-01-18 | 2021-06-04 | 复旦大学 | 一种基于语义分割的图像智能适配显示方法 |
WO2023169318A1 (zh) * | 2022-03-11 | 2023-09-14 | 百果园技术(新加坡)有限公司 | 图像质量确定方法、装置、设备和存储介质 |
CN116071357A (zh) * | 2023-03-07 | 2023-05-05 | 飞杨电源技术(深圳)有限公司 | 一种大功率充电器表面缺陷检测方法 |
CN116612389A (zh) * | 2023-07-20 | 2023-08-18 | 青建国际集团有限公司 | 一种建筑施工进度管理方法及系统 |
CN116612389B (zh) * | 2023-07-20 | 2023-09-19 | 青建国际集团有限公司 | 一种建筑施工进度管理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN101923703B (zh) | 2012-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101923703B (zh) | 基于语义的细缝裁剪和非均匀映射相结合的图像自适应方法 | |
CN100541524C (zh) | 基于内容的互联网动画媒体垃圾信息过滤方法 | |
JP3740065B2 (ja) | 領域分割された映像の領域特徴値整合に基づいた客体抽出装置およびその方法 | |
Grundmann et al. | Discontinuous seam-carving for video retargeting | |
CN108898145A (zh) | 一种结合深度学习的图像显著目标检测方法 | |
CN102799669B (zh) | 一种商品图像视觉质量的自动分级方法 | |
US20130079911A1 (en) | Method and device for generating morphing animation | |
US20110050723A1 (en) | Image processing apparatus and method, and program | |
Sasithradevi et al. | A new pyramidal opponent color-shape model based video shot boundary detection | |
TW201009749A (en) | Method and apparatus for identifying foregrounds of visual content | |
CN101339661B (zh) | 一种基于手持设备运动检测的实时人机交互方法和系统 | |
JP2007251687A5 (zh) | ||
Kiess et al. | Seam carving with improved edge preservation | |
CN106991686A (zh) | 一种基于超像素光流场的水平集轮廓跟踪方法 | |
CN113205502A (zh) | 一种基于深度学习的绝缘子缺陷检测方法及其系统 | |
CN100565584C (zh) | 一种具有纠偏性的自然图像抠图的全局优化方法 | |
CN103226824A (zh) | 维持视觉显著性的视频重定向系统 | |
Wang et al. | Recurrent context aggregation network for single image dehazing | |
CN103955934A (zh) | 一种结合图像显著性区域分割的图像模糊检测算法 | |
CN109447970B (zh) | 基于能量转移和均匀缩放的图像重定向方法 | |
Lin et al. | Saliency-aware spatio-temporal artifact detection for compressed video quality assessment | |
Wang et al. | Perception-guided multi-channel visual feature fusion for image retargeting | |
TW200910261A (en) | Image processing methods and image processing apparatuses utilizing the same | |
Guttmann et al. | Content aware video manipulation | |
CN107862681B (zh) | 一种自拍图像质量推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120905 Termination date: 20140827 |
|
EXPY | Termination of patent right or utility model |