CN103902730A - 一种缩略图生成方法和系统 - Google Patents

一种缩略图生成方法和系统 Download PDF

Info

Publication number
CN103902730A
CN103902730A CN201410150911.2A CN201410150911A CN103902730A CN 103902730 A CN103902730 A CN 103902730A CN 201410150911 A CN201410150911 A CN 201410150911A CN 103902730 A CN103902730 A CN 103902730A
Authority
CN
China
Prior art keywords
thumbnail
grid
distortion
important area
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410150911.2A
Other languages
English (en)
Other versions
CN103902730B (zh
Inventor
卢汉清
王金桥
屈展
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CN201410150911.2A priority Critical patent/CN103902730B/zh
Publication of CN103902730A publication Critical patent/CN103902730A/zh
Application granted granted Critical
Publication of CN103902730B publication Critical patent/CN103902730B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/18Image warping, e.g. rearranging pixels individually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/20Linear translation of whole images or parts thereof, e.g. panning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种缩略图生成方法和系统,通过联合使用裁切、扭曲、缩放三种图像处理策略生成缩略图,发挥了不同策略的优势,并使其互相补充,使图像中的重要区域在缩略图中得到准确、完整、充分的显示,在缩略图的有限空间中实现了重要信息的最大化保留。本发明将以上三种图像处理策略通过一次统一的最优化过程实现,同时具有较少的时间开销。

Description

一种缩略图生成方法和系统
技术领域
本发明涉及到一种图像处理领域,特别涉及到一种生成图像缩略图的方法和系统。
背景技术
近年来,随着多媒体和互联网技术的不断发展,图像、视频等可视化数据呈爆炸式增长。为了快速浏览图像,手机、IPad、电脑等设备先将图像转换成小尺寸的缩略图,然后在屏幕上同时显示多幅图像的缩略图,以方便用户的浏览。
根据调查,当前几乎所有设备所采用的缩略图生成方法都是裁切或者均匀缩放。裁剪就是直接在原始图像中间截取一块目标尺寸区域作为缩略图,而均匀缩放则是将原始图像以固定的比例压缩至缩略图的尺寸。然而,均匀缩放往往导致图像中重要物体在缩略图中严重形变,裁切可能造成某些重要物体被全部或者部分丢弃。总之,这两种方法生成的缩略图难以有效地向用户传达信息,极大降低了用户视觉体验。
近年来,一些国外学者注意到了缩略图的实用意义以及所面临的困难,提出了一些新的方法。在《Proceedings of IEEE International Conference onComputer Vision》2012年发表的《Scale and object aware image retargetingfor thumbnail browsing》中,他们通过联合使用两种图像处理策略----缝雕刻与扭曲,来生成缩略图,该方法首先通过缝雕刻算法剔除图像中的非重要像素,生成一幅目标尺寸的缩略图,然后根据缩略图中各像素与源图像中像素的对应关系,计算出从原始图像到缩略图的最佳映射,再根据该映射将源图像映射成缩略图。该方法可以使缩略图中的大部分空间用于显示重要的物体,同时确保该物体不发生严重的形变。然而,缝雕刻方法容易破坏图像的几何结构,很多时候后续的扭曲策略也无法完全修复,生成的缩略图中重要物体依然会出现明显的形状改变,而且,该方法采用分阶段的方式逐一执行两种图像处理策略,带来了较大的时间开销,不利于实际应用。
发明内容
本发明的目的是为了解决缩略图中重要图像内容形变严重、损失过多、视觉体验较差的问题,而提出一种图像的缩略图生成方法和系统。该方法和系统将不同尺寸、规格和内容的图像处理成预设尺寸的缩略图,并且使该缩略图准确、完整、充分地显示图像中的重要内容,提升用户浏览效率和浏览体验。
根据本发明的一个方面,提出一种图像的缩略图的生成方法,包括:步骤1,获取待生成缩略图的源图片和待生成缩略图的目标尺寸;步骤2,根据重要性分析算法,计算源图片的重要性分布即每个像素的重要性;步骤3,将源图片均匀划分成M×N个网格,其中M是大于等于1的整数,N是大于等于1的整数,以及,根据图像的重要性分布,计算每个网格的重要性;步骤4,根据不同网格的重要性,使用裁剪、缩放、扭曲三种策略对网格进行变形,获得变形后的网格;步骤5,使源图像各网格内的图像内容适应变形后的网格,获得第一缩略图;步骤6,根据重要区域完整性检测策略,判定第一缩略图对重要区域的显示是否符合中重要区域完整性判定条件;步骤7,若第一缩略图符合重要区域完整性条件,则直接将第一缩略图作为第二缩略图;否则,利用裁切修正算法调整裁切策略的作用效果,重新获得第一缩略图;步骤8,根据重要区域充分性检测策略,判定第二缩略图对重要区域的显示是否符合中重要区域充分性判定条件;步骤9,若第二缩略图符合重要区域充分性条件,则直接将第二缩略图作为第三缩略图;否则,利用缩放修正算法调整缩放策略的作用效果,重新获得第二缩略图;步骤10,输出第三缩略图。
根据本发明的另一方面,还提出一种缩略图生成系统,该系统包括:图片获取单元,用于获取待生成缩略图的源图片和待生成缩略图的目标尺寸;重要性分析单元,用于根据重要性分析算法,计算源图片的重要性分布即每个像素的重要性;网格重要性确定单元,用于将源图片均匀划分成M×N个网格,其中M是大于等于1的整数,N是大于等于1的整数,以及,根据图像的重要性分布,计算每个网格的重要性;网格变形单元,根据不同网格的重要性,使用裁剪、缩放、扭曲三种策略对网格进行变形,获得变形后的网格;第一缩略图获取单元,使源图像各网格内的图像内容适应变形后的网格,获得第一缩略图;第一判定单元,根据重要区域完整性检测策略,判定第一缩略图对重要区域的显示是否符合中重要区域完整性判定条件;第二缩略图获取单元,若第一缩略图符合重要区域完整性条件,则直接将第一缩略图作为第二缩略图;否则,利用裁切修正算法调整裁切策略的作用效果,重新获得第一缩略图;第二判定单元,根据重要区域充分性检测策略,判定第二缩略图对重要区域的显示是否符合中重要区域充分性判定条件;第三缩略图获取单元,若第二缩略图符合重要区域充分性条件,则直接将第二缩略图作为第三缩略图;否则,利用缩放修正算法调整缩放策略的作用效果,重新获得第二缩略图;输出单元,输出第三缩略图。
本发明的缩略图生成系统和方法联合使用三种图像处理策略生成目标尺寸的缩略图,将三种策略融合在一个统一的最优化框架下实现,根据所生成缩略图对重要区域显示的完整程度来调整裁切策略的作用效果,根据所生成缩略图对重要区域显示的充分程度来调整缩放策略的作用效果。
本发明引入的裁切策略,将使图像中的重要区域被保存在缩略图中,而相对不重要的图像外围区域则被舍弃,这么做将节省缩略图本已十分有限的空间,使缩略图有限的空间尽可能用于集中展示图像的重要信息。
本发明所引入的扭曲策略,将使图像的重要区域在缩略图中保持原有的形状和几何结构,并同时扭曲处于各重要区域之间的不重要区域,使重要目标的空间排列发生改变,使其排列得更加紧密,有利于缩略图完整地概括所有重要目标。
本发明所引入的缩放策略,将使重要区域在缩略图中保持一个合适的尺度,避免重要目标发生过度的缩小,影响用户的浏览和辨认,有利于缩略图有效地向用户传达信息。
本发明通过联合使用裁切、扭曲、缩放三种图像处理策略处理图像,发挥了不同策略的优势,并使其互相补充,使图像中的重要区域在缩略图中得到准确、完整、充分的显示,在缩略图的有限空间中实现了重要信息的最大化保留。
本发明将三种图像处理策略融合成一个统一的凸规划问题,通过一次数值优化即可求解,相较于采用分阶段的方式逐步执行各策略,这种统一的融合有效降低了算法的复杂度。
本发明定义的缩略图完整性判定条件和充分性判定条件可以评价当前缩略图对重要区域显示的完整程度和充分程度。
本发明所引入的缩略图完整性修正算法,对重要区域显示不完整的缩略图,相应地调整裁切策略的作用效果,使再次生成的缩略图包含更多重要区域,有效改进缩略图中重要区域的完整性。
本发明所引入的缩略图充分性修正算法,对重要区域显示不充分的缩略图,相应地调整缩放策略的作用效果,使再次生成的缩略图中重要区域占据更多空间,有效改进缩略图中重要区域的充分性。
附图说明
图1所示为本发明中的缩略图生成方法示意图;
图2所示为本发明中的缩略图生成系统示意图;
图3所示为缩略图生成系统中重要区域分析模块示意图;
图4所示为缩略图生成系统中最优化模块示意图;
图5所示为缩略图生成系统中完整性修正模块示意图;
图6所示为缩略图生成系统中充分性修正模块示意图;
图7所示为本发明重要性分析算法实施例示意图;
图8所示为本发明采用三种策略处理图像生成缩略图实施例示意图;
图9所示为本发明完整性、充分性修正算法修正缩略图实施例示意图;
图10所示为本发明与已有算法处理实施例对比示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
本发明的主要思想是同时使用三种图像处理策略来生成缩略图,使得重要的图像内容得以在缩略图中准确、完整、充分的显示,使缩略图最大化地保留原始图像的重要信息,提高用户的浏览效率和浏览体验,同时降低算法复杂度。
下面首先对本发明涉及到的术语进行解释:
裁切:位于裁切窗口内的图像内容被保留,而裁剪窗口外的区域则被丢弃。本发明中的裁切策略将优先保留图像的重要区域,而将不重要区域裁切掉。
扭曲:改变图像或者图像某个区域的形状,这种形状改变不包括等比例的放大或缩小,比如正方形区域被放大成一个边长更长的正方形并不视为形状改变,而正方形被拉伸成长方形则视为形状改变。本发明中的扭曲策略是使重要区域保持原有的形状,而改变不重要区域的形状。
缩放:将图像或者图像的某个区域放大成原图或者原区域的N倍,或者缩小成原图或者原区域的1/N倍,其中N大于1。本方法中的缩放策略是将重要区域缩放到一个相对较大的尺寸,而缩小不重要区域的尺寸。
变形:该处含义不仅仅指改变图像的形状,而是对图像内容广义的改变,包括改变图像某区域的形状和位置。本发明中通过裁切、扭曲、缩放三种策略处理过的图像被视为发生变形。
图1示出了本发明中缩略图生成方法的实施例的步骤流程图。如图1所示,本发明的缩略图生成方法包括以下步骤:
步骤101,获取待生成缩略图的源图像和该缩略图的尺寸;该处的源图像可以是任意尺寸和规格的图像数据,包括网络图片、数码相机照片到视频中捕捉到的一帧。该处待生成缩略图的目标尺寸可以是所述缩略图的宽WT和高HT
步骤102,根据重要性分析算法,计算目标图像的重要性分布,并且进一步划分出重要区域和非重要区域;计算图像重要分布包括以下步骤:
先根据显著性图计算算法,计算图像的显著性图,其中显著性图计算算法可以参考《IEEE Transactions on Pattern Analisis and MachineIntelligence》1998年的《A model of saliency-based visual attentionfor rapid scene analysis》中的方法。
然后根据人脸检测算法,检测目标图像的人脸所在区域;根据人脸检测结果生成人脸区域图。具体地,在人脸区域图中,将人脸所在区域的像素赋予较高的灰度值(如255),将其他区域的像素赋予较低的灰度值,其中人脸检测算法可以参考文献《International Journal on ComputerVision》2004年《Robust real-time face detection》中的方法。
对于目标图像每个像素,在显著性图和人脸区域图中找到相应位置的像素的灰度值,并取两个灰度值中较大的一个作为该像素的重要性值,获得重要性分布图:
I(i,j)=max(Is(i,j),If(i,j))
I(i,j)是原始图像中像素(i,j)的重要性图值,Is(i,j)和If(i,j)分别是像素(i,j)的显著性图值和人脸区域图值。
如图7所示为该重要性分析算法示意图。
步骤103,将目标图像均匀划分成M×N个网格;其中M是网格的行数大于等于1的整数,N是网格的列数大于等于1整数,以及,统计每个网格中所有像素的重要性分布,并相应地计算出各网格的重要性值;
步骤104,根据预置规则及各网格的重要性,使用裁切、缩放、扭曲三种策略对网格进行变形。这种处理是通过最小化目标函数实现的。首先,构建以网格顶点坐标为变量的缩略图目标函数,该函数为与裁切、扭曲、缩放三种策略相对应的裁切能量函数、扭曲能量函数和缩放能量函数的线性加权和;然后,根据求解算法,求解出使得总能量函数值最小的网格顶点新坐标。
具体地,为本实施例构建以网格顶点坐标为变量的优化模型,说明步骤104。
第一步,定义裁切窗口,裁切窗口的左上顶点与右下顶点坐标分别为(0,0)、(WT,HT),初始化原始网格顶点坐标,这里WT,HT是待生成缩略图的宽和高,该实施例中设为120、120。
第二步,分别构建对应扭曲、裁切、缩放策略的扭曲能量函数、裁切能量函数和缩放能量函数DW、DC和Ds。下面将具体给出DW、DC和Ds的计算方法。
所有网格总的形状改变DW的计算公式为:
D W = Σ i , j M , N I ij · d W ( q ij )
Iij为每个网格的重要性,dW(·)为网格的形状改变程度,qij为第i列第j行的网格。本实施例中网格变形程度dW(qij)的计算公式为
d W ( q ij ) = Σ l 4 | | s ij ( v ij l ) - v ~ ij l | | 2 2
Figure BDA0000491470180000082
Figure BDA0000491470180000083
分别为变形前和变形后网格q的第l个顶点坐标,sq(·)为相似性变换,即对网格按照sq(·)进行变换,变换后的网格与原始网格形状视为相同。本实施例中对网格的顶点v按照sq(·)进行变换的计算公式为 s q ( v ) = c 0 0 c x y + t x t y , c为正数,tx、ty为实数,x、y分别为顶点v的横坐标和纵坐标。
为提高计算效率,根据《Computer Graphics Forum》2009年中《Ashape-preserving approach to image resizing》的方法,本实施例中利用最小二乘法将 D W = Σ i , j M , N I ij · d W ( q ij ) = Σ i , j M , N I ij · Σ l 4 | | s ij ( v ij l ) - v ~ ij l | | 2 2 转化成另一种计算形式:
D W = Σ i , j M , N I ij · | | ( A ij ( A ij T A ij ) - 1 A ij T - I ) b ~ ij | | 2 2
其中,
A ij = x ij 1 1 0 y ij 1 0 1 . . . . . . . . . x ij 4 1 0 y ij 4 0 1 , b ~ ij = x ~ ij 1 y ~ ij 1 . . . x ~ ij 4 y ~ ij 4
Figure BDA0000491470180000088
Figure BDA0000491470180000089
分别是网格qij变形前和变形后第l顶点的纵坐标,
Figure BDA00004914701800000810
Figure BDA00004914701800000811
分别是网格qij变形前和变形后第l顶点的横坐标。
最小化DW将保留重要性高的网格的形状而扭曲重要性低的网格,在缩略图中,这意味着该项能量函数可以在保存重要目标形状的同时,扭曲各目标之间的不重要区域,使各重要目标排列得更加紧密。
裁切能量函数DC具体计算公式如下:
D C = Σ i , j M , N ( D c x ( q ij ) + D c y ( q ij ) ) · I ij
其中,
D c x ( i , j ) = ( - 1 ) · ( x ~ ij q · ( W T - x ~ ij q ) ) x ~ ij q ∉ [ 0 , W T ] ( - δ ) · ( x ~ ij q · ( W T - x ~ ij q ) 1 δ + δ - 1 x ~ ij q ∈ [ 0 , W T ]
D c y ( i , j ) = ( - 1 ) · ( y ~ ij q · ( H T - y ~ ij q ) ) y ~ ij q ∉ [ 0 , H T ] ( - δ ) · ( y ~ ij q · ( H T - y ~ ij q ) 1 δ + δ - 1 y ~ ij q ∈ [ 0 , H T ] ,
Figure BDA0000491470180000094
分别代表变形后网格的质心坐标,δ是一个大于1的正数,该实施例中设为9,WT和HT为待生成缩略图的目标尺寸。
最小化DC裁切能量函数DC,将使重要性高的网格被放置在裁切窗口之内,而把重要性低的网格放在窗口外;
缩放能量函数DS的计算公式为:
D S = Σ i , j M , N [ l d · ( c ij - 1 ) ] 2 · I ij
其中ld是原始网格的对角线长度,cij是相似性变换中的一个正参数,其计算公式为:
[ c , t x , t y ] ij T = ( A ij T A ij ) - 1 A ij T b ~ ij
cij对应当前网格被缩放的程度,其值大于1说明网格被放大,值小于1说明网格被缩小,等于1说明网格保持原始大小。tx,ty分别对应当前网格的水平方向偏移量和垂直方向偏移量。
最小化DS将使重要性高的网格保持与原始网格相同的大小,而使重要性低的网格收缩,这将使缩略图中的大部分显示空间用来显示重要区域。
第二步:构建优化模型的目标函数,即计算三种能量函数的线性加权和:
D=DW+λDC+μDS
λ和μ分别为DC和DS的权重,该实施例中初步设置为0.025和6。DW为所有网格变形程度的加权和,DC为所有网格裁剪能量的加权和,DS为所有网格尺度变化的加权和,
第三步:使用一个基于共轭梯度法的数值优化器求解该目标函数。该目标函数被构造为凸函数,可以通过数值优化器迭代求解局部最优解来得到全局最优解,同时该函数主要由二次函数构成,共轭梯度法可以以很高的效率求得目标函数的最优解、即新的网格顶点坐标。
步骤105,根据新的各网格顶点坐标,将原始网格中的图像内容渲染到新的网格中去,以及,将裁切窗口之外的图像内容丢弃,将裁切窗口之内的图像内容作为当前生成的第一缩略图。
如图所示为本实施例中目标函数通过逐步纳入三种能量函数进行优化,获得的变形后网格及生成的缩略图,从图中可以更加直观地理解三种策略的作用效果。
步骤106,根据重要区域完整性判定条件,判断第一缩略图中重要区域保留得是否完整;若重要区域保留完整,则转入步骤108;否则,转入步骤107,修正缩略图对重要区域显示的完整性。
重要区域完整性判定条件为:计算被保留在缩略图中的所有网格的重要性之和与原始图片中所有网格的重要性之和的比例,并与预设阈值比较,其中,预设阈值的取值大于0.2。
Σ q ~ ij ∈ Q ~ within I ij Σ q ij ∈ Q ≥ TH cplt
其中,是变形后处于裁切窗口之内的网格的集合,Q是所有网格的集合,THcplt为预设阈值,本实施案例中设为0.6,即当缩略图中保存的重要区域超过全部重要区域60%时,认为当前缩略图对重要目标的保存已足够完整。
步骤107,对不满足重要区域完整性判定条件的缩略图,利用完整性修正算法加以修正。
具体而言,当第一缩略图不符合重要区域完整性条件时,说明当前的裁切操作裁掉了过多的重要信息。因此,需要调整裁切策略使得重要物体得到完整呈现。完整性修正算法通过修正优化模型目标函数中裁切能量函数的权重来实现对裁切策略的调整。
通过本实施例进一步说明:
第一步:修改优化模型的目标函数:
D′=(D+λincDC)
其中,λinc是裁切能量函数权重的修正量,λinc的值根据D的最优解x*的情况以两种方式确定:
若该最优解在可行解空间内,则
Figure BDA0000491470180000113
其中
Figure BDA0000491470180000114
Lstep是常数的距离步长,在该实施例中设为100。
若该最优解在可行解空间的边界上,则通过解以下二次函数得到λinc
( ▿ D | x * 2 + λ inc ▿ D C | x * · ▿ D | x * ) 2 ▿ D | x * + λ inc ▿ D C | x * 2 · ▿ D | x * 2 = cos 2 A step
Astep是常数的角度步长,在该实施例中设为20度。
第二步:以D的最优解x*为初始点,重新进行最优化,求解出最小化D′的最优解,从而得到新的网格顶点坐标。根据新的网格坐标和裁切窗口重新生成第一缩略图。
第三步:检测该缩略图是否满足重要物体完整性条件,若满足,则停止运算,将该缩略图作为第二缩略图,若不满足,则将D′作为D,返回第一步
步骤108,根据重要区域显示充分性判定条件,判断第二缩略图中重要区域显示得是否充分;若重要区域占据了缩略图的大部分面积,已经得到充分显示,则转入步骤110;否则,转入步骤109,修正缩略图对重要区域显示的充分性。
重要区域显示充分性判定条件为:计算被保留在缩略图中的所有网格的面积的重要性加权和与缩略图显示面积的比例,并与预设阈值比较,其中,预设阈值的取值大于0.2。
Σ q ~ ij ∈ Q ~ within S ( q ~ ij ) · I ij W T × H T ≥ TH sfct
其中
Figure BDA0000491470180000122
计算了变形后的网格
Figure BDA0000491470180000123
的面积,THsfct为预设阈值,本实施案例中设为0.5,即当缩略图中重要区域占据的面积超过缩略图面积50%时,认为当前缩略图对重要目标的显示已足够充分。
步骤109,对不满足重要区域充分性判定条件的缩略图,利用充分性修正算法加以修正。
具体而言,当第二缩略图不符合重要区域显示充分性条件时,说明当前的缩放操作过度地缩小了重要区域。因此,需要调整缩放策略使得重要物体得到充分呈现。缩放效果修正算法通过修正优化模型目标函数中缩放能量函数的权重来实现对缩放策略的调整。
通过本实施例进一步说明,该缩放策略修正算法首先修改优化模型的目标函数:
D′=(D+μincDS)
其中,μinc是缩放能量函数权重的修正量,μinc的计算及生成改进效果的缩略图按照与步骤109相同的方式实现。
如图9所示,本发明所使用的效果修正算法可以在每次修正中有效地调整缩略图中裁切和缩放策略的效果,并在有限步内停止,得到重要目标保存完整,展示充分的输出缩略图。
步骤110,接受满足重要区域完整性、充分性判定条件的缩略图作为输出。
如图10所示,为本方法所产生的缩略图样例,及其分别于等比例缩放、《Computer Graphics Forum》2009年中的《A shape-preservingapproach to image resizing》、《ACM Transactions on Graphics》2008年的《Improved seam carving for video retargeting》与《Proceedingsof IEEE International Conference on Computer Vision》2012年发表的《Scale and object aware image retargeting for thumbnail browsing》中方法的处理结果对比,从图中可以直观的了解到图像的重要区域得到了准确、完整、充分的展示。在图10中,a为等比例缩放算法,b为《ComputerGraphics Forum》2009年中的《A shape-preserving approach to imageresizing》的方法,c为《ACM Transactions on Graphics》2008年的《Improved seam carving for video retargeting》的方法,d为《Proceedings of IEEE International Conference on Computer Vision》2012年发表的《Scale and object aware image retargeting forthumbnail browsing》,e为本发明方案。
以上实施例通过一系列的措施实现了对图像缩略图的生成,实现了该缩略图生成方法与装置,与常规方法相比,可以使图像中的重要区域在缩略图中得到准确、完整、充分的显示,在缩略图的有限空间中实现了重要信息的最大化保留。同时具有较低得时间开销,有广泛的应用前景。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种缩略图的生成方法,其特征在于,包括:
步骤1,获取待生成缩略图的源图片和待生成缩略图的目标尺寸;
步骤2,根据重要性分析算法,计算源图片的重要性分布即每个像素的重要性;
步骤3,将源图片均匀划分成M×N个网格,其中M是大于等于1的整数,N是大于等于1的整数,以及,根据图像的重要性分布,计算每个网格的重要性;
步骤4,根据不同网格的重要性,使用裁剪、缩放、扭曲三种策略对网格进行变形,获得变形后的网格;
步骤5,使源图像各网格内的图像内容适应变形后的网格,获得第一缩略图;
步骤6,根据重要区域完整性检测策略,判定第一缩略图对重要区域的显示是否符合中重要区域完整性判定条件;
步骤7,若第一缩略图符合重要区域完整性条件,则直接将第一缩略图作为第二缩略图;否则,利用裁切修正算法调整裁切策略的作用效果,重新获得第一缩略图;
步骤8,根据重要区域充分性检测策略,判定第二缩略图对重要区域的显示是否符合中重要区域充分性判定条件;
步骤9,若第二缩略图符合重要区域充分性条件,则直接将第二缩略图作为第三缩略图;否则,利用缩放修正算法调整缩放策略的作用效果,重新获得第二缩略图;
步骤10,输出第三缩略图。
2.根据权利要求1所述的生成方法,所述重要性分析算法,计算源图片的重要性分布,进一步包括:
步骤201,根据显著性图计算算法,计算源图片的显著性图;
步骤202,根据人脸检测算法,检测源图片的人脸区域,然后根据人脸检测结果生成人脸区域图;
步骤3,同时根据人脸区域图和显著性图,生成源图片的重要性分布;
其中,根据人脸检测结果生成人脸区域图的方式为:将人脸所在区域的像素赋予较高的灰度值,该灰度值的取值范围为150~255,将其他区域的像素赋予较低的灰度值,该灰度值的取值范围为1~100。
3.根据权利要求1所述的生成方法,步骤4进一步包括:使用扭曲策略保持重要区域的形状,而扭曲重要区域之间的不重要区域,使用裁切策略和缩放策略使变形后的网格同时满足裁切要求、扭曲要求、缩放要求。
4.根据权利要求3所述的生成方法,其特征在于:
所述裁切要求为:网格的重要性越高,变形后的网格的位置与裁切窗口中心的距离越近;
其中,单个网格与裁切窗口中心距离的计算方式为:变形后网格的质心距离裁切窗口中心的距离的平方和,包括:根据网格的四个顶点,计算当前变形后网格的质心坐标;根据变形后网格的质心坐标,计算质心与裁切窗口中心的距离;计算所述距离的平方。
5.根据权利要求3所述的生成方法,其特征在于:
缩放要求为:网格的重要性越高,变形后的网格与原始网格相比尺度差异越小。
其中,单个网格与原始网格尺度差异的计算方式为:变形后网格的平均对角线长度与原始网格对角线长度之差的平方和,包括:根据网格的四个顶点,计算当前变形后网格的尺度参数,该参数取值为正值,在0到1的范围内,说明该网格变形后发生了尺度缩小;大于1,说明该网格变形后发生尺度扩大;等于1说明该网格尺度未发生变化;根据变形后网格的尺度参数,计算变形后网格的平均对角线长度与原始网格对角线长度之差;计算所述长度差的平方。
6.根据权利要求1所述的生成方法,其特征在于,步骤5进一步包括:
根据变形后网格的四个顶点坐标与原始网格的四个顶点坐标,计算从原始网格到变形后网格的最佳平面投影关系,即一个二维的线性映射;
根据最佳平面投影关系,将原始网格内的各像素投影到变形后的网格中,使原始图像内容适应新的网格;
根据图像变形后像素的位置和裁切窗口的位置,丢弃处于裁切窗口之外的像素,保留裁切窗口之内像素作为第一缩略图。
7.根据权利要求1所述的生成方法,其特征在于,重要物体完整性判定条件为:缩略图中所有像素的重要性之和与源图片中所有像素的重要性之和的比例大于预设阈值,其中,预设阈值的取值大于0.2。
8.如权利要求1所述的方法,其特征在于,步骤7中利用裁切修正算法调整裁切策略的作用效果,重新获得第一缩略图的步骤进一步包括:对不满足重要物体完整性判定条件的缩略图,调整裁切策略的作用效果,即调整裁切要求,使重要网格距离裁切窗口中心的距离更近,减少变形后处于裁切窗口之外的像素数量。
9.根据权利要求1所述的生成方法,其特征在于,重要物体充分性判定条件为:缩略图中重要像素所占的面积与缩略图面积比例大于预设阈值,其中,预设阈值的取值大于0.2。
10.如权利要求1所述的方法,其特征在于,利用缩放修正算法调整缩放策略的作用效果,重新获得第二缩略图的步骤包括:对不满足重要物体充分性判定条件的缩略图,调整缩放策略的作用效果,即调整缩放要求,使重要网格的尺度与原始网格的尺度差异更小,增大变形后重要区域占据的面积。
11.一种缩略图生成系统,其特征在于,包括:图片获取单元,用于获取待生成缩略图的源图片和待生成缩略图的目标尺寸;
重要性分析单元,用于根据重要性分析算法,计算源图片的重要性分布即每个像素的重要性;
网格重要性确定单元,用于将源图片均匀划分成M×N个网格,其中M是大于等于1的整数,N是大于等于1的整数,以及,根据图像的重要性分布,计算每个网格的重要性;
网格变形单元,根据不同网格的重要性,使用裁剪、缩放、扭曲三种策略对网格进行变形,获得变形后的网格;
第一缩略图获取单元,使源图像各网格内的图像内容适应变形后的网格,获得第一缩略图;
第一判定单元,根据重要区域完整性检测策略,判定第一缩略图对重要区域的显示是否符合中重要区域完整性判定条件;
第二缩略图获取单元,若第一缩略图符合重要区域完整性条件,则直接将第一缩略图作为第二缩略图;否则,利用裁切修正算法调整裁切策略的作用效果,重新获得第一缩略图;
第二判定单元,根据重要区域充分性检测策略,判定第二缩略图对重要区域的显示是否符合中重要区域充分性判定条件;
第三缩略图获取单元,若第二缩略图符合重要区域充分性条件,则直接将第二缩略图作为第三缩略图;否则,利用缩放修正算法调整缩放策略的作用效果,重新获得第二缩略图;
输出单元,输出第三缩略图。
CN201410150911.2A 2014-04-15 2014-04-15 一种缩略图生成方法和系统 Active CN103902730B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410150911.2A CN103902730B (zh) 2014-04-15 2014-04-15 一种缩略图生成方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410150911.2A CN103902730B (zh) 2014-04-15 2014-04-15 一种缩略图生成方法和系统

Publications (2)

Publication Number Publication Date
CN103902730A true CN103902730A (zh) 2014-07-02
CN103902730B CN103902730B (zh) 2017-05-03

Family

ID=50994052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410150911.2A Active CN103902730B (zh) 2014-04-15 2014-04-15 一种缩略图生成方法和系统

Country Status (1)

Country Link
CN (1) CN103902730B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608261A (zh) * 2015-12-20 2016-05-25 河南思维自动化设备股份有限公司 无颜色损耗的鸟瞰图的生成方法
CN105956999A (zh) * 2016-04-28 2016-09-21 努比亚技术有限公司 缩略图生成装置和方法
CN106251283A (zh) * 2016-07-28 2016-12-21 乐视控股(北京)有限公司 一种缩略图生成方法及设备
CN106408508A (zh) * 2015-07-30 2017-02-15 腾讯科技(深圳)有限公司 一种图像变形处理方法及装置
CN106570195A (zh) * 2016-11-18 2017-04-19 广东小天才科技有限公司 一种基于位置的照片搜索方法及装置、用户设备
CN112532871A (zh) * 2020-11-11 2021-03-19 浙江大华技术股份有限公司 图像下采样方法、电子设备及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063085B (zh) * 2018-07-26 2021-07-13 创新先进技术有限公司 缩略图生成方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1655577A (zh) * 2004-02-12 2005-08-17 施乐公司 产生缩小尺寸的图像的方法和装置
CN1674632A (zh) * 2004-03-25 2005-09-28 日本电气株式会社 图像处理设备和方法
CN101065959A (zh) * 2004-10-05 2007-10-31 诺基亚公司 用于检验数字图像的取景和锐度的系统和方法
CN102365651A (zh) * 2009-03-26 2012-02-29 皇家飞利浦电子股份有限公司 用于通过使用基于色彩频率的显著图来修改图像的方法和装置
US20120287152A1 (en) * 2009-12-01 2012-11-15 Sony Computer Entertainment Inc. Information processing device, and information processing system
US20130107069A1 (en) * 2011-11-01 2013-05-02 Nokia Corporation Apparatus and Method for Forming Images

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1655577A (zh) * 2004-02-12 2005-08-17 施乐公司 产生缩小尺寸的图像的方法和装置
CN1674632A (zh) * 2004-03-25 2005-09-28 日本电气株式会社 图像处理设备和方法
CN101065959A (zh) * 2004-10-05 2007-10-31 诺基亚公司 用于检验数字图像的取景和锐度的系统和方法
CN102365651A (zh) * 2009-03-26 2012-02-29 皇家飞利浦电子股份有限公司 用于通过使用基于色彩频率的显著图来修改图像的方法和装置
US20120287152A1 (en) * 2009-12-01 2012-11-15 Sony Computer Entertainment Inc. Information processing device, and information processing system
US20130107069A1 (en) * 2011-11-01 2013-05-02 Nokia Corporation Apparatus and Method for Forming Images

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
施美玲等: "内容感知图像缩放技术综述", 《中国图象图形学报》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106408508A (zh) * 2015-07-30 2017-02-15 腾讯科技(深圳)有限公司 一种图像变形处理方法及装置
CN105608261A (zh) * 2015-12-20 2016-05-25 河南思维自动化设备股份有限公司 无颜色损耗的鸟瞰图的生成方法
CN105608261B (zh) * 2015-12-20 2019-04-12 河南思维自动化设备股份有限公司 无颜色损耗的鸟瞰图的生成方法
CN105956999A (zh) * 2016-04-28 2016-09-21 努比亚技术有限公司 缩略图生成装置和方法
CN105956999B (zh) * 2016-04-28 2020-08-28 努比亚技术有限公司 缩略图生成装置和方法
CN106251283A (zh) * 2016-07-28 2016-12-21 乐视控股(北京)有限公司 一种缩略图生成方法及设备
CN106570195A (zh) * 2016-11-18 2017-04-19 广东小天才科技有限公司 一种基于位置的照片搜索方法及装置、用户设备
CN112532871A (zh) * 2020-11-11 2021-03-19 浙江大华技术股份有限公司 图像下采样方法、电子设备及存储介质
CN112532871B (zh) * 2020-11-11 2022-07-15 浙江大华技术股份有限公司 图像下采样方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN103902730B (zh) 2017-05-03

Similar Documents

Publication Publication Date Title
CN103902730A (zh) 一种缩略图生成方法和系统
US11107232B2 (en) Method and apparatus for determining object posture in image, device, and storage medium
CN111598998B (zh) 三维虚拟模型重建方法、装置、计算机设备和存储介质
CN110363116B (zh) 基于gld-gan的不规则人脸矫正方法、系统及介质
CN102741879B (zh) 由单眼图像产生深度图的方法及其系统
US20150170400A1 (en) Depth map generation using bokeh detection
CN103019537B (zh) 一种图像预览方法及装置
CN103383700B (zh) 基于边缘方向差直方图的图像检索方法
CN111524145A (zh) 图片智能裁剪方法、系统、计算机设备及存储介质
CN104574311A (zh) 图像处理方法和装置
CN104867125B (zh) 获取图像的方法以及装置
CN104463873B (zh) 一种基于局部均匀缩放的图像目标重定位方法
CN103226824B (zh) 维持视觉显著性的视频重定向系统
CN110662014B (zh) 一种光场相机四维数据大景深三维显示的方法
CN102905136B (zh) 一种视频编解码方法、系统
CN110909724A (zh) 一种多目标图像的缩略图生成方法
WO2022148248A1 (zh) 图像处理模型的训练方法、图像处理方法、装置、电子设备及计算机程序产品
JP2018151887A (ja) 画像処理装置、画像処理方法およびプログラム
CN115294055A (zh) 图像处理方法、装置、电子设备和可读存储介质
Chai et al. MSTGAR: Multioperator-based stereoscopic thumbnail generation with arbitrary resolution
Xia et al. Perceptually guided photo retargeting
US9392146B2 (en) Apparatus and method for extracting object
CN111191729B (zh) 一种基于多模态特征融合的三维对象融合特征表示方法
Wang et al. Adaptive content condensation based on grid optimization for thumbnail image generation
CN102708570A (zh) 获取深度图的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant