CN105956999B - 缩略图生成装置和方法 - Google Patents
缩略图生成装置和方法 Download PDFInfo
- Publication number
- CN105956999B CN105956999B CN201610278002.6A CN201610278002A CN105956999B CN 105956999 B CN105956999 B CN 105956999B CN 201610278002 A CN201610278002 A CN 201610278002A CN 105956999 B CN105956999 B CN 105956999B
- Authority
- CN
- China
- Prior art keywords
- original picture
- thumbnail
- features
- salient region
- feature map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000013507 mapping Methods 0.000 claims description 62
- 238000000605 extraction Methods 0.000 claims description 5
- 238000004891 communication Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 238000010295 mobile communication Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 101150012579 ADSL gene Proteins 0.000 description 1
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 1
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明公开了一种缩略图生成装置和方法,该装置包括:区域识别模块,用于识别原始图片中的显著性区域;缩略图模块,用于根据显著性区域对原始图片进行裁剪,得到原始图片的缩略图,其中缩略图中包括显著性区域。根据本发明,首先识别出原始图片中的显著性区域,而显著性区域中通常反映了图片的关键信息,则根据显著性区域对原始图片进行裁剪,得到的缩略图中必然包含该显著性区域,即缩略图中包含原始图片的关键信息,提高了生成的缩略图的信息有效性,提高了用户查看缩略图的效率,进而能够提升终端产品的用户体验。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种缩略图生成装置和方法。
背景技术
目前在移动终端的相册、文件管理器等应用中预览大量图片时,通常生成图片的缩略图来为用户提供预览。目前缩略图的生成规则主要有两种:
(1)基于裁剪:按照目标图像面积对原图像进行裁剪生成,其中按裁剪的角度可分为向左、向右、向上、向下、中间裁剪;(2)基于缩放:根据原图的宽高比,等比例缩小或放大到适合目标图像面积的大小进行生成。
目前这两种缩略图生成方案都存在明显的缺陷:基于裁剪的方案,导致可能经过裁剪丢失原始图片的关键信息,导致缩略图没有明显表征意义;基于缩放的方案,在原图与缩略图目标面积宽高比例值相差较大时,会导致最终生成的缩略图边缘没有图像信息,出现白边,从而影响缩略图在终端上的显示效果。
发明内容
本发明的主要目的在于提出一种缩略图生成装置和方法,旨在解决缩略图中易丢失原始图片关键信息的问题。
为实现上述目的,本发明提供的一种缩略图生成装置,包括:区域识别模块,用于识别原始图片中的显著性区域;缩略图模块,用于根据所述显著性区域对所述原始图片进行裁剪,得到所述原始图片的缩略图,其中所述缩略图中包括所述显著性区域。
可选地,前述的装置,还包括:特征提取模块,用于提取所述原始图片中不同位置的特征;特征图模块,用于将所述原始图片中不同位置的特征映射为所述原始图片的特征图,所述特征图中具有对应于所述原始图片中不同位置的特征的映射值;映射值获取模块,用于根据所述特征图中的映射值大小,从所述特征图中选择部分位置的特征对应的映射值;所述区域识别模块根据所选映射值对应的部分位置,从所述原始图片中识别所述显著性区域。
可选地,前述的装置,所述特征图模块在所述原始图片每个位置具有多种特征时,根据预设的对应不同特征种类的权重,将所述原始图片每个位置的多种特征映射为一个对应的映射值。
可选地,前述的装置,所述缩略图模块根据预设的目标图像面积,对所述原始图片进行缩放,使缩放后所述原始图片中的所述显著性区域的面积与所述目标图像面积相符,并从所述原始图片中裁剪下包含所述显著性区域的所述缩略图。
可选地,前述的装置,所述缩略图模块以所述显著性区域为所述缩略图的中心,按照预设的目标图像面积对所述原始图片进行裁剪得到所述缩略图。
为实现上述目的,本发明还提供了一种缩略图生成方法,包括:识别原始图片中的显著性区域;根据所述显著性区域对所述原始图片进行裁剪,得到所述原始图片的缩略图,其中所述缩略图中包括所述显著性区域。
可选地,前述的方法,识别原始图片中的显著性区域,具体包括:提取所述原始图片中不同位置的特征;将所述原始图片中不同位置的特征映射为所述原始图片的特征图,所述特征图中具有对应于所述原始图片中不同位置的特征的映射值;根据所述特征图中的映射值大小,从所述特征图中选择部分位置的特征对应的映射值;根据所选映射值对应的部分位置,从所述原始图片中识别所述显著性区域。
可选地,前述的方法,将所述原始图片中不同位置的特征映射为所述原始图片的特征图,所述特征图中具有对应于所述原始图片中不同位置的特征的映射值,具体包括:在所述原始图片每个位置具有多种特征时,根据预设的对应不同特征种类的权重,将所述原始图片每个位置的多种特征映射为一个对应的映射值。
可选地,前述的方法,根据所述显著性区域对所述原始图片进行裁剪,得到所述原始图片的缩略图,具体包括:根据预设的目标图像面积,对所述原始图片进行缩放,使缩放后所述原始图片中的所述显著性区域的面积与所述目标图像面积相符,并从所述原始图片中裁剪下包含所述显著性区域的所述缩略图。
可选地,前述的方法,根据所述显著性区域对所述原始图片进行裁剪,得到所述原始图片的缩略图,具体包括:以所述显著性区域为所述缩略图的中心,按照预设的目标图像面积对所述原始图片进行裁剪得到所述缩略图。
根据以上技术方案,本发明提出的缩略图生成装置和方法至少具有以下优点:
根据本发明的技术方案,首先识别出原始图片中的显著性区域,而显著性区域中通常反映了图片的关键信息,则根据显著性区域对原始图片进行裁剪,得到的缩略图中必然包含该显著性区域,即缩略图中包含原始图片的关键信息,提高了生成的缩略图的信息有效性,提高了用户查看缩略图的效率,进而能够提升终端产品的用户体验。
附图说明
图1为实现本发明各个实施例的移动终端一个可选的硬件结构示意图;
图2为如图1所示的移动终端的无线通信系统示意图;
图3为根据本发明的一个实施例的缩略图生成装置的框图;
图4为根据本发明的一个实施例的缩略图生成装置的框图;
图5为根据本发明的一个实施例的缩略图生成装置的工作原理图;
图6为根据本发明的一个实施例的缩略图生成方法的流程图;
图7为根据本发明的一个实施例的缩略图生成方法的流程图;
图8为根据本发明的一个实施例的缩略图生成方法的流程图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
现在将参考附图描述实现本发明各个实施例的移动终端。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,"模块"与"部件"可以混合地使用。
移动终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。下面,假设终端是移动终端。然而,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本发明的实施方式的构造也能够应用于固定类型的终端。
图1为可以实现本发明各个实施例的移动终端一个可选的硬件结构示意图。
移动终端100可以包括无线通信单元110、A/V(音频/视频)输入单元120、用户输入单元130、输出单元150、存储器160、接口单元170、控制器180和电源单元190等等。图1示出了具有各种组件的移动终端,但是应理解的是,并不要求实施所有示出的组件。可以替代地实施更多或更少的组件。将在下面详细描述移动终端的元件。
无线通信单元110通常包括一个或多个组件,其允许移动终端100与无线通信系统或网络之间的无线电通信。例如,无线通信单元可以包括移动通信模块112、无线互联网模块113、短程通信模块114和位置信息模块115中的至少一个。
移动通信模块112将无线电信号发送到基站(例如,接入点、节点B等等)、外部终端以及服务器中的至少一个和/或从其接收无线电信号。这样的无线电信号可以包括语音通话信号、视频通话信号、或者根据文本和/或多媒体消息发送和/或接收的各种类型的数据。
无线互联网模块113支持移动终端的无线互联网接入。该模块可以内部或外部地耦接到终端。该模块所涉及的无线互联网接入技术可以包括WLAN(无线LAN)(Wi-Fi)、Wibro(无线宽带)、Wimax(全球微波互联接入)、HSDPA(高速下行链路分组接入)等等。
短程通信模块114是用于支持短程通信的模块。短程通信技术的一些示例包括蓝牙TM、射频识别(RFID)、红外数据协会(IrDA)、超宽带(UWB)、紫蜂TM等等。
位置信息模块115是用于检查或获取移动终端的位置信息的模块。位置信息模块的典型示例是GPS(全球定位系统)。根据当前的技术,GPS模块115计算来自三个或更多卫星的距离信息和准确的时间信息并且对于计算的信息应用三角测量法,从而根据经度、纬度和高度准确地计算三维当前位置信息。当前,用于计算位置和时间信息的方法使用三颗卫星并且通过使用另外的一颗卫星校正计算出的位置和时间信息的误差。此外,GPS模块115能够通过实时地连续计算当前位置信息来计算速度信息。
A/V输入单元120用于接收音频或视频信号。A/V输入单元120可以包括相机121和麦克风1220,相机121对在视频捕获模式或图像捕获模式中由图像捕获装置获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元151上。经相机121处理后的图像帧可以存储在存储器160(或其它存储介质)中或者经由无线通信单元110进行发送,可以根据移动终端的构造提供两个或更多相机1210。麦克风122可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风接收声音(音频数据),并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由移动通信模块112发送到移动通信基站的格式输出。麦克风122可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。
用户输入单元130可以根据用户输入的命令生成键输入数据以控制移动终端的各种操作。用户输入单元130允许用户输入各种类型的信息,并且可以包括键盘、锅仔片、触摸板(例如,检测由于被接触而导致的电阻、压力、电容等等的变化的触敏组件)、滚轮、摇杆等等。特别地,当触摸板以层的形式叠加在显示单元151上时,可以形成触摸屏。
接口单元170用作至少一个外部装置与移动终端100连接可以通过的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。识别模块可以是存储用于验证用户使用移动终端100的各种信息并且可以包括用户识别模块(UIM)、客户识别模块(SIM)、通用客户识别模块(USIM)等等。另外,具有识别模块的装置(下面称为"识别装置")可以采取智能卡的形式,因此,识别装置可以经由端口或其它连接装置与移动终端100连接。接口单元170可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端100内的一个或多个元件或者可以用于在移动终端和外部装置之间传输数据。
另外,当移动终端100与外部底座连接时,接口单元170可以用作允许通过其将电力从底座提供到移动终端100的路径或者可以用作允许从底座输入的各种命令信号通过其传输到移动终端的路径。从底座输入的各种命令信号或电力可以用作用于识别移动终端是否准确地安装在底座上的信号。输出单元150被构造为以视觉、音频和/或触觉方式提供输出信号(例如,音频信号、视频信号、警报信号、振动信号等等)。
输出单元150可以包括显示单元151、音频输出模块152等等。
显示单元151可以显示在移动终端100中处理的信息。例如,当移动终端100处于电话通话模式时,显示单元151可以显示与通话或其它通信(例如,文本消息收发、多媒体文件下载等等)相关的用户界面(UI)或图形用户界面(GUI)。当移动终端100处于视频通话模式或者图像捕获模式时,显示单元151可以显示捕获的图像和/或接收的图像、示出视频或图像以及相关功能的UI或GUI等等。
同时,当显示单元151和触摸板以层的形式彼此叠加以形成触摸屏时,显示单元151可以用作输入装置和输出装置。显示单元151可以包括液晶显示器(LCD)、薄膜晶体管LCD(TFT-LCD)、有机发光二极管(OLED)显示器、柔性显示器、三维(3D)显示器等等中的至少一种。这些显示器中的一些可以被构造为透明状以允许用户从外部观看,这可以称为透明显示器,典型的透明显示器可以例如为TOLED(透明有机发光二极管)显示器等等。根据特定想要的实施方式,移动终端100可以包括两个或更多显示单元(或其它显示装置),例如,移动终端可以包括外部显示单元(未示出)和内部显示单元(未示出)。触摸屏可用于检测触摸输入压力以及触摸输入位置和触摸输入面积。
音频输出模块152可以在移动终端处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时,将无线通信单元110接收的或者在存储器160中存储的音频数据转换音频信号并且输出为声音。而且,音频输出模块152可以提供与移动终端100执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出模块152可以包括扬声器、蜂鸣器等等。
存储器160可以存储由控制器180执行的处理和控制操作的软件程序等等,或者可以暂时地存储己经输出或将要输出的数据(例如,电话簿、消息、静态图像、视频等等)。而且,存储器160可以存储关于当触摸施加到触摸屏时输出的各种方式的振动和音频信号的数据。
存储器160可以包括至少一种类型的存储介质,所述存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等等。而且,移动终端100可以与通过网络连接执行存储器160的存储功能的网络存储装置协作。
控制器180通常控制移动终端的总体操作。例如,控制器180执行与语音通话、数据通信、视频通话等等相关的控制和处理。控制器180可以执行模式识别处理,以将在触摸屏上执行的手写输入或者图片绘制输入识别为字符或图像。
电源单元190在控制器180的控制下接收外部电力或内部电力并且提供操作各元件和组件所需的适当的电力。
这里描述的各种实施方式可以以使用例如计算机软件、硬件或其任何组合的计算机可读介质来实施。对于硬件实施,这里描述的实施方式可以通过使用特定用途集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理装置(DSPD)、可编程逻辑装置(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、被设计为执行这里描述的功能的电子单元中的至少一种来实施,在一些情况下,这样的实施方式可以在控制器180中实施。对于软件实施,诸如过程或功能的实施方式可以与允许执行至少一种功能或操作的单独的软件模块来实施。软件代码可以由以任何适当的编程语言编写的软件应用程序(或程序)来实施,软件代码可以存储在存储器160中并且由控制器180执行。
至此,己经按照其功能描述了移动终端。下面,为了简要起见,将描述诸如折叠型、直板型、摆动型、滑动型移动终端等等的各种类型的移动终端中的滑动型移动终端作为示例。因此,本发明能够应用于任何类型的移动终端,并且不限于滑动型移动终端。
如图1中所示的移动终端100可以被构造为利用经由帧或分组发送数据的诸如有线和无线通信系统以及基于卫星的通信系统来操作。
现在将参考图2描述其中根据本发明的移动终端能够操作的通信系统。
这样的通信系统可以使用不同的空中接口和/或物理层。例如,由通信系统使用的空中接口包括例如频分多址(FDMA)、时分多址(TDMA)、码分多址(CDMA)和通用移动通信系统(UMTS)(特别地,长期演进(LTE))、全球移动通信系统(GSM)等等。作为非限制性示例,下面的描述涉及CDMA通信系统,但是这样的教导同样适用于其它类型的系统。
参考图2,CDMA无线通信系统可以包括多个移动终端100、多个基站(BS)270、基站控制器(BSC)275和移动交换中心(MSC)280。MSC280被构造为与公共电话交换网络(PSTN)290形成接口。MSC280还被构造为与可以经由回程线路耦接到基站270的BSC275形成接口。回程线路可以根据若干己知的接口中的任一种来构造,所述接口包括例如E1/T1、ATM,IP、PPP、帧中继、HDSL、ADSL或xDSL。将理解的是,如图2中所示的系统可以包括多个BSC2750。
每个BS270可以服务一个或多个分区(或区域),由多向天线或指向特定方向的天线覆盖的每个分区放射状地远离BS270。或者,每个分区可以由用于分集接收的两个或更多天线覆盖。每个BS270可以被构造为支持多个频率分配,并且每个频率分配具有特定频谱(例如,1.25MHz,5MHz等等)。
分区与频率分配的交叉可以被称为CDMA信道。BS270也可以被称为基站收发器子系统(BTS)或者其它等效术语。在这样的情况下,术语"基站"可以用于笼统地表示单个BSC275和至少一个BS270。基站也可以被称为"蜂窝站"。或者,特定BS270的各分区可以被称为多个蜂窝站。
如图2中所示,广播发射器(BT)295将广播信号发送给在系统内操作的移动终端100。在图2中,示出了几个全球定位系统(GPS)卫星300。卫星300帮助定位多个移动终端100中的至少一个。
在图2中,描绘了多个卫星300,但是理解的是,可以利用任何数目的卫星获得有用的定位信息。如图1中所示的GPS模块115通常被构造为与卫星300配合以获得想要的定位信息。替代GPS跟踪技术或者在GPS跟踪技术之外,可以使用可以跟踪移动终端的位置的其它技术。另外,至少一个GPS卫星300可以选择性地或者额外地处理卫星DMB传输。
作为无线通信系统的一个典型操作,BS270接收来自各种移动终端100的反向链路信号。移动终端100通常参与通话、消息收发和其它类型的通信。特定基站270接收的每个反向链路信号被在特定BS270内进行处理。获得的数据被转发给相关的BSC275。BSC提供通话资源分配和包括BS270之间的软切换过程的协调的移动管理功能。BSC275还将接收到的数据路由到MSC280,其提供用于与PSTN290形成接口的额外的路由服务。类似地,PSTN290与MSC280形成接口,MSC与BSC275形成接口,并且BSC275相应地控制BS270以将正向链路信号发送到移动终端100。
基于上述移动终端硬件结构以及通信系统,提出本发明方法各个实施例。
如图3所示,本发明第一实施例提出一种缩略图生成装置,包括:
区域识别模块310,用于识别原始图片中的显著性区域。本领域技术人员应当理解,显著性区域为图像处理领域中的技术用语:显著性区域是图像中最能引起用户兴趣,最能表现图像内容的区域,现有技术中具有不同的用于识别显著性区域的技术方案。
例如:1)对于人物照片而言,其中的显著性区域往往是人脸所在区域,所以在本实施例的技术方案中,对于人物照片可以是人脸区域作为显著性区域;2)对于景物照片,则需要识别用户拍摄时对准的区域,并将该对准的区域作为显著性区域。
缩略图模块320,用于根据显著性区域对原始图片进行裁剪,得到原始图片的缩略图,其中缩略图中包括显著性区域。
在本实施例的技术方案中,采用了裁剪的方式获取缩略图,而非完全缩放的方式获得缩略图,其优势在于:缩略图中的信息含量较少,在缩略图面积固定的情况下,更容易清晰地展示缩略图中包含的信息。
在本实施例中,对裁剪的方式不进行限制,例如:可以采用现有的三分原则或者黄金分割原理裁剪方案,计算出待裁剪的区域,如果待裁剪区域未全部包含显著性区域,则对待裁剪的区域进行最小距离移动,使其完全包含显著性区域,这样处理的好处在于:在缩略图中可以保留对用户最重要的信息,同时可以结合所采用裁剪方案的优势。
根据本实施例的技术方案,首先识别出原始图片中的显著性区域,而显著性区域中通常反映了图片的关键信息,则根据显著性区域对原始图片进行裁剪,得到的缩略图中必然包含该显著性区域,即缩略图中包含原始图片的关键信息,提高了生成的缩略图的信息有效性,提高了用户查看缩略图的效率,进而能够提升终端产品的用户体验。
如图4所示,本发明第二实施例提出一种缩略图生成装置,包括:
特征提取模块410,用于提取原始图片中不同位置的特征。在本实施例中,对于位置的概念不进行限制,每个位置可以是一个像素点,可以是多个像素点形成的一块区域;在本实施例中,特征提取即确定图像特征研究的对象,直接影响最终生成的特征图的结果,通常选择的特征有亮度、颜色、方向等视觉特征。
特征图模块420,用于将原始图片中不同位置的特征映射为原始图片的特征图,特征图中具有对应于原始图片中不同位置的特征的映射值。在本实施例中,将特征信息映射为特征图,具体的将特征换算为映射值的方法不进行限制,具体地,适用于本实施例技术方案的算法可以具有以下原则:
当当前位置与其他位置的特征差别较大时,为当前位置设置较高的映射值;当当前位置与其他位置的特征差别较小时,为当前位置设置较小的映射值。进一步地,其他位置的特征可以取当位置的周边位置的特征均值,或原始图片所有位置的特征均值。
具体地,特征图模块420在原始图片每个位置具有多种特征时,根据预设的对应不同特征种类的权重,将原始图片每个位置的多种特征映射为一个对应的映射值。在本实施例中,这是因为由于各类别特征的量值单位不一致,所以不能直接将各个特征合并,需要根据各个特征在本实施例方案中的重要程度设置对应的权重,将各特征乘以权重值后累加得到的映射值,具体可以如图5所示,特征1和特征2是同一位置的两个不同特征,分别对应不同的权重w1和w2,按w1和w2汇总特征1和特征2计算得到该位置的映射值。
映射值获取模块430,用于根据特征图中的映射值大小,从特征图中选择部分位置的特征对应的映射值。在本实施例的技术方案中,可以按预定的策略选择该部分映射值,具体地,策略可以是:选择数值较大或数值较小的映射值,这是因为数值过大或过小的映射值通常能够反映出对应特征与其他特征之间存在明显差异;根据为特征计算映射值的方式,从特征图中选择映射值的方式也随之变化,本实施例中对此不进行限定,只需选择的映射值对应于其他特征差异较大的特征即可。
区域识别模块440,用于根据所选映射值对应的部分位置,从原始图片中识别显著性区域。根据本实施例的技术方案,当确定了显著性区域对应的映射值之后,自然可以从原始图片中确定显著性区域。
缩略图模块450,用于根据预设的目标图像面积,对原始图片进行缩放,使缩放后原始图片中的显著性区域的面积与目标图像面积相符,并从原始图片中裁剪下包含显著性区域的缩略图。在本实施例的技术方案中,根据目标图像面积对原始图片进行缩放的意义在于,使得缩略图中在包含显著性区域的情况下,尽可能放大显著性区域的信息,以供用户清晰完整地查看到显著性区域,从而更好地了解原始图片的关键信息。
在本实施例外的另一实施例中,缩略图模块450以显著性区域为缩略图的中心,按照预设的目标图像面积对原始图片进行裁剪得到缩略图。在本实施例的技术方案中,以显著性区域为中心进行裁剪的意义在于,显著性区域边缘位置的信息往往也是原始图片中比较重要的信息,此时能够将显著性区域边缘的信息在缩略图中显示给用户,从而用户可以更加全面地了解原始图片中的关键信息。
根据本实施例的技术方案,针对原始图片进行显著特征提取、生成与缩略图目标面积相同的缩略图;在考虑到原始图片中的显著性特征的情况下,由此生成缩略图,使得生成的缩略图包含原始图片中显著的要素信息,如人物、花朵、房屋等,提高了用户在大量缩略图页面中浏览、识别、检索的效率,提升了用户体验。
如图6所示,本发明第三实施例提出一种缩略图生成方法,包括:
步骤610,识别原始图片中的显著性区域。本领域技术人员应当理解,显著性区域为图像处理领域中的技术用语:显著性区域是图像中最能引起用户兴趣,最能表现图像内容的区域,现有技术中具有不同的用于识别显著性区域的技术方案。
例如:1)对于人物照片而言,其中的显著性区域往往是人脸所在区域,所以在本实施例的技术方案中,对于人物照片可以是人脸区域作为显著性区域;2)对于景物照片,则需要识别用户拍摄时对准的区域,并将该对准的区域作为显著性区域。
步骤620,根据显著性区域对原始图片进行裁剪,得到原始图片的缩略图,其中缩略图中包括显著性区域。在本实施例的技术方案中,采用了裁剪的方式获取缩略图,而非完全缩放的方式获得缩略图,其优势在于:缩略图中的信息含量较少,在缩略图面积固定的情况下,更容易清晰地展示缩略图中包含的信息。
在本实施例中,对裁剪的方式不进行限制,例如:可以采用现有的三分原则或者黄金分割原理裁剪方案,计算出待裁剪的区域,如果待裁剪区域未全部包含显著性区域,则对待裁剪的区域进行最小距离移动,使其完全包含显著性区域,这样处理的好处在于:在缩略图中可以保留对用户最重要的信息,同时可以结合所采用裁剪方案的优势。
根据本实施例的技术方案,首先识别出原始图片中的显著性区域,而显著性区域中通常反映了图片的关键信息,则根据显著性区域对原始图片进行裁剪,得到的缩略图中必然包含该显著性区域,即缩略图中包含原始图片的关键信息,提高了生成的缩略图的信息有效性,提高了用户查看缩略图的效率,进而能够提升终端产品的用户体验。
如图7所示,本发明第四实施例提出一种缩略图生成方法,包括:
步骤710,提取原始图片中不同位置的特征。在本实施例中,对于位置的概念不进行限制,每个位置可以是一个像素点,可以是多个像素点形成的一块区域;在本实施例中,特征提取即确定图像特征研究的对象,直接影响最终生成的特征图的结果,通常选择的特征有亮度、颜色、方向等视觉特征。
步骤720,将原始图片中不同位置的特征映射为原始图片的特征图,特征图中具有对应于原始图片中不同位置的特征的映射值。在本实施例中,将特征信息映射为特征图,具体的将特征换算为映射值的方法不进行限制,具体地,适用于本实施例技术方案的算法可以具有以下原则:
当当前位置与其他位置的特征差别较大时,为当前位置设置较高的映射值;当当前位置与其他位置的特征差别较小时,为当前位置设置较小的映射值。进一步地,其他位置的特征可以取当位置的周边位置的特征均值,或原始图片所有位置的特征均值。
具体地,步骤720中在原始图片每个位置具有多种特征时,根据预设的对应不同特征种类的权重,将原始图片每个位置的多种特征映射为一个对应的映射值。在本实施例中,这是因为由于各类别特征的量值单位不一致,所以不能直接将各个特征合并,需要根据各个特征在本实施例方案中的重要程度设置对应的权重,将各特征乘以权重值后累加得到的映射值,具体可以如图5所示,特征1和特征2是同一位置的两个不同特征,分别对应不同的权重w1和w2,按w1和w2汇总特征1和特征2计算得到该位置的映射值。
步骤730,根据特征图中的映射值大小,从特征图中选择部分位置的特征对应的映射值。在本实施例的技术方案中,可以按预定的策略选择该部分映射值,具体地,策略可以是:选择数值较大或数值较小的映射值,这是因为数值过大或过小的映射值通常能够反映出对应特征与其他特征之间存在明显差异;根据为特征计算映射值的方式,从特征图中选择映射值的方式也随之变化,本实施例中对此不进行限定,只需选择的映射值对应于其他特征差异较大的特征即可。
步骤740,根据所选映射值对应的部分位置,从原始图片中识别显著性区域。根据本实施例的技术方案,当确定了显著性区域对应的映射值之后,自然可以从原始图片中确定显著性区域。
步骤750,根据预设的目标图像面积,对原始图片进行缩放,使缩放后原始图片中的显著性区域的面积与目标图像面积相符,并从原始图片中裁剪下包含显著性区域的缩略图。在本实施例的技术方案中,根据目标图像面积对原始图片进行缩放的意义在于,使得缩略图中在包含显著性区域的情况下,尽可能放大显著性区域的信息,以供用户清晰完整地查看到显著性区域,从而更好地了解原始图片的关键信息。
根据本实施例的技术方案,针对原始图片进行显著特征提取、生成与缩略图目标面积相同的缩略图;在考虑到原始图片中的显著性特征的情况下,由此生成缩略图,使得生成的缩略图包含原始图片中显著的要素信息,如人物、花朵、房屋等,提高了用户在大量缩略图页面中浏览、识别、检索的效率,提升了用户体验。
如图8所示,本发明第五实施例提出一种缩略图生成方法,包括:
步骤810,识别原始图片中的显著性区域。在本实施例的技术方案中,所采用的识别显著性区域的方式如下:对于包含多个人物的人脸图片,识别其中的多个人脸,并采集多个人脸的大小、清晰度、位置等特征,根据该特征从多个人脸中选择一个人脸作为显著性区域。
步骤820,以显著性区域为缩略图的中心,按照预设的目标图像面积对原始图片进行裁剪得到缩略图。
在本实施例的技术方案中,以显著性区域为中心进行裁剪的意义在于,显著性区域边缘位置的信息往往也是原始图片中比较重要的信息,此时能够将显著性区域边缘的信息在缩略图中显示给用户,从而用户可以更加全面地了解原始图片中的关键信息。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种缩略图生成装置,其特征在于,包括:
区域识别模块,用于识别原始图片中的显著性区域;
缩略图模块,用于根据所述显著性区域对所述原始图片进行裁剪,得到所述原始图片的缩略图,其中所述缩略图中包括所述显著性区域;
特征提取模块,用于提取所述原始图片中不同位置的特征;
特征图模块,用于将所述原始图片中不同位置的特征映射为所述原始图片的特征图,所述特征图中具有对应于所述原始图片中不同位置的特征的映射值;
映射值获取模块,用于根据所述特征图中的映射值大小,从所述特征图中选择部分位置的特征对应的映射值;
所述区域识别模块根据所选映射值对应的部分位置,从所述原始图片中识别所述显著性区域。
2.根据权利要求1所述的装置,其特征在于,所述特征图模块在所述原始图片每个位置具有多种特征时,根据预设的对应不同特征种类的权重,将所述原始图片每个位置的多种特征映射为一个对应的映射值。
3.根据权利要求1所述的装置,其特征在于,
所述缩略图模块根据预设的目标图像面积,对所述原始图片进行缩放,使缩放后所述原始图片中的所述显著性区域的面积与所述目标图像面积相符,并从所述原始图片中裁剪下包含所述显著性区域的所述缩略图。
4.根据权利要求1所述的装置,其特征在于,
所述缩略图模块以所述显著性区域为所述缩略图的中心,按照预设的目标图像面积对所述原始图片进行裁剪得到所述缩略图。
5.一种缩略图生成方法,其特征在于,包括:
识别原始图片中的显著性区域;
根据所述显著性区域对所述原始图片进行裁剪,得到所述原始图片的缩略图,其中所述缩略图中包括所述显著性区域;
其中,识别原始图片中的显著性区域,具体包括:
提取所述原始图片中不同位置的特征;
将所述原始图片中不同位置的特征映射为所述原始图片的特征图,所述特征图中具有对应于所述原始图片中不同位置的特征的映射值;
根据所述特征图中的映射值大小,从所述特征图中选择部分位置的特征对应的映射值;
根据所选映射值对应的部分位置,从所述原始图片中识别所述显著性区域。
6.根据权利要求5所述的方法,其特征在于,将所述原始图片中不同位置的特征映射为所述原始图片的特征图,所述特征图中具有对应于所述原始图片中不同位置的特征的映射值,具体包括:
在所述原始图片每个位置具有多种特征时,根据预设的对应不同特征种类的权重,将所述原始图片每个位置的多种特征映射为一个对应的映射值。
7.根据权利要求5所述的方法,其特征在于,根据所述显著性区域对所述原始图片进行裁剪,得到所述原始图片的缩略图,具体包括:
根据预设的目标图像面积,对所述原始图片进行缩放,使缩放后所述原始图片中的所述显著性区域的面积与所述目标图像面积相符,并从所述原始图片中裁剪下包含所述显著性区域的所述缩略图。
8.根据权利要求5所述的方法,其特征在于,根据所述显著性区域对所述原始图片进行裁剪,得到所述原始图片的缩略图,具体包括:
以所述显著性区域为所述缩略图的中心,按照预设的目标图像面积对所述原始图片进行裁剪得到所述缩略图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610278002.6A CN105956999B (zh) | 2016-04-28 | 2016-04-28 | 缩略图生成装置和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610278002.6A CN105956999B (zh) | 2016-04-28 | 2016-04-28 | 缩略图生成装置和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105956999A CN105956999A (zh) | 2016-09-21 |
CN105956999B true CN105956999B (zh) | 2020-08-28 |
Family
ID=56916524
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610278002.6A Active CN105956999B (zh) | 2016-04-28 | 2016-04-28 | 缩略图生成装置和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105956999B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108389156A (zh) * | 2017-01-04 | 2018-08-10 | 成都科创知识产权研究所 | 数据处理方法、系统及图片编辑方法、系统 |
CN108958609A (zh) * | 2018-07-24 | 2018-12-07 | 百度在线网络技术(北京)有限公司 | 三维全景封面图的生成方法、装置、存储介质和终端设备 |
WO2020034150A1 (zh) * | 2018-08-16 | 2020-02-20 | 华为技术有限公司 | 一种广告图片的显示方法、上传方法及装置 |
CN109447072A (zh) * | 2018-11-08 | 2019-03-08 | 北京金山安全软件有限公司 | 一种缩略图裁剪方法、装置、电子设备及可读存储介质 |
CN111179153B (zh) * | 2018-11-13 | 2023-06-09 | 奇酷互联网络科技(深圳)有限公司 | 图片的裁剪方法、移动终端以及具有存储功能的装置 |
CN110377204B (zh) * | 2019-06-30 | 2021-07-09 | 华为技术有限公司 | 一种生成用户头像的方法及电子设备 |
CN110708606A (zh) * | 2019-09-29 | 2020-01-17 | 新华智云科技有限公司 | 一种智能剪辑视频的方法 |
CN110853068B (zh) * | 2019-09-30 | 2022-06-17 | 荣耀终端有限公司 | 图片处理方法、装置、电子设备及可读存储介质 |
CN111127469A (zh) * | 2019-12-18 | 2020-05-08 | 南京酷派软件技术有限公司 | 缩略图显示方法、装置、存储介质以及终端 |
CN112017193A (zh) * | 2020-08-24 | 2020-12-01 | 杭州趣维科技有限公司 | 一种基于视觉显著性和美学分数的图像裁切装置及方法 |
WO2023147693A1 (en) * | 2022-02-04 | 2023-08-10 | Qualcomm Incorporated | Non-linear thumbnail generation supervised by a saliency map |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011008509A (ja) * | 2009-06-25 | 2011-01-13 | Kddi Corp | 重要情報抽出方法および装置 |
CN103891263A (zh) * | 2011-11-09 | 2014-06-25 | 乐天株式会社 | 图像处理装置、图像处理装置的控制方法、程序和信息存储介质 |
CN103903223A (zh) * | 2014-04-24 | 2014-07-02 | 厦门美图之家科技有限公司 | 一种基于图像显著性检测的获取缩略图的方法 |
CN103902730A (zh) * | 2014-04-15 | 2014-07-02 | 中国科学院自动化研究所 | 一种缩略图生成方法和系统 |
CN103927713A (zh) * | 2014-04-23 | 2014-07-16 | 锤子科技(北京)有限公司 | 图片缩略图的获取方法及装置 |
CN104063444A (zh) * | 2014-06-13 | 2014-09-24 | 百度在线网络技术(北京)有限公司 | 缩略图的生成方法和装置 |
CN104063844A (zh) * | 2013-03-21 | 2014-09-24 | 腾讯科技(深圳)有限公司 | 一种缩略图生成方法及系统 |
CN104346772A (zh) * | 2014-11-06 | 2015-02-11 | 杭州华为数字技术有限公司 | 缩略图制作方法和装置 |
CN104504651A (zh) * | 2015-01-22 | 2015-04-08 | 网易(杭州)网络有限公司 | 预览图生成方法和设备 |
-
2016
- 2016-04-28 CN CN201610278002.6A patent/CN105956999B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011008509A (ja) * | 2009-06-25 | 2011-01-13 | Kddi Corp | 重要情報抽出方法および装置 |
CN103891263A (zh) * | 2011-11-09 | 2014-06-25 | 乐天株式会社 | 图像处理装置、图像处理装置的控制方法、程序和信息存储介质 |
CN104063844A (zh) * | 2013-03-21 | 2014-09-24 | 腾讯科技(深圳)有限公司 | 一种缩略图生成方法及系统 |
CN103902730A (zh) * | 2014-04-15 | 2014-07-02 | 中国科学院自动化研究所 | 一种缩略图生成方法和系统 |
CN103927713A (zh) * | 2014-04-23 | 2014-07-16 | 锤子科技(北京)有限公司 | 图片缩略图的获取方法及装置 |
CN103903223A (zh) * | 2014-04-24 | 2014-07-02 | 厦门美图之家科技有限公司 | 一种基于图像显著性检测的获取缩略图的方法 |
CN104063444A (zh) * | 2014-06-13 | 2014-09-24 | 百度在线网络技术(北京)有限公司 | 缩略图的生成方法和装置 |
CN104346772A (zh) * | 2014-11-06 | 2015-02-11 | 杭州华为数字技术有限公司 | 缩略图制作方法和装置 |
CN104504651A (zh) * | 2015-01-22 | 2015-04-08 | 网易(杭州)网络有限公司 | 预览图生成方法和设备 |
Also Published As
Publication number | Publication date |
---|---|
CN105956999A (zh) | 2016-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105956999B (zh) | 缩略图生成装置和方法 | |
CN106909274B (zh) | 一种图像显示方法和装置 | |
CN105468158B (zh) | 颜色调整方法及移动终端 | |
CN105426097B (zh) | 一种分屏大小实时调整方法及分屏装置 | |
CN104731480B (zh) | 基于触摸屏的图像显示方法及装置 | |
CN106302651B (zh) | 图片的社交分享方法及具有图片社交分享系统的终端 | |
CN106651867B (zh) | 一种实现交互式图像分割的方法、装置及终端 | |
CN107066604B (zh) | 一种垃圾文件清理方法和终端 | |
CN106372264B (zh) | 地图数据的迁移装置和方法 | |
CN106598538B (zh) | 指令集合更新方法及系统 | |
CN106534560B (zh) | 移动终端控制装置及方法 | |
CN105791541B (zh) | 截图方法及移动终端 | |
CN106455009B (zh) | 一种搜网装置和方法 | |
CN105955474B (zh) | 应用评价的提示方法及移动终端 | |
CN106385502B (zh) | 一种照片整理方法和一种移动终端 | |
CN107071275B (zh) | 一种图像合成方法及终端 | |
CN106559577B (zh) | 移动终端及其控制方法 | |
CN106569670B (zh) | 处理应用的装置及方法 | |
CN106791449B (zh) | 照片拍摄方法及装置 | |
CN107220109B (zh) | 一种界面显示的方法和设备 | |
CN106534446B (zh) | 移动终端拨号装置和方法 | |
CN106873981B (zh) | 一种图标处理方法、装置及终端 | |
CN105528137B (zh) | 一种根据遮挡区域自适应截屏的方法及装置 | |
CN106843649B (zh) | 一种图标处理方法、装置及终端 | |
CN106896988B (zh) | 应用图标对齐装置、终端及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |