CN108549702A - 一种移动终端的图片库的清理方法及移动终端 - Google Patents

一种移动终端的图片库的清理方法及移动终端 Download PDF

Info

Publication number
CN108549702A
CN108549702A CN201810345579.3A CN201810345579A CN108549702A CN 108549702 A CN108549702 A CN 108549702A CN 201810345579 A CN201810345579 A CN 201810345579A CN 108549702 A CN108549702 A CN 108549702A
Authority
CN
China
Prior art keywords
picture
fingerprint
pictures
mobile terminal
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810345579.3A
Other languages
English (en)
Other versions
CN108549702B (zh
Inventor
苏晋展
许清泉
余清洲
张伟
洪炜冬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meitu Technology Co Ltd
Original Assignee
Xiamen Meitu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meitu Technology Co Ltd filed Critical Xiamen Meitu Technology Co Ltd
Priority to CN201810345579.3A priority Critical patent/CN108549702B/zh
Publication of CN108549702A publication Critical patent/CN108549702A/zh
Application granted granted Critical
Publication of CN108549702B publication Critical patent/CN108549702B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种移动终端的图片库的清理方法,该方法包括步骤:响应于清理指令,提取图片库中每张图片的结构信息生成图片的第一指纹;提取每张图片的颜色信息生成图片的第二指纹;将每张图片的第一指纹和第二指纹连接得到图片的指纹;根据图片的指纹对图片库中的图片进行聚类处理,得到至少一个聚类;以及删除每个聚类中的至少一张图片,以清理移动终端的图片库。本发明一并公开了执行该清理方法的移动终端。

Description

一种移动终端的图片库的清理方法及移动终端
技术领域
本发明涉及图像处理技术领域,尤其是一种移动终端的图片库的清理方法及移动终端。
背景技术
随着计算机通信以及互联网技术的不断发展,移动终端,诸如移动电话、个人数字助理、平板电脑等应用越来越广泛,移动终端提供的应用功能也越来越丰富,极大地满足了不同用户的个性化需求。例如,人们越来越习惯将拍摄的照片或收集的图片存储到移动设备的图片库中(如,相册),以替代实体图片库。这样做既可以避免资源消耗,又便于用户查询。
然而,相册中所存储的图片往往存在大量重复,造成这种现象的原因,一方面可能是网络传输、编解码等原因,使得图片看起来是重复的,另一方面可能是用户在拍摄照片时,对同一场景重复拍摄,产生了一系列内容相似的图片。这些重复的、相似的图片占用了用户大量的存储空间,且不利于用户进行查询。
因此,需要采取一定的算法对图片库中的图片进行清理,为用户节省存储空间。
目前常见的检测重复的算法是采用计算文件哈希值的方法,如sha1,md5等。但是,这类哈希算法不适用于处理图片,主要原因是此类哈希算法对图片微小的变化不鲁棒,例如,图片在网络传输和压缩过程中都有可能产生变化,此时,图片的哈希值不同,但是在人眼看来,这样的图片仍然是重复或相似的,也就是说,哈希值不同的两张图片仍然有可能是重复的。
鉴于此,需要一种能够应用到移动终端的、有效清理其图片库的方法。
发明内容
为此,本发明提供了一种移动终端的图片库的清理方法及移动终端,以力图解决或者至少缓解上面存在的至少一个问题。
根据本发明的一个方面,提供了一种移动终端的图片库的清理方法,该方法包括步骤:响应于清理指令,提取图片库中每张图片的结构信息生成图片的第一指纹;提取每张图片的颜色信息生成图片的第二指纹;将每张图片的第一指纹和第二指纹连接得到图片的指纹;根据图片的指纹对图片库中的图片进行聚类处理,得到至少一个聚类;以及删除每个聚类中的至少一张图片,以清理移动终端的图片库。
可选地,在根据本发明的清理图片库的方法中,提取图片库中每张图片的结构信息生成该图片的第一指纹的步骤包括:获取图片的灰度图;将灰度图缩小到第一预定尺寸,得到第一灰度图;将第一灰度图向量化得到一维信号,并计算一维信号的二阶差分信号;对二阶差分信号进行量化和编码处理,得到该图片的第一指纹。
可选地,在根据本发明的清理图片库的方法中,提取每张图片的颜色信息生成图片的第二指纹的步骤包括:将图片缩放到第二预定尺寸,得到第一彩色图;统计第一彩色图在各颜色通道上的色彩分布,得到图片的颜色向量;对颜色向量进行量化和编码处理,得到图片的第二指纹。
可选地,在根据本发明的清理图片库的方法中,根据图片的指纹对图片库中的图片进行聚类处理、得到至少一个聚类的步骤包括:将图片库的所有图片两两相连,并根据图片的指纹计算相连的两张图片间的相似值;若两张图片间的相似值小于阈值,则断开两张图片之间的连接关系;以及将相互之间有连接关系的图片作为一个聚类。
可选地,在根据本发明的清理图片库的方法中,删除每个聚类中的至少一张图片,以清理移动终端的图片库的步骤还包括:计算每个聚类中的图片的数量;以及根据每个聚类中图片的数量按比例删除各聚类中的图片。
可选地,在根据本发明的清理图片库的方法中,根据每个聚类中图片的数量按比例删除各聚类中的图片的步骤还包括:当聚类中图片的数量小于2时,不删除该聚类中的图片。
可选地,在根据本发明的清理图片库的方法中,根据图片的指纹计算相连的两张图片间的相似值的步骤包括:计算两张图片的指纹的汉明距离;用汉明距离除以指纹的位数,得到第一系数;以及计算1与第一系数之差,得到两张图片的相似值。
可选地,在根据本发明的清理图片库的方法中,对二阶差分信号进行量化和编码处理、得到图片的第一指纹的步骤包括:遍历二阶差分信号,以找到信号中的最大值和最小值;根据最大值、最小值和第一量化级数计算得到二阶差分信号的量化序数;以及按预定规则对二阶差分信号的量化序数进行编码,得到第一指纹。
可选地,在根据本发明的清理图片库的方法中,二阶差分信号的量化序数Q1(i)定义为:
式中,Z(i)为二阶差分信号中的第i个值,Zmin为二阶差分信号的最小值,Zmax为二阶差分信号的最大值,q1为第一量化级数。
可选地,在根据本发明的清理图片库的方法中,统计第一彩色图在各颜色通道上的色彩分布、得到图片的颜色向量的步骤包括:统计第一彩色图在各颜色通道上的直方图分布,得到各颜色通道的直方图向量;以及连接各颜色通道的直方图向量,以得到图片的颜色向量。
可选地,在根据本发明的清理图片库的方法中,对颜色向量进行量化和编码处理、得到图片的第二指纹的步骤包括:遍历颜色向量,以找到颜色向量中的最大值;根据最大值和第二量化级数计算得到颜色向量的量化序数;以及按预定规则对颜色向量的量化序数进行编码,得到第二指纹。
可选地,在根据本发明的清理图片库的方法中,颜色向量的量化序数Q2(i)定义为:
式中,B(i)为颜色向量中的第i个值,Bmax为颜色向量的最大值,q2为第二量化级数。
可选地,在根据本发明的清理图片库的方法中,第一预定尺寸为8*9。
可选地,在根据本发明的清理图片库的方法中,第二预定尺寸为32*32。
根据本发明的又一方面,提供了一种移动终端,包括:一个或多个处理器;和存储器,其中存储器中布置有图片库;一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行如上所述方法中的任一方法的指令。
根据本发明的再一方面,提供了一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令当移动终端执行时,使得移动终端执行如上所述的方法中的任一方法。
根据本发明的清理图片库的方案,通过提取图片的结构特征和颜色特征来计算图片的指纹,进而检测出相似度较高和重复的图片,具有鲁棒性。并且,在计算图片的指纹时,避免采用深度特征,降低了计算量,适合部署在计算性能较弱的移动终端。
另外,通过对一系列图片进行高效地聚类处理,能够快速地将重复的图片聚为一类,并智能地删除一些重复的图片,或者是根据用户需求删除一些重复图片,或者是自动删除重复图片中质量不好的图片,能够大大地提升用户体验。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的移动终端100的构造示意图;
图2示出了根据本发明一个实施例的移动终端100的用户界面的示意图;
图3示出了根据本发明一个实施例的移动终端100的图片库的清理方法300的流程图;以及
图4A-图4C分别示出了根据本发明一个实施例的灰度图、第一灰度图、一维信号的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1是移动终端100的结构框图。
移动终端100可以包括存储器接口102、一个或多个数据处理器、图像处理器和/或中央处理单元104,以及外围接口106。
存储器接口102、一个或多个处理器104和/或外围接口106既可以是分立元件,也可以集成在一个或多个集成电路中。在移动终端100中,各种元件可以通过一条或多条通信总线或信号线来耦合。传感器、设备和子系统可以耦合到外围接口106,以便帮助实现多种功能。
例如,运动传感器110、光线传感器112和距离传感器114可以耦合到外围接口106,以方便定向、照明和测距等功能。其他传感器116同样可以与外围接口106相连,例如定位系统(例如GPS接收机)、加速度传感器、温度传感器、生物测定传感器或其他感测设备,由此可以帮助实施相关的功能。
相机子系统120和光学传感器122可以用于方便诸如记录照片和视频剪辑的相机功能的实现,其中所述相机子系统和光学传感器例如可以是电荷耦合器件(CCD)或互补金属氧化物半导体(CMOS)光学传感器。
可以通过一个或多个无线通信子系统124来帮助实现通信功能,其中无线通信子系统可以包括射频接收机和发射机和/或光(例如红外)接收机和发射机。无线通信子系统124的特定设计和实施方式可以取决于移动终端100所支持的一个或多个通信网络。例如,移动终端100可以包括被设计成支持LTE、3G、GSM网络、GPRS网络、EDGE网络、Wi-Fi或WiMax网络以及BlueboothTM网络的通信子系统124。
音频子系统126可以与扬声器128以及麦克风130相耦合,以便帮助实施启用语音的功能,例如语音识别、语音复制、数字记录和电话功能。I/O子系统140可以包括触摸屏控制器142和/或一个或多个其他输入控制器144。触摸屏控制器142可以耦合到触摸屏146。举例来说,该触摸屏146和触摸屏控制器142可以使用多种触摸感测技术中的任何一种来检测与之进行的接触和移动或是暂停,其中感测技术包括但不局限于电容性、电阻性、红外和表面声波技术。
在一些实现方式中,触摸屏146可包括多触敏显示器,多触敏显示器例如可以同时处理多个触摸点,包括处理与每个触摸点的压力、程度和/或位置有关的数据。这样的处理有助于利用多个手指进行的手势和交互、和弦(chording)以及其他交互。其他触敏显示器也可使用,例如利用触笔或其他点选设备进行接触的显示器。
一个或多个其他输入控制器144可以耦合到其他输入/控制设备148,例如一个或多个按钮、摇杆开关、拇指旋轮、红外端口、USB端口、和/或指示笔之类的指点设备。所述一个或多个按钮(未显示)可以包括用于控制扬声器128和/或麦克风130音量的向上/向下按钮。
存储器接口102可以与存储器150相耦合。该存储器150可以包括高速随机存取存储器和/或非易失性存储器,例如一个或多个磁盘存储设备,一个或多个光学存储设备,和/或闪存存储器(例如NAND,NOR)。存储器150可以存储操作系统152,例如Android、iOS或是Windows Phone之类的操作系统。该操作系统152可以包括用于处理基本系统服务以及执行依赖于硬件的任务的指令。在一些实施例中,操作系统152中包含了用于执行图片库的清理方法300的指令。存储器150还可以存储应用154。在移动终端运行时,会从存储器150中加载操作系统152,并且由处理器104执行。应用154在运行时,也会从存储器150中加载,并由处理器104执行。应用154运行在操作系统之上,利用操作系统以及底层硬件提供的接口实现各种用户期望的功能,如即时通信、网页浏览、图片管理、视频播放等。应用154可以是独立于操作系统提供的,也可以是操作系统自带的,包括各种社交应用软件,也包括各种视频播放应用软件,还可以包括图片库(相册)、计算器、录音笔等系统自带应用程序。另外,应用154被安装到移动终端100中时,也可以向操作系统添加驱动模块。根据本发明的一个实施例,存储器150的应用154中布置了图片库,用于存储图片。
在一些实现方式中,移动终端100可在触摸屏146上显示一个或多个用户界面,用于为用户提供对各种系统对象的访问以及用于向用户传达信息。图2示出了根据本发明一个实施例的移动终端100的用户界面的示意图。在一些实现方式中,用户界面可包括一个或多个显示对象,显示对象是系统对象的图形表示,系统对象的一些示例包括设备功能、应用、视窗、文件、警报、事件或其他可标识的系统对象。
如图2,显示对象可以是若干应用154的图形显示(或称作“应用图标”)。若干应用154包括图片库、计算器、录音笔、电话、短消息、地图、电子邮件等,用户通过触摸这些显示对象的一个来调用相应的功能,例如,响应于用户触摸图片库,用户可浏览图片库中所存储的图片。
在一些实现方式中,当一些功能被调用时,移动终端100的用户界面发生改变,或者由另一用户界面或用户界面元素扩充或替代,以帮助用户访问与相应功能相关联的特定功能。例如,响应于用户触摸电话的图形显示,触摸屏的用户界面可呈现与各种电话功能有关的显示对象;同样,响应于用户触摸图片库的图形显示,触摸屏的用户界面可呈现图片库中所存储的图片供用户浏览。
本发明提供了一种移动终端100中的图片库的清理方法300,通过在移动终端100的存储器150中存储相应的一个或多个程序(包括前文所述的相关指令)来对图片库中的重复图片进行清理。其中,图片库中的图片可以是通过相机子系统120采集到的,也可以是通过通信子系统124获取到的来自网络的图片。本发明对此不做限制。
移动终端100可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。
图3示出了根据本发明一个实施例的移动终端100的图片库的清理方法300的流程图。以下将结合图3,对方法300的执行流程进行描述。
方法300始于步骤S310,响应于清理指令,提取图片库中每张图片的结构信息生成对应的每张图片的第一指纹。
在一些实现方式中,在移动终端100的用户界面上布置清理图片库的图形显示,由用户触摸该图形显示来生成清理指令,调用相应的图片库清理功能。例如,打开移动终端100的图片库应用,在该应用的用户界面上布置图标作为清理图片库的图形显示;又如,直接在移动终端100的用户界面上布置清理图片库的图标,与图片库、短消息、电子邮件等应用图标一起,通过用户的触摸操作来调用相应的功能。
在另一些实现方式中,通过点击移动终端100上的某个按钮来触发清理图片库的操作,发起清理指令。
根据本发明的一个实施例,针对每一张图片,提取该图片的结构信息以生成该图片的第一指纹的步骤,包括如下1)至4)四个步骤。
1)获取图片的灰度图。一般地,图片库中的图片均是彩色图片,图片结构信息的计算通常是基于灰度信息,故先将图片转换为灰度图片(如,获取图片的Y通道图片作为灰度图)。
2)将灰度图缩小到第一预定尺寸,以消除不同图片的尺寸差异,从而得到第一灰度图。根据一种实现方式,第一预定尺寸的大小由第一指纹的大小决定。可选地,第一指纹的目标长度为64bit(位),因此,将第一预定尺寸设为8*9。
3)将第一灰度图向量化,展开得到一维信号,并计算该一维信号的二阶差分信号。以Lena图为例,如图4A示出了从彩色Lena图中获取到的灰度图,图4B示出了将图4A缩小到第一预定尺寸的第一灰度图,图4C示出了将图4B向量化,展开后的一维向量V。
在一些实现方式中,将信号的一阶差分的一阶差分定义为该信号的二阶差分。设一维信号V的一阶差分信号为D,一维信号V的二阶差分信号为Z,用公式表示如下:
D(i)=V(i+1)-V(i)
Z(i)=D(i+1)-D(i)=V(i+2)-2V(i+1)-V(i)
其中,V(i)表示一维信号V中的第i个值,D(i)表示一阶差分信号D中的第i个值,Z(i)表示二阶差分信号Z中的第i个值。
4)对二阶差分信号进行量化和编码处理,得到该图片的第一指纹。
根据本发明的一种实现方式,先计算二阶差分信号的量化序数,在对量化序数进行编码,得到该图片的第一指纹。
其中,二阶差分信号的量化序数的计算采用如下方式:先遍历该二阶差分信号,以找到信号中的最大值和最小值;再根据所查找到的最大值、最小值和第一量化级数,计算该二阶差分信号的量化序数。用下式表示二阶差分信号的量化序数Q1(i)为:
式中,Z(i)为二阶差分信号中的第i个值,Zmin为二阶差分信号的最小值,Zmax为二阶差分信号的最大值,q1为第一量化级数。
在得到二阶差分信号的量化序数后,按预定规则对该量化序数进行编码,得到第一指纹。可选地,采用类似于步进的方式对二阶差分信号的量化序数进行编码,可以方便地应用到后续汉明距离的计算中,并保证二阶差分信号的量化序数差异较大的编码,其汉明距离也较大。
设第一量化级数为2,那么对二阶差分信号中的量化序数进行编码后,其编码结果与自然码一致,如表1所示。
表1编码结果(量化级数为2)
二阶差分信号的量化序数 自然码 编码结果
0 0 0
1 1 1
同样地,设第一量化级数为5,其编码结果如表2。
表2编码结果(量化级数为5)
二阶差分信号的量化序数 自然码 步进编码
0 0000 0000
1 0001 0001
2 0010 0011
3 0011 0111
4 0100 1111
随后在步骤S320中,提取每张图片的颜色信息生成该图片的第二指纹。
根据本发明的一个实施例,针对图片库中的每张图片,提取每张图片的颜色信息,以生成该图片的第二指纹的步骤,包括如下a)-c)三步。
a).为消除不同图片的尺寸差异,先将图片缩放到第二预定尺寸,得到第一彩色图。对应于步骤S310中对第一预定尺寸的设置,第二预定尺寸设为32*32。
b).统计该第一彩色图在各颜色通道上的色彩分布,得到该图片的颜色向量。
在一些实现方式中,对颜色的分布进行统计,可以在RGB颜色空间进行,也可以在其它诸如Lab颜色空间、HSI颜色空间上进行,本发明对此不做限制。以RGB颜色空间为例,分别统计第一彩色图在R、G、B三个颜色通道上的直方图分布(根据本发明的一个实施例,计算直方图分布时,每个颜色区间的大小取16,即bin=16),得到三个颜色通道的直方图向量分别用Br、Bg、Bb。然后,将三个颜色通道的直方图向量Br、Bg、Bb连接成一个一维向量,作为该图片的颜色向量B。
c).对颜色向量进行量化和编码处理,得到该图片的第二指纹。
根据本发明的一种实现方式,先计算颜色向量B的量化序数,再对该量化序数进行编码,得到第二指纹。
可选地,颜色向量的量化序数采用如下方式进行计算:先遍历颜色向量,以找到该颜色向量中的最大值;再根据该最大值和第二量化级数计算得到颜色向量的量化序数。用如下公式计算颜色向量的量化序数Q2(i):
式中,B(i)为颜色向量中的第i个值,Bmax为颜色向量的最大值,q2为第二量化级数。
在得到颜色向量的量化序数后,按预定规则对该量化序数进行编码,得到第二指纹。根据本发明的实施方式,对颜色向量的量化序数的编码,采用与对二阶差分信号的量化序数的编码一致的方式进行编码,此处不再赘述。
需要说明的是,本发明的实施例仅是示例性地给出提取图片的结构信息和颜色信息的方法,在实际应用中,也可以根据实际需要选取其他结构信息和颜色信息的提取方法,例如,采用其他梯度算子(如Sobel算子、拉普拉斯算子等)来提取图片的结构信息。又如,通过计算图片颜色的一阶矩、二阶矩来提取图片的颜色信息。任何现在已知的或未来可知的提取特征的方法均可以与本发明的实施例相结合,得到图片库的清理方法200。同样地,本发明的实施例提出了一种计算简便,且能够应用于汉明距离计算的编码方式,在应用中,本发明对信息编码的方式亦不做限制。
随后在步骤S330中,将每张图片的第一指纹和第二指纹进行连接,得到该图片最终的指纹。
例如,用Q表示图片的指纹,那么,Q如下公式表示:
Q=concat(Qstructure,Qcolor)
其中,Qstructure表示图片的第一指纹,Qcolor表示图片的第二指纹。
随后在步骤S340中,根据图片的指纹对图片库中的所有图片进行聚类处理,得到至少一个聚类。
根据本发明的一个实施例,将图片库的所有图片两两相连,并根据图片的指纹计算相连的两张图片间的相似值,相似值越大,表明两张图片越相近,相似值越小,表明两张图片越不同。然后,根据两张图片的相似值确定这两张图片是否保持连接关系:若两张图片间的相似值小于阈值,则这两证图片不需要保持连接关系,即断开这两张图片之间的连接关系;否则,保持这两张图片间的连接关系。也就是说,保持连接关系的图片之间存在一定的相似性。最后,将相互之间仍有连接关系的图片作为一个聚类,即,在一个聚类中相互连接的图片就是相似的图片,孤立的图片就是与图片库中其他图片均没有重复的图片。
根据本发明的实施例,相连的两张图片间的相似值通过这两张图片的指纹来计算,其计算步骤包括:①计算两张图片的指纹的汉明距离;②用上述汉明距离除以指纹的位数,得到第一系数;③计算1与第一系数之差,得到这两张图片的相似值。可以用如下公式来表示:
式中,Si,j表示图片i和图片j的相似值,Qi,Qj分别表示图片i和图片j的指纹,bits(Q)表示指纹的位数(如,128bit),hamming(Qi,Qj)表示两个指纹的汉明距离。
随后在步骤S350中,删除每个聚类中的至少一张图片,以清理移动终端的图片库。
根据本发明的一种实现方式,根据聚类结果计算每个聚类中的图片的数量,再根据每个聚类中图片的数量按比例删除各聚类中的图片。例如,第一聚类中包含10张相似的图片,第二聚类中包含30张相似的图片,就从第一聚类中删除5张图片,从第二聚类中删除15张图片,以保证各聚类中图片的比例不变。
根据本发明的一种实现方式,当聚类中图片的数量小于2时,认为该聚类中图片并不多,暂不进行清理,则不删除该聚类中的图片。
根据本发明的另一些实现方式,在将图片库中的图片按相似度进行聚类后,可进一步计算各图片的质量,再根据图片质量从低到高的顺序依次删除各聚类中的质量较低的重复图片,这样,就可以初步地将重复图片中的一些模糊不清的图片进行删除(例如,存在块效应的图片、边缘不清晰的图片等)。可选地,图片质量的计算可参照图片的指纹来进行。考虑到降低移动终端的计算复杂度,可采用PSNR(峰值信噪比)方法来计算图片的质量。鉴于PSNR是图像处理领域常见的一种衡量图像质量的客观算法,此处不再赘述。
在一些实现方式中,也可以通过用户界面显示聚类下的图片和每个聚类下删除的图片,并接收用户对用户界面的一些操作,例如,进一步删除一些不想要的图片、恢复某些被删除的图片等。
根据本发明的清理图片库的方案,通过提取图片的结构特征和颜色特征来计算图片的指纹,进而检测出相似度较高和重复的图片,具有鲁棒性。并且,在计算图片的指纹时,避免采用深度特征,降低了计算量,适合部署在计算性能较弱的移动终端。
另外,通过对一系列图片进行高效地聚类处理,能够快速地将重复的图片聚为一类,并智能地删除一些重复的图片,或者是根据用户需求删除一些重复图片,或者是自动删除重复图片中质量不好的图片,能够大大地提升用户体验。
应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如软盘、CD-ROM、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明所述的方法。
以示例而非限制的方式,计算机可读介质包括计算机存储介质和通信介质。计算机可读介质包括计算机存储介质和通信介质。计算机存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在计算机可读介质的范围之内。
本发明一并公开了:
A9、如A8所述的方法,其中,所述二阶差分信号的量化序数Q1(i)定义为:
式中,Z(i)为二阶差分信号中的第i个值,Zmin为二阶差分信号的最小值,Zmax为二阶差分信号的最大值,q1为第一量化级数。
A10、如A3所述的方法,其中,所述统计第一彩色图在各颜色通道上的色彩分布、得到图片的颜色向量的步骤包括:统计第一彩色图在各颜色通道上的直方图分布,得到各颜色通道的直方图向量;以及连接所述各颜色通道的直方图向量,以得到图片的颜色向量。
A11、如A3或10所述的方法,其中,所述对颜色向量进行量化和编码处理、得到图片的第二指纹的步骤包括:遍历颜色向量,以找到所述颜色向量中的最大值;根据所述最大值和第二量化级数计算得到所述颜色向量的量化序数;以及按预定规则对所述颜色向量的量化序数进行编码,得到第二指纹。
A12、如A11所述的方法,其中,所述颜色向量的量化序数Q2(i)定义为:
式中,B(i)为颜色向量中的第i个值,Bmax为颜色向量的最大值,q2为第二量化级数。
A13、如A2所述的方法,其中,所述第一预定尺寸为8*9。
A14、如A3所述的方法,其中,所述第二预定尺寸为32*32。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (10)

1.一种移动终端的图片库的清理方法,所述方法包括步骤:
响应于清理指令,提取所述图片库中每张图片的结构信息生成所述图片的第一指纹;
提取每张图片的颜色信息生成所述图片的第二指纹;
将每张图片的第一指纹和第二指纹连接得到所述图片的指纹;
根据图片的指纹对所述图片库中的图片进行聚类处理,得到至少一个聚类;以及
删除每个聚类中的至少一张图片,以清理移动终端的图片库。
2.如权利要求1所述的方法,其中,提取图片库中每张图片的结构信息生成该图片的第一指纹的步骤包括:
获取图片的灰度图;
将所述灰度图缩小到第一预定尺寸,得到第一灰度图;
将所述第一灰度图向量化得到一维信号,并计算所述一维信号的二阶差分信号;
对所述二阶差分信号进行量化和编码处理,得到所述图片的第一指纹。
3.如权利要求1或2所述的方法,其中,所述提取每张图片的颜色信息生成所述图片的第二指纹的步骤包括:
将图片缩放到第二预定尺寸,得到第一彩色图;
统计所述第一彩色图在各颜色通道上的色彩分布,得到所述图片的颜色向量;
对所述颜色向量进行量化和编码处理,得到所述图片的第二指纹。
4.如权利要求1-3中任一项所述的方法,其中,所述根据图片的指纹对图片库中的图片进行聚类处理、得到至少一个聚类的步骤包括:
将所述图片库的所有图片两两相连,并根据图片的指纹计算相连的两张图片间的相似值;
若所述两张图片间的相似值小于阈值,则断开所述两张图片之间的连接关系;以及
将相互之间有连接关系的图片作为一个聚类。
5.如权利要求1-4中任一项所述的方法,其中,所述删除每个聚类中的至少一张图片,以清理移动终端的图片库的步骤还包括:
计算每个聚类中的图片的数量;以及
根据每个聚类中图片的数量按比例删除各聚类中的图片。
6.如权利要求5所述的方法,其中,所述根据每个聚类中图片的数量按比例删除各聚类中的图片的步骤还包括:
当聚类中图片的数量小于2时,不删除该聚类中的图片。
7.如权利要求4所述的方法,其中,根据图片的指纹计算相连的两张图片间的相似值的步骤包括:
计算两张图片的指纹的汉明距离;
用所述汉明距离除以所述指纹的位数,得到第一系数;以及
计算1与第一系数之差,得到所述两张图片的相似值。
8.如权利要求2所述的方法,其中,所述对二阶差分信号进行量化和编码处理、得到图片的第一指纹的步骤包括:
遍历所述二阶差分信号,以找到信号中的最大值和最小值;
根据所述最大值、最小值和第一量化级数计算得到所述二阶差分信号的量化序数;以及
按预定规则对所述二阶差分信号的量化序数进行编码,得到第一指纹。
9.一种移动终端,包括:
一个或多个处理器;和
存储器,其中所述存储器中布置有图片库;
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1-8所述方法中的任一方法的指令。
10.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当移动终端执行时,使得所述移动终端执行根据权利要求1-8所述的方法中的任一方法。
CN201810345579.3A 2018-04-17 2018-04-17 一种移动终端的图片库的清理方法及移动终端 Active CN108549702B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810345579.3A CN108549702B (zh) 2018-04-17 2018-04-17 一种移动终端的图片库的清理方法及移动终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810345579.3A CN108549702B (zh) 2018-04-17 2018-04-17 一种移动终端的图片库的清理方法及移动终端

Publications (2)

Publication Number Publication Date
CN108549702A true CN108549702A (zh) 2018-09-18
CN108549702B CN108549702B (zh) 2020-11-06

Family

ID=63515482

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810345579.3A Active CN108549702B (zh) 2018-04-17 2018-04-17 一种移动终端的图片库的清理方法及移动终端

Country Status (1)

Country Link
CN (1) CN108549702B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861966A (zh) * 2021-02-05 2021-05-28 浙江新再灵科技股份有限公司 图片去重方法、装置及存储介质
CN113110804A (zh) * 2021-04-30 2021-07-13 平安普惠企业管理有限公司 重复图片删除方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324650A (zh) * 2012-10-23 2013-09-25 深圳市宜搜科技发展有限公司 一种图像检索方法及系统
CN104809198A (zh) * 2015-04-23 2015-07-29 北京奇虎科技有限公司 图片清理的方法、装置以及终端设备
CN104881470A (zh) * 2015-05-28 2015-09-02 暨南大学 一种面向海量图片数据的重复数据删除方法
CN105261044A (zh) * 2015-09-15 2016-01-20 北京金山安全软件有限公司 相似图片的识别方法、装置及电子设备
CN105678334A (zh) * 2016-01-05 2016-06-15 广州市久邦数码科技有限公司 一种识别重复照片的方法及其实现系统
KR20170077730A (ko) * 2015-12-28 2017-07-06 삼성전자주식회사 컨텐트 인식 장치 및 그 동작 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324650A (zh) * 2012-10-23 2013-09-25 深圳市宜搜科技发展有限公司 一种图像检索方法及系统
CN104809198A (zh) * 2015-04-23 2015-07-29 北京奇虎科技有限公司 图片清理的方法、装置以及终端设备
CN104881470A (zh) * 2015-05-28 2015-09-02 暨南大学 一种面向海量图片数据的重复数据删除方法
CN105261044A (zh) * 2015-09-15 2016-01-20 北京金山安全软件有限公司 相似图片的识别方法、装置及电子设备
KR20170077730A (ko) * 2015-12-28 2017-07-06 삼성전자주식회사 컨텐트 인식 장치 및 그 동작 방법
CN105678334A (zh) * 2016-01-05 2016-06-15 广州市久邦数码科技有限公司 一种识别重复照片的方法及其实现系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861966A (zh) * 2021-02-05 2021-05-28 浙江新再灵科技股份有限公司 图片去重方法、装置及存储介质
CN113110804A (zh) * 2021-04-30 2021-07-13 平安普惠企业管理有限公司 重复图片删除方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN108549702B (zh) 2020-11-06

Similar Documents

Publication Publication Date Title
EP3125135B1 (en) Picture processing method and device
CN109800744B (zh) 图像聚类方法及装置、电子设备和存储介质
CN106934376B (zh) 一种图像识别方法、装置及移动终端
CN108537283A (zh) 一种图像分类方法及卷积神经网络生成方法
CN108062526A (zh) 一种人体姿态估计方法及移动终端
CN108230232B (zh) 一种图像处理的方法以及相关装置
CN109598250B (zh) 特征提取方法、装置、电子设备和计算机可读介质
CN107871001B (zh) 音频播放方法、装置、存储介质及电子设备
WO2020173115A1 (zh) 网络模块和分配方法及装置、电子设备和存储介质
CN107871000B (zh) 音频播放方法、装置、存储介质及电子设备
TWI785267B (zh) 影像處理方法、電子設備和儲存介質
CN206595991U (zh) 一种双摄像头移动终端
CN111881813B (zh) 人脸识别终端的数据存储方法及系统
CN109672908A (zh) 一种隐私信息保护方法、装置和移动终端
CN107153546A (zh) 一种视频播放方法及移动设备
CN108781252A (zh) 一种图像拍摄方法及装置
CN108549702A (zh) 一种移动终端的图片库的清理方法及移动终端
CN110166696B (zh) 拍摄方法、装置、终端设备以及计算机可读存储介质
CN109963072B (zh) 对焦方法、装置、存储介质及电子设备
CN105389108A (zh) 一种移动终端触摸操作的识别方法及装置
CN113271379B (zh) 图像处理方法、装置及电子设备
CN113271378B (zh) 图像处理方法、装置及电子设备
CN105516464B (zh) 一种来电数据隐私保护方法、装置和移动终端
CN109657440A (zh) 基于区块链的生物特征信息处理方法和装置、终端设备
CN109981970B (zh) 一种确定拍摄场景的方法、装置和机器人

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant