CN105678334A - 一种识别重复照片的方法及其实现系统 - Google Patents

一种识别重复照片的方法及其实现系统 Download PDF

Info

Publication number
CN105678334A
CN105678334A CN201610010333.1A CN201610010333A CN105678334A CN 105678334 A CN105678334 A CN 105678334A CN 201610010333 A CN201610010333 A CN 201610010333A CN 105678334 A CN105678334 A CN 105678334A
Authority
CN
China
Prior art keywords
photo
time
judged
photographs
mean value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610010333.1A
Other languages
English (en)
Inventor
邓裕强
张惠钧
磨剑波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou jiubang century science and Technology Co Ltd
Original Assignee
JIUBANG COMPUTER TECHNOLOGY (GUANGZHOU) Co Ltd
Guangzhou Jiubang Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JIUBANG COMPUTER TECHNOLOGY (GUANGZHOU) Co Ltd, Guangzhou Jiubang Digital Technology Co Ltd filed Critical JIUBANG COMPUTER TECHNOLOGY (GUANGZHOU) Co Ltd
Priority to CN201610010333.1A priority Critical patent/CN105678334A/zh
Publication of CN105678334A publication Critical patent/CN105678334A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Collating Specific Patterns (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种识别重复照片的方法,包括:将所有照片进行分组,把每一张照片的生成时间跟其它所有照片的生成时间进行一一比较,判断照片之间的生成时间差异是否在预设范围内,若是,则判断为时间相似的照片,并归类为同一时间组,若否,则判断为时间不相似的照片,不需要进行识别;将判断为时间相似的照片进行PHash算法运算,每个照片拥有自己独有的一串数字,作为照片的识别指纹;将时间相似的照片进行重新分组,把每一张照片的识别指纹跟同一时间组其它所有照片的识别指纹进行一一比较,判断照片之间的识别指纹差异是否在预设范围内,若是,则判断为重复的照片,若否,则判断为不重复的照片。本发明还公开了一种实现识别重复照片的系统。

Description

一种识别重复照片的方法及其实现系统
技术领域
本发明涉及移动终端图像识别技术领域,具体涉及一种识别重复照片的方法及其实现系统。
背景技术
大部分用户在拍照的过程中,都习惯在同一个场景连续拍几张,而一般情况仅有拍摄最好的一张才是用户真正需要的,这导致手机中存在多张重复冗余的照片。但现有的移动终端没有自动识别重复照片的功能,不能满足用户的个性化需求。
发明内容
本发明的目的,就是克服现有技术的不足,提供一种准确度高、识别效率高的识别重复照片的方法。
为实现本发明的另一目的,本发明还提供了一种实现识别重复照片的系统。
为了达到上述目的,采用如下技术方案:一种识别重复照片的方法,所述方法包括以下步骤:
S1、将所有照片进行分组,把每一张照片的生成时间跟其它所有照片的生成时间进行一一比较,判断照片之间的生成时间差异是否在预设范围内,若是,则判断为时间相似的照片,并归类为同一时间组,若否,则判断为时间不相似的照片,不需要进行识别;
S2、将步骤S1中判断为时间相似的照片进行PHash算法运算,运算执行后,每个照片拥有自己独有的一串数字,作为照片的识别指纹;
S3、将时间相似的照片进行重新分组,把每一张照片的识别指纹跟同一时间组其它所有照片的识别指纹进行一一比较,判断照片之间的识别指纹差异是否在预设范围内,若是,则判断为重复的照片,若否,则判断为不重复的照片。
进一步,所述步骤S2的PHash算法运算操作具体为:
将所有照片都缩放到预设像素大小的尺寸;
将缩放后的照片转换成灰度图像;
将灰度图像进行离散余弦变换降低频率,得出结果矩阵;
计算每个照片离散余弦矩阵平均值,并将照片余弦矩阵每一个数值与平均值进行比较,大于或等于平均值的像素标志为1,小于平均值的像素标志为0;
将比较结果逐一组合一起,就构成了一串数字。
为实现本发明的另一目的,本发明还采用如下技术方案:一种实现识别重复照片的系统,所述系统包括:
相似判断模块,用于将所有照片进行分组,把每一张照片的生成时间跟其它所有照片的生成时间进行一一比较,判断照片之间的生成时间差异是否在预设范围内,若是,则判断为时间相似的照片,并归类为同一时间组,若否,则判断为时间不相似的照片,不需要进行识别;
识别指纹模块,用于将相似判断模块中判断为时间相似的照片进行PHash算法运算,运算执行后,每个照片拥有自己独有的一串数字,作为照片的识别指纹;
重复判断模块,用于将时间相似的照片进行重新分组,把每一张照片的识别指纹跟同一时间组其它所有照片的识别指纹进行一一比较,判断照片之间的识别指纹差异是否在预设范围内,若是,则判断为重复的照片,若否,则判断为不重复的照片。
进一步,所述PHash算法运算操作具体为:
将所有照片都缩放到预设像素大小的尺寸;
将缩放后的照片转换成灰度图像;
将灰度图像进行离散余弦变换降低频率,得出结果矩阵;
计算每个照片离散余弦矩阵平均值,并将照片余弦矩阵每一个数值与平均值进行比较,大于或等于平均值的像素标志为1,小于平均值的像素标志为0;
将比较结果逐一组合一起,就构成了一串数字。
与现有技术相比,本发明的有益效果在于:本发明通过将所有照片进行分组,把每一张照片的生成时间跟其它所有照片的生成时间进行一一比较,判断照片之间的生成时间差异是否在预设范围内,若是,则判断为时间相似的照片,并归类为同一时间组,若否,则判断为时间不相似的照片,不需要进行识别;将上述判断为时间相似的照片进行PHash算法运算,运算执行后,每个照片拥有自己独有的一串数字,作为照片的识别指纹;将时间相似的照片进行重新分组,把每一张照片的识别指纹跟同一时间组其它所有照片的识别指纹进行一一比较,判断照片之间的识别指纹差异是否在预设范围内,若是,则判断为重复的照片,若否,则判断为不重复的照片。本发明的识别效率及准确度高,能满足用户的个性化需求。
附图说明
图1是本发明实施例一中实现识别重复照片的系统的模块示意图;
图2是本发明实施例一中识别重复照片的方法法的流程图。
具体实施方式
下面将结合附图以及具体实施方法来详细说明本发明,在本发明的示意性实施及说明用来解释本发明,但并不作为对本发明的限定。
实施例一
如图1所示,一种实现识别重复照片的系统,所述系统包括:
相似判断模块,用于将所有照片进行分组,把每一张照片的生成时间跟其它所有照片的生成时间进行一一比较,判断照片之间的生成时间差异是否在预设范围内,若是,则判断为时间相似的照片,并归类为同一时间组,若否,则判断为时间不相似的照片,不需要进行识别;
识别指纹模块,用于将相似判断模块中判断为相似的照片进行PHash算法运算,运算执行后,每个照片拥有自己独有的一串数字,作为照片的识别指纹;
所述PHash算法运算操作具体为:
将所有照片都缩放到预设像素大小的尺寸;
将缩放后的照片转换成灰度图像;
将灰度图像进行离散余弦变换降低频率,得出结果矩阵;
计算每个照片离散余弦矩阵平均值,并将照片余弦矩阵每一个数值与平均值进行比较,大于或等于平均值的像素标志为1,小于平均值的像素标志为0;
将比较结果逐一组合一起,就构成了一串数字。
重复判断模块,用于将时间相似的照片进行重新分组,把每一张照片的识别指纹跟同一时间组其它所有照片的识别指纹进行一一比较,判断照片之间的识别指纹差异是否在预设范围内,若是,则判断为重复的照片,若否,则判断为不重复的照片。
如图2所示,一种识别重复照片的方法,所述方法包括以下步骤:
S101:将所有照片进行分组,把每一张照片的生成时间跟其它所有照片的生成时间进行一一比较,判断照片之间的生成时间差异是否在预设范围内,若是,则判断为时间相似的照片,并归类为同一时间组,若否,则判断为时间不相似的照片,不需要进行识别;
S102:将步骤S101中判断为时间相似的照片进行PHash算法运算,运算执行后,每个照片拥有自己独有的一串数字,作为照片的识别指纹;
所述步骤S102的PHash算法运算操作具体为:
S201:将所有照片都缩放到预设像素大小的尺寸;
S202:将缩放后的照片转换成灰度图像;
S203:将灰度图像进行离散余弦变换降低频率,得出结果矩阵;
S204:计算每个照片离散余弦矩阵平均值,并将照片余弦矩阵每一个数值与平均值进行比较,大于或等于平均值的像素标志为1,小于平均值的像素标志为0;
S205:将比较结果逐一组合一起,就构成了一串数字。
S103:将时间相似的照片进行重新分组,把每一张照片的识别指纹跟同一时间组其它所有照片的识别指纹进行一一比较,判断照片之间的识别指纹差异是否在预设范围内,若是,则判断为重复的照片,若否,则判断为不重复的照片。
实施例二
一种实现识别重复照片的系统,所述系统包括:
相似判断模块,用于将移动终端中相机保存路径下所有照片进行分组,把每一张照片的生成时间跟其它所有照片的生成时间进行一一比较,判断照片之间的生成时间差异是否在预设的5min范围内,若是,则判断为时间相似的照片,并归类为同一时间组,若否,则判断为时间不相似的照片,不需要进行识别;这样将所有照片比较过后,即可排除一部分在时间上孤立的照片,此类照片间不太可能存在重复照片;
识别指纹模块,用于将相似判断模块中判断为时间相似的照片进行PHash算法运算,运算执行后,每个照片拥有自己独有的一串数字,作为照片的识别指纹;
所述PHash算法运算操作具体为:
将所有照片都缩放到8*8像素的尺寸,这样就可以摒弃不同尺寸、比例带来的照片差异;
将8*8的照片转换成灰度图像,这样可以摒弃了色彩带来的差异;
将灰度图像进行离散余弦变换降低频率,得出结果矩阵;
计算每个照片离散余弦矩阵平均值,并将照片余弦矩阵每一个数值与平均值进行比较,大于或等于平均值的像素标志为1,小于平均值的像素标志为0;
将比较结果逐一组合一起,就构成了一个64位的01整数串,这就是该照片的“指纹”。
重复判断模块,用于将时间相似的照片进行重新分组,把每一张照片的识别指纹跟同一时间组其它所有照片的识别指纹进行一一比较,判断照片之间的识别指纹差异是否在预设范围内,这样可以更精准地帅选出可能重复的照片,若是,则判断为重复的照片,若否,则判断为不重复的照片。
一种识别重复照片的方法,所述方法包括以下步骤:
S301:将移动终端中相机保存路径下所有照片进行分组,把每一张照片的生成时间跟其它所有照片的生成时间进行一一比较,判断照片之间的生成时间差异是否在预设的5min范围内,若是,则判断为时间相似的照片,并归类为同一时间组,若否,则判断为时间不相似的照片,不需要进行识别;这样将所有照片比较过后,即可排除一部分在时间上孤立的照片,此类照片间不太可能存在重复照片;
S302:将步骤S301中判断为时间相似的照片进行PHash算法运算,运算执行后,每个照片拥有自己独有的一串数字,作为照片的识别指纹;
所述步骤S302的PHash算法运算操作具体为:
S401:将所有照片都缩放到8*8像素的尺寸,这样就可以摒弃不同尺寸、比例带来的照片差异;
S402:将8*8的照片转换成灰度图像,这样可以摒弃了色彩带来的差异;
S403:将灰度图像进行离散余弦变换降低频率,得出结果矩阵;
S404:计算每个照片离散余弦矩阵平均值,并将照片余弦矩阵每一个数值与平均值进行比较,大于或等于平均值的像素标志为1,小于平均值的像素标志为0;
S405:将比较结果逐一组合一起,就构成了一个64位的01整数串,这就是该照片的“指纹”。
S303:将时间相似的照片进行重新分组,把每一张照片的识别指纹跟同一时间组其它所有照片的识别指纹进行一一比较,判断照片之间的识别指纹差异是否在预设范围内,这样可以更精准地帅选出可能重复的照片,若是,则判断为重复的照片,若否,则判断为不重复的照片。
本实施例所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本发明实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (4)

1.一种识别重复照片的方法,其特征在于,所述方法包括以下步骤:
S1、将所有照片进行分组,把每一张照片的生成时间跟其它所有照片的生成时间进行一一比较,判断照片之间的生成时间差异是否在预设范围内,若是,则判断为时间相似的照片,并归类为同一时间组,若否,则判断为时间不相似的照片,不需要进行识别;
S2、将步骤S1中判断为时间相似的照片进行PHash算法运算,运算执行后,每个照片拥有自己独有的一串数字,作为照片的识别指纹;
S3、将时间相似的照片进行重新分组,把每一张照片的识别指纹跟同一时间组其它所有照片的识别指纹进行一一比较,判断照片之间的识别指纹差异是否在预设范围内,若是,则判断为重复的照片,若否,则判断为不重复的照片。
2.根据权利要求1所述的识别重复照片的方法,其特征在于,所述步骤S2的PHash算法运算操作具体为:
将所有照片都缩放到预设像素大小的尺寸;
将缩放后的照片转换成灰度图像;
将灰度图像进行离散余弦变换降低频率,得出结果矩阵;
计算每个照片离散余弦矩阵平均值,并将照片余弦矩阵每一个数值与平均值进行比较,大于或等于平均值的像素标志为1,小于平均值的像素标志为0;
将比较结果逐一组合一起,就构成了一串数字。
3.一种实现识别重复照片的系统,其特征在于,所述系统包括:
相似判断模块,用于将所有照片进行分组,把每一张照片的生成时间跟其它所有照片的生成时间进行一一比较,判断照片之间的生成时间差异是否在预设范围内,若是,则判断为时间相似的照片,并归类为同一时间组,若否,则判断为时间不相似的照片,不需要进行识别;
识别指纹模块,用于将相似判断模块中判断为时间相似的照片进行PHash算法运算,运算执行后,每个照片拥有自己独有的一串数字,作为照片的识别指纹;
重复判断模块,用于将时间相似的照片进行重新分组,把每一张照片的识别指纹跟同一时间组其它所有照片的识别指纹进行一一比较,判断照片之间的识别指纹差异是否在预设范围内,若是,则判断为重复的照片,若否,则判断为不重复的照片。
4.根据权利要求3所述的实现识别重复照片的系统,其特征在于,所述PHash算法运算操作具体为:
将所有照片都缩放到预设像素大小的尺寸;
将缩放后的照片转换成灰度图像;
将灰度图像进行离散余弦变换降低频率,得出结果矩阵;
计算每个照片离散余弦矩阵平均值,并将照片余弦矩阵每一个数值与平均值进行比较,大于或等于平均值的像素标志为1,小于平均值的像素标志为0;
将比较结果逐一组合一起,就构成了一串数字。
CN201610010333.1A 2016-01-05 2016-01-05 一种识别重复照片的方法及其实现系统 Pending CN105678334A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610010333.1A CN105678334A (zh) 2016-01-05 2016-01-05 一种识别重复照片的方法及其实现系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610010333.1A CN105678334A (zh) 2016-01-05 2016-01-05 一种识别重复照片的方法及其实现系统

Publications (1)

Publication Number Publication Date
CN105678334A true CN105678334A (zh) 2016-06-15

Family

ID=56299524

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610010333.1A Pending CN105678334A (zh) 2016-01-05 2016-01-05 一种识别重复照片的方法及其实现系统

Country Status (1)

Country Link
CN (1) CN105678334A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108549702A (zh) * 2018-04-17 2018-09-18 厦门美图之家科技有限公司 一种移动终端的图片库的清理方法及移动终端
CN111597363A (zh) * 2019-02-21 2020-08-28 奇酷互联网络科技(深圳)有限公司 检测重复照片的方法、移动终端和具有存储功能的装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140161348A1 (en) * 2012-12-07 2014-06-12 Realnetworks, Inc. Method and system to detect and select best photographs
CN103984776A (zh) * 2014-06-05 2014-08-13 北京奇虎科技有限公司 一种识别重复图片的方法、图片搜索去重方法及其装置
CN104504120A (zh) * 2014-12-29 2015-04-08 北京奇艺世纪科技有限公司 一种相似图片检测方法及装置
CN104809198A (zh) * 2015-04-23 2015-07-29 北京奇虎科技有限公司 图片清理的方法、装置以及终端设备
CN105205181A (zh) * 2015-10-28 2015-12-30 上海斐讯数据通信技术有限公司 一种照片管理方法及管理系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140161348A1 (en) * 2012-12-07 2014-06-12 Realnetworks, Inc. Method and system to detect and select best photographs
CN103984776A (zh) * 2014-06-05 2014-08-13 北京奇虎科技有限公司 一种识别重复图片的方法、图片搜索去重方法及其装置
CN104504120A (zh) * 2014-12-29 2015-04-08 北京奇艺世纪科技有限公司 一种相似图片检测方法及装置
CN104809198A (zh) * 2015-04-23 2015-07-29 北京奇虎科技有限公司 图片清理的方法、装置以及终端设备
CN105205181A (zh) * 2015-10-28 2015-12-30 上海斐讯数据通信技术有限公司 一种照片管理方法及管理系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108549702A (zh) * 2018-04-17 2018-09-18 厦门美图之家科技有限公司 一种移动终端的图片库的清理方法及移动终端
CN108549702B (zh) * 2018-04-17 2020-11-06 厦门美图之家科技有限公司 一种移动终端的图片库的清理方法及移动终端
CN111597363A (zh) * 2019-02-21 2020-08-28 奇酷互联网络科技(深圳)有限公司 检测重复照片的方法、移动终端和具有存储功能的装置

Similar Documents

Publication Publication Date Title
US8577131B1 (en) Systems and methods for visual object matching
US9053386B2 (en) Method and apparatus of identifying similar images
JP5911578B2 (ja) 画像の特徴点位置情報を符号化する方法、コンピュータプログラム、モバイルデバイス
CN104094255B (zh) 用于搜索图像的方法和装置以及用于执行该方法的计算机可读记录介质
US20170147608A1 (en) Method and apparatus for performing a parallel search operation
WO2015123601A4 (en) Global visual vocabulary, systems and methods
CN106886553A (zh) 一种图像检索方法及服务器
CN104767940A (zh) 拍照方法及装置
WO2013068638A2 (en) Methods and apparatuses for mobile visual search
CN111274446A (zh) 视频处理方法及相关装置
CN105678334A (zh) 一种识别重复照片的方法及其实现系统
US20160275370A1 (en) Methods and systems for determining a perceptual similarity between images
Memon et al. Unsupervised feature approach for content based image retrieval using principal component analysis
EP2979226A1 (en) A method and apparatus for estimating a pose of an imaging device
Fierro-Radilla et al. An effective visual descriptor based on color and shape features for image retrieval
Sandoval Orozco et al. Image source acquisition identification of mobile devices based on the use of features
Kaur et al. Deep CNN based online image deduplication technique for cloud storage system
TW201624322A (zh) 照片分群系統及方法
Qi et al. An efficient deep learning hashing neural network for mobile visual search
Singh et al. Effective image retrieval based on hybrid features with weighted similarity measure and query image classification
Tra et al. Dominant SIFT: A novel compact descriptor
Parra et al. Automatic gang graffiti recognition and interpretation
Abdulkadhem et al. Proposed a content-based image retrieval system based on the shape and texture features
CN105574157A (zh) 一种照片存储方法及设备
Singh et al. An effective mechanism to neutralize the semantic gap in content based image retrieval (CBIR).

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20171025

Address after: 510055, tower 17, A tower, Zhonghua International Center, No. three, 33 Zhongshan Road, Yuexiu District, Guangdong, Guangzhou, China

Applicant after: Guangzhou jiubang century science and Technology Co Ltd

Address before: 510055 A, block 16-17, China International Center, No. three, Zhongshan Road, Guangzhou, Guangdong, China

Applicant before: Guangzhou Jiubang Digital Technology Co., Ltd.

Applicant before: Jiubang computer technology (Guangzhou) Co., Ltd.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160615