CN111310832A - 一种图片查重方法和系统 - Google Patents

一种图片查重方法和系统 Download PDF

Info

Publication number
CN111310832A
CN111310832A CN202010101514.1A CN202010101514A CN111310832A CN 111310832 A CN111310832 A CN 111310832A CN 202010101514 A CN202010101514 A CN 202010101514A CN 111310832 A CN111310832 A CN 111310832A
Authority
CN
China
Prior art keywords
picture
target
target picture
pictures
fingerprint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010101514.1A
Other languages
English (en)
Inventor
杨嘉华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong 3vjia Information Technology Co Ltd
Original Assignee
Guangdong 3vjia Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong 3vjia Information Technology Co Ltd filed Critical Guangdong 3vjia Information Technology Co Ltd
Priority to CN202010101514.1A priority Critical patent/CN111310832A/zh
Publication of CN111310832A publication Critical patent/CN111310832A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明提供了一种图片查重方法和系统,涉及图像处理的技术领域,包括:获取多个待查重图片;按照预设尺寸,对多个待查重图片进行缩放处理,得到多个目标图片;确定每个目标图片的图片指纹;利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出第一目标图片和第二目标图片之间的汉明距离,其中,第一目标图片为目标图片中的任意一张图片,第二目标图片为目标图片中除第一目标图片以外的图片;根据汉明距离,确定第一目标图片是否为第二目标图片的重复图片,解决了现有技术中无法对大量图片进行查重的技术问题。

Description

一种图片查重方法和系统
技术领域
本发明涉及图像处理的技术领域,尤其是涉及一种图像查重的方法和系统。
背景技术
在大数据时代,每天甚至每小时每分钟互联网都产生和传播着海量的图片,在企业平台,特别是电商平台,商品山寨,图标仿冒十分严重。为解决这些问题,靠人工一张张图片去检测肯定是做不到的,只能建立一个图片查重系统在海量图片中自动化找出相似图片进而排查图标仿冒。而现有的图片查重技术中,往往耗时很久,无法针对海量图片的查重。
针对上述问题,还未提出有效的解决方案。
发明内容
有鉴于此,本发明的目的在于提供一种图片查重方法和系统,以缓解了解决了现有技术中无法对大量图片进行查重的技术问题。
第一方面,本发明实施例提供了一种图片查重方法,包括:获取多个待查重图片;按照预设尺寸,对所述多个待查重图片进行缩放处理,得到多个目标图片;确定每个所述目标图片的图片指纹;利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出所述第一目标图片和所述第二目标图片之间的汉明距离,其中,所述第一目标图片为所述目标图片中的任意一张图片,所述第二目标图片为所述目标图片中除所述第一目标图片以外的图片;根据所述汉明距离,确定所述第一目标图片是否为所述第二目标图片的重复图片。
进一步地,所述预设尺寸为n*m,则所述目标图片中包含n*m个像素块,其中,n与m均为大于0的整数。
进一步地,确定每个所述目标图片的图片指纹,包括:对所述目标图片进行灰度化处理,得到所述目标图片的灰度图;对所述灰度图进行离散余弦变换,得到所述目标图片的DCT系数矩阵;基于所述目标图片DCT系数矩阵,确定出每个所述像素块所对应的系数,以及计算所述DCT系数矩阵的平均值;结合每个所述像素块所对应的系数和所述平均值,确定出所述目标图片的图片指纹。
进一步地,结合每个所述像素块所对应的系数和所述平均值,确定出所述待查重图片的图片指纹,包括:根据每个所述像素块所对应的系数和所述平均值,确定出所述n*m个像素块中的第一目标像素块,其中,所述第一目标像素块为所述n*m个像素块中系数大于或等于所述平均值的像素块;将所述第一目标像素块的哈希值标记为第一预设值,以及将第二目标像素块的哈希值标记为第二预设值,其中,所述第二目标像素块为所述n*m个像素块中除所述第一目标像素块以外的像素块;根据所述第一目标像素块的哈希值和所述第二目标像素块的哈希值,确定出所述目标图片的哈希值,并将所述哈希值确定为所述图片指纹。
进一步地,利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出所述第一目标图片和所述第二目标图片之间的汉明距离,包括:将所述第一目标图片的图片指纹均分为预设数量个第一子图片指纹,以及将所述第二目标图片的图片指纹均分为所述预设数量个第二子图片指纹;分别计算所述第一子图片指纹与每个所述第二目标图片的第二子图片指纹之间的汉明距离,得到多个汉明距离。
进一步地,根据所述汉明距离,确定所述待查重图片是否为所述预设图片的重复图片,包括:确定所述多个汉明距离中是否包含目标汉明距离,其中,所述目标汉明距离为所述多个汉明距离中大于预设阈值的汉明距离;若所述多个汉明距离中包含目标汉明距离,则所述第一目标图片为所述第二目标图片的重复图片;若所述多个汉明距离中不包含目标汉明距离,则所述第一目标图片不是为所述第二目标图片的重复图片。
第二方面,本发明实施例还提供了一种图片查重系统,包括:获取单元,缩放单元,第一确定单元,计算单元和第二确定单元,其中,所述获取单元,用于获取多个待查重图片;所述缩放单元,用于按照预设尺寸,对所述多个待查重图片进行缩放处理,得到多个目标图片;所述第一确定单元,确定每个所述目标图片的图片指纹;所述计算单元,用于利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出所述第一目标图片和所述第二目标图片之间的汉明距离,其中,所述第一目标图片为所述目标图片中的任意一张图片,所述第二目标图片为所述目标图片中除所述第一目标图片以外的图片;所述第二确定单元,用于根据所述汉明距离,确定所述第一目标图片是否为所述第二目标图片的重复图片。
进一步地,所述预设尺寸为n*m,则所述目标图片中包含n*m个像素块,其中,n与m均为大于0的整数。
第三方面,本发明实施例还提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行第一方面所述的图片查重方法。
第四方面,本发明实施例还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面中所述的图片查重方法。
在本发明实施例中,首先,获取多个待查重图片;并按照预设尺寸,对多个待查重图片进行缩放处理,得到多个目标图片;接着,确定每个目标图片的图片指纹;然后,利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出第一目标图片和第二目标图片之间的汉明距离,其中,第一目标图片为目标图片中的任意一张图片,第二目标图片为目标图片中除第一目标图片以外的图片;最后根据汉明距离,确定第一目标图片是否为第二目标图片的重复图片。
本发明实施例中,通过对多个待查重图片进行缩放,得到多个目标图片,确定出每个目标图片的图片指纹,最后利用各个目标图片的图片指纹之间的汉明距离,确定出多个待查重图片中是否包含重复的图片,从而达到了对大量图片进行查重的目的,进而无法对大量图片进行查重的技术问题,从而实现了能够快速准确地对大量图片进行查重的技术效果。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种图片查重方法的流程图;
图2为本发明实施例提供的一种目标图片的图片指纹的确定方法的流程图;
图3为本发明实施例提供的一种汉明距离的计算方法的流程图;
图4为本发明实施例提供的一种图片查重系统的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
根据本发明实施例,提供了一种图片查重方法和系统的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种图片查重方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取多个待查重图片;
步骤S104,按照预设尺寸,对所述多个待查重图片进行缩放处理,得到多个目标图片;
具体的,上述预设尺寸为n*m,则目标图片中包含n*m个像素块,其中,n与m均为大于0的整数,上述的预设尺寸可以有工作人员根据实际情况自行设定,在本发明实施例中不做具体限定。
通过对多个待查重图片进行缩放处理能够去除待查重图片的细节,只保留图片结构、图片明暗等基本信息,摒弃不同尺寸、比例带来的待查重图片差异,同时也起到减少计算的作用。
步骤S106,确定每个所述目标图片的图片指纹;
步骤S108,利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出所述第一目标图片和所述第二目标图片之间的汉明距离,其中,所述第一目标图片为所述目标图片中的任意一张图片,所述第二目标图片为所述目标图片中除所述第一目标图片以外的图片;
步骤S110,根据所述汉明距离,确定所述第一目标图片是否为所述第二目标图片的重复图片。
本发明实施例中,通过对多个待查重图片进行缩放,得到多个目标图片,确定出每个目标图片的图片指纹,最后利用各个目标图片的图片指纹之间的汉明距离,确定出多个待查重图片中是否包含重复的图片,从而达到了对大量图片进行查重的目的,进而无法对大量图片进行查重的技术问题,从而实现了能够快速准确地对大量图片进行查重的技术效果。
需要说明的是,在计算多个目标图片的图片指纹时,可以采用多进程并行计算批量图片的指纹的方式,充分利用终端设备的多核CPU资源,提高CPU的使用率,从而大大降低计算海量图片的图片指纹所需的时间。
在本发明实施例中,如图2所示,步骤S106还包括如下步骤:
步骤S11,对所述目标图片进行灰度化处理,得到所述目标图片的灰度图;
步骤S12,对所述灰度图进行离散余弦变换,得到所述目标图片的DCT系数矩阵;
步骤S13,基于所述目标图片DCT系数矩阵,确定出每个所述像素块所对应的系数,以及计算所述DCT系数矩阵的平均值;
步骤S14,结合每个所述像素块所对应的系数和所述平均值,确定出所述目标图片的图片指纹。
在本发明实施例中,通过将目标图片转换为灰度图,能够减少步骤S13中的计算量,从而提高图片查重的查重速率。
通过灰度图进行离散余弦变换,能够得到目标图片的DCT系数矩阵,在得到DCT系数矩阵之后,计算出DCT系数矩阵的平均值和每个像素块所对应的系数。
最后,判断每个像素块的系数至于DCT系数矩阵的平均值之间的关系。
当像素块的系数大于或等于平均值,则将该像素块确定为第一目标像素块,,并将第一目标像素块的哈希值设定为第一预设值,一般情况下,第一预设值设定为1。
当像素块的系数小于平均值,则将该像素块确定为第二目标像素块(即目标像素块中除第一目标像素块以外的像素块),并将第二目标像素块的哈希值设定为第二预设值,一般情况下,第一预设值设定为0。
最后,根据第一目标像素块的哈希值和第二目标像素块的哈希值,确定出目标图片的哈希值,并将哈希值确定为图片指纹。
下面以预设尺寸为8*8为例,目标图片包含64个像素块,目标图片的哈希值(图片指纹)则是一个64的二进制数。
在本发明实施例中,如图3所示,步骤S108包括如下步骤:
步骤S21,将所述第一目标图片的图片指纹均分为预设数量个第一子图片指纹,以及将所述第二目标图片的图片指纹均分为所述预设数量个第二子图片指纹;
步骤S22,分别计算所述第一子图片指纹与每个所述第二目标图片的第二子图片指纹之间的汉明距离,得到多个汉明距离。
在本发明实施例中,首先将第一目标图片的图片指纹均分为预设数量个第一子图片指纹,以及将第二目标图片的图片指纹均分为所述预设数量个第二子图片指纹。
接着,分别计算所述第一子图片指纹与每个第二目标图片的第二子图片指纹之间的汉明距离,从而得到多个汉明距离。
具体的,以目标图片的图片指纹为64位二进制数,预设数量为4为例,对上述步骤进行详细说明:
将64位二进制数平均分为4个子图片指纹,每个子图片指纹中均包含16个二进数,然后,构建4个键值对,其中第i个键值对的key为第i等分的所有图片(第一目标图片和第二目标图片)的16位指纹,value为一个列表,用于存储具有相同的第i个等分的所有图片的路径;再遍历所有的键值对,对每一个列表计算第一目标图片的64位二进制数和每个第二目标图片的64位二进制数之间的汉明距离,进而得到多个汉明距离。
在得到多个汉明距离之后,需要确定多个汉明距离中是否包含目标汉明距离(多个汉明距离中大于预设阈值的汉明距离);
如果多个汉明距离中包含目标汉明距离,那么第一目标图片为第二目标图片的重复图片;
如果多个汉明距离中不包含目标汉明距离,那么第一目标图片不是为第二目标图片的重复图片。
用汉明距离(Hamming distance)比较两张图片的相似度,然后跟预设的阈值比较以此判断两张图片是否是相似的。在信息论中,两个等长字符串(即第一目标图片的图片指纹和第二目标图片的图片指纹)之间的汉明距离是两个字符串对应位置的不同字符的个数。
例如:为第一字符串101110,第二字符串为110011,则第一字符串和第二字符串之间的汉明距离是4。
在本发明实施例中,通过将第一目标图片的图片指纹和第二目标图片的图片指纹均分为4等份,能够有效的减少计算第一目标图片的图片指纹和第二目标图片的图片指纹之间的汉明距离所需要的时间。
通过将第一目标图片的图片指纹和第二目标图片的图片指纹均分为4等份的计算汉明距离的时间复杂度为O(4n),而如果不等分指纹,对应每张图片,都用64位二进制数的图片指纹,去计算第一目标图片的图片指纹和第二目标图片的图片指纹之间的汉明距离,一样可以得到结果,但是时间复杂度为O(n2),效率较低。
实施例二:
本发明实施例还提供了一种图片查重系统,该图片查重系统用于执行本发明实施例上述内容所提供的图片查重方法,以下是本发明实施例提供的图片查重系统的具体介绍。
如图4所示,图4为上述图片查重系统的示意图,该图片查重系统包括:获取单元10,缩放单元20,第一确定单元30,计算单元40和第二确定单元50。
所述获取单元10,用于获取多个待查重图片;
所述缩放单元20,用于按照预设尺寸,对所述多个待查重图片进行缩放处理,得到多个目标图片;
所述第一确定单元30,确定每个所述目标图片的图片指纹;
所述计算单元40,用于利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出所述第一目标图片和所述第二目标图片之间的汉明距离,其中,所述第一目标图片为所述目标图片中的任意一张图片,所述第二目标图片为所述目标图片中除所述第一目标图片以外的图片;
所述第二确定单元50,用于根据所述汉明距离,确定所述第一目标图片是否为所述第二目标图片的重复图片。
本发明实施例中,通过对多个待查重图片进行缩放,得到多个目标图片,确定出每个目标图片的图片指纹,最后利用各个目标图片的图片指纹之间的汉明距离,确定出多个待查重图片中是否包含重复的图片,从而达到了对大量图片进行查重的目的,进而无法对大量图片进行查重的技术问题,从而实现了能够快速准确地对大量图片进行查重的技术效果。
优选的,所述预设尺寸为n*m,则所述目标图片中包含n*m个像素块,其中,n与m均为大于0的整数。
优选的,所述第一确定单元用于对所述目标图片进行灰度化处理,得到所述目标图片的灰度图;对所述灰度图进行离散余弦变换,得到所述目标图片的DCT系数矩阵;基于所述目标图片DCT系数矩阵,确定出每个所述像素块所对应的系数,以及计算所述DCT系数矩阵的平均值;结合每个所述像素块所对应的系数和所述平均值,确定出所述目标图片的图片指纹。
优选的,所述第一确定单元还用于根据每个所述像素块所对应的系数和所述平均值,确定出所述n*m个像素块中的第一目标像素块,其中,所述第一目标像素块为所述n*m个像素块中系数大于或等于所述平均值的像素块;将所述第一目标像素块的哈希值标记为第一预设值,以及将第二目标像素块的哈希值标记为第二预设值,其中,所述第二目标像素块为所述n*m个像素块中除所述第一目标像素块以外的像素块;根据所述第一目标像素块的哈希值和所述第二目标像素块的哈希值,确定出所述目标图片的哈希值,并将所述哈希值确定为所述图片指纹。
优选的,所述计算单元用于将所述第一目标图片的图片指纹均分为预设数量个第一子图片指纹,以及将所述第二目标图片的图片指纹均分为所述预设数量个第二子图片指纹;分别计算所述第一子图片指纹与每个所述第二目标图片的第二子图片指纹之间的汉明距离,得到多个汉明距离。
优选的,第二确定单元用于确定所述多个汉明距离中是否包含目标汉明距离,其中,所述目标汉明距离为所述多个汉明距离中大于预设阈值的汉明距离;若所述多个汉明距离中包含目标汉明距离,则所述第一目标图片为所述第二目标图片的重复图片;若所述多个汉明距离中不包含目标汉明距离,则所述第一目标图片不是为所述第二目标图片的重复图片。
本发明实施例提供的一种具有处理器可执行的非易失的程序代码的计算机可读介质,程序代码使处理器执行上述实施例一中的图片查重方法。
实施例三:
本发明实施例提供的一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例一中的图片查重方法。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种图片查重方法,其特征在于,包括:
获取多个待查重图片;
按照预设尺寸,对所述多个待查重图片进行缩放处理,得到多个目标图片;
确定每个所述目标图片的图片指纹;
利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出所述第一目标图片和所述第二目标图片之间的汉明距离,其中,所述第一目标图片为所述目标图片中的任意一张图片,所述第二目标图片为所述目标图片中除所述第一目标图片以外的图片;
根据所述汉明距离,确定所述第一目标图片是否为所述第二目标图片的重复图片。
2.根据权利要求1所述的方法,其特征在于,所述预设尺寸为n*m,则所述目标图片中包含n*m个像素块,其中,n与m均为大于0的整数。
3.根据权利要求2所述的方法,其特征在于,确定每个所述目标图片的图片指纹,包括:
对所述目标图片进行灰度化处理,得到所述目标图片的灰度图;
对所述灰度图进行离散余弦变换,得到所述目标图片的DCT系数矩阵;
基于所述目标图片的DCT系数矩阵,确定出每个所述像素块所对应的系数,以及计算所述DCT系数矩阵的平均值;
结合每个所述像素块所对应的系数和所述平均值,确定出所述目标图片的图片指纹。
4.根据权利要求2所述的方法,其特征在于,结合每个所述像素块所对应的系数和所述平均值,确定出所述待查重图片的图片指纹,包括:
根据每个所述像素块所对应的系数和所述平均值,确定出所述n*m个像素块中的第一目标像素块,其中,所述第一目标像素块为所述n*m个像素块中系数大于或等于所述平均值的像素块;
将所述第一目标像素块的哈希值标记为第一预设值,以及将第二目标像素块的哈希值标记为第二预设值,其中,所述第二目标像素块为所述n*m个像素块中除所述第一目标像素块以外的像素块;
根据所述第一目标像素块的哈希值和所述第二目标像素块的哈希值,确定出所述目标图片的哈希值,并将所述哈希值确定为所述图片指纹。
5.根据权利要求4所述的方法,其特征在于,利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出所述第一目标图片和所述第二目标图片之间的汉明距离,包括:
将所述第一目标图片的图片指纹均分为预设数量个第一子图片指纹,以及将所述第二目标图片的图片指纹均分为所述预设数量个第二子图片指纹;
分别计算所述第一子图片指纹与每个所述第二目标图片的第二子图片指纹之间的汉明距离,得到多个汉明距离。
6.根据权利要求1所述的方法,其特征在于,根据所述汉明距离,确定所述待查重图片是否为所述预设图片的重复图片,包括:
确定所述多个汉明距离中是否包含目标汉明距离,其中,所述目标汉明距离为所述多个汉明距离中大于预设阈值的汉明距离;
若所述多个汉明距离中包含目标汉明距离,则所述第一目标图片为所述第二目标图片的重复图片;
若所述多个汉明距离中不包含目标汉明距离,则所述第一目标图片不是为所述第二目标图片的重复图片。
7.一种图片查重系统,其特征在于,包括:获取单元,缩放单元,第一确定单元,计算单元和第二确定单元,其中,
所述获取单元,用于获取多个待查重图片;
所述缩放单元,用于按照预设尺寸,对所述多个待查重图片进行缩放处理,得到多个目标图片;
所述第一确定单元,确定每个所述目标图片的图片指纹;
所述计算单元,用于利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出所述第一目标图片和所述第二目标图片之间的汉明距离,其中,所述第一目标图片为所述目标图片中的任意一张图片,所述第二目标图片为所述目标图片中除所述第一目标图片以外的图片;
所述第二确定单元,用于根据所述汉明距离,确定所述第一目标图片是否为所述第二目标图片的重复图片。
8.根据权利要求7所述的系统,其特征在于,所述预设尺寸为n*m,则所述目标图片中包含n*m个像素块,其中,n与m均为大于0的整数。
9.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行上述权利要求1至6中任一项所述的图片查重方法。
10.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至6中任一项所述的图片查重方法。
CN202010101514.1A 2020-02-18 2020-02-18 一种图片查重方法和系统 Pending CN111310832A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010101514.1A CN111310832A (zh) 2020-02-18 2020-02-18 一种图片查重方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010101514.1A CN111310832A (zh) 2020-02-18 2020-02-18 一种图片查重方法和系统

Publications (1)

Publication Number Publication Date
CN111310832A true CN111310832A (zh) 2020-06-19

Family

ID=71156443

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010101514.1A Pending CN111310832A (zh) 2020-02-18 2020-02-18 一种图片查重方法和系统

Country Status (1)

Country Link
CN (1) CN111310832A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114430488A (zh) * 2022-04-01 2022-05-03 深圳市华曦达科技股份有限公司 一种视频编码和视频解码的方法及装置
CN115357742A (zh) * 2022-08-02 2022-11-18 广州市玄武无线科技股份有限公司 门店图像查重方法、系统、终端设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101887457A (zh) * 2010-07-02 2010-11-17 杭州电子科技大学 基于内容的复制图像检测方法
CN106327426A (zh) * 2016-08-19 2017-01-11 携程计算机技术(上海)有限公司 图像去重方法及系统
CN106708951A (zh) * 2016-11-25 2017-05-24 西安电子科技大学 支持所有权认证的客户端图像模糊去重方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101887457A (zh) * 2010-07-02 2010-11-17 杭州电子科技大学 基于内容的复制图像检测方法
CN106327426A (zh) * 2016-08-19 2017-01-11 携程计算机技术(上海)有限公司 图像去重方法及系统
CN106708951A (zh) * 2016-11-25 2017-05-24 西安电子科技大学 支持所有权认证的客户端图像模糊去重方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114430488A (zh) * 2022-04-01 2022-05-03 深圳市华曦达科技股份有限公司 一种视频编码和视频解码的方法及装置
CN115357742A (zh) * 2022-08-02 2022-11-18 广州市玄武无线科技股份有限公司 门店图像查重方法、系统、终端设备及存储介质

Similar Documents

Publication Publication Date Title
US10692218B2 (en) Method and system of detecting image tampering, electronic device and storage medium
CN106845331B (zh) 一种图像处理方法及终端
CN112861648B (zh) 文字识别方法、装置、电子设备及存储介质
CN112508145B (zh) 电子印章生成及验证方法、装置、电子设备及存储介质
CN107908998B (zh) 二维码解码方法、装置、终端设备及计算机可读存储介质
CN111310832A (zh) 一种图片查重方法和系统
CN113887408B (zh) 活化人脸视频的检测方法、装置、设备及存储介质
CN112651953B (zh) 图片相似度计算方法、装置、计算机设备及存储介质
CN110827248A (zh) 一种电子设备屏幕区域识别方法与设备
CN116168351B (zh) 电力设备巡检方法及装置
WO2019024160A1 (zh) 图像篡改检测方法、系统、电子装置及可读存储介质
CN114550076A (zh) 区域异常行为监控方法、装置、设备及存储介质
CN112507923A (zh) 证件翻拍检测方法、装置、电子设备及介质
CN110472128B (zh) 基于图像识别的网页取证方法、装置、存储介质及服务器
CN113505765B (zh) 基于用户头像的年龄预测方法、装置及电子设备
Doan et al. Image tampering detection based on a statistical model
CN109426775B (zh) 一种检测人脸图像中网纹的方法、装置及设备
CN115119197A (zh) 基于大数据的无线网络风险分析方法、装置、设备及介质
CN110213457B (zh) 一种图像传输方法及装置
CN113766312A (zh) 设备间的响应延迟计算方法、装置、设备及存储介质
CN114417397A (zh) 行为画像的构建方法、装置、存储介质及计算机设备
CN113628192A (zh) 图像模糊检测方法、装置、设备、存储介质及程序产品
CN112016606A (zh) 一种应用程序app的检测方法、装置、设备及存储介质
CN115601606B (zh) 一种门店状态检测方法、装置、设备及存储介质
CN111429399A (zh) 一种直线检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination