CN109918518A - 图片查重方法、装置、计算机设备和存储介质 - Google Patents

图片查重方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN109918518A
CN109918518A CN201910101273.8A CN201910101273A CN109918518A CN 109918518 A CN109918518 A CN 109918518A CN 201910101273 A CN201910101273 A CN 201910101273A CN 109918518 A CN109918518 A CN 109918518A
Authority
CN
China
Prior art keywords
picture
group
numerical value
data
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910101273.8A
Other languages
English (en)
Inventor
陈林
丁磊磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910101273.8A priority Critical patent/CN109918518A/zh
Priority to PCT/CN2019/089110 priority patent/WO2020155488A1/zh
Publication of CN109918518A publication Critical patent/CN109918518A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请揭示了一种基于图像处理的图片查重方法、装置、计算机设备和存储介质,其中方法包括:获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表;在所述数据表中查找与所述第一组指定数值相同的第二组指定数值;如果查找到,则获取第一照片的第一二进制数据,以及与所述第一组指定数值相同的第二组指定数值的第二照片的第二二进制数据;比较所述第一二进制数据和第二二进制数据是否相同;如果相同,则判定在所述图片数据库中存在与所述第一图片相同过的第二图片,停止将所述第一图片导入所述图片数据库中。本申请可以提高查找重复图片的速度,减小计算量。

Description

图片查重方法、装置、计算机设备和存储介质
技术领域
本申请涉及到图像处理领域,特别是涉及到一种图片查重方法、装置、计算机设备和存储介质。
背景技术
人脸数据库中存储有大量的底图照片,而且还会持续不断地向人脸数据库中导入新的底图照片。在导入新的底图照片的时候,需要与人脸数据库中已有的底图照片进行查重处理,以防止人脸数据库中存在相同的底图照片。现有技术的图片重复判断方法包括:将新的底图照片与人脸数据库中的各已有的底图照片进行逐一的像似度计算,当相似度达到指定阈值的时候,判定该新的底图照片与人脸数据库中存储有的底图照片存在重复,这种重复判断方法需要进行大量的计算,计算比较耗时,同时浪费计算资源。
发明内容
本申请的主要目的为提供一种图片查重方法、装置、计算机设备和存储介质,旨在解决向图片数据库中存储新的图片时,查重图片计算耗时和消耗大量计算元的问题。
为了实现上述发明目的,本申请提出一种图片查重方法,包括步骤:
获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表;其中,第一组指定数值包括第一数据量值和第一MD5值,第二组指定数值包括第二数据量值和第二MD5值;
在所述数据表中查找与所述第一组指定数值相同的第二组指定数值;
如果查找到与所述第一组指定数值相同的第二组指定数值,则获取第一照片的第一二进制数据,以及与所述第一组指定数值相同的第二组指定数值的第二照片的第二二进制数据;
比较所述第一二进制数据和第二二进制数据是否相同;
如果所述第一二进制数据和第二二进制数据不相同,则将所述第一图片导入到所述图片数据库中;如果所述第一二进制数据和第二二进制数据相同,则判定在所述图片数据库中存在与所述第一图片相同过的第二图片,停止将所述第一图片导入所述图片数据库中。
进一步地,所述在所述数据表中查找与所述第一组指定数值相同的第二组指定数值的步骤,包括:
在所述数据表中查找与所述第一数据量值的相同的第二数据量值;
若未查找到与所述第一数据量值相同的第二数据量值,则判定在所述数据表中不存在与所述第一组指定数值相同的第二组指定数值;若查找到与所述第一数据量值的相同的第二数据量值,则在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中查找与所述第一MD5值相同的MD5值;
如果在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中查找到与所述第一MD5值相同的MD5值,则判定所述数据表中存在与所述第一组指定数值的相同的第二组指定数值;如果在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中未查找到与所述第一MD5值相同的MD5值,则判定在所述数据表中不存在与所述第一组指定数值相同的第二组指定数值。
进一步地,所述获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表的步骤之前,包括:
接收用户发送的拖动指令,所述拖动指令用于将第一图片拖动至图片数据库的入口区域;
响应于所述拖动指令,触发在所述图片数据库中查找是否存在于第一图片相同的第二图片的命令。
进一步地,所述响应于所述拖动指令,触发在所述图片数据库中查找是否存在于第一图片相同的第二图片的命令的步骤之后,包括:
生成确认按钮和取消按钮;
若在指定时间内接收到所述确认按钮被选择的命令,则执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令;若在所述指定时间内接收到所述取消按钮被选择的命令,则停止执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令;若在所述指定时间内即未接收到确认按钮被选择的命令,也未接收到取消按钮被选择的命令,则执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令。
进一步地,所述获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表的步骤之前,包括:
将所述第一图片导入预设的图片归类模型中进行归类,确定所述第一图片的第一类别;
根据所述第一类别,调用所述数据表中对应所述第一类别的第一数据表,以便于在第一数据表中查找与所述第一组指定数值相同的第二组指定数值。
进一步地,当所述第一图片为多张时,所述在所述数据表中查找与所述第一组指定数值相同的第二组指定数值的步骤,包括:
将多张所述第一图片分类后,同时在不同的类别的数据表中对查找与所述第一组指定数值相同的第二组指定数值。
进一步地,所述获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表的步骤之前,包括:
利用高清摄像头依次拍摄多头待投保牲畜险的生猪脸部图像;其中,每拍摄一张生猪脸部图像,对应的建立一个投保序号,以及计算出对应的数据量值和MD5值,记录到所述数据表中;
将拍摄的各生猪脸部图像,以及所述数据表存储到指定的数据库中,形成所述图片数据库。
本申请还提供一种图片查重装置,包括:
第一获取单元,用于获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表;其中,第一组指定数值包括第一数据量值和第一MD5值,第二组指定数值包括第二数据量值和第二MD5值;
查找单元,用于在所述数据表中查找与所述第一组指定数值相同的第二组指定数值;
第二获取单元,用于如果查找到与所述第一组指定数值相同的第二组指定数值,则获取第一照片的第一二进制数据,以及与所述第一组指定数值相同的第二组指定数值的第二照片的第二二进制数据;
比较单元,用于比较所述第一二进制数据和第二二进制数据是否相同;
结果处理单元,用于如果所述第一二进制数据和第二二进制数据不相同,则将所述第一图片导入到所述图片数据库中;如果所述第一二进制数据和第二二进制数据相同,则判定在所述图片数据库中存在与所述第一图片相同过的第二图片,停止将所述第一图片导入所述图片数据库中。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请的图片查重方法、装置、计算机设备和存储介质,根据导入图片的第一数据量值和第一MD5值与预设的对应图片数据库中各第二图片的数据表中的各第二数据量值和第二MD5值进行比较,以缩小可能重复的图片数量,然后在缩小后的图片中通过二进制数据进行比较,提高查找重复图片的速度,减小计算量。
附图说明
图1为本申请一实施例的图片查重方法的流程示意图;
图2为本申请一实施例的图片查重装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例提供一种图片查重方法,包括以下步骤:
S1、获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表;其中,第一组指定数值包括第一数据量值和第一MD5值,第二组指定数值包括第二数据量值和第二MD5值;
S2、在所述数据表中查找与所述第一组指定数值相同的第二组指定数值;
S3、如果查找到与所述第一组指定数值相同的第二组指定数值,则获取第一照片的第一二进制数据,以及与所述第一组指定数值相同的第二组指定数值的第二照片的第二二进制数据;
S4、比较所述第一二进制数据和第二二进制数据是否相同;
S5、如果所述第一二进制数据和第二二进制数据不相同,则将所述第一图片导入到所述图片数据库中;如果所述第一二进制数据和第二二进制数据相同,则判定在所述图片数据库中存在与所述第一图片相同过的第二图片,停止将所述第一图片导入所述图片数据库中。
如上述步骤S1所述,上述图片数据库即为存储有大量第二图片的数据库,比如存储人脸图片的人脸图片数据库、存储猪脸图片的猪脸图片数据库等。上述的指定数值是分组存在的,即每一张图片对应一组指定数值,在本申请中,指定数值包括数据量值和MD5值。上述数据量值即为表述图片数据量大小的值,其单位为KB、M、G等,上述MD5值即为根据MD5(Message-Digest Algorithm 5信息-摘要算法5)针对图片计算出的值。每一张图片的格式固定后,其对应的数据量值和MD5值也是固定不变的。上述数据表中记录有图片数据库中每一幅第二图片的对应的第二数据量值和第二MD5值,其与图片数据库中的第二图片呈一对一的映射关系。
如上述步骤S2所述,即为将所述第一组指定数值逐一的与数据表中的各第二组指定数值进行比较,进而查找与所述第一组指定数值相同的第二组指定数值。
如上述步骤S3至S5所述,如果图片数据库中不存在与第一组指定数值相同的第二组指定数值,则说明图片数据库中不存在与第一图片相同的第二图片,此时,可以将第一图片导入到图片数据库中;如果存在与所述第一组指定数值相同的第二组指定数值,则说明图片数据库中可能存在与第一图片相同的第二图片,此时将可能与第一图片相同的第二图片的第二二进制数据与第一图片对应的第一二进制数据进行比较,因为已经经过了数据量值和MD5值比较过滤,所以无需与图片数据库全部的第二图片的第二二进制数据进行二进制比较,其计算量更少。上述二进制数据即为图片存储在计算机中的以0和1组合形式存在的二进制数据。
在一个实施例中,上述在所述数据表中查找与所述第一组指定数值相同的第二组指定数值的步骤S2,包括:
S21、在所述数据表中查找与所述第一数据量值的相同的第二数据量值;
S22、若未查找到与所述第一数据量值相同的第二数据量值,则判定在所述数据表中不存在与所述第一组指定数值相同的第二组指定数值;若查找到与所述第一数据量值的相同的第二数据量值,则在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中查找与所述第一MD5值相同的MD5值;
S23、如果在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中查找到与所述第一MD5值相同的MD5值,则判定所述数据表中存在与所述第一组指定数值的相同的第二组指定数值;如果在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中未查找到与所述第一MD5值相同的MD5值,则判定在所述数据表中不存在与所述第一组指定数值相同的第二组指定数值。
如上述步骤S21至S23所述,先在数据表中查找是否存在与所述第一数据量值的相同的第二数据量值,如果不存在则可以直接判定数据表中不存在与第一组指定数值相同的第二组指定数值,可以减少比较次数,节约计算资源;如果存在与第一组指定数值相同的第二组指定数值,则将这些第二组指定数值中的第二MD5值分别与第一MD5值进行比较,因为已经进行过数据量数值的比较过滤,所说进行第二MD5值与第一MD5值进行比较的过程中进一步地减少比较次数,提高查找速度和减少计算资源。如果查找到与所述与所述第一数据量值的相同的第二数据量值对应的第二MD5值中查找与所述第一MD5值相同的MD5值,则说明上述数据表中存在与第一数据量值的相同的第二数据量值。在其它数据表中,也可以先在数据表中查找与第一MD5值相同的第二MD5值,然后再在经过MD5值过滤后的数据中查找与第一数据量值相同的第第二数据量值。
在一个实施例中,上述获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表的步骤S1之前,包括:
S1a、接收用户发送的拖动指令,所述拖动指令用于将第一图片拖动至图片数据库的入口区域;
S1b、响应于所述拖动指令,触发在所述图片数据库中查找是否存在与第一图片相同的第二图片的命令。
如上述步骤S1a和S1b所述,实时监控是否有第一图片将要导入图片数据库中,而监控的方式是判断是否有图片被拖动至图片数据库的入口区域,监控方法简单,用户体验好。在其它实施例中,还可以通过选择第一图片,然后点击预设的导入按钮进行导入动作,当获取到导入按钮被点击时,触发在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令。触发在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令之后,即进入上述步骤S1-S5的过程。
在一个实施例中,上述响应于所述拖动指令,触发在所述图片数据库中查找是否存在于第一图片相同的第二图片的命令的步骤S1b之后,包括:
S1c、生成确认按钮和取消按钮;
S1d、若在指定时间内接收到所述确认按钮被选择的命令,则执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令;若在所述指定时间内接收到所述取消按钮被选择的命令,则停止执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令;若在所述指定时间内即未接收到确认按钮被选择的命令,也未接收到取消按钮被选择的命令,则执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令。
如上述步骤S1c和S1d所述,即为生成一个供用户选择的是否需要去除重复照片的选项。在实际应用中,无论计算速度有多快,只要有去除重复照片的步骤,即会消耗系统的计算资源,以及等待计算完成才会将第一图片导入到图片数据库中。在一些紧急情况下,用户需要将第一图片快速导入图片数据库而进行使用,则不考虑去除重复图片的问题,而会直接导入第一图片到图片数据库中,此时选择上述的取消按钮,则会跳过上述步骤S1-S5的过程,节省时间等。当用户度过紧急情况后,用户可以启动图片数据库内部图片去除重复图片的流程。在一个具体实施例中,对在紧急情况下导入的第一图片进行标记,当紧急情况处理完成后,在数据库查找出带有标记的图片,将其作为步骤S1中的第一图片,然后进行上述步骤S1-S5的过程进行去处重复图片的过程。当去除重复图片的过程结束之后,将含有标记的图片的标记去除,以防止下一次遇到同样的紧急情况后,再一次对已经处理过的、但是具有标记的图片进行去除重复图片的处理。
在一个实施例中,上述获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表的步骤S1之前,包括:
S1A、将所述第一图片导入预设的图片归类模型中进行归类,确定所述第一图片的第一类别;
S1B、根据所述第一类别,调用所述数据表中对应所述第一类别的第一数据表,以便于在第一数据表中查找与所述第一组指定数值相同的第二组指定数值。
如上述步骤S1A和S1B,上述图片归类模型一般为通过样本图片训练完成的神经网络模型,即通过不同的类别的图片样本对预设的神经网络进行训练,得到输入图片,输出图片类型的神经网络模型。图片的类别一般包括人脸图片类别、建筑图片类别、多种指定的牲畜脸部图片的类别、其它类别等等,具体训练过程可以选择现有技术中常用的训练方法,在此不在赘述。在上述图片数据库中包括多个根据图片类别区分的子库,每一个子库对应的设置有一个对应的子数据表,当第一图片被分类后,既可以根据其类别调取对应的子数据表(即上述的第一数据表),然后在后期的去除重复图片的过程中,只需要与对应的子数据表中的第二组指定数值进行比较即可,大大地减少比较的数据量,提高去除重复图片的效率。
进一步地,当所述第一图片为多张时,上述在所述数据表中查找与所述第一组指定数值相同的第二组指定数值的步骤S2包括:
S21、将多张所述第一图片分类后,同时在不同的类别的数据表中对查找与所述第一组指定数值相同的第二组指定数值。
如上述步骤S21所述,即为多线程地同时处理不同子数据表的查重过程,提高查找与所述第一组指定数值相同的第二组指定数值的速度。
在一个实施例中,上述获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表的步骤S1之前,包括:
S101、利用高清摄像头依次拍摄多头待投保牲畜险的生猪脸部图像;其中,每拍摄一张生猪脸部图像,对应的建立一个投保序号,以及计算出对应的数据量值和MD5值,记录到所述数据表中;
S102、将拍摄的各生猪脸部图像,以及所述数据表存储到指定的数据库中,形成所述图片数据库。
本实施例中,上述的图片数据库是猪脸图片数据库,在给待投保的生猪脸部进行拍照后,直接将拍摄的脸部照片和在一起形成图片数据库,因为每头生猪只需要拍摄一张猪脸图像,所以不会存在重复出现的生猪脸部图像在图片数据库中,形成的图片数据库无需进行去除重复图片的过程。上述拍摄生猪脸部图像是为了确定生猪的身份,当投保生猪发生病死等情况后,通过拍摄病死猪的脸部图片与图片数据库中的猪脸图像进行比对,如果确认是同一头猪,则进行相应的理赔等。上述病死猪的脸部图片与图片数据库中的猪脸图像进行比对的方法可以通过现有技术中的通过预设的图片识别的神经网络模型进行识别。上述投保序号是指唯一存在的序号,在生猪投保时使用,如形成投保编号,或者用于对应生猪投保时的单号,便于根据投保序号查找到对应的保单等。
本申请的图片查重方法,根据导入图片的第一数据量值和第一MD5值与预设的对应图片数据库中各第二图片的数据表中的各第二数据量值和第二MD5值进行比较,以缩小可能重复的图片数量,然后在缩小后的图片中通过二进制数据进行比较,提高查找重复图片的速度,减小计算量。
参照图2,本申请还提供一种图片查重方法,包括以下步骤:
第一获取单元10,用于获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表;其中,第一组指定数值包括第一数据量值和第一MD5值,第二组指定数值包括第二数据量值和第二MD5值;
查找单元20,用于在所述数据表中查找与所述第一组指定数值相同的第二组指定数值;
第二获取单元30,用于如果查找到与所述第一组指定数值相同的第二组指定数值,则获取第一照片的第一二进制数据,以及与所述第一组指定数值相同的第二组指定数值的第二照片的第二二进制数据;
比较单元40,用于比较所述第一二进制数据和第二二进制数据是否相同;
结果处理单元50,用于如果所述第一二进制数据和第二二进制数据不相同,则将所述第一图片导入到所述图片数据库中;如果所述第一二进制数据和第二二进制数据相同,则判定在所述图片数据库中存在与所述第一图片相同过的第二图片,停止将所述第一图片导入所述图片数据库中。
如上述第一获取单元10,上述图片数据库即为存储有大量第二图片的数据库,比如存储人脸图片的人脸图片数据库、存储猪脸图片的猪脸图片数据库等。上述的指定数值是分组存在的,即每一张图片对应一组指定数值,在本申请中,指定数值包括数据量值和MD5值。上述数据量值即为表述图片数据量大小的值,其单位为KB、M、G等,上述MD5值即为根据MD5(Message-Digest Algorithm 5信息-摘要算法5)针对图片计算出的值。每一张图片的格式固定后,其对应的数据量值和MD5值也是固定不变的。上述数据表中记录有图片数据库中每一幅第二图片的对应的第二数据量值和第二MD5值,其与图片数据库中的第二图片呈一对一的映射关系。
如上述查找单元20,即为将所述第一组指定数值逐一的与数据表中的各第二组指定数值进行比较,进而查找与所述第一组指定数值相同的第二组指定数值。
如上述第二获取单元30、比较单元40和结果处理单元50,如果图片数据库中不存在与第一组指定数值相同的第二组指定数值,则说明图片数据库中不存在与第一图片相同的第二图片,此时,可以将第一图片导入到图片数据库中;如果存在与所述第一组指定数值相同的第二组指定数值,则说明图片数据库中可能存在与第一图片相同的第二图片,此时将可能与第一图片相同的第二图片的第二二进制数据与第一图片对应的第一二进制数据进行比较,因为已经经过了数据量值和MD5值比较过滤,所以无需与图片数据库全部的第二图片的第二二进制数据进行二进制比较,其计算量更少。上述二进制数据即为图片存储在计算机中的以0和1组合形式存在的二进制数据。
在一个实施例中,上述查找单元20,包括:
第一查找模块,用于在所述数据表中查找与所述第一数据量值的相同的第二数据量值;
第二查找模块,用于若未查找到与所述第一数据量值相同的第二数据量值,则判定在所述数据表中不存在与所述第一组指定数值相同的第二组指定数值;若查找到与所述第一数据量值的相同的第二数据量值,则在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中查找与所述第一MD5值相同的MD5值;
判定模块,用于如果在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中查找到与所述第一MD5值相同的MD5值,则判定所述数据表中存在与所述第一组指定数值的相同的第二组指定数值;如果在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中未查找到与所述第一MD5值相同的MD5值,则判定在所述数据表中不存在与所述第一组指定数值相同的第二组指定数值。
在本实施例中,先在数据表中查找是否存在与所述第一数据量值的相同的第二数据量值,如果不存在则可以直接判定数据表中不存在与第一组指定数值相同的第二组指定数值,可以减少比较次数,节约计算资源;如果存在与第一组指定数值相同的第二组指定数值,则将这些第二组指定数值中的第二MD5值分别与第一MD5值进行比较,因为已经进行过数据量数值的比较过滤,所说进行第二MD5值与第一MD5值进行比较的过程中进一步地减少比较次数,提高查找速度和减少计算资源。如果查找到与所述与所述第一数据量值的相同的第二数据量值对应的第二MD5值中查找与所述第一MD5值相同的MD5值,则说明上述数据表中存在与第一数据量值的相同的第二数据量值。在其它数据表中,也可以先在数据表中查找与第一MD5值相同的第二MD5值,然后再在经过MD5值过滤后的数据中查找与第一数据量值相同的第第二数据量值。
在一个实施例中,上述图片查重装置,还包括:
接收单元,用于接收用户发送的拖动指令,所述拖动指令用于将第一图片拖动至图片数据库的入口区域;
触发单元,用于响应于所述拖动指令,触发在所述图片数据库中查找是否存在与第一图片相同的第二图片的命令。
在本实施例中,实时监控是否有第一图片将要导入图片数据库中,而监控的方式是判断是否有图片被拖动至图片数据库的入口区域,监控方法简单,用户体验好。在其它实施例中,还可以通过选择第一图片,然后点击预设的导入按钮进行导入动作,当获取到导入按钮被点击时,触发在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令。触发在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令之后,启动上述第一获取单元10、查找单元20、第二获取单元30、比较单元40和结果处理单元50等模块进行工作。
在一个实施例中,上述图片查重装置,还包括:
生成单元,用于生成确认按钮和取消按钮;
执行单元,用于若在指定时间内接收到所述确认按钮被选择的命令,则执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令;若在所述指定时间内接收到所述取消按钮被选择的命令,则停止执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令;若在所述指定时间内即未接收到确认按钮被选择的命令,也未接收到取消按钮被选择的命令,则执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令。
在本实施例中,即为生成一个供用户选择的是否需要去除重复照片的选项。在实际应用中,无论计算速度有多快,只要有去除重复照片的步骤,即会消耗系统的计算资源,以及等待计算完成才会将第一图片导入到图片数据库中。在一些紧急情况下,用户需要将第一图片快速导入图片数据库而进行使用,则不考虑去除重复图片的问题,而会直接导入第一图片到图片数据库中,此时选择上述的取消按钮,则会跳过上述步骤S1-S5的过程,节省时间等。当用户度过紧急情况后,用户可以启动图片数据库内部图片去除重复图片的流程。在一个具体实施例中,对在紧急情况下导入的第一图片进行标记,当紧急情况处理完成后,在数据库查找出带有标记的图片,将其作为步骤S1中的第一图片,然后进行上述步骤S1-S5的过程进行去处重复图片的过程。当去除重复图片的过程结束之后,将含有标记的图片的标记去除,以防止下一次遇到同样的紧急情况后,再一次对已经处理过的、但是具有标记的图片进行去除重复图片的处理。
在一个实施例中,上述图片查重装置,还包括:
分类单元,用于将所述第一图片导入预设的图片归类模型中进行归类,确定所述第一图片的第一类别;
调用查找单元,用于根据所述第一类别,调用所述数据表中对应所述第一类别的第一数据表,以便于在第一数据表中查找与所述第一组指定数值相同的第二组指定数值。
在本实施例中,上述图片归类模型一般为通过样本图片训练完成的神经网络模型,即通过不同的类别的图片样本对预设的神经网络进行训练,得到输入图片,输出图片类型的神经网络模型。图片的类别一般包括人脸图片类别、建筑图片类别、多种指定的牲畜脸部图片的类别、其它类别等等,具体训练过程可以选择现有技术中常用的训练方法,在此不在赘述。在上述图片数据库中包括多个根据图片类别区分的子库,每一个子库对应的设置有一个对应的子数据表,当第一图片被分类后,既可以根据其类别调取对应的子数据表(即上述的第一数据表),然后在后期的去除重复图片的过程中,只需要与对应的子数据表中的第二组指定数值进行比较即可,大大地减少比较的数据量,提高去除重复图片的效率。
进一步地,当所述第一图片为多张时,上述查找单元20,包括:
分类查找模块,用于将多张所述第一图片分类后,同时在不同的类别的数据表中对查找与所述第一组指定数值相同的第二组指定数值。
在本实施例中,即为多线程地同时处理不同子数据表的查重过程,提高查找与所述第一组指定数值相同的第二组指定数值的速度。
在一个实施例中,上述图片查重装置,还包括:
拍摄单元,用于利用高清摄像头依次拍摄多头待投保牲畜险的生猪脸部图像;其中,每拍摄一张生猪脸部图像,对应的建立一个投保序号,以及计算出对应的数据量值和MD5值,记录到所述数据表中;
存储单元,用于将拍摄的各生猪脸部图像,以及所述数据表存储到指定的数据库中,形成所述图片数据库。
本实施例中,上述的图片数据库是猪脸图片数据库,在给待投保的生猪脸部进行拍照后,直接将拍摄的脸部照片和在一起形成图片数据库,因为每头生猪只需要拍摄一张猪脸图像,所以不会存在重复出现的生猪脸部图像在图片数据库中,形成的图片数据库无需进行去除重复图片的过程。上述拍摄生猪脸部图像是为了确定生猪的身份,当投保生猪发生病死等情况后,通过拍摄病死猪的脸部图片与图片数据库中的猪脸图像进行比对,如果确认是同一头猪,则进行相应的理赔等。上述病死猪的脸部图片与图片数据库中的猪脸图像进行比对的方法可以通过现有技术中的通过预设的图片识别的神经网络模型进行识别。上述投保序号是指唯一存在的序号,在生猪投保时使用,如形成投保编号,或者用于对应生猪投保时的单号,便于根据投保序号查找到对应的保单等。
本申请的图片查重装置,根据导入图片的第一数据量值和第一MD5值与预设的对应图片数据库中各第二图片的数据表中的各第二数据量值和第二MD5值进行比较,以缩小可能重复的图片数量,然后在缩小后的图片中通过二进制数据进行比较,提高查找重复图片的速度,减小计算量。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储图片等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图片查重方法。
上述处理器执行上述图片查重方法,包括步骤:获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表;其中,第一组指定数值包括第一数据量值和第一MD5值,第二组指定数值包括第二数据量值和第二MD5值;在所述数据表中查找与所述第一组指定数值相同的第二组指定数值;如果查找到与所述第一组指定数值相同的第二组指定数值,则获取第一照片的第一二进制数据,以及与所述第一组指定数值相同的第二组指定数值的第二照片的第二二进制数据;比较所述第一二进制数据和第二二进制数据是否相同;如果所述第一二进制数据和第二二进制数据不相同,则将所述第一图片导入到所述图片数据库中;如果所述第一二进制数据和第二二进制数据相同,则判定在所述图片数据库中存在与所述第一图片相同过的第二图片,停止将所述第一图片导入所述图片数据库中。
在一个实施例中,上述在所述数据表中查找与所述第一组指定数值相同的第二组指定数值的步骤,包括:在所述数据表中查找与所述第一数据量值的相同的第二数据量值;若未查找到与所述第一数据量值相同的第二数据量值,则判定在所述数据表中不存在与所述第一组指定数值相同的第二组指定数值;若查找到与所述第一数据量值的相同的第二数据量值,则在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中查找与所述第一MD5值相同的MD5值;如果在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中查找到与所述第一MD5值相同的MD5值,则判定所述数据表中存在与所述第一组指定数值的相同的第二组指定数值;如果在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中未查找到与所述第一MD5值相同的MD5值,则判定在所述数据表中不存在与所述第一组指定数值相同的第二组指定数值。
在一个实施例中,上述获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表的步骤之前,包括:接收用户发送的拖动指令,所述拖动指令用于将第一图片拖动至图片数据库的入口区域;响应于所述拖动指令,触发在所述图片数据库中查找是否存在于第一图片相同的第二图片的命令。
在一个实施例中,上述响应于所述拖动指令,触发在所述图片数据库中查找是否存在于第一图片相同的第二图片的命令的步骤之后,包括:生成确认按钮和取消按钮;若在指定时间内接收到所述确认按钮被选择的命令,则执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令;若在所述指定时间内接收到所述取消按钮被选择的命令,则停止执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令;若在所述指定时间内即未接收到确认按钮被选择的命令,也未接收到取消按钮被选择的命令,则执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令。
在一个实施例中,上述获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表的步骤之前,包括:将所述第一图片导入预设的图片归类模型中进行归类,确定所述第一图片的第一类别;根据所述第一类别,调用所述数据表中对应所述第一类别的第一数据表,以便于在第一数据表中查找与所述第一组指定数值相同的第二组指定数值。
在一个实施例中,当所述第一图片为多张时,上述在所述数据表中查找与所述第一组指定数值相同的第二组指定数值的步骤,包括:将多张所述第一图片分类后,同时在不同的类别的数据表中对查找与所述第一组指定数值相同的第二组指定数值。
在一个实施例中,上述获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表的步骤之前,包括:利用高清摄像头依次拍摄多头待投保牲畜险的生猪脸部图像;其中,每拍摄一张生猪脸部图像,对应的建立一个投保序号,以及计算出对应的数据量值和MD5值,记录到所述数据表中;将拍摄的各生猪脸部图像,以及所述数据表存储到指定的数据库中,形成所述图片数据库。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种上述图片查重方法,包括步骤:获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表;其中,第一组指定数值包括第一数据量值和第一MD5值,第二组指定数值包括第二数据量值和第二MD5值;在所述数据表中查找与所述第一组指定数值相同的第二组指定数值;如果查找到与所述第一组指定数值相同的第二组指定数值,则获取第一照片的第一二进制数据,以及与所述第一组指定数值相同的第二组指定数值的第二照片的第二二进制数据;比较所述第一二进制数据和第二二进制数据是否相同;如果所述第一二进制数据和第二二进制数据不相同,则将所述第一图片导入到所述图片数据库中;如果所述第一二进制数据和第二二进制数据相同,则判定在所述图片数据库中存在与所述第一图片相同过的第二图片,停止将所述第一图片导入所述图片数据库中。
上述计算机可读存储介质存储的计算机程序,根据导入图片的第一数据量值和第一MD5值与预设的对应图片数据库中各第二图片的数据表中的各第二数据量值和第二MD5值进行比较,以缩小可能重复的图片数量,然后在缩小后的图片中通过二进制数据进行比较,提高查找重复图片的速度,减小计算量。
在一个实施例中,上述在所述数据表中查找与所述第一组指定数值相同的第二组指定数值的步骤,包括:在所述数据表中查找与所述第一数据量值的相同的第二数据量值;若未查找到与所述第一数据量值相同的第二数据量值,则判定在所述数据表中不存在与所述第一组指定数值相同的第二组指定数值;若查找到与所述第一数据量值的相同的第二数据量值,则在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中查找与所述第一MD5值相同的MD5值;如果在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中查找到与所述第一MD5值相同的MD5值,则判定所述数据表中存在与所述第一组指定数值的相同的第二组指定数值;如果在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中未查找到与所述第一MD5值相同的MD5值,则判定在所述数据表中不存在与所述第一组指定数值相同的第二组指定数值。
在一个实施例中,上述获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表的步骤之前,包括:接收用户发送的拖动指令,所述拖动指令用于将第一图片拖动至图片数据库的入口区域;响应于所述拖动指令,触发在所述图片数据库中查找是否存在于第一图片相同的第二图片的命令。
在一个实施例中,上述响应于所述拖动指令,触发在所述图片数据库中查找是否存在于第一图片相同的第二图片的命令的步骤之后,包括:生成确认按钮和取消按钮;若在指定时间内接收到所述确认按钮被选择的命令,则执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令;若在所述指定时间内接收到所述取消按钮被选择的命令,则停止执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令;若在所述指定时间内即未接收到确认按钮被选择的命令,也未接收到取消按钮被选择的命令,则执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令。
在一个实施例中,上述获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表的步骤之前,包括:将所述第一图片导入预设的图片归类模型中进行归类,确定所述第一图片的第一类别;根据所述第一类别,调用所述数据表中对应所述第一类别的第一数据表,以便于在第一数据表中查找与所述第一组指定数值相同的第二组指定数值。
在一个实施例中,当所述第一图片为多张时,上述在所述数据表中查找与所述第一组指定数值相同的第二组指定数值的步骤,包括:将多张所述第一图片分类后,同时在不同的类别的数据表中对查找与所述第一组指定数值相同的第二组指定数值。
在一个实施例中,上述获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表的步骤之前,包括:利用高清摄像头依次拍摄多头待投保牲畜险的生猪脸部图像;其中,每拍摄一张生猪脸部图像,对应的建立一个投保序号,以及计算出对应的数据量值和MD5值,记录到所述数据表中;将拍摄的各生猪脸部图像,以及所述数据表存储到指定的数据库中,形成所述图片数据库。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM一多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种图片查重方法,其特征在于,包括步骤:
获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表;其中,第一组指定数值包括第一数据量值和第一MD5值,第二组指定数值包括第二数据量值和第二MD5值;
在所述数据表中查找与所述第一组指定数值相同的第二组指定数值;
如果查找到与所述第一组指定数值相同的第二组指定数值,则获取第一照片的第一二进制数据,以及与所述第一组指定数值相同的第二组指定数值的第二照片的第二二进制数据;
比较所述第一二进制数据和第二二进制数据是否相同;
如果所述第一二进制数据和第二二进制数据不相同,则将所述第一图片导入到所述图片数据库中;如果所述第一二进制数据和第二二进制数据相同,则判定在所述图片数据库中存在与所述第一图片相同过的第二图片,停止将所述第一图片导入所述图片数据库中。
2.根据权利要求1所述的图片查重方法,其特征在于,所述在所述数据表中查找与所述第一组指定数值相同的第二组指定数值的步骤,包括:
在所述数据表中查找与所述第一数据量值的相同的第二数据量值;
若未查找到与所述第一数据量值相同的第二数据量值,则判定在所述数据表中不存在与所述第一组指定数值相同的第二组指定数值;若查找到与所述第一数据量值的相同的第二数据量值,则在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中查找与所述第一MD5值相同的MD5值;
如果在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中查找到与所述第一MD5值相同的MD5值,则判定所述数据表中存在与所述第一组指定数值的相同的第二组指定数值;如果在与所述第一数据量值的相同的第二数据量值对应的第二MD5值中未查找到与所述第一MD5值相同的MD5值,则判定在所述数据表中不存在与所述第一组指定数值相同的第二组指定数值。
3.根据权利要求1所述的图片查重方法,其特征在于,所述获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表的步骤之前,包括:
接收用户发送的拖动指令,所述拖动指令用于将第一图片拖动至图片数据库的入口区域;
响应于所述拖动指令,触发在所述图片数据库中查找是否存在于第一图片相同的第二图片的命令。
4.根据权利要求3所述的图片查重方法,其特征在于,所述响应于所述拖动指令,触发在所述图片数据库中查找是否存在于第一图片相同的第二图片的命令的步骤之后,包括:
生成确认按钮和取消按钮;
若在指定时间内接收到所述确认按钮被选择的命令,则执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令;若在所述指定时间内接收到所述取消按钮被选择的命令,则停止执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令;若在所述指定时间内即未接收到确认按钮被选择的命令,也未接收到取消按钮被选择的命令,则执行在所述图片数据库中查找是否存在与所述第一图片相同的第二图片的命令。
5.根据权利要求1所述的图片查重方法,其特征在于,所述获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表的步骤之前,包括:
将所述第一图片导入预设的图片归类模型中进行归类,确定所述第一图片的第一类别;
根据所述第一类别,调用所述数据表中对应所述第一类别的第一数据表,以便于在第一数据表中查找与所述第一组指定数值相同的第二组指定数值。
6.根据权利要求5所述的图片查重方法,其特征在于,当所述第一图片为多张时,所述在所述数据表中查找与所述第一组指定数值相同的第二组指定数值的步骤,包括:
将多张所述第一图片分类后,同时在不同的类别的数据表中对查找与所述第一组指定数值相同的第二组指定数值。
7.根据权利要求1所述的图片查重方法,其特征在于,所述获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表的步骤之前,包括:
利用高清摄像头依次拍摄多头待投保牲畜险的生猪脸部图像;其中,每拍摄一张生猪脸部图像,对应的建立一个投保序号,以及计算出对应的数据量值和MD5值,记录到所述数据表中;
将拍摄的各生猪脸部图像,以及所述数据表存储到指定的数据库中,形成所述图片数据库。
8.一种图片查重装置,其特征在于,包括:
第一获取单元,用于获取待导入图片数据库中的第一图片对应的第一组指定数值,以及记录所述图片数据库中每一幅第二图片对应的第二组指定数值的数据表;其中,第一组指定数值包括第一数据量值和第一MD5值,第二组指定数值包括第二数据量值和第二MD5值;
查找单元,用于在所述数据表中查找与所述第一组指定数值相同的第二组指定数值;
第二获取单元,用于如果查找到与所述第一组指定数值相同的第二组指定数值,则获取第一照片的第一二进制数据,以及与所述第一组指定数值相同的第二组指定数值的第二照片的第二二进制数据;
比较单元,用于比较所述第一二进制数据和第二二进制数据是否相同;
结果处理单元,用于如果所述第一二进制数据和第二二进制数据不相同,则将所述第一图片导入到所述图片数据库中;如果所述第一二进制数据和第二二进制数据相同,则判定在所述图片数据库中存在与所述第一图片相同过的第二图片,停止将所述第一图片导入所述图片数据库中。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201910101273.8A 2019-01-31 2019-01-31 图片查重方法、装置、计算机设备和存储介质 Pending CN109918518A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910101273.8A CN109918518A (zh) 2019-01-31 2019-01-31 图片查重方法、装置、计算机设备和存储介质
PCT/CN2019/089110 WO2020155488A1 (zh) 2019-01-31 2019-05-29 图片查重方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910101273.8A CN109918518A (zh) 2019-01-31 2019-01-31 图片查重方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN109918518A true CN109918518A (zh) 2019-06-21

Family

ID=66961289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910101273.8A Pending CN109918518A (zh) 2019-01-31 2019-01-31 图片查重方法、装置、计算机设备和存储介质

Country Status (2)

Country Link
CN (1) CN109918518A (zh)
WO (1) WO2020155488A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110750451A (zh) * 2019-09-23 2020-02-04 惠州市德赛西威汽车电子股份有限公司 一种车载多媒体ui素材自动识别检测系统及方法
CN113296715A (zh) * 2021-06-29 2021-08-24 中国平安人寿保险股份有限公司 图片资源处理方法、装置和计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831127A (zh) * 2011-06-17 2012-12-19 阿里巴巴集团控股有限公司 重复数据处理方法、装置及系统
US20130086006A1 (en) * 2011-09-30 2013-04-04 John Colgrove Method for removing duplicate data from a storage array
CN104200499A (zh) * 2014-09-24 2014-12-10 深圳市英威诺科技有限公司 一种资讯图片智能去重的技术方法
US20170103068A1 (en) * 2015-10-08 2017-04-13 International Business Machines Corporation Data deduplication using a small hash table

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8201021B1 (en) * 2005-01-31 2012-06-12 Symantec Corporation Method and apparatus for efficiently creating backup files with less redundancy
CN103020086B (zh) * 2011-09-26 2016-10-05 北大方正集团有限公司 一种图片查重的方法及装置
CN104112284B (zh) * 2013-04-22 2017-10-13 阿里巴巴集团控股有限公司 一种图片的相似度检测方法和设备
CN107169057B (zh) * 2017-04-27 2022-04-05 腾讯科技(深圳)有限公司 一种重复图片的检测方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831127A (zh) * 2011-06-17 2012-12-19 阿里巴巴集团控股有限公司 重复数据处理方法、装置及系统
US20130086006A1 (en) * 2011-09-30 2013-04-04 John Colgrove Method for removing duplicate data from a storage array
CN104200499A (zh) * 2014-09-24 2014-12-10 深圳市英威诺科技有限公司 一种资讯图片智能去重的技术方法
US20170103068A1 (en) * 2015-10-08 2017-04-13 International Business Machines Corporation Data deduplication using a small hash table

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110750451A (zh) * 2019-09-23 2020-02-04 惠州市德赛西威汽车电子股份有限公司 一种车载多媒体ui素材自动识别检测系统及方法
CN113296715A (zh) * 2021-06-29 2021-08-24 中国平安人寿保险股份有限公司 图片资源处理方法、装置和计算机设备

Also Published As

Publication number Publication date
WO2020155488A1 (zh) 2020-08-06

Similar Documents

Publication Publication Date Title
CN106982359B (zh) 一种双目视频监控方法、系统和计算机可读存储介质
CN108446621A (zh) 票据识别方法、服务器及计算机可读存储介质
JP6731529B1 (ja) 単一画素攻撃サンプルの生成方法、装置、設備及び記憶媒体
CN104915351A (zh) 图片排序方法及终端
CN109726664B (zh) 一种智能表盘推荐方法、系统、设备及存储介质
CN109918518A (zh) 图片查重方法、装置、计算机设备和存储介质
CN114529873A (zh) 目标检测方法及应用其的城市违规事件监测方法
CN109598307A (zh) 数据筛选方法、装置、服务器及存储介质
CN109766470A (zh) 图像检索方法、装置及处理设备
Obeso et al. Forward-backward visual saliency propagation in deep nns vs internal attentional mechanisms
Spezzano et al. Reshaping terrorist networks
CN115170932A (zh) 门店终端识别方法、装置、系统及计算机可读存储介质
CN107992402A (zh) 日志管理方法及日志管理装置
CN112529078A (zh) 一种业务处理方法、装置及设备
CN109241316A (zh) 图像检索方法、装置、电子设备及存储介质
CN109345184A (zh) 基于微表情的节点信息处理方法、装置、计算机设备及存储介质
CN110275974A (zh) 样本数据集的数据添加方法、装置、终端设备及存储介质
CN113673318B (zh) 一种动作检测方法、装置、计算机设备和存储介质
Amerini et al. Prana: Prnu-based technique to tell real and deepfake videos apart
CN115758337A (zh) 基于时序图卷积网络的后门实时监测方法、电子设备、介质
CN114299540A (zh) 人员穿戴检测方法、装置、计算机设备和存储介质
CN111382628B (zh) 同行判定方法及装置
CN112669352A (zh) 一种对象识别方法、装置及设备
CN114830186A (zh) 图像分类方法、装置、存储介质及电子设备
CN111753950A (zh) 一种前向耗时的确定方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination