CN106682130A - 相似图片检测方法和装置 - Google Patents

相似图片检测方法和装置 Download PDF

Info

Publication number
CN106682130A
CN106682130A CN201611156106.6A CN201611156106A CN106682130A CN 106682130 A CN106682130 A CN 106682130A CN 201611156106 A CN201611156106 A CN 201611156106A CN 106682130 A CN106682130 A CN 106682130A
Authority
CN
China
Prior art keywords
picture
data
cluster
error
cluster center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611156106.6A
Other languages
English (en)
Other versions
CN106682130B (zh
Inventor
刘燕辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing 58 Information Technology Co Ltd
Original Assignee
Beijing 58 Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing 58 Information Technology Co Ltd filed Critical Beijing 58 Information Technology Co Ltd
Priority to CN201611156106.6A priority Critical patent/CN106682130B/zh
Publication of CN106682130A publication Critical patent/CN106682130A/zh
Application granted granted Critical
Publication of CN106682130B publication Critical patent/CN106682130B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供一种相似图片检测方法和装置。该方法包括:接收第一图片的数据,第一图片的数据包括第一部分和第二部分;将第一图片的数据的第一部分与存储空间的每个图片的数据的第一部分进行对比;若存在第二图片的数据的第一部分与第一图片的数据的第一部分在第一误差范围内相同,则将第一图片的数据的第二部分与第二图片的数据的第二部分进行对比;若第一图片的数据的第二部分与第二图片的数据的第二部分在第一误差范围内相同,则确定第一图片与第二图片为相似图片。本发明提供的相似图片检测方法和装置,将图片的数据进行分段,减少相似图片检测过程中需比较的数据量,提高相似图片检测速度。

Description

相似图片检测方法和装置
技术领域
本发明涉及图像处理领域,尤其涉及一种相似图片检测方法和装置。
背景技术
随着计算机网络技术的发展,网络传输带宽越来越大,计算机的存储能力越来越强,以图片形式承载信息越来越常见。常见的网站与应用软件中也逐渐开始支持用户上传图片和视频。但是,用户上传的图片可能是盗用他人图片或恶意用户就同一图片重复上传,因此,网站的运营商需针对用户上传的图片,进行相似图片检测。
现有的相似图片检测方法,主要通过将当前上传的图片与图片库中的所有图片进行逐一比较,以确定图片库中是否存在与当前上传的图片相似的图片,该方法在每次比较时,均需对图片库进行一次遍历,相似图片检测速度较慢、效率较低。
发明内容
本发明提供一种相似图片检测方法和装置,用以解决现有的相似图片检测方法检测速度慢、效率低的问题。
本发明一方面提供一种相似图片检测方法,包括:
接收第一图片的数据,所述第一图片的数据包括第一部分和第二部分;
将所述第一图片的数据的第一部分与存储空间的每个图片的数据的第一部分进行对比;
若存在第二图片的数据的第一部分与所述第一图片的数据的第一部分在第一误差范围内相同,则将所述第一图片的数据的第二部分与所述第二图片的数据的第二部分进行对比;
若所述第一图片的数据的第二部分与所述第二图片的数据的第二部分在第一误差范围内相同,则确定所述第一图片与所述第二图片为相似图片。
如上所述的相似图片检测方法,所述将所述第一图片的数据的第一部分与存储空间的每个图片的数据的第一部分进行对比,包括:
将所述第一图片的数据的第一部分与存储空间的每个簇中心图片的数据的第一部分进行比较;
则所述方法还包括:
若存在第一簇中心图片的数据的第一部分与所述第一图片的数据的第一部分在第二误差范围内相同,则将所述第一图片的数据的第二部分与所述第一簇中心图片的数据的第二部分进行对比;
若所述第一图片的数据的第二部分与所述第一簇中心图片的数据的第二部分在第二误差范围内相同,则在所述第一簇中心图片所属的簇中确定与所述第一图片相似的至少一个第三图片;
其中,第二误差范围大于所述第一误差范围。
如上所述的相似图片检测方法,所述将所述第一图片的数据的第一部分与存储空间的每个图片的数据的第一部分进行对比,包括:
将所述第一图片的数据的第一部分与缓存空间中的每个图片的数据的第一部分进行对比;所述存储空间包括所述缓存空间。
如上所述的相似图片检测方法,若所述第一图片的数据的第二部分与所述第一簇中心图片的数据的第二部分在第二误差范围内相同,所述方法还包括:
将所述第一图片的数据存储在所述第一簇中心图片的数据所属的簇中。
如上所述的相似图片检测方法,所述方法还包括:
检测所述第一簇中心图片的数据所属的簇是否符合预设条件;
若否,则将所述第一簇中心图片的数据所属的簇删除或者发送告警信息。
下面介绍本发明实施例提供的一种相似图片检测装置,该装置与方法一一对应,用以实现上述实施例中的相似图片检测方法,具有相同的技术特征和技术效果,本发明对此不再赘述。
本发明另一方面提供一种相似图片检测装置,包括:接收模块,用于接收第一图片的数据,所述第一图片的数据包括第一部分和第二部分;
第一比较模块,用于将所述第一图片的数据的第一部分与存储空间的每个图片的数据的第一部分进行对比;
第二比较模块,用于若存在第二图片的数据的第一部分与所述第一图片的数据的第一部分在第一误差范围内相同,则将所述第一图片的数据的第二部分与所述第二图片的数据的第二部分进行对比;
确定模块,用于若所述第一图片的数据的第二部分与所述第二图片的数据的第二部分在第一误差范围内相同,则确定所述第一图片与所述第二图片为相似图片。
如上所述的相似图片检测装置,所述第一比较模块具体用于:将所述第一图片的数据的第一部分与存储空间的每个簇中心图片的数据的第一部分进行比较;
所述第二比较模块具体用于:若存在第一簇中心图片的数据的第一部分与所述第一图片的数据的第一部分在第二误差范围内相同,则将所述第一图片的数据的第二部分与所述第一簇中心图片的数据的第二部分进行对比;
所述装置还包括第三比较模块;
所述第三比较模块具体用于:若所述第一图片的数据的第二部分与所述第一簇中心图片的数据的第二部分在第二误差范围内相同,则在所述第一簇中心图片所属的簇中确定与所述第一图片相似的至少一个第三图片;
其中,第二误差范围大于所述第一误差范围。
如上所述的相似图片检测装置,所述第一比较模块具体用于:
将所述第一图片的数据的第一部分与缓存空间中的每个图片的数据的第一部分进行对比;所述存储空间包括所述缓存空间。
如上所述的相似图片检测装置,所述装置还包括存储模块,用于若所述第一图片的数据的第二部分与所述第一簇中心图片的数据的第二部分在第二误差范围内相同,将所述第一图片的数据存储在所述第一簇中心图片的数据所属的簇中。
如上所述的相似图片检测装置,所述装置还包括:检测模块,用于检测所述第一簇中心图片的数据所属的簇是否符合预设条件;若否,则将所述第一簇中心图片的数据所属的簇删除或者发送告警信息。
本发明提供的相似图片检测方法和装置,将图片的数据进行分段,首先先采用第一图片的数据的第一部分,与图片库中的图片的数据的第一部分进行比较,选出在误差范围内相同的第二图片,将误差范围外的图片直接视为不相似图片,仅比较第一图片的数据的第二部分和第二图片的数据的第二部分,从中选出相似图片,从而可减少相似图片检测过程中需比较的数据量,提高相似图片检测速度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的相似图片检测方法实施例一的流程示意图;
图2为本发明提供的相似图片检测方法实施例二的流程示意图;
图3为本发明提供的相似图片检测装置实施例一的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
当用户通过网页或应用软件上传图片时,网页或应用软件作为客户端,接收用户上传的第一图片,并将第一图片发送给服务器端,将第一图片与服务器中的图片库中的所有图片进行比较,在图片库中确定是否存在与第一图片相似的图片。为减少传输数据量,可根据图片表示算法,为第一图片生成图片签名,客户端仅将第一图片的签名传送给服务器端,比较第一图片的签名与图片库中的所有图片的签名,确定图片库中是否存在相似图片。示例性的,为保证不同图片的签名不重复,签名的位数通常较长,签名可以为一串64比特位的十六进制数据,当图片库中的图片较多时,需要比较的数据量依然很大,相似图片的检测过程依然速度较慢、效率较低。
针对上述问题,本发明提供一种相似图片检测方法,将第一图片的签名进行分段,在进行相似图片检测时,仅采用第一图片的签名的一部分,与图片库中的图片的签名的相同部分进行比较,当确定选定的部分不相同时,则无需再比较签名的剩余部分,从而减少待比较的数据,提高相似图片检测速度。
下面采用具体实施例对本发明提供的相似图片检测方法进行详细说明。图1为本发明提供的相似图片检测方法实施例一的流程示意图,该方法的执行主体为相似图片检测装置,该装置可以通过软件或硬件的方式实现,可以集成在网站运营商的服务器中。本发明对此不做限定。如图1所示,该方法包括:
S101、接收第一图片的数据,第一图片的数据包括第一部分和第二部分;
S102、将第一图片的数据的第一部分与存储空间的每个图片的数据的第一部分进行对比;
S103、若存在第二图片的数据的第一部分与第一图片的数据的第一部分在第一误差范围内相同,则将第一图片的数据的第二部分与第二图片的数据的第二部分进行对比;
S104、若第一图片的数据的第二部分与第二图片的数据的第二部分在第一误差范围内相同,则确定第一图片与第二图片为相似图片。
具体的,在S101中,服务器接收用户上传的第一图片的数据,示例性的,客户端可采用哈希算法,对用户上传的第一图片进行哈希处理,得到图片的签名,将图片的签名作为第一图片的数据发送给服务器,可选的,还可采用其他压缩算法等处理方法,获取可区分第一图片与其他图片的数据,并将该数据发送给服务器。在下文中均以签名为例,本领域技术人员应该理解,签名仅为数据的一种可行的实现方式。
数据用以代表第一图片,并能够将第一图片与其他图片进行区分,即当图片不同,图片对应的数据也不同,因此,当数据为二进制时,数据位数通常较长。当两幅图片相似时,两幅图片的数据也应相似,当两幅图片不相似时,两幅图像的数据也不相似。
具体的,在S102中,为进一步加快相似图片检测速度,可将数据划分为第一部分和第二部分,由于当两幅图像相似时,两幅图像的数据的第一部分和第二部分都应相似,即可仅根据两幅图像的数据的第一部分或第二部分不相似即可确定两幅图像不相似。
因此,当将数据均匀划分为两部分时,采用将第一图片的数据的第一部分与存储空间的每个图片的数据的第一部分进行对比,相比采用将第一图片的数据与存储空间的每个图片的数据进行对比,可大大节省需比较的数据量。
示例性的,也可采用不均匀划分,本发明对此不做限定。其中,第一部分可以为数据的前半段,也可以为数据的后半段,或者,也可以为数据的特定部分,本发明对此不做限定。示例性的,还可划分为更多部分,即数据包括第一部分、第二部分、第三部分等。本发明以下实施例中以数据包括第一部分和第二部分为例进行说明。
具体的,在S103中,将第一图片的数据的第一部分与图片库中的所有图片的数据的第一部分进行比较,若存在第二图片的数据的第一部分与第一图片的数据的第一部分在第一误差范围内相同,则将该些第二图片划定为待进一步比较图片,对于与第一图片的数据的第一部分在第一误差范围内不相同的图片,则确定为不相似图片,无需在进行第二部分的比较。进一步将第一图片的数据的第二部分与第二图片的数据的第二部分进行对比,以确定第二图片是否与第一图片相似。
示例性的,当图片的数据为二进制形式的数据串时,第一误差范围可以为第一图片的数据的第一部分与第二图片的数据的第一部分的不相同的位数N,其中N为大于1的正整数。当第一图片的数据的第一部分与第二图片的数据的第一部分的不相同的位数超过3时,则认为两幅图片不相似。
具体的,在S104中,当确定第一图片的数据的第二部分与第二图片的数据的第二部分在第一误差范围内相同时,则确定第一图片与第二图片为相似图片。尽管将数据的比较分为两次进行,但是,并没有增加需要比较的数据,同时,减少了第二次需要比较的数据,因此,可提高相似图片检测的速度。
可选的,可由服务器对接收到的第一图片的数据进行分段,也可由客户端将第一图片的数据分段后再发送给服务器。在服务器检测第一图片的相似图片前,先对接收到的第一图片的数据进行校验,确定该数据为合法数据后,开始进行相似图片检测,避免无效操作。
本发明提供的相似图片检测方法,将图片的数据进行分段,首先先采用第一图片的数据的第一部分,与图片库中的图片的数据的第一部分进行比较,选出在误差范围内相同的第二图片,将误差范围外的图片直接视为不相似图片,仅比较第一图片的数据的第二部分和第二图片的数据的第二部分,从中选出相似图片,从而可减少相似图片检测过程中需比较的数据量,提高相似图片检测速度。
进一步的,在图1所示实施例的基础上,考虑到将第一图片与图片库中的所有图片依次进行比较,比较次数多、检测速度慢,可将图片库中的图片先采用机器学习算法进行聚簇,相似的图片聚为一个簇,每一簇中包括一个簇中心图片。
图2为本发明提供的相似图片检测方法实施例二的流程示意图,如图2所示,在图片库中进行相似图片检测的方法具体包括:
S201、将第一图片的数据的第一部分与存储空间的每个簇中心图片的数据的第一部分进行比较;
S202、若存在第一簇中心图片的数据的第一部分与第一图片的数据的第一部分在第二误差范围内相同,则将第一图片的数据的第二部分与第一簇中心图片的数据的第二部分进行对比;
S203、若第一图片的数据的第二部分与第一簇中心图片的数据的第二部分在第二误差范围内相同,则在第一簇中心图片所属的簇中确定与第一图片相似的至少一个第三图片;
其中,第二误差范围大于第一误差范围。
具体的,为进一步提高相似图片检测速度,将图片库中的图片进行聚簇处理,相似的图片聚为一簇,首先将第一图片与各簇的簇中心图片进行比较,当第一图片与某一簇的簇中心图片相似时,则进一步在该簇中确定与第一图片相似的图片,当确定某一簇的簇中心图片与第一图片不相似时,则直接确定该簇内的所有图片均与第一图片不相似。通过将第一图片先与簇中心图片进行比较,可快速筛除与第一图片不相似的簇,减少待比较的数据量。
具体的,在S201中,将第一图片的数据的第一部分与存储空间的每个簇中心图片的数据的第一部分进行比较,当某一簇中心图片的数据的第一部分与第一图片的数据的第一部分在第二误差范围内相同时,将该簇中心图片记为第一簇中心图片,执行S202,进一步将第一图片的数据的第二部分与第一簇中心图片的数据的第二部分进行对比。其中,第二误差范围大于第一误差范围。当第一图片的数据的第二部分与第一簇中心图片的数据的第二部分在第二误差范围内相同,则执行S203,在第一簇中心图片所属的簇中确定与第一图片相似的至少一个第三图片。示例性的,S203的具体实现方式可以与图1所示实施例中的S101至S104相同,本发明不再赘述。
进一步的,在图1或图2所示实施例的基础上,考虑恶意用户通常集中进行相同图片的上传,处理器在一段内处理的第一图片均为同一图片,则该些图片在图片库中的相似图片也相同,因此,考虑到处理器在处理数据过程中,会将处理中的数据存储在缓存空间中,以提高处理性能,因此,在将第一图片与图片库中的图片进行对比之前,还包括:
将第一图片的数据的第一部分与缓存空间中的每个图片的数据的第一部分进行对比。
其中,存储空间包括缓存空间。
具体的,当服务器接收到第一图片的数据时,将第一图片的数据的第一部分与缓存空间中缓存的每一图片的数据的第一部分进行比较,确定是否存在第一误差范围内相似的第二图片,然后与上述实施例中相同,当确实存在时,将第二图片的数据的第二部分与第一图片的数据的第二部分进行比较,确定是否存在相似图片。
进一步的,考虑到网站用户量大,图片数量过多时,客户端一幅一幅图像检测速度过慢,网页服务供应商还可选择批量进行相似图片检测。
在上述任一实施例的基础上,当同时处理多幅图像时,若第一图片的数据的第二部分与第一簇中心图片的数据的第二部分在第二误差范围内相同,相似图片检测方法还包括:
将第一图片的数据存储在第一簇中心图片的数据所属的簇中。
具体的,当第一图片与第一簇中心图片相似时,将第一图片划分至第一簇中心图片所属的簇中,并存储第一图片的数据。当服务器接收到多幅第一图像时,将多幅第一图像按簇划分,并存储在各自簇中,当现有图片库中不存在与某一第一图像相似的簇中心图片时,该第一图片作为一个新的簇中心图片,增加一个新的簇分类。
服务器将预设时间内接收到到的所有第一图像按簇分类,并展示给用户,示例性的,可按照簇的大小顺序向用户展示,可按照簇的更新时间向用户进行展示。
进一步的,在将多幅第一图片按簇存储后,相似图片检测方法还包括:
检测第一簇中心图片的数据所属的簇是否符合预设条件;
若否,则将第一簇中心图片的数据所属的簇删除或者发送告警信息。
具体的,当将多幅第一图像按簇划分后,可进一步判断各簇是否符合预设条件,可选的,预设条件可以为簇的大小,簇的类型等。示例性的,可进一步根据簇中的图片的内容是否为广告、二维码等,确定簇的类型。当簇中的图片的内容为广告时,可将簇划分为违规广告簇,当检测到一个簇为广告簇时,确定该簇不符合预设条件,可直接将该簇删除,或向用户发送告警信息,提醒用户及时对不符合预设条件的簇进行处理。
通过将多幅图像按簇划分,方便了同时对多幅图像进行处理,提高了相似图片检测后的处理速度。
可选的,当服务器确定与第一图片相似的第二图片后,向用户反馈与第一图片相似的第二图片的数量,以及各第二图片的属性信息,如第二图片所属的帖子的地址,第二图片所属的帖子所在的网站版块等信息,以使用户根据第二图片的属性信息,进行相似图片处理。
本发明另一方面还提供的一种相似图片检测装置,该装置可以由软件/硬件实现,本发明对此不做限定。该装置与方法实施例一一对应,用以实现上述实施例中的相似图片检测方法,具有相同的技术特征和技术效果,本发明实施例对此不再赘述。
图3为本发明提供的相似图片检测装置实施例一的结构示意图。如图3所示,该装置包括:
接收模块301,用于接收第一图片的数据,第一图片的数据包括第一部分和第二部分;
第一比较模块302,用于将第一图片的数据的第一部分与存储空间的每个图片的数据的第一部分进行对比;
第二比较模块303,用于若存在第二图片的数据的第一部分与第一图片的数据的第一部分在第一误差范围内相同,则将第一图片的数据的第二部分与第二图片的数据的第二部分进行对比;
确定模块304,用于若第一图片的数据的第二部分与第二图片的数据的第二部分在第一误差范围内相同,则确定第一图片与第二图片为相似图片。
可选的,在图3所示实施例的基础上,第一比较模块302具体用于:将第一图片的数据的第一部分与存储空间的每个簇中心图片的数据的第一部分进行比较;
第二比较模块303具体用于:若存在第一簇中心图片的数据的第一部分与第一图片的数据的第一部分在第二误差范围内相同,则将第一图片的数据的第二部分与第一簇中心图片的数据的第二部分进行对比;
相似图片检测装置还包括第三比较模块;
第三比较模块具体用于:若第一图片的数据的第二部分与第一簇中心图片的数据的第二部分在第二误差范围内相同,则在第一簇中心图片所属的簇中确定与第一图片相似的至少一个第三图片;
其中,第二误差范围大于第一误差范围。
可选的,在上述任一实施例的基础上,第一比较模块302具体用于:
将第一图片的数据的第一部分与缓存空间中的每个图片的数据的第一部分进行对比;存储空间包括缓存空间。
可选的,在上述任一实施例的基础上,相似图片检测装置还包括存储模块,用于若第一图片的数据的第二部分与第一簇中心图片的数据的第二部分在第二误差范围内相同,将第一图片的数据存储在第一簇中心图片的数据所属的簇中。
可选的,相似图片检测装置还包括检测模块,用于检测第一簇中心图片的数据所属的簇是否符合预设条件;若否,则将第一簇中心图片的数据所属的簇删除或者发送告警信息。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种相似图片检测方法,其特征在于,包括:
接收第一图片的数据,所述第一图片的数据包括第一部分和第二部分;
将所述第一图片的数据的第一部分与存储空间的每个图片的数据的第一部分进行对比;
若存在第二图片的数据的第一部分与所述第一图片的数据的第一部分在第一误差范围内相同,则将所述第一图片的数据的第二部分与所述第二图片的数据的第二部分进行对比;
若所述第一图片的数据的第二部分与所述第二图片的数据的第二部分在第一误差范围内相同,则确定所述第一图片与所述第二图片为相似图片。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一图片的数据的第一部分与存储空间的每个图片的数据的第一部分进行对比,包括:
将所述第一图片的数据的第一部分与存储空间的每个簇中心图片的数据的第一部分进行比较;
则所述方法还包括:
若存在第一簇中心图片的数据的第一部分与所述第一图片的数据的第一部分在第二误差范围内相同,则将所述第一图片的数据的第二部分与所述第一簇中心图片的数据的第二部分进行对比;
若所述第一图片的数据的第二部分与所述第一簇中心图片的数据的第二部分在第二误差范围内相同,则在所述第一簇中心图片所属的簇中确定与所述第一图片相似的至少一个第三图片;
其中,第二误差范围大于所述第一误差范围。
3.根据权利要求1或2所述的方法,其特征在于,所述将所述第一图片的数据的第一部分与存储空间的每个图片的数据的第一部分进行对比,包括:
将所述第一图片的数据的第一部分与缓存空间中的每个图片的数据的第一部分进行对比;所述存储空间包括所述缓存空间。
4.根据权利要求2所述的方法,其特征在于,若所述第一图片的数据的第二部分与所述第一簇中心图片的数据的第二部分在第二误差范围内相同,所述方法还包括:
将所述第一图片的数据存储在所述第一簇中心图片的数据所属的簇中。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
检测所述第一簇中心图片的数据所属的簇是否符合预设条件;
若否,则将所述第一簇中心图片的数据所属的簇删除或者发送告警信息。
6.一种相似图片检测装置,其特征在于,包括:
接收模块,用于接收第一图片的数据,所述第一图片的数据包括第一部分和第二部分;
第一比较模块,用于将所述第一图片的数据的第一部分与存储空间的每个图片的数据的第一部分进行对比;
第二比较模块,用于若存在第二图片的数据的第一部分与所述第一图片的数据的第一部分在第一误差范围内相同,则将所述第一图片的数据的第二部分与所述第二图片的数据的第二部分进行对比;
确定模块,用于若所述第一图片的数据的第二部分与所述第二图片的数据的第二部分在第一误差范围内相同,则确定所述第一图片与所述第二图片为相似图片。
7.根据权利要求6所述的装置,其特征在于,所述第一比较模块具体用于:将所述第一图片的数据的第一部分与存储空间的每个簇中心图片的数据的第一部分进行比较;
所述第二比较模块具体用于:若存在第一簇中心图片的数据的第一部分与所述第一图片的数据的第一部分在第二误差范围内相同,则将所述第一图片的数据的第二部分与所述第一簇中心图片的数据的第二部分进行对比;
所述装置还包括第三比较模块;
所述第三比较模块具体用于:若所述第一图片的数据的第二部分与所述第一簇中心图片的数据的第二部分在第二误差范围内相同,则在所述第一簇中心图片所属的簇中确定与所述第一图片相似的至少一个第三图片;
其中,第二误差范围大于所述第一误差范围。
8.根据权利要求6或7所述的装置,其特征在于,所述第一比较模块具体用于:
将所述第一图片的数据的第一部分与缓存空间中的每个图片的数据的第一部分进行对比;所述存储空间包括所述缓存空间。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括存储模块,用于若所述第一图片的数据的第二部分与所述第一簇中心图片的数据的第二部分在第二误差范围内相同,将所述第一图片的数据存储在所述第一簇中心图片的数据所属的簇中。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:检测模块,用于检测所述第一簇中心图片的数据所属的簇是否符合预设条件;若否,则将所述第一簇中心图片的数据所属的簇删除或者发送告警信息。
CN201611156106.6A 2016-12-14 2016-12-14 相似图片检测方法和装置 Active CN106682130B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611156106.6A CN106682130B (zh) 2016-12-14 2016-12-14 相似图片检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611156106.6A CN106682130B (zh) 2016-12-14 2016-12-14 相似图片检测方法和装置

Publications (2)

Publication Number Publication Date
CN106682130A true CN106682130A (zh) 2017-05-17
CN106682130B CN106682130B (zh) 2022-11-15

Family

ID=58869552

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611156106.6A Active CN106682130B (zh) 2016-12-14 2016-12-14 相似图片检测方法和装置

Country Status (1)

Country Link
CN (1) CN106682130B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109102264A (zh) * 2018-08-29 2018-12-28 Oppo广东移动通信有限公司 一种电子红包检测方法、装置及终端设备
CN110765396A (zh) * 2019-09-28 2020-02-07 同程网络科技股份有限公司 图形适配系统及基于该系统的图形适配方法
CN111552829A (zh) * 2020-05-07 2020-08-18 北京海益同展信息科技有限公司 用于分析图像素材的方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984776A (zh) * 2014-06-05 2014-08-13 北京奇虎科技有限公司 一种识别重复图片的方法、图片搜索去重方法及其装置
CN104036259A (zh) * 2014-06-27 2014-09-10 北京奇虎科技有限公司 人脸相似度识别方法和系统
US20160283824A1 (en) * 2015-03-24 2016-09-29 Fujifilm Corporation Image processing device, image processing method, program, and recording medium

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984776A (zh) * 2014-06-05 2014-08-13 北京奇虎科技有限公司 一种识别重复图片的方法、图片搜索去重方法及其装置
CN104036259A (zh) * 2014-06-27 2014-09-10 北京奇虎科技有限公司 人脸相似度识别方法和系统
US20160283824A1 (en) * 2015-03-24 2016-09-29 Fujifilm Corporation Image processing device, image processing method, program, and recording medium

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109102264A (zh) * 2018-08-29 2018-12-28 Oppo广东移动通信有限公司 一种电子红包检测方法、装置及终端设备
CN110765396A (zh) * 2019-09-28 2020-02-07 同程网络科技股份有限公司 图形适配系统及基于该系统的图形适配方法
WO2021056812A1 (zh) * 2019-09-28 2021-04-01 同程网络科技股份有限公司 图形适配系统及基于该系统的图形适配方法
CN111552829A (zh) * 2020-05-07 2020-08-18 北京海益同展信息科技有限公司 用于分析图像素材的方法和装置
CN111552829B (zh) * 2020-05-07 2023-06-27 京东科技信息技术有限公司 用于分析图像素材的方法和装置

Also Published As

Publication number Publication date
CN106682130B (zh) 2022-11-15

Similar Documents

Publication Publication Date Title
CN106202569A (zh) 一种基于大数据量的清洗方法
US10795744B2 (en) Identifying failed customer experience in distributed computer systems
CN110430066B (zh) 用于减少区块链交易重复广播的方法、设备及存储介质
CN106682130A (zh) 相似图片检测方法和装置
CN107329963B (zh) 加速网页访问的方法和装置
CN108429777B (zh) 一种基于缓存的数据更新方法及服务器
CN105608117A (zh) 一种信息推荐方法及装置
CN106599239A (zh) 网页内容数据获取方法及服务器
CN105721883B (zh) 一种云存储系统中基于溯源信息的视频共享方法与系统
CN104427284B (zh) 处理运动视频的方法和装置
CN109167840B (zh) 一种任务推送方法、节点自治服务器及边缘缓存服务器
CN105183873A (zh) 恶意点击行为检测方法及装置
CN110851680B (zh) 网络爬虫识别方法和装置
CN105653198A (zh) 数据处理方法及装置
CN104580432A (zh) memcached系统及内存缓存数据提供、维护和集群维护方法及装置
CN104462283A (zh) 在移动终端中进行网页元素请求的方法、装置和客户端
CN103618787A (zh) 一种网页展现系统和方法
CN103813181A (zh) 一种视频优化系统及方法
CN103731482A (zh) 一种集群负载均衡系统及其实现方法
CN104899236A (zh) 一种评论信息显示方法、装置及系统
CN103455580A (zh) 一种推荐信息的方法和装置
US20160028805A1 (en) Collecting client-side application performance monitoring information
CN103593442A (zh) 日志数据的去重方法及装置
CN105893429A (zh) 用于优化web缓存的方法及系统
CN105490835B (zh) 信息监控方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant