CN113821672A - 侵权图片的确定方法及装置 - Google Patents

侵权图片的确定方法及装置 Download PDF

Info

Publication number
CN113821672A
CN113821672A CN202111119802.0A CN202111119802A CN113821672A CN 113821672 A CN113821672 A CN 113821672A CN 202111119802 A CN202111119802 A CN 202111119802A CN 113821672 A CN113821672 A CN 113821672A
Authority
CN
China
Prior art keywords
picture
hash value
checked
target
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111119802.0A
Other languages
English (en)
Inventor
陈健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Soufun Science & Technology Development Co ltd
Original Assignee
Beijing Soufun Science & Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Soufun Science & Technology Development Co ltd filed Critical Beijing Soufun Science & Technology Development Co ltd
Priority to CN202111119802.0A priority Critical patent/CN113821672A/zh
Publication of CN113821672A publication Critical patent/CN113821672A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Storage Device Security (AREA)

Abstract

本发明提供了一种侵权图片的确定方法及装置,该方法包括:获取待核验图片;对待核验图片进行灰度处理,获得待核验图片的哈希值;将待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行比对,获得所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值;所述差异值表征所述待核验图片的哈希值与所述目标图片的哈希值的差异程度;基于所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值,确定所述待核验图片与每个所述目标图片的相似度;若所述待核验图片与任意一个所述目标图片的相似度大于预先设置的相似度阈值,则将所述待核验图片确定为侵权图片。应用本发明提供的侵权图片的确定方法,能够准确的确定出侵权图片。

Description

侵权图片的确定方法及装置
技术领域
本发明涉及图片处理技术领域,特别涉及一种侵权图片的确定方法及装置。
背景技术
随着互联网技术的飞速发展,越来越多的人通过网络发表自己的原创作品,如图片、文字、视频等等。但是,用户发表的原创作品经常会被其他人盗用,这不仅侵犯了用户的合法权益,在一定程度上也打击了用户创作的积极性。
目前,通常会采用人工搜集的方式来查找侵权图片,这不仅需要投入大量的人力成本和时间成本,而且光靠人眼比对侵权图片效率低,比对准确率率不高。
发明内容
本发明所要解决的技术问题是提供一种侵权图片的确定方法,能够准确的确定出侵权图片。
本发明还提供了一种侵权图片的确定装置,用以保证上述方法在实际中的实现及应用。
一种侵权图片的确定方法,包括:
获取待核验图片;
对所述待核验图片进行灰度处理,获得所述待核验图片的哈希值;
将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行比对,获得所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值;所述差异值表征所述待核验图片的哈希值与所述目标图片的哈希值的差异程度;
基于所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值,确定所述待核验图片与每个所述目标图片的相似度;
若所述待核验图片与任意一个所述目标图片的相似度大于预先设置的相似度阈值,则将所述待核验图片确定为侵权图片。
上述的方法,可选的,所述将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行比对,获得所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值,包括:
将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行按位比对,获得每个所述目标图片的哈希值对应的不一致位的数量;
基于每个所述目标图片的哈希值对应的不一致位的数量,获得所述待核验图片与该目标图片的不一致率;
将所述待核验图片与所述目标图片的不一致率确定为所述待核验图片与所述目标图片的差异值。
上述的方法,可选的,所述图片库的建立过程,包括:
接收各个用户通过预先设置的上传渠道上传的初始图片;
对于接收到的每个所述初始图片,在该初始图片的可交换图像文件格式Exif包含坐标信息的情况下,将所述初始图片确定为目标图片;
对每个所述目标图片进行灰度处理,获得所述目标图片的哈希值,并为所述目标图片分配版权标识以及图片标签;
由各个所述目标图片和每个所述目标图片的哈希值、版权标识以及图片标签组成所述图片库。
上述的方法,可选的,所述获取待核验图片,包括:
确定待检测的目标网站;
对所述目标网站进行图片抓取,获得待核验图片。
上述的方法,可选的,所述将所述待核验图片确定为侵权图片之后,还包括:
基于所述侵权图片以及与所述侵权图片的相似度大于所述相似度阈值的目标图片,生成侵权核验信息;
将所述侵权核验信息存储至预先设置的数据库。
一种侵权图片的确定装置,包括:
获取单元,用于获取待核验图片;
处理单元,用于对所述待核验图片进行灰度处理,获得所述待核验图片的哈希值;
比对单元,用于将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行比对,获得所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值;所述差异值表征所述待核验图片的哈希值与所述目标图片的哈希值的差异程度;
第一确定单元,用于基于所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值,确定所述待核验图片与每个所述目标图片的相似度;
第二确定单元,用于若所述待核验图片与任意一个所述目标图片的相似度大于预先设置的相似度阈值,则将所述待核验图片确定为侵权图片。
上述的装置,可选的,所述比对单元,包括:
比对子单元,用于将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行按位比对,获得每个所述目标图片的哈希值对应的不一致位的数量;
第一执行子单元,用于基于每个所述目标图片的哈希值对应的不一致位的数量,获得所述待核验图片与该目标图片的不一致率;
第一确定子单元,用于将所述待核验图片与所述目标图片的不一致率确定为所述待核验图片与所述目标图片的差异值。
上述的装置,可选的,所述比对单元,包括:
接收子单元,用于接收各个用户通过预先设置的上传渠道上传的初始图片;
第二确定子单元,用于对于接收到的每个所述初始图片,在该初始图片的可交换图像文件格式Exif包含坐标信息的情况下,将所述初始图片确定为目标图片;
灰度处理子单元,用于对每个所述目标图片进行灰度处理,获得所述目标图片的哈希值,并为所述目标图片分配版权标识以及图片标签;
构建子单元,用于由各个所述目标图片和每个所述目标图片的哈希值、版权标识以及图片标签组成所述图片库。
上述的装置,可选的,所述获取单元,包括:
第三确定子单元,用于确定待检测的目标网站;
第二执行子单元,用于对所述目标网站进行图片抓取,获得待核验图片。
上述的装置,可选的,还包括:
生成单元,用于基于所述侵权图片以及与所述侵权图片的相似度大于所述相似度阈值的目标图片,生成侵权核验信息;
存储单元,用于将所述侵权核验信息存储至预先设置的数据库。
与现有技术相比,本发明包括以下优点:
本发明提供了一种侵权图片的确定方法及装置,该方法包括:获取待核验图片;对所述待核验图片进行灰度处理,获得所述待核验图片的哈希值;将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行比对,获得所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值;所述差异值表征所述待核验图片的哈希值与所述目标图片的哈希值的差异程度;基于所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值,确定所述待核验图片与每个所述目标图片的相似度;若所述待核验图片与任意一个所述目标图片的相似度大于预先设置的相似度阈值,则将所述待核验图片确定为侵权图片。应用本发明提供的侵权图片的确定方法,能够根据差异值确定出相似度,进而根据相似度确定待核验图片是否为侵权图片,能够提高识别侵权图片的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明提供的一种侵权图片的确定方法的方法流程图;
图2为本发明提供的一种获得待核验图片的哈希值与每个目标图片的哈希值的差异值的过程的流程图;
图3为本发明提供的一种图片库的建立过程的流程图;
图4为本发明提供的一种获取待核验图片的过程的流程图;
图5为本发明提供的一种侵权图片的确定装置的结构示意图;
图6为本发明提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明实施例提供了一种侵权图片的确定方法,该方法可以应用于电子设备,所述方法的方法流程图如图1所示,具体包括:
S101:获取待核验图片。
在本发明实施例中,可以在接收到用户发送的检测请求的情况下,获取待核验图片。
其中,可以按预先设置的时间间隔获取待核验图片。
可选的,待核验图片的数量可以为一个或多个。
S102:对所述待核验图片进行灰度处理,获得所述待核验图片的哈希值。
其中,该哈希值可以为十六进制的哈希值,也可以为二进制的哈希值。
在本发明实施例中,可以对待核验图片进行灰度处理,获得待核验图片的各个像素点的灰度值,基于各个像素点的灰度值计算得到待核验图片的十六进制的哈希值,可以将该十六进制的哈希值转换为二进制的哈希值。
S103:将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行比对,获得所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值;所述差异值表征所述待核验图片的哈希值与所述目标图片的哈希值的差异程度。
在本发明实施例中,可以将待核验图片的哈希值与每个目标图片的哈希值进行比对,得到各个比对结果;基于每个比对结果获得待核验图片的哈希值与每个目标图片的哈希值的差异值。
可选的,该图片库中包括多个目标图片,目标图片为满足预先设置的存储条件的图片,该存储条件可以为图片的可交换图像文件格式Exif包含坐标信息。
其中,目标图片的哈希值的进制与该待核验图片的进制一致。
S104:基于所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值,确定所述待核验图片与每个所述目标图片的相似度。
在本发明实施例中,可以通过对待核验图片的哈希值与每个目标图片的哈希值进行计算,得到待核验图片与每个目标图片的相似度。
具体的,该差异值可以为不一致率k,则相似度P=1-k。
S105:若所述待核验图片与任意一个所述目标图片的相似度大于预先设置的相似度阈值,则将所述待核验图片确定为侵权图片。
在发明实施例中,可以将待核验图片与每个目标图片的相似度与预先设置的相似度阈值进行比较,该相似度阈值可以依据实际需求设定为任意数值,例如,可以为0.97、0.98或0.99等。
其中,将待核验图片确定为侵权图片之后,可以保存该侵权图片以及与该侵权图片的相似度大于相似度阈值的目标图片,并记录该侵权图片的来源信息,还可以发出提示信息,以提示用户核验侵权图片。
可选的,在待核验图片的与每个目标图片的相似度均未大于该相似度阈值的情况下,通过预先设置的检测模型对所述待核验图片以及各个目标图片进行特征提取,获得待核验图片的图片特征以及每个目标图片的图片特征,将待核验图片的图片特征与每个目标图片的图片特征进行比对,获得待核验图片与每个目标图片的特征差异值,将每个特征差异值与预先设置的特征差异阈值进行比较,若存在至少一个特征差异值小于该特征差异阈值,则确定该待核验图片为侵权图片,否则,可以确定该待核验图片不为侵权图片。
应用本发明提供的侵权图片的确定方法,能够根据差异值确定出相似度,进而根据相似度确定待核验图片是否为侵权图片,能够提高识别侵权图片的准确率。
在本发明实施例提供的方法中,基于上述的实施过程,具体的,所述将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行比对,获得所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值,如图2所示,具体包括:
S201:将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行按位比对,获得每个所述目标图片的哈希值对应的不一致位的数量。
在本发明实施例中,可以将待核验图片的哈希值与目标图片的哈希值的每一位数进行比对,从而可以获得待核验图片的哈希值与目标图片的哈希值中不一致位的数量。
例如,待核验图片的哈希值的前五位为10010,目标图片的哈希值的前五位为11010,可以得到待核验图片的哈希值的第二位与目标图片的哈希值的第二位不一致,而其余的位数的值一致,因此,不一致位的数量为1。
S202:基于每个所述目标图片的哈希值对应的不一致位的数量,获得所述待核验图片与该目标图片的不一致率。
在本发明实施例中,可以将不一致位的数量比上哈希值的总位数,得到不一致率。
具体的,不一致率C=T/R,其中,T为不一致位的数量,R为总位数,该总位数可以为256位。
S203:将所述待核验图片与所述目标图片的不一致率确定为所述待核验图片与所述目标图片的差异值。
本发明实施例提供的方法中,通过计算待核验图片与目标图片的不一致率,可以得到待核验图片的哈希值与目标图片的哈希值的差异程度。
本发明实施例提供的方法中,基于上述的实施过程,具体的,所述图片库的建立过程,如图3所示,具体包括:
S301:接收各个用户通过预先设置的上传渠道上传的初始图片。
在本发明实施例中,可以用户可以通过客户端的APP上传初始图片。
S302:对于接收到的每个所述初始图片,在该初始图片的可交换图像文件格式Exif包含坐标信息的情况下,将所述初始图片确定为目标图片。
S303:对每个所述目标图片进行灰度处理,获得所述目标图片的哈希值,并为所述目标图片分配版权标识以及图片标签。
在本发明实施例中,该版权标识是基于预先设置的标识生成规则生成的,具体可以是基于上传该目标图片的用户的用户名、设备标识、该目标图片的坐标信息以及该目标图片的分类编码生成该版权标识,该版权标识可以为版权ID。
S304:由各个所述目标图片和每个所述目标图片的哈希值、版权标识以及图片标签组成所述图片库。
本发明实施例提供的方法中,基于上述的实施过程,具体的,所述获取待核验图片的过程,如图4所示,包括:
S401:确定待检测的目标网站。
在本发明实施例中,该目标网站的数量可以为一个或多个。
其中,该目标网站可以为预先指定的网站。
S402:对所述目标网站进行图片抓取,获得待核验图片。
在本发明实施例中,通过下载目标网站中的图片,获得待核验图片。
在本发明实施例提供的方法中,基于上述的实施过程,具体的,所述将所述待核验图片确定为侵权图片之后,还包括:
基于所述侵权图片以及与所述侵权图片的相似度大于所述相似度阈值的目标图片,生成侵权核验信息;
将所述侵权核验信息存储至预先设置的数据库。
在本发明实施例中,该侵权核验信息包含该侵权图片的侵权信息。
本发明实施例提供的侵权图片的确定方法,可以应用于多种应用场景中,下面进行举例说明:
对于用户上传的图片,若该该图片为用户通过预先设置的app上传,且该图片exif中有坐标信息,则可以将该图片确定为原图数据,即目标图片。
可以对目标图片进行灰度处理,得到16进制的哈希值。
可以按照IP编号生成规则,为该目标图片分配一个版权ID,然后将哈希值,以及图片标签、版权ID等相关信息保存到数据库中,以备比对图片是否侵权使用。
定期抓取分析疑似侵权网站图片数据,对图片进行下载,下载后进行灰度处理,保存哈希值。
取出数据库中目标图片,将目标图片的16进制哈希值转换成2进制哈希值。
将抓取的待核验图片的16进制哈希值转换成2进制哈希值。
将目标图片的2进制哈希值与待核验图片的2进制哈希值进行按位比对,比对出不一致位的数量。
将不一致位的数量除以256得到不一致率。
应用1减去不一致率,得到两张图片的相似度,若存在相似度大于0.99,则将待核验图片确定为疑似侵权图片。
将侵权图片信息、原图信息存入数据库备查。
与图1所述的方法相对应,本发明实施例还提供了一种侵权图片的确定装置,用于对图1中方法的具体实现,本发明实施例提供的侵权图片的确定装置可以应用于电子设备中,其结构示意图如图5所示,具体包括:
获取单元501,用于获取待核验图片;
处理单元502,用于对所述待核验图片进行灰度处理,获得所述待核验图片的哈希值;
比对单元503,用于将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行比对,获得所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值;所述差异值表征所述待核验图片的哈希值与所述目标图片的哈希值的差异程度;
第一确定单元504,用于基于所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值,确定所述待核验图片与每个所述目标图片的相似度;
第二确定单元505,用于若所述待核验图片与任意一个所述目标图片的相似度大于预先设置的相似度阈值,则将所述待核验图片确定为侵权图片。
在本发明提供的一实施例中,基于上述的方案,可选的,所述比对单元503,包括:
比对子单元,用于将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行按位比对,获得每个所述目标图片的哈希值对应的不一致位的数量;
第一执行子单元,用于基于每个所述目标图片的哈希值对应的不一致位的数量,获得所述待核验图片与该目标图片的不一致率;
第一确定子单元,用于将所述待核验图片与所述目标图片的不一致率确定为所述待核验图片与所述目标图片的差异值。
在本发明提供的一实施例中,基于上述的方案,可选的,所述比对单元503,包括:
接收子单元,用于接收各个用户通过预先设置的上传渠道上传的初始图片;
第二确定子单元,用于对于接收到的每个所述初始图片,在该初始图片的可交换图像文件格式Exif包含坐标信息的情况下,将所述初始图片确定为目标图片;
灰度处理子单元,用于对每个所述目标图片进行灰度处理,获得所述目标图片的哈希值,并为所述目标图片分配版权标识以及图片标签;
构建子单元,用于由各个所述目标图片和每个所述目标图片的哈希值、版权标识以及图片标签组成所述图片库。
在本发明提供的一实施例中,基于上述的方案,可选的,所述获取单元501,包括:
第三确定子单元,用于确定待检测的目标网站;
第二执行子单元,用于对所述目标网站进行图片抓取,获得待核验图片。
在本发明提供的一实施例中,基于上述的方案,可选的,还包括:
生成单元,用于基于所述侵权图片以及与所述侵权图片的相似度大于所述相似度阈值的目标图片,生成侵权核验信息;
存储单元,用于将所述侵权核验信息存储至预先设置的数据库。
上述本发明实施例公开的侵权图片的确定装置中的各个单元和模块具体的原理和执行过程,与上述本发明实施例公开的侵权图片的确定方法相同,可参见上述本发明实施例提供的侵权图片的确定方法中相应的部分,这里不再进行赘述。
本发明实施例还提供了一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行上述侵权图片的确定方法。
本发明实施例还提供了一种电子设备,其结构示意图如图6所示,具体包括存储器601,以及一个或者一个以上的指令602,其中一个或者一个以上指令602存储于存储器601中,且经配置以由一个或者一个以上处理器603执行所述一个或者一个以上指令602进行以下操作:
获取待核验图片;
对所述待核验图片进行灰度处理,获得所述待核验图片的哈希值;
将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行比对,获得所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值;所述差异值表征所述待核验图片的哈希值与所述目标图片的哈希值的差异程度;
基于所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值,确定所述待核验图片与每个所述目标图片的相似度;
若所述待核验图片与任意一个所述目标图片的相似度大于预先设置的相似度阈值,则将所述待核验图片确定为侵权图片。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
以上对本发明所提供的一种侵权图片的确定方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种侵权图片的确定方法,其特征在于,包括:
获取待核验图片;
对所述待核验图片进行灰度处理,获得所述待核验图片的哈希值;
将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行比对,获得所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值;所述差异值表征所述待核验图片的哈希值与所述目标图片的哈希值的差异程度;
基于所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值,确定所述待核验图片与每个所述目标图片的相似度;
若所述待核验图片与任意一个所述目标图片的相似度大于预先设置的相似度阈值,则将所述待核验图片确定为侵权图片。
2.根据权利要求1所述的方法,其特征在于,所述将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行比对,获得所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值,包括:
将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行按位比对,获得每个所述目标图片的哈希值对应的不一致位的数量;
基于每个所述目标图片的哈希值对应的不一致位的数量,获得所述待核验图片与该目标图片的不一致率;
将所述待核验图片与所述目标图片的不一致率确定为所述待核验图片与所述目标图片的差异值。
3.根据权利要求1所述的方法,其特征在于,所述图片库的建立过程,包括:
接收各个用户通过预先设置的上传渠道上传的初始图片;
对于接收到的每个所述初始图片,在该初始图片的可交换图像文件格式Exif包含坐标信息的情况下,将所述初始图片确定为目标图片;
对每个所述目标图片进行灰度处理,获得所述目标图片的哈希值,并为所述目标图片分配版权标识以及图片标签;
由各个所述目标图片和每个所述目标图片的哈希值、版权标识以及图片标签组成所述图片库。
4.根据权利要求1所述的方法,其特征在于,所述获取待核验图片,包括:
确定待检测的目标网站;
对所述目标网站进行图片抓取,获得待核验图片。
5.根据权利要求1所述的方法,其特征在于,所述将所述待核验图片确定为侵权图片之后,还包括:
基于所述侵权图片以及与所述侵权图片的相似度大于所述相似度阈值的目标图片,生成侵权核验信息;
将所述侵权核验信息存储至预先设置的数据库。
6.一种侵权图片的确定装置,其特征在于,包括:
获取单元,用于获取待核验图片;
处理单元,用于对所述待核验图片进行灰度处理,获得所述待核验图片的哈希值;
比对单元,用于将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行比对,获得所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值;所述差异值表征所述待核验图片的哈希值与所述目标图片的哈希值的差异程度;
第一确定单元,用于基于所述待核验图片的哈希值与每个所述目标图片的哈希值的差异值,确定所述待核验图片与每个所述目标图片的相似度;
第二确定单元,用于若所述待核验图片与任意一个所述目标图片的相似度大于预先设置的相似度阈值,则将所述待核验图片确定为侵权图片。
7.根据权利要求6所述的装置,其特征在于,所述比对单元,包括:
比对子单元,用于将所述待核验图片的哈希值与预先建立的图片库中的每个目标图片的哈希值进行按位比对,获得每个所述目标图片的哈希值对应的不一致位的数量;
第一执行子单元,用于基于每个所述目标图片的哈希值对应的不一致位的数量,获得所述待核验图片与该目标图片的不一致率;
第一确定子单元,用于将所述待核验图片与所述目标图片的不一致率确定为所述待核验图片与所述目标图片的差异值。
8.根据权利要求6所述的装置,其特征在于,所述比对单元,包括:
接收子单元,用于接收各个用户通过预先设置的上传渠道上传的初始图片;
第二确定子单元,用于对于接收到的每个所述初始图片,在该初始图片的可交换图像文件格式Exif包含坐标信息的情况下,将所述初始图片确定为目标图片;
灰度处理子单元,用于对每个所述目标图片进行灰度处理,获得所述目标图片的哈希值,并为所述目标图片分配版权标识以及图片标签;
构建子单元,用于由各个所述目标图片和每个所述目标图片的哈希值、版权标识以及图片标签组成所述图片库。
9.根据权利要求6所述的装置,其特征在于,所述获取单元,包括:
第三确定子单元,用于确定待检测的目标网站;
第二执行子单元,用于对所述目标网站进行图片抓取,获得待核验图片。
10.根据权利要求6所述的装置,其特征在于,还包括:
生成单元,用于基于所述侵权图片以及与所述侵权图片的相似度大于所述相似度阈值的目标图片,生成侵权核验信息;
存储单元,用于将所述侵权核验信息存储至预先设置的数据库。
CN202111119802.0A 2021-09-24 2021-09-24 侵权图片的确定方法及装置 Pending CN113821672A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111119802.0A CN113821672A (zh) 2021-09-24 2021-09-24 侵权图片的确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111119802.0A CN113821672A (zh) 2021-09-24 2021-09-24 侵权图片的确定方法及装置

Publications (1)

Publication Number Publication Date
CN113821672A true CN113821672A (zh) 2021-12-21

Family

ID=78921261

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111119802.0A Pending CN113821672A (zh) 2021-09-24 2021-09-24 侵权图片的确定方法及装置

Country Status (1)

Country Link
CN (1) CN113821672A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112149744A (zh) * 2020-09-25 2020-12-29 浙江数秦科技有限公司 一种侵权图片快速识别方法
CN112182329A (zh) * 2020-09-14 2021-01-05 浙江数秦科技有限公司 一种网络图片侵权监控及自动取证方法
CN112651953A (zh) * 2020-12-31 2021-04-13 平安国际智慧城市科技股份有限公司 图片相似度计算方法、装置、计算机设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112182329A (zh) * 2020-09-14 2021-01-05 浙江数秦科技有限公司 一种网络图片侵权监控及自动取证方法
CN112149744A (zh) * 2020-09-25 2020-12-29 浙江数秦科技有限公司 一种侵权图片快速识别方法
CN112651953A (zh) * 2020-12-31 2021-04-13 平安国际智慧城市科技股份有限公司 图片相似度计算方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
RU2677368C1 (ru) Способ и система для автоматического определения нечетких дубликатов видеоконтента
CN109194671B (zh) 一种异常访问行为的识别方法及服务器
CN110851879A (zh) 一种基于存证区块链的侵权存证方法、装置及设备
CN103198293A (zh) 用于指纹识别视频的系统和方法
CN109756760B (zh) 视频标签的生成方法、装置及服务器
US20100287201A1 (en) Method and a system for identifying elementary content portions from an edited content
RU2018145499A (ru) Автоматизация проверки достоверности изображения
US10769247B2 (en) System and method for interacting with information posted in the media
CN108989875B (zh) 一种生成弹幕文件的方法及装置
CN112132030B (zh) 视频处理方法及装置、存储介质及电子设备
KR101803066B1 (ko) 불법 복제된 서적의 통합 식별 시스템 및 방법
CN111339368B (zh) 基于视频指纹的视频检索方法、装置和电子设备
US20210099772A1 (en) System and method for verification of video integrity based on blockchain
CN109101964B (zh) 确定多媒体文件中首尾区域的方法、设备及存储介质
CN113821672A (zh) 侵权图片的确定方法及装置
US11714847B2 (en) Methods and apparatus to detect unconfined view media
CN115269910A (zh) 音视频审核方法及系统
CN112597321B (zh) 基于区块链的多媒体处理方法及相关设备
CN111382394A (zh) 一种图片的侵权监控方法及装置
CN109040781A (zh) 视频认证方法、装置、系统、电子设备及可读介质
CN111209733B (zh) 文本记录处理方法及装置
CN110909798A (zh) 一种多算法智能研判方法、系统及服务器
CN116821523B (zh) 一种人员匹配逻辑校验方法、装置、电子设备及存储介质
US20230409658A1 (en) Process and system for automatic forensic acquisition of web page content
KR101081308B1 (ko) 동영상 저작권 위반 판별방법 및 그것을 이용한 동영상 저작권 위반 판별장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination