CN101303734A - 图片检测系统及方法 - Google Patents

图片检测系统及方法 Download PDF

Info

Publication number
CN101303734A
CN101303734A CN 200810125798 CN200810125798A CN101303734A CN 101303734 A CN101303734 A CN 101303734A CN 200810125798 CN200810125798 CN 200810125798 CN 200810125798 A CN200810125798 A CN 200810125798A CN 101303734 A CN101303734 A CN 101303734A
Authority
CN
Grant status
Application
Patent type
Prior art keywords
image
detected
picture
value
blacklist
Prior art date
Application number
CN 200810125798
Other languages
English (en)
Other versions
CN101303734B (zh )
Inventor
付立波
杨干荣
王建宇
波 陈
Original Assignee
腾讯科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Abstract

本发明揭示一种图片检测系统及方法,所述图片检测系统包括:特征数据库,用于存储图片不变特征黑名单;图片匹配模块,用于存储图片黑名单,接收被检测图片并比较所述被检测图片是否与黑名单的图片匹配;图片检测模块,计算所述不匹配的被检测图片的置信值并判断所述被检测图片的置信值是否达到标准;结果处理模块,用于将置信值未达到标准的被检测图片发送人工审核。所述图片检测方法通过步骤:建立图片黑名单;接收被检测图片并比较所述被检测图片是否与黑名单的图片匹配;计算所述不匹配的被检测图片的置信值并判断所述被检测图片的置信值是否达到标准;将置信值未达到标准的被检测图片发送人工检测;实现区分合法图片和非法图片的目的。

Description

图片4全测系统及方法

技术领域

本发明涉及到图片检测领域,特别涉及到 一种图片检测系统及方法。 背景技术

随着互联网信息量的日益丰富,不良信息也越来越多。尤其是非法或不 良图片、视频等富媒体信息,其承载的信息量剧增,但该类富媒体信息绝大 部分为非结构化的内容,难于自动辨识。鉴于该类富媒体信息承载大量的信 息,且有可能涉及国家安全、社会风气和影响青少年身心健康等,有必要对 此类信息在发布时予以审查,而依靠人工审查的方式虽可隔离部分非法或不 良图片、视频,但工作量却极其巨大,且效率较低,阻碍了互联网该类技术 的发展。

现有的网络图片检测方法主要是建立网站URL ( Uniform Resource Locator)黑名单、匹配图片标题关键词等。然而通过建立网站URL黑名单检 测方式存在URL黑名单更新滞后性的不足;而匹配图片标题关键词的技术存 在匹配不可靠、不能适用于Blog相册、BBS和/或Email等用户可主动上传图 片的业务。

另外,现有技术通过肤色检测技术检测色情图片,但是由于人体姿态各 异,棵露皮肤与图片是否为色情也并不完全对应,以肤色检测为基础的色情 图片检测技术目前还比较困难,正常图片被检为色情图片的比例较高。

发明内容

本发明的目的之一为提供一种图片检测系统及方法,可有效地区分非法 与合法图片,提升了图片检测的效率。

本发明提出一种图片检测系统,包括: 特征数据库,用于存储图片不变特征黑名单;

图片匹配模块,接收被检测图片并比较所述被检测图片是否与黑名单的 图片匹配;

图片检测模块,计算所述不匹配的被检测图片的置信值并判断所述被检 测图片的置信值是否达到标准;

结果处理模块,用于将置信值未达到标准的被;险测图片发送人工审核。优选地,所述图片匹配模块包括:特征获取单元和比较匹配单元,分别用于接收被检测图片、获取被检测图片不变特征及比较所述获取的被^r测图片不变特征是否与黑名单的图片不 变特征匹配,以区分合法和非法图片。 优选地,所述特征获取单元包括:接收组件和获取组件,分别用于选择接收被检测图片及获取所接收被检 测图片的图片不变特征。优选地,所述图片不变特征包括: 图片MD5值、图片特性或图片特性MD5值。 优选地,所述比较匹配单元包括:第一比较组件和第二比较组件,分别用于比较图片MD5值是否与黑名单 的图片MD5值匹配及比较图片特性MD5值是否与黑名单的图片特性MD5值匹配。优选地,所述图片检测模块包括:检测单元和置信值判断单元,分别用于计算所述不匹配的被检测图片的 置信值及判断所述被才佥测图片的置信值是否达到标准。本发明图片检测系统,通过匹配检测、图片检测和发送人工审核的方式, 将非法图片与合法图片有效区分。本发明还提出一种图片检测方法,包括步骤: 建立图片黑名单;接收被^f企测图片并比较所述被检测图片是否与黑名单的图片匹配; 计算所述不匹配的被检测图片的置信值并判断所述被检测图片的置信值 是否达到标准;将置信值未达到标准的被检测图片发送人工检测。 优选地,所述建立图片黑名单步骤包括: 建立图片不变特征黑名单。优选地,所述接收被检测图片并比较所述被检测图片是否与黑名单的图 片匹配的步骤包括:获取所接收被检测图片的图片不变特征。优选地,所述获取所接收被4企测图片的图片不变特征步骤包括: 获取图片MD5值、获取图片特性或获取图片特性MD5值。 本发明图片检测方法,通过匹配检测、图片检测和发送人工审核的方式, 将非法图片与合法图片有效区分。本发明还提出一种图片匹配检测装置,包括:

特征数据库,用于存储图片不变特征名单;

特征获取模块,用于接收被检测图片,并获取被检测图片不变特征; 比较匹配模块,用于比较所述获取的被检测图片的图片不变特征是否与 名单的图片不变特征匹配,以区分合法和非法图片。 优选地,所述特征获取模块包括:

接收单元和获取单元,分别用于选择接收被检测图片及获取所接收被检 测图片的图片不变特征。

优选地,所述图片不变特征包括: 图片MD5值、图片特性或图片特性MD5值。 优选地,所述比较匹配模块包括:

第 一比较单元和第二比较单元,分别用于比较被检测图片的图片MD5值 是否与黑名单的图片MD5值匹配及比较被检测图片的图片特性MD5值是否与 黑名单的图片特性MD5值匹配。

本发明通过匹配检测,快速区分非法图片与合法图片。

附图说明

图l是本发明第一实施例图片检测系统结构示意图; 图2是本发明第二实施例图片检测系统结构示意图; 图3是本发明第三实施例图片检测方法流程示意图; 图4是本发明第四实施例图片检测方法流程示意图; 图5是本发明第五实施例图片匹配检测装置结构示意图; 图6是本发明第六实施例图片匹配检测装置结构示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步 说明。

具体实施方式

本发明提供一种图片检测系统,通过将图片与已有数据进行比较、对图 片进行辨识和发送人工审核的方式,有效地区分合法图片与非法图片。 本发明提出第一实施例,请参阅图l,所述图片检测系统包括: 特征数据库100,存储图片不变特征黑名单;

图片匹配模块IO,接收被检测图片,比较所述接收的被检测图片是否与 黑名单的图片匹配;

图片检测模块ll,与图片匹配模块10连接,计算不匹配图片的置信值,根据所述置信值判断图片是否达到既定标准;结果处理模块12,与图片检测模块ll连接,将置信值未达到既定标准的图片发送人工审核。本实施例所述的被检测图片包括合法图片和非法图片,所述非法图片包 括政治类图片、色情类图片、有伤社会风化或社会公德类图片、涉及国家安 全类图片、恶搞类图片等,还包括图片检测系统自定义的非法图片等。本实施例所述图片检测系统,通过图片匹配模块IO、图片检测模块ll和 结果处理模块12对所接收的被检测图片进行检测,将非法图片与合法图片进 行有效区分。基于上述实施例,本发明提出第二实施例。请参阅图2,本实例图片检测 系统包括:特征数据库100,存储图片不变特征黑名单;所述图片不变特征包括图片 MD5 ( Message-Digest Algorithm 5,信息-摘要算法)值、图片特性和/或图片 特性MD5值等;所述不变特征黑名单可以包括图片MD5值黑名单和图片特性 MD5值黑名单;图片匹配模块IO,接收被检测图片,比较所述接收的被检测图片是否与 所述图片特征黑名单的图片匹配;其中,该图片匹配模块10包括特征获取单 元101和比较匹配单元102。所述特征获取单元101用于接收被检测图片、获取 图片不变特征;所述比较匹配单元102用于比较所述获取的被检测图片不变特 征是否与黑名单的图片不变特征匹配;图片检测模块ll,与所述图片匹配模块10连接,该图片检测模块ll包括 -险测单元110和置信值判断单元111;所述检测单元110用于计算所述不匹配图 片的置信值,所述置信值判断单元lll用于判断所述被检测图片的置信值是否 达到标准。、,, 、;,—,' :, ,1011;所述接收组件1010用于接收被检测图片,所述获取组件1011用于获取 所述被检测的图片不变特征。所述比较匹配单元102包括第一比较组件1020和 第二比较组件1021;所述第一比较组件1020用于比较图片的MD5值是否与黑 名单的图片MD5值匹配;所述第二比较组件1021用于比较图片特性MD5值是 否与黑名单的图片特性MD5值匹配。本实施例以对网络相册的上传图片进行才企测为例,进一步对本发明的图 片^f企测系统进行说明。网络相册用户在相册中上传图片,需要经过本实施例所述图片检测系统检测后,才能被所述网络相册浏览者浏览。

本实施例对网络相册上传图片的检测可以分为实时审核、旁路审核和人

工审核;所述实时审核是对有实时性要求的上传图片快速地进行审核,不使 上传图片在检测中产生较大延时,及时上传所需要显示的上传图片;所述旁 路审核是对所述实时审核不能确定审核结果和无实时性要求的上传图片,进 行的审核;所述人工审核是对所述旁路审核不能确定结果的上传图片,进行 的审核。

本实施例所述实时审核,可以利用所述图片MD5值黑名单,进行图片MD5 值匹配,匹配成功,则判定所述上传图片为非法图片,反之,进行下一步审 核;所述旁路审核,可以利用所述图片特性MD5值,进行图片特性MD5值匹 配,匹配成功,则判定所述上传图片为非法图片,反之进行基于肤色检测的 色情图片识别技术的置信值判断,分辨出可信任、不信任和可疑图片;所述 人工审核,是由人工对所述可疑图片进行审核。

所述上传图片在所述图片检测系统的检测中为被检测图片。

本实施例图片检测系统的特征数据库100,累积存储有非法图片的图片不 变特征,建立图片不变特征黑名单。所述图片不变特征黑名单可以是基于图 片内容的图片MD5值黑名单和基于图片特性内容的图片特性MD5值,并可在 所述图片不变特征黑名单建立HASH (散列)索引,以便于加快查找速度。

对有实时性要求的被检测图片进行实时审核,此实时审核是通过所述接 收组件1010接收所述有实时性要求的被检测图片,由所述获取组件1011获取 所述被检测图片的图片MD5值,利用所述第 一比较组件1020进行检测。

所述第一比较组件1020将被检测图片的图片MD5值与MD5值黑名单中的 MD5值进行匹配;如果匹配成功,则判定所述净皮^r测图片为非法图片,禁止 所述被检测图片上传至网络相册;反之,将所述被检测图片存储至所述系统 的临时数据库中,等待下一步审核。

对第 一比较组件1020匹配不成功和无实时性要求的被检测图片进行旁路 审核,此旁路审核是通过所述接收组件1010接收所述第一比较组件1020匹配 不成功和无实时性要求的被检测图片,由所述获取组件1011获取所述被检测 图片的图片特性MD5值,利用所述第二比较组件1021和图片检测模块ll进行 检测。其中,所述第一比较组件1020匹配不成功的被检测图片可优先进行检 测。

对于无实时性要求的被检测图片,所述接收组件1010可根据优先级选择 接收用户上传的图片,所述优先级选择是指将历史记录较差的用户确定为较 高优先级而予以优先审核。而如果是对网络上已有图片进行审核,则可根据 单个图片最近一段时间的浏览次数设定不同的优先级。接收所述净皮^r测图片后,通过获取组件1011获if又所述被才企测图片的图片MD5值。在实际的网络传输中,所述被检测图片因重复传阅而有部分失真或被加 工,例如大小缩放、截去或者添加边框、加水印和/或色度亮度对比度调整等, 使得被检测图片的图片MD5值被改变,上述被检测图片的原图片MD5值的匹 配方式将会失效,不能检测出经过加工或失真的非法图片。因此,可以通过 所述第二比较组件1021对此类失真或被加工的图片进行;险测。由于每一图片中都存在某些特性,能像人体指紋一样具有唯一性,因此, 可以先对待检测图像按等方向比标准化到一个预先设定的大小,然后进行 Canny边缘检测(一种边缘检测的算法),提取出图像中主要的连续边缘,然 后计算边缘点集合的矩不变量(Moment Invariants )等,作为被加工图片的图 片特性,并计算所述矩不变量的整数编码的MD5值,建立图片特性的MD5值 黑名单。利用所述第二比较组件1021,进行图片特性MD5值匹配,需要先通过所 述接收组件1010在所述临时数据库中按照所述优先级选择接收图片;再由所 述获取组件1011提取所接收图片的图片特性,并计算获取图片特性MD5值; 所述第二比较组件1021将被检测图片的图片特性MD5值与图片特性MD5值黑 名单中的图片特性MD5值进行匹配;如果匹配成功,判定所述被检测图片为 非法图片,禁止所述被检测图片上传网络相册;反之,进行色情图片检测。所述图片检测模块l 1,通过图片检测技术对所述图片特性MD5值匹配不 成功的被检测图片进行检测,可区分合法图片和非法图片,此处以区分非色 情图片和色情图片为例。其中,所述检测单元IIO,用于检测所述图片特性MD5值匹配不成功的被 检测图片,并计算所述被检测图片的置信值。此置信值计算是基于肤色检测 的色情图片识别技术进行,在此不作赘述。所述置信值判断单元lll,与所述检测单元110连接,判断所述被检测图片 的置信值是否达到标准。所述置信值为一标准数值,被;险测图片置信值越大 说明被检测图片为色情图片的可能性越大。所述标准可分为信任、不信任和 可疑,比如,当被检测图片所述置信值小于50,则此被^r测图片为可信任图 片,即非色情图片,允许此被检测图片上传网络相册;当被检测图片所述置 信值大于90,则所述被检测图片为不可信任图片,即色情图片,禁止该被检 测图片上传至网络相册;当^U企测图片所述置信值小于等于90大于等于50, 则此被;f企测图片为可疑图片,即为未达到标准图片,无法判定其为色情或非 色情图片,需要进行人工审核。本实施例所述结果处理模块12,可将所述经图片检测模块11判定为可疑 的被检测图片发送至人工检测平台13,进行人工审核,由人工区分合法图片和非法图片,并将所述合法图片和非法图片分别返回所述图片检测系统。

本实施例所述图片检测系统还包括增量训练模块15,与所述图片检测模 块ll连接,分别接收人工审核为合法图片和非法的图片,提取所述被检测图 片的图片特征对所述图片检测模块ll进行增量训练,增强所述图片检测模块 ll的检测能力。

本实施例所述图片检测系统还包括增量学习模块14 ,获取所述色情图片 的不变特征,以添加至所述特征数据库100。此增量学习模块14还可接收人工 检测平台13发送的非法图片,并获取所述非法图片的图片MD5值及图片特性 MD5值,分別将所述非法图片的图片MD5值和图片特性MD5值增加至所述图 片MD5值黑名单和图片特性MD5值黑名单,以加强所述图片匹配模块10的检 测效果。

本实施例图片检测系统是针对单个图片进行检测,其还可以应用于对已 有网站上图片进行的检测,当检测到网站已有图片为非法图片,通过在图片 检测系统中设置删除功能,将所述图片删除,维护网络环境;所述图片检测 系统,还可以应用于对网络中传递的图片进行的检测,即时截获传输中的图 片,及时禁止非法图片传输;且所述图片检测系统,还可以应用于本地图片 的斗企测,清理本地图片中的非法图片。

本实施例图片检测系统,首先通过图片匹配模块10的非法图片不变特征 黑名单,对被检测图片进行非法图片过滤检测,快速过滤掉存在于所述黑名 单中的非法图片,节省检测时间;然后利用图片检测模块ll检测经过上述过 滤检测的被检测图片,检测出其中的色情图片;再是由结果处理模块12将图 片检测模块1 l检测为可疑的图片发送人工审核;本实施例图片检测系统可有 效将合法图片和非法图片区分,节省大量人工审核的时间,维护良好的网络 环境。

本发明提出第三实施例,提供一种图片检测方法。请参阅图3,所述方法 包括步骤:

510, 建立图片黑名单;

511, 接收被检测图片并比较所述被^r测图片是否与图片黑名单的图片匹 配,以区分合法图片和非法图片;

S12,计算所述不匹配被检测图片的置信值并判断所述被检测图片的置信 值是否达到标准;

S13 ,将置信值未达到标准的被检测图片设置为非法图片或者发送给人工检测。

本实施例所述的被检测图片包括合法图片和非法图片,所述非法图片包括政治类图片、色情类图片、有伤社会风化或社会公德类图片、涉及国家安 全类图片、恶搞类图片等,还包括图片检测系统自定义的非法图片等。

本实施例所述图片检测方法,通过匹配检测、色情图片检测和发送人工 审核的方式,将非法图片与合法图片有效区分。

基于上述实施例,本发明提出第四实施例。请参阅图4,本实施例图片检

测方法,包括步骤:

S100,建立图片MD5值黑名单和图片特性MD5值黑名单;

SllO,接收被检测图片并获取所接收被检测图片的图片MD5值;

S111 ,比较所述被检测图片的图片MD5值是否与黑名单的图片MD5值匹

配;

S112,获取不匹配被检测图片的图片特性MD5值;

Sl 13,比较所述净皮^r测图片的图片特性MD5值是否与黑名单的图片特性 MD5^f直匹配;

S120,计算不匹配^皮检测图片的置信值;

S121,判断所述被才企测图片的置信值是否达到标准;

S130,将置信值未达到标准的被^r测图片设置为非法图片或者发送给人 工检测。

如步骤S100所述,所述被检测图片不变特征黑名单至少包括图片MD5值 黑名单和图片特性MD5值黑名单。将所积累的非法图片的图片MD5值和图片 特性MD5值组合建立图片MD5值黑名单和图片特性MD5值黑名单,并在所述 黑名单建立HASH索引,以便于加快查找速度。

对有实时性要求的被检测图片进行实时审核,此实时审核是通过接收所 述有实时性要求的被检测图片,获取所述被检测图片的图片MD5值,利用所 述步骤S 110和S111进4亍图片MD5值匹配4企测。

如步骤S110所述,所述图片不变特征包括图片MD5值、图片特性或图片 特性MD5值等。在此处,可以利用MD5算法基于图片内容计算获取被检测图 片MD5值。

如步骤S111所述,将所述获^l的所述^^佥测图片的图片MD5值与所述黑 名单图片MD5值进行匹配;如匹配成功,所述被检测图片将被判定为非法图 片;如匹配不成功,对所述图片进行下一步检测。

对图片MD5值匹配不成功和无实时性要求的被检测图片进行旁路审核, 此旁路审核是通过接收所述图片MD5值匹配不成功和无实时性要求的^皮;险测 图片,获取所述被检测图片的图片特性MD5值,利用所述所述步骤S112至步 骤S121进行图片特性MD5值匹配和置信值判断检测。其中,所述对图片MD5值匹配不成功的净皮4全测图片可优先进行检测。

如步骤S112所述,先对待检测图像按等方向比标准化到一个预先设定的

大小,然后进行Ca皿y边缘检测(一种边缘检测的算法),提取出图像中主要 的连续边缘,然后计算边缘点集合的矩不变量(Moment Invariants )等,作为 被加工图片的图片特性,再计算所述矩不变量的整数编码的MD5值,作为图 片特性MD5值。

如步骤S113所述,将所述提取的所述被检测图片的图片特性MD5值与所 述黑名单的图片特性MD5值进行匹配;如匹配成功,所述被检测图片将被判 定为非法图片;如匹配不成功,对所述被检测图片进行下一步检测。

如步骤S 120所述,利用现有技术中基于肤色检测的色情图片识别技术, 检测所述图片特性MD5值匹配不成功的被检测图片,并计算所述被检测图片 的置信值。

如步骤S121所述,判断所述被检测图片的置信值是否达到标准。所述置 信值为一标准数值,被检测图片置信值越大说明被检测图片为色情图片的可 能性越小。所述标准可分为信任、不信任和可疑,比如,当被检测图片所述 置信值小于50,则此被检测图片为可信任图片,即非色情图片,允许此被检 测图片上传至网络相册;当被检测图片所述置信值大于90,则所述被检测图 片为不可信任图片,即色情图片,禁止该被检测图片上传至网络相册;当被 检测图片所述置信值小于等于90大于等于50,则此被^r测图片为可疑图片, 即为未达到标准图片,无法判定其为色情或非色情图片,需要进行人工审核。

如步骤S130所述,可将所述可疑图片交付人工审核,由人工区分合法图 片和非法图片。

本实施例所述图片4企测方法,可以通过分别^^收人工审核为合法和非法 的图片,提取所述被检测图片的图片特征对所述色情图片检测进行训练,增 强所述色情图片检测的检测能力。

本实施例所述图片检测方法,还可以获取所述色情图片的图片MD5值和 色情图片的图片特性MD5值,分别添加至所述图片MD5值黑名单和图片特性 MD5值黑名单;还可以接收人工审核为非法的被检测图片,并获取非法图片 的图片MD5值及图片特性MD5值,分别添加至所述图片MD5值黑名单和图片 特性MD5值黑名单,以加强所述图片匹配检测的检测效果。

本实施例,首先通过非法图片不变特征黑名单,快速过滤掉存在于所述 黑名单中的非法图片,节省^r测时间;然后利用计算^^企测图片置信值的方 式,区分出信任图片、色情图片和可疑图片;再是将可疑图片发送人工审核; 本实施例图片检测方法可有效将合法图片和非法图片区分,节省大量人工审 核的时间,维护良好的网络环境。本发明提出第五实施例,提供一种图片匹配装置20,可对图片进行^r测,

快速分离出非法图片。

请参阅图5,所述图片匹配装置20包括:

特征数据库IOO,存储图片不变特征名单;通过积累存储图片不变特征, 建立图片不变特征的名单。本实施例的所述名单可为白名单或黑名单;白名 单为合法图片名单,黑名单可为非法图片名单;

特征获取模块201 ,接收被检测图片,获取被检测图片的图片不变特征; 所述图片不变特征是所述图片的特征中相对其他图片是唯一的;

比较匹配模块202,分别与所述特征获取模块201和特征数据库IOO相连 接,比较所述获取的被检测图片的图片不变特征是否与名单的图片不变特征 匹配,以区分合法和非法图片;如果所述图片不变特征的名单为黑名单,将 所述获取的被检测图片的图片不变特征与所述黑名单的图片不变特征进行匹 配比较;如果所述获取的被4企测图片的图片不变特征与所述黑名单的图片不 变特征相匹配,则判定被检测的图片为非法图片;反之,所述被检测的图片 为合法图片。

如果所述图片不变特征的名单为白名单,同样将所述获取的被检测图片 的图片不变特征与所述白名单的图片不变特征进行匹配比较;相匹配,则判 定被检测图片为合法图片;反之,所述被检测图片为非法图片。

本实施例所述的被检测图片包括合法图片和非法图片,所述非法图片包 括政治类图片、色情类图片、有伤社会风化或社会公德类图片、涉及国家安 全类图片、恶搞类图片等,还包括图片检测系统自定义的非法图片等。

本实施例所述图片匹配装置20,通过比较被^r测图片的图片不变特征是 否与所述黑名单的图片不变特征匹配,而将非法图片与合法图片合理区分。

基于上述实施例,本发明提出第六实施例。请参阅图6,提供一种图片匹 配装置20,可快速匹配检测出非法图片。所述图片匹配装置包括: 特征数据库IOO,存储图片不变特征名单;

特征获取模块201,接收被检测图片,获取被检测图片的图片不变特征; 其中,所述特征获ip^莫块201包括接收单元2010和获耳又单元2011;所述接收单 元2010用于选择接收被检测图片,所述获取单元2011用于获取所接收被检测 图片的图片不变特征。

比4交匹配模块202,分别与所述特征获取模块201和特征数据库IOO相连 接,比较所述获取的被检测图片的图片不变特征是否与名单的图片不变特征 匹配,以区分合法和非法图片;其中,所述比较匹配模块202包括第一比较单元2020和第二比较单元2021;所述第 一比较单元2020用于比较被检测图片的 图片MD5值是否与黑名单的图片MD5值匹配,所述第二比较单元2021用于比 较^^企测图片的图片特性MD5值是否与黑名单的图片特性MD5值匹配。

本实施例还是以网络相册图片上传为例,可通过本图片匹配装置20快速 对用户上传图片进行匹配检测。

本实施例图片匹配装置20的特征数据库100,累积存储有非法图片的图片 不变特征,建立图片不变特征黑名单。所述图片不变特征包括图片MD5值、 图片特性和/或图片特性MD5值等。所述图片不变特征黑名单可以是基于图片 内容的MD5值黑名单,并可在所述图片不变特征黑名单建立HASH(散列)索 引,以便于加快查找速度。

其中,所述接收单元2010可根据优先级选择接收用户上传的图片,所述 优先级选择是指将历史记录较差的用户确定为较高优先级而予以优先审核。 而如果是对网络上已有图片进行审核,则可根据单个图片最近一段时间的浏 览次数设定不同的优先级。接收所述被检测图片后,通过获取单元2011获取 所述净皮^^测图片的图片MD5值。

所述第 一比较单元2020将被^r测图片的图片MD5值与MD5值黑名单中的 MD5值进行匹配;如果匹配成功,则判定所述被检测图片为非法图片,禁止 所述被检测图片上传至网络相册;反之,将所述被检测图片存储至所述系统 的临时数据库中,等待下一步审核。

在实际的网络传输中,所述一皮检测图片因重复传阅而有部分失真或被加 工,例如大小缩放、截去或者添加边框、加水印和/或色度亮度对比度调整等, 使得被检测图片的图片MD5值被改变,上述被检测图片的原图片MD5值的匹 配方式将会失效,不能检测出经过加工或失真的非法图片。因此,可以通过 所述第二比较单元2021对此类失真或一皮加工的图片进行4企测。

由于每一图片中都存在某些特性,能像人体指紋一样具有唯一性,因此, 可以先对待检测图像按等方向比标准化到一个预先设定的大小,然后进行 Ca皿y边缘检测(一种边缘检测的算法),提取出图像中主要的连续边缘,然 后计算边缘点集合的矩不变量(Moment Invariants )等,作为被加工图片的图 片特性,并计算所述矩不变量的整it编码的MD5值,建立图片特性的MD5值 黑名单。

利用所述第二比较单元2021,进行图片特性MD5值匹配,需要先通过所 述接收单元2010在所述临时数据库中按照所述优先级选择接收图片;再由所 述获取单元2011提取所接收图片的图片特性,并计算获取图片特性MD5值; 所述第二比较单元2021将被检测图片的图片特性MD5值与图片特性MD5值黑名单中的图片特性MD5值进行匹配;如果匹配成功,判定所述被检测图片为 非法图片,禁止所述被检测图片上传网络相册;反之,再使用其他方式检测, 或允许上传网络相册。

本实施例图片匹配装置20,还可以应用于对已有网站上图片的4企测和/或 网络中传递的图片的检测及本地图片的检测等可针对单个图片进行的检测。

本实施例图片匹配装置20,首先通过特征数据库100的非法图片不变特征 黑名单,对被检测图片进行非法图片过滤检测,快速过滤掉存在于所述黑名 单中的非法图片;本实施例图片匹配装置20可快速将合法图片和非法图片区 分,节省大量人工审核的时间,维护良好的网络环境。

以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围, 凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接 或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (18)

1、一种图片检测系统,其特征在于,包括: 特征数据库,用于存储图片不变特征黑名单; 图片匹配模块,接收被检测图片并比较所述被检测图片是否与黑名单的图片匹配; 图片检测模块,计算所述不匹配的被检测图片的置信值并判断所述被检测图片的置信值是否达到标准; 结果处理模块,用于将置信值未达到标准的被检测图片发送人工审核。
2、 根据权利要求l所述的图片检测系统,其特征在于,所述图片匹配模 块包括:特征获取单元和比较匹配单元,分别用于接收被检测图片、获取被检测 图片不变特征及比较所述获取的被检测图片不变特征是否与黑名单的图片不 变特征匹配,以区分合法和非法图片。
3、 根据权利要求2所述的图片检测系统,其特征在于,所述特征获取单 元包括:接收组件和获取组件,分别用于选择接收被检测图片及获取所接收被检 测图片的图片不变特征。
4、 根据权利要求2所述的图片检测系统,其特征在于,所述图片不变特 征包括:图片MD5值、图片特性或图片特性MD5值。
5、 根据权利要求4所述的图片检测系统,其特征在于,所述比较匹配单 元包括:第 一比较组件和第二比较组件,分别用于比较图片MD5值是否与黑名单 的图片MD5值匹配及比较图片特性MD5值是否与黑名单的图片特性MD5值匹配。
6、 根据权利要求l所述的图片检测系统,其特征在于,所述图片检测模 块包括:检测单元和置信值判断单元,分别用于计算所述不匹配的被检测图片的 置信值及判断所述被检测图片的置信值是否达到标准。
7、 根据权利要求6所述的图片检测系统,其特征在于: 所述标准分为信任、不信任和可疑。
8、 根据权利要求7所述的图片检测系统,其特征在于: 所述置信值未达到标准的被检测图片是判定标准为可疑的图片。
9、 根据权利要求8所述的图片检测系统,其特征在于,还包括: 增量学习模块,获取所述标准为不信任图片和人工审核所发送非法图片的图片不变特4i,添加至所述特征^t据库。
10、 根据权利要求l所述的图片检测系统,其特征在于,还包括: 增量训练模块,分别接收人工检测平台所发送的合法和非法图片,对所述图片检测模块进行检测能力增强训练。
11、 一种图片检测方法,其特征在于,包括步骤: 建立图片黑名单;接收被4企测图片并比较所述被检测图片是否与黑名单的图片匹配; 计算所述不匹配的被;险测图片的置信值并判断所述被;险测图片的置信值 是否达到标准;将置信值未达到标准的被检测图片发送人工检测。
12、 根据权利要求ll所述的图片检测方法,其特征在于,所述建立图片 黑名单步骤包括:建立图片不变特征黑名单。
13、 根据权利要求ll所述的图片检测方法,其特征在于,所述接收被检 测图片并比较所述被检测图片是否与黑名单的图片匹配的步骤包括:获取所接收被检测图片的图片不变特征。
14、 根据权利要求13所述的图片检测方法,其特征在于,所述获取所接 收净皮^r测图片的图片不变特征步骤包括:获取图片MD5值、获取图片特性或获取图片特性MD5值。
15、 一种图片匹配检测装置,其特征在于,包括:特征数据库,用于存储图片不变特征名单;特征获f^莫块,用于接收被检测图片,并获取被检测图片不变特征;比较匹配模块,用于比较所述获取的被检测图片的图片不变特征是否与 名单的图片不变特征匹配,以区分合法和非法图片。
16、 根据权利要求15所述的图片匹配检测装置,其特征在于,所述特征 获取模块包括:接收单元和获取单元,分别用于选择接收被检测图片及获取所接收被检 测图片的图片不变特征。
17、 根据权利要求16所述的图片匹配检测装置,其特征在于,所述图片 不变特征包括:图片MD5值、图片特性或图片特性MD5^:。
18、 根据权利要求17所述的图片匹配检测装置,其特征在于,所述比较 匹配模块包括:第一比较单元和第二比较单元,分别用于比较被检测图片的图片MD5值 是否与黑名单的图片MD5值匹配及比较被检测图片的图片特性MD5值是否 与黑名单的图片特性MD5值匹配。
CN 200810125798 2008-06-25 2008-06-25 图片检测系统及方法 CN101303734B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200810125798 CN101303734B (zh) 2008-06-25 2008-06-25 图片检测系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200810125798 CN101303734B (zh) 2008-06-25 2008-06-25 图片检测系统及方法

Publications (2)

Publication Number Publication Date
CN101303734A true true CN101303734A (zh) 2008-11-12
CN101303734B CN101303734B (zh) 2011-06-22

Family

ID=40113633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200810125798 CN101303734B (zh) 2008-06-25 2008-06-25 图片检测系统及方法

Country Status (1)

Country Link
CN (1) CN101303734B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794390A (zh) * 2010-02-24 2010-08-04 北京微智信业科技有限公司 图像指纹提取方法及其设备、信息过滤方法及其系统
CN102314457A (zh) * 2010-06-30 2012-01-11 百度在线网络技术(北京)有限公司 信息自动审核方法与系统
CN102902675A (zh) * 2011-07-26 2013-01-30 腾讯科技(深圳)有限公司 图片内容审核方法和装置
CN103020651A (zh) * 2012-11-27 2013-04-03 华中科技大学 一种微博图片敏感信息检测方法
CN103544482A (zh) * 2013-10-25 2014-01-29 北京奇虎科技有限公司 特征图片的识别方法及装置
CN104331414A (zh) * 2014-09-28 2015-02-04 北京云巢动脉科技有限公司 基于数据块的敏感数据过滤的方法和系统
CN105138867A (zh) * 2014-06-09 2015-12-09 北大方正集团有限公司 图片版权保护的方法和设备
CN105843912A (zh) * 2016-03-24 2016-08-10 新浪网技术(中国)有限公司 文件审核处理方法及装置
CN102314457B (zh) * 2010-06-30 2016-11-30 百度在线网络技术(北京)有限公司 信息自动审核方法与系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794390A (zh) * 2010-02-24 2010-08-04 北京微智信业科技有限公司 图像指纹提取方法及其设备、信息过滤方法及其系统
CN102314457A (zh) * 2010-06-30 2012-01-11 百度在线网络技术(北京)有限公司 信息自动审核方法与系统
CN102314457B (zh) * 2010-06-30 2016-11-30 百度在线网络技术(北京)有限公司 信息自动审核方法与系统
CN102902675A (zh) * 2011-07-26 2013-01-30 腾讯科技(深圳)有限公司 图片内容审核方法和装置
CN103020651A (zh) * 2012-11-27 2013-04-03 华中科技大学 一种微博图片敏感信息检测方法
CN103544482A (zh) * 2013-10-25 2014-01-29 北京奇虎科技有限公司 特征图片的识别方法及装置
CN105138867A (zh) * 2014-06-09 2015-12-09 北大方正集团有限公司 图片版权保护的方法和设备
CN104331414A (zh) * 2014-09-28 2015-02-04 北京云巢动脉科技有限公司 基于数据块的敏感数据过滤的方法和系统
CN105843912A (zh) * 2016-03-24 2016-08-10 新浪网技术(中国)有限公司 文件审核处理方法及装置

Also Published As

Publication number Publication date Type
CN101303734B (zh) 2011-06-22 grant

Similar Documents

Publication Publication Date Title
Seo et al. A robust image fingerprinting system using the Radon transform
Huang et al. Improved DCT-based detection of copy-move forgery in images
US8006314B2 (en) System for identifying content of digital data
US20080289047A1 (en) Anti-content spoofing (acs)
US7451487B2 (en) Fraudulent message detection
US20060031684A1 (en) Fast signal detection and distributed computing in portable computing devices
US20070085710A1 (en) Methods for searching forensic data
US20030061490A1 (en) Method for identifying copyright infringement violations by fingerprint detection
US20090005010A1 (en) Separating Attachments Received from a Mobile Device
US20090013414A1 (en) System and Method for Monitoring Content
US6922781B1 (en) Method and apparatus for identifying and characterizing errant electronic files
US20010027450A1 (en) Method of detecting changed contents
US20130185802A1 (en) Online Fraud Detection Dynamic Scoring Aggregation Systems and Methods
US20030105739A1 (en) Method and a system for identifying and verifying the content of multimedia documents
Tralic et al. CoMoFoD—New database for copy-move forgery detection
US20070085711A1 (en) Systems and methods for enterprise-wide data identification data sharing and management
US20020120849A1 (en) Parallel processing of digital watermarking operations
US20080159632A1 (en) Image detection methods and apparatus
US20120281911A1 (en) Reducing Photo-Tagging Spam
US20080250240A1 (en) Remote Informed Watermark Detection System
US20110029555A1 (en) Method, system and apparatus for content identification
US20040156528A1 (en) Apparatus and method for preventing illegal distribution of digital contents by using a fingerprinting technique
CN101582887A (zh) 安全防护方法、网关设备及安全防护系统
US20120210431A1 (en) Detecting a trojan horse
US20100088522A1 (en) Method and Apparatus for Tamper Proof Camera Logs

Legal Events

Date Code Title Description
C06 Publication
C10 Request of examination as to substance
C41 Transfer of the right of patent application or the patent right
ASS Succession or assignment of patent right

Owner name: SHENZHEN TENCENT COMPUTER SYSTEM CO., LTD.

Free format text: FORMER OWNER: TENCENT TECHNOLOGY (SHENZHEN) CO., LTD.

Effective date: 20090320

C14 Granted