CN101303734B - 图片检测系统及方法 - Google Patents

图片检测系统及方法 Download PDF

Info

Publication number
CN101303734B
CN101303734B CN2008101257987A CN200810125798A CN101303734B CN 101303734 B CN101303734 B CN 101303734B CN 2008101257987 A CN2008101257987 A CN 2008101257987A CN 200810125798 A CN200810125798 A CN 200810125798A CN 101303734 B CN101303734 B CN 101303734B
Authority
CN
China
Prior art keywords
picture
detected
value
blacklist
invariant features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2008101257987A
Other languages
English (en)
Other versions
CN101303734A (zh
Inventor
付立波
王建宇
陈波
杨干荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tencent Computer Systems Co Ltd
Original Assignee
Shenzhen Tencent Computer Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tencent Computer Systems Co Ltd filed Critical Shenzhen Tencent Computer Systems Co Ltd
Priority to CN2008101257987A priority Critical patent/CN101303734B/zh
Publication of CN101303734A publication Critical patent/CN101303734A/zh
Application granted granted Critical
Publication of CN101303734B publication Critical patent/CN101303734B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明揭示一种图片检测系统及方法,所述图片检测系统包括:特征数据库,用于存储图片不变特征黑名单;图片匹配模块,用于存储图片黑名单,接收被检测图片并比较所述被检测图片是否与黑名单的图片匹配;图片检测模块,计算所述不匹配的被检测图片的置信值并判断所述被检测图片的置信值是否达到标准;结果处理模块,用于将置信值未达到标准的被检测图片发送人工审核。所述图片检测方法通过步骤:建立图片黑名单;接收被检测图片并比较所述被检测图片是否与黑名单的图片匹配;计算所述不匹配的被检测图片的置信值并判断所述被检测图片的置信值是否达到标准;将置信值未达到标准的被检测图片发送人工检测;实现区分合法图片和非法图片的目的。

Description

图片检测系统及方法
技术领域
本发明涉及到图片检测领域,特别涉及到一种图片检测系统及方法。
背景技术
随着互联网信息量的日益丰富,不良信息也越来越多。尤其是非法或不良图片、视频等富媒体信息,其承载的信息量剧增,但该类富媒体信息绝大部分为非结构化的内容,难于自动辨识。鉴于该类富媒体信息承载大量的信息,且有可能涉及国家安全、社会风气和影响青少年身心健康等,有必要对此类信息在发布时予以审查,而依靠人工审查的方式虽可隔离部分非法或不良图片、视频,但工作量却极其巨大,且效率较低,阻碍了互联网该类技术的发展。
现有的网络图片检测方法主要是建立网站URL(Uniform ResourceLocator)黑名单、匹配图片标题关键词等。然而通过建立网站URL黑名单检测方式存在URL黑名单更新滞后性的不足;而匹配图片标题关键词的技术存在匹配不可靠、不能适用于Blog相册、BBS和/或Email等用户可主动上传图片的业务。
另外,现有技术通过肤色检测技术检测色情图片,但是由于人体姿态各异,裸露皮肤与图片是否为色情也并不完全对应,以肤色检测为基础的色情图片检测技术目前还比较困难,正常图片被检为色情图片的比例较高。
发明内容
本发明的目的之一为提供一种图片检测系统及方法,可有效地区分非法与合法图片,提升了图片检测的效率。
本发明提出一种图片检测系统,包括:
特征数据库,用于存储图片不变特征黑名单;
图片匹配模块,接收被检测图片并比较所述被检测图片是否与黑名单的图片匹配;
图片检测模块,计算所述不匹配的被检测图片的置信值并判断所述被检测图片的置信值是否达到标准;
结果处理模块,用于将置信值未达到标准的被检测图片发送人工审核。
优选地,所述图片匹配模块包括:
特征获取单元和比较匹配单元,分别用于接收被检测图片、获取被检测图片不变特征及比较所述获取的被检测图片不变特征是否与黑名单的图片不变特征匹配,以区分合法和非法图片。
优选地,所述特征获取单元包括:
接收组件和获取组件,分别用于选择接收被检测图片及获取所接收被检测图片的图片不变特征。
优选地,所述图片不变特征包括:
图片MD5值、图片特性或图片特性MD5值。
优选地,所述比较匹配单元包括:
第一比较组件和第二比较组件,分别用于比较图片MD5值是否与黑名单的图片MD5值匹配及比较图片特性MD5值是否与黑名单的图片特性MD5值匹配。
优选地,所述图片检测模块包括:
检测单元和置信值判断单元,分别用于计算所述不匹配的被检测图片的置信值及判断所述被检测图片的置信值是否达到标准。
本发明图片检测系统,通过匹配检测、图片检测和发送人工审核的方式,将非法图片与合法图片有效区分。
本发明还提出一种图片检测方法,包括步骤:
建立图片黑名单;
接收被检测图片并比较所述被检测图片是否与黑名单的图片匹配;
计算所述不匹配的被检测图片的置信值并判断所述被检测图片的置信值是否达到标准;
将置信值未达到标准的被检测图片发送人工检测。
优选地,所述建立图片黑名单步骤包括:
建立图片不变特征黑名单。
优选地,所述接收被检测图片并比较所述被检测图片是否与黑名单的图片匹配的步骤包括:
获取所接收被检测图片的图片不变特征。
优选地,所述获取所接收被检测图片的图片不变特征步骤包括:
获取图片MD5值、获取图片特性或获取图片特性MD5值。
本发明图片检测方法,通过匹配检测、图片检测和发送人工审核的方式,将非法图片与合法图片有效区分。
本发明还提出一种图片匹配检测装置,包括:
特征数据库,用于存储图片不变特征名单;
特征获取模块,用于接收被检测图片,并获取被检测图片不变特征;
比较匹配模块,用于比较所述获取的被检测图片的图片不变特征是否与名单的图片不变特征匹配,以区分合法和非法图片。
优选地,所述特征获取模块包括:
接收单元和获取单元,分别用于选择接收被检测图片及获取所接收被检测图片的图片不变特征。
优选地,所述图片不变特征包括:
图片MD5值、图片特性或图片特性MD5值。
优选地,所述比较匹配模块包括:
第一比较单元和第二比较单元,分别用于比较被检测图片的图片MD5值是否与黑名单的图片MD5值匹配及比较被检测图片的图片特性MD5值是否与黑名单的图片特性MD5值匹配。
本发明通过匹配检测,快速区分非法图片与合法图片。
附图说明
图1是本发明第一实施例图片检测系统结构示意图;
图2是本发明第二实施例图片检测系统结构示意图;
图3是本发明第三实施例图片检测方法流程示意图;
图4是本发明第四实施例图片检测方法流程示意图;
图5是本发明第五实施例图片匹配检测装置结构示意图;
图6是本发明第六实施例图片匹配检测装置结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
本发明提供一种图片检测系统,通过将图片与已有数据进行比较、对图片进行辨识和发送人工审核的方式,有效地区分合法图片与非法图片。
本发明提出第一实施例,请参阅图1,所述图片检测系统包括:
特征数据库100,存储图片不变特征黑名单;
图片匹配模块10,接收被检测图片,比较所述接收的被检测图片是否与黑名单的图片匹配;
图片检测模块11,与图片匹配模块10连接,计算不匹配图片的置信值,根据所述置信值判断图片是否达到既定标准;
结果处理模块12,与图片检测模块11连接,将置信值未达到既定标准的图片发送人工审核。
本实施例所述的被检测图片包括合法图片和非法图片,所述非法图片包括政治类图片、色情类图片、有伤社会风化或社会公德类图片、涉及国家安全类图片、恶搞类图片等,还包括图片检测系统自定义的非法图片等。
本实施例所述图片检测系统,通过图片匹配模块10、图片检测模块11和结果处理模块12对所接收的被检测图片进行检测,将非法图片与合法图片进行有效区分。
基于上述实施例,本发明提出第二实施例。请参阅图2,本实例图片检测系统包括:
特征数据库100,存储图片不变特征黑名单;所述图片不变特征包括图片MD5(Message-Digest Algorithm 5,信息-摘要算法)值、图片特性和/或图片特性MD5值等;所述不变特征黑名单可以包括图片MD5值黑名单和图片特性MD5值黑名单;
图片匹配模块10,接收被检测图片,比较所述接收的被检测图片是否与所述图片特征黑名单的图片匹配;其中,该图片匹配模块10包括特征获取单元101和比较匹配单元102。所述特征获取单元101用于接收被检测图片、获取图片不变特征;所述比较匹配单元102用于比较所述获取的被检测图片不变特征是否与黑名单的图片不变特征匹配;
图片检测模块11,与所述图片匹配模块10连接,该图片检测模块11包括检测单元110和置信值判断单元111;所述检测单元110用于计算所述不匹配图片的置信值,所述置信值判断单元111用于判断所述被检测图片的置信值是否达到标准。
在本实施例中,所述特征获取单元101包括接收组件1010和获取组件1011;所述接收组件1010用于接收被检测图片,所述获取组件1011用于获取所述被检测的图片不变特征。所述比较匹配单元102包括第一比较组件1020和第二比较组件1021;所述第一比较组件1020用于比较图片的MD5值是否与黑名单的图片MD5值匹配;所述第二比较组件1021用于比较图片特性MD5值是否与黑名单的图片特性MD5值匹配。
本实施例以对网络相册的上传图片进行检测为例,进一步对本发明的图片检测系统进行说明。
网络相册用户在相册中上传图片,需要经过本实施例所述图片检测系统检测后,才能被所述网络相册浏览者浏览。
本实施例对网络相册上传图片的检测可以分为实时审核、旁路审核和人工审核;所述实时审核是对有实时性要求的上传图片快速地进行审核,不使上传图片在检测中产生较大延时,及时上传所需要显示的上传图片;所述旁路审核是对所述实时审核不能确定审核结果和无实时性要求的上传图片,进行的审核;所述人工审核是对所述旁路审核不能确定结果的上传图片,进行的审核。
本实施例所述实时审核,可以利用所述图片MD5值黑名单,进行图片MD5值匹配,匹配成功,则判定所述上传图片为非法图片,反之,进行下一步审核;所述旁路审核,可以利用所述图片特性MD5值,进行图片特性MD5值匹配,匹配成功,则判定所述上传图片为非法图片,反之进行基于肤色检测的色情图片识别技术的置信值判断,分辨出可信任、不信任和可疑图片;所述人工审核,是由人工对所述可疑图片进行审核。
所述上传图片在所述图片检测系统的检测中为被检测图片。
本实施例图片检测系统的特征数据库100,累积存储有非法图片的图片不变特征,建立图片不变特征黑名单。所述图片不变特征黑名单可以是基于图片内容的图片MD5值黑名单和基于图片特性内容的图片特性MD5值,并可在所述图片不变特征黑名单建立HASH(散列)索引,以便于加快查找速度。
对有实时性要求的被检测图片进行实时审核,此实时审核是通过所述接收组件1010接收所述有实时性要求的被检测图片,由所述获取组件1011获取所述被检测图片的图片MD5值,利用所述第一比较组件1020进行检测。
所述第一比较组件1020将被检测图片的图片MD5值与MD5值黑名单中的MD5值进行匹配;如果匹配成功,则判定所述被检测图片为非法图片,禁止所述被检测图片上传至网络相册;反之,将所述被检测图片存储至所述系统的临时数据库中,等待下一步审核。
对第一比较组件1020匹配不成功和无实时性要求的被检测图片进行旁路审核,此旁路审核是通过所述接收组件1010接收所述第一比较组件1020匹配不成功和无实时性要求的被检测图片,由所述获取组件1011获取所述被检测图片的图片特性MD5值,利用所述第二比较组件1021和图片检测模块11进行检测。其中,所述第一比较组件1020匹配不成功的被检测图片可优先进行检测。
对于无实时性要求的被检测图片,所述接收组件1010可根据优先级选择接收用户上传的图片,所述优先级选择是指将历史记录较差的用户确定为较高优先级而予以优先审核。而如果是对网络上已有图片进行审核,则可根据单个图片最近一段时间的浏览次数设定不同的优先级。接收所述被检测图片后,通过获取组件1011获取所述被检测图片的图片MD5值。
在实际的网络传输中,所述被检测图片因重复传阅而有部分失真或被加工,例如大小缩放、截去或者添加边框、加水印和/或色度亮度对比度调整等,使得被检测图片的图片MD5值被改变,上述被检测图片的原图片MD5值的匹配方式将会失效,不能检测出经过加工或失真的非法图片。因此,可以通过所述第二比较组件1021对此类失真或被加工的图片进行检测。
由于每一图片中都存在某些特性,能像人体指纹一样具有唯一性,因此,可以先对待检测图像按等方向比标准化到一个预先设定的大小,然后进行Canny边缘检测(一种边缘检测的算法),提取出图像中主要的连续边缘,然后计算边缘点集合的矩不变量(Moment Invariants)等,作为被加工图片的图片特性,并计算所述矩不变量的整数编码的MD5值,建立图片特性的MD5值黑名单。
利用所述第二比较组件1021,进行图片特性MD5值匹配,需要先通过所述接收组件1010在所述临时数据库中按照所述优先级选择接收图片;再由所述获取组件1011提取所接收图片的图片特性,并计算获取图片特性MD5值;所述第二比较组件1021将被检测图片的图片特性MD5值与图片特性MD5值黑名单中的图片特性MD5值进行匹配;如果匹配成功,判定所述被检测图片为非法图片,禁止所述被检测图片上传网络相册;反之,进行色情图片检测。
所述图片检测模块11,通过图片检测技术对所述图片特性MD5值匹配不成功的被检测图片进行检测,可区分合法图片和非法图片,此处以区分非色情图片和色情图片为例。
其中,所述检测单元110,用于检测所述图片特性MD5值匹配不成功的被检测图片,并计算所述被检测图片的置信值。此置信值计算是基于肤色检测的色情图片识别技术进行,在此不作赘述。
所述置信值判断单元111,与所述检测单元110连接,判断所述被检测图片的置信值是否达到标准。所述置信值为一标准数值,被检测图片置信值越大说明被检测图片为色情图片的可能性越大。所述标准可分为信任、不信任和可疑,比如,当被检测图片所述置信值小于50,则此被检测图片为可信任图片,即非色情图片,允许此被检测图片上传网络相册;当被检测图片所述置信值大于90,则所述被检测图片为不可信任图片,即色情图片,禁止该被检测图片上传至网络相册;当被检测图片所述置信值小于等于90大于等于50,则此被检测图片为可疑图片,即为未达到标准图片,无法判定其为色情或非色情图片,需要进行人工审核。
本实施例所述结果处理模块12,可将所述经图片检测模块11判定为可疑的被检测图片发送至人工检测平台13,进行人工审核,由人工区分合法图片和非法图片,并将所述合法图片和非法图片分别返回所述图片检测系统。
本实施例所述图片检测系统还包括增量训练模块15,与所述图片检测模块11连接,分别接收人工审核为合法图片和非法的图片,提取所述被检测图片的图片特征对所述图片检测模块11进行增量训练,增强所述图片检测模块11的检测能力。
本实施例所述图片检测系统还包括增量学习模块14,获取所述色情图片的不变特征,以添加至所述特征数据库100。此增量学习模块14还可接收人工检测平台13发送的非法图片,并获取所述非法图片的图片MD5值及图片特性MD5值,分别将所述非法图片的图片MD5值和图片特性MD5值增加至所述图片MD5值黑名单和图片特性MD5值黑名单,以加强所述图片匹配模块10的检测效果。
本实施例图片检测系统是针对单个图片进行检测,其还可以应用于对已有网站上图片进行的检测,当检测到网站已有图片为非法图片,通过在图片检测系统中设置删除功能,将所述图片删除,维护网络环境;所述图片检测系统,还可以应用于对网络中传递的图片进行的检测,即时截获传输中的图片,及时禁止非法图片传输;且所述图片检测系统,还可以应用于本地图片的检测,清理本地图片中的非法图片。
本实施例图片检测系统,首先通过图片匹配模块10的非法图片不变特征黑名单,对被检测图片进行非法图片过滤检测,快速过滤掉存在于所述黑名单中的非法图片,节省检测时间;然后利用图片检测模块11检测经过上述过滤检测的被检测图片,检测出其中的色情图片;再是由结果处理模块12将图片检测模块11检测为可疑的图片发送人工审核;本实施例图片检测系统可有效将合法图片和非法图片区分,节省大量人工审核的时间,维护良好的网络环境。
本发明提出第三实施例,提供一种图片检测方法。请参阅图3,所述方法包括步骤:
S10,建立图片黑名单;
S11,接收被检测图片并比较所述被检测图片是否与图片黑名单的图片匹配,以区分合法图片和非法图片;
S12,计算所述不匹配被检测图片的置信值并判断所述被检测图片的置信值是否达到标准;
S13,将置信值未达到标准的被检测图片设置为非法图片或者发送给人工检测。
本实施例所述的被检测图片包括合法图片和非法图片,所述非法图片包括政治类图片、色情类图片、有伤社会风化或社会公德类图片、涉及国家安全类图片、恶搞类图片等,还包括图片检测系统自定义的非法图片等。
本实施例所述图片检测方法,通过匹配检测、色情图片检测和发送人工审核的方式,将非法图片与合法图片有效区分。
基于上述实施例,本发明提出第四实施例。请参阅图4,本实施例图片检测方法,包括步骤:
S100,建立图片MD5值黑名单和图片特性MD5值黑名单;
S110,接收被检测图片并获取所接收被检测图片的图片MD5值;
S111,比较所述被检测图片的图片MD5值是否与黑名单的图片MD5值匹配;
S112,获取不匹配被检测图片的图片特性MD5值;
S113,比较所述被检测图片的图片特性MD5值是否与黑名单的图片特性MD5值匹配;
S120,计算不匹配被检测图片的置信值;
S121,判断所述被检测图片的置信值是否达到标准;
S130,将置信值未达到标准的被检测图片设置为非法图片或者发送给人工检测。
如步骤S100所述,所述被检测图片不变特征黑名单至少包括图片MD5值黑名单和图片特性MD5值黑名单。将所积累的非法图片的图片MD5值和图片特性MD5值组合建立图片MD5值黑名单和图片特性MD5值黑名单,并在所述黑名单建立HASH索引,以便于加快查找速度。
对有实时性要求的被检测图片进行实时审核,此实时审核是通过接收所述有实时性要求的被检测图片,获取所述被检测图片的图片MD5值,利用所述步骤S110和S111进行图片MD5值匹配检测。
如步骤S110所述,所述图片不变特征包括图片MD5值、图片特性或图片特性MD5值等。在此处,可以利用MD5算法基于图片内容计算获取被检测图片MD5值。
如步骤S111所述,将所述获取的所述被检测图片的图片MD5值与所述黑名单图片MD5值进行匹配;如匹配成功,所述被检测图片将被判定为非法图片;如匹配不成功,对所述图片进行下一步检测。
对图片MD5值匹配不成功和无实时性要求的被检测图片进行旁路审核,此旁路审核是通过接收所述图片MD5值匹配不成功和无实时性要求的被检测图片,获取所述被检测图片的图片特性MD5值,利用所述所述步骤S112至步骤S121进行图片特性MD5值匹配和置信值判断检测。其中,所述对图片MD5值匹配不成功的被检测图片可优先进行检测。
如步骤S112所述,先对待检测图像按等方向比标准化到一个预先设定的大小,然后进行Canny边缘检测(一种边缘检测的算法),提取出图像中主要的连续边缘,然后计算边缘点集合的矩不变量(Moment Invariants)等,作为被加工图片的图片特性,再计算所述矩不变量的整数编码的MD5值,作为图片特性MD5值。
如步骤S113所述,将所述提取的所述被检测图片的图片特性MD5值与所述黑名单的图片特性MD5值进行匹配;如匹配成功,所述被检测图片将被判定为非法图片;如匹配不成功,对所述被检测图片进行下一步检测。
如步骤S120所述,利用现有技术中基于肤色检测的色情图片识别技术,检测所述图片特性MD5值匹配不成功的被检测图片,并计算所述被检测图片的置信值。
如步骤S121所述,判断所述被检测图片的置信值是否达到标准。所述置信值为一标准数值,被检测图片置信值越大说明被检测图片为色情图片的可能性越小。所述标准可分为信任、不信任和可疑,比如,当被检测图片所述置信值小于50,则此被检测图片为可信任图片,即非色情图片,允许此被检测图片上传至网络相册;当被检测图片所述置信值大于90,则所述被检测图片为不可信任图片,即色情图片,禁止该被检测图片上传至网络相册;当被检测图片所述置信值小于等于90大于等于50,则此被检测图片为可疑图片,即为未达到标准图片,无法判定其为色情或非色情图片,需要进行人工审核。
如步骤S130所述,可将所述可疑图片交付人工审核,由人工区分合法图片和非法图片。
本实施例所述图片检测方法,可以通过分别接收人工审核为合法和非法的图片,提取所述被检测图片的图片特征对所述色情图片检测进行训练,增强所述色情图片检测的检测能力。
本实施例所述图片检测方法,还可以获取所述色情图片的图片MD5值和色情图片的图片特性MD5值,分别添加至所述图片MD5值黑名单和图片特性MD5值黑名单;还可以接收人工审核为非法的被检测图片,并获取非法图片的图片MD5值及图片特性MD5值,分别添加至所述图片MD5值黑名单和图片特性MD5值黑名单,以加强所述图片匹配检测的检测效果。
本实施例,首先通过非法图片不变特征黑名单,快速过滤掉存在于所述黑名单中的非法图片,节省检测时间;然后利用计算被检测图片置信值的方式,区分出信任图片、色情图片和可疑图片;再是将可疑图片发送人工审核;本实施例图片检测方法可有效将合法图片和非法图片区分,节省大量人工审核的时间,维护良好的网络环境。
本发明提出第五实施例,提供一种图片匹配装置20,可对图片进行检测,快速分离出非法图片。
请参阅图5,所述图片匹配装置20包括:
特征数据库100,存储图片不变特征名单;通过积累存储图片不变特征,建立图片不变特征的名单。本实施例的所述名单可为白名单或黑名单;白名单为合法图片名单,黑名单可为非法图片名单;
特征获取模块201,接收被检测图片,获取被检测图片的图片不变特征;所述图片不变特征是所述图片的特征中相对其他图片是唯一的;
比较匹配模块202,分别与所述特征获取模块201和特征数据库100相连接,比较所述获取的被检测图片的图片不变特征是否与名单的图片不变特征匹配,以区分合法和非法图片;如果所述图片不变特征的名单为黑名单,将所述获取的被检测图片的图片不变特征与所述黑名单的图片不变特征进行匹配比较;如果所述获取的被检测图片的图片不变特征与所述黑名单的图片不变特征相匹配,则判定被检测的图片为非法图片;反之,所述被检测的图片为合法图片。
如果所述图片不变特征的名单为白名单,同样将所述获取的被检测图片的图片不变特征与所述白名单的图片不变特征进行匹配比较;相匹配,则判定被检测图片为合法图片;反之,所述被检测图片为非法图片。
本实施例所述的被检测图片包括合法图片和非法图片,所述非法图片包括政治类图片、色情类图片、有伤社会风化或社会公德类图片、涉及国家安全类图片、恶搞类图片等,还包括图片检测系统自定义的非法图片等。
本实施例所述图片匹配装置20,通过比较被检测图片的图片不变特征是否与所述黑名单的图片不变特征匹配,而将非法图片与合法图片合理区分。
基于上述实施例,本发明提出第六实施例。请参阅图6,提供一种图片匹配装置20,可快速匹配检测出非法图片。所述图片匹配装置包括:
特征数据库100,存储图片不变特征名单;
特征获取模块201,接收被检测图片,获取被检测图片的图片不变特征;其中,所述特征获取模块201包括接收单元2010和获取单元2011;所述接收单元2010用于选择接收被检测图片,所述获取单元2011用于获取所接收被检测图片的图片不变特征。
比较匹配模块202,分别与所述特征获取模块201和特征数据库100相连接,比较所述获取的被检测图片的图片不变特征是否与名单的图片不变特征匹配,以区分合法和非法图片;其中,所述比较匹配模块202包括第一比较单元2020和第二比较单元2021;所述第一比较单元2020用于比较被检测图片的图片MD5值是否与黑名单的图片MD5值匹配,所述第二比较单元2021用于比较被检测图片的图片特性MD5值是否与黑名单的图片特性MD5值匹配。
本实施例还是以网络相册图片上传为例,可通过本图片匹配装置20快速对用户上传图片进行匹配检测。
本实施例图片匹配装置20的特征数据库100,累积存储有非法图片的图片不变特征,建立图片不变特征黑名单。所述图片不变特征包括图片MD5值、图片特性和/或图片特性MD5值等。所述图片不变特征黑名单可以是基于图片内容的MD5值黑名单,并可在所述图片不变特征黑名单建立HASH(散列)索引,以便于加快查找速度。
其中,所述接收单元2010可根据优先级选择接收用户上传的图片,所述优先级选择是指将历史记录较差的用户确定为较高优先级而予以优先审核。而如果是对网络上已有图片进行审核,则可根据单个图片最近一段时间的浏览次数设定不同的优先级。接收所述被检测图片后,通过获取单元2011获取所述被检测图片的图片MD5值。
所述第一比较单元2020将被检测图片的图片MD5值与MD5值黑名单中的MD5值进行匹配;如果匹配成功,则判定所述被检测图片为非法图片,禁止所述被检测图片上传至网络相册;反之,将所述被检测图片存储至所述系统的临时数据库中,等待下一步审核。
在实际的网络传输中,所述被检测图片因重复传阅而有部分失真或被加工,例如大小缩放、截去或者添加边框、加水印和/或色度亮度对比度调整等,使得被检测图片的图片MD5值被改变,上述被检测图片的原图片MD5值的匹配方式将会失效,不能检测出经过加工或失真的非法图片。因此,可以通过所述第二比较单元2021对此类失真或被加工的图片进行检测。
由于每一图片中都存在某些特性,能像人体指纹一样具有唯一性,因此,可以先对待检测图像按等方向比标准化到一个预先设定的大小,然后进行Canny边缘检测(一种边缘检测的算法),提取出图像中主要的连续边缘,然后计算边缘点集合的矩不变量(Moment Invariants)等,作为被加工图片的图片特性,并计算所述矩不变量的整数编码的MD5值,建立图片特性的MD5值黑名单。
利用所述第二比较单元2021,进行图片特性MD5值匹配,需要先通过所述接收单元2010在所述临时数据库中按照所述优先级选择接收图片;再由所述获取单元2011提取所接收图片的图片特性,并计算获取图片特性MD5值;所述第二比较单元2021将被检测图片的图片特性MD5值与图片特性MD5值黑名单中的图片特性MD5值进行匹配;如果匹配成功,判定所述被检测图片为非法图片,禁止所述被检测图片上传网络相册;反之,再使用其他方式检测,或允许上传网络相册。
本实施例图片匹配装置20,还可以应用于对已有网站上图片的检测和/或网络中传递的图片的检测及本地图片的检测等可针对单个图片进行的检测。
本实施例图片匹配装置20,首先通过特征数据库100的非法图片不变特征黑名单,对被检测图片进行非法图片过滤检测,快速过滤掉存在于所述黑名单中的非法图片;本实施例图片匹配装置20可快速将合法图片和非法图片区分,节省大量人工审核的时间,维护良好的网络环境。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (17)

1.一种图片检测系统,其特征在于,包括:
特征数据库,用于存储图片不变特征黑名单;
图片匹配模块,接收被检测图片并比较所述被检测图片的图片不变特性是否与所述黑名单中的图片不变特性匹配;
图片检测模块,计算所述不匹配的被检测图片的置信值并判断所述被检测图片的置信值是否达到标准;
结果处理模块,用于将置信值未达到标准的被检测图片发送人工审核。
2.根据权利要求1所述的图片检测系统,其特征在于,所述图片匹配模块包括:
特征获取单元和比较匹配单元,分别用于接收被检测图片、获取被检测图片不变特征及比较所述获取的被检测图片不变特征是否与黑名单的图片不变特征匹配,以区分合法和非法图片。
3.根据权利要求2所述的图片检测系统,其特征在于,所述特征获取单元包括:
接收组件和获取组件,分别用于选择接收被检测图片及获取所接收被检测图片的图片不变特征。
4.根据权利要求2所述的图片检测系统,其特征在于,所述图片不变特征包括:
图片MD5值、图片特性或图片特性MD5值,所述图片特性通过将被检测图片标准化到预先设定的大小、通过边缘检测提取主要连续边缘、然后计算边缘点集合的矩不变量而获得。
5.根据权利要求4所述的图片检测系统,其特征在于,所述比较匹配单元包括:
第一比较组件和第二比较组件,分别用于比较图片MD5值是否与黑名单的图片MD5值匹配及比较图片特性MD5值是否与黑名单的图片特性MD5值匹配。
6.根据权利要求1所述的图片检测系统,其特征在于,所述图片检测模块包括:
检测单元和置信值判断单元,分别用于计算所述不匹配的被检测图片的置信值及判断所述被检测图片的置信值是否达到标准。
7.根据权利要求6所述的图片检测系统,其特征在于:
所述标准分为信任、不信任和可疑。
8.根据权利要求7所述的图片检测系统,其特征在于:
所述置信值未达到标准的被检测图片是判定标准为可疑的图片。
9.根据权利要求8所述的图片检测系统,其特征在于,还包括:
增量学习模块,获取所述标准为不信任图片和人工审核所发送非法图片的图片不变特征,添加至所述特征数据库。
10.根据权利要求1所述的图片检测系统,其特征在于,还包括:
增量训练模块,分别接收人工检测平台所发送的合法和非法图片,对所述图片检测模块进行检测能力增强训练。
11.一种图片检测方法,其特征在于,包括步骤:
建立图片不变特征黑名单;
接收被检测图片并比较所述被检测图片的图片不变特征是否与所述黑名单中的图片不变特征匹配;
计算所述不匹配的被检测图片的置信值并判断所述被检测图片的置信值是否达到标准;
将置信值未达到标准的被检测图片发送人工检测。
12.根据权利要求11所述的图片检测方法,其特征在于,所述接收被检测图片并比较所述被检测图片是否与黑名单的图片匹配的步骤包括:
获取所接收被检测图片的图片不变特征。
13.根据权利要求12所述的图片检测方法,其特征在于,所述获取所接收被检测图片的图片不变特征步骤包括:
获取图片MD5值、获取图片特性或获取图片特性MD5值,所述图片特性通过将被检测图片标准化到预先设定的大小、通过边缘检测提取主要连续边缘、然后计算边缘点集合的矩不变量而获得。
14.一种图片匹配检测装置,其特征在于,包括:
特征数据库,用于存储图片不变特征名单;
特征获取模块,用于接收被检测图片,并获取被检测图片不变特征;
比较匹配模块,用于比较所述获取的被检测图片的图片不变特征是否与名单的图片不变特征匹配,以区分合法和非法图片。
15.根据权利要求14所述的图片匹配检测装置,其特征在于,所述特征获取模块包括:
接收单元和获取单元,分别用于选择接收被检测图片及获取所接收被检测图片的图片不变特征。
16.根据权利要求15所述的图片匹配检测装置,其特征在于,所述图片不变特征包括:
图片MD5值、图片特性或图片特性MD5值,所述图片特性通过将被检测图片标准化到预先设定的大小、通过边缘检测提取主要连续边缘、然后计算边缘点集合的矩不变量而获得。
17.根据权利要求16所述的图片匹配检测装置,其特征在于,所述比较匹配模块包括:
第一比较单元和第二比较单元,分别用于比较被检测图片的图片MD5值是否与黑名单的图片MD5值匹配及比较被检测图片的图片特性MD5值是否与黑名单的图片特性MD5值匹配。
CN2008101257987A 2008-06-25 2008-06-25 图片检测系统及方法 Active CN101303734B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008101257987A CN101303734B (zh) 2008-06-25 2008-06-25 图片检测系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101257987A CN101303734B (zh) 2008-06-25 2008-06-25 图片检测系统及方法

Publications (2)

Publication Number Publication Date
CN101303734A CN101303734A (zh) 2008-11-12
CN101303734B true CN101303734B (zh) 2011-06-22

Family

ID=40113633

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101257987A Active CN101303734B (zh) 2008-06-25 2008-06-25 图片检测系统及方法

Country Status (1)

Country Link
CN (1) CN101303734B (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101996180A (zh) * 2009-08-12 2011-03-30 升东网络科技发展(上海)有限公司 图片审核过滤系统及方法
CN101794390B (zh) * 2010-02-24 2013-09-25 北京微智信业科技有限公司 图像指纹提取方法及其设备、信息过滤方法及其系统
CN102902675B (zh) * 2011-07-26 2017-10-10 腾讯科技(深圳)有限公司 图片内容审核方法和装置
CN103020651B (zh) * 2012-11-27 2014-03-05 华中科技大学 一种微博图片敏感信息检测方法
CN103544482A (zh) * 2013-10-25 2014-01-29 北京奇虎科技有限公司 特征图片的识别方法及装置
CN105159902A (zh) * 2014-04-04 2015-12-16 卡姆芬德公司 基于优先级的图像处理方法
CA2885858A1 (en) * 2014-04-04 2015-10-04 Bradford A. Folkens Image tagging system
CN105138867A (zh) * 2014-06-09 2015-12-09 北大方正集团有限公司 图片版权保护的方法和设备
CN105404631B (zh) * 2014-09-15 2021-01-29 腾讯科技(深圳)有限公司 图片识别方法和装置
CN104331414A (zh) * 2014-09-28 2015-02-04 北京云巢动脉科技有限公司 基于数据块的敏感数据过滤的方法和系统
CN106557527A (zh) * 2015-09-30 2017-04-05 中兴通讯股份有限公司 一种色情图像检测和系统
CN105843912A (zh) * 2016-03-24 2016-08-10 新浪网技术(中国)有限公司 文件审核处理方法及装置
CN106202404A (zh) * 2016-07-11 2016-12-07 百度在线网络技术(北京)有限公司 用于处理信息的方法和装置
CN108470028B (zh) * 2017-02-23 2020-08-18 北京唱吧科技股份有限公司 一种图片审核方法和装置
CN107256250A (zh) * 2017-06-08 2017-10-17 福建中金在线信息科技有限公司 一种图片处理方法、装置、服务器及存储介质
CN107609082A (zh) * 2017-09-06 2018-01-19 叶进蓉 一种网页中违禁图片检测方法及系统
CN108805069A (zh) * 2018-06-04 2018-11-13 上海东方报业有限公司 影像检测方法及装置
CN109284894A (zh) * 2018-08-10 2019-01-29 广州虎牙信息科技有限公司 图片审核方法、装置、存储介质和计算机设备
CN109597902A (zh) * 2018-12-20 2019-04-09 深圳市丰巢科技有限公司 图片审核方法、装置、设备及存储介质
CN109831698B (zh) * 2018-12-28 2021-07-23 广州华多网络科技有限公司 信息审核方法、装置、电子设备及计算机可读取存储介质
CN111324764B (zh) * 2020-02-18 2023-09-22 北京金山安全软件有限公司 一种图像检测方法、装置、电子设备及存储介质
CN111444362B (zh) * 2020-03-31 2024-04-16 腾讯音乐娱乐科技(深圳)有限公司 恶意图片拦截方法、装置、设备和存储介质
CN111642478B (zh) * 2020-05-19 2022-02-01 重庆赛格盾科技有限公司 一种害虫识别系统
CN115828191A (zh) * 2021-08-31 2023-03-21 广东艾檬电子科技有限公司 一种图片处理方法、网络设备、智能手表及存储介质

Also Published As

Publication number Publication date
CN101303734A (zh) 2008-11-12

Similar Documents

Publication Publication Date Title
CN101303734B (zh) 图片检测系统及方法
US20130011007A1 (en) Using camera signatures from uploaded images to authenticate users of an online system
US9443122B2 (en) Upload apparatus, server apparatus, upload system, and upload method
US20090328175A1 (en) Identity verification via selection of sensible output from recorded digital data
CN106559654A (zh) 一种人脸识别监控采集系统及其控制方法
CN107613254A (zh) 一种检测门外来访者、识别来访者身份的方法及装置
CN110009789A (zh) 一种基于生物识别技术的中小学幼儿园校园接送系统
CN105844247A (zh) 双摄像头柜机人证识别系统
CN104282049B (zh) 面部识别考勤终端与考勤过程认证系统及认证方法
CN110070469A (zh) 一种基于生物识别技术的中小学幼儿园智慧校园系统
CN107403165B (zh) 智能人脸识别系统的数据管理架构及使用方法
CN103412877A (zh) 图片传递方法及装置
CN105844246A (zh) 单摄像头柜机人证识别系统
CN106792267A (zh) 一种图片及视频信息真实性标识及鉴别的系统和方法
US20220046012A1 (en) Method and System for Verifying the Identity of a User
CN107563352A (zh) 一种识别门外来访者身份的方法及装置
CN102340424A (zh) 不良报文的检测方法及不良报文的检测装置
Bertini et al. Profile resolution across multilayer networks through smartphone camera fingerprint
CN111147490A (zh) 一种定向钓鱼攻击事件发现方法及装置
US11171979B2 (en) Using data science to aid in detection of unauthorized distribution
CN102063659A (zh) 电子相片采集制作方法、服务器和系统
CN111259216B (zh) 一种信息识别方法、装置及设备
CN102685117A (zh) 一种组播安全管理方法及装置
CN1997097A (zh) 可提供信息码的认证系统、方法及其装置
CN109859351B (zh) 一种基于蓝牙设备的人脸注册系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20090320

Address after: Guangdong province Shenzhen city Nanshan District South Road Fiyta building 5-10 post encoding: 518057

Applicant after: Shenzhen Tencent Computer System Co., Ltd.

Address before: Room 2, East 403, SEG Science Park, Zhenxing Road, Guangdong, Shenzhen, Futian District: 518044

Applicant before: Tencent Technology (Shenzhen) Co., Ltd.

ASS Succession or assignment of patent right

Owner name: SHENZHEN TENCENT COMPUTER SYSTEM CO., LTD.

Free format text: FORMER OWNER: TENCENT TECHNOLOGY (SHENZHEN) CO., LTD.

Effective date: 20090320

C14 Grant of patent or utility model
GR01 Patent grant