具体实施方式
本发明提供一种图片检测系统,通过将图片与已有数据进行比较、对图片进行辨识和发送人工审核的方式,有效地区分合法图片与非法图片。
本发明提出第一实施例,请参阅图1,所述图片检测系统包括:
特征数据库100,存储图片不变特征黑名单;
图片匹配模块10,接收被检测图片,比较所述接收的被检测图片是否与黑名单的图片匹配;
图片检测模块11,与图片匹配模块10连接,计算不匹配图片的置信值,根据所述置信值判断图片是否达到既定标准;
结果处理模块12,与图片检测模块11连接,将置信值未达到既定标准的图片发送人工审核。
本实施例所述的被检测图片包括合法图片和非法图片,所述非法图片包括政治类图片、色情类图片、有伤社会风化或社会公德类图片、涉及国家安全类图片、恶搞类图片等,还包括图片检测系统自定义的非法图片等。
本实施例所述图片检测系统,通过图片匹配模块10、图片检测模块11和结果处理模块12对所接收的被检测图片进行检测,将非法图片与合法图片进行有效区分。
基于上述实施例,本发明提出第二实施例。请参阅图2,本实例图片检测系统包括:
特征数据库100,存储图片不变特征黑名单;所述图片不变特征包括图片MD5(Message-Digest Algorithm 5,信息-摘要算法)值、图片特性和/或图片特性MD5值等;所述不变特征黑名单可以包括图片MD5值黑名单和图片特性MD5值黑名单;
图片匹配模块10,接收被检测图片,比较所述接收的被检测图片是否与所述图片特征黑名单的图片匹配;其中,该图片匹配模块10包括特征获取单元101和比较匹配单元102。所述特征获取单元101用于接收被检测图片、获取图片不变特征;所述比较匹配单元102用于比较所述获取的被检测图片不变特征是否与黑名单的图片不变特征匹配;
图片检测模块11,与所述图片匹配模块10连接,该图片检测模块11包括检测单元110和置信值判断单元111;所述检测单元110用于计算所述不匹配图片的置信值,所述置信值判断单元111用于判断所述被检测图片的置信值是否达到标准。
在本实施例中,所述特征获取单元101包括接收组件1010和获取组件1011;所述接收组件1010用于接收被检测图片,所述获取组件1011用于获取所述被检测的图片不变特征。所述比较匹配单元102包括第一比较组件1020和第二比较组件1021;所述第一比较组件1020用于比较图片的MD5值是否与黑名单的图片MD5值匹配;所述第二比较组件1021用于比较图片特性MD5值是否与黑名单的图片特性MD5值匹配。
本实施例以对网络相册的上传图片进行检测为例,进一步对本发明的图片检测系统进行说明。
网络相册用户在相册中上传图片,需要经过本实施例所述图片检测系统检测后,才能被所述网络相册浏览者浏览。
本实施例对网络相册上传图片的检测可以分为实时审核、旁路审核和人工审核;所述实时审核是对有实时性要求的上传图片快速地进行审核,不使上传图片在检测中产生较大延时,及时上传所需要显示的上传图片;所述旁路审核是对所述实时审核不能确定审核结果和无实时性要求的上传图片,进行的审核;所述人工审核是对所述旁路审核不能确定结果的上传图片,进行的审核。
本实施例所述实时审核,可以利用所述图片MD5值黑名单,进行图片MD5值匹配,匹配成功,则判定所述上传图片为非法图片,反之,进行下一步审核;所述旁路审核,可以利用所述图片特性MD5值,进行图片特性MD5值匹配,匹配成功,则判定所述上传图片为非法图片,反之进行基于肤色检测的色情图片识别技术的置信值判断,分辨出可信任、不信任和可疑图片;所述人工审核,是由人工对所述可疑图片进行审核。
所述上传图片在所述图片检测系统的检测中为被检测图片。
本实施例图片检测系统的特征数据库100,累积存储有非法图片的图片不变特征,建立图片不变特征黑名单。所述图片不变特征黑名单可以是基于图片内容的图片MD5值黑名单和基于图片特性内容的图片特性MD5值,并可在所述图片不变特征黑名单建立HASH(散列)索引,以便于加快查找速度。
对有实时性要求的被检测图片进行实时审核,此实时审核是通过所述接收组件1010接收所述有实时性要求的被检测图片,由所述获取组件1011获取所述被检测图片的图片MD5值,利用所述第一比较组件1020进行检测。
所述第一比较组件1020将被检测图片的图片MD5值与MD5值黑名单中的MD5值进行匹配;如果匹配成功,则判定所述被检测图片为非法图片,禁止所述被检测图片上传至网络相册;反之,将所述被检测图片存储至所述系统的临时数据库中,等待下一步审核。
对第一比较组件1020匹配不成功和无实时性要求的被检测图片进行旁路审核,此旁路审核是通过所述接收组件1010接收所述第一比较组件1020匹配不成功和无实时性要求的被检测图片,由所述获取组件1011获取所述被检测图片的图片特性MD5值,利用所述第二比较组件1021和图片检测模块11进行检测。其中,所述第一比较组件1020匹配不成功的被检测图片可优先进行检测。
对于无实时性要求的被检测图片,所述接收组件1010可根据优先级选择接收用户上传的图片,所述优先级选择是指将历史记录较差的用户确定为较高优先级而予以优先审核。而如果是对网络上已有图片进行审核,则可根据单个图片最近一段时间的浏览次数设定不同的优先级。接收所述被检测图片后,通过获取组件1011获取所述被检测图片的图片MD5值。
在实际的网络传输中,所述被检测图片因重复传阅而有部分失真或被加工,例如大小缩放、截去或者添加边框、加水印和/或色度亮度对比度调整等,使得被检测图片的图片MD5值被改变,上述被检测图片的原图片MD5值的匹配方式将会失效,不能检测出经过加工或失真的非法图片。因此,可以通过所述第二比较组件1021对此类失真或被加工的图片进行检测。
由于每一图片中都存在某些特性,能像人体指纹一样具有唯一性,因此,可以先对待检测图像按等方向比标准化到一个预先设定的大小,然后进行Canny边缘检测(一种边缘检测的算法),提取出图像中主要的连续边缘,然后计算边缘点集合的矩不变量(Moment Invariants)等,作为被加工图片的图片特性,并计算所述矩不变量的整数编码的MD5值,建立图片特性的MD5值黑名单。
利用所述第二比较组件1021,进行图片特性MD5值匹配,需要先通过所述接收组件1010在所述临时数据库中按照所述优先级选择接收图片;再由所述获取组件1011提取所接收图片的图片特性,并计算获取图片特性MD5值;所述第二比较组件1021将被检测图片的图片特性MD5值与图片特性MD5值黑名单中的图片特性MD5值进行匹配;如果匹配成功,判定所述被检测图片为非法图片,禁止所述被检测图片上传网络相册;反之,进行色情图片检测。
所述图片检测模块11,通过图片检测技术对所述图片特性MD5值匹配不成功的被检测图片进行检测,可区分合法图片和非法图片,此处以区分非色情图片和色情图片为例。
其中,所述检测单元110,用于检测所述图片特性MD5值匹配不成功的被检测图片,并计算所述被检测图片的置信值。此置信值计算是基于肤色检测的色情图片识别技术进行,在此不作赘述。
所述置信值判断单元111,与所述检测单元110连接,判断所述被检测图片的置信值是否达到标准。所述置信值为一标准数值,被检测图片置信值越大说明被检测图片为色情图片的可能性越大。所述标准可分为信任、不信任和可疑,比如,当被检测图片所述置信值小于50,则此被检测图片为可信任图片,即非色情图片,允许此被检测图片上传网络相册;当被检测图片所述置信值大于90,则所述被检测图片为不可信任图片,即色情图片,禁止该被检测图片上传至网络相册;当被检测图片所述置信值小于等于90大于等于50,则此被检测图片为可疑图片,即为未达到标准图片,无法判定其为色情或非色情图片,需要进行人工审核。
本实施例所述结果处理模块12,可将所述经图片检测模块11判定为可疑的被检测图片发送至人工检测平台13,进行人工审核,由人工区分合法图片和非法图片,并将所述合法图片和非法图片分别返回所述图片检测系统。
本实施例所述图片检测系统还包括增量训练模块15,与所述图片检测模块11连接,分别接收人工审核为合法图片和非法的图片,提取所述被检测图片的图片特征对所述图片检测模块11进行增量训练,增强所述图片检测模块11的检测能力。
本实施例所述图片检测系统还包括增量学习模块14,获取所述色情图片的不变特征,以添加至所述特征数据库100。此增量学习模块14还可接收人工检测平台13发送的非法图片,并获取所述非法图片的图片MD5值及图片特性MD5值,分别将所述非法图片的图片MD5值和图片特性MD5值增加至所述图片MD5值黑名单和图片特性MD5值黑名单,以加强所述图片匹配模块10的检测效果。
本实施例图片检测系统是针对单个图片进行检测,其还可以应用于对已有网站上图片进行的检测,当检测到网站已有图片为非法图片,通过在图片检测系统中设置删除功能,将所述图片删除,维护网络环境;所述图片检测系统,还可以应用于对网络中传递的图片进行的检测,即时截获传输中的图片,及时禁止非法图片传输;且所述图片检测系统,还可以应用于本地图片的检测,清理本地图片中的非法图片。
本实施例图片检测系统,首先通过图片匹配模块10的非法图片不变特征黑名单,对被检测图片进行非法图片过滤检测,快速过滤掉存在于所述黑名单中的非法图片,节省检测时间;然后利用图片检测模块11检测经过上述过滤检测的被检测图片,检测出其中的色情图片;再是由结果处理模块12将图片检测模块11检测为可疑的图片发送人工审核;本实施例图片检测系统可有效将合法图片和非法图片区分,节省大量人工审核的时间,维护良好的网络环境。
本发明提出第三实施例,提供一种图片检测方法。请参阅图3,所述方法包括步骤:
S10,建立图片黑名单;
S11,接收被检测图片并比较所述被检测图片是否与图片黑名单的图片匹配,以区分合法图片和非法图片;
S12,计算所述不匹配被检测图片的置信值并判断所述被检测图片的置信值是否达到标准;
S13,将置信值未达到标准的被检测图片设置为非法图片或者发送给人工检测。
本实施例所述的被检测图片包括合法图片和非法图片,所述非法图片包括政治类图片、色情类图片、有伤社会风化或社会公德类图片、涉及国家安全类图片、恶搞类图片等,还包括图片检测系统自定义的非法图片等。
本实施例所述图片检测方法,通过匹配检测、色情图片检测和发送人工审核的方式,将非法图片与合法图片有效区分。
基于上述实施例,本发明提出第四实施例。请参阅图4,本实施例图片检测方法,包括步骤:
S100,建立图片MD5值黑名单和图片特性MD5值黑名单;
S110,接收被检测图片并获取所接收被检测图片的图片MD5值;
S111,比较所述被检测图片的图片MD5值是否与黑名单的图片MD5值匹配;
S112,获取不匹配被检测图片的图片特性MD5值;
S113,比较所述被检测图片的图片特性MD5值是否与黑名单的图片特性MD5值匹配;
S120,计算不匹配被检测图片的置信值;
S121,判断所述被检测图片的置信值是否达到标准;
S130,将置信值未达到标准的被检测图片设置为非法图片或者发送给人工检测。
如步骤S100所述,所述被检测图片不变特征黑名单至少包括图片MD5值黑名单和图片特性MD5值黑名单。将所积累的非法图片的图片MD5值和图片特性MD5值组合建立图片MD5值黑名单和图片特性MD5值黑名单,并在所述黑名单建立HASH索引,以便于加快查找速度。
对有实时性要求的被检测图片进行实时审核,此实时审核是通过接收所述有实时性要求的被检测图片,获取所述被检测图片的图片MD5值,利用所述步骤S110和S111进行图片MD5值匹配检测。
如步骤S110所述,所述图片不变特征包括图片MD5值、图片特性或图片特性MD5值等。在此处,可以利用MD5算法基于图片内容计算获取被检测图片MD5值。
如步骤S111所述,将所述获取的所述被检测图片的图片MD5值与所述黑名单图片MD5值进行匹配;如匹配成功,所述被检测图片将被判定为非法图片;如匹配不成功,对所述图片进行下一步检测。
对图片MD5值匹配不成功和无实时性要求的被检测图片进行旁路审核,此旁路审核是通过接收所述图片MD5值匹配不成功和无实时性要求的被检测图片,获取所述被检测图片的图片特性MD5值,利用所述所述步骤S112至步骤S121进行图片特性MD5值匹配和置信值判断检测。其中,所述对图片MD5值匹配不成功的被检测图片可优先进行检测。
如步骤S112所述,先对待检测图像按等方向比标准化到一个预先设定的大小,然后进行Canny边缘检测(一种边缘检测的算法),提取出图像中主要的连续边缘,然后计算边缘点集合的矩不变量(Moment Invariants)等,作为被加工图片的图片特性,再计算所述矩不变量的整数编码的MD5值,作为图片特性MD5值。
如步骤S113所述,将所述提取的所述被检测图片的图片特性MD5值与所述黑名单的图片特性MD5值进行匹配;如匹配成功,所述被检测图片将被判定为非法图片;如匹配不成功,对所述被检测图片进行下一步检测。
如步骤S120所述,利用现有技术中基于肤色检测的色情图片识别技术,检测所述图片特性MD5值匹配不成功的被检测图片,并计算所述被检测图片的置信值。
如步骤S121所述,判断所述被检测图片的置信值是否达到标准。所述置信值为一标准数值,被检测图片置信值越大说明被检测图片为色情图片的可能性越小。所述标准可分为信任、不信任和可疑,比如,当被检测图片所述置信值小于50,则此被检测图片为可信任图片,即非色情图片,允许此被检测图片上传至网络相册;当被检测图片所述置信值大于90,则所述被检测图片为不可信任图片,即色情图片,禁止该被检测图片上传至网络相册;当被检测图片所述置信值小于等于90大于等于50,则此被检测图片为可疑图片,即为未达到标准图片,无法判定其为色情或非色情图片,需要进行人工审核。
如步骤S130所述,可将所述可疑图片交付人工审核,由人工区分合法图片和非法图片。
本实施例所述图片检测方法,可以通过分别接收人工审核为合法和非法的图片,提取所述被检测图片的图片特征对所述色情图片检测进行训练,增强所述色情图片检测的检测能力。
本实施例所述图片检测方法,还可以获取所述色情图片的图片MD5值和色情图片的图片特性MD5值,分别添加至所述图片MD5值黑名单和图片特性MD5值黑名单;还可以接收人工审核为非法的被检测图片,并获取非法图片的图片MD5值及图片特性MD5值,分别添加至所述图片MD5值黑名单和图片特性MD5值黑名单,以加强所述图片匹配检测的检测效果。
本实施例,首先通过非法图片不变特征黑名单,快速过滤掉存在于所述黑名单中的非法图片,节省检测时间;然后利用计算被检测图片置信值的方式,区分出信任图片、色情图片和可疑图片;再是将可疑图片发送人工审核;本实施例图片检测方法可有效将合法图片和非法图片区分,节省大量人工审核的时间,维护良好的网络环境。
本发明提出第五实施例,提供一种图片匹配装置20,可对图片进行检测,快速分离出非法图片。
请参阅图5,所述图片匹配装置20包括:
特征数据库100,存储图片不变特征名单;通过积累存储图片不变特征,建立图片不变特征的名单。本实施例的所述名单可为白名单或黑名单;白名单为合法图片名单,黑名单可为非法图片名单;
特征获取模块201,接收被检测图片,获取被检测图片的图片不变特征;所述图片不变特征是所述图片的特征中相对其他图片是唯一的;
比较匹配模块202,分别与所述特征获取模块201和特征数据库100相连接,比较所述获取的被检测图片的图片不变特征是否与名单的图片不变特征匹配,以区分合法和非法图片;如果所述图片不变特征的名单为黑名单,将所述获取的被检测图片的图片不变特征与所述黑名单的图片不变特征进行匹配比较;如果所述获取的被检测图片的图片不变特征与所述黑名单的图片不变特征相匹配,则判定被检测的图片为非法图片;反之,所述被检测的图片为合法图片。
如果所述图片不变特征的名单为白名单,同样将所述获取的被检测图片的图片不变特征与所述白名单的图片不变特征进行匹配比较;相匹配,则判定被检测图片为合法图片;反之,所述被检测图片为非法图片。
本实施例所述的被检测图片包括合法图片和非法图片,所述非法图片包括政治类图片、色情类图片、有伤社会风化或社会公德类图片、涉及国家安全类图片、恶搞类图片等,还包括图片检测系统自定义的非法图片等。
本实施例所述图片匹配装置20,通过比较被检测图片的图片不变特征是否与所述黑名单的图片不变特征匹配,而将非法图片与合法图片合理区分。
基于上述实施例,本发明提出第六实施例。请参阅图6,提供一种图片匹配装置20,可快速匹配检测出非法图片。所述图片匹配装置包括:
特征数据库100,存储图片不变特征名单;
特征获取模块201,接收被检测图片,获取被检测图片的图片不变特征;其中,所述特征获取模块201包括接收单元2010和获取单元2011;所述接收单元2010用于选择接收被检测图片,所述获取单元2011用于获取所接收被检测图片的图片不变特征。
比较匹配模块202,分别与所述特征获取模块201和特征数据库100相连接,比较所述获取的被检测图片的图片不变特征是否与名单的图片不变特征匹配,以区分合法和非法图片;其中,所述比较匹配模块202包括第一比较单元2020和第二比较单元2021;所述第一比较单元2020用于比较被检测图片的图片MD5值是否与黑名单的图片MD5值匹配,所述第二比较单元2021用于比较被检测图片的图片特性MD5值是否与黑名单的图片特性MD5值匹配。
本实施例还是以网络相册图片上传为例,可通过本图片匹配装置20快速对用户上传图片进行匹配检测。
本实施例图片匹配装置20的特征数据库100,累积存储有非法图片的图片不变特征,建立图片不变特征黑名单。所述图片不变特征包括图片MD5值、图片特性和/或图片特性MD5值等。所述图片不变特征黑名单可以是基于图片内容的MD5值黑名单,并可在所述图片不变特征黑名单建立HASH(散列)索引,以便于加快查找速度。
其中,所述接收单元2010可根据优先级选择接收用户上传的图片,所述优先级选择是指将历史记录较差的用户确定为较高优先级而予以优先审核。而如果是对网络上已有图片进行审核,则可根据单个图片最近一段时间的浏览次数设定不同的优先级。接收所述被检测图片后,通过获取单元2011获取所述被检测图片的图片MD5值。
所述第一比较单元2020将被检测图片的图片MD5值与MD5值黑名单中的MD5值进行匹配;如果匹配成功,则判定所述被检测图片为非法图片,禁止所述被检测图片上传至网络相册;反之,将所述被检测图片存储至所述系统的临时数据库中,等待下一步审核。
在实际的网络传输中,所述被检测图片因重复传阅而有部分失真或被加工,例如大小缩放、截去或者添加边框、加水印和/或色度亮度对比度调整等,使得被检测图片的图片MD5值被改变,上述被检测图片的原图片MD5值的匹配方式将会失效,不能检测出经过加工或失真的非法图片。因此,可以通过所述第二比较单元2021对此类失真或被加工的图片进行检测。
由于每一图片中都存在某些特性,能像人体指纹一样具有唯一性,因此,可以先对待检测图像按等方向比标准化到一个预先设定的大小,然后进行Canny边缘检测(一种边缘检测的算法),提取出图像中主要的连续边缘,然后计算边缘点集合的矩不变量(Moment Invariants)等,作为被加工图片的图片特性,并计算所述矩不变量的整数编码的MD5值,建立图片特性的MD5值黑名单。
利用所述第二比较单元2021,进行图片特性MD5值匹配,需要先通过所述接收单元2010在所述临时数据库中按照所述优先级选择接收图片;再由所述获取单元2011提取所接收图片的图片特性,并计算获取图片特性MD5值;所述第二比较单元2021将被检测图片的图片特性MD5值与图片特性MD5值黑名单中的图片特性MD5值进行匹配;如果匹配成功,判定所述被检测图片为非法图片,禁止所述被检测图片上传网络相册;反之,再使用其他方式检测,或允许上传网络相册。
本实施例图片匹配装置20,还可以应用于对已有网站上图片的检测和/或网络中传递的图片的检测及本地图片的检测等可针对单个图片进行的检测。
本实施例图片匹配装置20,首先通过特征数据库100的非法图片不变特征黑名单,对被检测图片进行非法图片过滤检测,快速过滤掉存在于所述黑名单中的非法图片;本实施例图片匹配装置20可快速将合法图片和非法图片区分,节省大量人工审核的时间,维护良好的网络环境。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。