CN103093180B - 一种色情图像侦测的方法和系统 - Google Patents

一种色情图像侦测的方法和系统 Download PDF

Info

Publication number
CN103093180B
CN103093180B CN201110336168.6A CN201110336168A CN103093180B CN 103093180 B CN103093180 B CN 103093180B CN 201110336168 A CN201110336168 A CN 201110336168A CN 103093180 B CN103093180 B CN 103093180B
Authority
CN
China
Prior art keywords
area
connected domain
image
skin area
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110336168.6A
Other languages
English (en)
Other versions
CN103093180A (zh
Inventor
薛晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201110336168.6A priority Critical patent/CN103093180B/zh
Publication of CN103093180A publication Critical patent/CN103093180A/zh
Priority to HK13107589.7A priority patent/HK1180424A1/zh
Application granted granted Critical
Publication of CN103093180B publication Critical patent/CN103093180B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本申请提供了一种色情图像侦测的方法和系统,其中所述方法包括:检测目标图像中的皮肤区域;若所述皮肤区域在目标图像整体区域中的占比大于第一预设阈值,则检测所述目标图像中的连通域;判断所述连通域在皮肤区域中的分布是否满足预置规则,若是,则判定所述目标图像为色情图像。本申请可以提高色情图像识别的召回率和准确率。

Description

一种色情图像侦测的方法和系统
技术领域
本申请涉及图像识别的技术领域,特别是涉及一种色情图像侦测的方法和系统。
背景技术
随着互联网的快速发展,互联网在为人们认识世界、方便生活、提供帮助的同时,也为有害信息的广泛传播提供了便捷的途径,例如,人们常常会受到含有如色情、暴力等不健康的色情图像和视频的侵扰;网络犯罪活动的现象也日渐增多,如色情小说、色情图像和录像的传播,它们扰乱社会秩序、破坏社会风气,给人们尤其是青少年带来了极大的负面影响。
据统计,全球现有色情网站数以百万,另外,约28%的网站包含成人内容;一个人在互联网上随便点击每七次就有一次可能点击到色情站点,25%的小网迷曾主动访问色情网站,20%的人曾被动收到色情信息,全球75%的家长明确表示担心不良信息对孩子的负面影响;全球电子邮件中有大约55%是垃圾邮件,而其中色情图像大约占20%左右。
目前,过滤色情图像信息主要采用以下三种策略:
1、文本关键词过滤;
2、针对包含成人内容的网站建立黑名单,从而根据IP地址进行过滤;
3、基于内容进行图像识别。
对于第一种文本关键词过滤的方法而言,尽管文本检索、自然语言处理等技术已经发展地相当成熟,但单纯的基于文本过滤的方式,仍然存在着较大的漏杀率。主要原因之一在于文本修改的成本较低,恶意用户往往可以通过尝试不同的文字变形(错别字、象形文字等)来突破单纯依赖辞典的关键词过滤手段。另一方面,图像对人眼的冲击力往往更大(换言之,色情图像的危害程度相较文字更大),恶意用户甚至直接将文字印在图像上,对于这类情况,文本过滤的方式往往无能为力。
对于第二种根据黑名单网站IP地址进行过滤的方法而言,由于IP过滤的方式是一种静态防御的方式,无法第一时间发现包含成人内容的网站,而往往依赖其它技术或者人工举报的方式去维护黑名单。
与上述两种方法相比,第三种基于内容的图像识别技术通过分析、提取色情图像不同于正常图像的特征,作为机器判断的依据,提供了更灵活、直接且文字无关的处理手段。
传统的基于内容的图像识别技术,基本上单纯依赖皮肤颜色检测,往往会有较为严重的误判问题,即对于某些正常图像,只要其出现了黄色背景、纺织物、毛发等情况,都有很大概率会被过滤为色情图像。特别的,对于电子商务网站中存在的大量内衣、首饰等产品图像,存在十分严重的误杀率。
因此,目前需要本领域技术人员迫切解决的一个技术问题就是:提出一种色情图像的侦测技术,用以提高色情图像识别的召回率和准确率。
发明内容
本申请的目的是提供一种色情图像侦测的方法和系统,用以提高色情图像识别的召回率和准确率。
为了解决上述问题,本申请公开了一种色情图像侦测的方法,包括:
检测目标图像中的皮肤区域;
若所述皮肤区域在目标图像整体区域中的占比大于第一预设阈值,则检测所述目标图像中的连通域;
判断所述连通域在皮肤区域中的分布是否满足预置规则,若是,则判定所述目标图像为色情图像。
优选的是,所述检测目标图像中的皮肤区域的步骤进一步包括:
对目标图像进行肤色检测,获得候选皮肤区域;
在所述候选皮肤区域在目标图像整体区域中的占比大于第一预设阈值时,对所述候选皮肤区域进行纹理特征检测;
确定所述纹理特征强度大于第二预设阈值的候选皮肤区域为皮肤区域。
优选的是,所述判断连通域在皮肤区域中的分布是否满足预置规则的步骤进一步包括:
获取各连通域的面积,判断其中面积最大的连通域在皮肤区域中的占比是否大于第三预设阈值;
和/或,
获取各连通域的面积,判断其中面积大小在前n位的连通域,在皮肤区域中的占比是否大于第四预设阈值,所述n大于1。
优选的是,在所述判定目标图像为色情图像的步骤之前,还包括:
检测目标图像中的脸部区域;
若所述脸部区域在目标图像整体区域中的占比小于第五预设阈值,则根据所述脸部区域估算躯干区域,并检测躯干区域中的皮肤区域;
若所述躯干区域中的皮肤区域在躯干区域中的占比超过第六预设阈值,则判定所述目标图像为色情图像。
优选的是,所述第一预设阈值为20%;所述纹理特征检测采用边缘提取算法,所述第二预设阈值为5;所述第三预设阈值为5%;所述n为3,所述第四预设阈值为50%;所述第五预设阈值为65%;所述第六预设阈值75%。
本申请还公开了一种色情图像侦测的方法,包括:
检测样本图像中的皮肤区域;所述样本图像包括正样本图像和反样本图像;
若所述皮肤区域在当前样本图像整体区域中的占比大于第一预设阈值,则检测所述样本图像中的连通域;
针对所述正样本图像和反样本图像中,连通域面积大小在前m位的目标连通域提取预设特征;
根据所提取的预设特征生成分类模型;
将待检测的目标图像输入分类模型,判断是否为色情图像。
优选的是,所述预设特征包括:
第一特征:所述目标连通域的面积在当前样本图像中的占比;
和/或,
第二特征:所述目标连通域最小外接椭圆的中心与当前样本图像中心的距离;
和/或,
第三特征:所述目标连通域最小外接椭圆的长轴与水平或者垂直方向的最小夹角;
和/或,
第四特征:所述目标连通域最小外接椭圆的长轴与短轴的比例;
和/或,
第五特征:所述目标连通域中皮肤区域的面积占整个目标连通域面积的比例;
和/或,
第六特征:所述目标连通域中皮肤区域的各像素所对应的每一个通道值的均方差。
本申请同时公开了一种色情图像侦测的系统,包括:
皮肤区域检测模块,用于检测目标图像中的皮肤区域;
第一判断模块,用于判断所述皮肤区域在目标图像整体区域中的占比是否大于第一预设阈值,若是,则调用连通域分析模块;
连通域分析模块,用于检测所述目标图像中的连通域;
第二判断模块,用于判断所述连通域在皮肤区域中的分布是否满足预置规则,若是,则判定所述目标图像为色情图像。
优选的是,所述皮肤区域检测模块进一步包括:
肤色检测子模块,用于对目标图像进行肤色检测,获得候选皮肤区域;
纹理特征检测子模块,用于在所述候选皮肤区域在目标图像整体区域中的占比大于第一预设阈值时,对所述候选皮肤区域进行纹理特征检测;
皮肤区域确定子模块,用于确定所述纹理特征强度大于第二预设阈值的候选皮肤区域为皮肤区域。
优选的是,所述连通域分析模块进一步包括:
最大连通域分析子模块,用于获取各连通域的面积,判断其中面积最大的连通域在皮肤区域中的占比是否大于第三预设阈值;
和/或,
优选连通域分析子模块,用于获取各连通域的面积,判断其中面积大小在前n位的连通域,在皮肤区域中的占比是否大于第四预设阈值,所述n大于1。
优选的是,所述的系统,还包括:
脸部区域检测模块,用于检测目标图像中的脸部区域;
第三判断模块,用于判断所述脸部区域在目标图像整体区域中的占比是否小于第五预设阈值,若是,则调用躯干区域检测模块;
躯干区域检测模块,用于根据所述脸部区域估算躯干区域,并检测躯干区域中的皮肤区域;
第四判断模块,用于判断所述躯干区域中的皮肤区域在躯干区域中的占比是否超过第六预设阈值,若是,则判定所述目标图像为色情图像。
本申请还公开了一种色情图像侦测的系统,包括:
样本皮肤检测模块,用于检测样本图像中的皮肤区域;所述样本图像包括正样本图像和反样本图像;
第五判断模块,用于判断所述皮肤区域在当前样本图像整体区域中的占比大于第一预设阈值,若是,则调用连通域检测模块;
连通域检测模块,用于检测所述样本图像中的连通域;
特征提取模块,用于针对所述正样本图像和反样本图像中,连通域面积大小在前m位的目标连通域提取预设特征;
模型生成模块,用于根据所提取的预设特征生成分类模型;
模型判断模块,用于将待检测的目标图像输入分类模型,判断是否为色情图像。
优选的是,所述预设特征包括:
第一特征:所述目标连通域的面积在当前样本图像中的占比;
和/或,
第二特征:所述目标连通域最小外接椭圆的中心与当前样本图像中心的距离;
和/或,
第三特征:所述目标连通域最小外接椭圆的长轴与水平或者垂直方向的最小夹角;
和/或,
第四特征:所述目标连通域最小外接椭圆的长轴与短轴的比例;
和/或,
第五特征:所述目标连通域中皮肤区域的面积占整个目标连通域面积的比例;
和/或,
第六特征:所述目标连通域中皮肤区域的各像素所对应的每一个通道值的均方差。
与现有技术相比,本申请包括以下优点:
传统的基于内容的图像识别技术,基本上单纯依赖皮肤颜色检测,往往会有较为严重的误判问题,即对于某些正常图像,只要其出现了黄色背景、纺织物、毛发等情况,都有很大概率会被过滤为色情图像。特别的,对于电子商务网站中存在的大量内衣、首饰等产品图像,存在十分严重的误杀率。
本申请实施例在肤色检测的基础上,新增了皮肤纹理检测、连通域分析、脸部检测、躯干轮廓判断,并辅以机器学习等手段,显著了提高了召回率和准确率。
附图说明
图1是本申请一种色情图像侦测的方法实施例1的步骤流程图;
图2是本申请一种色情图像侦测的方法实施例2的步骤流程图;
图3是本申请一种色情图像侦测的方法实施例3的步骤流程图;
图4是本申请的一种色情图像侦测的系统实施例1的结构框图;
图5是本申请的一种色情图像侦测的系统实施例2的结构框图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
参照图1,示出了本申请一种色情图像侦测的方法实施例1的步骤流程图,具体可以包括如下步骤:
步骤101、检测目标图像中的皮肤区域;
在具体实现中,可以通过肤色检测和纹理特征检测确定目标图像中的皮肤区域。具体而言,本步骤具体可以包括如下子步骤:
子步骤S11、对目标图像进行肤色检测,获得候选皮肤区域,判断所述候选皮肤区域在目标图像整体区域中的占比是否大于第一预设阈值,若是,则执行子步骤S12;
肤色检测可以作为确定目标图像中皮肤区域的第一步。皮肤区域在图像中所占的比例是判断色情图像的一个重要指标,同时也为后续的操作奠定了基础。研究表明,皮肤的颜色主要反映了血液的颜色,而不同人种的肤色主要反映在亮度上,其色调大致相同,因此在YCbCr或者HSV等色彩空间上进行计算的效果要优于传统的RGB空间。
公知的是,YCbCr是DVD、摄像机、数字电视等消费类视频产品中常用的色彩编码方案。其中Y是指亮度分量,Cb指蓝色色度分量,而Cr指红色色度分量。人的肉眼对视频的Y分量更敏感,因此在通过对色度分量进行子采样来减少色度分量后,肉眼将察觉不到图像质量的变化。HSV这个模型中颜色的参数分别是:色调(H),饱和度(S),亮度(V)。HSV模型的三维表示从RGB立方体演化而来。设想从RGB沿立方体对角线的白色顶点向黑色顶点观察,就可以看到立方体的六边形外形。六边形边界表示色彩,水平轴表示纯度,明度沿垂直轴测量。
作为本实施例具体应用的一种示例,判断某一个像素是否为皮肤,可以采用如下两种方法:
第一种、基于经验所得阈值的方式:如果该像素的各通道值均在指定的阈值范围内,则判定该像素为皮肤。
通道对于RGB来说就是每个像素R、G、B的值,同样HSV也是每个像素的H、S、V的值。阈值的设定一般是根据经验所得,所使用的阈值可以作为一个参考,即满足下式的像素被归类到皮肤像素。
red>95&&green>40&&blue>20&&(maxrgb-minrgb)>15&&abs(red-green)>15&&red>green&&red>blue&&green>blue&&red<(green+150)&&red<(blue+150)&&green<(blue+150);
上式中,red、green、blue分别是当前像素的RGB值,maxrgb、minrgb是当前像素RGB值中的最大值和最小值,abs代表取绝对值操作。
第二种、基于统计的方式:首先对一批样本图像进行人工皮肤标注,对颜色空间的每一个值存储皮肤/非皮肤的概率;在肤色检测时,针对输入图像各个像素的颜色空间值,结合贝叶斯公式进行判断。
例如,贝叶斯公式的数学表达式为P(A|B)=P(B|A)*P(A)/P(B),其中,A、B指的是事件,比如A为是否为皮肤,B为像素值是多少;各变量的意义是:
P(A):训练集合中,皮肤或者非皮肤区域的概率;
P(B):训练集合中,该像素值出现的概率;
P(B|A):训练集合中,在已知的皮肤区域中,该像素出现的概率;
P(A|B):已知某一像素值,是皮肤或者非皮肤的概率。
上述P(A)、P(B)和P(B|A)为先验概率,可以通过事先的训练得到;P(A|B)为设置的用于判断某一个像素是否属于皮肤的依据。
在实际应用中,可以准备多张包含人物的样本图像,并采取如下手段:
1)首先通过手工标注的方式,勾勒出皮肤区域;一般以如下形式保存:
【像素值(Key),作为皮肤出现的次数(Value1),作为非皮肤出现的次数(Value2)】;
2)对每一张图像来说,逐像素扫描,如果某一点为皮肤,则找到该像素值Key存放的地址,将Value1自增一,反之则将Value2自增一,形如:
Pixel1,4,5
Pixel2,2,7
Pixel3,10,21
……
3)对训练集中的图像都采用上面的方式。最后会形成一个很大的文件;
4)根据这个文件,可以得到某一像素是皮肤或者非皮肤的概率,如下:
A:判断某一像素是皮肤的概率P1:
P(A)(累加各像素Value1的和,与累加各像素Value2+Value1的和,的比值)、P(B)(指定像素的Value1+Value2,与所有像素的Value1+Value2之和,的比值)、P(B|A)(如果是指定像素的Value1,与所有像素的Value1之和,的比值);再通过贝叶斯公式算得P(A|B);
B:判断某一像素是非皮肤的概率P2:
P(A)(累加各像素Value2的和,与累加各像素Value2+Value1的和,的比值)、P(B)(指定像素的Value1+Value2,与所有像素的Value1+Value2之和,的比值)、P(B|A)(指定像素的Value2,与所有像素的Value2之和,的比值);再通过贝叶斯公式算得P(A|B);
5)如果P1:P2>N(本方案N取3),则判定该像素是皮肤,否则即是非皮肤。
对于检测出的皮肤面积占全图比例小于第一预设阈值,如20%,的图像,直接将其判定为正常图像;否则转入子步骤S12。
当然,上述肤色检测的方法仅仅用作示例,本领域技术人员采用任一种肤色检测的方法都是可行的,本申请对此无需加以限制。
子步骤S12、对所述候选皮肤区域进行纹理特征检测;
子步骤S13、确定所述纹理特征强度大于第二预设阈值的候选皮肤区域为皮肤区域。
单纯依靠颜色来判断皮肤,会有较大的误判率,某些接近皮肤颜色的毛发、织物等也会被误判为皮肤,因此为进一步提高色情图像检测的准确率,降低误判率,在本申请的一种优选实施例中可以引入纹理特征检测。H计算机图形学H中的纹理既包括通常意义上物体表面的纹理即使物体表面呈现凹凸不平的沟纹,同时也包括在物体的光滑表面上的彩色图案。皮肤区别于毛发、织物等物体的一个重要特征在于更为光滑,反映在图像特征上,即纹理的幅度较弱。
作为本实施例具体应用的一种示例,可以采用如下方式对候选皮肤区域进行纹理特征检测:
A)针对肤色检测输出的图像,采用边缘提取算法提取其纹理特征;
B)针对已通过肤色判定为皮肤区域的每一个像素,如果其纹理的强度大于第二预设阈值,则判定为非皮肤。
作为一种示例,可以选择Sobel算子来进行边缘检测,在这种情况下,所述第二预设阈值可以为5。
C)由于步骤B)输出的图像可能会存在许多细小的皮肤/非皮肤区域,在具体实现中,还可以采用形态学滤波的方式(对皮肤区域进行先腐蚀后膨胀)来滤除这些噪音。
其中,数学形态学是由一组形态学的代数运算子组成的,它的基本运算有4个:膨胀(或扩张)、腐蚀(或侵蚀)、开启和闭合,它们在二值图像和灰度图像中各有特点。基于这些基本运算还可推导和组合成各种数学形态学实用算法,用它们可以进行图像形状和结构的分析及处理,包括图像分割、特征抽取、边界检测、图像滤波、图像增强和恢复等。
对于皮肤区域的面积占全图比例小于第一预设阈值的图像,直接将其判定为正常图像;否则转入下一步骤。
理论上,肤色检测与纹理特征检测是两个独立的判别方法,可以任选其一或者更换顺序;但实际使用过程中,优选为使用先进行肤色检测再纹理特征检测的方式,主要原因在于:肤色是一个较强的过滤器,根据统计,大约可以过滤掉大约80%的无关图像,而纹理则要弱的多;纹理更适合在肤色检测基础上,做一些修正,去除一些肤色相近纹理较强的非皮肤区域(肉色外衣以及金发等等)
步骤102、若所述皮肤区域在目标图像整体区域中的占比大于第一预设阈值,则检测所述目标图像中的连通域;
由于色情图像往往会呈现大块的皮肤区域,因此对色情图像侦测来说,大块连通的皮肤区域往往嫌疑程度越高,反之则越低。连通域提取有许多很成熟的算法,比较经典的包括四连通域(查看某一个像素的相邻四个像素是否也为皮肤,是则添加进连通域中,以此类推)和八连通域(类似)。最终可以得到各连通域在图像中的位置以及面积。
步骤103、判断所述连通域在皮肤区域中的分布是否满足预置规则,若是,则判定所述目标图像为色情图像。
在本申请的一种优选实施例中,本步骤103具体可以包括如下子步骤:
子步骤S21、获取各连通域的面积,判断其中面积最大的连通域在皮肤区域中的占比是否大于第三预设阈值;
和/或,
子步骤S21、获取各连通域的面积,判断其中面积大小在前n位的连通域,在皮肤区域中的占比是否大于第四预设阈值,所述n大于1。
由于面积较大的连通域为大块皮肤区域的可能性更高,大块皮肤区域为色情图像的嫌疑程度更高,因此在本申请的优选实施例中,可以提取面积最大的连通域和/或面积大小在前n位的连通域进行判断,在实际中,所述第三预设阈值可以为5%;所述n可以为3,所述第四预设阈值可以为50%。
在实际中,若面积最大的连通域在皮肤区域中的占比小于第三预设阈值;和/或,其中面积大小在前n位的连通域,在皮肤区域中的占比小于第四预设阈值,则可以判断目标图像为正常图像。
参照图2,示出了本申请一种色情图像侦测的方法实施例2的步骤流程图,具体可以包括如下步骤:
步骤201、检测目标图像中的皮肤区域;
步骤202、若所述皮肤区域在目标图像整体区域中的占比大于第一预设阈值,则检测所述目标图像中的连通域;
步骤203、判断所述连通域在皮肤区域中的分布是否满足预置规则,若是,则执行步骤204;
步骤204、检测目标图像中的脸部区域;
步骤205、判断所述脸部区域在目标图像整体区域中的占比是否小于第五预设阈值,若是,则执行步骤206;
步骤206、根据所述脸部区域估算躯干区域,并检测躯干区域中的皮肤区域;
步骤207、判断所述躯干区域中的皮肤区域在躯干区域中的占比是否超过第六预设阈值,若是,则执行步骤208;
步骤208、判定所述目标图像为色情图像。
在本实施例中,采用脸部检测的方法来辅助识别色情图像。目前常用的脸部检测的方法包括:自适应增强(adaboost,adaptiveboosting)、ASM(算法状态机)、AAM(activeappearancemodel,主动形状模型)等,本领域技术人员可以根据实际情况选择合适的算法。应用本实施例,对于包含人脸的目标图像,结合提取出来的脸部信息,可以采用如下策略来进行筛选:
1)如果脸部的面积占全图面积的比例超过第五预设阈值,如65%,则该图很有可能是脸部特写,判定为正常图像。
2)根据人脸的位置、大小估算躯干区域。
得到人脸信息后,根据正常人体的比例,可以估计出大致躯干的区域。在具体应用中可以将人脸下方、以人脸为中心,宽度为2倍人脸直径,高度为5倍人脸直径的矩形区域定义为人体躯干。
3)如果躯干区域皮肤的面积占躯干面积的比例超过第六预设阈值,如75%,则判定为色情图像
参照图3,示出了本申请一种色情图像侦测的方法实施例3的步骤流程图,具体可以包括如下步骤:
步骤301、检测样本图像中的皮肤区域;
其中,所述样本图像可以包括正样本图像和反样本图像;
步骤302、若所述皮肤区域在当前样本图像整体区域中的占比大于第一预设阈值,则检测所述样本图像中的连通域;
步骤303、针对所述正样本图像和反样本图像中,连通域面积大小在前m位的目标连通域提取预设特征;
步骤304、根据所提取的预设特征生成分类模型;
步骤305、将待检测的目标图像输入分类模型,判断是否为色情图像。
在具体实现中,可以选择若干数量的正样本图像(色情图像)和反样本图像(正常图像),按照前述方法实施例1和方法实施例2中的相关方法进行皮肤区域提取及连通域分析。
作为本申请的一种优选实施例,所述预设特征可以包括:
第一特征:所述目标连通域的面积在当前样本图像中的占比;
所述第一特征可以理解为相对面积的特征,即皮肤连通域面积占全图面积的比例,该参数越大说明为色情图像的可能性越高。
和/或,
第二特征:所述目标连通域最小外接椭圆的中心与当前样本图像中心的距离;
所述第二特征可以理解为相对位置的特征,即皮肤连通域最小外接椭圆的中心与图像中心的距离。绝大多数情况下,图像的主体位于其中心位置,因此该参数越小,说明裸露皮肤位于图像的位置越重要,该图像为色情图像的可能性越高。
和/或,
第三特征:所述目标连通域最小外接椭圆的长轴与水平或者垂直方向的最小夹角;
所述第三特征可以理解为相对方向的特征,即皮肤连通域最小外接椭圆的长轴与水平或者垂直方向的最小夹角。大多数情况下,色情图像中裸露的躯干四肢往往会呈水平或者垂直方向,因此该参数越小,说明该图像为色情图像的可能性越高。
和/或,
第四特征:所述目标连通域最小外接椭圆的长轴与短轴的比例;
所述第四特征可以理解为形状特征,即皮肤连通域最小外接椭圆的长轴与短轴的比例。由于人体的躯干、四肢都呈狭长状并且长宽比都在一定的阈值范围内,如2:5。因此该参数如果在预设的阈值范围内,则该图像为色情图像的可能性越高。
和/或,
第五特征:所述目标连通域中皮肤区域的面积占整个目标连通域面积的比例;
所述第五特征可以理解为填充率特征,即皮肤连通域中实际皮肤像素的面积与整个连通域面积的比例。该参数越高,则说明该图像为色情图像的可能性也越高。
和/或,
第六特征:所述目标连通域中皮肤区域的各像素所对应的每一个通道值的均方差。
所述第六特征可以理解为颜色均方差特征,即皮肤连通域中各个像素分别每一个通道值的均方差。由于肤色检测具有一定的误差,会将一些类似肤色的其它物体(毛发、衣物、家具等)误判为皮肤区域。同一个人的皮肤区域其颜色往往呈现出较强的一致性,因此可以使用连通域内各像素的颜色均方差来衡量该区域是皮肤的置信度。该参数越低,则说明该图像为色情图像的可能性也越高。
针对之前提取的特征,使用机器学习的方式,如支持向量机(SVM)或者神经网络的方式进行训练,得到分类所用的模型。训练可以选用上述一个或多个特征,本申请对此不作限制。
对输入待检测的图像,使用前一步输出的模型进行最终的判断。
需要说明的是,对于前述的方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
参考图4,示出了本申请的一种色情图像侦测的系统实施例1的结构框图,具体可以包括如下模块:
皮肤区域检测模块401,用于检测目标图像中的皮肤区域;
第一判断模块402,用于判断所述皮肤区域在目标图像整体区域中的占比是否大于第一预设阈值,若是,则调用连通域分析模块403;
连通域分析模块403,用于检测所述目标图像中的连通域;
第二判断模块404,用于判断所述连通域在皮肤区域中的分布是否满足预置规则,若是,则判定所述目标图像为色情图像。
在本申请的一种优选实施例中,所述皮肤区域检测模块401可以进一步包括如下子模块:
肤色检测子模块,用于对目标图像进行肤色检测,获得候选皮肤区域;
纹理特征检测子模块,用于在所述候选皮肤区域在目标图像整体区域中的占比大于第一预设阈值时,对所述候选皮肤区域进行纹理特征检测;
皮肤区域确定子模块,用于确定所述纹理特征强度大于第二预设阈值的候选皮肤区域为皮肤区域。
在本申请的一种优选实施例中,所述连通域分析模块403可以进一步包括以下子模块:
最大连通域分析子模块,用于获取各连通域的面积,判断其中面积最大的连通域在皮肤区域中的占比是否大于第三预设阈值;
和/或,
优选连通域分析子模块,用于获取各连通域的面积,判断其中面积大小在前n位的连通域,在皮肤区域中的占比是否大于第四预设阈值,所述n大于1。
更为优选的是,本申请实施例还可以包括如下模块:
脸部区域检测模块,用于检测目标图像中的脸部区域;
第三判断模块,用于判断所述脸部区域在目标图像整体区域中的占比是否小于第五预设阈值,若是,则调用躯干区域检测模块;
躯干区域检测模块,用于根据所述脸部区域估算躯干区域,并检测躯干区域中的皮肤区域;
第四判断模块,用于判断所述躯干区域中的皮肤区域在躯干区域中的占比是否超过第六预设阈值,若是,则判定所述目标图像为色情图像。
在具体实现中,所述第一预设阈值可以为20%;所述纹理特征检测可以采用边缘提取算法,所述第二预设阈值可以为5;所述第三预设阈值可以为5%;所述n可以为3,所述第四预设阈值可以为50%;所述第五预设阈值可以为65%;所述第六预设阈值可以75%。
参考图5,示出了本申请的一种色情图像侦测的系统实施例2的结构框图,具体可以包括如下模块:
样本皮肤检测模块501,用于检测样本图像中的皮肤区域;所述样本图像包括正样本图像和反样本图像;
第五判断模块502,用于判断所述皮肤区域在当前样本图像整体区域中的占比大于第一预设阈值,若是,则调用连通域检测模块503;
连通域检测模块503,用于检测所述样本图像中的连通域;
特征提取模块504,用于针对所述正样本图像和反样本图像中,连通域面积大小在前m位的目标连通域提取预设特征;
模型生成模块505,用于根据所提取的预设特征生成分类模型;
模型判断模块506,用于将待检测的目标图像输入分类模型,判断是否为色情图像。
作为本申请实施例的一种优选示例,所述预设特征具体可以包括:
第一特征:所述目标连通域的面积在当前样本图像中的占比;
和/或,
第二特征:所述目标连通域最小外接椭圆的中心与当前样本图像中心的距离;
和/或,
第三特征:所述目标连通域最小外接椭圆的长轴与水平或者垂直方向的最小夹角;
和/或,
第四特征:所述目标连通域最小外接椭圆的长轴与短轴的比例;
和/或,
第五特征:所述目标连通域中皮肤区域的面积占整个目标连通域面积的比例;
和/或,
第六特征:所述目标连通域中皮肤区域的各像素所对应的每一个通道值的均方差。
对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
以上对本申请所提供的一种色情图像侦测的方法和系统,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (11)

1.一种色情图像侦测的方法,其特征在于,包括:
检测目标图像中的皮肤区域;
若所述皮肤区域的面积在目标图像整体区域中的占比大于第一预设阈值,则检测所述目标图像中的连通域;
判断所述连通域在皮肤区域中的分布是否满足预置规则,若是,则判定所述目标图像为色情图像;
其中,所述判断连通域在皮肤区域中的分布是否满足预置规则的步骤进一步包括:
获取各连通域的面积,判断其中面积最大的连通域在皮肤区域中的占比是否大于第三预设阈值;
和/或,
获取各连通域的面积,判断其中面积大小在前n位的连通域,在皮肤区域中的占比是否大于第四预设阈值,所述n大于1。
2.根据权利要求1所述的方法,其特征在于,所述检测目标图像中的皮肤区域的步骤进一步包括:
对目标图像进行肤色检测,获得候选皮肤区域;
在所述候选皮肤区域在目标图像整体区域中的占比大于第一预设阈值时,对所述候选皮肤区域进行纹理特征检测;
确定所述纹理特征强度大于第二预设阈值的候选皮肤区域为皮肤区域。
3.根据权利要求2所述的方法,其特征在于,在所述判定目标图像为色情图像的步骤之前,还包括:
检测目标图像中的脸部区域;
若所述脸部区域在目标图像整体区域中的占比小于第五预设阈值,则根据所述脸部区域估算躯干区域,并检测躯干区域中的皮肤区域;
若所述躯干区域中的皮肤区域在躯干区域中的占比超过第六预设阈值,则判定所述目标图像为色情图像。
4.根据权利要求3所述的方法,其特征在于,所述第一预设阈值为20%;所述纹理特征检测采用边缘提取算法,所述第二预设阈值为5;所述第三预设阈值为5%;所述n为3,所述第四预设阈值为50%;所述第五预设阈值为65%;所述第六预设阈值75%。
5.一种色情图像侦测的方法,其特征在于,包括:
检测样本图像中的皮肤区域;所述样本图像包括正样本图像和反样本图像;
若所述皮肤区域的面积在当前样本图像整体区域中的占比大于第一预设阈值,则检测所述样本图像中的连通域;
针对所述正样本图像和反样本图像中,连通域面积大小在前m位的目标连通域提取预设特征;
根据所提取的预设特征生成分类模型;
将待检测的目标图像输入分类模型,判断是否为色情图像;
其中,所述预设特征包括:
第二特征:所述目标连通域最小外接椭圆的中心与当前样本图像中心的距离;
和/或,
第三特征:所述目标连通域最小外接椭圆的长轴与水平或者垂直方向的最小夹角;
和/或,
第四特征:所述目标连通域最小外接椭圆的长轴与短轴的比例;
和/或,
第五特征:所述目标连通域中皮肤区域的面积占整个目标连通域面积的比例;
和/或,
第六特征:所述目标连通域中皮肤区域的各像素所对应的每一个通道值的均方差。
6.根据权利要求5所述的方法,其特征在于,所述预设特征包括:
第一特征:所述目标连通域的面积在当前样本图像中的占比。
7.一种色情图像侦测的系统,其特征在于,包括:
皮肤区域检测模块,用于检测目标图像中的皮肤区域;
第一判断模块,用于判断所述皮肤区域的面积在目标图像整体区域中的占比是否大于第一预设阈值,若是,则调用连通域分析模块;
连通域分析模块,用于检测所述目标图像中的连通域;
第二判断模块,用于判断所述连通域在皮肤区域中的分布是否满足预置规则,若是,则判定所述目标图像为色情图像;
其中,所述连通域分析模块进一步包括:
最大连通域分析子模块,用于获取各连通域的面积,判断其中面积最大的连通域在皮肤区域中的占比是否大于第三预设阈值;
和/或,
优选连通域分析子模块,用于获取各连通域的面积,判断其中面积大小在前n位的连通域,在皮肤区域中的占比是否大于第四预设阈值,所述n大于1。
8.根据权利要求7所述的系统,其特征在于,所述皮肤区域检测模块进一步包括:
肤色检测子模块,用于对目标图像进行肤色检测,获得候选皮肤区域;
纹理特征检测子模块,用于在所述候选皮肤区域在目标图像整体区域中的占比大于第一预设阈值时,对所述候选皮肤区域进行纹理特征检测;
皮肤区域确定子模块,用于确定所述纹理特征强度大于第二预设阈值的候选皮肤区域为皮肤区域。
9.根据权利要求7或8所述的系统,其特征在于,还包括:
脸部区域检测模块,用于检测目标图像中的脸部区域;
第三判断模块,用于判断所述脸部区域在目标图像整体区域中的占比是否小于第五预设阈值,若是,则调用躯干区域检测模块;
躯干区域检测模块,用于根据所述脸部区域估算躯干区域,并检测躯干区域中的皮肤区域;
第四判断模块,用于判断所述躯干区域中的皮肤区域在躯干区域中的占比是否超过第六预设阈值,若是,则判定所述目标图像为色情图像。
10.一种色情图像侦测的系统,其特征在于,包括:
样本皮肤检测模块,用于检测样本图像中的皮肤区域;所述样本图像包括正样本图像和反样本图像;
第五判断模块,用于判断所述皮肤区域的面积在当前样本图像整体区域中的占比大于第一预设阈值,若是,则调用连通域检测模块;
连通域检测模块,用于检测所述样本图像中的连通域;
特征提取模块,用于针对所述正样本图像和反样本图像中,连通域面积大小在前m位的目标连通域提取预设特征;
模型生成模块,用于根据所提取的预设特征生成分类模型;
模型判断模块,用于将待检测的目标图像输入分类模型,判断是否为色情图像;
其中,所述预设特征包括:
第二特征:所述目标连通域最小外接椭圆的中心与当前样本图像中心的距离;
和/或,
第三特征:所述目标连通域最小外接椭圆的长轴与水平或者垂直方向的最小夹角;
和/或,
第四特征:所述目标连通域最小外接椭圆的长轴与短轴的比例;
和/或,
第五特征:所述目标连通域中皮肤区域的面积占整个目标连通域面积的比例;
和/或,
第六特征:所述目标连通域中皮肤区域的各像素所对应的每一个通道值的均方差。
11.根据权利要求10所述的系统,其特征在于,所述预设特征包括:
第一特征:所述目标连通域的面积在当前样本图像中的占比。
CN201110336168.6A 2011-10-28 2011-10-28 一种色情图像侦测的方法和系统 Active CN103093180B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201110336168.6A CN103093180B (zh) 2011-10-28 2011-10-28 一种色情图像侦测的方法和系统
HK13107589.7A HK1180424A1 (zh) 2011-10-28 2013-06-28 種色情圖像偵測的方法和系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110336168.6A CN103093180B (zh) 2011-10-28 2011-10-28 一种色情图像侦测的方法和系统

Publications (2)

Publication Number Publication Date
CN103093180A CN103093180A (zh) 2013-05-08
CN103093180B true CN103093180B (zh) 2016-06-29

Family

ID=48205732

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110336168.6A Active CN103093180B (zh) 2011-10-28 2011-10-28 一种色情图像侦测的方法和系统

Country Status (2)

Country Link
CN (1) CN103093180B (zh)
HK (1) HK1180424A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103839076B (zh) * 2014-02-25 2017-05-10 中国科学院自动化研究所 一种基于光照特征的网络敏感图像识别方法
CN103971135A (zh) * 2014-05-05 2014-08-06 中国民航大学 基于头肩深度信息特征的人体目标检测方法
KR20170017583A (ko) * 2015-08-07 2017-02-15 주식회사 더아이콘티비 컨텐츠 제공 장치
WO2018023710A1 (zh) * 2016-08-05 2018-02-08 黄新勇 视频安全播放方法及系统
CN106446803A (zh) * 2016-09-07 2017-02-22 北京小米移动软件有限公司 直播内容识别处理方法、装置及设备
CN107103628A (zh) * 2017-03-22 2017-08-29 北京安博通科技股份有限公司 图像检测方法及装置
CN107403200A (zh) * 2017-08-10 2017-11-28 北京亚鸿世纪科技发展有限公司 改进图像分割算法结合深度学习的多重不良图片分类方法
CN108805069A (zh) * 2018-06-04 2018-11-13 上海东方报业有限公司 影像检测方法及装置
CN110533659A (zh) 2019-09-03 2019-12-03 安翰科技(武汉)股份有限公司 消化道图像判断方法及包括其的消化道清洁程度判断方法及其计算机设备和可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101359372A (zh) * 2008-09-26 2009-02-04 腾讯科技(深圳)有限公司 分类器的训练方法及装置、识别敏感图片的方法及装置
CN102163286A (zh) * 2010-02-24 2011-08-24 中国科学院自动化研究所 一种色情图像评价方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8358837B2 (en) * 2008-05-01 2013-01-22 Yahoo! Inc. Apparatus and methods for detecting adult videos

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101359372A (zh) * 2008-09-26 2009-02-04 腾讯科技(深圳)有限公司 分类器的训练方法及装置、识别敏感图片的方法及装置
CN102163286A (zh) * 2010-02-24 2011-08-24 中国科学院自动化研究所 一种色情图像评价方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
图像过滤关键技术的研究及应用;冯军红;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20030915(第03期);第2、19-20、31-39、44-46页 *
基于内容的敏感图像判别模型的设计;彭浩林 等;《图形图像》;20101231(第09期);第49页 *
基于内容的敏感图像过滤系统研究与设计;刘达志;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20060415(第04期);第31、38-45页,图3.3 *
实际网络环境中不良图片的过滤方法;王一丁;《通信学报》;20091031;第30卷(第10A期);第103-106页 *

Also Published As

Publication number Publication date
HK1180424A1 (zh) 2013-10-18
CN103093180A (zh) 2013-05-08

Similar Documents

Publication Publication Date Title
CN103093180B (zh) 一种色情图像侦测的方法和系统
Raghunandan et al. Object detection algorithms for video surveillance applications
Shuhua et al. The application of improved HSV color space model in image processing
Yang et al. Research on a skin color detection algorithm based on self-adaptive skin color model
Sankowski et al. Reliable algorithm for iris segmentation in eye image
Lakshmi et al. Segmentation algorithm for multiple face detection in color images with skin tone regions using color spaces and edge detection techniques
Ishikura et al. Saliency detection based on multiscale extrema of local perceptual color differences
Chandrappa et al. Face detection in color images using skin color model algorithm based on skin color information
Li et al. Face detection in complex background based on skin color features and improved AdaBoost algorithms
Tabrizi et al. Open/closed eye analysis for drowsiness detection
Chen et al. Fast face detection algorithm based on improved skin-color model
Devi et al. Driver drowsiness detection using skin color algorithm and circular hough transform
Zaidan et al. A new hybrid module for skin detector using fuzzy inference system structure and explicit rules
Dwina et al. Skin segmentation based on improved thresholding method
Manaf et al. Color recognition system with augmented reality concept and finger interaction: Case study for color blind aid system
Xu et al. Similarity measures for content-based image retrieval based on intuitionistic fuzzy set theory.
Yusuf et al. Human face detection using skin color segmentation and watershed algorithm
Jusoh et al. Skin detection based on thresholding in RGB and hue component
Berbar Skin colour correction and faces detection techniques based on HSL and R colour components
Niu et al. Color edge detection based on direction information measure
He Mask wearing detection method based on the skin color and eyes detection
Nallaperumal et al. Human face detection in color images using skin color and template matching models for multimedia on the Web
CN112949367A (zh) 基于视频流数据的工作服颜色检测方法及装置
CN112052912A (zh) 一种消防机器人智能火焰燃烧状态识别方法
Devi et al. Active facial tracking

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1180424

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1180424

Country of ref document: HK