CN105740752A - 敏感图片过滤方法和系统 - Google Patents

敏感图片过滤方法和系统 Download PDF

Info

Publication number
CN105740752A
CN105740752A CN201410768418.7A CN201410768418A CN105740752A CN 105740752 A CN105740752 A CN 105740752A CN 201410768418 A CN201410768418 A CN 201410768418A CN 105740752 A CN105740752 A CN 105740752A
Authority
CN
China
Prior art keywords
picture
human body
sensitization
information
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410768418.7A
Other languages
English (en)
Other versions
CN105740752B (zh
Inventor
林志聪
周国盛
张颖
司徒海富
陈剑恒
马幸晖
黄柑波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyi Digital Life Technology Co Ltd
Original Assignee
CENTURY DRAGON INFORMATION NETWORK Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CENTURY DRAGON INFORMATION NETWORK Co Ltd filed Critical CENTURY DRAGON INFORMATION NETWORK Co Ltd
Priority to CN201410768418.7A priority Critical patent/CN105740752B/zh
Publication of CN105740752A publication Critical patent/CN105740752A/zh
Application granted granted Critical
Publication of CN105740752B publication Critical patent/CN105740752B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

一种敏感图片过滤方法和系统,其方法包括:读取待过滤的图片,利用人体部位结构特征库对所述图片进行人体部位识别,筛选出含有人体部位信息的图片,其中,所述人体部位结构特征库是各种人体部位结构信息的集合;对筛选出的图片进行人体肤色识别,获取图片中人体肤色区域的总面积;识别图片中的人体正常裸露部位,并获取人体正常裸露部位的人体肤色区域面积;计算所述图片中人体肤色区域的总面积与所述人体正常裸露部位的人体肤色区域面积的面积差值;将所述面积差值除以所述图片中人体肤色区域的总面积得到敏感图片判据;根据所述敏感图片判据判断所述图片是否为敏感图片,若是敏感图片则将其过滤。本申请提高了过滤的准确率。

Description

敏感图片过滤方法和系统
技术领域
本发明涉及图像处理技术领域,特别是涉及一种敏感图片过滤方法和系统。
背景技术
随着互联网信息量的日益丰富,不良信息也越来越多。不良信息中的色情图片等敏感图片污染社会风气,危害青少年的身心健康,识别并拦截这类敏感图片是净化互联网内容的一项关键任务。
考虑到敏感图片绝大多数都是存在大面积人体皮肤裸露的,而检测人体裸露皮肤相对比直接检测出敏感图片容易,因此人体裸露皮肤检测是达到敏感图片过滤的一种有效的启发式办法。
目前敏感图片过滤方法是通过计算图片中皮肤颜色面积占图片面积比例,若该值大于某一阈值,则视为敏感图片,将其过滤。这种方法的准确率非常低,并且会造成大量的误过滤。
发明内容
基于此,有必要针对过滤敏感图片准确率低的问题,提供一种敏感图片过滤方法和系统。
一种敏感图片过滤方法,包括:
读取待过滤的图片,利用人体部位结构特征库对所述图片进行人体部位识别,筛选出含有人体部位信息的图片,其中,所述人体部位结构特征库是各种人体部位结构信息的集合;
对筛选出的图片进行人体肤色识别,获取图片中人体肤色区域的总面积;
识别图片中的人体正常裸露部位,并获取人体正常裸露部位的人体肤色区域面积;
计算所述图片中人体肤色区域的总面积与所述人体正常裸露部位的人体肤色区域面积的面积差值;将所述面积差值除以所述图片中人体肤色区域的总面积得到敏感图片判据;
根据所述敏感图片判据判断所述图片是否为敏感图片,若是敏感图片则将其过滤。
一种敏感图片过滤系统,包括:
人体部位识别模块,用于读取待过滤的图片,利用人体部位结构特征库对所述图片进行人体部位识别,筛选出含有人体部位信息的图片,其中,所述人体部位结构特征库是各种人体部位结构信息的集合;
第一面积获取模块,用于对筛选出的图片进行人体肤色识别,获取图片中人体肤色区域的总面积;
第二面积获取模块,用于识别图片中的人体正常裸露部位,并获取人体正常裸露部位的人体肤色区域面积;
敏感图片判据计算模块,用于计算所述图片中人体肤色区域的总面积与所述人体正常裸露部位的人体肤色区域面积的面积差值;将所述面积差值除以所述图片中人体肤色区域的总面积得到敏感图片判据;
过滤模块,用于根据所述敏感图片判据判断所述图片是否为敏感图片,若是敏感图片则将其过滤。
上述敏感图片过滤方法和系统,通过先筛选出含有人体部位信息的图片,对筛选出的图片进行人体肤色识别,获取图片中人体肤色区域的总面积;识别图片中的人体正常裸露部位,并获取人体正常裸露部位的人体肤色区域面积;通过计算图片中人体肤色区域的总面积与人体正常裸露部位的人体肤色区域面积的面积差值;将面积差值除以图片中人体肤色区域的总面积得到敏感图片判据;从而根据敏感图片判据判断图片是否为敏感图片,若是敏感图片则将其过滤。通过先人体部位识别,再对识别出来的图片进行人体肤色识别,同时,敏感图片判据是根据总面积与人体正常裸露部位区域面积的面积差值与总面积的比值得到,大大的提高了识别敏感图片的准确率,从而提高了过滤敏感图片的准确率。
附图说明
图1为本发明敏感图片过滤方法实施例的流程示意图;
图2为本发明敏感图片过滤方法具体应用实例流程示意图;
图3为本发明具体应用实例中肤色风险检测流程示意图;
图4为本发明具体应用实例中命中区域示意图;
图5为本发明敏感图片过滤系统实施例的结构示意图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细说明,但本发明的实施方式不限于此。
如图1所示,为本发明敏感图片过滤方法实施例的流程示意图,包括步骤:
步骤S101:读取待过滤的图片,利用人体部位结构特征库对所述图片进行人体部位识别,筛选出含有人体部位信息的图片,其中,所述人体部位结构特征库是各种人体部位结构信息的集合;
本步骤主要是进行第一重筛选,筛选出含有人体部位信息的图片,对筛选出来的图片进行以下操作,进而提高了筛选效率。
步骤S102:对筛选出的图片进行人体肤色识别,获取图片中人体肤色区域的总面积;
肤色是指人类皮肤表皮层因黑色素、原血红素、叶红素等色素沉着所反映出的皮肤颜色。肤色在不同地区及人群有不同的分布。在其中一个实施例中,可以根据地区的不同划分不同肤色,建立地区与肤色对应的列表。根据地区与肤色对应的列表对筛选出的图片进行人体肤色识别。
进行人体肤色识别的方法有很多种,比如可以对筛选出的图片中的像素采用贝叶斯Bayes决策方法进行肤色判别。该方法在一个大样本集上统计皮肤颜色和非皮肤颜色的分布,对一种给定的颜色,根据两个分布使用Bayes公式计算出该颜色是皮肤颜色的后验概率,根据概率大小决定其是皮肤色还是非皮肤色。还可以利用YUV、RGB、RG、HSB等皮肤检测算法进行肤色判别。
通过进行人体肤色识别,可以获取图片中人体肤色区域的总面积,在其中一个实施例中,可以进一步获取图片中人物的人体肤色区域的总面积。
步骤S103:识别图片中的人体正常裸露部位,并获取人体正常裸露部位的人体肤色区域面积;
人体正常裸露部位可以是事先设定好的人体部位,比如,可以是头部、手部、脚部等。在识别图形中的人体正常裸露部位时,可以采用命中区域的方式进行识别。比如,可以用方形框识别出大概的脸部区域,然后获取方形框内人体肤色区域面积,该面积即为脸部的人体肤色区域面积。
步骤S104:计算所述图片中人体肤色区域的总面积与所述人体正常裸露部位的人体肤色区域面积的面积差值;将所述面积差值除以所述图片中人体肤色区域的总面积得到敏感图片判据;
比如,可以采用以下公式计算敏感图片判据:
S = S 1 - S 2 S 1
其中,S表示敏感图片判据,S1表示图片中人体肤色区域的总面积,S2表示人体正常裸露部位的人体肤色区域面积。
步骤S105:根据所述敏感图片判据判断所述图片是否为敏感图片,若是敏感图片则将其过滤。
根据敏感图片判据判断图片是否为敏感图片的方法有很多种,具体的,可以根据敏感图片与阈值的关系判断图片是否为敏感图片。比如,可以直接将敏感图片判据与预设的阈值进行比较判断,当大于预设的阈值时,判定该图片为敏感图片。所谓敏感图片可以是低俗、色情类的图片。
本实施例先进行人体部位识别,再对识别出来的图片进行人体肤色识别,同时,敏感图片判据是根据总面积与人体正常裸露部位区域面积的面积差值与总面积的比值得到,大大的提高了识别敏感图片的准确率,从而提高了过滤敏感图片的准确率。
根据敏感图片判据判断图片是否为敏感图片的方法有很多中。在其中一个实施例中,所述根据所述敏感图片判据判断所述图片是否为敏感图片步骤,包括:
获取所述图片的上下文文字信息及其信息源;
判断是否所述上下文文字信息存在敏感文字数据库中的敏感文字、所述信息源为不可靠信息源、所述敏感图片判据大于第一预设阈值;
当满足上下文文字信息存在敏感文字、信息源为不可靠信息源、敏感图片判据大于第一预设阈值中至少两个条件时,判定所述图片为敏感图片;
其中,所述信息源为传输信息的信息发布平台,信息源包括可靠信息源和不可靠信息源,所述可靠信息源为通过正常传输途径传输信息的正常的信息发布平台。
本实施例通过综合考虑上下文文字信息、信息源和敏感图片判据,通过对图片上下文内容进行语义分析,判断是否包敏感文字;判断信息源是否可靠,判断敏感图片判据是否大于阈值,只要满足其中两个条件就认为图片是敏感图片的可能性很大,将其过滤。该实施例具有较高的检测成功率,有效过滤互联网中的低俗及色情图片;具有较低的误报率,确保正常图片的展示,提高用户体验。
例如,将上下文文字信息存在敏感文字视为上下文信息风险,将敏感图片判据大于第一预设阈值视为肤色风险,则如表1,根据信号源、上下文信息风险和肤色风险判断图片是否为敏感图片的策略为:
表1
进一步的,为了提高判断效率,可以依次从人体正面、人体侧面、人体上半身、人体下半身的顺序对图片进行人体部位识别,不同的人体检测类型(人体正面、人体侧面、人体上半身、人体下半身)对应不同的阈值,根据对预设张(比如上万张)图片进行测试和统计,得到每种人体类型的阈值。
在另一个实施例中,所述根据所述敏感图片判据判断所述图片是否为敏感图片步骤,包括:
获取所述图片的上下文文字信息;
判断所述上下文文字信息是否存在敏感文字数据库中的敏感文字;
若存在,根据所述敏感文字数据库中敏感文字对应的敏感加权值,计算所述上下文文字信息的敏感度;
将所述敏感图片判据与预设的肤色敏感加权值相乘,获得肤色的敏感度;
将所述上下文文字信息的敏感度和所述肤色的敏感度求和,获得图片的敏感度,将所述图片的敏感度与第二预设阈值比较,判断所述图片是否为敏感图片。
敏感文字可以是低俗及色情类型的文字。肤色敏感加权值是根据肤色判断图片是敏感图片的风险权重,敏感文字对应的敏感加权值是根据敏感文字判断图片是敏感图片的风险权重。敏感度即图片是敏感图片的风险值。
通过肤色敏感加权值确定肤色的敏感度,通过敏感加权值确定上下文文字信息的敏感度,从而将两个敏感度求和得到图片的敏感度。判断图片的敏感度是否大于第二预设阈值,大于第二预设阈值时,判定图片为敏感图片。通过敏感度的方式,更准确的判断出图片是否为敏感图片。
在其中一个实施例中,所述根据所述敏感图片判据判断所述图片是否为敏感图片步骤,包括:
获取所述图片及其上下文文字信息的信息源;
判断所述信息源是否为可靠信息源;
当所述信息源为不可靠信息源时,基于预存的各不可靠信息源与敏感度的关系获取所述信息源对应的敏感度;
将所述敏感图片判据与预设的肤色敏感加权值相乘,获得肤色的敏感度;
将所述信息源对应的敏感度和所述肤色的敏感度求和,获得图片的敏感度,将所述图片的敏感度与第三预设阈值比较,判断所述图片是否为敏感图片;
其中,所述信息源为传输信息的信息发布平台,信息源包括可靠信息源和不可靠信息源,所述可靠信息源为通过正常传输途径传输信息的正常的信息发布平台。
可靠信息源可以是官方或权威媒体,内容质量有保证。比如,可以是人民网、新华网等。只要不是可靠信息源的信息源均认为是不可靠信息源。即通过不正常途径传输的平台或不正常平台都认为是不可靠信息源。可以事先存储不同不可靠信息源对应的敏感度。敏感度即图片是敏感图片的风险值。肤色敏感加权值是根据肤色判断图片是敏感图片的风险权重。
本实施例通过将不可靠信息源对应的敏感度与肤色的敏感度求和得到图片的敏感度,判断图片的敏感度是否大于第三预设阈值,大于第三预设阈值时,判定图片为敏感图片。通过敏感度的方式,更准确的判断出图片是否为敏感图片。
进一步的,还可以同时对上下文文字信息风险和信息源风险进行判断,提高判断的准确性,即所述根据所述敏感图片判据判断所述图片是否为敏感图片步骤,包括:
获取所述图片的上下文文字信息、及其上下文文字信息的信息源;
判断所述上下文文字信息是否存在敏感文字数据库中的敏感文字;若存在,根据所述敏感文字数据库中敏感文字对应的敏感加权值,计算所述上下文文字信息的敏感度;
判断所述信息源是否为可靠信息源;当所述信息源为不可靠信息源时,基于预存的各不可靠信息源与敏感度的关系获取所述信息源对应的敏感度;
将所述敏感图片判据与预设的肤色敏感加权值相乘,获得肤色的敏感度;
将所述上下文文字信息的敏感度、所述信息源对应的敏感度及所述肤色的敏感度求和,获得图片的敏感度,将所述图片的敏感度与第四预设阈值比较,判断所述图片是否为敏感图片;
其中,所述信息源为传输信息的信息发布平台,信息源包括可靠信息源和不可靠信息源,所述可靠信息源为通过正常传输途径传输信息的正常的信息发布平台。
在其中一个实施例中,所述对筛选出的图片进行人体肤色识别步骤之前,还包括:
对所述图片进行灰度识别,若所述图片为灰度图,则获取所述图片的上下文文字信息及其信息源;
判断是否所述上下文文字信息存在敏感文字数据库中的敏感文字、所述信息源为不可靠信息源;
若所述上下文文字信息存在敏感文字、且信息源为不可靠信息源,则判定所述图片为敏感图片;
其中,所述信息源为传输信息的信息发布平台,信息源包括可靠信息源和不可靠信息源,所述可靠信息源为通过正常传输途径传输信息的正常的信息发布平台。
当图片为灰度图时,则无法通过肤色进行判断,此时,只有在上下文文字信息存在敏感文字、且信息源为不可靠信息源,则判定图片为敏感图片,以便避免误判。
当然,若图片不是灰度图时,则可以执行步骤S102至步骤S105。
在其中一个实施例中,为了提高判断效率,可以依次从人体正面、人体侧面、人体上半身、人体下半身的顺序对图片进行人体部位识别,即按照由易到难的顺序进行识别。具体的,所述利用人体部位结构特征库对所述图片进行人体部位识别步骤,包括:
根据人体部位结构特征库检测所述图片中是否存在人体的正面脸部结构;
若存在,则将该图片识别为含有人体部位信息的图片,若不存在,根据人体部位结构特征库检测所述图片中是否存在人体的侧面脸部结构;
若存在,则将该图片识别为含有人体部位信息的图片,若不存在,根据人体部位结构特征库检测所述图片中是否存在人体的上半身结构;
若存在,则将该图片识别为含有人体部位信息的图片,若不存在,根据人体部位结构特征库检测所述图片中是否存在人体的下半身结构;
若存在,则将该图片识别为含有人体部位信息的图片。
在其中一个实施例中,所述利用人体部位结构特征库对所述图片进行人体部位识别步骤,包括:
检测所述图片的像素值,当所述像素值大于设定像素值时,将所述图片进行压缩,利用人体部位结构特征库对压缩后的图片进行人体部位识别。
本实施例通过将大于设定像素值的图片进行压缩,从而可以提高处理速度。这里的压缩是指将大像素值的图片缩小为小像素的图片。
在其中一个实施例中,为了提高人体部位识别的准确性,可以通过旋转或翻转的方式,多方位的对图片进行人体部位识别。具体的,所述利用人体部位结构特征库对所述图片进行人体部位识别步骤,包括:
利用人体部位结构特征库检测所述图片中是否存在人体部位信息,若不存在,以设定角度旋转或水平翻转所述图片,利用人体部位结构特征库检测旋转或翻转后的图片中是否存在人体部位信息。
以上实施方式中的各种技术特征可以任意进行组合,只要特征之间的组合不存在冲突或矛盾,但是限于篇幅,未进行一一描述,因此上述实施方式中的各种技术特征的任意进行组合也属于本说明书公开的范围。
本方案还举其中一个具体应用实例进行说明。
整体流程可以如图2所示,为本发明敏感图片过滤方法具体应用实例流程示意图。其中,如图3所示,为本发明具体应用实例中肤色风险检测流程示意图。具体流程如下:
A)对图片进行人体检测,将图片进行分类。
采用OpenCV提供的图像检测特征库,先对图片进行压缩,将宽度大于300像素的图片缩小到300像素,在不影响检测质量的情况下,提高处理速度。
再依次执行正脸、侧脸、上半身、下半身的检测,使用的是opencv自带的人体部位结构特征库;检测过程中,图片中的人像可能是倾斜的,所以需要对图像进行一定角度的旋转或水平翻转,再执行检测。旋转角度可以是正负30/60/90度,另外,侧脸检测区分左侧脸和右侧脸,所以侧脸检测时需要对图像进行水平翻转。
判断图片中是否存在人体部位信息,如存在,可以将图片划分为以下四类:有正脸、有侧脸、有人体(上半身/下半身)、无人体。
B)在判断是否存在人体部位信息时,对分类后的皮肤颜色检测。
先对图片进行灰度检测,对灰度的图片特殊对待,不进行肤色检测,分类为“灰度有人”和“灰度无人”。
对于彩色图片,根据人体检测得到的命中区域,利用YUV皮肤检测算法,计算命中区域以外的肤色面积占总肤色面积的比例,与设定的阈值进行比较,大于阈值则视为多肤色,小于则视为少肤色。
命中区域概念:图像检测算法检测到的区域。如图4所示,为本发明具体应用实例中命中区域示意图。图4是正脸检测,方框的位置为命中区域。其中,图4只是为了示意命中区域,对于图中人物不进行限定。在有些实施例中可以限定为真实人物图。在有些实施例中图中人物既可以包括真实人物图,也可以包括卡通人物图。
阈值的设定:不同的人体检测类型对应不同的阈值,根据对上万张图片的测试和统计,得到每一种类型的阈值,其中正脸0.7,侧脸0.7,上半身0.5,下半身0.5。
通过步骤A和B,可以将图片再细化划分为以下几类,并定义肤色风险等级,如表格2。
表格2
图片检测结果分类 肤色风险
正脸多肤色
正脸少肤色
侧脸多肤色
侧脸少肤色
有人体多肤色
有人体少肤色
无人多肤色
无人少肤色
灰度有人(正脸、侧脸、人体)
灰度无人
C)对图片上下文文字信息进行语义分析,得到上下文文字信息风险等级
获取图片上下文文字信息(内容)的信息来源,判断是来自可靠信息源还是不可靠信息源;并对图片上下文内容进行语义分析,判断是否包含低俗及色情的关键字,得到文本内容的风险等级。
上下文内容风险等级:有低俗及色情风险,无低俗及色情风险。
信息源类型:可靠信息源、不可靠信息源。
可靠信息源通常是官方或权威媒体,内容质量有保证,如人民网、新华网等;不可靠信息源内容的质量没有保证,风险较高,如小型网站、自媒体和网友上传的内容。
D)结合以上三步A)、B)、C)的结果,制定策略,决定图片是否需要过滤。结合图片检测结果、图片上下文内容的语义分析结果和信息源,制定图片的过滤策略,如表3:
表3
本应用实例使用多种人体特征库进行检测,提高准确率;皮肤颜色占比计算时忽略正常裸露肤色区域的面积;结合图片上下文的信息来源的可靠度和其内容的低俗色情风险等级,提高了低俗及色情图片的准确率和误报率。确保正常图片的展示,提高用户体验。
根据上述敏感图片过滤方法,本发明还提供一种敏感图片过滤系统,如图5所示,为本发明敏感图片过滤系统实施例的结构示意图,包括:
人体部位识别模块510,用于读取待过滤的图片,利用人体部位结构特征库对所述图片进行人体部位识别,筛选出含有人体部位信息的图片,其中,所述人体部位结构特征库是各种人体部位结构信息的集合;
第一面积获取模块520,用于对筛选出的图片进行人体肤色识别,获取图片中人体肤色区域的总面积;
第二面积获取模块530,用于识别图片中的人体正常裸露部位,并获取人体正常裸露部位的人体肤色区域面积;
敏感图片判据计算模块540,用于计算所述图片中人体肤色区域的总面积与所述人体正常裸露部位的人体肤色区域面积的面积差值;将所述面积差值除以所述图片中人体肤色区域的总面积得到敏感图片判据;
过滤模块550,用于根据所述敏感图片判据判断所述图片是否为敏感图片,若是敏感图片则将其过滤。
在其中一个实施例中,所述过滤模块,还用于:
获取所述图片的上下文文字信息及其信息源;
判断是否所述上下文文字信息存在敏感文字数据库中的敏感文字、所述信息源为不可靠信息源、所述敏感图片判据大于第三预设阈值;
当满足上下文文字信息存在敏感文字、信息源为不可靠信息源、敏感图片判据大于第一预设阈值中至少两个条件时,判定所述图片为敏感图片;
其中,所述信息源为传输信息的信息发布平台,信息源包括可靠信息源和不可靠信息源,所述可靠信息源为通过正常传输途径传输信息的正常的信息发布平台。
在其中一个实施例中,所述过滤模块,还用于:
获取所述图片的上下文文字信息;
判断所述上下文文字信息是否存在敏感文字数据库中的敏感文字;
若存在,根据所述敏感文字数据库中敏感文字对应的敏感加权值,计算所述上下文文字信息的敏感度;
将所述敏感图片判据与预设的肤色敏感加权值相乘,获得肤色的敏感度;
将所述上下文文字信息的敏感度和所述肤色的敏感度求和,获得图片的敏感度,将所述图片的敏感度与第二预设阈值比较,判断所述图片是否为敏感图片。
在其中一个实施例中,所述过滤模块,还用于:
获取所述图片及其上下文文字信息的信息源;
判断所述信息源是否为可靠信息源;
当所述信息源为不可靠信息源时,基于预存的各不可靠信息源与敏感度的关系获取所述信息源对应的敏感度;
将所述敏感图片判据与预设的肤色敏感加权值相乘,获得肤色的敏感度;
将所述信息源对应的敏感度和所述肤色的敏感度求和,获得图片的敏感度,将所述图片的敏感度与第三预设阈值比较,判断所述图片是否为敏感图片;
其中,所述信息源为传输信息的信息发布平台,信息源包括可靠信息源和不可靠信息源,所述可靠信息源为通过正常传输途径传输信息的正常的信息发布平台。
在其中一个实施例中,还包括灰度识别过滤模块,用于:
对筛选出的图片进行人体肤色识别步骤之前,对所述图片进行灰度识别,若所述图片为灰度图,则获取所述图片的上下文文字信息及其信息源;
判断是否所述上下文文字信息存在敏感文字数据库中的敏感文字、所述信息源为不可靠信息源;
若所述上下文文字信息存在敏感文字、且信息源为不可靠信息源,则判定所述图片为敏感图片;
其中,所述信息源为传输信息的信息发布平台,信息源包括可靠信息源和不可靠信息源,所述可靠信息源为通过正常传输途径传输信息的正常的信息发布平台。
在其中一个实施例中,所述人体部位识别模块还用于:
根据人体部位结构特征库检测所述图片中是否存在人体的正面脸部结构;
若存在,则将该图片识别为含有人体部位信息的图片,若不存在,根据人体部位结构特征库检测所述图片中是否存在人体的侧面脸部结构;
若存在,则将该图片识别为含有人体部位信息的图片,若不存在,根据人体部位结构特征库检测所述图片中是否存在人体的上半身结构;
若存在,则将该图片识别为含有人体部位信息的图片,若不存在,根据人体部位结构特征库检测所述图片中是否存在人体的下半身结构;
若存在,则将该图片识别为含有人体部位信息的图片。
在其中一个实施例中,所述人体部位识别模块还用于:
检测所述图片的像素值,当所述像素值大于设定像素值时,将所述图片进行压缩,利用人体部位结构特征库对压缩后的图片进行人体部位识别。
在其中一个实施例中,所述人体部位识别模块还用于:
利用人体部位结构特征库检测所述图片中是否存在人体部位信息,若不存在,以设定角度旋转或水平翻转所述图片,利用人体部位结构特征库检测旋转或翻转后的图片中是否存在人体部位信息。
本发明的敏感图片过滤系统与本发明的敏感图片过滤方法是一一对应的,上述敏感图片过滤方法实施例中的相关技术特征及其技术效果均适用于敏感图片过滤系统实施例中,在此不再赘述。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种敏感图片过滤方法,其特征在于,包括:
读取待过滤的图片,利用人体部位结构特征库对所述图片进行人体部位识别,筛选出含有人体部位信息的图片,其中,所述人体部位结构特征库是各种人体部位结构信息的集合;
对筛选出的图片进行人体肤色识别,获取图片中人体肤色区域的总面积;
识别图片中的人体正常裸露部位,并获取人体正常裸露部位的人体肤色区域面积;
计算所述图片中人体肤色区域的总面积与所述人体正常裸露部位的人体肤色区域面积的面积差值;将所述面积差值除以所述图片中人体肤色区域的总面积得到敏感图片判据;
根据所述敏感图片判据判断所述图片是否为敏感图片,若是敏感图片则将其过滤。
2.根据权利要求1所述的敏感图片过滤方法,其特征在于,所述根据所述敏感图片判据判断所述图片是否为敏感图片步骤,包括:
获取所述图片的上下文文字信息及其信息源;
判断是否所述上下文文字信息存在敏感文字数据库中的敏感文字、所述信息源为不可靠信息源、所述敏感图片判据大于第一预设阈值;
当满足上下文文字信息存在敏感文字、信息源为不可靠信息源、敏感图片判据大于第一预设阈值中至少两个条件时,判定所述图片为敏感图片;
其中,所述信息源为传输信息的信息发布平台,信息源包括可靠信息源和不可靠信息源,所述可靠信息源为通过正常传输途径传输信息的正常的信息发布平台。
3.根据权利要求1所述的敏感图片过滤方法,其特征在于,所述根据所述敏感图片判据判断所述图片是否为敏感图片步骤,包括:
获取所述图片的上下文文字信息;
判断所述上下文文字信息是否存在敏感文字数据库中的敏感文字;
若存在,根据所述敏感文字数据库中敏感文字对应的敏感加权值,计算所述上下文文字信息的敏感度;
将所述敏感图片判据与预设的肤色敏感加权值相乘,获得肤色的敏感度;
将所述上下文文字信息的敏感度和所述肤色的敏感度求和,获得图片的敏感度,将所述图片的敏感度与第二预设阈值比较,判断所述图片是否为敏感图片。
4.根据权利要求1所述的敏感图片过滤方法,其特征在于,所述根据所述敏感图片判据判断所述图片是否为敏感图片步骤,包括:
获取所述图片及其上下文文字信息的信息源;
判断所述信息源是否为可靠信息源;
当所述信息源为不可靠信息源时,基于预存的各不可靠信息源与敏感度的关系获取所述信息源对应的敏感度;
将所述敏感图片判据与预设的肤色敏感加权值相乘,获得肤色的敏感度;
将所述信息源对应的敏感度和所述肤色的敏感度求和,获得图片的敏感度,将所述图片的敏感度与第三预设阈值比较,判断所述图片是否为敏感图片;
其中,所述信息源为传输信息的信息发布平台,信息源包括可靠信息源和不可靠信息源,所述可靠信息源为通过正常传输途径传输信息的正常的信息发布平台。
5.根据权利要求1所述的敏感图片过滤方法,其特征在于,所述对筛选出的图片进行人体肤色识别步骤之前,还包括:
对所述图片进行灰度识别,若所述图片为灰度图,则获取所述图片的上下文文字信息及其信息源;
判断是否所述上下文文字信息存在敏感文字数据库中的敏感文字、所述信息源为不可靠信息源;
若所述上下文文字信息存在敏感文字、且信息源为不可靠信息源,则判定所述图片为敏感图片;
其中,所述信息源为传输信息的信息发布平台,信息源包括可靠信息源和不可靠信息源,所述可靠信息源为通过正常传输途径传输信息的正常的信息发布平台。
6.根据权利要求1至5任意一项所述的敏感图片过滤方法,其特征在于,所述利用人体部位结构特征库对所述图片进行人体部位识别步骤,包括:
根据人体部位结构特征库检测所述图片中是否存在人体的正面脸部结构;
若存在,则将该图片识别为含有人体部位信息的图片,若不存在,根据人体部位结构特征库检测所述图片中是否存在人体的侧面脸部结构;
若存在,则将该图片识别为含有人体部位信息的图片,若不存在,根据人体部位结构特征库检测所述图片中是否存在人体的上半身结构;
若存在,则将该图片识别为含有人体部位信息的图片,若不存在,根据人体部位结构特征库检测所述图片中是否存在人体的下半身结构;
若存在,则将该图片识别为含有人体部位信息的图片。
7.根据权利要求1至5任意一项所述的敏感图片过滤方法,其特征在于,所述利用人体部位结构特征库对所述图片进行人体部位识别步骤,包括:
检测所述图片的像素值,当所述像素值大于设定像素值时,将所述图片进行压缩,利用人体部位结构特征库对压缩后的图片进行人体部位识别。
8.根据权利要求1至5任意一项所述的敏感图片过滤方法,其特征在于,所述利用人体部位结构特征库对所述图片进行人体部位识别步骤,包括:
利用人体部位结构特征库检测所述图片中是否存在人体部位信息,若不存在,以设定角度旋转或水平翻转所述图片,利用人体部位结构特征库检测旋转或翻转后的图片中是否存在人体部位信息。
9.一种敏感图片过滤系统,其特征在于,包括:
人体部位识别模块,用于读取待过滤的图片,利用人体部位结构特征库对所述图片进行人体部位识别,筛选出含有人体部位信息的图片,其中,所述人体部位结构特征库是各种人体部位结构信息的集合;
第一面积获取模块,用于对筛选出的图片进行人体肤色识别,获取图片中人体肤色区域的总面积;
第二面积获取模块,用于识别图片中的人体正常裸露部位,并获取人体正常裸露部位的人体肤色区域面积;
敏感图片判据计算模块,用于计算所述图片中人体肤色区域的总面积与所述人体正常裸露部位的人体肤色区域面积的面积差值;将所述面积差值除以所述图片中人体肤色区域的总面积得到敏感图片判据;
过滤模块,用于根据所述敏感图片判据判断所述图片是否为敏感图片,若是敏感图片则将其过滤。
10.根据权利要求9所述的敏感图片过滤系统,其特征在于,所述过滤模块,还用于:
获取所述图片的上下文文字信息及其信息源;
判断是否所述上下文文字信息存在敏感文字数据库中的敏感文字、所述信息源为不可靠信息源、所述敏感图片判据大于第三预设阈值;
当满足上下文文字信息存在敏感文字、信息源为不可靠信息源、敏感图片判据大于第一预设阈值中至少两个条件时,判定所述图片为敏感图片;
其中,所述信息源为传输信息的信息发布平台,信息源包括可靠信息源和不可靠信息源,所述可靠信息源为通过正常传输途径传输信息的正常的信息发布平台。
CN201410768418.7A 2014-12-11 2014-12-11 敏感图片过滤方法和系统 Active CN105740752B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410768418.7A CN105740752B (zh) 2014-12-11 2014-12-11 敏感图片过滤方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410768418.7A CN105740752B (zh) 2014-12-11 2014-12-11 敏感图片过滤方法和系统

Publications (2)

Publication Number Publication Date
CN105740752A true CN105740752A (zh) 2016-07-06
CN105740752B CN105740752B (zh) 2021-05-11

Family

ID=56240836

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410768418.7A Active CN105740752B (zh) 2014-12-11 2014-12-11 敏感图片过滤方法和系统

Country Status (1)

Country Link
CN (1) CN105740752B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446803A (zh) * 2016-09-07 2017-02-22 北京小米移动软件有限公司 直播内容识别处理方法、装置及设备
CN108805069A (zh) * 2018-06-04 2018-11-13 上海东方报业有限公司 影像检测方法及装置
CN110210542A (zh) * 2019-05-24 2019-09-06 厦门美柚信息科技有限公司 图片文字识别模型训练方法、装置及文字识别系统
CN112528996A (zh) * 2020-12-22 2021-03-19 北京百度网讯科技有限公司 图片处理方法、装置、设备、存储介质和计算机程序产品
CN115633166A (zh) * 2022-09-27 2023-01-20 北京星绚文化传播有限公司 一种视频检测方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101324888A (zh) * 2007-06-13 2008-12-17 北京恒金恒泰信息技术有限公司 基于ie的过滤色情软件插件
CN101923652A (zh) * 2010-07-23 2010-12-22 华中师范大学 一种基于肤色和特征部位联合检测的色情图片识别方法
KR20110012302A (ko) * 2009-07-30 2011-02-09 (주)필링크 유해영상 자동 판별 방법
CN102693236A (zh) * 2011-03-24 2012-09-26 苏州风采信息技术有限公司 基于内容理解的不良信息过滤方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101324888A (zh) * 2007-06-13 2008-12-17 北京恒金恒泰信息技术有限公司 基于ie的过滤色情软件插件
KR20110012302A (ko) * 2009-07-30 2011-02-09 (주)필링크 유해영상 자동 판별 방법
CN101923652A (zh) * 2010-07-23 2010-12-22 华中师范大学 一种基于肤色和特征部位联合检测的色情图片识别方法
CN102693236A (zh) * 2011-03-24 2012-09-26 苏州风采信息技术有限公司 基于内容理解的不良信息过滤方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王影: "基于内容的敏感图像检测方法研究", 《现代电信科技》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446803A (zh) * 2016-09-07 2017-02-22 北京小米移动软件有限公司 直播内容识别处理方法、装置及设备
CN108805069A (zh) * 2018-06-04 2018-11-13 上海东方报业有限公司 影像检测方法及装置
CN110210542A (zh) * 2019-05-24 2019-09-06 厦门美柚信息科技有限公司 图片文字识别模型训练方法、装置及文字识别系统
CN112528996A (zh) * 2020-12-22 2021-03-19 北京百度网讯科技有限公司 图片处理方法、装置、设备、存储介质和计算机程序产品
CN112528996B (zh) * 2020-12-22 2023-10-27 北京百度网讯科技有限公司 图片处理方法、装置、设备、存储介质和计算机程序产品
CN115633166A (zh) * 2022-09-27 2023-01-20 北京星绚文化传播有限公司 一种视频检测方法、装置及电子设备

Also Published As

Publication number Publication date
CN105740752B (zh) 2021-05-11

Similar Documents

Publication Publication Date Title
CN104778453B (zh) 一种基于红外行人亮度统计特征的夜间行人检测方法
CN105787472B (zh) 一种基于时空拉普拉斯特征映射学习的异常行为检测方法
CN105740752A (zh) 敏感图片过滤方法和系统
CN102799893B (zh) 考场监控视频处理方法
CN105956572A (zh) 一种基于卷积神经网络的活体人脸检测方法
US20140341422A1 (en) Systems and Methods for Facial Property Identification
CN106997452B (zh) 活体验证方法及装置
CN109670430A (zh) 一种基于深度学习的多分类器融合的人脸活体识别方法
CN109670441A (zh) 一种实现安全帽穿戴识别的方法、系统、终端以及计算机可读存储介质
CN106250845A (zh) 基于卷积神经网络的火焰检测方法及装置
CN101980242A (zh) 人脸面相判别方法、系统及公共安全系统
CN102073841A (zh) 一种不良视频检测方法及装置
CN108734067A (zh) 一种人证比对的认证方法、系统及相机
CN109460787A (zh) 入侵检测模型建立方法、装置及数据处理设备
CN101447023B (zh) 人头检测方法和系统
CN103530648A (zh) 一种基于多帧图像的人脸识别方法
CN108985200A (zh) 一种基于终端设备的非配合式的活体检测算法
CN103093180A (zh) 一种色情图像侦测的方法和系统
CN105930798A (zh) 基于学习的面向手机应用的舌像快速检测分割方法
CN110059607B (zh) 活体多重检测方法、装置、计算机设备及存储介质
CN102436578B (zh) 狗脸特征检测器的形成方法、狗脸检测方法及装置
CN108446690A (zh) 一种基于多视角动态特征的人脸活体检测方法
CN111222380A (zh) 一种活体检测方法、装置、及其识别模型训练方法
CN106780446A (zh) 一种无参考混合失真图像质量评价方法
CN107832730A (zh) 提高人脸识别准确率的方法和人脸识别系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220215

Address after: Room 1423, No. 1256 and 1258, Wanrong Road, Jing'an District, Shanghai 200040

Patentee after: Tianyi Digital Life Technology Co.,Ltd.

Address before: 1 / F and 2 / F, East Garden, Huatian International Plaza, 211 Longkou Middle Road, Tianhe District, Guangzhou, Guangdong 510630

Patentee before: Century Dragon Information Network Co.,Ltd.

TR01 Transfer of patent right