CN103839076B - 一种基于光照特征的网络敏感图像识别方法 - Google Patents

一种基于光照特征的网络敏感图像识别方法 Download PDF

Info

Publication number
CN103839076B
CN103839076B CN201410064935.6A CN201410064935A CN103839076B CN 103839076 B CN103839076 B CN 103839076B CN 201410064935 A CN201410064935 A CN 201410064935A CN 103839076 B CN103839076 B CN 103839076B
Authority
CN
China
Prior art keywords
network image
image
network
sensitive
sensitive features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410064935.6A
Other languages
English (en)
Other versions
CN103839076A (zh
Inventor
吴偶
胡卫明
景晓军
陈颖
赵林
姜玉垄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CN201410064935.6A priority Critical patent/CN103839076B/zh
Publication of CN103839076A publication Critical patent/CN103839076A/zh
Application granted granted Critical
Publication of CN103839076B publication Critical patent/CN103839076B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于光照特征的网络敏感图像识别方法,该方法包括以下步骤:收集网络图像样本集;提取每个网络图像样本的光照特征和敏感特征,得到网络图像光照特征集和网络图像敏感特征集;对每个网络图像样本进行人工标注标签;对网络图像光照特征集进行聚类,并根据网络图像光照特征集与网络图像敏感特征集的一一对应关系,将网络图像敏感特征集分成多个网络图像敏感特征子集;针对每个网络图像敏感特征子集,基于属于该网络图像敏感特征子集的敏感特征和相应网络图像样本的标签,得到对应于该网络图像敏感特征子集的图像分类器;使用图像分类器对待分类网络图像进行分类。本发明可以应用在互联网敏感图像过滤,以维护互联网的内容安全。

Description

一种基于光照特征的网络敏感图像识别方法
技术领域
本发明涉及模式识别技术领域,特别涉及一种基于光照特征的网络敏感图像识别方法。
背景技术
图片等敏感(专指色情)信息在互联网上的传播给社会生活的方方面面都带来了严重隐患,尤其严重的是对未成年人的危害。未成年人由于缺乏对事物的辨别能力及自控能力,其生理、心理和思维尚处在发育和发展过程中,不良信息不仅会给他们的学习和生活带来许多困扰,还会严重影响他们的身心健康,而且已经成为近年来未成年人违法犯罪的一个重要诱因。
对于网络敏感图像的识别,一般都是先提取不同类型的敏感特征,然后根据这些特征来构造分类器。例如美国爱荷华大学的Fleck与伯克利大学的Forsyth等人结合颜色和纹理信息对图像进行肤色分割,分割后寻找所有连通的圆柱形肤色区域。在假定这些肤色区域包含了人体躯干和四肢的基础之上,通过图像匹配从肤色区域提取手臂和四肢以及躯干。如果能够组合出一个具有人体形状的物体,那么就认为图像中有人的裸体存在,该图像被识别为不良图像。中国科学院计算技术研究所段立娟等人通过提取图像中肤色面积的比例以及最大连通肤色区域的面积,并结合原始图像的颜色直方图和颜色一致性向量(直方图的一种扩展)组成特征向量,最后利用RBF(径向基函数)核的支持向量机分类器进行色情图像检测。中国科学院自动化研究所杨金锋等人在肤色检测的基础上综合运用区域划分、区域生长、目标轮廓描述、局部特征分析、结构分析、自适应网格构建、精确轮廓分析等手段来获取图像中目标的特征信息,进而进行色情图像的分类和识别。
但是目前几乎所有的网络敏感图像识别方法均未考虑到光照对识别性能的影响。光照严重地影响着图像肤色提取的准确度,而肤色提取又是敏感图像识别最为关键的一步。此外,光照也一定程度上反映着图像所在的场景。所以有必要在进行网络敏感图像识别的过程中将光照因素合理地考虑进去,以实现更为合理的识别。
发明内容
有鉴于此,本发明的主要目的是提供一种基于光照特征的网络敏感图像识别方法,该方法根据不同图像的光照特点来将网络图像分为不同类型,对每种类型分别构造分类器,对于新的网络图像,根据其光照特征对应的类型来调用相应的分类器以进行网络敏感图像的识别。
为达到上述目的,本发明基于光照特征的网络敏感图像识别方法包括以下步骤:
步骤101:收集网络图像样本集;
步骤102:依次提取网络图像样本集中每个网络图像样本的光照特征和敏感特征,所有网络图像样本的光照特征构成了网络图像光照特征集,所有网络图像样本的敏感特征构成了网络图像敏感特征集;
步骤103:利用人工来对每个网络图像样本进行判别,给定其标签;
步骤104:对所述网络图像光照特征集进行聚类,将其分成多个聚类团,记录每个聚类团的中心,并根据网络图像光照特征集与网络图像敏感特征集的一一对应关系,将网络图像敏感特征集分成多个网络图像敏感特征子集;
步骤105:针对每个网络图像敏感特征子集,基于属于该网络图像敏感特征子集的敏感特征和相应网络图像样本的标签,利用基于聚类的多任务学习算法得到对应于该网络图像敏感特征子集的图像分类器;
步骤106:使用所述步骤105得到的针对网络图像敏感特征子集的图像分类器对待分类网络图像进行分类。
从上述技术方案可以看出,本发明具有以下优点:
1、本发明提供的一种基于光照特征的网络敏感图像识别方法,能够根据网络图像样本对应的光照特点来分为不同的类型,并分别对于不同的类型构造有害图像分类器。光照严重地影响着图像肤色提取的准确度,而肤色提取又是敏感图像识别最为关键的一步,此外光照也在一定程度上反应了图像的场景,例如室内和室外场景下的图像的光照就明显的不同;通过计算机摄像头获得的图像的光照也具有独特的特点。本发明考虑了网络图像的光照条件复杂多变,通过对光照特征进行聚类来将网络图像分成不同的类型,所构造出的分类器相比于现有方法所构造出的分类器,更加符合网络图像的特点。
2、本发明所采用的基于聚类的多任务学习,既能够学习到不同光照类型对应的有害图像分类器,又能够避免不同光照类型网络图像样本训练子集规模较小的不足。
附图说明
图1为本发明提供的一种基于光照特征的网络敏感图像识别方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
本发明的执行环境采用一台具有3.0G赫兹中央处理器和2G字节内存的奔腾4计算机,实现了本发明一种基于光照特征的网络敏感图像识别方法,当然也可以采用其他的执行环境,在此不再赘述。
图1为本发明提供的一种基于光照特征的网络敏感图像识别方法的流程图,如图1所示,所述方法包括以下步骤:
步骤101:利用计算机收集网络图像样本集;
步骤102:依次提取网络图像样本集中每个网络图像样本的光照特征和敏感特征,所有网络图像样本的光照特征构成了网络图像光照特征集,所有网络图像样本的敏感特征构成了网络图像敏感特征集;
在本发明一实施例中,在光照特征的提取上,主要提取能反应光照条件的特征,例如可以通过使用明科夫斯基范式(Minkowski-norm)并选取多个不同的范数,来获得多个光照色度以组合成光照特征;
在敏感特征的提取上,主要提取能体现色情内容的特征。例如最大肤色联通区域面积占总肤色面积的比例、人脸个数等。
步骤103:利用人工来对每个网络图像样本进行判别,给定其标签,所述标签的内容为敏感或正常;
步骤104:对所述网络图像光照特征集进行聚类,将其分成多个聚类团,记录每个聚类团的中心,并根据网络图像光照特征集与网络图像敏感特征集的一一对应关系,将网络图像敏感特征集分成多个网络图像敏感特征子集;
根据本发明的一实施例,可以选用常规的聚类方法如K-means、谱聚类等对网络图像光照特征集进行聚类。
根据本发明的一实施例,可以将网络图像敏感特征集表示为X={x1,…,xi,…,xN},其中xi是第i个网络图像样本的敏感特征,N是网络图像样本集中的网络图像样本总数,第i个网络图像样本的标签用yi表示,当第i个网络图像样本属于第一类别时,yi=1,否则yi=-1,第i个网络图像样本的光照特征用ui表示。所有网络图像样本的光照特征构成的网络图像光照特征集表示为U={u1,…,ui,…,uN}。
利用聚类算法对网络图像光照特征集U进行聚类之后,将U分成C个聚类团,其中C为预先设置的聚类团个数。根据本发明的一实施例,C的值选取范围为[5,20],并优选地大于10。根据网络图像敏感特征集X与网络图像光照特征集U之间的对应关系,将X分成C个网络图像敏感特征子集X1,…,Xc,…,XC,1≤c≤C。
步骤105:针对每个网络图像敏感特征子集,基于属于该网络图像敏感特征子集的敏感特征和相应网络图像样本的标签,利用基于聚类的多任务学习算法得到对应于该网络图像敏感特征子集的图像分类器;
该步骤中,建立以下目标优化函数:
s.t.FTF=IP
其中:wc和bc是对应于第c个网络图像敏感特征子集的图像分类器的参数;W=[w1,...,wc,...,wC];α和β是平衡因子,F是聚类矩阵,Ip是单位矩阵,在求解过程中通过交叉验证的方法对α、β、F和Ip进行选择。根据本发明的一实施例,3≤P≤C。
这样,就可以计算得到每个网络图像敏感特征子集对应的图像分类器的参数,从而得到相应的图像分类器。
步骤106:使用所述步骤105得到的针对网络图像敏感特征子集的图像分类器对待分类网络图像进行分类。
所述步骤106进一步包括以下步骤:
步骤1061:对于待分类网络图像,按照所述步骤102分别提取其光照特征(ut)和敏感特征(xt);
步骤1062:计算该光照特征ut与所述步骤104得到的C个聚类团的聚类中心的距离,假定与光照特征ut之间距离最小的聚类中心为第z个聚类团的聚类中心,那么利用与第z个聚类团相对应的第z个网络图像敏感特征子集所对应的分类器来对该待分类网络图像进行分类。
具体地,通过计算以下等式来对所述待分类网络图像进行分类:f=<wz,xt>+bz,其中,wz和bz是所述第z个网络图像敏感特征子集所对应的图像分类器的参数,<wz,xt>表示两者的内积,如果f>0,则所述待分类网络图像属于第一类别,比如敏感,否则,所述待分类网络图像属于第二类别,比如正常。
应当注意,以上对各步骤的编号仅为说明目的,而并不限定各步骤的执行顺序。在不脱离本发明精神和范围的情况下,可以改变步骤的执行顺序和/或将单个步骤拆分为多个步骤、将多个步骤组合为单个步骤、或将某个步骤的一部分与其他步骤或其他步骤的一部分组合为单个步骤来执行。本发明明确考虑这些情况并将其包含在本发明的范围内。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于光照特征的网络敏感图像识别方法,其特征在于,该方法包括以下步骤:
步骤101:收集网络图像样本集;
步骤102:依次提取网络图像样本集中每个网络图像样本的光照特征和敏感特征,所有网络图像样本的光照特征构成了网络图像光照特征集,所有网络图像样本的敏感特征构成了网络图像敏感特征集;
步骤103:利用人工来对每个网络图像样本进行判别,给定其标签;
步骤104:对所述网络图像光照特征集进行聚类,将其分成多个聚类团,记录每个聚类团的中心,并根据网络图像光照特征集与网络图像敏感特征集的一一对应关系,将网络图像敏感特征集分成多个网络图像敏感特征子集;
步骤105:针对每个网络图像敏感特征子集,基于属于该网络图像敏感特征子集的敏感特征和相应网络图像样本的标签,利用基于聚类的多任务学习算法得到对应于该网络图像敏感特征子集的图像分类器;
步骤106:使用所述步骤105得到的针对网络图像敏感特征子集的图像分类器对待分类网络图像进行分类;
所述步骤106进一步包括以下步骤:
步骤1061:对于待分类网络图像,按照所述步骤102分别提取其光照特征ut和敏感特征xt
步骤1062:计算该光照特征ut与所述步骤104得到的多个聚类团的聚类中心的距离,利用与第z个聚类团相对应的第z个网络图像敏感特征子集所对应的分类器来对该待分类网络图像进行分类,所述第z个聚类团为与光照特征ut之间距离最小的聚类中心所属的聚类团。
2.根据权利要求1所述的方法,其特征在于,所述光照特征为由多个光照色度组合得到的光照特征。
3.根据权利要求2所述的方法,其特征在于,所述光照色度通过使用明科夫斯基范式并选取多个不同的范数来获得。
4.根据权利要求1所述的方法,其特征在于,所述敏感特征为最大 肤色联通区域面积占总肤色面积的比例和/或人脸个数。
5.根据权利要求1所述的方法,其特征在于,所述标签的内容为敏感或正常。
6.根据权利要求1所述的方法,其特征在于,所述步骤105中,通过目标优化函数来计算得到每个网络图像敏感特征子集对应的图像分类器的参数。
7.根据权利要求6所述的方法,其特征在于,所述目标优化函数表示为:
s.t.FTF=IP
其中,wc和bc是对应于第c个网络图像敏感特征子集的图像分类器的参数;W=[w1,...,wc,...,wC]为参数wc的集合;C为预先设置的聚类团个数;xi是第i个网络图像样本的敏感特征,yi表示第i个网络图像样本的标签;α和β是平衡因子,F是聚类矩阵,Ip是单位矩阵。
8.根据权利要求1所述的方法,其特征在于,所述步骤1062中,通过计算下式来对所述待分类网络图像进行分类:
f=<wz,xt>+bz
其中,wz和bz是所述第z个网络图像敏感特征子集所对应的图像分类器的参数,<wz,xt>表示wz和xt的内积;
如果计算结果f>0,则所述待分类网络图像属于敏感图像,否则,所述待分类网络图像属于正常图像。
CN201410064935.6A 2014-02-25 2014-02-25 一种基于光照特征的网络敏感图像识别方法 Active CN103839076B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410064935.6A CN103839076B (zh) 2014-02-25 2014-02-25 一种基于光照特征的网络敏感图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410064935.6A CN103839076B (zh) 2014-02-25 2014-02-25 一种基于光照特征的网络敏感图像识别方法

Publications (2)

Publication Number Publication Date
CN103839076A CN103839076A (zh) 2014-06-04
CN103839076B true CN103839076B (zh) 2017-05-10

Family

ID=50802554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410064935.6A Active CN103839076B (zh) 2014-02-25 2014-02-25 一种基于光照特征的网络敏感图像识别方法

Country Status (1)

Country Link
CN (1) CN103839076B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105809096A (zh) * 2014-12-31 2016-07-27 中兴通讯股份有限公司 人物标注方法和终端
CN107291737B (zh) * 2016-04-01 2019-05-14 腾讯科技(深圳)有限公司 敏感图像识别方法及装置
CN106778581A (zh) * 2016-12-07 2017-05-31 西京学院 一种移动终端“敏感”信息识别方法
CN107886335A (zh) * 2017-10-20 2018-04-06 北京火星盒子网络信息技术有限公司 一种商品扫码设备
CN109359551A (zh) * 2018-09-21 2019-02-19 深圳市璇玑实验室有限公司 一种基于机器学习的敏感图像识别方法与系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763502A (zh) * 2008-12-24 2010-06-30 中国科学院自动化研究所 一种高效的敏感图像检测方法及其系统
CN101923652A (zh) * 2010-07-23 2010-12-22 华中师范大学 一种基于肤色和特征部位联合检测的色情图片识别方法
CN102163286A (zh) * 2010-02-24 2011-08-24 中国科学院自动化研究所 一种色情图像评价方法
CN102842032A (zh) * 2012-07-18 2012-12-26 郑州金惠计算机系统工程有限公司 基于多模式组合策略的移动互联网色情图像识别方法
CN103093180A (zh) * 2011-10-28 2013-05-08 阿里巴巴集团控股有限公司 一种色情图像侦测的方法和系统
CN103164687A (zh) * 2011-12-15 2013-06-19 阿里巴巴集团控股有限公司 一种色情图像侦测的方法和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6751348B2 (en) * 2001-03-29 2004-06-15 Fotonation Holdings, Llc Automated detection of pornographic images
US20080159624A1 (en) * 2006-12-27 2008-07-03 Yahoo! Inc. Texture-based pornography detection

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101763502A (zh) * 2008-12-24 2010-06-30 中国科学院自动化研究所 一种高效的敏感图像检测方法及其系统
CN102163286A (zh) * 2010-02-24 2011-08-24 中国科学院自动化研究所 一种色情图像评价方法
CN101923652A (zh) * 2010-07-23 2010-12-22 华中师范大学 一种基于肤色和特征部位联合检测的色情图片识别方法
CN103093180A (zh) * 2011-10-28 2013-05-08 阿里巴巴集团控股有限公司 一种色情图像侦测的方法和系统
CN103164687A (zh) * 2011-12-15 2013-06-19 阿里巴巴集团控股有限公司 一种色情图像侦测的方法和系统
CN102842032A (zh) * 2012-07-18 2012-12-26 郑州金惠计算机系统工程有限公司 基于多模式组合策略的移动互联网色情图像识别方法

Also Published As

Publication number Publication date
CN103839076A (zh) 2014-06-04

Similar Documents

Publication Publication Date Title
CN107016405B (zh) 一种基于分级预测卷积神经网络的害虫图像分类方法
CN106815604B (zh) 基于多层信息融合的注视点检测方法
CN103839076B (zh) 一种基于光照特征的网络敏感图像识别方法
CN108171184A (zh) 基于Siamese网络的用于行人重识别的方法
CN108171136A (zh) 一种多任务卡口车辆以图搜图的系统及方法
CN110334565A (zh) 一种显微镜病理照片的宫颈癌病变细胞分类系统
CN106845510A (zh) 基于深度层级特征融合的中国传统视觉文化符号识别方法
CN108197538A (zh) 一种基于局部特征和深度学习的卡口车辆检索系统及方法
CN108491077A (zh) 一种基于多流分治卷积神经网络的表面肌电信号手势识别方法
CN105005765A (zh) 一种基于Gabor小波和灰度共生矩阵的人脸表情识别方法
WO2013037119A1 (zh) 红细胞形态学分析装置及其方法
CN103577838A (zh) 一种人脸识别方法和装置
CN103226088A (zh) 一种颗粒物计数方法及其装置
Sufri et al. Vision based system for banknote recognition using different machine learning and deep learning approach
CN104036247A (zh) 基于脸部特征的人脸种族分类方法
CN108764302A (zh) 一种基于颜色特征和词袋特征的票据图像分类方法
CN108154195A (zh) 茶叶识别方法及使用该方法的茶叶分拣装置
CN110956212A (zh) 一种基于视觉特征融合的打叶质量检测方法
CN111861103A (zh) 一种基于多特征与多分类器的鲜茶叶分类方法
CN107679579A (zh) 基于深度学习的红枣品质分选方法
CN105913090B (zh) 基于sdae-svm的sar图像目标分类方法
CN110827260A (zh) 一种基于lbp特征与卷积神经网络的布匹缺陷分类方法
CN111753805A (zh) 安全帽佩戴检测方法和装置
CN103177266A (zh) 储藏物害虫智能识别系统
CN106874929A (zh) 一种基于深度学习的珍珠分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant