CN100470592C - 基于人体局部和形体信息的敏感图像识别方法 - Google Patents

基于人体局部和形体信息的敏感图像识别方法 Download PDF

Info

Publication number
CN100470592C
CN100470592C CNB021571155A CN02157115A CN100470592C CN 100470592 C CN100470592 C CN 100470592C CN B021571155 A CNB021571155 A CN B021571155A CN 02157115 A CN02157115 A CN 02157115A CN 100470592 C CN100470592 C CN 100470592C
Authority
CN
China
Prior art keywords
image
growing point
point
growing
growth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB021571155A
Other languages
English (en)
Other versions
CN1508756A (zh
Inventor
谭铁牛
胡卫明
杨金峰
王谦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CNB021571155A priority Critical patent/CN100470592C/zh
Publication of CN1508756A publication Critical patent/CN1508756A/zh
Application granted granted Critical
Publication of CN100470592C publication Critical patent/CN100470592C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

一种基于人体局部和形体信息的敏感图像识别方法,包括步骤:对静态敏感图像进行划分;确定区域几何点;采用生长点的自主抖动确定生长点所属区域的图像局部特征;进行图像性质判断。本发明是一种新型的敏感图像识别技术,突破了诸如色彩直方图匹配、小波变换轮廓匹配、肤色纹理描述、图像中心矩匹配等国际现有敏感图像识别技术速度慢、效率低、设备依赖性强等方面的难题,具有广阔的应用前景。

Description

基于人体局部和形体信息的敏感图像识别方法
技术领域
本发明涉及模式识别领域,特别涉及基于人体局部和形体信息的敏感图像识别方法。
背景技术
随着现代互联网技术的飞速发展,网络对全球经济和社会生活的渗透,其深度和影响力已远远超出人们的预料。网络信息安全逐渐成为一个极为重要的问题,其中对社会,尤其是对未成年人的影响更引起人们的广泛关注,所以信息过滤技术成了迫切的理论和实际需求。在美国,这些问题早在1994年就已引起公众的注意,当时美国社会深受便利的网络在线色情图片、暴力、恶毒言论等有害网络信息的痛苦困扰,诸多新闻、报纸、杂志都充斥着对色情网站、各种丑恶团体、在线性侵犯等问题的恐惧。网络上大量的有害内容直接导致国会通过“Communications Decency Act(CDA)”和“Child On-line ProtectionAct(COPA)”两项法律。以此为法律依据,美国的软件工业开发了他们自己的网络内容过滤软件,并建立网络内容审计系统平台。随后在1999年国会又通过了“Childrens’Internet Protection Act(CIPA)”法律以保护青少年,使其免受网络有害信息的侵害。
在对敏感信息检测方面,国外一些大学(Berkeley,Iowa,Standford)开展了部分对网络上敏感图片进行分析的探索。Fleck与Forsyth通过检测人体的皮肤,并把各部分皮肤区域连成一组,来识别一幅图片是否包含裸体内容。James Ze Wang利用WIPE(Wavelet ImagePornography Elimimation)方法对敏感图片进行识别与过滤。这种方法综合利用了Daubechies小波变换,归一化中心矩,颜色直方图形成语义匹配向量进行图像分类识别。Aberdeen的Ian Craw在皮肤检测中用SOM网对肤色的概率模型进行学习,检验样本输入网络后得到一个可能为肤色的概率值,然后设置一阀值来判定是否为肤色。此外,还有一些通用的基于内容的图像检索系统,如IBM的QBIC,Attrasoft的ImageFinder、MWLabs的Imatch等。值得一提的是,法国国立计算机与自动化研究所图像与多媒体索引组的四名科学家于1999年成立了LookThatUp公司,该公司图像过滤与检索产品在行业内处于领先地位。LookThatUp的Image-FilterTM利用先进的识别算法可以对网络上的图像进行实时过滤。
在2001年,欧洲启动NetProtect计划,该计划从2001年1月1日开始到2002年5月1日结束,由法国的EADS Matra Systemes&Information研究机构联合西班牙的Red Educativa、法国的MatraGlobal Netservices、希腊的Hyertech、德国的SailLabs等科研机构共同开发研制。NetProtect计划的目标是建立欧洲互联网内容过滤工具的统一技术标准,以实现跨地域、跨语言的互联网有害信息过滤。
国内现有的反黄软件有美萍软件工作室推出美萍反黄专家、ZiJinCheng.NET推出的紫禁城反黄卫士、飞涛软件工作室推出的护花使者、中国科学技术大学讯飞信息科技有限公司开发的“火眼金睛”电脑反黄软件、清华的“五行卫士”电脑反黄软件等等。需要提出的是国内的这些网络有害信息过滤软件无论从技术上还是从过滤方法上均不能达到应有的效果。特别是我国近些年来网络应用的飞速发展,致使网络对社会、家庭、教育的影响日益深远,所以网络有害信息过滤将面临前所未有的压力。
需要强调的是,虽然互联网有害信息过滤技术在世界范围内得到了广泛的关注和研究,但在对有害信息识别技术方面仍然存在诸多难点,其中基于图像内容的色情图片识别和过滤方法仍然缺乏有效的算法和分类方法。因此如何开发更加鲁棒、准确的敏感图像识别技术仍是一个挑战。
发明内容
本发明的目的是提供一种利用敏感图片所能表达的人体的局部和形体信息来达到对敏感图像的识别的方法。
为实现上述目的,基于人体局部和形体信息的敏感图像识别方法包括步骤:
对静态敏感图像采用4×4等区域划分,形成16个子区域,实现对子区域以4×4矩阵式编号;
选择4相邻子区域的公共点为生长点,并对其进行编号,以生长点为中心,分别选取4个子区域的各一部分为生长区域。
以生长点为参考对象对生长区域进行编号,并形成生长点与生长区域、生长区域与子区域之间的空间编号关系;
以生长区域的肤色信息为基础,通过阈值判断,在图像子区域和生长点中产生具有描述目标形体状态的候选区域和候选生长点;
以候选生长点为基础,采用顺时针连接生长点并形成点集,以点集元素的抖动生长刻画目标区域的图像局部特征;
进行图像性质判断。
本发明是一种新型的敏感图像识别技术,突破了诸如色彩直方图匹配、小波变换轮廓匹配、肤色纹理描述、图像中心矩匹配等国际现有敏感图像识别技术速度慢、效率低、设备依赖性强等方面的难题,具有广阔的应用前景。
附图说明
图1是区域划分图;
图2是区域属性关系图;
图3生长区域与候选区域关系图;
图4是点生长方向和生长方式图;
图5是判断流程。
具体实施方式
本发明的主要特点在于:1)采取了一种新型的图像总体特征判定方法,即区域初步判定法。它能依据图像中选取的相关区域的特征初步判断图像的性质,这将有助于后续过程的处理;2)在确定的区域基础上确立相应几何点,几何点的抖动生长采取了以肤色为基础的生长方式,这种方式大大缩短了几何点生长的时间,降低了计算代价;3)在肤色点定位的基础上,建立肤色点之间的几何关系。在此几何关系下,确立点与点之间的图像信息获取方法。这个过程不仅获取了图像的局部信息,同时也表达出相应的形体信息;4-)在获取的图像信息的基础上确立图像快速分类的方法。
下面详细给出该发明技术方案中所涉及的各个细节问题的说明。
图像几何区域划分
图像几何区域划分是确定图像特征的初始条件,在划分的同时,算法还提取了子区域之间的几何关系。若图像为f(x,y),子区域为,fi(xi,yi)则它们之间的关系可表示如下
f(x,y)=f1(x1,y1)+f2(x2,y2)+f3(x3,y3)+…+fn(xn,yn)               (1)
式中n=16。图像经过划分,子区域fi(xi,yi)在一定程度上代表了部分的局部信息,划分方法见附图1。在此划分的基础上,建立图像子区域和生长区域之间的代数关系,矩阵表示如下:
A = a 11 a 12 a 13 a 14 a 21 a 22 a 23 a 24 a 31 a 32 a 33 a 34 a 41 a 42 a 43 a 44          P = p 11 p 12 p 13 p 21 p 22 p 23 p 31 p 32 p 33
a ij ′ = p ( i - 1 ) ( j - 1 ) ( 4 ) p ( i - 1 ) j ( 3 ) p i ( j - 1 ) ( 2 ) p ij ( 1 )          p ij ′ = p ij ( 1 ) P ij ( 2 ) p ij ( 3 ) p ij ( 4 )
A是图像区域属性确定矩阵,P是生长点矩阵,
Figure C02157115D00085
是图像子区域属性判断矩阵,
Figure C02157115D00086
是生长点属性判断矩阵,其中
Figure C02157115D00087
是生长点所属生长区域,面积为其所在子区域的九分之一。这样就建立了图像子区域、生长点、生长区域之间的相互关系,直观表达方法可参考图2、图3。
生长点确立和抖动生长
取四个相邻子区域的交叉点pij作为区域的生长点,生长点在子区域内的抖动生长将表达生长点所属区域的局部肤色特征信息。对于敏感图像,图像所具有的突出特征就是肤色所表达的内容,若以函数F(r,g,b)代表肤色信息,函数Gij(F(r,g,b),xij,yij)为几何点pij的生长函数。则对于其中任意一个区域,生长点的生长方式的数学描述如下
p ij ∈ p ij ( e ) ⇔ G ij ( F ( r , g , b ) , x ij ( e ) , y ij ( e ) ) - - - ( 2 )
生长停止的约束条件
F(r,g,b)≤α,α是给定阈值。             (3)
直观表达方法见附图4。通过区域生长点的抖动生长和属性判断即可得到矩阵A、P中各元素的数值。当aij=0时,对应图像中相应区域为非候选区域,当aij=1时,对应图像中相应子区域为目标区域,图像中人体形体的形成就依靠整个图像所确定的目标区域。当pij=0时,该生长点为非目标点,当pij=1时,该生长点为目标点,图像形体局部特征的形成就依靠生长点矩阵所确定的目标点。
局部特征和形体特征的生成
通过区域的划分和生长点抖动生长,我们获得了图像目标子区域和目标点。在这些区域中,我们抽取含有肤色信息较丰富的区域作为进一步运算的基本信息。也就是说初始区域为16块,经过上一步的特征判断,现在选取的区域数目N的大小应为0≤N≤9,N为整数。以目标点为基础,顺时针连接目标点,并生成如下点集,数学形式描述如下
Figure C02157115D00101
其中k=yj-yi/xj-xi,b=kxi+yi。这样,在图像平面中,由线段
Figure C02157115D00102
利用式(4)可以确定一个像素点集S。对点集S中每一个元素(像素点)运用生长函数G(F(r,g,b),Si′)便可得到相应的局部特征。对于整幅图像应有 M = C N 2 个点集,其中N≥2,所以图像的局部信息表达函数应为
LocalFun ( x , y ) = ΣLocalFun ( f i , G s m ) - - - ( 5 )
图像形体信息实际上点集之间的位置关系。在确定图像局部特征的同时,算法采集图像点集中各点的位置信息,经过对各点位置信息的特征抽取来形成图像中人体内容的形体信息。所以形体信息表达函数应为
ShapeFun ( x , y ) = Σ i = 0 N F ( S i ( x i , y i ) ) - - - ( 6 )
其中为线性F(Si(xi,yi))分段函数。
图像性质表达
上述分析提供了图像的局部信息和形体信息,二者的结合可得到对图像性质的描述。若图像特征表达函数为FeaturgFun(),则
FeatureFun(f(x,y)=LocalFun(x,y)+ShapeFun(x,y)       (7)
所以对于任一幅图像,图像的局部特征数应为
N L = C N 2 , 2 &le; N &le; 9 1 , 0 &le; N < 2 - - - ( 8 )
形体特征数应为NS=1。而本算法所能表达的图像形体数应为
N S = C 9 0 + C 9 1 + C 9 2 + C 9 3 + C 9 4 + C 9 5 + C 9 6 + C 9 7 + C 9 8 + C 9 9 - - - ( 9 )
算法所能表达的图像总特征数应为
NF=NL*NS                    (10)
图像性质判断
上述分析完成了对图像内容的表达,此部分要依据所表达的图像内容对图像性质进行判断;若以ClassFun()表示图像性质判断函数,则
ClassFun ( FeatureFun ( x , y ) ) = 1 true 0 false - - - ( 11 )
图像性质判断函数实际上是图像分类函数,当函数值为1时,图像为敏感图像,当函数值为0时,图像为非敏感图像。
对形体信息采用几何相似度进行度量,直观可理解为平面三角形的相似关系,即若两个平面三角形相似,则它们所对应的夹角相等。数学表述如下
这里“Δ”是描述三角形的一个符号。但对于图像形体相似的判断,算法不要求形体信息完全相似,满足给定域值即可。
对于图像局部信息采用形体相似关系下的距离度量方法,数学表述如下
min D = &Sigma; ( x - x &prime; ) 2 + ( y - y &prime; ) 2 - - - ( 13 )
满足形体相似关系的也许有很多,但满足形体相似关系下的局部特征距离最近的只有一个。整个判断过程见附图5。
为了实施本发明的具体思想,我们设计和实现了基于图像内容识别的互联网敏感图像过滤系统,这种算法体现了很高的运算速度,完全能满足实时过滤的要求,同时我们设计了基于图像库检索识别的主动识别系统,对13643幅图像的识别正确率达到85%以上。
图像的整个识别算法以动态链接库文件的形式进行程序调用。它就象一个带有过滤网的水龙头,能过滤掉水中的有害物质,不同的是水龙头需定时清洗,而我们的图像过滤器不需人工干预,它会自动丢弃有害的网络数据包。

Claims (3)

1.一种基于人体局部和形体信息的敏感图像识别方法,包括步骤:
对静态敏感图像采用4×4等区域划分,形成16个子区域,实现对子区域以4×4矩阵式编号;
选择4相邻子区域的公共点为生长点,并对其进行编号,以生长点为中心,分别选取4个子区域的各一部分为生长区域;
以生长点为参考对象对生长区域进行编号,并形成生长点与生长区域、生长区域与子区域之间的空间编号关系;
以生长区域的肤色信息为基础,通过阈值判断,在图像子区域和生长点中产生具有描述目标形体状态的候选区域和候选生长点;
以候选生长点为基础,采用顺时针连接生长点并形成点集,以点集元素的抖动生长刻画目标区域的图像局部特征;
进行图像性质判断。
2.按权利要求1所述的方法,其特征在于确定区域生长点包括步骤:
取4个相邻子区域的交叉点作为生长点;
生长点生长方式满足下式:
p ij &Element; p ij ( e ) &DoubleLeftRightArrow; G ij ( F ( r , g , b ) , x ij ( e ) , y ij ( e ) )
是生长点所属生长区域,面积为其所在子区域的一部分,
Figure C02157115C00023
为生长点生长时变化的坐标。
3.按权利要求1所述的方法,其特征在于所述的图像性质判断包括步骤:
在多个满足形体相似关系的图像形体中选择局部特征距离最近的一个。
CNB021571155A 2002-12-17 2002-12-17 基于人体局部和形体信息的敏感图像识别方法 Expired - Fee Related CN100470592C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB021571155A CN100470592C (zh) 2002-12-17 2002-12-17 基于人体局部和形体信息的敏感图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB021571155A CN100470592C (zh) 2002-12-17 2002-12-17 基于人体局部和形体信息的敏感图像识别方法

Publications (2)

Publication Number Publication Date
CN1508756A CN1508756A (zh) 2004-06-30
CN100470592C true CN100470592C (zh) 2009-03-18

Family

ID=34236494

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB021571155A Expired - Fee Related CN100470592C (zh) 2002-12-17 2002-12-17 基于人体局部和形体信息的敏感图像识别方法

Country Status (1)

Country Link
CN (1) CN100470592C (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100525395C (zh) * 2005-09-29 2009-08-05 中国科学院自动化研究所 多摄像机下基于主轴匹配的行人跟踪方法
JP5041229B2 (ja) * 2007-12-07 2012-10-03 ソニー株式会社 学習装置および方法、認識装置および方法、並びにプログラム
CN101996314B (zh) * 2009-08-26 2012-11-28 厦门市美亚柏科信息股份有限公司 一种基于内容的人体上半身敏感图像识别方法及其装置
CN105190689A (zh) * 2013-06-14 2015-12-23 英特尔公司 包括基于毗连特征的对象检测和/或双边对称对象分段的图像处理

Also Published As

Publication number Publication date
CN1508756A (zh) 2004-06-30

Similar Documents

Publication Publication Date Title
Srihari Automatic indexing and content-based retrieval of captioned images
CN104834922B (zh) 基于混合神经网络的手势识别方法
CN110349136A (zh) 一种基于深度学习的篡改图像检测方法
CN108961137A (zh) 一种基于卷积神经网络的图像隐写分析方法及系统
CN102332034B (zh) 一种人像图片检索方法和装置
CN106845373A (zh) 面向监控视频的行人属性预测方法
CN101763440B (zh) 对搜索图像的过滤方法
CN108446700A (zh) 一种基于对抗攻击的车牌攻击生成方法
CN102163283B (zh) 一种基于局部三值模式的人脸特征提取方法
CN103854016B (zh) 基于方向性共同发生特征的人体行为分类识别方法及系统
CN106649275A (zh) 基于词性信息和卷积神经网络的关系抽取方法
CN111597870B (zh) 一种基于注意力机制与多任务学习的人体属性识别方法
CN1331099C (zh) 基于内容的图像识别方法
CN104462053A (zh) 一种文本内的基于语义特征的人称代词指代消解方法
CN101520894A (zh) 基于区域显著性的显著对象提取方法
CN105205449A (zh) 基于深度学习的手语识别方法
CN105956570B (zh) 基于唇部特征和深度学习的笑脸识别方法
CN106469181A (zh) 一种用户行为模式分析方法及装置
CN107092884A (zh) 一种快速粗精级联行人检测方法
CN110084149A (zh) 一种基于难样本四元组动态边界损失函数的人脸验证方法
CN110008861A (zh) 一种基于全局和局部特征学习的行人再识别方法
CN110287856A (zh) 一种执勤人员行为分析系统、方法及装置
CN109740578A (zh) 一种适用于光照、姿态、表情变化的人脸识别方法
CN102411712B (zh) 基于笔迹的身份识别的方法及终端
CN109063643A (zh) 一种用于脸部信息部分隐藏条件下的面部表情痛苦度识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090318

Termination date: 20181217