CN1728161A - 基于非均匀量化颜色特征矢量的敏感图像过滤方法 - Google Patents
基于非均匀量化颜色特征矢量的敏感图像过滤方法 Download PDFInfo
- Publication number
- CN1728161A CN1728161A CN 200510028206 CN200510028206A CN1728161A CN 1728161 A CN1728161 A CN 1728161A CN 200510028206 CN200510028206 CN 200510028206 CN 200510028206 A CN200510028206 A CN 200510028206A CN 1728161 A CN1728161 A CN 1728161A
- Authority
- CN
- China
- Prior art keywords
- image
- sensitive
- sensitive image
- feature
- color
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
一种模式识别领域的基于非均匀量化颜色特征矢量的敏感图像过滤方法,首先进行多种图像特征的提取,包括图像基本特征的提取和图像内容特征的提取,图像基本特征是针对敏感图像特点的非均匀量化颜色直方图特征;图像内容特征是基于纹理检测的皮肤区域分布特征;然后采用自适应提升算法,综合分析所提取的特征组合,根据其与图像样本库内敏感图像和正常图像的匹配程度,判别该图像是否为敏感图像。本发明提出了一种新型图像基本颜色特征的表达方式,能够使用尽可能低维的特征向量来描述敏感图像的颜色分布特点。因此,本发明在获得高识别率的同时,保证了较高的处理速度,具有广阔的应用前景。
Description
技术领域
本发明涉及的是一种图像处理技术领域的方法,特别是一种基于非均匀量化颜色特征矢量的敏感图像过滤方法。
背景技术
在互联网给人民生活带来极大便利的同时,其负面效应也日益凸显出来,各种不良信息能够在互联网中快捷地传播,其中,敏感图象在互联网中的泛滥则是一个重要的方面,相对于其他一些不良信息,敏感图像所带来的危害更大,更加直接,尤其对未成年少年的危害,更加不容忽视。在这种情况下,如何净化网络空间,限制敏感图像在网络中的传播已经受到人们的普遍关注。因此,有必要对网络中的信息进行监控,以发现并过滤隐藏其中的敏感图像。图像不同于一般的信息,需要在理解其中的语义的基础上才能判断是否包含敏感内容,而对于高级语义的理解则需要通过提取图像的低级特征,如颜色、纹理、形状等信息,并对这些低级特征的分析来完成,进而完成图像内容的识别和判断。对于敏感图像的语义描述以及在这个基础之上的图像内容的识别,有人提出自动识别裸体人物图片的系统。该识别方法结合了肤色和纹理特征来标记皮肤区域,然后让这些标记后的皮肤区域通过一个专门的分类器,利用人体结构的几何特征来分类出人的轮廓。带有十分大量的可能肢体区域的图片即可被认为是包含裸体人物的敏感图片。但该方法过于依赖非几何的因素(比如肤色)和部位之间的关系。还有人提出多层次特定类型图像过滤方法,是一种基于计算机视觉和模式识别的敏感图像过滤方法。通过研究人类视觉对图像的分析机理,提出综合肤色模型检验、支持向量机分类和最近邻方法校验的多层次图像处理框架。该方法通过综合多种方法的过滤结果以提高过滤的准确性。
经过对现有技术文献的检索发现,中国专利申请号为:02157115.5,名称为“基于人体局部和形体信息的敏感图像识别方法”该专利自述为:一种基于人体局部和形体信息的敏感图像识别方法,包括步骤:对静态敏感图像进行划分;确定区域几何点;采用生长点的自主抖动确定生长点所属区域的图像局部特征;进行图像性质判断。该方法主要通过将图像划分成若干个不同的区域,综合每个区域中所提取的图像局部特征和人体形体特征来进行判断。故而这种方法处理时间短,对于背景清晰或形体轮廓清晰的图像具有较好的效果。然而,实际生活中的图像往往具有复杂的背景,人体与背景之间的颜色对比度也不太明显。在这种情况下,该方法很难准确地获得人体的轮廓信息。另外,仅仅通过颜色信息来判断皮肤区域也存在较大的误差。
发明内容
本发明的目的在于克服现有技术中的不足,提出一种基于非均匀量化颜色特征矢量的敏感图像过滤方法,使其实现对于图像内容的识别,判断图像是否包含敏感内容,在获得高识别率的同时,保证了较高的处理速度。
本发明是通过以下技术方案实现的,首先进行多种图像特征的提取,主要包括:1)图像基本特征,即针对敏感图像特点的非均匀量化颜色直方图特征;2)图像内容特征,即基于纹理检测的皮肤区域分布特征。然后采用自适应提升(ADABOOST)算法,综合分析所提取的特征组合,根据其与图像样本库内敏感图像和正常图像的匹配程度,判别该图像是否为敏感图像。本发明还采用平衡因子来调节识别率和错误率的平衡,可以针对不同的情况采取不同的判别方法。
本发明采用针对敏感图像的非均匀量化颜色直方图特征,该特征在性能上优于传统的均匀量化颜色直方图,其原因在于,一方面,传统的均匀量化颜色直方图一般来说是高维的,其中包含很多与图像敏感与否无关的冗余信息;另一方面,图像性质的信息往往包含在多个邻近的直方图元素的相互关系而非任何一个单个元素中,综合多个邻近的直方图元素往往比单个元素能够提供更高的判别力。2)采取一种能够根据上述特征进行判别图像内容的方法,并可以自主调节识别率和错误率的平衡,以满足各种不同的应用需求。
本发明是一种新的敏感图像描述和识别方法,针对敏感图像的具体特点,提出了新的适合该类图像的特征描述方法,并实现了敏感图像的识别。本发明经过了性能测试,测试结果表明了本发明对于图像内容的识别有着较高正确率,即正确判断一幅是敏感图像,识别率高于88%;同时有着较低的错误率,即将一幅正常图像判断为敏感图像,错误率小于10%。因此,本发明在获得高识别率的同时,保证了较高的处理速度,具有广阔的应用前景。
附图说明
图1本发明方法流程图
图2本发明非均匀量化颜色直方图特征的提取流程图
图3本发明皮肤区域分布特征的提取流程图
具体实施方式
结合附图以及本发明的内容,对本发明作进一步详细说明:
如图1所示,本发明首先进行多种图像特征的提取,主要包括:1)图像基本特征,即针对敏感图像特点的非均匀量化颜色直方图特征;2)图像内容特征,即基于纹理检测的皮肤区域分布特征。然后采用自适应提升(ADABOOST)算法,综合分析所提取的特征组合,根据其与图像样本库内敏感图像和正常图像的匹配程度,判别该图像是否为敏感图像。
如图2所示,非均匀量化颜色直方图特征的提取流程,首先建立一个包含敏感图像和非敏感图像的训练集,从中获得能够区分敏感和非敏感图像的特征描述方法。提取步骤如下:
1)从24位RGB格式的图像中,将每个颜色成分均匀的分成10份,统计每个颜色单元中包含的像素点个数记为ni,j,k,则均匀量化的直方图矢量为ci,j,k=ni,j,k/N(i,j,k∈{0,1,2,...,9}),其中N为图像中包含的像素点总数。初始化特征组gi*100+j*10+k=ci,j,k(i,j,k∈{0,1,2,...,9})。
2)对于未标记的每个特征(组),计算依据该特征(组)作判别的误差。从中选取误差最小(记为e1)的特征(组)g1。
3)在特征(组)g1的颜色空间邻域范围内寻找满足以下要求,误差最小的特征(组)g2:
i)将特征(组)g1和g2合并后的判别误差e2<e1。
ii)g1和g2中包含的元素在三个颜色成分的最大差别小于给定阈值τ。
4)如果找不到这样的特征(组)g2,则标记特征(组)g1,否则将特征(组)g2并入g1同时删除组g2。如果存在未被标记的组则转到第2步,否则退出循环。
值得注意的是:第一,上述步骤中均采用线性判别式分析(LDA)作为判别算法,在终止循环之前记录所有的分组情况及其相应的LDA权重;第二,这样的训练过程只需预先进行一次,之后便可以通过所得到的分组和LDA权重来计算任何图像的非均匀量化颜色直方图特征。
如图3所示,皮肤区域分布特征的提取,通过颜色门限、纹理检验方法,从图像中提取皮肤区域,并生成描述皮肤区域分布情况的特征矢量。具体如下:
1.色彩门限法
首先将图像转化到HIS颜色空间,选取满足以下条件的像素点为可能的皮肤点:H∈[0,1.6]∪[5.6,2π],I>100,0.1<S<0.88且R>240。
2.纹理检验
通过Gabor特征来描述皮肤区域的纹理特征,从可能的皮肤点中过滤掉与皮肤纹理模型不符的像素点。
3.皮肤区域的描述
从得到的皮肤区域中,提取以下特征:
i)pi=皮肤点的总数/图像中包含的总像素点
ii)p2=最大连接皮肤块中包含的像素点总数/图像中包含的总像素点
iii)p3=最大连接皮肤块中包含的像素点总数/最小外包矩形面积
采用自适应提升算法,综合分析所提取的特征组合,根据其与图像样本库内敏感图像和正常图像的匹配程度,判别该图像是否为敏感图像,具体如下:
记训练集中包含的非敏感图像特征集为{x1 +,x2 +,…,xp +},敏感图像特征集为{x1 -,x2 -,…,xn -},其中xi +和xi -为包含所有图像特征(基本特征和内容特征)的矢量。预设平衡因子c(0<c<1),整个判别方法如下:
1)初始化样本权重
2)针对每个图像特征,根据样本权重训练一个相应的基本分类器hj,其产生的误差为
3)选取误差最小的图像特征,记其误差为et,并计算
4)更新权重
其中,Zt +和Zt -是归一化因子。
5)t=t+1,如果t大于给定的阈值T,则退出循环,否则转到步骤2)。
6)最终的判别方法为
其中平衡因子c用来调节识别率和错误率的平衡,可以针对不同的情况采取不同的判别方法(如对于比较可靠的图像信息来源,可以适当提高因子c来降低错误率,反之亦然)。
为了实施本发明的具体方法,设计并实现了基于图像内容识别的互联网上敏感图像过滤系统。通过10,000多幅互联网上随机获取图像的性能测试(包含3,000幅敏感图像),本系统对于图像内容的识别有着较高正确率,即正确判断一幅是敏感图像,识别率高于88%;同时有着较低的错误率,即将一幅正常图像判断为敏感图像,错误率小于10%。
Claims (9)
1、一种基于非均匀量化颜色特征矢量的敏感图像过滤方法,其特征在于,首先进行多种图像特征的提取,包括图像基本特征的提取和图像内容特征的提取,图像基本特征是针对敏感图像特点的非均匀量化颜色直方图特征;图像内容特征是基于纹理检测的皮肤区域分布特征;然后采用自适应提升算法,综合分析所提取的特征组合,根据其与图像样本库内敏感图像和正常图像的匹配程度,判别该图像是否为敏感图像。
2、根据权利要求1所述的基于非均匀量化颜色特征矢量的敏感图像过滤方法,其特征是,所述的非均匀量化颜色直方图特征的提取,首先建立一个包含敏感图像和非敏感图像的训练集,从中获得能够区分敏感和非敏感图像的特征描述方法,提取步骤如下:
1)从24位RGB格式的图像中,将每个颜色成分均匀的分成10份,统计每个颜色单元中包含的像素点个数记为ni,j,k,则均匀量化的直方图矢量为ci,j,k=ni,j,k/N(i,j,k∈{0,1,2,...,9}),其中N为图像中包含的像素点总数,初始化特征组
2)对于未标记的每个特征组,计算依据该特征组作判别的误差。从中选取误差最小的特征组g1,其所对应的误差为e1;
3)在特征组g1的颜色空间邻域范围内寻找满足要求,误差最小的特征组g2;
4)如果所有e2≥e1,则标记特征组g1,否则将特征组g2并入g1同时删除组g2;如果存在未被标记的组则转到第2)步,否则退出循环。
3、根据权利要求2所述的基于非均匀量化颜色特征矢量的敏感图像过滤方法,其特征是,所述的误差最小的特征组g2满足以下要求:
i)将特征组g1和g2合并后的判别误差e2<e1;
ii)g1和g2中包含的元素在三个颜色成分的最大差别小于给定阈值τ。
4、根据权利要求2所述的基于非均匀量化颜色特征矢量的敏感图像过滤方法,其特征是,所述的非均匀量化颜色直方图特征,采用线性判别式分析作为判别算法,在终止循环之前记录所有的分组情况及其相应的LDA权重;这样的训练过程只需预先进行一次,之后便通过所得到的分组和LDA权重来计算任何图像的非均匀量化颜色直方图特征。
5、根据权利要求1所述的基于非均匀量化颜色特征矢量的敏感图像过滤方法,其特征是,所述的基于纹理检测的皮肤区域分布特征,通过颜色门限法、纹理检验法从图像中提取皮肤区域,并生成描述皮肤区域分布情况的特征矢量。
6、根据权利要求5所述的基于非均匀量化颜色特征矢量的敏感图像过滤方法,其特征是,所述的色彩门限法,具体是:首先将图像转化到HIS颜色空间,选取满足以下条件的像素点为可能的皮肤点:H∈[0,1.6]∪[5.6,2π],I>100,0.1<S<0.88且R>240。
7、根据权利要求5所述的基于非均匀量化颜色特征矢量的敏感图像过滤方法,其特征是,所述的纹理检验法,具体是:通过Gabor特征来描述皮肤区域的纹理特征,从可能的皮肤点中寻找满足皮肤纹理模型的像素点。
8、根据权利要求5或者7所述的基于非均匀量化颜色特征矢量的敏感图像过滤方法,其特征是,所述的皮肤区域,其描述如下:
i)p1=皮肤点的总数/图像中包含的总像素点;
ii)p2=最大连接皮肤块中包含的像素点总数/图像中包含的总像素点;
iii)p3=最大连接皮肤块中包含的像素点总数/最小外包矩形面积。
9、根据权利要求1所述的基于非均匀量化颜色特征矢量的敏感图像过滤方法,其特征是,所述的采用自适应提升算法,综合分析所提取的特征组合,根据其与图像样本库内敏感图像和正常图像的匹配程度,判别该图像是否为敏感图像,具体如下:
记训练集中包含的非敏感图像特征集为{x1 +,x2 +,…,xp +},敏感图像特征集为{x1 -,x2 -,…,xn -},其中xi +和xi -为包含图像基本特征和内容特征的矢量,预设平衡因子c(0<c<1),整个判别方法如下:
1)初始化样本权重
t=0;
2)针对每个图像特征,根据样本权重训练一个相应的基本分类器hj,其产生的误差为
3)选取误差最小的图像特征,记其误差为et,并计算
4)更新权重
其中,Zt +和Zt -是归一化因子;
5)t=t+1,如果t大于给定的阈值T,则退出循环,否则转到步骤2);
6)最终的判别方法为
其中平衡因子c用来调节识别率和错误率的平衡。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005100282066A CN100370475C (zh) | 2005-07-28 | 2005-07-28 | 基于非均匀量化颜色特征矢量的敏感图像过滤方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005100282066A CN100370475C (zh) | 2005-07-28 | 2005-07-28 | 基于非均匀量化颜色特征矢量的敏感图像过滤方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1728161A true CN1728161A (zh) | 2006-02-01 |
CN100370475C CN100370475C (zh) | 2008-02-20 |
Family
ID=35927421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2005100282066A Expired - Fee Related CN100370475C (zh) | 2005-07-28 | 2005-07-28 | 基于非均匀量化颜色特征矢量的敏感图像过滤方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100370475C (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101923637A (zh) * | 2010-07-21 | 2010-12-22 | 康佳集团股份有限公司 | 一种移动终端及其人脸检测方法和装置 |
CN102306287A (zh) * | 2011-08-24 | 2012-01-04 | 百度在线网络技术(北京)有限公司 | 一种用于识别敏感图像的方法与设备 |
CN102436665A (zh) * | 2011-08-25 | 2012-05-02 | 清华大学 | 消化道图像二维平面表示方法 |
CN101763527B (zh) * | 2009-06-17 | 2012-12-12 | 中国科学院自动化研究所 | 基于层状目标侧面纹理分析的张数检测方法 |
CN102819583A (zh) * | 2012-07-26 | 2012-12-12 | 华数传媒网络有限公司 | 网络动画快速检索方法 |
CN107085766A (zh) * | 2017-04-20 | 2017-08-22 | 温州市鹿城区中津先进科技研究院 | 基于销量进行备料策略指导的大数据分析方法 |
CN108460390A (zh) * | 2018-02-27 | 2018-08-28 | 北京中晟信达科技有限公司 | 一种基于特征学习的敏感图像识别方法 |
CN116975895A (zh) * | 2023-09-21 | 2023-10-31 | 天津市城市规划设计研究总院有限公司 | 一种基于用户行为及图层内容的数据安全防护方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100364753B1 (ko) * | 1999-11-19 | 2002-12-16 | 엘지전자 주식회사 | 칼라 히스토그램의 빈값 양자화 방법 |
US20010044818A1 (en) * | 2000-02-21 | 2001-11-22 | Yufeng Liang | System and method for identifying and blocking pornogarphic and other web content on the internet |
CN1419361A (zh) * | 2002-10-31 | 2003-05-21 | 上海交通大学 | 网上图像智能安全监管方法 |
-
2005
- 2005-07-28 CN CNB2005100282066A patent/CN100370475C/zh not_active Expired - Fee Related
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101763527B (zh) * | 2009-06-17 | 2012-12-12 | 中国科学院自动化研究所 | 基于层状目标侧面纹理分析的张数检测方法 |
CN101923637A (zh) * | 2010-07-21 | 2010-12-22 | 康佳集团股份有限公司 | 一种移动终端及其人脸检测方法和装置 |
CN101923637B (zh) * | 2010-07-21 | 2016-03-16 | 康佳集团股份有限公司 | 一种移动终端及其人脸检测方法和装置 |
CN102306287A (zh) * | 2011-08-24 | 2012-01-04 | 百度在线网络技术(北京)有限公司 | 一种用于识别敏感图像的方法与设备 |
CN102306287B (zh) * | 2011-08-24 | 2017-10-10 | 百度在线网络技术(北京)有限公司 | 一种用于识别敏感图像的方法与设备 |
CN102436665A (zh) * | 2011-08-25 | 2012-05-02 | 清华大学 | 消化道图像二维平面表示方法 |
CN102819583A (zh) * | 2012-07-26 | 2012-12-12 | 华数传媒网络有限公司 | 网络动画快速检索方法 |
CN102819583B (zh) * | 2012-07-26 | 2016-08-24 | 华数传媒网络有限公司 | 网络动画快速检索方法 |
CN107085766A (zh) * | 2017-04-20 | 2017-08-22 | 温州市鹿城区中津先进科技研究院 | 基于销量进行备料策略指导的大数据分析方法 |
CN108460390A (zh) * | 2018-02-27 | 2018-08-28 | 北京中晟信达科技有限公司 | 一种基于特征学习的敏感图像识别方法 |
CN116975895A (zh) * | 2023-09-21 | 2023-10-31 | 天津市城市规划设计研究总院有限公司 | 一种基于用户行为及图层内容的数据安全防护方法及装置 |
CN116975895B (zh) * | 2023-09-21 | 2024-01-19 | 天津市城市规划设计研究总院有限公司 | 一种基于用户行为及图层内容的数据安全防护方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN100370475C (zh) | 2008-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Grid-based pavement crack analysis using deep learning | |
CN1728161A (zh) | 基于非均匀量化颜色特征矢量的敏感图像过滤方法 | |
CN107134144B (zh) | 一种用于交通监控的车辆检测方法 | |
WO2017190574A1 (zh) | 一种基于聚合通道特征的快速行人检测方法 | |
CN109558810B (zh) | 基于部位分割与融合目标人物识别方法 | |
CN109800648A (zh) | 基于人脸关键点校正的人脸检测识别方法及装置 | |
CN107688784A (zh) | 一种基于深层特征和浅层特征融合的字符识别方法及存储介质 | |
CN105760858A (zh) | 一种基于类Haar中间层滤波特征的行人检测方法及装置 | |
Sugiarto et al. | Wood identification based on histogram of oriented gradient (HOG) feature and support vector machine (SVM) classifier | |
CN104992142A (zh) | 一种基于深度学习和属性学习相结合的行人识别方法 | |
CN108171223A (zh) | 一种基于多模型多通道的人脸识别方法及系统 | |
CN105389593A (zh) | 基于surf特征的图像物体识别方法 | |
CN101853397A (zh) | 一种基于人类视觉特性的仿生人脸检测方法 | |
CN103065122A (zh) | 基于面部动作单元组合特征的人脸表情识别方法 | |
CN104008395A (zh) | 一种基于人脸检索的不良视频智能检测方法 | |
CN101667245A (zh) | 基于支持向量新颖检测分类器级联的人脸检测方法 | |
CN109034281A (zh) | 加速基于卷积神经网络的中文手写体识别的方法 | |
CN105956570B (zh) | 基于唇部特征和深度学习的笑脸识别方法 | |
CN105844221A (zh) | 一种基于Vadaboost筛选特征块的人脸表情识别方法 | |
CN102129574B (zh) | 一种人脸认证方法及系统 | |
CN102982321A (zh) | 人脸库采集方法及装置 | |
CN108681737A (zh) | 一种复杂光照下图像特征提取方法 | |
CN110543906A (zh) | 基于数据增强和Mask R-CNN模型的肤质自动识别方法 | |
CN109344720B (zh) | 一种基于自适应特征选择的情感状态检测方法 | |
CN107357834A (zh) | 一种基于视觉显著性融合的图像检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20080220 Termination date: 20130728 |