CN101661559B - 一种数字图像训练和检测方法 - Google Patents
一种数字图像训练和检测方法 Download PDFInfo
- Publication number
- CN101661559B CN101661559B CN 200910092710 CN200910092710A CN101661559B CN 101661559 B CN101661559 B CN 101661559B CN 200910092710 CN200910092710 CN 200910092710 CN 200910092710 A CN200910092710 A CN 200910092710A CN 101661559 B CN101661559 B CN 101661559B
- Authority
- CN
- China
- Prior art keywords
- image
- training
- sample
- svm
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明提供一种数字图像训练方法以及利用该训练方法的图像检测方法。其中该训练方法包括下列步骤:提取训练样本的图像特征;根据所述图像特征对所述训练样本进行聚类分析,将所述训练样本分为多个子类;对于每个子类,根据所述图像特征进行SVM训练,生成SVM模型。利用该训练方法所获得的多个SVM模型进行图像检测,检测准确率高、且具有较佳推广性和较高时效性。
Description
技术领域
本发明涉及模式识别领域,更具体地,涉及一种数字图像训练和检测方法。
背景技术
随着多媒体技术的进步和网络带宽的显著提高,互联网络中图像和视频信息比重日趋增大,其中不乏一些有害的不良信息,例如色情图像和视频,已经成为互联网的一大公害,日益成为一个全球性的社会问题。研究如何提高对网上大规模视频有害信息、垃圾信息的过滤防范能力,以实现互联网有效治理、健康发展,具有重要的意义。
对于色情图像等不良图像信息,由于肤色差异、光线和环境的多样性导致目前检测难度很大。现有技术中,有些仅采用肤色检测,这种方法误检率高,容易将具有类似肤色的非色情图像误识为色情图像,诸如图像中包括黄色的门和墙壁的图像。如果肤色检测阈值过高则导致过高漏检率,而且单一肤色模型无法囊括各种可能的肤色,可推广性能差;还有一些采用不同的图像特征训练单一的SVM模型,但此种方法可推广性能差,而且所需的训练时间和测试时间长。
因此,迫切需要一种检测准确、且具有较佳推广性和较高时效性的数字图像训练和检测方法。
发明内容
为解决上述问题,本发明提供了一种检测准确率高、且具有较佳推广性和较高时效性的图像训练和检测方法。
根据本发明的一个方面,提供了一种数字图像训练方法,包括下列步骤:
提取训练样本的图像特征;
根据所述图像特征对所述训练样本进行聚类分析,将所述训练样本分为多个子类;
对于每个子类,根据所述图像特征进行SVM训练,生成SVM模型。
在上述训练方法中,所述图像特征包括颜色特征和边缘特征。
在上述训练方法中,所述聚类分析的步骤进一步包括:
将所述颜色特征和边缘特征进行前融合;
根据所述前融合后的特征对所述训练样本进行聚类分析。
在上述训练方法中,所述颜色特征是颜色直方图。
在上述训练方法中,所述SVM训练的步骤进一步包括:
将所述颜色特征和边缘特征进行前融合;
根据所述前融合后的特征进行SVM训练。
在上述训练方法中,所述颜色特征是颜色矩。
在上述训练方法中,所述聚类分析采用隐狄利克雷分布聚类或K均值聚类。
在上述训练方法中,所述聚类分析的步骤将每个训练样本划分到一个或多个所述子类中。
根据本发明的另一方面,还提供了一种根据权利要求1所述的训练方法的数字图像检测方法,包括下列步骤:
提取测试样本的图像特征;
计算所述测试样本属于所述每个子类的权重系数向量;
根据所述权重系数向量选择多个所述SVM模型;
根据所述权重系数向量计算所述测试样本在所述多个SVM模型上的可信度,根据所述可信度判断所述测试样本的类别。
在上述检测方法中,所述计算可信度的步骤可以包括下列步骤:
根据所述权重系数向量计算概率向量P(j|y),其中y表示所述测试样本,j表示第j个子类;
根据所述概率向量P(j|y)选择m个SVM模型,计算所述测试样本y在所述m个SVM模型的每个上的预测值P(y|j);
根据公式 计算所述可信度P(y)。
在上述检测方法中,所述计算可信度的步骤也可以采用平均融合方法。
根据本发明所提供的训练方法的检测方法,检测准确率高、且具有较佳推广性和较高时效性。
附图说明
图1是根据本发明一个具体实施例的数字图像训练方法的流程图;
图2是根据本发明一个具体实施例的数字图像检测方法的流程图;
图3是根据本发明一个具体实施例的ROC曲线图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对根据本发明一个实施例的数字图像训练和检测方法进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。本领域普通技术人员可以理解,在下面的实施例中,以色情图像作为数字图像的一个示例进行检测,本发明的方法也可以应用于其他数字图像。
图1示出了根据本发明一个具体实施例的数字图像训练方法的流程图,下面根据该流程图详细描述训练过程。
首先,建立大规模色情图像训练样本库。为保证样本库来源的广泛性,共离线搜集了1,108个色情视频和5,000个非色情视频,并从网络上实时抓取了20,000个网络色情视频片段,6.5万个非色情视频等;并搜集10万幅色情静态图像和10万幅非色情静态图像。为保证样本的代表性,可以采用基于DC系数的自适应快速聚类的关键帧提取算法对所搜集的视频进行关键帧提取。对所搜集的图像,其中包含视频关键帧,去除冗余的相似图像。在现有的样本上进行标注,将裸露乳房、股沟、阴部以及性交场景(包括自慰)的图像都标注为正样本,从而建立了训练样本库。样本库的规模为420,615幅,其中正负样本分布情况如表1所示。
表1训练样本库的正负样本分布
静态图像 | 视频关键帧图像 | 合计 | |
正样本个数 | 21,699 | 44,128 | 65,827 |
负样本个数 | 51,680 | 303,108 | 354,788 |
对于样本库中的样本进行图像特征提取,优选地,不仅提取其颜色特征,其中主要包括颜色直方图和颜色矩,还提取其边缘特征,在本实施例中为边缘直方图。上述两种特征提取实现简单、速度快。本领域的普通技术人员可以理解,除了上述具体的颜色特征和边缘特征仅是示例,还可以利用其他图像特征,例如:小波纹理和视觉关键词特征等。
根据上述图像特征进行聚类分析。优选的,采用样本图像特征提取速度相对较快的颜色特征(颜色直方图)和边缘特征(边缘直方图)进行前融合。根据前融合后的特征对训练样本进行聚类分析,将样本集分为k个子类。根据本发明的一个具体实施例,该聚类分析具体过程如下。
采用隐狄利克雷分布(LDA,即Latent Dirichlet Allocation)进行聚类。通过LDA分析共现(Cocurrence)关系特征,发现和提取样本集中隐含的语义结构,得到隐含的主题(Topic),根据样本总数,在本实施例中确定主题个数k=40。
将每个样本表示成一个主题表示向量(TRV,即Topic-simplexRepresentation Vector),对每个样本进行分类,该分类过程具体为:
对主题表示向量TRV归一化,按公式(1)计算样本图像x属于每个主题类Topicj的概率:
对样本图像x的概率向量(P(1|x),P(2|x),...,P(k|x))进行降序排列。可以采用软聚类方法进行分类,即按公式(2)选取最大的前m个元素,将样本图像x分到m个主题类{Topicl,...,Topicm}中。在公式(2)中,th为预先设定的阈值,0<th<1。也可以采用硬聚类方法进行分类,即选取最大元素P(j|x),即取m=1,将样本图像x分到一个主题类Topicj中。
本领域的普通技术人员可以理解,除了上述隐狄利克雷分布聚类方法,也可以采用其他聚类方法,例如K均值聚类等。而且对于其它聚类方法,可以采用计算样本图像x与每个类的聚类中心的距离的倒数或相似度来作为权重系数gj。
对于聚类所得到的每个子类,根据样本标注信息利用前述图像特征进行SVM训练,生成与每个子类一一对应的SVM训练模型。优选地,在进行SVM训练之前,首先将颜色矩和边缘直方图特征进行前融合。
图2示出了根据本发明一个具体实施例的数字图像检测方法的流程图。下面根据图2中所示,详细描述检测过程。对于测试样本,提取其与上面的训练过程中所提起的图像特征相同的图像特征,根据本发明的一个实施例,该图像特征为颜色特征和边缘特征。
与上面所述的训练样本的训练过程类似,优选地,将测试样本y的颜色特征(颜色直方图)和边缘特征(边缘直方图)前融合。计算测试样本属于每个子类的权重系数向量。根据本发明的上述采用LDA聚类的实施例,计算测试样本的主题表示向量作为其属于每个子类的权重系数向量。本领域普通技术人员可以理解,如果采用其它聚类方法,则也可以计算测试样本与每个类的聚类中心的距离或相似度来作为权重系数向量。
将主题表示向量TRV向量按公式(1)进行归一化,得到相应的概率向量P(j|y),并按降序进行排序,选择最大的前m个概率向量所对应的m个SVM模型进行预测(SVM Predict),得到该测试样本图像y在每个SVMj模型上的预测值P(y|j),用向量表示为:(P(y|1),P(y|2),...,P(y|m))。
根据本发明的一个具体实施例,可以采用平均融合方法,如公式(3)所示,即对测试样本y在m个主题类的SVM模型上的预测值的平均值来作为该测试样本y属于色情的可信度值:
根据本发明的另一个优选具体实施例,还可以采用自适应融合方法。根据所选择的m个SVM模型,以及该测试样本y在每个SVMj模型上相应的预测值,按公式(4)对该测试样本y在每个子类进行自适应融合,计算该测试样本y属于色情的可信度值。
优选地,还将可信度值归一化到区间[0,1]。若该值大于一定阈值,则判定该测试样本为色情图像,否则为非色情图像。
根据本发明的上述实施例,在色情图像检测时,在聚类分析和SVM训练与测试时分别用了颜色直方图和颜色矩,对聚类后的多个子类建立了多个SVM模型。由于所构建的训练样本库很大,样本来源相当广泛,因此能克服单一肤色模型无法囊括各种可能肤色的缺陷,从而对肤色检测具有较好的鲁棒性。通过融合边缘特征和基于分块的颜色矩特征建立SVM模型,大大降低误检率,排除了包括类似肤色但边缘和纹理明显不同的非色情图像。本发明采用聚类分析技术,实现了多SVM融合。可克服单一模型由于过拟合(Overfit)导致的可推广性能差这一问题,从而提高了检测精度;又由于采用了SVM模型选择策略,抛弃了毫不相关的模型,提高了检测速度。另外,由于分类后的样本个数比总的样本个数大减小,这可大大降低模型训练的时间,提高概念模型的训练效率。
将以上方法应用于互联网视频流实时内容过滤,测试结果如表2所示。其中,测试数据库是SVM模型训练完后独自建立的,与样本库来源完全不同,测试数据库中共7110幅图像,其中测试负例5415例,测试正例:1695例。
表2基于LDA聚类的多SVM色情图像检测结果表
检测阈值 | 正例识别率(查全率) | 负例识别率 | 误检率(负例识别成正例的比率) |
0.95 | 840/1695=49.56% | 5409/5415=99.89% | 1-99.89%=0.11% |
0.90 | 1016/1695=59.94% | 5395/5415=99.63% | 1-99.63%=0.37% |
0.80 | 1229/1695=72.51% | 5356/5415=98.91% | 1-98.91%=1.09% |
0.70 | 1377/1695=81.24% | 5307/5415=98.01% | 1-98.01%=1.99% |
0.60 | 1462/1695=86.25% | 5244/5415=96.84% | 1-96.84%=3.16% |
0.50 | 1527/1695=90.09% | 5151/5415=95.12% | 1-95.12%=4.88% |
从上述结果可知,根据本发明的一个具体实施例的数字图像检测方法能够较准确地进行图像检测。
另外,根据以下三种方法的对比实验:(1)基于肤色模型的方法(Skin-based);(2)单一SVM模型方法,因为训练效率问题,在该方法中没有取全部训练样本,仅从训练库中随机选取了120,000个训练样本;(3)基于本发明的LDA-SVM的方法(k=40),如图3的ROC曲线图所示,本发明所提供的方法明显优于前两种方法。
图3的ROC曲线图还示出了检测过程中分别采用平均融合方法和自适应融合方法的实验效果,其在图中分别示为LDA-SVM(AVG)和LDA-SVM。从图3中可知,自适应融合方法更有效。
表3示出了本发明所提供的图像训练和检测方法和现有的单一SVM模型方法的训练时间和测试时间。
表3训练和检测时间表
方法 | 训练样本个数 | 支持向量个数 | 训练时间 | 测试时间 |
SVM | 120,000 | 24,112 | 72小时 | 667毫秒 |
LDA-SVM | 420,615 | 平均每个主题:1,842 | 6小时 | 49毫秒 |
通过表3所示可以理解,本发明提出的图像训练和检测方法与单一SVM模型方法相比更高效。
应该注意到并理解,针对不同的数字图像,通过建立相应的大规模训练样本库和研究使用相应的特征,应用本发明所提供的方法可以进行其它数字图像的检测,如飞机图像、汽车图像等的检测。在不脱离后附的权利要求所要求的本发明的精神和范围的情况下,能够对上述详细描述的本发明做出各种修改和改进。因此,要求保护的技术方案的范围不受所给出的任何特定示范教导的限制。
Claims (7)
1.一种数字图像检测方法,包括训练步骤和检测步骤,其中训练步骤包括下列子步骤:
1)提取训练样本的图像特征;
2)根据所述图像特征对所述训练样本进行聚类分析,将所述训练样本分为多个子类;
3)对于每个子类,根据所述图像特征进行SVM训练,生成SVM模型;
所述步骤2)中,将每个样本图像x表示成一个主题表示向量(g1,g2,...,gk),该向量中每个元素gj表示样本图像x在第j个主题类上的权重系数,其表示该样本属于第j个主题类的程度;
对权重系数向量归一化,计算样本图像x属于每个主题类的概率
对样本图像x的概率向量(P(1|x),P(2|x),...,P(k|x))进行降序排列,选取其中最大的前m个元素,将样本图像x分到m个主题类中,其中按照下述公式选取最大的前m个元素:
其中,th为预先设定的阈值,0<th<1;
2.根据权利要求1所述的检测方法,其特征在于,所述图像特征包括颜色特征和边缘特征。
3.根据权利要求2所述的检测方法,其特征在于,所述聚类分析的步骤进一步包括:
将所述颜色特征和边缘特征进行前融合;
根据所述前融合后的特征对所述训练样本进行聚类分析。
4.根据权利要求3所述的检测方法,其特征在于,所述颜色特征是颜色直方图。
5.根据权利要求2所述的检测方法,其特征在于,所述SVM训练的步骤进一步包括:
将所述颜色特征和边缘特征进行前融合;
根据所述前融合后的特征进行SVM训练。
6.根据权利要求5所述的检测方法,其特征在于,所述颜色特征是颜色矩。
7.根据权利要求1所述的检测方法,其特征在于,所述聚类分析采用隐狄利克雷分布聚类或K均值聚类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200910092710 CN101661559B (zh) | 2009-09-16 | 2009-09-16 | 一种数字图像训练和检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200910092710 CN101661559B (zh) | 2009-09-16 | 2009-09-16 | 一种数字图像训练和检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101661559A CN101661559A (zh) | 2010-03-03 |
CN101661559B true CN101661559B (zh) | 2013-03-06 |
Family
ID=41789569
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200910092710 Active CN101661559B (zh) | 2009-09-16 | 2009-09-16 | 一种数字图像训练和检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101661559B (zh) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101819638B (zh) * | 2010-04-12 | 2012-07-11 | 中国科学院计算技术研究所 | 色情检测模型建立方法和色情检测方法 |
US9014423B2 (en) | 2011-03-14 | 2015-04-21 | Siemens Aktiengesellschaft | Method and system for catheter tracking in fluoroscopic images using adaptive discriminant learning and measurement fusion |
CN102697482B (zh) * | 2011-03-14 | 2016-01-20 | 西门子公司 | 使用自适应判别学习和测量融合的导管跟踪的方法和系统 |
CN102496146B (zh) * | 2011-11-28 | 2014-03-05 | 南京大学 | 一种基于视觉共生的图像分割方法 |
CN102646199B (zh) * | 2012-02-29 | 2013-12-18 | 湖北莲花山计算机视觉和信息科学研究院 | 复杂场景中的车型识别方法 |
CN103559175B (zh) * | 2013-10-12 | 2016-08-10 | 华南理工大学 | 一种基于聚类的垃圾邮件过滤系统及方法 |
CN103886585A (zh) * | 2014-02-18 | 2014-06-25 | 浙江大学 | 一种基于排序学习的视频跟踪方法 |
CN104091152A (zh) * | 2014-06-30 | 2014-10-08 | 南京理工大学 | 大数据环境下的行人检测的方法 |
CN104268595B (zh) * | 2014-09-24 | 2018-02-13 | 深圳市华尊科技股份有限公司 | 通用物件检测方法及系统 |
CN105095884B (zh) * | 2015-08-31 | 2018-11-13 | 桂林电子科技大学 | 一种基于随机森林支持向量机的行人识别系统及处理方法 |
CN105354307B (zh) * | 2015-11-06 | 2021-01-15 | 腾讯科技(深圳)有限公司 | 一种图像内容识别方法及装置 |
CN105844299B (zh) * | 2016-03-23 | 2019-04-23 | 浙江理工大学 | 一种基于词袋模型的图像分类方法 |
CN105893573B (zh) * | 2016-03-31 | 2019-07-23 | 天津大学 | 一种基于地点的多模态媒体数据主题提取模型 |
CN107291737B (zh) * | 2016-04-01 | 2019-05-14 | 腾讯科技(深圳)有限公司 | 敏感图像识别方法及装置 |
CN106210784A (zh) * | 2016-08-05 | 2016-12-07 | 黄新勇 | 视频安全播放方法及系统 |
CN106682694A (zh) * | 2016-12-27 | 2017-05-17 | 复旦大学 | 一种基于深度学习的敏感图像识别方法 |
CN107067143A (zh) * | 2016-12-30 | 2017-08-18 | 山东鲁能软件技术有限公司 | 一种设备安全等级分类方法 |
CN107819698A (zh) * | 2017-11-10 | 2018-03-20 | 北京邮电大学 | 一种基于半监督学习的网络流量分类方法、计算机设备 |
CN108664921B (zh) * | 2018-05-10 | 2021-07-20 | 江苏大学 | 一种安卓平台下基于词袋模型的图像识别方法及系统 |
CN110147878B (zh) * | 2018-11-28 | 2023-01-31 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置及设备 |
CN110991220B (zh) * | 2019-10-15 | 2023-11-07 | 京东科技信息技术有限公司 | 禽蛋检测、图像处理方法,装置、电子设备及存储介质 |
CN111476297A (zh) * | 2020-04-07 | 2020-07-31 | 中国民航信息网络股份有限公司 | 一种类别确定方法及装置 |
CN115188429A (zh) * | 2022-07-27 | 2022-10-14 | 华东理工大学 | 一种融合时序特征提取的催化裂化装置关键指标建模方法 |
CN116091883B (zh) * | 2023-04-10 | 2023-07-18 | 深圳市普雷德科技有限公司 | 基于多源信息融合的目标检测识别方法、系统及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101122952A (zh) * | 2007-09-21 | 2008-02-13 | 北京大学 | 一种图片文字检测的方法 |
-
2009
- 2009-09-16 CN CN 200910092710 patent/CN101661559B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101122952A (zh) * | 2007-09-21 | 2008-02-13 | 北京大学 | 一种图片文字检测的方法 |
Non-Patent Citations (1)
Title |
---|
佟雨兵等.《基于PSNR与SSM联合的图像质量评价模型》.《中国图象图形学报》.2006,第11卷(第12期),2.1,2.2,第3-4章节. * |
Also Published As
Publication number | Publication date |
---|---|
CN101661559A (zh) | 2010-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101661559B (zh) | 一种数字图像训练和检测方法 | |
CN110084151B (zh) | 基于非局部网络深度学习的视频异常行为判别方法 | |
CN104268599B (zh) | 一种基于车辆轨迹时空特征分析的黑车智能发现方法 | |
CN103020618B (zh) | 视频图像文字的检测方法及系统 | |
CN103812872B (zh) | 一种基于混合狄利克雷过程的网络水军行为检测方法及系统 | |
CN105005594B (zh) | 异常微博用户识别方法 | |
CN102346847B (zh) | 一种支持向量机的车牌字符识别方法 | |
CN101763502B (zh) | 一种高效的敏感图像检测方法及其系统 | |
CN112001282A (zh) | 一种图像识别方法 | |
CN108446700A (zh) | 一种基于对抗攻击的车牌攻击生成方法 | |
CN102129568B (zh) | 利用改进的高斯混合模型分类器检测图像垃圾邮件的方法 | |
CN105808691A (zh) | 一种卡口车辆检索方法及其系统 | |
CN109960763A (zh) | 一种基于用户细粒度摄影偏好的摄影社区个性化好友推荐方法 | |
CN108921083A (zh) | 基于深度学习目标检测的非法流动摊贩识别方法 | |
CN101923652A (zh) | 一种基于肤色和特征部位联合检测的色情图片识别方法 | |
CN105718912B (zh) | 一种基于深度学习的车辆特征物检测方法 | |
CN103853744B (zh) | 一种面向用户生成内容的欺骗性垃圾意见检测方法 | |
CN107230267A (zh) | 基于人脸识别算法的幼儿园智能签到方法 | |
CN106203296B (zh) | 一种属性辅助的视频动作识别方法 | |
CN108549901A (zh) | 一种基于深度学习的快速迭代目标检测方法 | |
Schulz et al. | Small-scale incident detection based on microposts | |
CN108829661A (zh) | 一种基于模糊匹配的新闻主体名称提取方法 | |
CN107544961A (zh) | 一种社交媒体评论的情感分析方法、设备及其存储设备 | |
CN101251896A (zh) | 一种基于多分类器的物体检测系统及方法 | |
CN103337248A (zh) | 一种基于时间序列核聚类的机场噪声事件识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |