CN107886102A - Adaboost分类器训练方法及系统 - Google Patents

Adaboost分类器训练方法及系统 Download PDF

Info

Publication number
CN107886102A
CN107886102A CN201610866106.9A CN201610866106A CN107886102A CN 107886102 A CN107886102 A CN 107886102A CN 201610866106 A CN201610866106 A CN 201610866106A CN 107886102 A CN107886102 A CN 107886102A
Authority
CN
China
Prior art keywords
sample
svm classifier
training set
window
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610866106.9A
Other languages
English (en)
Other versions
CN107886102B (zh
Inventor
田凤彬
于晓静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ingenic Semiconductor Co Ltd
Original Assignee
Beijing Ingenic Semiconductor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ingenic Semiconductor Co Ltd filed Critical Beijing Ingenic Semiconductor Co Ltd
Priority to CN201610866106.9A priority Critical patent/CN107886102B/zh
Publication of CN107886102A publication Critical patent/CN107886102A/zh
Application granted granted Critical
Publication of CN107886102B publication Critical patent/CN107886102B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Abstract

本发明提供一种Adaboost分类器训练方法及系统。所述方法包括:通过第一训练集训练所述Adaboost分类器训练时需要用到的SVM分类器;使用训练出的SVM分类器提取第二训练集的样本特征;根据提取出的第二训练集的样本特征训练Adaboost分类器。本发明能够缩短Adaboost分类器的训练时间。

Description

Adaboost分类器训练方法及系统
技术领域
本发明涉及分类器技术领域,尤其涉及一种Adaboost分类器训练方法及系统。
背景技术
人脸检测、行人检测、车辆检测等目标检测技术是智能视频监控的核心技术之一。目前,目标检测有两种主流的方法:基于运动检测和基于分类器检测。基于运动检测是通过背景建模等技术分割出场景中的运动目标(前景),速度快,但是对光照变化、恶劣天气、干扰物等很敏感。基于分类器检测是使用机器学习的方法,事先训练一个特定目标的分类器(如人脸分类器),运行时,对整个视频帧进行扫描,检测出其中所有的目标。
在目标检测分类器中,被广泛使用的是Adaboost分类器。Adaboost分类器在训练时一般是通过大量计算获得训练样本的样本特征,训练时间较长。
发明内容
本发明提供的Adaboost分类器训练方法及系统,能够缩短Adaboost分类器的训练时间。
第一方面,本发明提供一种Adaboost分类器训练方法,所述方法包括:
通过第一训练集训练所述Adaboost分类器训练时需要用到的SVM分类器;
使用训练出的SVM分类器提取第二训练集的样本特征;
根据提取出的第二训练集的样本特征训练Adaboost分类器。
可选地,所述通过第一训练集训练所述Adaboost分类器训练时需要用到的SVM分类器,包括:
2-1)选择第一目标窗口的一部分区域,作为小块目标窗口,所述第一目标窗口与所述第一训练集中的正样本或负样本一样大小;
2-2)从所述第一训练集提取所述小块目标窗口对应的样本特征;
2-3)根据所述小块目标窗口对应的样本特征训练所述小块目标窗口的SVM分类器;
2-4)使用训练出的所述小块目标窗口的SVM分类器检测负样本原始图片集,将识别为正样本的目标区域截取出来投入到所述第一训练集以更新所述第一训练集;
2-5)返回步骤2-2),重复执行预定的训练次数,训练出所述小块目标窗口的SVM分类器;
2-6)遍历不同大小和不同位置的所有小块目标窗口,按步骤2-1)~2-5)训练所述所有小块目标窗口的SVM分类器;
2-7)使用训练出的所述所有小块目标窗口的SVM分类器检测测试库中的测试图片,得到所述所有小块目标窗口的SVM分类器的正检率;
2-8)按照正检率从高到低对所述所有小块目标窗口的SVM分类器进行排序,将窗口重合面积超过各自预定比例的任意两个窗口的SVM分类器进行合并,保留其中正检率大的SVM分类器;
2-9)按照正检率从高到低对合并后的所有的SVM分类器进行排序,选择排在前面的预定个数的SVM分类器。
可选地,所述从所述第一训练集提取所述小块目标窗口对应的样本特征,包括:
计算所述第一训练集中所有正样本与所述小块目标窗口相同位置的图像数据的正样本直方图数据;
计算所述第一训练集中所有负样本与所述小块目标窗口相同位置的图像数据的负样本直方图数据。
可选地,所述使用训练出的所述小块目标窗口的SVM分类器检测负样本原始图片集,将识别为正样本的目标区域截取出来投入到所述第一训练集以更新所述第一训练集,包括:
4-1)使用第一检测窗口从负样本原始图片中选择目标区域,所述第一检测窗口与所述第一训练集中的正样本或负样本一样大小;
4-2)使用训练出的所述小块目标窗口的SVM分类器对所述目标区域的图像数据进行映射,生成所述目标区域的数据特征矩阵;
4-3)根据所述目标区域的数据特征矩阵,判断所述目标区域是正样本或负样本;
4-4)如果判断所述目标区域是正样本,截取所述目标区域,投入到所述第一训练集;
4-5)使用所述第一检测窗口遍历负样本原始图片的不同目标区域,重复执行步骤4-2)~4-4);
4-6)将所述负样本原始图片缩小预定的比例值;
4-7)判断缩小后的负样本原始图片是否大于所述第一检测窗口,如果缩小后的负样本原始图片大于所述第一检测窗口,返回步骤4-1),否则检测下一张负样本原始图片;
4-8)按步骤4-1)~4-7)检测所有负样本原始图片。
可选地,所述根据所述目标区域的数据特征矩阵,判断所述目标区域是正样本或负样本,包括:
将所述目标区域的数据特征矩阵中的全部数据进行求和,如果大于预定阈值,判断所述目标区域为正样本,否则判断所述目标区域为负样本。
可选地,所述使用训练出的SVM分类器提取第二训练集的样本特征,包括:
使用所述训练出的SVM分类器对所述第二训练集中的正样本的图像数据进行映射,生成正样本的数据特征矩阵;
使用所述训练出的SVM分类器对所述第二训练集中的负样本的图像数据进行映射,生成负样本的数据特征矩阵。
第二方面,本发明提供一种Adaboost分类器训练系统,所述系统包括:
SVM分类器训练模块,用于通过第一训练集训练所述Adaboost分类器训练时需要用到的SVM分类器;
第二训练集特征提取模块,用于使用所述SVM分类器训练模块训练出的SVM分类器提取第二训练集的样本特征;
Adaboost分类器训练模块,用于根据所述第二训练集特征提取模块提取出的第二训练集的样本特征训练Adaboost分类器。
可选地,所述SVM分类器训练模块包括:
小块目标窗口选择单元,用于从第一目标窗口中选择不同的小块目标窗口,所述第一目标窗口与所述第一训练集中的正样本或负样本一样大小;
第一训练集特征提取单元,用于从所述第一训练集提取所述小块目标窗口选择单元选择的小块目标窗口对应的样本特征;
SVM分类器训练单元,用于根据所述第一训练集特征提取单元提取的小块目标窗口对应的样本特征训练所述小块目标窗口的SVM分类器;
负样本原始图片集检测单元,用于使用所述SVM分类器训练单元训练出的小块目标窗口的SVM分类器检测负样本原始图片集,将识别为正样本的目标区域截取出来投入到所述第一训练集以更新所述第一训练集;
测试库检测单元,用于使用所述SVM分类器训练单元训练出的所有小块目标窗口的SVM分类器检测测试库中的测试图片,得到所述所有小块目标窗口的SVM分类器的正检率;
第一排序单元,用于根据所述测试库检测单元得到的所有小块目标窗口的SVM分类器的正检率从高到低对所述所有小块目标窗口的SVM分类器进行排序;
合并单元,用于将所述第一排序单元排序之后的所有小块目标窗口的SVM分类器中窗口重合面积超过各自预定比例的任意两个窗口的SVM分类器进行合并,保留其中正检率大的SVM分类器;
第二排序单元,用于按照正检率从高到低对所述合并单元合并后的所有的SVM分类器进行排序;
SVM分类器选择单元,用于选择所述第二排序单元排序之后排在前面的预定个数的SVM分类器。
可选地,所述第一训练集特征提取单元,包括:
第一正样本特征提取子单元,用于计算所述第一训练集中所有正样本与所述小块目标窗口相同位置的图像数据的正样本直方图数据;
第一负样本特征提取子单元,用于计算所述第一训练集中所有负样本与所述小块目标窗口相同位置的图像数据的负样本直方图数据。
可选地,所述负样本原始图片集检测单元,包括:
目标区域选择子单元,用于使用第一检测窗口从负样本原始图片中选择目标区域,所述第一检测窗口与所述第一训练集中的正样本或负样本一样大小;
映射子单元,用于使用所述SVM分类器训练单元训练出的所述小块目标窗口的SVM分类器对所述目标区域选择子单元选择的目标区域的图像数据进行映射,生成所述目标区域的数据特征矩阵;
第一判断子单元,用于根据所述映射子单元生成的目标区域的数据特征矩阵,判断所述目标区域是正样本或负样本;
截取子单元,用于当所述第一判断子单元判断所述目标区域是正样本时,截取所述目标区域,投入到所述第一训练集;
缩放子单元,用于将所述负样本原始图片缩小预定的比例值;
第二判断子单元,用于判断所述缩放子单元缩小后的负样本原始图片是否大于所述第一检测窗口。
可选地,所述第一判断子单元,用于将所述目标区域的数据特征矩阵中的全部数据进行求和,如果大于预定阈值,判断所述目标区域为正样本,否则判断所述目标区域为负样本。
可选地,所述第二训练集特征提取模块,包括:
第二正样本特征提取单元,用于使用所述SVM分类器训练模块训练出的SVM分类器对所述第二训练集中的正样本的图像数据进行映射,生成正样本的数据特征矩阵;
第二负样本特征提取单元,用于使用所述SVM分类器训练模块训练出的SVM分类器对所述第二训练集中的负样本的图像数据进行映射,生成负样本的数据特征矩阵。
本发明提供的Adaboost分类器训练方法及系统,通过第一训练集训练所述Adaboost分类器训练时需要用到的SVM分类器;使用训练出的SVM分类器提取第二训练集的样本特征;根据提取出的第二训练集的样本特征训练Adaboost分类器。与现有技术相比,本发明通过预先训练好的SVM分类器映射获得训练样本的样本特征,避免了大量计算,能够缩短Adaboost分类器的训练时间,同时结合了SVM分类器训练精度高的优点,解决了Adaboost分类器在小样本情况下训练效果不好的问题。进一步地,本发明训练出的Adaboost分类器进行目标检测时,检测速度更快,同时正检率提高,误检率下降,提高了检测效果。
附图说明
图1为本发明一实施例提供的Adaboost分类器训练方法的流程图;
图2为本发明实施例中通过第一训练集训练Adaboost分类器训练时需要用到的SVM分类器的流程图;
图3为本发明实施例中灰度图预处理后的图像数据与数据特征矩阵的映射关系示意图;
图4为本发明实施例中使用SVM分类器检测负样本原始图片集的流程图;
图5为本发明一实施例提供的Adaboost分类器训练系统的结构示意图;
图6为本发明实施例中SVM分类器训练模块的结构示意图;
图7为本发明实施例中第一训练集特征提取单元的结构示意图;
图8为本发明实施例中负样本原始图片集检测单元的结构示意图;
图9为本发明实施例中第二训练集特征提取模块的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种Adaboost分类器训练方法,如图1所示,所述方法包括:
S11、通过第一训练集训练所述Adaboost分类器训练时需要用到的SVM分类器;
S12、使用训练出的SVM分类器提取第二训练集的样本特征;
S13、根据提取出的第二训练集的样本特征训练Adaboost分类器。
具体地,首先建立第一训练集,用于训练所述Adaboost分类器训练时需要用到的SVM(Support Vector Machine,支持向量机)分类器。
通常我们将包含目标实例的样本称为正样本,将不包含目标实例的样本称为负样本,所有正样本构成一个集合,称为正样本集,所有负样本构成一个集合,称为负样本集。正样本集和负样本集一起构成第一训练集。
本实施例中的负样本都是从负样本原始图片中截取,通常将用于截取负样本的负样本原始图片构成的集合称为负样本原始图片集。负样本原始图片比负样本要大,从负样本原始图片中随机截取出和正样本一样大小的图片作为负样本,保证正样本和负样本的数量比例为1:10。在由负样本原始图片集生成负样本集的过程中,通常所有的负样本原始图片保存在一个目录文件下,比如1.jpg,2.jpg,3.jpg,4.jpg,……,66.jpg,……,90.jpg,……,888.jpg,考虑到在采集或搜索负样本原始图片时,一般相邻的图片相似度很高,为避免重复性,使用随机程序对这些图片的顺序进行打乱,比如生成了888.jgp,3.jpg,90.jpg,66.jpg,……,再从这些图片中随机截取一块和正样本一样大小的区域作为负样本。
将所述第一训练集中的正样本和负样本转化为灰度图,所述灰度图的像素取值范围是0~255,再对所述灰度图进行预处理,主要包括sobel算法处理和lbp算法处理,预处理可以有效地突出所述第一训练集中的样本图片的纹理信息,所述灰度图预处理后的图像数据其实是一个由不同像素构成的矩阵,矩阵的数据都是像素值,像素取值范围依然是0~255。
根据所述灰度图预处理后的图像数据,下一步就可以训练SVM分类器。
可选地,如图2所示,所述通过第一训练集训练所述Adaboost分类器训练时需要用到的SVM分类器,包括:
S21、选择第一目标窗口的一部分区域,作为小块目标窗口,所述第一目标窗口与所述第一训练集中的正样本或负样本一样大小。与现有训练SVM分类器不同的是,现有技术使用与正样本或负样本一样大小的第一目标窗口训练SVM分类器,而本发明实施例采用的小块目标窗口,只是正样本或负样本的一部分区域,所述小块目标窗口的面积比正样本或负样本要小。
S22、从所述第一训练集提取所述小块目标窗口对应的样本特征。可以包括:
计算所述第一训练集中所有正样本与所述小块目标窗口相同位置的图像数据的正样本直方图数据;
计算所述第一训练集中所有负样本与所述小块目标窗口相同位置的图像数据的负样本直方图数据。
S23、根据所述小块目标窗口对应的样本特征训练所述小块目标窗口的SVM分类器。将上述正样本直方图数据和负样本直方图数据作为样本特征投入到SVM训练器,训练出所述小块目标窗口的SVM分类器。
所述小块目标窗口的SVM分类器其实是一个一维数组,数组中有256个浮点型的数据,一般采用.xml格式或.txt格式保存,根据前面提到的,第一训练集中的样本图片转化成的灰度图经过预处理后的图像像素值取值范围是0~255,共256个,所述小块目标窗口的SVM分类器中的每一个浮点型数据对应0~255中的一个像素值,默认对应关系是第1个数据对应0,第2个数据对应1,第3个数据对应2,依次类推,第256个数据对应255,如表1所示,给出了一个简单的SVM分类器的数据与灰度图经过预处理后的图像像素值之间的映射关系,列表中左列数据是SVM分类器的数据,列表中右列数据是灰度图经过预处理后的图像像素值。为了简化,此处假设SVM分类器中的数据从第9个数据至第256个数据都为0,也就是说,0对应像素值8~255。需要说明的是,0~255中的每个像素值对应的SVM分类器的数据一般都不一样,也可能存在两个或三个是一样的。
表1
使用训练出的所述小块目标窗口的SVM分类器对所述灰度图经过预处理后的图像像素值进行映射,映射关系如图3所示,其中图3(a)给出了一个很小图像的灰度图预处理后的图像数据示意图,图3(b)是与之对应的映射后生成的数据特征矩阵。
S24、判断训练次数是否达到预定值,比如训练3或4次,若训练次数达到预定值,执行S26,否则执行S25。
S25、使用训练出的所述小块目标窗口的SVM分类器检测负样本原始图片集,将识别为正样本的目标区域截取出来投入到所述第一训练集以更新所述第一训练集。负样本原始图片中本来是没有正样本的,如果检测出正样本,那么就是误检,将误检为正样本的图片数据进行保存,重新投入到所述第一训练集中,这样可以提高训练出的小块目标窗口的SVM分类器的正检率。
所述负样本原始图片集中的负样本原始图片先全部转化为灰度图,所述灰度图的像素取值范围是0~255,再对所述灰度图进行预处理,主要包括sobel算法处理和lbp算法处理,如前所述,所述灰度图预处理后的图像数据其实是一个由不同像素构成的矩阵。如图4所示,整个检测过程可以按以下步骤执行:
S251、使用第一检测窗口从负样本原始图片中选择目标区域,所述第一检测窗口与所述第一训练集中的正样本或负样本一样大小;
S252、使用训练出的所述小块目标窗口的SVM分类器对所述目标区域的图像数据进行映射,生成所述目标区域的数据特征矩阵;
S253、根据所述目标区域的数据特征矩阵,判断所述目标区域是正样本或负样本;例如,将所述目标区域的数据特征矩阵中的全部数据进行求和,如果大于0,判断所述目标区域为正样本,否则判断所述目标区域为负样本。
S254、判断所述目标区域是正样本时,截取所述目标区域,投入到所述第一训练集;
S255、使用所述第一检测窗口遍历负样本原始图片的不同目标区域,重复执行步骤S252~S254;
S256、将所述负样本原始图片缩小预定的比例值,例如缩小到原来的0.9倍;
S257、判断缩小后的负样本原始图片是否大于所述第一检测窗口,如果缩小后的负样本原始图片大于所述第一检测窗口,返回步骤S251,对所述缩小后的负样本原始图片再次检测,否则执行步骤S258;
S258、检测下一张负样本原始图片。
按上述步骤使用训练出的所述小块目标窗口的SVM分类器检测所有负样本原始图片,检测完成后,返回步骤S22。
S26、遍历不同大小和不同位置的所有小块目标窗口,按步骤S21~S25训练所述所有小块目标窗口的SVM分类器。
S27、使用训练出的所述所有小块目标窗口的SVM分类器检测测试库中的测试图片,得到所述所有小块目标窗口的SVM分类器的正检率。设定所述测试库中测试图片与正样本或负样本大小一样,将所述测试库中的测试图片全部转化为灰度图,所述灰度图的像素取值范围是0~255,再对所述灰度图进行预处理,主要包括sobel算法处理和lbp算法处理,使用已经训练出的一个小块目标窗口的SVM分类器对所述灰度图预处理后的图像数据进行映射,映射后生成测试图片的数据特征矩阵,将所述数据特征矩阵中的全部数据进行求和,如果大于0,则判断该测试图片为正样本,否则判断该测试图片为负样本,按照上述方法对测试库中的所有测试图片依次检测,最后统计该小块目标窗口的SVM分类器的正检率;分别使用不同小块目标窗口的SVM分类器对测试库中的所有测试图片进行检测,统计所有小块目标窗口的SVM分类器的正检率。
S28、按照正检率从高到低对所述所有小块目标窗口的SVM分类器进行排序,将窗口重合面积超过各自预定比例的任意两个窗口的SVM分类器进行合并,保留其中正检率大的SVM分类器,其中预定比例可以取60%。
S29、按照正检率从高到低对合并后的所有的SVM分类器进行排序,选择排在前面的预定个数的SVM分类器,例如取前20个SVM分类器,这20个SVM分类器就是后面Adaboost分类器训练时需要用到的SVM分类器。
接下来,使用训练出的SVM分类器提取第二训练集的样本特征。需要说明的是,第二训练集中的正样本集可以和第一训练集中的正样本集相同,第二训练集中的负样本集可以直接使用上述负样本原始图片集,使用随机程序对负样本原始图片集中的图片顺序进行打乱,省略截取的过程。
可选地,所述使用训练出的SVM分类器提取第二训练集的样本特征,包括:
使用所述训练出的SVM分类器对所述第二训练集中的正样本的图像数据进行映射,生成正样本的数据特征矩阵;
使用所述训练出的SVM分类器对所述第二训练集中的负样本的图像数据进行映射,生成负样本的数据特征矩阵。
这里假设正样本有500个,负样本有499个,使用训练出的20个SVM分类器分别对正样本和负样本的图像数据进行映射,将生成20*500+20*499=19980个数据特征矩阵。将这19980个数据特征矩阵投入到Adaboost训练器,训练出Adaboost分类器。
本发明实施例提供的Adaboost分类器训练方法,通过第一训练集训练所述Adaboost分类器训练时需要用到的SVM分类器;使用训练出的SVM分类器提取第二训练集的样本特征;根据提取出的第二训练集的样本特征训练Adaboost分类器。与现有技术相比,本发明实施例通过预先训练好的SVM分类器映射获得训练样本的样本特征,避免了大量计算,能够缩短Adaboost分类器的训练时间,同时结合了SVM分类器训练精度高的优点,解决了Adaboost分类器在小样本情况下训练效果不好的问题。进一步地,本发明实施例训练出的Adaboost分类器进行目标检测时,检测速度更快,同时正检率提高,误检率下降,提高了检测效果。
本发明实施例还提供一种Adaboost分类器训练系统,如图5所示,所述系统包括:
SVM分类器训练模块51,用于通过第一训练集训练所述Adaboost分类器训练时需要用到的SVM分类器;
第二训练集特征提取模块52,用于使用所述SVM分类器训练模块51训练出的SVM分类器提取第二训练集的样本特征;
Adaboost分类器训练模块53,用于根据所述第二训练集特征提取模块52提取出的第二训练集的样本特征训练Adaboost分类器。
进一步地,如图6所示,所述SVM分类器训练模块51包括:
小块目标窗口选择单元511,用于从第一目标窗口中选择不同的小块目标窗口,所述第一目标窗口与所述第一训练集中的正样本或负样本一样大小;
第一训练集特征提取单元512,用于从所述第一训练集提取所述小块目标窗口选择单元511选择的小块目标窗口对应的样本特征;
SVM分类器训练单元513,用于根据所述第一训练集特征提取单元512提取的小块目标窗口对应的样本特征训练所述小块目标窗口的SVM分类器;
负样本原始图片集检测单元514,用于使用所述SVM分类器训练单元513训练出的小块目标窗口的SVM分类器检测负样本原始图片集,将识别为正样本的目标区域截取出来投入到所述第一训练集以更新所述第一训练集;
测试库检测单元515,用于使用所述SVM分类器训练单元513训练出的所有小块目标窗口的SVM分类器检测测试库中的测试图片,得到所述所有小块目标窗口的SVM分类器的正检率;
第一排序单元516,用于根据所述测试库检测单元515得到的所有小块目标窗口的SVM分类器的正检率从高到低对所述所有小块目标窗口的SVM分类器进行排序;
合并单元517,用于将所述第一排序单元516排序之后的所有小块目标窗口的SVM分类器中窗口重合面积超过各自预定比例的任意两个窗口的SVM分类器进行合并,保留其中正检率大的SVM分类器,其中预定比例可以取60%;
第二排序单元518,用于按照正检率从高到低对所述合并单元517合并后的所有的SVM分类器进行排序;
SVM分类器选择单元519,用于选择所述第二排序单元518排序之后排在前面的预定个数的SVM分类器。
进一步地,如图7所示,所述第一训练集特征提取单元512,包括:
第一正样本特征提取子单元5121,用于计算所述第一训练集中所有正样本与所述小块目标窗口相同位置的图像数据的正样本直方图数据;
第一负样本特征提取子单元5122,用于计算所述第一训练集中所有负样本与所述小块目标窗口相同位置的图像数据的负样本直方图数据。
进一步地,如图8所示,所述负样本原始图片集检测单元514,包括:
目标区域选择子单元5141,用于使用第一检测窗口从负样本原始图片中选择目标区域,所述第一检测窗口与所述第一训练集中的正样本或负样本一样大小;
映射子单元5142,用于使用所述SVM分类器训练单元513训练出的所述小块目标窗口的SVM分类器对所述目标区域选择子单元5141选择的目标区域的图像数据进行映射,生成所述目标区域的数据特征矩阵;
第一判断子单元5143,用于根据所述映射子单元5142生成的目标区域的数据特征矩阵,判断所述目标区域是正样本或负样本;
截取子单元5144,用于当所述第一判断子单元5143判断所述目标区域是正样本时,截取所述目标区域,投入到所述第一训练集;
缩放子单元5145,用于将所述负样本原始图片缩小预定的比例值;
第二判断子单元5146,用于判断所述缩放子单元5145缩小后的负样本原始图片是否大于所述第一检测窗口。
进一步地,如图9所示,所述第二训练集特征提取模块52,包括:
第二正样本特征提取单元521,用于使用所述SVM分类器训练模块训练出的SVM分类器对所述第二训练集中的正样本的图像数据进行映射,生成正样本的数据特征矩阵;
第二负样本特征提取单元522,用于使用所述SVM分类器训练模块训练出的SVM分类器对所述第二训练集中的负样本的图像数据进行映射,生成负样本的数据特征矩阵。
本发明实施例提供的Adaboost分类器训练系统,通过第一训练集训练所述Adaboost分类器训练时需要用到的SVM分类器;使用训练出的SVM分类器提取第二训练集的样本特征;根据提取出的第二训练集的样本特征训练Adaboost分类器。与现有技术相比,本发明实施例通过预先训练好的SVM分类器映射获得训练样本的样本特征,避免了大量计算,能够缩短Adaboost分类器的训练时间,同时结合了SVM分类器训练精度高的优点,解决了Adaboost分类器在小样本情况下训练效果不好的问题。进一步地,本发明实施例训练出的Adaboost分类器进行目标检测时,检测速度更快,同时正检率提高,误检率下降,提高了检测效果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (12)

1.一种Adaboost分类器训练方法,其特征在于,所述方法包括:
通过第一训练集训练所述Adaboost分类器训练时需要用到的SVM分类器;
使用训练出的SVM分类器提取第二训练集的样本特征;
根据提取出的第二训练集的样本特征训练Adaboost分类器。
2.根据权利要求1所述的方法,其特征在于,所述通过第一训练集训练所述Adaboost分类器训练时需要用到的SVM分类器,包括:
2-1)选择第一目标窗口的一部分区域,作为小块目标窗口,所述第一目标窗口与所述第一训练集中的正样本或负样本一样大小;
2-2)从所述第一训练集提取所述小块目标窗口对应的样本特征;
2-3)根据所述小块目标窗口对应的样本特征训练所述小块目标窗口的SVM分类器;
2-4)使用训练出的所述小块目标窗口的SVM分类器检测负样本原始图片集,将识别为正样本的目标区域截取出来投入到所述第一训练集以更新所述第一训练集;
2-5)返回步骤2-2),重复执行预定的训练次数,训练出所述小块目标窗口的SVM分类器;
2-6)遍历不同大小和不同位置的所有小块目标窗口,按步骤2-1)~2-5)训练所述所有小块目标窗口的SVM分类器;
2-7)使用训练出的所述所有小块目标窗口的SVM分类器检测测试库中的测试图片,得到所述所有小块目标窗口的SVM分类器的正检率;
2-8)按照正检率从高到低对所述所有小块目标窗口的SVM分类器进行排序,将窗口重合面积超过各自预定比例的任意两个窗口的SVM分类器进行合并,保留其中正检率大的SVM分类器;
2-9)按照正检率从高到低对合并后的所有的SVM分类器进行排序,选择排在前面的预定个数的SVM分类器。
3.根据权利要求2所述的方法,其特征在于,所述从所述第一训练集提取所述小块目标窗口对应的样本特征,包括:
计算所述第一训练集中所有正样本与所述小块目标窗口相同位置的图像数据的正样本直方图数据;
计算所述第一训练集中所有负样本与所述小块目标窗口相同位置的图像数据的负样本直方图数据。
4.根据权利要求2所述的方法,其特征在于,所述使用训练出的所述小块目标窗口的SVM分类器检测负样本原始图片集,将识别为正样本的目标区域截取出来投入到所述第一训练集以更新所述第一训练集,包括:
4-1)使用第一检测窗口从负样本原始图片中选择目标区域,所述第一检测窗口与所述第一训练集中的正样本或负样本一样大小;
4-2)使用训练出的所述小块目标窗口的SVM分类器对所述目标区域的图像数据进行映射,生成所述目标区域的数据特征矩阵;
4-3)根据所述目标区域的数据特征矩阵,判断所述目标区域是正样本或负样本;
4-4)如果判断所述目标区域是正样本,截取所述目标区域,投入到所述第一训练集;
4-5)使用所述第一检测窗口遍历负样本原始图片的不同目标区域,重复执行步骤4-2)~4-4);
4-6)将所述负样本原始图片缩小预定的比例值;
4-7)判断缩小后的负样本原始图片是否大于所述第一检测窗口,如果缩小后的负样本原始图片大于所述第一检测窗口,返回步骤4-1),否则检测下一张负样本原始图片;
4-8)按步骤4-1)~4-7)检测所有负样本原始图片。
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标区域的数据特征矩阵,判断所述目标区域是正样本或负样本,包括:
将所述目标区域的数据特征矩阵中的全部数据进行求和,如果大于预定阈值,判断所述目标区域为正样本,否则判断所述目标区域为负样本。
6.根据权利要求1所述的方法,其特征在于,所述使用训练出的SVM分类器提取第二训练集的样本特征,包括:
使用所述训练出的SVM分类器对所述第二训练集中的正样本的图像数据进行映射,生成正样本的数据特征矩阵;
使用所述训练出的SVM分类器对所述第二训练集中的负样本的图像数据进行映射,生成负样本的数据特征矩阵。
7.一种Adaboost分类器训练系统,其特征在于,所述系统包括:
SVM分类器训练模块,用于通过第一训练集训练所述Adaboost分类器训练时需要用到的SVM分类器;
第二训练集特征提取模块,用于使用所述SVM分类器训练模块训练出的SVM分类器提取第二训练集的样本特征;
Adaboost分类器训练模块,用于根据所述第二训练集特征提取模块提取出的第二训练集的样本特征训练Adaboost分类器。
8.根据权利要求7所述的系统,其特征在于,所述SVM分类器训练模块包括:
小块目标窗口选择单元,用于从第一目标窗口中选择不同的小块目标窗口,所述第一目标窗口与所述第一训练集中的正样本或负样本一样大小;
第一训练集特征提取单元,用于从所述第一训练集提取所述小块目标窗口选择单元选择的小块目标窗口对应的样本特征;
SVM分类器训练单元,用于根据所述第一训练集特征提取单元提取的小块目标窗口对应的样本特征训练所述小块目标窗口的SVM分类器;
负样本原始图片集检测单元,用于使用所述SVM分类器训练单元训练出的小块目标窗口的SVM分类器检测负样本原始图片集,将识别为正样本的目标区域截取出来投入到所述第一训练集以更新所述第一训练集;
测试库检测单元,用于使用所述SVM分类器训练单元训练出的所有小块目标窗口的SVM分类器检测测试库中的测试图片,得到所述所有小块目标窗口的SVM分类器的正检率;
第一排序单元,用于根据所述测试库检测单元得到的所有小块目标窗口的SVM分类器的正检率从高到低对所述所有小块目标窗口的SVM分类器进行排序;
合并单元,用于将所述第一排序单元排序之后的所有小块目标窗口的SVM分类器中窗口重合面积超过各自预定比例的任意两个窗口的SVM分类器进行合并,保留其中正检率大的SVM分类器;
第二排序单元,用于按照正检率从高到低对所述合并单元合并后的所有的SVM分类器进行排序;
SVM分类器选择单元,用于选择所述第二排序单元排序之后排在前面的预定个数的SVM分类器。
9.根据权利要求8所述的系统,其特征在于,所述第一训练集特征提取单元,包括:
第一正样本特征提取子单元,用于计算所述第一训练集中所有正样本与所述小块目标窗口相同位置的图像数据的正样本直方图数据;
第一负样本特征提取子单元,用于计算所述第一训练集中所有负样本与所述小块目标窗口相同位置的图像数据的负样本直方图数据。
10.根据权利要求8所述的系统,其特征在于,所述负样本原始图片集检测单元,包括:
目标区域选择子单元,用于使用第一检测窗口从负样本原始图片中选择目标区域,所述第一检测窗口与所述第一训练集中的正样本或负样本一样大小;
映射子单元,用于使用所述SVM分类器训练单元训练出的所述小块目标窗口的SVM分类器对所述目标区域选择子单元选择的目标区域的图像数据进行映射,生成所述目标区域的数据特征矩阵;
第一判断子单元,用于根据所述映射子单元生成的目标区域的数据特征矩阵,判断所述目标区域是正样本或负样本;
截取子单元,用于当所述第一判断子单元判断所述目标区域是正样本时,截取所述目标区域,投入到所述第一训练集;
缩放子单元,用于将所述负样本原始图片缩小预定的比例值;
第二判断子单元,用于判断所述缩放子单元缩小后的负样本原始图片是否大于所述第一检测窗口。
11.根据权利要求10所述的系统,其特征在于,所述第一判断子单元,用于将所述目标区域的数据特征矩阵中的全部数据进行求和,如果大于预定阈值,判断所述目标区域为正样本,否则判断所述目标区域为负样本。
12.根据权利要求7所述的系统,其特征在于,所述第二训练集特征提取模块,包括:
第二正样本特征提取单元,用于使用所述SVM分类器训练模块训练出的SVM分类器对所述第二训练集中的正样本的图像数据进行映射,生成正样本的数据特征矩阵;
第二负样本特征提取单元,用于使用所述SVM分类器训练模块训练出的SVM分类器对所述第二训练集中的负样本的图像数据进行映射,生成负样本的数据特征矩阵。
CN201610866106.9A 2016-09-29 2016-09-29 Adaboost分类器训练方法及系统 Active CN107886102B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610866106.9A CN107886102B (zh) 2016-09-29 2016-09-29 Adaboost分类器训练方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610866106.9A CN107886102B (zh) 2016-09-29 2016-09-29 Adaboost分类器训练方法及系统

Publications (2)

Publication Number Publication Date
CN107886102A true CN107886102A (zh) 2018-04-06
CN107886102B CN107886102B (zh) 2020-04-07

Family

ID=61769353

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610866106.9A Active CN107886102B (zh) 2016-09-29 2016-09-29 Adaboost分类器训练方法及系统

Country Status (1)

Country Link
CN (1) CN107886102B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950588A (zh) * 2020-07-03 2020-11-17 国网冀北电力有限公司 一种基于改进Adaboost算法的分布式电源孤岛检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101645135A (zh) * 2009-07-13 2010-02-10 北京中星微电子有限公司 一种人体检测方法和系统
CN103417219A (zh) * 2013-09-11 2013-12-04 重庆大学 穿戴式人体跌倒检测装置
CN103605962A (zh) * 2013-11-19 2014-02-26 四川长虹电器股份有限公司 基于类内类间距离的人脸验证方法
CN104240720A (zh) * 2013-06-24 2014-12-24 北京大学深圳研究生院 一种基于多重分形和信息融合的语音情感识别方法
CN105528607A (zh) * 2015-10-30 2016-04-27 小米科技有限责任公司 区域提取方法、模型训练方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101645135A (zh) * 2009-07-13 2010-02-10 北京中星微电子有限公司 一种人体检测方法和系统
CN104240720A (zh) * 2013-06-24 2014-12-24 北京大学深圳研究生院 一种基于多重分形和信息融合的语音情感识别方法
CN103417219A (zh) * 2013-09-11 2013-12-04 重庆大学 穿戴式人体跌倒检测装置
CN103605962A (zh) * 2013-11-19 2014-02-26 四川长虹电器股份有限公司 基于类内类间距离的人脸验证方法
CN105528607A (zh) * 2015-10-30 2016-04-27 小米科技有限责任公司 区域提取方法、模型训练方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950588A (zh) * 2020-07-03 2020-11-17 国网冀北电力有限公司 一种基于改进Adaboost算法的分布式电源孤岛检测方法
CN111950588B (zh) * 2020-07-03 2023-10-17 国网冀北电力有限公司 一种基于改进Adaboost算法的分布式电源孤岛检测方法

Also Published As

Publication number Publication date
CN107886102B (zh) 2020-04-07

Similar Documents

Publication Publication Date Title
CN108334848B (zh) 一种基于生成对抗网络的微小人脸识别方法
CN107134144B (zh) 一种用于交通监控的车辆检测方法
CN109117836A (zh) 一种基于焦点损失函数的自然场景下文字检测定位方法和装置
CN105590099B (zh) 一种基于改进卷积神经网络的多人行为识别方法
CN109829467A (zh) 图像标注方法、电子装置及非暂态电脑可读取储存媒体
CN105512683A (zh) 基于卷积神经网络的目标定位方法及装置
US9070005B2 (en) Image processing apparatus, image processing method, non-transitory computer-readable medium, and image processing system for detection of target cells using image feature determination
CN108647625A (zh) 一种表情识别方法及装置
CN107808126A (zh) 车辆检索方法及装置
CN106530271B (zh) 一种红外图像显著性检测方法
CN110298297A (zh) 火焰识别方法和装置
CN109961037A (zh) 一种考场视频监控异常行为特征识别方法
CN103093212A (zh) 基于人脸检测和跟踪截取人脸图像的方法和装置
CN104615986A (zh) 利用多检测器对场景变化的视频图像进行行人检测的方法
CN106778687A (zh) 基于局部评估和全局优化的注视点检测方法
CN109858547A (zh) 一种基于bssd的目标检测方法与装置
CN111274926B (zh) 图像数据筛选方法、装置、计算机设备和存储介质
CN106650670A (zh) 活体人脸视频的检测方法及装置
CN110008899B (zh) 一种可见光遥感图像候选目标提取与分类方法
CN109284673A (zh) 对象跟踪方法及装置、电子设备及存储介质
CN106250913B (zh) 一种基于局部典型相关分析的分类器集成车牌识别方法
CN110020669A (zh) 一种车牌分类方法、系统、终端设备及计算机程序
CN106469293A (zh) 快速检测目标的方法及系统
CN112488220B (zh) 一种基于深度学习的小目标检测方法
CN109948432A (zh) 一种行人检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant