CN108090512A

CN108090512A - 一种基于Ransac算法的鲁棒AdaBoost分类器构建方法

Info

Publication number: CN108090512A
Application number: CN201711353247.1A
Authority: CN
Inventors: 罗宇; 黄文超; 吴家慧; 李文琪
Original assignee: Foshan Tak Public Record Technology Co Ltd
Current assignee: Foshan Tak Public Record Technology Co Ltd
Priority date: 2017-12-15
Filing date: 2017-12-15
Publication date: 2018-05-29

Abstract

本发明提出了一种基于Ransac算法的鲁棒AdaBoost分类器构建方法，包括以下步骤：根据Ransac算法，构建立样本子集；抽取样本；利用AdaBoost算法训练强分类器；计算分类模型对应分类精度；构建分类器模型Ci；判断满足该新构建分类器模型的全部训练样本；重复上述步骤，直到基于Ransac算法估计下的一个模型Ci和其对应的一致集；判断已建立的不同分类器模型数量是否已超过Nmax；确定为最终选取的分类器模型，计算对应分类精度。本发明构建方法由含有外点的样本建立了最佳的分类器模型，并且利用Ransac算法的迭代过程去除了外点对分类器模型构建的影响。

Description

一种基于Ransac算法的鲁棒AdaBoost分类器构建方法

技术领域

本发明涉及鲁棒分类器技术领域，具体涉及一种基于Ransac算法的鲁棒AdaBoost分类器构建方法。

背景技术

AdaBoost一词是来源于Adaptive Boosting(自适应增强)的缩写，是由YoavFreund和Robert Schapire提出的机器学习元算法，它的设计指导原则是确保当前训练样本有最高分类精度。通过将不同的弱分类器(这里所谓的弱分类器是指分类精度稍稍好于随机猜测)合理的组合起来，形成强分类器，尽管每个弱分类器的分类精度不高，但最终的强分类器在分类性能上会得到巨大提升。AdaBoost算法在某种意义上讲是自适应的，通过调整之前被弱分类器错分样本的权值，提高后续弱分类器对错分样本的重视程度，实现最终分类器模型的设计。正是基于此，合理的设计一组弱分类器，可以组合成强分类器，获得一个整体上令人满意的分类精度。但是，像任何事情都具有两面性一样，尽管AdaBoost算法优点众多，但其对外点敏感，在一些情况下更容易受此影响而导致分类器整体性能的降级、失效。这是因为不断对不能正确分类的样本进行加权，尤其是对外点的不断加权，使得外点的权值过快增长。过大的外点权值会引起分类器算法不断向外点偏离，进而背离大部分正常样本，不可避免的会造成所设计分类器模型的降级。

发明内容

针对现有技术的不足，本发明提出一种基于Ransac算法的鲁棒AdaBoost分类器构建方法，去除潜在外点。

本发明的技术方案是这样实现的：一种基于Ransac算法的鲁棒AdaBoost分类器构建方法，包括以下步骤：

(1)根据Ransac算法，设置每次初始构建分类器的样本子集为R，样本个数为n；

(2)从训练样本集中随机抽取n个样本，作为样本子集R；

(3)基于这些样本，利用AdaBoost算法训练强分类器，使得分类器模型最符合当前样本；

(4)基于AdaBoost算法用新构建的分类器模型Ci分类剩余的样本，并计算分类模型对应分类精度；

(5)用所有这些正确的样本重新基AdaBoost算法构建分类器模型Ci；

(6)用这个新构建的分类器模型再次判断满足该新构建分类器模型的全部训练样本，即样本子集为R的一致集，并更新当前迭代次数j＝j+1；

(7)重复上述步骤4到步骤6直到满足分类器模型Ci的样本数量m不再增加或迭代次数已经超过了Tmax，则这m个样本构成内点集，重新训练分类器模型，至此可以获得基于Ransac算法估计下的一个模型Ci和其对应的一致集；

(8)更新i＝i+1，判断已建立的不同分类器模型数量是否已超过Nmax，如未超过转回步骤(2)；

(9)比较全部分类器模型对应的正确分类样本数，基于Ransac算法寻找最大一致集，即具有最多分类正确样本数的分类器模型，并将其确定为最终选取的分类器模型，计算对应分类精度。与现有技术相比，本发明具有以下优点：本发明借助于Ransac算法强的去外点能力，运用AdaBoost算法训练分类器模型，有效的弥补了AdaBoost算法的不足，使得原有AdaBoost算法更加鲁棒与准确。并且外点对AdaBoost算法的影响也被彻底清除，经过Ransac算法的迭代过程，训练所得分类器模型精度更高。通过以上的步骤有效的防止了由外点引起的分类器模型降级。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

一种基于Ransac算法的鲁棒AdaBoost分类器构建方法，包括以下步骤：

(2)从训练样本集中随机抽取n个样本，作为样本子集R；

(9)比较全部分类器模型对应的正确分类样本数，基于Ransac算法寻找最大一致集，即具有最多分类正确样本数的分类器模型，并将其确定为最终选取的分类器模型，计算对应分类精度。本发明不同于其他AdaBoost算法在分类器构建中单纯使用样本加权或权值控制的手段，该算法将Ransac算法引入AdaBoost分类器模型构建过程中，去除潜在外点，克服现有Ada Boost算法缺陷。同时，借助Ransac算法，从全部AdaBoost分类器中选择最佳分类器模型，消除由外点引起的分类器降级

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于Ransac算法的鲁棒AdaBoost分类器构建方法，其特征在于，包括以下步骤：

(2)从训练样本集中随机抽取n个样本，作为样本子集R；

(9)比较全部分类器模型对应的正确分类样本数，基于Ransac算法寻找最大一致集，即具有最多分类正确样本数的分类器模型，并将其确定为最终选取的分类器模型，计算对应分类精度。