CN108090512A - 一种基于Ransac算法的鲁棒AdaBoost分类器构建方法 - Google Patents

一种基于Ransac算法的鲁棒AdaBoost分类器构建方法 Download PDF

Info

Publication number
CN108090512A
CN108090512A CN201711353247.1A CN201711353247A CN108090512A CN 108090512 A CN108090512 A CN 108090512A CN 201711353247 A CN201711353247 A CN 201711353247A CN 108090512 A CN108090512 A CN 108090512A
Authority
CN
China
Prior art keywords
model
sample
sorter model
algorithms
adaboost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201711353247.1A
Other languages
English (en)
Inventor
罗宇
黄文超
吴家慧
李文琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan Tak Public Record Technology Co Ltd
Original Assignee
Foshan Tak Public Record Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan Tak Public Record Technology Co Ltd filed Critical Foshan Tak Public Record Technology Co Ltd
Priority to CN201711353247.1A priority Critical patent/CN108090512A/zh
Publication of CN108090512A publication Critical patent/CN108090512A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operation Control Of Excavators (AREA)

Abstract

本发明提出了一种基于Ransac算法的鲁棒AdaBoost分类器构建方法,包括以下步骤:根据Ransac算法,构建立样本子集;抽取样本;利用AdaBoost算法训练强分类器;计算分类模型对应分类精度;构建分类器模型Ci;判断满足该新构建分类器模型的全部训练样本;重复上述步骤,直到基于Ransac算法估计下的一个模型Ci和其对应的一致集;判断已建立的不同分类器模型数量是否已超过Nmax;确定为最终选取的分类器模型,计算对应分类精度。本发明构建方法由含有外点的样本建立了最佳的分类器模型,并且利用Ransac算法的迭代过程去除了外点对分类器模型构建的影响。

Description

一种基于Ransac算法的鲁棒AdaBoost分类器构建方法
技术领域
本发明涉及鲁棒分类器技术领域,具体涉及一种基于Ransac算法的鲁棒AdaBoost分类器构建方法。
背景技术
AdaBoost一词是来源于Adaptive Boosting(自适应增强)的缩写,是由YoavFreund和Robert Schapire提出的机器学习元算法,它的设计指导原则是确保当前训练样本有最高分类精度。通过将不同的弱分类器(这里所谓的弱分类器是指分类精度稍稍好于随机猜测)合理的组合起来,形成强分类器,尽管每个弱分类器的分类精度不高,但最终的强分类器在分类性能上会得到巨大提升。AdaBoost算法在某种意义上讲是自适应的,通过调整之前被弱分类器错分样本的权值,提高后续弱分类器对错分样本的重视程度,实现最终分类器模型的设计。正是基于此,合理的设计一组弱分类器,可以组合成强分类器,获得一个整体上令人满意的分类精度。但是,像任何事情都具有两面性一样,尽管AdaBoost算法优点众多,但其对外点敏感,在一些情况下更容易受此影响而导致分类器整体性能的降级、失效。这是因为不断对不能正确分类的样本进行加权,尤其是对外点的不断加权,使得外点的权值过快增长。过大的外点权值会引起分类器算法不断向外点偏离,进而背离大部分正常样本,不可避免的会造成所设计分类器模型的降级。
发明内容
针对现有技术的不足,本发明提出一种基于Ransac算法的鲁棒AdaBoost分类器构建方法,去除潜在外点。
本发明的技术方案是这样实现的:一种基于Ransac算法的鲁棒AdaBoost分类器构建方法,包括以下步骤:
(1)根据Ransac算法,设置每次初始构建分类器的样本子集为R,样本个数为n;
(2)从训练样本集中随机抽取n个样本,作为样本子集R;
(3)基于这些样本,利用AdaBoost算法训练强分类器,使得分类器模型最符合当前样本;
(4)基于AdaBoost算法用新构建的分类器模型Ci分类剩余的样本,并计算分类模型对应分类精度;
(5)用所有这些正确的样本重新基AdaBoost算法构建分类器模型Ci;
(6)用这个新构建的分类器模型再次判断满足该新构建分类器模型的全部训练样本,即样本子集为R的一致集,并更新当前迭代次数j=j+1;
(7)重复上述步骤4到步骤6直到满足分类器模型Ci的样本数量m不再增加或迭代次数已经超过了Tmax,则这m个样本构成内点集,重新训练分类器模型,至此可以获得基于Ransac算法估计下的一个模型Ci和其对应的一致集;
(8)更新i=i+1,判断已建立的不同分类器模型数量是否已超过Nmax,如未超过转回步骤(2);
(9)比较全部分类器模型对应的正确分类样本数,基于Ransac算法寻找最大一致集,即具有最多分类正确样本数的分类器模型,并将其确定为最终选取的分类器模型,计算对应分类精度。与现有技术相比,本发明具有以下优点:本发明借助于Ransac算法强的去外点能力,运用AdaBoost算法训练分类器模型,有效的弥补了AdaBoost算法的不足,使得原有AdaBoost算法更加鲁棒与准确。并且外点对AdaBoost算法的影响也被彻底清除,经过Ransac算法的迭代过程,训练所得分类器模型精度更高。通过以上的步骤有效的防止了由外点引起的分类器模型降级。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于Ransac算法的鲁棒AdaBoost分类器构建方法,包括以下步骤:
(1)根据Ransac算法,设置每次初始构建分类器的样本子集为R,样本个数为n;
(2)从训练样本集中随机抽取n个样本,作为样本子集R;
(3)基于这些样本,利用AdaBoost算法训练强分类器,使得分类器模型最符合当前样本;
(4)基于AdaBoost算法用新构建的分类器模型Ci分类剩余的样本,并计算分类模型对应分类精度;
(5)用所有这些正确的样本重新基AdaBoost算法构建分类器模型Ci;
(6)用这个新构建的分类器模型再次判断满足该新构建分类器模型的全部训练样本,即样本子集为R的一致集,并更新当前迭代次数j=j+1;
(7)重复上述步骤4到步骤6直到满足分类器模型Ci的样本数量m不再增加或迭代次数已经超过了Tmax,则这m个样本构成内点集,重新训练分类器模型,至此可以获得基于Ransac算法估计下的一个模型Ci和其对应的一致集;
(8)更新i=i+1,判断已建立的不同分类器模型数量是否已超过Nmax,如未超过转回步骤(2);
(9)比较全部分类器模型对应的正确分类样本数,基于Ransac算法寻找最大一致集,即具有最多分类正确样本数的分类器模型,并将其确定为最终选取的分类器模型,计算对应分类精度。本发明不同于其他AdaBoost算法在分类器构建中单纯使用样本加权或权值控制的手段,该算法将Ransac算法引入AdaBoost分类器模型构建过程中,去除潜在外点,克服现有Ada Boost算法缺陷。同时,借助Ransac算法,从全部AdaBoost分类器中选择最佳分类器模型,消除由外点引起的分类器降级
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种基于Ransac算法的鲁棒AdaBoost分类器构建方法,其特征在于,包括以下步骤:
(1)根据Ransac算法,设置每次初始构建分类器的样本子集为R,样本个数为n;
(2)从训练样本集中随机抽取n个样本,作为样本子集R;
(3)基于这些样本,利用AdaBoost算法训练强分类器,使得分类器模型最符合当前样本;
(4)基于AdaBoost算法用新构建的分类器模型Ci分类剩余的样本,并计算分类模型对应分类精度;
(5)用所有这些正确的样本重新基AdaBoost算法构建分类器模型Ci;
(6)用这个新构建的分类器模型再次判断满足该新构建分类器模型的全部训练样本,即样本子集为R的一致集,并更新当前迭代次数j=j+1;
(7)重复上述步骤4到步骤6直到满足分类器模型Ci的样本数量m不再增加或迭代次数已经超过了Tmax,则这m个样本构成内点集,重新训练分类器模型,至此可以获得基于Ransac算法估计下的一个模型Ci和其对应的一致集;
(8)更新i=i+1,判断已建立的不同分类器模型数量是否已超过Nmax,如未超过转回步骤(2);
(9)比较全部分类器模型对应的正确分类样本数,基于Ransac算法寻找最大一致集,即具有最多分类正确样本数的分类器模型,并将其确定为最终选取的分类器模型,计算对应分类精度。
CN201711353247.1A 2017-12-15 2017-12-15 一种基于Ransac算法的鲁棒AdaBoost分类器构建方法 Withdrawn CN108090512A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711353247.1A CN108090512A (zh) 2017-12-15 2017-12-15 一种基于Ransac算法的鲁棒AdaBoost分类器构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711353247.1A CN108090512A (zh) 2017-12-15 2017-12-15 一种基于Ransac算法的鲁棒AdaBoost分类器构建方法

Publications (1)

Publication Number Publication Date
CN108090512A true CN108090512A (zh) 2018-05-29

Family

ID=62176029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711353247.1A Withdrawn CN108090512A (zh) 2017-12-15 2017-12-15 一种基于Ransac算法的鲁棒AdaBoost分类器构建方法

Country Status (1)

Country Link
CN (1) CN108090512A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034188A (zh) * 2018-06-15 2018-12-18 北京金山云网络技术有限公司 机器学习模型的获取方法、获取装置、设备及存储介质
CN112233091A (zh) * 2020-10-15 2021-01-15 青岛理工大学 一种风力机叶片图像损伤检测和定位方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
曹万鹏 等: "抗外点干扰的鲁棒AdaBoost分类器构建方法", 《计算机工程与应用》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034188A (zh) * 2018-06-15 2018-12-18 北京金山云网络技术有限公司 机器学习模型的获取方法、获取装置、设备及存储介质
CN112233091A (zh) * 2020-10-15 2021-01-15 青岛理工大学 一种风力机叶片图像损伤检测和定位方法

Similar Documents

Publication Publication Date Title
CN109948658B (zh) 面向特征图注意力机制的对抗攻击防御方法及应用
CN107506799B (zh) 一种基于深度神经网络的开集类别发掘与扩展方法与装置
CN113688723B (zh) 一种基于改进YOLOv5的红外图像行人目标检测方法
CN105205448A (zh) 基于深度学习的文字识别模型训练方法和识别方法
CN105488528A (zh) 基于改进自适应遗传算法的神经网络图像分类方法
CN110334742A (zh) 一种基于强化学习的通过添加虚假节点的图对抗样本生成方法
CN105913450A (zh) 基于神经网络图像处理的轮胎橡胶炭黑分散度评价方法及系统
CN108090512A (zh) 一种基于Ransac算法的鲁棒AdaBoost分类器构建方法
CN111583311B (zh) 一种pcba快速图像匹配方法
CN110288007A (zh) 数据标注的方法、装置及电子设备
KR102252155B1 (ko) 자율주행 자동차의 레벨 4를 충족시키기 위해 필요한 hd 지도와의 콜라보레이션을 지원하는 임베딩 로스 및 소프트맥스 로스를 이용하여 적어도 하나의 차선을 가지는 이미지를 세그멘테이션하는 학습 방법 및 학습 장치, 그리고 이를 이용한 테스트 방법 및 테스트 장치
CN114399644A (zh) 一种基于小样本目标检测方法及装置
CN110322003A (zh) 一种基于梯度的通过添加虚假节点的图对抗样本生成方法
CN111985560B (zh) 知识追踪模型的优化方法、系统及计算机存储介质
Tang et al. Afo-tad: Anchor-free one-stage detector for temporal action detection
Hollósi et al. Improve the accuracy of neural networks using capsule layers
CN113343924B (zh) 一种基于循环谱特征和生成对抗网络的调制信号识别方法
CN115935257A (zh) 分类识别方法、计算机设备和存储介质
CN106529579A (zh) 一种改善的基于Ransac算法的鲁棒AdaBoost分类器构建方法
CN113657506A (zh) 一种对抗样本生成方法、装置、设备及介质
CN109840926B (zh) 一种图像生成方法、装置及设备
CN114550283A (zh) 基于改进支持向量机的无线网信号动作识别系统及方法
CN108460405A (zh) 一种基于深度强化学习的图像隐写分析集成分类优化方法
CN114091665A (zh) 一种训练深度神经网络的方法及这种网络
CN113808026A (zh) 图像处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20180529