CN106778455A - 一种树状结构级联分类器 - Google Patents

一种树状结构级联分类器 Download PDF

Info

Publication number
CN106778455A
CN106778455A CN201510851975.XA CN201510851975A CN106778455A CN 106778455 A CN106778455 A CN 106778455A CN 201510851975 A CN201510851975 A CN 201510851975A CN 106778455 A CN106778455 A CN 106778455A
Authority
CN
China
Prior art keywords
node
sample
cascade classifier
grader
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510851975.XA
Other languages
English (en)
Inventor
单志辉
刘宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Shichazhe Information Technology Co Ltd
Original Assignee
Nanjing Shichazhe Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Shichazhe Information Technology Co Ltd filed Critical Nanjing Shichazhe Information Technology Co Ltd
Priority to CN201510851975.XA priority Critical patent/CN106778455A/zh
Publication of CN106778455A publication Critical patent/CN106778455A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种树状结构级联分类器,区别于传统的线状结构级联分类器,该级联分类器将多个子分类器以树的结构组织起来。根据正样本的关键点位置信息,将正样本集拆分到树的各个节点,在每个节点训练出一个分类器。通过调整节点分类器的阈值,可以控制树状结构级联分类器的整体丢失率和假警率。实验表明,该树状结构级联分类器可以显著提高分类结果的准确率。

Description

一种树状结构级联分类器
技术领域
本发明涉及计算机视觉领域,特别是一种新的树状结构级联分类器。
背景技术
传统的级联分类器是线状的(如图1所示),它由一系列的分类器串联而成。前面级次的分类器相对来说使用的特征数较少,尽可能地滤除那些与目标差异较大的负样本,后面级次分类器则使用更多的特征,从而试图将那些与目标相似的负样本与目标物体区分开。但是,在实际的检测应用中,由于目标姿态变化和相机角度不同等因素,目标在视频画面中呈现出多种不同的外观,这种目标外观的多样性,使得单单依靠增加特征的个数难以显著提升分类器的区分能力。
针对这一问题,传统的解决方法是人工对样本进行拆分,例如将人脸分为正脸、左侧脸、右侧脸三个子集,然后在每个子集上分别训练分类器。这种传统解决方法的缺点是子类的划分太主观,若分得过细,在各个子类上训练出的分类器容易过拟合,从而直接降低整体分类性能,若分得过粗,则对分类结果的准确率提升不大。
发明内容
本发明的目的是提出一种树状结构级联分类器。
本发明要解决的技术问题是,提供一种新的分类器级联结构,当检测目标由于外观多样性而分类困难时,不需要人工主观将样本分成多个子类来分别训练分类器,而是根据样本关键点位置对样本集进行拆分,拆分结果形成树状结构。同时,在树的每个节点训练分类器,并通过设置阈值控制级联分类器的丢失率和假警率。实验结果表明,此方法可以显著提升分类结果的准确率。
附图说明
图1——传统的线状结构级联分类器示例图。
图2——本发明所构建的树状级联分类器示例图。
图3——本发明所使用的节点分裂流程图。
具体实施方式
下面进一步阐述本发明所述的树状结构级联分类器。
如图2所示为本发明所构建的树状级联分类器示例,根节点包括所有正样本,根据正样本关键点位置拆分样本集,将样本组织成树状结构,同时在各个样本子集上训练出各自的子分类器,如此形成了树状级联分类器。
本发明所述的树状级联分类器,主要包括三个阶段:
第一阶段,对正样本进行关键点标注;
具体地,所述关键点,是指被检测目标的重要局部。例如对于人脸,眉梢、眼角、鼻尖和嘴角等位置是关键点;对于行人,头、肩、手、脚、手肘、膝盖、胯部等位置是关键点。标注关键点的目的是为了对正样本集进行更细致的拆分。
第二阶段,训练分类器;
分类器的训练过程是个递归的过程,实际上也是一个树节点分裂的过程。初始条件下,树只有一个根节点,当前所在节点就是根节点,根节点中包含所有的正样本。节点的分裂过程包括以下步骤:
第一步,随机产生一组负样本,利用该节点的正样本和负样本训练出一个分类器(i表示节点编号);
第二步,若分类器可以将当前节点的正负样本完全分类开来,则该节点停止分裂,否则调整分类器的阈值,使得当前节点正样本的误分率小于某一阈值;
第三步,根据正样本的关键点位置对该节点的正样本进行K均值聚类(K=2),为节点生成两个子节点,并将聚类得到的两类正样本分别送给左右子节点;
第四步,重复以上步骤,分别训练左右子节点,直到所有节点停止分裂。
第三阶段,使用分类器进行预测。
分类器的预测过程是一个递归的过程,初始条件下,输入一张测试图片,当前节点是树的根节点,对测试图片的预测过程包括以下步骤:
第一步,使用当前节点的分类器对样本进行分类,若分类器输出为1,则返回1并退出,否则执行下一步;
第二步,判断当前节点有没有子节点,若没有,则返回1并退出,否则执行下一步;
第三步,将样本送至子节点进行预测,重复以上预测过程,若至少有一个子节点的预测结果是1,则返回预测结果1,否则返回0,退出。
本发明与现有技术相比具有以下优点:
1.本发明中子类的划分是以样本中关键点的位置为依据,按层次由粗到细的拆分,而拆分结束的时点由分类器决定,从而避免了人为主观性和人工划分子类过粗或过细的问题;
2.相比传统的线状结构级联分类器,本发明所述方法可以显著提升分类结果的准确率。

Claims (4)

1.一种树状结构级联分类器,其特征在于该级联分类器将多个子分类器以树状结构组织起来;初始条件下,根节点包括所有正样本,根据样本关键点位置拆分样本集,将样本集组织成树状结构,在各个样本子集上训练得到分类器形成树状级联分类器。
2.根据权利要求1所述的级联分类器,其特征在于其训练过程中使用的正样本为预先标注过的样本,其标注的关键点为被检测目标的主要局部。
3.根据权利要求1所述的级联分类器,其特征在于其训练过程中分裂一个节点包括以下步骤:
第一步,利用该节点的正样本和负样本训练出一个分类器(i表示节点编号);
第二步,若分类器可以将当前节点的正负样本完全分类开来,则该节点停止分裂,否则调整分类器的阈值,使得当前节点正样本的误分率小于一定阈值;
第三步,根据正样本的关键点位置对该节点的正样本进行K均值聚类(K=2),为节点生成两个子节点,并将聚类得到的两类正样本分别送给左右子节点;
第四步,重复以上步骤,分别训练左右子节点,直到所有节点分裂结束并退出。
4.根据权利要求1所述的级联分类器,其特征在于对测试图片预测结果的过程主要包括以下步骤:
第一步,使用当前节点的分类器对样本进行分类,若分类器输出为1,则返回1并退出,否则执行下一步;
第二步,判断当前节点有没有子节点,若没有,则返回1并退出,否则执行下一步;
第三步,将样本送至子节点进行预测,重复以上预测过程,若至少有一个子节点的预测结果是1,则返回预测结果1,否则返回0,退出。
CN201510851975.XA 2015-11-24 2015-11-24 一种树状结构级联分类器 Pending CN106778455A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510851975.XA CN106778455A (zh) 2015-11-24 2015-11-24 一种树状结构级联分类器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510851975.XA CN106778455A (zh) 2015-11-24 2015-11-24 一种树状结构级联分类器

Publications (1)

Publication Number Publication Date
CN106778455A true CN106778455A (zh) 2017-05-31

Family

ID=58965455

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510851975.XA Pending CN106778455A (zh) 2015-11-24 2015-11-24 一种树状结构级联分类器

Country Status (1)

Country Link
CN (1) CN106778455A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101290660A (zh) * 2008-06-02 2008-10-22 中国科学技术大学 一种用于行人检测的树状组合分类方法
CN105069477A (zh) * 2015-08-13 2015-11-18 天津津航技术物理研究所 AdaBoost级联分类器检测图像目标的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101290660A (zh) * 2008-06-02 2008-10-22 中国科学技术大学 一种用于行人检测的树状组合分类方法
CN105069477A (zh) * 2015-08-13 2015-11-18 天津津航技术物理研究所 AdaBoost级联分类器检测图像目标的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄金凤 等: ""基于检测树结构的快速人脸检测"", 《计算机与数字工程》 *

Similar Documents

Publication Publication Date Title
Xiong et al. A pursuit of temporal accuracy in general activity detection
Li et al. Deep joint discriminative learning for vehicle re-identification and retrieval
CN108764072B (zh) 一种基于多尺度融合的血细胞亚型图像分类方法
CN109431523B (zh) 基于非社会性声音刺激行为范式的孤独症初级筛查装置
Wu et al. End-to-end chromosome Karyotyping with data augmentation using GAN
CN108288015A (zh) 基于时间尺度不变性的视频中人体动作识别方法及系统
CN107735795A (zh) 用于社会关系识别的方法和系统
CN109815967A (zh) 基于特征融合的cnn舰船目标识别系统及方法
CN110879881B (zh) 基于特征组分层和半监督随机森林的鼠标轨迹识别方法
CN108921201A (zh) 基于特征组合与cnn的大坝缺陷识别与分类方法
CN108960342B (zh) 基于改进Soft-Max损失函数的图像相似度计算方法
CN110348345B (zh) 一种基于动作连贯性的弱监督时序动作定位方法
CN105469397B (zh) 一种基于系数矩阵分析的目标遮挡检测方法
CN109410204A (zh) 一种基于cam的皮质白内障图像处理及增强方法
CN107808375A (zh) 融合多种上下文深度学习模型的水稻病害图像检测方法
CN105138975B (zh) 一种基于深度信念网络的人体肤色区域分割方法
CN110176024A (zh) 在视频中对目标进行检测的方法、装置、设备和存储介质
CN105389598A (zh) 面向软件缺陷数据的特征选择及分类方法
CN105740866B (zh) 一种具有仿反馈调节机制的回转窑烧成状态识别方法
CN105023025B (zh) 一种开集痕迹图像分类方法及系统
CN103839076B (zh) 一种基于光照特征的网络敏感图像识别方法
CN110516615A (zh) 基于卷积神经网络的人车分流控制方法
Murugeswari et al. Automated sugarcane disease detection using faster RCNN with an android application
CN114332711A (zh) 面部动作识别及模型训练的方法、装置、设备和存储介质
CN110248113A (zh) 图像处理装置、方法及计算机可读取的记录媒介物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Everwise road in Qinhuai District of Nanjing City, Jiangsu province 210014 No. 6 Baixia high-tech park, building 4, building 209 B

Applicant after: Nanjing inspectors Image Recognition Technology Co., Ltd.

Address before: 603, room 129-3, A1 District, Guanghua Road, Qinhuai District, Jiangsu, Nanjing 210014, China

Applicant before: NANJING SHICHAZHE INFORMATION TECHNOLOGY CO., LTD.

CB02 Change of applicant information
CB02 Change of applicant information

Address after: Everwise road in Qinhuai District of Nanjing City, Jiangsu province 210014 No. 6 Baixia high-tech park, building 4, building 209 B

Applicant after: Nanjing inspectors Image Recognition Technology Co., Ltd.

Address before: 603, room 129-3, A1 District, Guanghua Road, Qinhuai District, Jiangsu, Nanjing 210014, China

Applicant before: NANJING SHICHAZHE INFORMATION TECHNOLOGY CO., LTD.

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170531