CN106557781B - 人脸识别的分类器获取方法和装置 - Google Patents

人脸识别的分类器获取方法和装置 Download PDF

Info

Publication number
CN106557781B
CN106557781B CN201611000464.8A CN201611000464A CN106557781B CN 106557781 B CN106557781 B CN 106557781B CN 201611000464 A CN201611000464 A CN 201611000464A CN 106557781 B CN106557781 B CN 106557781B
Authority
CN
China
Prior art keywords
weak classifier
sample image
classification
default
combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611000464.8A
Other languages
English (en)
Other versions
CN106557781A (zh
Inventor
毕微
陈祖家
袁晓
田阳
曹轩铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Aichi Star Polytron Technologies Inc
Original Assignee
Beijing Aichi Star Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Aichi Star Polytron Technologies Inc filed Critical Beijing Aichi Star Polytron Technologies Inc
Priority to CN201611000464.8A priority Critical patent/CN106557781B/zh
Publication of CN106557781A publication Critical patent/CN106557781A/zh
Application granted granted Critical
Publication of CN106557781B publication Critical patent/CN106557781B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供一种人脸识别的分类器获取方法和装置,该方法包括:获取多个训练样本图像以及多个预设弱分类器组合,多个训练样本图像中包括干净样本图像和污染样本图像;采用蚁群算法,根据每个预设弱分类器组合对应的信息素,使每个训练样本图像选取所使用的预设弱分类器组合;其中,每个预设弱分类器组合对应的信息素与该预设弱分类器组合的分类精度和分类抗干扰能力相关;从多个预设弱分类器中选出具有最优分类精度和分类抗干扰能力的,和/或多个训练样本图像收敛于的预设弱分类器组合。通过采用蚁群算法选取分类器,且每条路径对应的信息素由对应弱分类器组合的分类性能决定,从而保证选择出的弱分类器组合具有最优分类性能。

Description

人脸识别的分类器获取方法和装置
技术领域
本发明涉及人工智能技术领域,尤其涉及一种人脸识别的分类器获取方法和装置。
背景技术
分类算法就是基于分类器模型为待检测样本从可选的分类中选取最佳的类别假设,它属于人工智能中机器学习范畴,已经吸引了该领域相关研究者的极大关注。人们投入了大量的时间和精力研究诸如C4.5、支持向量机、贝叶斯算法、AdaBoost算法和K-最近邻分类算法等分类算法,并将它们应用于面部识别、笔迹验证、数据分析和医学应用等不同领域。
AdaBoost一词是来源于自适应增强(Adaptive Boosting)的缩写,是由YoavFreund和Robert Schapire提出的机器学习元算法。其设计的指导原则为确保当前训练样本有最高分类精度,即以分类精度为目标函数。其中,分类精度可以简单理解为分类正确率。其通过将不同的弱分类器合理的组合起来,形成强分类器,尽管每个弱分类器的分类精度不高,但最终的强分类器在分类性能上得到巨大提升。
很明显,不同的弱分类器选择将导致完全不同的分类效果。寻找最合适的弱分类器组合相当重要,决定了强分类器是否能拥有更高分类性能。但是目前,往往是基于人为经验来进行弱分类器组合选取,使得最终获得的强分类器的分类性能不佳。
发明内容
有鉴于此,本发明实施例提供一种人脸识别的分类器获取方法和装置,基于蚁群算法,在所有可能的弱分类器组合中,以分类精度和分类抗干扰风险为目标进行弱分类器组合的选取,使得获取的强分类器具有更佳的分类性能。
本发明实施例提供一种人脸识别的分类器获取方法,包括:
获取多个训练样本图像以及多个预设弱分类器组合,所述多个训练样本图像中包括干净样本图像和污染样本图像;
采用蚁群算法,根据所述多个预设弱分类器组合中每个预设弱分类器组合对应的信息素,使所述多个训练样本图像中每个训练样本图像从所述多个预设弱分类器组合中选取所使用的预设弱分类器组合;其中,所述每个预设弱分类器组合对应的信息素与该预设弱分类器组合的分类精度和分类抗干扰能力相关;
从所述多个预设弱分类器中选出具有最优分类精度和分类抗干扰能力的,和/或所述多个训练样本图像收敛于的预设弱分类器组合;
其中,所述分类抗干扰能力用于表征正确识别出污染样本图像的能力。
本发明实施例提供一种人脸识别的分类器获取装置,包括:
获取模块,用于获取多个训练样本图像以及多个预设弱分类器组合,所述多个训练样本图像中包括干净样本图像和污染样本图像;
蚁群训练模块,用于采用蚁群算法,根据所述多个预设弱分类器组合中每个预设弱分类器组合对应的信息素,使所述多个训练样本图像中每个训练样本图像从所述多个预设弱分类器组合中选取所使用的预设弱分类器组合;其中,所述每个预设弱分类器组合对应的信息素与该预设弱分类器组合的分类精度和分类抗干扰能力相关;
确定模块,用于从所述多个预设弱分类器中选出具有最优分类精度和分类抗干扰能力的,和/或所述多个训练样本图像收敛于的预设弱分类器组合;
其中,所述分类抗干扰能力用于表征正确识别出污染样本图像的能力。
本发明实施例提供的人脸识别的分类器获取方法和装置,对于可选的多个弱分类器组合,为保证最终选取出的弱分类器组合具有较佳的分类性能——分类精度、分类抗干扰能力,一方面,对于训练样本图像,该训练样本图像中除了包含若干干净样本图像,还包括若干污染样本图像,以训练分类器的抗干扰能力;另一方面,对于弱分类器的选取,采用蚁群算法,以若干训练样本图像作为蚂蚁,每一种弱分类器组合作为一条路径,每条路径对应的信息素由对应弱分类器的分类性能决定,由于最优路径对应的信息素浓度最强,从而基于蚁群算法从多个弱分类器组合中选择出的弱分类器组合具有最优分类精度和分类抗干扰能力,从而由该弱分类器构成的强分类器具有更佳的分类性能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的人脸识别的分类器获取方法实施例一的流程图;
图2为本发明实施例提供的人脸识别的分类器获取方法实施例二的流程图;
图3为本发明实施例提供的人脸识别的分类器获取装置实施例一的结构示意图;
图4为本发明实施例提供的人脸识别的分类器获取装置实施例二的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种,但是不排除包含至少一种的情况。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述XXX,但这些XXX不应限于这些术语。这些术语仅用来将XXX彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一XXX也可以被称为第二XXX,类似地,第二XXX也可以被称为第一XXX。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
图1为本发明实施例提供的人脸识别的分类器获取方法实施例一的流程图,本实施例提供的该分类器获取方法可以由一分类器获取装置来执行,该分类器获取装置可以实现为软件,或者实现为软件和硬件的组合,该分类器获取装置可以集成设置在终端设备或服务器中等。如图1所示,该方法包括如下步骤:
步骤101、获取多个训练样本图像以及多个预设弱分类器组合,多个训练样本图像中包括干净样本图像和污染样本图像。
本实施例中,为保证最终选取的强分类器的分类性能,训练样本图像的数量一般比较大,作为训练样本图像的图像可以是人脸图像、指纹图像等图像,基于强分类器的具体实际应用场景而定。其中,该强分类器可以是AdaBoost分类器。
不同于以往对强分类器的训练过程中都采用干净样本图像,本实施例中,为了提高强分类器的抗干扰能力,训练样本图像中还包括污染样本图像。实际应用中,干净样本图像的数量和污染样本图像的数量可以相等或不等,不等时,可以设置干净样本图像的数量大于污染样本图像的数量。
本实施例中,对于强分类器的分类性能除了以传统的分类精度来度量外,还包括分类抗干扰能力。其中,分类精度简单来说,就是分类结果的正确率;分类抗干扰能力用于表征正确识别出污染样本图像的能力。其中,分类精度,在一种可选的方式中,可以用于度量全部训练样本图像的分类正确率,在另一种可选的方式中,也可以用于度量干净样本图像的分类正确率。
值得说明的是,本实施例中,污染样本图像的含义是指被错误标记的样本图像。具体地,对于每个训练样本图像,可以基于一定的标记规则给每个训练样本图像打上一个标记,假设某个训练样本图像应该被打上的标记为a,结果将该训练样本图像标记为b,则该训练样本图像为污染样本图像。相对的,如果某个训练样本图像应该被打上的标记为a,结果将该训练样本图像的标记也确实是a,则该训练样本图像为干净样本图像。
另外,本实施例中,多个预设弱分类器组合可以是基于全部可选弱分类器的数量和强分类器中应该包含的弱分类器的数量而对全部可选弱分类器进行所有可能性组合而获得的。比如,总共有52个弱分类器,设置强分类器中应该包含30个弱分类器,则所有的30个弱分类器的组合结果都可以作为本实施例中的多个预设弱分类器组合之一。
另外,一组弱分类器组合中的各弱分类器可以具有不同的权重值,一般来说,权重值的设置可以从几个可选的权值中选定,这样,基于不同弱分类器与不同权重值的搭配结果,最终获得的多个预设弱分类器的数量更多。
其中,弱分类器的权重值是基于如下的设计思想而存在的:对于AdaBoost分类算法来说,其在某种意义上讲是自适应的,通过调整之前被某弱分类器错分的样本权值,提高后续弱分类器对错分样本的重视程度,实现最终强分类器模型的设计。
步骤102、采用蚁群算法,根据每个预设弱分类器组合对应的信息素,使多个训练样本图像中每个训练样本图像从多个预设弱分类器组合中选取所使用的预设弱分类器组合。
步骤103、从多个预设弱分类器中选出具有最优分类精度和分类抗干扰能力,且大于预设比例的训练样本图像收敛于的预设弱分类器组合。
其中,每个预设弱分类器组合对应的信息素与该预设弱分类器组合的分类精度和分类抗干扰能力相关。
本实施例中,对于弱分类器的选择,是基于蚁群算法(Ant Colony Optimization,简称ACO)来进行的。其中,多个训练样本图像作为ACO的蚂蚁,每种预设弱分类器组合作为一条路径,每条路径的信息素由对应预设弱分类器组合的分类性能指标值即分类精度值和分类抗干扰能力值确定。
其中,每个预设弱分类器组合的分类精度值和分类抗干扰能力值根据预设分类算法对训练样本图像的分类识别结果确定,预设分类算法可以是AdaBoost分类算法。
由于蚁群算法是寻找最优路径的算法,一般来说,路径最优性以路径长度最短为目标,本实施例中,对应于路径长度最短的目标,即为是寻找分类性能最优的弱分类器组合。因此,也就是说,一方面,训练样本图像作为蚂蚁,基于蚁群算法,找寻最优路径;另一方面,训练样本图像作为弱分类器组合的输入,基于分类算法,得到各训练样本图像的分类结果,以统计各弱分类器组合的分类性能,该分类性能反馈至蚁群算法,影响后续蚂蚁的最优路径搜索过程。从而,蚁群算法和分类算法有机配合,最终选择出具有最佳分类性能的强分类器。
可以理解的是,一般在强分类器训练的过程中,都是通过多次迭代过程而不断调整分类器中的相关参数,以最终获得强分类器的。在多次迭代的过程中,需要进行部分参数的初始化设置。本实施例中,需要初始设置各弱分类器组合的信息素,为了避免在初始阶段对蚂蚁的错误引导,设置各弱分类器组合具有相同的信息素值,另外,还可以设置迭代最大次数,以避免多次迭代分类器仍不收敛的情况下,无尽地迭代处理。可选地,本发明实施例中迭代结束条件为迭代次数达到预设迭代次数或训练样本图像收敛于多个预设弱分类器组合中的一个。
在进行上述初始化设置之后,基于每次迭代过程后,对各弱分类器组合的分类性能的统计,进而基于分类性能更新对应的弱分类器组合的信息素,从而,使得分类性能较佳的弱分类器组合吸引的蚂蚁数量更多,从而渐渐地,越来越多的蚂蚁收敛到分类性能最佳的弱分类器组合的路径上,从而选择出了最佳弱分类器组合。
其中,本实施例中,多个训练样本图像收敛于某若分类器组合中的收敛的含义,从蚁群算法的角度,简单来说就是全部或近乎全部即很大比例的蚂蚁都选择了相同的一条路径。
本实施例中,对于可选的多个弱分类器组合,为保证最终选取出的弱分类器组合具有较佳的分类性能——分类精度、分类抗干扰能力,一方面,对于训练样本图像,该训练样本图像中除了包含若干干净样本图像,还包括若干污染样本图像,以训练分类器的抗干扰能力;另一方面,对于弱分类器的选取,采用蚁群算法,以若干训练样本图像作为蚂蚁,每一种弱分类器组合作为一条路径,每条路径对应的信息素由对应弱分类器的分类性能决定,由于最优路径对应的信息素浓度最强,从而基于蚁群算法从多个弱分类器组合中选择出的弱分类器组合具有最优分类精度和分类抗干扰能力,从而由该弱分类器构成的强分类器具有更佳的分类性能。
前述实施例中主要从本发明获取强分类器的主要过程的角度进行了主要介绍。下面结合图2所示的实施例,对实际获取强分类器的过程进行详细说明。
图2为本发明实施例提供的人脸识别的分类器获取方法实施例二的流程图,如图2所示,包括如下步骤:
步骤201、获取多个训练样本图像以及多个预设弱分类器组合,多个训练样本图像中包括干净样本图像和污染样本图像。
上述步骤201的具体实现过程参见图1所示实施例中的相关说明,在此不赘述。
步骤202、初始化参数设置:设置每个预设弱分类器组合的初始信息素和初始转移概率,设置迭代最大次数。
本实施例中,为了进一步保证弱分类器组合选取结果的准确性,除了基于信息素进行路径即弱分类器组合的选取外,还可以进一步结合转移概率进行路径即弱分类器组合的选取。对于各预设弱分类器组合来说,具有相同的初始转移概率,也具有相同的初始信息素,以避免初始时对蚂蚁的错误引导。
其中,转移概率反映了一组弱分类器组合累计迭代过程中信息素的浓度。
步骤203、判定当前迭代次数是否小于或等于迭代最大次数,若是,则执行步骤204,否则,执行步骤210。
步骤204、采用蚁群算法,根据每个预设弱分类器组合当前对应的信息素和转移概率,使多个训练样本图像中每个训练样本图像从多个预设弱分类器组合中选取所使用的预设弱分类器组合。
本实施例中,对于信息素和转移概率的利用,在一种可选的实现方式中,可以首先基于信息素大小进行路径的选择,如果两条路径的信息素大小相同时,比较转移概率大小,选择转移概率大的路径。若两条路径的转移概率还相同,则可以随机从两条路径中选择。
步骤205、确定多个训练样本图像是否收敛于某个预设弱分类器组合,若否,则执行步骤206,否则,执行步骤211。
在蚁群算法的训练过程中,可以统计每次迭代过程中,每个预设弱分类器组合输出的分类结果数量即每条路径上经过的蚂蚁数,如果某弱分类器组合输出的分类结果数量已经近乎全部训练样本图像数量,即某条路径上经过的蚂蚁数已经近乎是全部蚂蚁数,确定训练样本图像收敛于该预设弱分类器组合,该预设弱分类器组合即为最终选取的强分类器。
步骤206、根据预设分类算法,获取每个训练样本图像对应的分类输出信息。
步骤207、根据每个训练样本图像对应的分类输出信息确定每个预设弱分类器组合对应的分类精度值和分类抗干扰能力值。
步骤208、根据每个预设弱分类器组合对应的分类精度值和分类抗干扰能力值,确定每个预设弱分类器组合当前对应的信息素和转移概率。
步骤209、迭代次数加一,转至执行步骤203。
本实施例中,如果当前迭代次数没有满足最大次数,训练样本图像也没有收敛,则统计各预设弱分类器组合的分类性能,进而更新对应的信息素和转移概率,进行下一次的迭代过程处理。
具体地,为统计各预设弱分类器组合的分类性能,首先需要统计每个训练样本图像根据AdaBoost算法在其所选择的弱分类器组合这一路径下的分类输出信息。为了统计各弱分类器组合的包含分类精度、分类抗干扰能力在内的分类性能,需要获得的每个训练样本图像的分类输出信息中包括分类结果、预设弱分类器组合标识、训练样本图像标识。其中,针对任一训练样本图像来说,分类结果比如为是、否这样的识别结果,对应于类似识别输入的训练人脸样本图像是否为授权用户的人脸图像的场景中。预设弱分类器组合标识是指该训练样本图像本次迭代过程中选择的预设弱分类器组合的标识即选择了哪条路径。实际应用中,可以给每个弱分类器打上唯一的标记,训练样本人脸图像每次迭代过程中,记录先后经历的各若分类器的标识,从而在输出端,可以基于其记录的各弱分类器的标识确定其对应的弱分类器组合的标识。训练样本图像标识是指该训练样本图像是干净还是污染样本图像。
具体地,根据每个训练样本图像对应的分类输出信息确定每个预设弱分类器组合对应的分类精度值和分类抗干扰能力值,包括:
首先,根据预设弱分类器组合标识,确定每个预设弱分类器组合对应的分类输出信息,即对全部训练样本图像的分类输出信息,按照对应的弱分类器组合标识进行划分,将同一个预设弱分类器组合的分类输出信息汇总在一起。
其次,根据每个预设弱分类器组合对应的分类输出信息中的训练样本图像标识,确定每个预设弱分类器组合对应的干净样本图像的数量和污染样本图像的数量,以及干净样本图像的分类结果和污染样本图像的分类结果。也就是说,将每个预设弱分类器组合对应的分类结果按照对应训练样本图像标识的类别进行分别汇总。
最后,根据干净样本图像的分类结果和干净样本图像的数量,确定每个预设弱分类器组合对应的分类精度值,根据污染样本图像的分类结果和污染样本图像的数量,确定每个预设弱分类器组合对应的分类抗干扰能力值。其中,分类精度值可以表征为干净样本图像正确分类结果的数量占干净样本图像数量的比值;分类抗干扰能力值可以表征为污染样本图像正确分类结果的数量占污染样本图像数量的比值。
其中,分类结果是否正确,可以根据如下方式判定:在训练之前,标记每个训练样本图像的参考输出结果,在每次迭代后,根据每个训练样本图像的实际输出的分类结果是否与参考输出结果一致,确定实际分类结果是否正确。
综上,在训练之前,对于每个训练样本图像,可以进行两个维度的标记,其一是标记其参考输出结果,其二是标记其对应的样本类别,即是干净样本图像还是污染样本图像。分类精度可以视为干净样本图像的分类正确率,分类抗干扰能力可以视为污染样本图像的分类正确率。
在获得每个弱分类器组合对应的分类精度值和分类抗干扰能力值之后,据此确定每个预设弱分类器组合当前对应的信息素和转移概率。
其中,信息素可以确定为:
ti=(CA*CT)/n,其中,ti为弱分类器组合经过第i次迭代后对应的信息素,CA为对应的分类精度值,CT为对应的分类抗干扰能力值,n为多个预设弱分类器组合的个数。可选地,也可以不除以n。
转移概率确定为:
在更新了信息素和转移概率后,如果更新后的迭代次数没有超过迭代最大次数,进行下一次迭代过程处理,以更新后的信息素和转移概率影响蚂蚁的路径选择,直到满足收敛或最大迭代次数的结束条件。
步骤210、确定具有最优分类精度和分类抗干扰能力的预设弱分类器组合为最终获得的强分类器。
如果在迭代次数已经达到迭代最大次数,但是训练样本图像还是没有收敛于某个弱分类器组合,则可以以最后一次迭代后,具有最优分类精度和分类抗干扰能力的弱分类器组合作为最终选出的强分类器。
步骤211、确定多个训练样本图像收敛于的某个预设弱分类器组合为最终获得的强分类器。
值得说明的是,前述实施例中,分类精度、分类抗干扰能力的计算都是基于训练样本图像的训练过程而计算的。但是实际应用中,该分类精度、分类抗干扰能力的计算还可以是基于验证样本图像对各弱分类器组合的验证过程而计算获得。其中,验证样本图像是对已经训练过的各弱分类器组合进行分类性能验证的样本图像,验证样本图像的验证过程与训练过程类似,只是,在基于验证样本图像进行验证处理时,训练过程只需执行蚁群算法、分类算法,获得分类结果即可,无需进行分类精度、分类抗干扰能力的计算,该计算可以在每次迭代后基于验证样本图像的验证过程中计算。验证过程与训练过程类似,验证样本图像也需要经过蚁群算法、分类算法,得到各弱分类器组合的分类输出信息,进而计算分类精度、分类抗干扰能力,基于此计算对应的信息素、转移概率,以作用到下一次训练过程中。也就是说,以验证样本图像获得的信息素、转移概率,反馈到训练样本图像的下一次路径选择中。
本实施例中,利用ACO算法,以分类精度、分类抗干扰能力作为信息素、转移概率的决定因素,能够从多个弱分类器组合中选取出一个最优的弱分类器组合。而且,以分类精度、分类抗干扰能力一同作为目标函数,不同于以往单独使用分类精度作为分类好坏的唯一度量,同时考察含有一定外点样本即污染样本下,分类器的分类精度,提高了选择具有更好抗干扰能力的弱分类器作为强分类器组成之一的概率。
以下将详细描述本发明的一个或多个实施例的分类器获取装置。这些分类器获取装置可以被实现在电子设备尤其是服务器的基础架构中。本领域技术人员可以理解,这些分类器获取装置均可使用市售的硬件组件通过本方案所教导的步骤进行配置来构成。
图3为本发明实施例提供的人脸识别的分类器获取装置实施例一的结构示意图,如图3所示,该装置包括:获取模块11、蚁群训练模块12、确定模块13。
获取模块11,用于获取多个训练样本图像以及多个预设弱分类器组合,所述多个训练样本图像中包括干净样本图像和污染样本图像。
蚁群训练模块12,用于采用蚁群算法,根据所述多个预设弱分类器组合中每个预设弱分类器组合对应的信息素,使所述多个训练样本图像中每个训练样本图像从所述多个预设弱分类器组合中选取所使用的预设弱分类器组合;其中,所述每个预设弱分类器组合对应的信息素与该预设弱分类器组合的分类精度和分类抗干扰能力相关。
确定模块13,用于从所述多个预设弱分类器中选出具有最优分类精度和分类抗干扰能力的,和/或所述多个训练样本图像收敛于的预设弱分类器组合。
其中,所述分类抗干扰能力用于表征正确识别出污染样本图像的能力。
图3所示装置可以执行图1所示实施例的方法,本实施例未详细描述的部分,可参考对图1所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1所示实施例中的描述,在此不再赘述。
图4为本发明实施例提供的人脸识别的分类器获取装置实施例二的结构示意图,如图4所示,在图3所示实施例基础上,所述蚁群训练模块12包括:蚁群训练子模块121、获取子模块122、确定子模块123、更新子模块124。
在以迭代次数达到预设迭代次数或所述多个训练样本图像收敛于所述多个预设弱分类器组合中的一个为迭代结束条件的迭代过程中:
所述蚁群训练子模块121,用于根据所述多个预设弱分类器组合中每个预设弱分类器组合当前对应的信息素,使所述多个训练样本图像中每个训练样本图像从所述多个预设弱分类器组合中选取所使用的预设弱分类器组合。
所述获取子模块122,用于根据预设分类算法,获取所述每个训练样本图像对应的分类输出信息。
所述确定子模块123,用于根据所述分类输出信息确定所述每个预设弱分类器组合对应的分类精度值和分类抗干扰能力值。
所述更新子模块124,用于根据所述每个预设弱分类器组合对应的分类精度值和分类抗干扰能力值,更新所述每个预设弱分类器组合对应的信息素。
可选地,所述蚁群训练子模块121还用于:
根据所述多个预设弱分类器组合中每个预设弱分类器组合当前对应的信息素和转移概率,使所述多个训练样本图像中每个训练样本图像从所述多个预设弱分类器组合中选取所使用的预设弱分类器组合。
所述更新子模块124还用于:根据更新后的信息素更新对应的转移概率。
具体地,所述分类输出信息中包括分类结果、预设弱分类器组合标识、训练样本图像标识,所述确定子模块123具体用于:
根据所述预设弱分类器组合标识,确定所述每个预设弱分类器组合对应的分类输出信息;
根据所述每个预设弱分类器组合对应的分类输出信息中的训练样本图像标识,确定所述每个预设弱分类器组合对应的干净样本图像的数量和污染样本图像的数量,以及干净样本图像的分类结果和污染样本图像的分类结果;
根据所述干净样本图像的分类结果和所述干净样本图像的数量,确定所述每个预设弱分类器组合对应的分类精度值,根据所述污染样本图像的分类结果和所述污染样本图像的数量,确定所述每个预设弱分类器组合对应的分类抗干扰能力值。
可选地,所述更新子模块124具体用于:
根据所述每个预设弱分类器组合对应的分类精度值和分类抗干扰能力值的乘积,更新所述每个预设弱分类器组合对应的信息素。
图4所示装置可以执行图2所示实施例的方法,本实施例未详细描述的部分,可参考对图2所示实施例的相关说明。该技术方案的执行过程和技术效果参见图2所示实施例中的描述,在此不再赘述。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以产品的形式体现出来,该计算机产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (6)

1.一种人脸识别的分类器获取方法,其特征在于,包括:
获取多个训练样本图像以及多个预设弱分类器组合,所述多个训练样本图像中包括干净样本图像和污染样本图像,其中,所述污染样本图像是指被错误标记的样本图像;
采用蚁群算法,根据所述多个预设弱分类器组合中每个预设弱分类器组合对应的信息素,使所述多个训练样本图像中每个训练样本图像从所述多个预设弱分类器组合中选取所使用的预设弱分类器组合;其中,所述每个预设弱分类器组合对应的信息素与该预设弱分类器组合的分类精度和分类抗干扰能力相关;
从所述多个预设弱分类器中选出具有最优分类精度和分类抗干扰能力的,和/或所述多个训练样本图像收敛于的预设弱分类器组合;
其中,所述分类抗干扰能力用于表征正确识别出污染样本图像的能力;
所述根据所述多个预设弱分类器组合中每个预设弱分类器组合对应的信息素,使所述多个训练样本图像中每个训练样本图像从所述多个预设弱分类器组合中选取所使用的预设弱分类器组合,包括:
迭代执行如下过程,其中,迭代结束条件为迭代次数达到预设迭代次数或所述多个训练样本图像收敛于所述多个预设弱分类器组合中的一个:
根据所述多个预设弱分类器组合中每个预设弱分类器组合当前对应的信息素和转移概率,使所述多个训练样本图像中每个训练样本图像从所述多个预设弱分类器组合中选取所使用的预设弱分类器组合;
根据预设分类算法,获取所述每个训练样本图像对应的分类输出信息;
根据所述分类输出信息确定所述每个预设弱分类器组合对应的分类精度值和分类抗干扰能力值;
根据所述每个预设弱分类器组合对应的分类精度值和分类抗干扰能力值,更新所述每个预设弱分类器组合对应的信息素;
根据更新后的信息素更新对应的转移概率,其中,所述转移概率用于反映了一组弱分类器组合累计迭代过程中信息素的浓度。
2.根据权利要求1所述的方法,其特征在于,所述分类输出信息中包括分类结果、预设弱分类器组合标识、训练样本图像标识;以及,
所述根据所述分类输出信息确定所述每个预设弱分类器组合对应的分类精度值和分类抗干扰能力值,包括:
根据所述预设弱分类器组合标识,确定所述每个预设弱分类器组合对应的分类输出信息;
根据所述每个预设弱分类器组合对应的分类输出信息中的训练样本图像标识,确定所述每个预设弱分类器组合对应的干净样本图像的数量和污染样本图像的数量,以及干净样本图像的分类结果和污染样本图像的分类结果;
根据所述干净样本图像的分类结果和所述干净样本图像的数量,确定所述每个预设弱分类器组合对应的分类精度值,根据所述污染样本图像的分类结果和所述污染样本图像的数量,确定所述每个预设弱分类器组合对应的分类抗干扰能力值。
3.根据权利要求1所述的方法,其特征在于,更新所述每个预设弱分类器组合对应的信息素,包括:
根据所述每个预设弱分类器组合对应的分类精度值和分类抗干扰能力值的乘积,更新所述每个预设弱分类器组合对应的信息素。
4.一种人脸识别的分类器获取装置,其特征在于,包括:
获取模块,用于获取多个训练样本图像以及多个预设弱分类器组合,所述多个训练样本图像中包括干净样本图像和污染样本图像,其中,所述污染样本图像是指被错误标记的样本图像;
蚁群训练模块,用于采用蚁群算法,根据所述多个预设弱分类器组合中每个预设弱分类器组合对应的信息素,使所述多个训练样本图像中每个训练样本图像从所述多个预设弱分类器组合中选取所使用的预设弱分类器组合;其中,所述每个预设弱分类器组合对应的信息素与该预设弱分类器组合的分类精度和分类抗干扰能力相关;
确定模块,用于从所述多个预设弱分类器中选出具有最优分类精度和分类抗干扰能力的,和/或所述多个训练样本图像收敛于的预设弱分类器组合;
其中,所述分类抗干扰能力用于表征正确识别出污染样本图像的能力;
所述蚁群训练模块包括:蚁群训练子模块、获取子模块、确定子模块、更新子模块;
在以迭代次数达到预设迭代次数或所述多个训练样本图像收敛于所述多个预设弱分类器组合中的一个为迭代结束条件的迭代过程中:
所述蚁群训练子模块,用于根据所述多个预设弱分类器组合中每个预设弱分类器组合当前对应的信息素和转移概率,使所述多个训练样本图像中每个训练样本图像从所述多个预设弱分类器组合中选取所使用的预设弱分类器组合;
所述获取子模块,用于根据预设分类算法,获取所述每个训练样本图像对应的分类输出信息;
所述确定子模块,用于根据所述分类输出信息确定所述每个预设弱分类器组合对应的分类精度值和分类抗干扰能力值;
所述更新子模块,用于根据所述每个预设弱分类器组合对应的分类精度值和分类抗干扰能力值,更新所述每个预设弱分类器组合对应的信息素;根据更新后的信息素更新对应的转移概率,其中,所述转移概率用于反映了一组弱分类器组合累计迭代过程中信息素的浓度。
5.根据权利要求4所述的装置,其特征在于,所述分类输出信息中包括分类结果、预设弱分类器组合标识、训练样本图像标识,所述确定子模块具体用于:
根据所述预设弱分类器组合标识,确定所述每个预设弱分类器组合对应的分类输出信息;
根据所述每个预设弱分类器组合对应的分类输出信息中的训练样本图像标识,确定所述每个预设弱分类器组合对应的干净样本图像的数量和污染样本图像的数量,以及干净样本图像的分类结果和污染样本图像的分类结果;
根据所述干净样本图像的分类结果和所述干净样本图像的数量,确定所述每个预设弱分类器组合对应的分类精度值,根据所述污染样本图像的分类结果和所述污染样本图像的数量,确定所述每个预设弱分类器组合对应的分类抗干扰能力值。
6.根据权利要求4所述的装置,其特征在于,所述更新子模块具体用于:
根据所述每个预设弱分类器组合对应的分类精度值和分类抗干扰能力值的乘积,更新所述每个预设弱分类器组合对应的信息素。
CN201611000464.8A 2016-11-14 2016-11-14 人脸识别的分类器获取方法和装置 Active CN106557781B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611000464.8A CN106557781B (zh) 2016-11-14 2016-11-14 人脸识别的分类器获取方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611000464.8A CN106557781B (zh) 2016-11-14 2016-11-14 人脸识别的分类器获取方法和装置

Publications (2)

Publication Number Publication Date
CN106557781A CN106557781A (zh) 2017-04-05
CN106557781B true CN106557781B (zh) 2019-09-03

Family

ID=58444832

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611000464.8A Active CN106557781B (zh) 2016-11-14 2016-11-14 人脸识别的分类器获取方法和装置

Country Status (1)

Country Link
CN (1) CN106557781B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111815493B (zh) * 2019-04-11 2024-03-26 深圳市家家分类科技有限公司 生物降解系统的环保金生成方法及相关产品

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7693049B2 (en) * 2004-10-29 2010-04-06 Honeywell International Inc. Self-organization of sensor networks using ant colony optimization
CN103499608B (zh) * 2013-07-30 2015-09-30 中国标准化研究院 一种基于蚁群算法的表征蜂蜜差异性智能嗅觉图谱特征提取方法
CN103942562B (zh) * 2014-03-27 2017-05-17 河海大学 基于多分类器组合的高光谱图像分类方法

Also Published As

Publication number Publication date
CN106557781A (zh) 2017-04-05

Similar Documents

Publication Publication Date Title
Gowda et al. Smart frame selection for action recognition
CN110443143B (zh) 多分支卷积神经网络融合的遥感图像场景分类方法
CN111523621B (zh) 图像识别方法、装置、计算机设备和存储介质
Nguyen et al. Weakly supervised action localization by sparse temporal pooling network
CN113688723B (zh) 一种基于改进YOLOv5的红外图像行人目标检测方法
CN111753881B (zh) 一种基于概念敏感性量化识别对抗攻击的防御方法
CN111507469B (zh) 对自动标注装置的超参数进行优化的方法和装置
CN111444951B (zh) 样本识别模型的生成方法、装置、计算机设备和存储介质
CN111178120B (zh) 一种基于作物识别级联技术的害虫图像检测方法
CN107480261A (zh) 一种基于深度学习细粒度人脸图像快速检索方法
CN109919252A (zh) 利用少数标注图像生成分类器的方法
CN109902202A (zh) 一种视频分类方法及装置
CN110490227A (zh) 一种基于特征转换的少样本图像分类方法
CN110245711A (zh) 基于角度旋转生成网络的sar目标识别方法
CN112784031B (zh) 一种基于小样本学习的客服对话文本的分类方法和系统
CN113541985B (zh) 物联网故障诊断方法、模型的训练方法及相关装置
CN110298394A (zh) 一种图像识别方法和相关装置
CN114842343A (zh) 一种基于ViT的航空图像识别方法
CN110110845A (zh) 一种基于并行多级宽度神经网络的学习方法
CN108960270A (zh) 一种基于流形迁移学习的数据标定方法及系统
CN111126155B (zh) 一种基于语义约束生成对抗网络的行人再识别方法
CN109284378A (zh) 一种面向知识图谱的关系分类方法
CN108920477A (zh) 一种基于二叉树结构的不平衡数据处理方法
CN106557781B (zh) 人脸识别的分类器获取方法和装置
CN110097117A (zh) 基于线性判别分析与多元自适应样条的数据分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant