CN107016377A - 基于sgasen算法的人脸识别优化方法 - Google Patents

基于sgasen算法的人脸识别优化方法 Download PDF

Info

Publication number
CN107016377A
CN107016377A CN201710246607.1A CN201710246607A CN107016377A CN 107016377 A CN107016377 A CN 107016377A CN 201710246607 A CN201710246607 A CN 201710246607A CN 107016377 A CN107016377 A CN 107016377A
Authority
CN
China
Prior art keywords
base
base grader
individual
sgasen
algorithms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710246607.1A
Other languages
English (en)
Inventor
杨新武
张翱翔
袁顺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201710246607.1A priority Critical patent/CN107016377A/zh
Publication of CN107016377A publication Critical patent/CN107016377A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/259Fusion by voting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Physiology (AREA)
  • Biomedical Technology (AREA)
  • Genetics & Genomics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于SGASEN算法的人脸识别优化方法,首先对人脸图像进行特征提取,然后使用SGASEN算法进行识别分类。对于SGASEN算法对中存在种群大量无效交叉操作问题,本方法以回归树作为基分类器,在交叉操作之前使用计算简单的杰卡德相似性检测,对相似个体减少交叉操作,使种群更加多样性。又针对SGASEN算法存在基分类器的数目未作限制的问题,在适应度函数中考虑泛化误差和基分类器数目,采用最优保留策略进行遗传进化。最终获得了泛化能力强和基分类器数目少的强分类器,有效地提高了人脸识别的准确率。

Description

基于SGASEN算法的人脸识别优化方法
技术领域
本发明属于机器学习和模式识别技术领域,是利用训练数据集构建一个具有较强泛化能力的预测方法,以期达到对新的未知对象给出精确估计。
背景技术
人脸识别技术是图像处理方面的主要技术,然而识别率不高一直是妨碍人脸识别技术广泛应用的重要原因。研究发现可以通过集成学习的方法来提高准确率。集成学习是由多个基分类器或弱分类器的加权组合来形成强分类器的学习模型。集成的目标是组合若干个基分类器来改进在单个分类器上的预测能力不足的问题,使其具有更好的泛化能力和鲁棒性。然而在基分类器产生的过程中,由于增加了更多的随机不确定性,产生了冗余的或性能差的基分类器,为此有学者提出了选择性集成学习方法。选择性集成学习是在集成学习的基础上对基分类器加以选择,进而生成泛化能力更强的基分类器组合。
选择性集成其实是一个组合优化问题,属于NP难问题。目前主要的组合策略有:基于聚类的方法;基于排序的方法;基于优化的方法;其他(动态选择和循环集成)。遗传算法作为全局优化搜索算法,在集成学习中已经有应用的典范。例如:在集成学习基分类器的训练中,高维特征中的冗余特征一直是影响基分类器质量的关键因素,冗余特征不利于基分类器规则的产生,有学者提出基于遗传算法的特征选择方法,成功的完成了特征的约简,并且约简后的特征训练出的基分类器有更好的分类能力。遗传算法不仅在特征的约简方面表现出了更好的寻优能力,而且在基分类器的选择上同样有较好的效果。例如,周志华等学者提出的GASEN算法,是首次将遗传算法应用于基分类器选择上,并取得了较好的效果。
但是,遗传算法在集成选择的过程中还存在着不足,种群的多样性由于大量无效交叉的存在而丧失,GASEN算法的适应度函数仅考虑集成的泛化误差而对基分类器的数目未作限制。针对无效交叉问题,徐晓艳等人提出的聚类改进遗传算法通过对种群划分,在个体进行交叉操作时对同一划分内的两个个体间禁止交叉,从而避免了无效交叉的发生。虽然可以有效避免无效交叉,但是加入聚类的遗传算法时间复杂度增大同时计算量也增加。
发明内容
本发明的目的在于针对已有的人脸识别技术存在的复杂度高和识别率低的问题,提出一种基于相似性改进遗传算法的选择性集成学习方法(Selective EnsembleLearning Method based on Similarity Improved Genetic Algorithm,SGASEN)应用于人脸识别中。
为达到上述目的,本发明采用的技术方案是利用SGASEN算法的人脸识别的优化算法。首先利用PCA算法对人脸图像进行特征提取和降维,有效地降低了问题的时间复杂度;然后,用降维后的矩阵数据,使用SGASEN算法进行识别分类。
该方法以回归树作为基分类器,从原始的训练集有又放回抽取N个样本,迭代T次。对产生后的N个基分类器进行二进制编码,生成初始种群,在交叉操作之前使用杰卡德相似性检测,对于相似个体减少交叉操作,在对适应度函数设置的同时,兼顾集成泛化误差和基分类器数目,采用最优保留策略进行遗传进化。
流程图见图1,其具体步骤如下:
(1)首先,对人脸识别库中的所有图像进行归一化处理,然后再用PCA算法降维。确定每次训练集大小N和迭代次数T,该训练集是由人脸识别库中图像样本构成。本方法的各个参数意义如下:N表示每次从人脸图像中抽取的样本数目,T表示为训练出T个基分类器需要的迭代次数,St表示第t次抽取出的图像样本构成的训练集,M表示从训练出的基本分类器中随机选出基分类器的个数。
(2)For t=1:T执行以下几步:
①从原始训练集中有放回抽样出N个样本构成训练集St
②用回归分类树算法在St下训练出基分类器模型ht
(3)采用遗传算法,执行以下几步:
①初始化,对h1,···,ht采用二进制编码,编码长度为T,此处的编码长度T与基分类器的个数相等,每个基因位取值为0或1,基因位为1表示该基分类器被选中,基因位为0表示基分类器未被选中,不同的二进制基因编码串表示不同的个体。以为适应度函数,其中ε为回归树集成误差,α为惩罚系数,t为基因编码串中基因值1的个数即被选中的基分类器个数。
②随机产生M个个体,构成初始种群。
③设置相似度阈值λ,表示种群中两个个体的相似程度,相似度计算公式使用Jaccard系数,采用轮盘赌选择法选择两个父代个体,使用Jaccard检测相似度,当相似度大于λ时,对适应度较差的个体重新选择,直到两个个体相似度小于λ。
④对③中选择的两个个体进行相互交叉操作,产生两个下一代个体。
⑤对所有新产生个体进行基因位的变异操作。
⑥停止种群进化。
(4)从最后一代个体中取出最优个体,进行解码即为基分类器组合,使用多数投票法对测试集预测,计算分类错误率。
(5)结束。
本发明的有益效果在于:1、降低了问题的复杂度;2、利用本发明算法进行分类识别可以效地提高分类准确率即人脸识别率。
附图说明
图1是本方法的实施流程。
具体实施方式
下面详细给出该发明技术方案中所涉及的各个细节问题的说明:
在提出新方法之前,首先对zhou等人(Zhi-Hua Zhou,Jianxin Wu,WeiTang.Ensembling neural networks:Many could be better than all☆[J].ArtificialIntelligence,2002,137(1–2):239-263)提出的选择性集成学习理论分析,主要分析了针对二分类问题的选择性理论。
假设m个训练样本,它们的期望输出结果为[d1,d2,···,dm]T,其中dj为第j个样本的期望结果。f={f1,f2,···,fN}为样本集训练的基分类器集合,其中N是基分类器个数,fi为第i个基分类器,其分类结果为[fi1,fi2,···,fim]T,fij即为第i个基分类器对第j个样本的输出结果。其中dj∈{-1,+1}(j=1,2,···,m),fij∈{-1,+1}(i=1,2,···,N;j=1,2,···,m)。显然,当第i个基分类器对第j个样本分类正确时,有fijdij=+1,否则fijdij=-1。那么第i个基分类器对m个训练样本的分类错误率为:
其中Error(x)可定义如下:
引入一个向量Sum=[Sum1,Sum2,···,Summ],其中Sumj为所有基分类器对第j个样本的输出结果之和,即
那么集成分类器对第j个样本的输出为:
其中
显然集成分类器对第j个样本输出正确结果则有输出错误则有除此之外这意味着对其没有得到评判结果。那么集成分类器的泛化错误率为:
现将第k个基分类器从集成中排除,那么新的集成分类器对第j个样本的集成结果为:
新的集成分类器的泛化错误率为:
若有:
说明排除第k个基分类器集成泛化错误率并不会大于全部集成的泛化错误率。此时考虑到第k个基分类器对第j个样本的最终结果没有影响,即|Sumj|>1,考虑到函数Error(x)和Sgn(x)的性质,当x∈{-1,0,+1},y∈{-1,+1}时,有:
约束条件:
显然上式是满足的。当所有基分类器是同一个的时候,上式表明集成的数目可以减少,而且并不会增大泛化错误率。
综上,一些从二分类问题出发,应用反证法分析了去除部分对分类结果无影响的基分类器可以提高最后的集成效果。还有一些从相互独立的泛化误差的角度分析,当基分类器无限增加且相互独立时最终的集成泛化误差趋于零。假设每个基分类器的泛化误差为p,对于由N个基分类器构成的集成中k个基分类器对样本分类错误,那么通过投票的方式决策出的最终泛化误差是:
显然,当p<1/2时,上式随着N的增大而逐渐减小,也就是每个基分类器对样本的分类正确率大于1/2,而且基分类器间相互独立,那么最终的结果是每个样本都能被正确分类。但是维持基分类器间的相互独立性是件困难的事情,也就是无法提前预知基分类器的分类规则,判断基分类器间的独立性。通常基分类器的产生有两种方式:第一种是通过对样本的重采样形成不同的样本集,利用样本集的差异产生不同的基分类器,但是不同的样本集可能产生相同的基分类器;第二种一般是对高维的样本集进行特征的采样,根据特征的组合不同训练出不同的基分类器,这种方式产生的基分类器一般差异性较大,尤其是维数较高的分类任务,随机产生的特征组合构造的基分类器分类能力可能会过低,以至于无法满足基本的分类需求。两种方式都有各自的优缺点和应用场景,本文主要是通过样本集的重新选择来产生基分类器。
选择基分类器是集成学习的首要任务,不同类型的基分类器对最终的集成效果有着较大的差异。决策树是一种不稳定的学习算法,样本的微小变化可导致分类规则的较大变化,是集成学习的研究中经常用到基分类器。本文主要以分类回归树(ClassificationAnd Regression Tree,CART)作为基分类器。分类回归树是决策树的一种实现方法,也是应用最为广泛的决策学习方法。CART主要由三部分组成:特征选择、树的构造、剪枝操作。
特征选择主要是在树的构造过程中,选择分支节点时使用。树的构造过程是一个递归的过程,对于一个有N个样本M个属性K个类别的分类问题,假设样本归属于第k个类别的概率为pk,那么基尼指数可定义为:
通过计算每个特征属性的基尼指数来确定当前节点的最优分支属性及切分点,之后根据属性切分点对样本集划分,划分后的子集分别递归执行属性的选择划分,最后直至满足停止条件。树的构造完成之后,一般都要进行剪枝操作,剪枝操作是防止模型过拟合的有效方法,通常使用相对独立的验证样本集对训练出的生成树剪枝。
本方法是应用改进的遗传算法优化基分类器组合,优化的结果要尽可能的达到基分类器数目少和集成泛化误差低的目标。遗传算法解决实际问题时,针对不同的问题其适应度函数设计一般不同。在GASEN算法中,适应度函数只考虑了集成的泛化误差,对集成分类器的数目并没有加以控制。遗传进化的过程中可能存在泛化误差相同但集成分类器数目不同的个体,计算出的适应度值是相同的,而那些集成分类器数目多的个体并不是最终想要的优良个体。为此在集成泛化误差的基础上增加了对基分类器数目的惩罚,当个体泛化误差相同时,对于基分类器数目大的个体增加惩罚,使被选择到下一代的概率减小。本章所使用的泛化误差是遗传算法个体中被选中的基分类器对训练样本集的错误率的计算值。
交叉操作是遗传算法产生新个体的有效方法,通常情况下从种群中随机选择两个父代个体,随机产生一个交叉点,进行交叉操作。随着遗传算法迭代次数的不断增加,子代种群中大量的个体会趋于相近或相同,导致大量无效交叉的发生,进而影响种群的多样性和收敛速度。有学者提出一种避免无效交叉的改进遗传算法,并对无效交叉进行了分析,具体的步骤如下:
Step1设定迭代次数为T,种群规模为N,产生初始种群。
Step2使用聚类算法对当前种群划分,随机选择两个个体,若两个个体处于同一划分,则重新选择适应度值小的个体,当两个个体不在同一划分时停止。
Step3采用单点交叉的方法应用于Step2中的两个个体,将产生的两个个体加入到新种群中,若新种群规模达到N则执行Step3,否则执行Step2。
Step4对Step3中的新种群执行变异选择操作,重构新种群。
Step5当迭代次数满足T时停止进化,否则执行Step2。
采用聚类的方法进行种群的划分,进而避免无效交叉的产生,虽然对保持种群多样性有积极作用,但是聚类算法计算复杂度高,而且基于k-means的算法聚类数目又难以确定。聚类的本质是对相似个体尽可能的聚在一起,不相似的个体尽可能的分开,以此达到划分的目的。为此,本文提出相似性检测技术代替聚类运算,从而减少了计算复杂度,也能起到避免无效交叉的作用。
常见的相似性检测方法主要是使用距离度量,常用的距离度量计算方法有:欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、马氏距离、余弦夹角、杰卡德系数和相关系数等,计算公式如下:
(1)欧氏距离是比较常用的距离度量方法,计算复杂度为O(N),公式为:
(2)曼哈顿距离公式为:
(3)切比雪夫距离公式为:
(4)闵可夫斯基距离公式为
(5)马氏距离公式为:
d(x,y)=∑(x-y)s-1(x-y) (1-18)
其中s为由x,y,···等构成的协方差矩阵。
(6)余弦夹角公式为:
(7)杰卡德系数是对两个集合的相似度进行度量的方法,其公式为:
(8)相关系数公式为:
其中Cov(x,y)表示两个向量的协方差,D(x),D(y)为方差。
采用二进制的方式对基分类器进行编码,相似度的测量使用杰卡德系数,计算简单,对二进制串的相似度测量较其它方法有效。
以相似性改进遗传算法为基础,提出了一种新的基于改进遗传算法的选择性集成学习方法。该方法采用回归树为基分类器,训练T个基分类器,以为适应度函数,其中ε为回归树集成误差,α为惩罚因子,t为被选中的基分类器个数。其中α因子的初始值跟基分类器的错误率相关,错误率低的基分类器其对应的α因子小。
采用二进制的编码形式,每个个体为基分类器组合,采用遗传算法的选择、交叉、变异等操作,选择出适应度最好的个体为最终的分类器组合。
初始训练集S={(x1,y1),(x2,y2),···,(xn,yn)},yi∈{1,2,···,k},k为类别数
Step1确定训练集大小N和迭代次数T
Step2 For t=1:T执行以下几步:
③从原始训练集重抽样N个样本构成训练集St
④用回归分类树算法在St下训练出基分类器模型ht
Step3采用遗传算法,执行以下几步:
⑦初始化,对h1,···,ht采用二进制编码,编码长度为T,每个基因位取值为0或1,基因值为1表示该基分类器被选中,基因值为0表示基分类器未被选中,不同的二进制基因编码串表示不同的个体。以为适应度函数,其中ε为回归树集成误差,α为惩罚因子,t为基因编码串中基因值1的个数即被选中的基分类器个数。
⑧随机产生M个个体,构成初始种群。
⑨设置相似度阈值λ,表示种群中两个个体的相似程度,相似度计算使用Jaccard系数,Jaccard系数主要用于计算符号度量或布尔值度量的个体间的相似度,计算公式为其中||x||,||y||为个体中基因值为1的个数,||x∩y||两个个体中表示相同基因位取值均为1的个数,采用轮盘赌选择法选择两个父代个体,使用Jaccard检测相似度,当相似度大于λ时,对适应度较差的个体重新选择,直到两个个体相似度小于λ。在一定程度上避免近亲繁殖,这样可以减少遗传操作的无效交叉次数,提高算法的搜索性能。
⑩对③中选择的两个个体进行交叉,产生两个子代个体
对所有子代个体进行基因位的变异操作
停止种群进化
其中,适应度函数的计算过程是对于一个个体b=(b1,b2,···,bT),T是编码长度,bi∈{0,1},样本x最终的分类结果采用多数投票的方法得出其表达式为:
对于训练集S的集成泛化误差为:
那么适应度函数计算表达式为:
Step4从最后一代个体中取出最优个体,进行解码即为基分类器组合,使用多数投票法对测试集预测,计算分类错误率。
Step5结束。
实验验证
在Yale人脸库和UCI数据集上,对Bagging、GASEN以及SGASEN算法进行比较测试。数据集的基本介绍见表1-1。将数据集转化为数值表示,并随机拆分为两部分,一部分为训练集,另一部分为测试集,其中训练集占比80%。分别在集成分类器规模为20,40,60,80,100时对Bagging算法、GASEN算法及本专利算法SGASEN做了对比实验,实验结果见表1-2,表1-3,表1-4,表1-2表示Bagging下的错误率,表1-3表示GASEN下的错误率,表1-4表示SGASEN下的错误率。不同基分类器规模下GASEN和SGASEN所使用的基分类器个数见表1-5,其中奇数列为GASEN使用的基分类器个数,偶数列为SGASEN使用的基分类器个数。
表1-1 UCI数据集
表1-2 Bagging算法在不同基分类器规模下的错误率
表1-3GASEN算法在不同基分类器规模下的错误率
表1-4SGASEN算法在不同基分类器规模下的错误率
表1-5基分类器个数
由表1-2,1-3,1-4对比可知,GASEN和SGASEN的测试错误率均小于Bagging算法,说明GASEN和SGASEN算法都能够有效提高选择性集成的泛化能力。从表1-3与表1-4发现,SGASE总体误差率达到了不弱于GASEN的效果,只有在集成分类器规模为100时,其误差率略高于GASEN。另外,从表1-5可以看出,SGASEN算法所使用的基分类器数目在大多数情况下都小于GASEN算法,只在wdbc数据集基分类器规模为100时SGASEN多于GASEN 2个基分类器和waveform数据集基分类器规模为20时SGASEN多于GASEN 1个基分类器。
在人脸库等数据集上的对比验表明,提出的SGASEN算法不仅关注到了集成泛化误差而且对基分类器数目加以惩罚,使得算法不降低集成泛化误差的前提下更有利于去搜寻基分类器数目少的个体。从而达到了泛华误差能力强和复杂度低的目的,有效地提高了人脸识别的准确率。

Claims (1)

1.基于SGASEN算法的人脸识别优化方法,首先利用PCA算法对人脸图像进行特征提取和降维,有效地降低了问题的时间复杂度;然后,用降维后的矩阵数据,使用SGASEN算法进行识别分类;
该方法以回归树作为基分类器,从原始的训练集有又放回抽取N个样本,迭代T次;对产生后的N个基分类器进行二进制编码,生成初始种群,在交叉操作之前使用杰卡德相似性检测,对于相似个体减少交叉操作,在对适应度函数设置的同时,兼顾集成泛化误差和基分类器数目,采用最优保留策略进行遗传进化;
其特征在于:该方法具体步骤如下,
(1)首先,对人脸识别库中的所有图像进行归一化处理,然后再用PCA算法降维;确定每次训练集大小N和迭代次数T,该训练集是由人脸识别库中图像样本构成;本方法的各个参数意义如下:N表示每次从人脸图像中抽取的样本数目,T表示为训练出T个基分类器需要的迭代次数,St表示第t次抽取出的图像样本构成的训练集,M表示从训练出的基本分类器中随机选出基分类器的个数;
(2)For t=1:T执行以下几步:
①从原始训练集中有放回抽样出N个样本构成训练集St
②用回归分类树算法在St下训练出基分类器模型ht
(3)采用遗传算法,执行以下几步:
①初始化,对h1,···,ht采用二进制编码,编码长度为T,此处的编码长度T与基分类器的个数相等,每个基因位取值为0或1,基因位为1表示该基分类器被选中,基因位为0表示基分类器未被选中,不同的二进制基因编码串表示不同的个体;以为适应度函数,其中ε为回归树集成误差,α为惩罚系数,t为基因编码串中基因值1的个数即被选中的基分类器个数;
②随机产生M个个体,构成初始种群;
③设置相似度阈值λ,表示种群中两个个体的相似程度,相似度计算公式使用Jaccard系数,采用轮盘赌选择法选择两个父代个体,使用Jaccard检测相似度,当相似度大于λ时,对适应度较差的个体重新选择,直到两个个体相似度小于λ;
④对③中选择的两个个体进行相互交叉操作,产生两个下一代个体;
⑤对所有新产生个体进行基因位的变异操作;
⑥停止种群进化;
(4)从最后一代个体中取出最优个体,进行解码即为基分类器组合,使用多数投票法对测试集预测,计算分类错误率;
(5)结束。
CN201710246607.1A 2017-04-16 2017-04-16 基于sgasen算法的人脸识别优化方法 Pending CN107016377A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710246607.1A CN107016377A (zh) 2017-04-16 2017-04-16 基于sgasen算法的人脸识别优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710246607.1A CN107016377A (zh) 2017-04-16 2017-04-16 基于sgasen算法的人脸识别优化方法

Publications (1)

Publication Number Publication Date
CN107016377A true CN107016377A (zh) 2017-08-04

Family

ID=59448103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710246607.1A Pending CN107016377A (zh) 2017-04-16 2017-04-16 基于sgasen算法的人脸识别优化方法

Country Status (1)

Country Link
CN (1) CN107016377A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109948680A (zh) * 2019-03-11 2019-06-28 合肥工业大学 病历数据的分类方法及系统
CN110688983A (zh) * 2019-08-22 2020-01-14 中国矿业大学 基于多模态优化和集成学习的微震信号识别方法
CN110929644A (zh) * 2019-11-22 2020-03-27 南京甄视智能科技有限公司 基于启发式算法的多模型融合人脸识别方法、装置、计算机系统与可读介质
CN113657178A (zh) * 2021-07-22 2021-11-16 浙江大华技术股份有限公司 人脸识别方法、电子设备和计算机可读存储介质
CN114415751A (zh) * 2021-11-25 2022-04-29 内蒙古大唐国际托克托发电有限责任公司 一种用于火电机组的主、再热汽温优化系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050100209A1 (en) * 2003-07-02 2005-05-12 Lockheed Martin Corporation Self-optimizing classifier
CN102103691A (zh) * 2011-03-14 2011-06-22 南京邮电大学 一种基于主成分分析人脸的识别方法
CN103390154A (zh) * 2013-07-31 2013-11-13 中国人民解放军国防科学技术大学 基于进化多特征提取的人脸识别方法
CN106067066A (zh) * 2016-05-31 2016-11-02 西安工程大学 基于遗传算法优化装袋算法的电力变压器故障诊断方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050100209A1 (en) * 2003-07-02 2005-05-12 Lockheed Martin Corporation Self-optimizing classifier
CN102103691A (zh) * 2011-03-14 2011-06-22 南京邮电大学 一种基于主成分分析人脸的识别方法
CN103390154A (zh) * 2013-07-31 2013-11-13 中国人民解放军国防科学技术大学 基于进化多特征提取的人脸识别方法
CN106067066A (zh) * 2016-05-31 2016-11-02 西安工程大学 基于遗传算法优化装袋算法的电力变压器故障诊断方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
M.S.BARTLETT: "Face Recognition by Independent Component Analysis", 《IEEE》 *
武军: "遗传算法在PCA人脸识别算法中的应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109948680A (zh) * 2019-03-11 2019-06-28 合肥工业大学 病历数据的分类方法及系统
CN109948680B (zh) * 2019-03-11 2021-06-11 合肥工业大学 病历数据的分类方法及系统
CN110688983A (zh) * 2019-08-22 2020-01-14 中国矿业大学 基于多模态优化和集成学习的微震信号识别方法
CN110929644A (zh) * 2019-11-22 2020-03-27 南京甄视智能科技有限公司 基于启发式算法的多模型融合人脸识别方法、装置、计算机系统与可读介质
CN110929644B (zh) * 2019-11-22 2020-06-26 南京甄视智能科技有限公司 基于启发式算法的多模型融合人脸识别方法、装置、计算机系统与可读介质
CN113657178A (zh) * 2021-07-22 2021-11-16 浙江大华技术股份有限公司 人脸识别方法、电子设备和计算机可读存储介质
CN114415751A (zh) * 2021-11-25 2022-04-29 内蒙古大唐国际托克托发电有限责任公司 一种用于火电机组的主、再热汽温优化系统及方法

Similar Documents

Publication Publication Date Title
CN107016377A (zh) 基于sgasen算法的人脸识别优化方法
CN113378632B (zh) 一种基于伪标签优化的无监督域适应行人重识别方法
Cruz et al. META-DES: A dynamic ensemble selection framework using meta-learning
Opelt et al. Incremental learning of object detectors using a visual shape alphabet
KR20180120061A (ko) 인공 신경망 모델 학습 방법 및 딥 러닝 시스템
CN108846259A (zh) 一种基于聚类和随机森林算法的基因分类方法及系统
CN107590506A (zh) 一种基于特征处理的复杂设备故障诊断方法
CN102436589B (zh) 一种基于多类基元自主学习的复杂目标自动识别方法
CN104392253B (zh) 一种草图数据集的交互式类别标注方法
CN111553127A (zh) 一种多标记的文本类数据特征选择方法及装置
Kumar et al. A benchmark to select data mining based classification algorithms for business intelligence and decision support systems
CN107273818B (zh) 遗传算法融合差分进化的选择性集成人脸识别方法
CN109165672A (zh) 一种基于渐进式学习的集成分类方法
CN109492589A (zh) 通过二进制特征与联合层叠结构融合的人脸识别工作方法以及智能芯片
CN111611877A (zh) 基于多时空信息融合的抗年龄干扰的人脸识别方法
CN103258147A (zh) 一种基于gpu的并行演化超网络dna微阵列基因数据分类系统及方法
CN108877947A (zh) 基于迭代均值聚类的深度样本学习方法
Gyamerah et al. On stock market movement prediction via stacking ensemble learning method
Behnke et al. Competitive neural trees for pattern classification
Calaña et al. Prototype selection for dissimilarity representation by a genetic algorithm
Bama et al. Efficient classification using average weighted pattern score with attribute rank based feature selection
Wei et al. A flight maneuver recognition method based on multi-strategy affine canonical time warping
CN115310491A (zh) 一种基于深度学习的类不平衡磁共振全脑数据分类方法
CN111402953B (zh) 基于层次注意力网络的蛋白质序列分类方法
Manokhin Machine learning for probabilistic prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170804

RJ01 Rejection of invention patent application after publication