CN107766868A - 一种分类器训练方法及装置 - Google Patents
一种分类器训练方法及装置 Download PDFInfo
- Publication number
- CN107766868A CN107766868A CN201610670755.1A CN201610670755A CN107766868A CN 107766868 A CN107766868 A CN 107766868A CN 201610670755 A CN201610670755 A CN 201610670755A CN 107766868 A CN107766868 A CN 107766868A
- Authority
- CN
- China
- Prior art keywords
- sample
- training
- sub
- biological characteristic
- training sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
Abstract
本发明的实施例提供一种分类器训练方法及装置,涉及计算机技术领域,用以降低分类器训练过程的训练时间和计算时间。该方法包括:提取训练样本的生物特征训练集及对应的样本标签;将生物特征训练集划分为多个生物特征子训练集,每个生物特征子训练集中包含的生物特征数量相同;将每个生物特征子训练集作为分类器的输入特征,将对应的样本标签作为分类器的输出特征,分别对分类器进行训练,得到每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子;将每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种分类器训练方法及装置。
背景技术
目前,计算机在进行生物特征(例如,语音、指纹、人脸等)识别时,通常是基于直接提取的声纹特征参数以及浅层结构算法(例如、支持向量机(英文:Support VectorMachine,简称:SVM))得到的分类器对声纹进行分类的。例如,对语音进行识别时,可以直接提取的语音特征参数(例如,短时能量、共振峰以及基音频率等能够表征说话人情绪的韵律特征以及音质特征的特征参数)以及浅层结构算法得到的分类器对语音进行分类的。
但是,由于现有的SVM分类器的训练方法所需的训练样本规模巨大,且是基于单个特征空间的单核函数来对训练样本的生物特征进行处理计算的,从而导致分类器的训练过程需要大量的计算量,增加了计算时间和训练时间。
发明内容
本发明的实施例提供一种分类器训练方法及装置,用以降低分类器训练过程的训练时间和计算时间。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,提供一种分类器训练方法,包括:
提取训练样本的生物特征训练集及对应的样本标签;
将所述生物特征训练集划分为多个生物特征子训练集,每个生物特征子训练集中包含的生物特征数量相同;
将每个生物特征子训练集作为分类器的输入特征,将对应的样本标签作为所述分类器的输出特征,分别对所述分类器进行训练,得到每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子;
将所述每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器。
可选的,所述训练样本包括正训练样本和负训练样本;所述正训练样本对应正样本标签,为目标用户注册时所提取的声纹样本或所述目标用户进行声纹认证后认证成功的声纹样本;所述负训练样本对应负样本标签,为其它用户对应的声纹样本或所述目标用户进行声纹认证后认证失败的声纹样本。
可选的,所述将所述训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器之前,所述方法还包括:
根据所述训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子,从所述训练样本中筛选出目标训练样本,所述目标训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子均小于预定阈值;
所述将所述训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器具体包括:将所述目标训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器。
可选的,所述提取训练样本的生物特征训练集及对应的样本标签之前,所述方法还包括:对所述训练样本进行筛选;
其中,对所述训练样本的筛选过程具体包括如下步骤:
确定所述训练样本中的每个正训练样本与其他正训练样本间的第一相似度以及所述训练样本中的每个负训练样本与其他负训练样本间的第二相似度;
根据所述正训练样本间的第一相似度以及所述负训练样本间的第二相似度,确定出目标正训练样本集合和目标负训练样本集合。
可选的,所述将所述每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合具体包括:
将所述每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子加权求平均,得到融合后的拉格朗日乘子向量。
可选的,所述基于融合后的拉格朗日乘子向量得到训练后的分类器之后,所述方法还包括:
获取待识别样本的生物特征;
将所述待识别样本的生物特征输入所述训练后的分类器进行对比验证,判定所述待识别样本是否为目标用户的声纹样本;
其中,若所述待识别样本的样本标签为正样本标签,则判定认证成功,确定所述待识别样本为目标用户的声纹样本;
若所述待识别样本的样本标签为负样本标签,则判定认证失败,确定所述待识别样本为非目标用户的声纹样本。
第二方面,提供一种分类器训练装置,包括:
提取模块,用于提取训练样本的生物特征训练集及对应的样本标签;
划分模块,用于将所述提取模块提取的所述生物特征训练集划分为多个生物特征子训练集,每个生物特征子训练集中包含的生物特征数量相同;
训练模块,用于将所述划分模块划分出的每个生物特征子训练集作为分类器的输入特征,将对应的样本标签作为所述分类器的输出特征,分别对所述分类器进行训练,得到每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子;
融合模块,用于将所述训练模块对所述训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器。
可选的,所述训练样本包括正训练样本和负训练样本;所述正训练样本对应正样本标签,为目标用户注册时所提取的声纹样本或所述目标用户进行声纹认证后认证成功的声纹样本;所述负训练样本对应负样本标签,为其它用户对应的声纹样本或所述目标用户进行声纹认证后认证失败的声纹样本。
可选的,所述装置,还包括:
筛选模块,用于根据所述训练模块对所述训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子,从所述训练样本中筛选出目标训练样本,所述目标训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子均小于预定阈值;
所述融合模块具体用于:将所述训练模块对所述目标训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器。
可选的,所述装置,还包括:筛选模块,用于对所述训练样本进行筛选;
其中,对所述训练样本进行筛选的筛选过程具体包括如下步骤:
确定所述训练样本中的每个正训练样本与其他正训练样本间的第一相似度以及所述训练样本中的每个负训练样本与其他负训练样本间的第二相似度;
根据所述正训练样本间的第一相似度以及所述负训练样本间的第二相似度,确定出目标正训练样本集合和目标负训练样本集合。
可选的,所述融合模块具体用于:
将所述每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子加权求平均,得到融合后的拉格朗日乘子向量。
可选的,所述装置还包括:
所述获取模块还用于获取待识别样本的生物特征;
判定模块,用于将所述获取模块获取的所述待识别样本的生物特征输入所述训练后的分类器进行对比验证,判定所述待识别样本是否为目标用户的声纹样本;
其中,若所述判定模块判定所述待识别样本的样本标签为正样本标签,则判定认证成功,确定所述待识别样本为目标用户的声纹样本;
若所述判定模块判定所述待识别样本的样本标签为负样本标签,则判定认证失败,确定所述待识别样本为非目标用户的声纹样本。
本发明提供的分类器训练方法及装置,通过提取训练样本的生物特征训练集及对应的样本标签,然后将训练样本的生物特征训练集划分为多个生物特征子训练集,并将每个生物特征子训练集作为分类器的输入特征,将对应的样本标签作为该分类器的输出特征,分别对分类器进行训练,得到每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子,最后,将每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器。这样通过采用多组分类器并行训练的方式得到多个子分类器模型,然后对多个子分类器模型进行融合,这样不仅降低了分类器训练过程的训练时间和计算时间,同时还可得到统一的分类器模型,提高了分类器训练的时效性以及声纹识别的识别精度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种分类器训练方法的方法流程图;
图2为本发明实施例提供的一种用户声纹特征认证流程的流程示意图;
图3为本发明实施例提供的一种分类器训练装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的分类器训练方法的执行主体可以为分类器训练装置,或者用于执行上述分类器训练方法的电子设备。具体的,该电子设备可以为智能电视、智能手机、平板电脑、笔记本电脑、超级移动个人计算机(英文:Ultra-mobile Personal Computer,简称:UMPC)、上网本、个人数字助理(英文:Personal Digital Assistant,简称:PDA)等终端设备。其中,分类器训练装置可以为上述电子设备中的中央处理器(英文:CentralProcessing Unit,简称CPU)或者可以为上述电子设备的中的控制单元或者功能模块。
本发明实施例中的训练样本可以为语音样本、指纹样本、人脸图像样本等等声纹样本。为了方便说明下文中均以“声纹样本是语音样本”来进行阐述,并且具体以为“对语音样本进行声纹认证”为例进行说明。需要说明的是,本领域技术人员应当清楚,下文中所提及的“语音”可以替换为指纹、人脸图像等其他任一种声纹信息。
为了便于清楚描述本发明实施例的技术方案,在本发明的实施例中,采用了“第一”、“第二”等字样对功能或作用基本相同的相同项或相似项进行区分,本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
下面将结合本发明实施例的说明书附图,对本发明实施例提供的技术方案进行说明。显然,所描述的是本发明的一部分实施例,而不是全部的实施例。需要说明的是,下文所提供的任意多个技术方案中的部分或全部技术特征在不冲突的情况下,可以结合使用,形成新的技术方案。
本发明的实施例提供一种分类器训练方法,如图1所示,该方法包括如下步骤:
101、提取训练样本的生物特征训练集及对应的样本标签。
示例性的,若使用本发明实施例所提供的分类器训练方法所训练出的分类器进行声纹认证或声纹识别时,则本发明实施例中的训练样本包括正训练样本(即认证结果接受)和负训练样本(即认证结果拒绝)。其中,上述的正训练样本对应正样本标签(值为1),为目标用户注册时所提取的声纹样本或目标用户在声纹认证后认证成功的声纹样本。上述的负训练样本对应负样本标签(值为-1),为其它用户对应的声纹样本或目标用户在声纹认证后认证失败的声纹样本。需要说明的是,上述样本标签值1或-1仅仅是一种示例,实际使用中,可以按照需求进行设定,在此并不做限定。
示例性的,以语音样本为例,电子设备在将用户录入的语音样本进行预处理后,便可利用特定语言信号特征提取方法得到语音特征向量,例如:提取短时能量、持续时间、短时过零率、共振峰、基音频率、线性预测倒谱系数(英文:Linear Prediction CepstrumCoefficient,简称:LPCC)、Mel频率倒谱系数(英文:Mel Frequency CepstrumCoefficient,,简称MFCC)(是一种基于频谱的语音特征向量)、Mel频带能量及其衍生参数中的至少两个作为语音特征向量。而以指纹样本为例,电子设备在将用户录入的指纹样本进行预处理后,通过电子设备的指纹录入传感器提取用户指纹的纹理交叉点的坐标、交叉点的个数等;而就人脸样本为例,电子设备可通过电子设备摄像头可拍摄用户的正面人脸头像图片,通过特点算法提取出用户人脸特点,如SIFT(英文:Scale-invariant featuretransform)特征算子等特征。
102、将生物特征训练集划分为多个生物特征子训练集,每个生物特征子训练集中包含的生物特征数量相同。
示例性的,假设用户注册的训练样本的生物特征集合为Strain={<x1,y1>,<x2,y2>,……,<xm,ym>},例如,<xi,yi>,xi为生物特征训练集,yi为对应的样本标签(若该样本标签包括正样本标签和负样本标签,则正样本标签可以用1来表示,负样本标签可以用-1来表示)。电子设备可以将该生物特征训练样本集合Strain分为o个生物特征子训练集,每个生物特征子训练集中包含k个生物特征,具体的得到如下o个生物特征子训练集S:
S1={<x1,y1>,<x2,y2>,……,<xk,yk>};
S2={<xk+1,yk+1>,<xk+2,yk+2>,……,<x2k,y2k>};
S3={<x2k+1,y2k+1>,<x2k+2,y2k+2>,……,<x3k,y3k>};
……
So={<x(o-1)k+1,y(o-1)k+1>,<x(o-1)k+2,y(o-1)k+2>,……,<xok,yok>}。
103、将每个生物特征子训练集作为分类器的输入特征,将对应的样本标签作为分类器的输出特征,分别对分类器进行训练,得到每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子。
本发明实施例中的分类器可以为SVM分类器或受限玻尔兹曼机(英文:RestrictedBoltzmann Machine,简称:RBM)分类器。其中,SVM分类器为二值分类器,而二值分类器的原理是设法找到一个“边界”,该边界可以将正样本与负样本之间的距离最大化,达到分类目的。此外,SVM分类器适用多核融合分类器训练,而基于核分类器的原理是预测某一个输入测试向量值的正负归属问题(等同于身份认证通过或不通过),具体的可以通过下述公式来说明原理:
其中,上述公式中的xi=1Ln为训练样本,Si=1Ln为训练样本的生物特征向量xi所对应的样本标签,λi=1Ln为训练样本权值,而K(xi,x)为核函数。
具体针对SVM分类器,上述的核分类器的原理表达式可以改进为:
其中,上述公式中的yi为样本标签,αi为拉格朗日乘子的最优解。
示例性的,电子设备将这些生物特征子训练集分别进行SVM分类器训练,从而构建多个子分类器训练任务,得到每个生物特征子训练集训练后得到的子分类器模型对应的最优拉格朗日乘子向量,即将每个生物特征子训练集代入上述公式二中,得到每个子分类器模型对应的最优拉格朗日乘子向量,具体的可参照下述过程:
其中为一组最优解;
……
其中为一组最优解。
需要说明的是,步骤103中各个生物特征子训练集的训练过程可以由云环境下不同虚拟机或分布式系统同步并行来实现,从而提升分类器训练效率。
104、将每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器。
具体的,电子设备在获取到各生物特征子训练集训练出的子分类器模型对应的拉格朗日最佳乘子组成的拉格朗日最佳乘子向量后,可以将该拉格朗日最佳乘子向量中的各项值加权求平均,从而得到融合后的拉格朗日乘子向量,具体如下所示:
上述公式三表述的意思为:共o组子训练集,得到O组对应的拉格朗日算子向量,然后将这O组向量里各组对应的值(第1,2,3,….第k个)进行加权平均,从而得到一个新的最佳拉格朗日算子向量optmial.O系子训练集组数,k系每个训练集训练出的拉格朗日算子向量中的元素个数。
进一步的,以SVM分类器为例,当得到融合后的最佳拉格朗日乘子向量后,代入公式二中,得到下述公式四:
其中自此,得到SVM分类器统一模型,可用于认证过程中用户声纹身份认证环节进行身份比对。上述公式四(SVM分类器统一模型)还可进行身份比对,自此训练流程即可结束。
本发明提供的分类器训练方法,通过提取训练样本的生物特征训练集及对应的样本标签,然后将训练样本的生物特征训练集划分为多个生物特征子训练集,并将每个生物特征子训练集作为分类器的输入特征,将对应的样本标签作为该分类器的输出特征,分别对分类器进行训练,得到每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子,最后,将每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器。这样通过采用多组分类器并行训练的方式得到多个子分类器模型,然后对多个子分类器模型进行融合,这样不仅降低了分类器训练过程的训练时间和计算时间,同时还可得到统一的分类器模型,提高了分类器训练的时效性以及声纹识别的识别精度。
进一步的,为了进一步提升训练出的分类器的分类性能和声纹认证的精度,还可以进一步先新的训练样本或对原训练样本进行筛选,以实现对训练出的分类器的分类性能和声纹认证的精度得到进一步的提高。即找出标准的正(认证成功)、负(认证失败)的样本作为标杆,然后通过相似性度量进行快速匹配,并通过预先设定相似度阈值,但凡在阈值内的正负样本,可以收集起来,形成若干组训练样本,然后重复之前分组训练的操作,得到新的融合后的拉格朗日乘子,从而得到对应的新的更能体现该用户特点的分类器模型。
可以通过两种实现方式来进行。
具体的,第一种实现方式:
在步骤104之前,还包括如下步骤:
A1、根据训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子,从训练样本中筛选出目标训练样本,该目标训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子均小于预定阈值。
基于上述的步骤A1,步骤104具体包括:将该目标训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器。
示例性的,从原训练样本中筛选出SVM的最优超平面附近的样本,即从原训练样本中筛选出:所有拉格朗日乘子α的分量值满足0<αi≤c,i=1,……,k的样本(xi,yi),此处c为阈值。其中,该阈值C为为一个小于正负两超平面的距离的一个物理值,即可以通过下述公式来确定阈值c:
但是,由于上述公式六中φ(g)是xi映射到Hilbert空间的变换值,很难确定。因此又要引入核函数来进行处理计算,需要大量的计算量,增加计算时间。
为降低训练时间,并避免所筛选出来的最优支持向量过多且需要庞杂的计算能力筛选出最终训练向量的状况出现,可以采取以下方式来化简筛选出适当数量的最优支持向量样本训练SVM,以提高效率。
即第二种实现方式为:
在步骤104之后,还包括如下步骤来对训练样本进行初步筛选:
B1、确定所述训练样本中的每个正训练样本与其他正训练样本间的第一相似度以及所述训练样本中的每个负训练样本与其他负训练样本间的第二相似度。
其中,步骤B1中的训练样本可以为步骤101中获取的训练样本,也可以是装置重新获取的更为标准的正(认证成功)、负(认证失败)的样本,这里不做限定。例如,下述的(xi,yi)集合。
B2、根据所述正训练样本间的第一相似度以及所述负训练样本间的第二相似度,确定出目标正训练样本集合和目标负训练样本集合。
示例性的,针对本步筛选出的(xi,yi)集合中随机抽取若干个正样本(xi_positive,1)、负样本(xi_negative,-1)(后台认证服务器可选取他人样本作为负样本),其余正样本集合为(xi_rest_positive,1)负样本(xi_rest_negative,-1)。在剩余的正样本(xi_rest_positive,1)、负样本(xi_rest_negative,-1)中寻找与随机抽取正负样本相似的正负样本。
具体的,若步骤B1中的相似度计算方法以Spearman相关系数计算方法为例时,可以通过下述公式来计算两样本间的相似度:
任意抽取的正样本xi_positive与xi_rest_positive剩余正样本进行相似度对比公式如下:
其中ρ为Spearman相关系数,xi_positve'为元素按照升序排列的抽取正样本,xi_rest_positve'为元素按照升序排列的抽取剩余正样本,n为特征向量中元素的个数。其中相关系数的值ρ∈[-1,1]。若将两特征向量中的元素按照升序排列,ρ值为正值,取值范围为[0,1];反之,若降序排列,则ρ取值范围为[-1,0]。
同理,负样本相似度计算公式如下:
需要说明的是,Spearman是一种统计任意两向量相关性的度量,通过将两向量中的元素按照升序或降序排列(例如,以升序排列为例,即把样本向量里的元素,按照值的大小,从小到大,重新排列,得到一个新的向量),该系数可以检验两向量之间的相关性大小。一般的,若计算出的Spearman的值越接近于0,说明两匹配分数之间的相关性越小;反之,系数接近于1,两者之间的相关性越大。一般的,通常采用升序排列计算Spearman相关系数。
利用以上相似性度量,将抽取的正样本(xi_positive,1)与负样本(xi_negative,-1)依次与剩余的正样本集合(xi_rest_positive,1)、负样本集合(xi_rest_negative,-1)进行依次比对,从而得到与抽取样本最为相似、相近的样本(xi_near,1)与(xi_near,-1)若干。将抽取样本(xi_positive,1)、(xi_negative,-1)与以上近似样本(xi_near,1)、(xi_near,-1)构成新的训练向量,从而训练出更优SVM统一分类模型,用于卡认证环节过程中的用户声纹认证。
进一步的,在训练出分类器后,该电子设备便可通过如下步骤实现声纹认证或识别过程,具体包括如下步骤:
105a、获取待识别样本的生物特征。
105b、将待识别样本的生物特征输入该训练后的分类器进行对比验证,判定该待识别样本是否为目标用户的声纹样本。
示例性的,若该待识别样本的样本标签为正样本标签,则判定认证成功,确定该待识别样本为目标用户的声纹样本;若该待识别样本的样本标签为负样本标签,则判定认证失败,确定该待识别样本为非目标用户的声纹样本。
示例性的,参照如图2所示的用户声纹特征认证流程的流程示意图,基于本发明提供的分类器训练方法所训练的分类器还可应用在声纹识别和声纹认证应用中。例如,当用户利用卡认证应用进行高安全级别第三方网站登录时,用户输入手机号后,后台统一认证服务器发送数据短信指令至用户终端、卡应用,卡应用进行解析后,然后提示用户点击确认后,调用用户终端上预装的声纹识别应用,提示用户输入声纹样本,并利用本发明所提供的分类器训练方法在用户注册阶段训练出该用户对应的统一分类模型,供认证阶段实现精准的身份比对,确认用户身份真伪,从而实现高安全级别的网站登录流程,避免他人恶意仿冒身份盗登情况的出现。
而图2对应的用户声纹特征认证流程包括:注册流程与用户授权流程,具体的,以语音信息为例。
1)注册流程
第一步,用户登录SIM卡认证服务门户激活“SIM卡认证登录”服务,该认证服务门户搭载于认证服务器;
第二步,认证服务门户接收激活请求后,后台无感知推送SIM卡应用至用户终端SIM卡内;同时,门户提示用户点击下载声纹认证应用程序(例如,APP);
第三步,SIM卡接收数据短信,并编译、装载卡应用;
第四步,启动声纹认证应用程序,该声纹认证应用程序弹出窗口,提示用户录入语音信息(如,用户根据页面提示念5-8秒文字)进行注册。
第五步,用户录入语音信息后,注册过程完成。后台统一认证服务器将处理原始录入的语音信息,提取对应的语音特征向量,并启动图1对应的分类器训练方法为用户训练统一分类器模型。而该统一分类器模型可参照上述步骤101-104的过程,此处不再赘述。
2)认证流程
第一步,用户在高安全级别网站首页点击“SIM卡认证登录”键,选择SIM卡应用方式登录该网站,并输入手机号作为唯一身份认证标识;
第二步,该高安全级别网站接受登录请求,并将用户手机号以及登录信息发送至认证服务器进行验证;
第三步,认证服务器接收高安全级别网站请求后,将身份验证请求发送至提供的手机号对应的移动终端SIM卡应用内;
第四步,卡应用接收请求后发送调用终端UI手机弹窗的指令,指示用户确认登录的指令;
第五步,移动终端接收卡应用指令后,弹出“是否登录该网站”的窗口,让用户点击确认。
第六步,用户点击移动终端上弹窗确认登录。
第七步,卡应用调用声纹认证应用程序弹出窗口,提示用户录入语音信息;
第八步,用户根据提示录入语音信息。
第九步,认证服务器接收到用户话语信息提取语音特征,并进行分类器比对验证。
第十步,认证服务器将认证结果发送至高安全级别网站,该网站显示登录成功或登录失败结果。认证成功的话语样本,可作为新的正训练样本,认证失败的语音样本,可以作为新的负训练样本,用于声纹SVM分类器的进一步训练,由认证服务器自动留存,以提高分类性能。
本发明的实施例提供一种分类器训练装置,如图3所示,该装置3包括:提取模块31、划分模块32、训练模块33、融合模块34,其中:
提取模块31,用于提取训练样本的生物特征训练集及对应的样本标签。
划分模块32,用于将提取模块31提取的所述生物特征训练集划分为多个生物特征子训练集,每个生物特征子训练集中包含的生物特征数量相同。
训练模块33,用于将划分模块32划分出的每个生物特征子训练集作为分类器的输入特征,将对应的样本标签作为所述分类器的输出特征,分别对分类器进行训练,得到每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子。
融合模块34,用于将训练模块33对训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器。
可选的,训练样本包括正训练样本和负训练样本,该正训练样本对应正样本标签,为目标用户注册时所提取的声纹样本或目标用户在声纹认证后认证成功的声纹样本时,该负训练样本对应负样本标签,为其它用户对应的声纹样本或所述目标用户在声纹认证后认证失败的声纹样本。
可选的,装置3,还包括:筛选模块35,其中:
筛选模块35,用于根据训练模块33对训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子,从训练样本中筛选出目标训练样本,该目标训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子均小于预定阈值。
融合模块34具体用于:将训练模块33对目标训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器。
可选的,筛选模块35对该训练样本进行筛选的筛选过程具体包括如下步骤:
确定训练样本中的每个正训练样本与其他正训练样本间的第一相似度以及训练样本中的每个负训练样本与其他负训练样本间的第二相似度;
根据正训练样本间的第一相似度以及负训练样本间的第二相似度,确定出目标正训练样本集合和目标负训练样本集合。
可选的,融合模块34具体用于:
将每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子加权求平均,得到融合后的拉格朗日乘子向量。
可选的,装置1还包括:获取模块36、判定模块37,其中:
获取模块36还用于获取待识别样本的生物特征。
判定模块37,用于将获取模块36获取的待识别样本的生物特征输入该训练后的分类器进行对比验证,判定所述待识别样本是否为目标用户的声纹样本。
其中,若该判定模块37判定待识别样本的样本标签为正样本标签,则判定认证成功,确定待识别样本为目标用户的声纹样本;
若判定模块37判定待识别样本的样本标签为负样本标签,则判定认证失败,确定待识别样本为非目标用户的声纹样本。
上述分类器训练装置所执行的动作所对应的程序均可以以软件形式存储于节点设备的存储器中,以便于处理器调用执行以上各个模块对应的操作。
需要说明的是,上文所提供的分类器训练装置或该装置中的处理器可以是一个处理器,也可以是多个处理元件的统称。例如,处理器可以为中央处理器(centralprocessing unit,CPU;也可以为其他通用处理器、数字信号处理器(digital signalprocessing,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等;还可以为专用处理器,该专用处理器可以包括基带处理芯片、射频处理芯片等中的至少一个。进一步地,该专用处理器还可以包括具有该处理器所在的设备(例如网络设备或终端设备)中其他专用处理功能的芯片。
上文所提供的分类器训练装置中的存储器可以包括易失性存储器(volatilememory),例如随机存取存储器(random-access memory,RAM);也可以包括非易失性存储器(non-volatile memory),例如只读存储器(read-only memory,ROM),快闪存储器(flashmemory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);还可以包括上述种类的存储器的组合。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理包括,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (12)
1.一种分类器训练方法,其特征在于,包括:
提取训练样本的生物特征训练集及对应的样本标签;
将所述生物特征训练集划分为多个生物特征子训练集,每个生物特征子训练集中包含的生物特征数量相同;
将每个生物特征子训练集作为分类器的输入特征,将对应的样本标签作为所述分类器的输出特征,分别对所述分类器进行训练,得到每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子;
将所述训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器。
2.根据权利要求1所述的方法,其特征在于,所述训练样本包括正训练样本和负训练样本;所述正训练样本对应正样本标签,为目标用户注册时所提取的声纹样本或所述目标用户进行声纹认证后认证成功的声纹样本;所述负训练样本对应负样本标签,为其它用户对应的声纹样本或所述目标用户进行声纹认证后认证失败的声纹样本。
3.根据权利要求1所述的方法,其特征在于,所述将所述训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器之前,所述方法还包括:
根据所述训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子,从所述训练样本中筛选出目标训练样本,所述目标训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子均小于预定阈值;
所述将所述训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器具体包括:将所述目标训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器。
4.根据权利要求1所述的方法,其特征在于,所述提取训练样本的生物特征训练集及对应的样本标签之前,所述方法还包括:对所述训练样本进行筛选;
其中,对所述训练样本的筛选过程具体包括如下步骤:
确定所述训练样本中的每个正训练样本与其他正训练样本间的第一相似度以及所述训练样本中的每个负训练样本与其他负训练样本间的第二相似度;
根据所述正训练样本间的第一相似度以及所述负训练样本间的第二相似度,确定出目标正训练样本集合和目标负训练样本集合。
5.根据权利要求1所述的方法,其特征在于,所述将所述每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合具体包括:
将所述每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子加权求平均,得到融合后的拉格朗日乘子向量。
6.根据权利要求2所述的方法,其特征在于,所述基于融合后的拉格朗日乘子向量得到训练后的分类器之后,所述方法还包括:
获取待识别样本的生物特征;
将所述待识别样本的生物特征输入所述训练后的分类器进行对比验证,判定所述待识别样本是否为目标用户的声纹样本;
其中,若所述待识别样本的样本标签为正样本标签,则判定认证成功,确定所述待识别样本为目标用户的声纹样本;
若所述待识别样本的样本标签为负样本标签,则判定认证失败,确定所述待识别样本为非目标用户的声纹样本。
7.一种分类器训练装置,其特征在于,包括:
提取模块,用于提取训练样本的生物特征训练集及对应的样本标签;
划分模块,用于将所述提取模块提取的所述生物特征训练集划分为多个生物特征子训练集,每个生物特征子训练集中包含的生物特征数量相同;
训练模块,用于将所述划分模块划分出的每个生物特征子训练集作为分类器的输入特征,将对应的样本标签作为所述分类器的输出特征,分别对所述分类器进行训练,得到每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子;
融合模块,用于将所述训练模块对所述训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器。
8.根据权利要求7所述的装置,其特征在于,所述训练样本包括正训练样本和负训练样本;所述正训练样本对应正样本标签,为目标用户注册时所提取的声纹样本或所述目标用户进行声纹认证后认证成功的声纹样本;所述负训练样本对应负样本标签,为其它用户对应的声纹样本或所述目标用户进行声纹认证后认证失败的声纹样本。
9.根据权利要求7所述的装置,其特征在于,所述装置,还包括:
筛选模块,用于根据所述训练模块对所述训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子,从所述训练样本中筛选出目标训练样本,所述目标训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子均小于预定阈值;
所述融合模块具体用于:将所述训练模块对所述目标训练样本的每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子进行融合,并基于融合后的拉格朗日乘子向量得到训练后的分类器。
10.根据权利要求7所述的装置,其特征在于,所述装置,还包括:筛选模块,用于对所述训练样本进行筛选;
其中,对所述训练样本进行筛选的筛选过程具体包括如下步骤:
确定所述训练样本中的每个正训练样本与其他正训练样本间的第一相似度以及所述训练样本中的每个负训练样本与其他负训练样本间的第二相似度;
根据所述正训练样本间的第一相似度以及所述负训练样本间的第二相似度,确定出目标正训练样本集合和目标负训练样本集合。
11.根据权利要求7所述的装置,其特征在于,所述融合模块具体用于:
将所述每个生物特征子训练集训练出的子分类器模型对应的拉格朗日乘子加权求平均,得到融合后的拉格朗日乘子向量。
12.根据权利要求8所述的装置,其特征在于,所述装置还包括:
所述获取模块还用于获取待识别样本的生物特征;
判定模块,用于将所述获取模块获取的所述待识别样本的生物特征输入所述训练后的分类器进行对比验证,判定所述待识别样本是否为目标用户的声纹样本;
其中,若所述判定模块判定所述待识别样本的样本标签为正样本标签,则判定认证成功,确定所述待识别样本为目标用户的声纹样本;
若所述判定模块判定所述待识别样本的样本标签为负样本标签,则判定认证失败,确定所述待识别样本为非目标用户的声纹样本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610670755.1A CN107766868A (zh) | 2016-08-15 | 2016-08-15 | 一种分类器训练方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610670755.1A CN107766868A (zh) | 2016-08-15 | 2016-08-15 | 一种分类器训练方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107766868A true CN107766868A (zh) | 2018-03-06 |
Family
ID=61259857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610670755.1A Pending CN107766868A (zh) | 2016-08-15 | 2016-08-15 | 一种分类器训练方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107766868A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108805091A (zh) * | 2018-06-15 | 2018-11-13 | 北京字节跳动网络技术有限公司 | 用于生成模型的方法和装置 |
CN109304306A (zh) * | 2018-09-19 | 2019-02-05 | 广东省智能制造研究所 | 生产线物体分拣方法、系统和物体分拣系统 |
CN109343951A (zh) * | 2018-08-15 | 2019-02-15 | 南京邮电大学 | 移动计算资源分配方法、计算机可读存储介质和终端 |
CN109358962A (zh) * | 2018-08-15 | 2019-02-19 | 南京邮电大学 | 移动计算资源自主分配装置 |
CN110308796A (zh) * | 2019-07-08 | 2019-10-08 | 合肥工业大学 | 一种基于腕部pvdf传感器阵列的手指运动识别方法 |
CN110610066A (zh) * | 2018-06-15 | 2019-12-24 | 武汉安天信息技术有限责任公司 | 仿冒应用检测方法和相关装置 |
CN111950644A (zh) * | 2020-08-18 | 2020-11-17 | 东软睿驰汽车技术(沈阳)有限公司 | 模型的训练样本选择方法、装置及计算机设备 |
CN115331673A (zh) * | 2022-10-14 | 2022-11-11 | 北京师范大学 | 一种复杂声音场景下的声纹识别家电控制方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101158873A (zh) * | 2007-09-26 | 2008-04-09 | 东北大学 | 一种非线性过程故障诊断方法 |
US20120093397A1 (en) * | 2010-09-20 | 2012-04-19 | Siemens Aktiengesellschaft | Method and System for Learning Based Object Detection in Medical Images |
CN103886330A (zh) * | 2014-03-27 | 2014-06-25 | 西安电子科技大学 | 基于半监督svm集成学习的分类方法 |
CN105718956A (zh) * | 2016-01-26 | 2016-06-29 | 上海经达信息科技股份有限公司 | 基于支持向量机的超载判断方法 |
CN105787419A (zh) * | 2014-12-23 | 2016-07-20 | 阿里巴巴集团控股有限公司 | 手掌图像的手掌检测方法及系统 |
-
2016
- 2016-08-15 CN CN201610670755.1A patent/CN107766868A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101158873A (zh) * | 2007-09-26 | 2008-04-09 | 东北大学 | 一种非线性过程故障诊断方法 |
US20120093397A1 (en) * | 2010-09-20 | 2012-04-19 | Siemens Aktiengesellschaft | Method and System for Learning Based Object Detection in Medical Images |
CN103886330A (zh) * | 2014-03-27 | 2014-06-25 | 西安电子科技大学 | 基于半监督svm集成学习的分类方法 |
CN105787419A (zh) * | 2014-12-23 | 2016-07-20 | 阿里巴巴集团控股有限公司 | 手掌图像的手掌检测方法及系统 |
CN105718956A (zh) * | 2016-01-26 | 2016-06-29 | 上海经达信息科技股份有限公司 | 基于支持向量机的超载判断方法 |
Non-Patent Citations (1)
Title |
---|
赵喆,向阳,王继生: "基于并行计算的文本分类技术", 《计算机应用》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108805091A (zh) * | 2018-06-15 | 2018-11-13 | 北京字节跳动网络技术有限公司 | 用于生成模型的方法和装置 |
CN110610066A (zh) * | 2018-06-15 | 2019-12-24 | 武汉安天信息技术有限责任公司 | 仿冒应用检测方法和相关装置 |
CN109343951A (zh) * | 2018-08-15 | 2019-02-15 | 南京邮电大学 | 移动计算资源分配方法、计算机可读存储介质和终端 |
CN109358962A (zh) * | 2018-08-15 | 2019-02-19 | 南京邮电大学 | 移动计算资源自主分配装置 |
CN109358962B (zh) * | 2018-08-15 | 2022-02-11 | 南京邮电大学 | 移动计算资源自主分配装置 |
CN109343951B (zh) * | 2018-08-15 | 2022-02-11 | 南京邮电大学 | 移动计算资源分配方法、计算机可读存储介质和终端 |
CN109304306A (zh) * | 2018-09-19 | 2019-02-05 | 广东省智能制造研究所 | 生产线物体分拣方法、系统和物体分拣系统 |
CN109304306B (zh) * | 2018-09-19 | 2020-08-11 | 广东省智能制造研究所 | 生产线物体分拣方法、系统和物体分拣系统 |
CN110308796A (zh) * | 2019-07-08 | 2019-10-08 | 合肥工业大学 | 一种基于腕部pvdf传感器阵列的手指运动识别方法 |
CN111950644A (zh) * | 2020-08-18 | 2020-11-17 | 东软睿驰汽车技术(沈阳)有限公司 | 模型的训练样本选择方法、装置及计算机设备 |
CN111950644B (zh) * | 2020-08-18 | 2024-03-26 | 东软睿驰汽车技术(沈阳)有限公司 | 模型的训练样本选择方法、装置及计算机设备 |
CN115331673A (zh) * | 2022-10-14 | 2022-11-11 | 北京师范大学 | 一种复杂声音场景下的声纹识别家电控制方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107766868A (zh) | 一种分类器训练方法及装置 | |
WO2018166187A1 (zh) | 服务器、身份验证方法、系统及计算机可读存储介质 | |
EP2784710B1 (en) | Method and system for validating personalized account identifiers using biometric authentication and self-learning algorithms | |
CN110047490A (zh) | 声纹识别方法、装置、设备以及计算机可读存储介质 | |
CN110322317B (zh) | 一种交易数据处理方法、装置、电子设备及介质 | |
CN105069622A (zh) | 一种面向移动终端的人脸识别支付系统和方法 | |
US10909991B2 (en) | System for text-dependent speaker recognition and method thereof | |
CN110287311B (zh) | 文本分类方法及装置、存储介质、计算机设备 | |
CN102223367A (zh) | 移动用户访问网站的方法、设备及系统 | |
Tolosana et al. | Reducing the template ageing effect in on‐line signature biometrics | |
CN110704618B (zh) | 确定对话数据对应的标准问题的方法及装置 | |
CN110489747A (zh) | 一种图像处理方法、装置、存储介质及电子设备 | |
CN113177850A (zh) | 一种保险的多方身份认证的方法及装置 | |
Okokpujie et al. | Implementation of the enhanced fingerprint authentication in the ATM system using ATmega128 | |
CN113656761A (zh) | 基于生物识别技术的业务处理方法、装置和计算机设备 | |
US10970573B2 (en) | Method and system for free text keystroke biometric authentication | |
CN110149280B (zh) | 网络流量分类方法和装置 | |
CN105099700A (zh) | 一种认证方法、服务器及系统 | |
CN113191787A (zh) | 电信数据的处理方法、装置电子设备及存储介质 | |
CN113053395A (zh) | 发音纠错学习方法、装置、存储介质及电子设备 | |
CN112417412A (zh) | 一种银行账户余额查询方法、装置及系统 | |
CN111833068A (zh) | 基于声纹识别的身份核验系统及方法 | |
US11126705B2 (en) | Systems and methods for user authentication using word-gesture pairs | |
Mokgonyane et al. | Development of a text-independent speaker recognition system for biometric access control | |
US20200387587A1 (en) | Methods and systems for authenticating a user |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180306 |