CN102194455A - 一种与说话内容无关的声纹鉴别认证方法 - Google Patents

一种与说话内容无关的声纹鉴别认证方法 Download PDF

Info

Publication number
CN102194455A
CN102194455A CN2010101260493A CN201010126049A CN102194455A CN 102194455 A CN102194455 A CN 102194455A CN 2010101260493 A CN2010101260493 A CN 2010101260493A CN 201010126049 A CN201010126049 A CN 201010126049A CN 102194455 A CN102194455 A CN 102194455A
Authority
CN
China
Prior art keywords
vector sequence
sample
feature
model
vocal print
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010101260493A
Other languages
English (en)
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BOSHIJIN (BEIJING) INFORMATION TECHNOLOGY Co Ltd
Original Assignee
BOSHIJIN (BEIJING) INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BOSHIJIN (BEIJING) INFORMATION TECHNOLOGY Co Ltd filed Critical BOSHIJIN (BEIJING) INFORMATION TECHNOLOGY Co Ltd
Priority to CN2010101260493A priority Critical patent/CN102194455A/zh
Publication of CN102194455A publication Critical patent/CN102194455A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Collating Specific Patterns (AREA)

Abstract

本发明属于模式识别和身份认证技术领域,特别涉及通过人类声纹信息进行鉴别与认证的方法。本发明包括人类声纹信息的提取和处理,声纹特征信息的抗噪、抗信道干扰处理,个人声纹信息模型建立,个人声纹信息的检测与认证,声纹信息背景库建立及调整方法,似然得分投影方法。本发明具有鉴别认证准确率高、鉴别认证速度快、对声纹信号要求低等优点,可广泛应用于司法、公安、银行、国防等需要声纹鉴别、认证的部门和单位。

Description

一种与说话内容无关的声纹鉴别认证方法
技术领域
本发明为一种与说话内容无关的声纹鉴别认证方法,属于模式识别和身份认证技术领域。
背景技术
在已有的技术中,基于通用背景模型(Universal Background Model,以下简称UBM)的一种与说话内容无关的声纹鉴别认证(Voiceprint Identification Certification)方法,包括通用背景模型训练方法,样本声纹模型自适应方法,及检材声纹鉴别认证方法三个部分。
通用背景模型UBM训练方法:
(1)从大量说话人的声纹信号中提取出声纹特征,形成多个说话人的特征矢量序列;
(2)使用提取出的特征矢量序列训练出一个大型的、能够表征人类声纹信息的背景空间模型。方法是对所有说话人的声纹特征矢量采用某种聚类方法(如K-均值算法、EM算法)进行聚类,得到M个高斯分量,其中第m个高斯分布均值向量为μm,协方差矩阵为∑m,第m个高斯分布聚类中涵盖的特征矢量数目占总体特征矢量数目的百分比称为ωm,则通用背景模型可表征为:
UBM = { μ m ubm , Σ m ubm , ω m ubm | 1 ≤ m ≤ M } .
样本声纹模型自适应方法:
(1)从样本语音信号中提取出声纹信息特征,形成样本特征矢量序列;
(2)将通用背景模型UBM根据样本特征矢量序列,自适应调整成符合样本特性的样本模型,自适应方法可采用现有的自适应方法得到(如MAP自适应方法),最终形成的样本声纹模型为 
Figure GSA00000043963100012
其与通用背景模型的高斯分量具有一一对应关系。
检材声纹鉴别认证方法:
(1)从待鉴别认证的检材语音中提取声纹信息特征,形成待鉴别认证的声纹特征矢量序列;
(2)将检材的声纹特征矢量序列与样本声纹模型比较,得到一个匹配平均得分,再与背景模型比较,得到另一个匹配平均得分,最终将前者得分减去后者得分即得到最终得分结果,根据得分的高低给出鉴别认证结果。
缺点:(1)声纹信息特征并不完全符合高斯分布,与高斯模型不够吻合;(2)高斯模型各高斯分量间正交性差,区分性不够强;(3)缺少信道补偿能力,抗噪、抗信道干扰能力有限;(4)结果得分为似然比得分,难于被认证人员理解和掌握。
发明内容
本发明的目的在于提山一种与说话内容无关的声纹鉴别认证方法(1)通过对声纹信息特征的高斯化处理方法,使特征和模型间吻合,并能克服部分噪声干扰;(2)通过使用集内、集外区分性分析方法,使模型各分量间更具区分性;(3)通过信道补偿方法,使信道干扰减轻;(4)使用非线性弯折投影方法,将似然比得分折算成更加符合认证需要的百分比形式。
本发明的一种与说话内容无关的声纹鉴别认证方法,包括以下步骤:
(1)从大量说话人的声纹信号中提取声纹特征信息,形成背景特征矢量序列;
(2)将背景特征矢量序列做短时高斯化处理;
(3)将处理后的背景特征矢量序列通过异质线性区分性分析方法得到区分性矩阵和最终背景特征矢量序列;
(4)将最终背景特征矢量序列聚类成M类高斯混合空间背景模型;
(5)从大量不同信道、不同说话人的声纹信号中提取声纹特征信息,形成信道背景特征矢量序列,并将该特征矢量序列做高斯化处理及区分性处理,再通过因子分析技术得到信道信息矩阵;
(6)从样本说话人声纹信号中提取其声纹特征信息,形成样本特征矢量序列,并通过短时高斯化处理、区分性矩阵处理得到最终样本特征矢量序列;
(7)将样本特征矢量序列通过自适应模型调整方法从高斯混合空间背景模型调整为含有其个性信息的样本说话人模型;
(8)从检材说话人声纹信号中提取其声纹特征信息,形成检材特征矢量序列,并通过短时高斯化处理、区分性矩阵处理得到最终检材特征矢量序列;
(9)将最终检材特征矢量序列通过信道背景矩阵和样本说话人模型,调整为符合样本信道特征的个人特征矢量序列;
(10)计算检材调整后的特征矢量序列与样本说话人模型、背景模型的平均似然比得分的差,作为结果得分;
(11)将结果得分通过分数投影方法映射成为概率分数作为最终认证结果返回;
上述方法中的(2)、(5)、(6)、(7)、(8)步骤中的特征高斯化处理,该方法包括以下步骤:
①建立长度为N的高斯表;
②对每一维特征取长度为N的特征矢量序列,计算N/2处特征值的排序值,按照排序值查找高斯表中的值作为新特征值;
③移动到下一个长度为N的特征矢量序列(每次移动1帧),重复步骤(2),直到所有特征矢量序列完成高斯化处理;
上述方法中的(3)、(5)、(6)、(8)中异质线性区分性分析及其相应特征矢量序列处理方法,该方法包括以下步骤:
①将背景特征矢量序列聚类成M类,并记录每帧特征所属类别;
②通过背景特征矢量序列和分类结果,计算类内矩阵W,和类间矩阵B;
③利用公式: 
Figure GSA00000043963100021
求解使得类内矩阵差异最小,类间矩阵差异最大的矩阵 
Figure GSA00000043963100022
④在求解样本和检材特征后,经过短时高斯化处理,然后均乘以该矩阵,得到最终特征矢量序列;
上述方法中的(5)、(9)中因子分析技术,该方法包括以下步骤:
①提取出大量不同信道、不同说话人的声纹信息特征,使用模型自适应方法(如MAP)将每个人在每个信道下的特征通过背景模型调整成个人模型(只需要均值);
②提取出所有人所有信道下的模型均值,组成超向量矩阵S,计算其特征向量矩阵V;
③通过自适应模型调整方法从背景模型训练出样本的个人模型;
④将提取的样本声纹特征,通过特征向量矩阵V,使用ML或MAP准则,训练出符合样本信道信息的信道补偿因子;
⑤对提取出的检材声纹特征做信道信息补偿处理;
上述方法中的(11)中分数的非线性弯折技术,该方法包括以下步骤:
①通过背景模型训练集外大量语音数据测试,得到两类错误率的统计规律,获得符合要求的准确率所处的偏转点数值;
②利用偏转点数值,使用非线性弯折技术,对测试得分进行投影得到最终结果。
本发明提出的一种与说话内容无关的声纹鉴别认证方法,解决了声纹信息特征与模型间的不吻合问题,增强了模型本身的区分性能,加强了对噪声和信道干扰的抵抗能力,改变了得分的方式,使得认证更加易于理解和掌握。并且在该方法下,通过近2万次测试(使用经验阈值),认证准确率从原有方法的87.63,提高到95.57。
附图说明
图1所示为本发明方法提出的一种与说话内容无关的声纹鉴别认证方法的系统流程结构图。
具体实施方式
本发明提出的一种与说话内容无关的声纹鉴别认证方法,首先从大量说话人的原始声纹信号中提取出声纹特征矢量序列;对特征矢量序列做高斯化处理;通过聚类算法将处理后声纹特征矢量序列聚类成通用背景模型;根据聚类信息,通过异质线性分析方法得到区分性矩阵;利用区分性矩阵调整通用背景模型;再从大量不同信道、不同说话人的声纹信号中提取出声纹特征矢量序列,使用因子分析方法得到信道信息矩阵;从样本声纹信号中提取出声纹特征矢量序列,经过高斯化处理后,再与乘以区分性矩阵,将最终得到的特征矢量序列通过模型自适应方法训练成符合样本个性信息的样本声纹模型;从检材声纹信号中提取声纹特征矢量序列,经过高斯化处理后,再与乘以区分性矩阵,而后根据信道信息矩阵和样本模型对特征矢量序列进一步补偿,得到最终处理后的检材声纹特征矢量序列;计算最终处理后的声纹特征矢量序列与样本模型和背景模型的平均匹配得分差;将该得分差送入非线性弯折投影方程,得到最终的分数结果返回。
以下介绍本发明的一个实施例。
本发明的与说话内容无关的声纹鉴别认证实施例包括区分性矩阵建立和背景模型训练,信道信息矩阵建立,样本模型构建,检材与样本模型和背景模型匹配计算及得分投影,说明如下:
本实施例的区分性矩阵建立和背景模型训练步骤包括:
取60名男性说话人声纹信号和60名女性说话人声纹信号,将每个人的声纹信号中的静音段去除,保留每人1分钟左右的声纹信号。
将所有人的声纹信号进行分帧、加窗处理,帧长为16毫秒,帧移为帧长一半,窗函数使用汉明窗,对每一帧信号提取其16维美尔倒谱系数(MFCC),并通过计算其一阶、二阶差分,将特征扩展为48维,所有声纹帧特征组成特征矢量序列;
对每一维特征矢量序列进行高斯化处理,得到处理后的特征X;
对特征矢量序列进行聚类,根据聚类信息得到区分性矩阵 
Figure GSA00000043963100041
利用该矩阵得到新的特征矢量序列, 
Figure GSA00000043963100042
对特征矢量序列Y进行聚类,得到背景模型, UBM = { μ m ubm , Σ m ubm , ω m ubm | 1 ≤ m ≤ M } ;
本实施例的信道信息矩阵建立步骤包括:
(1)取100名男性声纹信号和100名女性声纹信号,每个人均含有八段来自不同信道的声纹信号,将每个人、每个信道下的声纹信号做去静音处理,每段声纹信号最终为1到2分钟不等。
(2)将每段声纹信号进行分帧、加窗处理,帧长为16毫秒,帧移为帧长一半,窗函数使用汉明窗,对每一帧信号提取其16维美尔倒谱系数(MFCC),对通过计算其一阶、二阶差分,将特征扩展为48维,得到每段声纹信号的声纹特征序列;
(3)对每段声纹信号的声纹特征序列做高斯化处理,得到其特征矢量序列Xi,j,其中i代表第i个说话人,j代表该说话人声纹信号来源信道。
(4)利用模型自适应方法,使用特征矢量序列Xi,j将背景模型均值调整为符合第i个说话人在其第j个信道下的模型均值Si,j
(5)将所有段声纹信号模型均值组合成超向量矩阵S;
(6)对矩阵 
Figure GSA00000043963100044
做特征分解,得到信道信息矩阵V,其中J为声纹信号段的数目;
本实施例的样本模型构建步骤包括:
(1)将样本声纹信号进行分帧、加窗处理,帧长为16毫秒,帧移为帧长一半,窗函数使用汉明窗,对每一帧信号提取其16维美尔倒谱系数(MFCC),对通过计算其一阶、二阶差分,将特征扩展为48维,得到样本声纹特征矢量序列;
(2)对样本特征做高斯化处理后,再乘以区分性矩阵 
Figure GSA00000043963100045
得到最终的样本声纹特征序列;
(3)使用最终得到的样本声纹特征矢量序列使用模型自适应方法对背景模型进行调整,得到样本声纹模型 Samp = { μ m samp , Σ m samp , ω m samp | 1 ≤ m ≤ M } ;
本实施例的检材与样本模型和背景模型匹配计算及得分投影步骤包括:
(1)将检材声纹信号进行分帧、加窗处理,帧长为16毫秒,帧移为帧长一半,窗函数使用汉明窗,对每一帧信号提取其16维美尔倒谱系数(MFCC),对通过计算其一阶、二阶差分,将特征扩展 为48维,得到检材声纹特征矢量序列;
(2)对检材声纹特征矢量序列做高斯化处理,再乘以区分性矩阵 
Figure GSA00000043963100051
最后再通过信道信息补偿矩阵V对特征矢量做信道补偿,得到最终的检材声纹特征矢量序列;
(3)计算最终的检材声纹特征矢量序列与样本模型和背景模型的匹配得分差;
(4)对该得分差使用非线性弯折投影方法得到最终的得分结果供认证人员分析;
(5)声纹鉴别认证过程结束。

Claims (5)

1.一种与说话内容无关的声纹鉴别认证方法,其特征在于该方法包括以下步骤:
(1)从大量说话人的声纹信号中提取声纹特征信息,形成背景特征矢量序列;
(2)将背景特征矢量序列做规整处理,如去均值处(CMS)、短时高斯化(ShortTime Gausianization)、特征映射(Feature Mapping)等;
(3)将规整处理后的背景特征矢量序列通过特征分解技术,如主分量分析(PCA)、核-主分量分析(KPCA)、线性分量分析(LDA)、异质线性分量分析(HLDA)等,得到区分性分析矩阵和降维的最终的背景特征矢量序列;
(4)将最终的背景特征矢量序列聚类成M类高斯混合空间背景模型;
(5)从大量不同信道、不同说话人的语音信号中提取声纹特征信息,形成信道背景特征矢量序列,并将该特征矢量序列做规整处理及区分性处理,再通过因子分析技术得到信道信息背景矩阵;
(6)从样本说话人语音信号中提取其声纹特征信息,形成样本特征矢量序列,并通过规整处理、区分性处理得到最终样本特征矢量序列;
(7)将样本特征矢量序列通过自适应模型调整方法从高斯混合空间背景模型调整为含有其个性信息的样本说话人模型;
(8)从检材说话人语音信号中提取其声纹特征信息,形成检材特征矢量序列,并通过规整处理、区分性处理得到最终检材特征矢量序列;
(9)将最终检材特征矢量序列通过信道背景矩阵和样本说话人模型,调整为符合样本信道特性的特征矢量序列;
(10)计算调整后的检材特征矢量序列与样本说话人模型、背景模型的平均似然比得分的差,作为结果得分;
(11)将结果得分通过分数投影方法映射成为概率分数作为最终鉴别结果返回;
2.如权力要求1所述方法,其特征在于步骤(2)、(5)、(6)、(7)、(8)中的特征规整处理,以短时高斯化为例,该方法包括以下步骤:
(1)建立长度为N的高斯表;
(2)对每一维特征取长度为N的特征矢量序列,计算N/2处特征值的排序值,按照排序值查找高斯表中的值作为新特征值;
(3)移动到下一个长度为N的特征矢量序列(每次移动1帧),重复步骤(2),直到所有特征矢量序列完成高斯化处理;
3.如权力要求1所述方法,其特征在于步骤(3)中特征分解技术,以异质线性分量分析及其相应特征矢量序列处理方法为例,该方法包括以下步骤:
(1)将背景特征矢量序列聚类成M类,并记录每帧特征所属类别;
(2)通过背景特征矢量序列和分类结果,计算类内矩阵W,和类间矩阵B;
(3)利用公式:
Figure FSA00000043963000011
求解使得类内矩阵差异最小,类间矩阵差异最大的特征矩阵
Figure FSA00000043963000012
(4)在求解样本和检材特征后,经过特征规整处理,然后均乘以该矩阵,得到最终特征矢量序列;
4.如权力要求1所述方法,其特征在于步骤(5)、(9)中因子分析技术,该方法包括以下步骤:
(1)提取出大量不同信道、不同说话人的声纹信息特征,使用模型自适应方法(如MAP)将每个人在每个信道下的特征通过背景模型调整成个人模型(只需要均值向量);
(2)提取出所有人所有信道下的模型均值,组成超向量矩阵S,计算其特征向量矩阵V;
(3)通过自适应模型调整方法从背景模型训练出样本的个人模型;
(4)将提取的样本声纹特征,通过特征向量矩阵V,使用ML或MAP准则,训练出符合样本信道信息的信道补偿因子;
(5)对提取出的检材声纹特征做信道信息补偿处理;
5.如权力要求1所述方法,其特征在于步骤(11)中分数的非线性投影技术,该方法包括以下步骤:
(1)通过背景模型训练集外大量语音数据测试,得到两类错误率(错误接受率和错误拒绝率)的统计规律;
(2)设计一种非线性弯折函数,依据(1)中得到的统计规律设计函数参数;
(3)将得到的似然得分通过弯折函数,得到相似性得分。
CN2010101260493A 2010-03-17 2010-03-17 一种与说话内容无关的声纹鉴别认证方法 Pending CN102194455A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010101260493A CN102194455A (zh) 2010-03-17 2010-03-17 一种与说话内容无关的声纹鉴别认证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101260493A CN102194455A (zh) 2010-03-17 2010-03-17 一种与说话内容无关的声纹鉴别认证方法

Publications (1)

Publication Number Publication Date
CN102194455A true CN102194455A (zh) 2011-09-21

Family

ID=44602410

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101260493A Pending CN102194455A (zh) 2010-03-17 2010-03-17 一种与说话内容无关的声纹鉴别认证方法

Country Status (1)

Country Link
CN (1) CN102194455A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103077719A (zh) * 2012-12-27 2013-05-01 安徽科大讯飞信息科技股份有限公司 一种基于矩阵离线预计算的快速全空间因子处理方法
WO2013072791A1 (en) * 2011-11-16 2013-05-23 International Business Machines Corporation Joint factor analysis scoring for speech processing systems
CN103730111A (zh) * 2013-08-15 2014-04-16 中华电信股份有限公司 利用语者识别的切割音视讯片段的方法
CN104143326A (zh) * 2013-12-03 2014-11-12 腾讯科技(深圳)有限公司 一种语音命令识别方法和装置
CN105096955A (zh) * 2015-09-06 2015-11-25 广东外语外贸大学 一种基于模型生长聚类的说话人快速识别方法及系统
CN106033670A (zh) * 2015-03-19 2016-10-19 科大讯飞股份有限公司 声纹密码认证方法及系统
CN103730111B (zh) * 2013-08-15 2016-11-30 中华电信股份有限公司 利用语者识别的切割音视讯片段的方法
CN106971736A (zh) * 2016-01-14 2017-07-21 芋头科技(杭州)有限公司 一种提升声纹识别准确度的方法和系统
CN107274883A (zh) * 2017-07-04 2017-10-20 清华大学 语音信号重构方法及装置
CN107274890A (zh) * 2017-07-04 2017-10-20 清华大学 声纹谱提取方法及装置
CN107393540A (zh) * 2017-07-20 2017-11-24 任文 一种语音输入消除噪音的方法
CN108364656A (zh) * 2018-03-08 2018-08-03 北京得意音通技术有限责任公司 一种用于语音重放检测的特征提取方法及装置
WO2019227574A1 (zh) * 2018-05-31 2019-12-05 平安科技(深圳)有限公司 语音模型训练方法、语音识别方法、装置、设备及介质
CN110555370A (zh) * 2019-07-16 2019-12-10 西北工业大学 水下目标识别中基于plda因子分析法的通道效应抑制方法
CN111081261A (zh) * 2019-12-25 2020-04-28 华南理工大学 一种基于lda的文本无关声纹识别方法
CN111506763A (zh) * 2020-04-15 2020-08-07 厦门快商通科技股份有限公司 一种声纹数据库建立方法和装置以及设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1247363A (zh) * 1998-09-04 2000-03-15 松下电器产业株式会社 基于本征话音的说话者检验和说话者识别

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1247363A (zh) * 1998-09-04 2000-03-15 松下电器产业株式会社 基于本征话音的说话者检验和说话者识别

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
《2002 IEEE International Conference on Acoustics, Speech, and Signal Processing》 20020517 Bing Xiang, Upendra V. Chaudhari1, Jili Navratill, Ganesh N. Ram SHORT-TIME GAUSSIANIZATION FOR ROBUST SPEAKER VERIFICATION 2 , *
《2008 IEEE International Conference on Acoustics, Speech, and Signal Processing》 20080404 Si-Bao Chen, Yu Hu, Bin Luo, Ren-Hua Wang HETEROSCEDASTIC DISCRIMINANT ANALYSIS WITH TWO-DIMENSIONAL CONSTRAINTS 3 , *
《CNKI中国博士学位论文全文数据库》 20080815 郭武 复杂信道下的说话人识别 1-5 , 第8期 *
《IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING》 20070930 Lukáˇs Burget,Pavel Matˇejka,Petr Schwarz,Ondrˇej Glembek Analysis of Feature Extraction and Channel Compensation in a GMM Speaker Recognition System 1-5 第15卷, 第7期 *
《电子学报》 20090430 郭武, 李轶杰, 戴礼荣, 王仁华 采用非监督得分规整和因子分析的说话人确认 5 第37卷, 第4期 *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013072791A1 (en) * 2011-11-16 2013-05-23 International Business Machines Corporation Joint factor analysis scoring for speech processing systems
CN103077719A (zh) * 2012-12-27 2013-05-01 安徽科大讯飞信息科技股份有限公司 一种基于矩阵离线预计算的快速全空间因子处理方法
CN103077719B (zh) * 2012-12-27 2015-01-07 安徽科大讯飞信息科技股份有限公司 一种基于矩阵离线预计算的快速全空间因子处理方法
CN103730111B (zh) * 2013-08-15 2016-11-30 中华电信股份有限公司 利用语者识别的切割音视讯片段的方法
CN103730111A (zh) * 2013-08-15 2014-04-16 中华电信股份有限公司 利用语者识别的切割音视讯片段的方法
US10013985B2 (en) 2013-12-03 2018-07-03 Tencent Technology (Shenzhen) Company Limited Systems and methods for audio command recognition with speaker authentication
CN104143326A (zh) * 2013-12-03 2014-11-12 腾讯科技(深圳)有限公司 一种语音命令识别方法和装置
CN104143326B (zh) * 2013-12-03 2016-11-02 腾讯科技(深圳)有限公司 一种语音命令识别方法和装置
CN106033670A (zh) * 2015-03-19 2016-10-19 科大讯飞股份有限公司 声纹密码认证方法及系统
CN106033670B (zh) * 2015-03-19 2019-11-15 科大讯飞股份有限公司 声纹密码认证方法及系统
CN105096955A (zh) * 2015-09-06 2015-11-25 广东外语外贸大学 一种基于模型生长聚类的说话人快速识别方法及系统
CN105096955B (zh) * 2015-09-06 2019-02-01 广东外语外贸大学 一种基于模型生长聚类的说话人快速识别方法及系统
CN106971736A (zh) * 2016-01-14 2017-07-21 芋头科技(杭州)有限公司 一种提升声纹识别准确度的方法和系统
CN107274890B (zh) * 2017-07-04 2020-06-02 清华大学 声纹谱提取方法及装置
CN107274883B (zh) * 2017-07-04 2020-06-02 清华大学 语音信号重构方法及装置
CN107274890A (zh) * 2017-07-04 2017-10-20 清华大学 声纹谱提取方法及装置
CN107274883A (zh) * 2017-07-04 2017-10-20 清华大学 语音信号重构方法及装置
CN107393540A (zh) * 2017-07-20 2017-11-24 任文 一种语音输入消除噪音的方法
CN108364656A (zh) * 2018-03-08 2018-08-03 北京得意音通技术有限责任公司 一种用于语音重放检测的特征提取方法及装置
CN108364656B (zh) * 2018-03-08 2021-03-09 北京得意音通技术有限责任公司 一种用于语音重放检测的特征提取方法及装置
WO2019227574A1 (zh) * 2018-05-31 2019-12-05 平安科技(深圳)有限公司 语音模型训练方法、语音识别方法、装置、设备及介质
CN110555370A (zh) * 2019-07-16 2019-12-10 西北工业大学 水下目标识别中基于plda因子分析法的通道效应抑制方法
CN110555370B (zh) * 2019-07-16 2023-03-31 西北工业大学 水下目标识别中基于plda因子分析法的通道效应抑制方法
CN111081261A (zh) * 2019-12-25 2020-04-28 华南理工大学 一种基于lda的文本无关声纹识别方法
CN111081261B (zh) * 2019-12-25 2023-04-21 华南理工大学 一种基于lda的文本无关声纹识别方法
CN111506763A (zh) * 2020-04-15 2020-08-07 厦门快商通科技股份有限公司 一种声纹数据库建立方法和装置以及设备

Similar Documents

Publication Publication Date Title
CN102194455A (zh) 一种与说话内容无关的声纹鉴别认证方法
Gomez-Alanis et al. A light convolutional GRU-RNN deep feature extractor for ASV spoofing detection
CN110289003B (zh) 一种声纹识别的方法、模型训练的方法以及服务器
CN102034288B (zh) 基于多生物特征识别的智能门禁系统
CN106448684A (zh) 基于深度置信网络特征矢量的信道鲁棒声纹识别系统
CN102820033B (zh) 一种声纹识别方法
CN102509547B (zh) 基于矢量量化的声纹识别方法及系统
CN110299142B (zh) 一种基于网络融合的声纹识别方法及装置
CN107492382A (zh) 基于神经网络的声纹信息提取方法及装置
CN109903774A (zh) 一种基于角度间隔损失函数的声纹识别方法
CN108231067A (zh) 基于卷积神经网络与随机森林分类的声音场景识别方法
US9355642B2 (en) Speaker recognition method through emotional model synthesis based on neighbors preserving principle
CN106127156A (zh) 基于声纹和人脸识别的机器人交互方法
CN102968990B (zh) 说话人识别方法和系统
CN1302427A (zh) 用于说话者认证的模型自适应系统和方法
JPH08314491A (ja) ミックスチャ分解識別による話者検証方法と装置
CN103456302B (zh) 一种基于情感gmm模型权重合成的情感说话人识别方法
CN109961794A (zh) 一种基于模型聚类的分层说话人识别方法
CN1963917A (zh) 评价语音的分辨力、说话人认证的注册和验证方法及装置
CN111816203A (zh) 基于音素级分析抑制音素影响的合成语音检测方法
CN107346568A (zh) 一种门禁系统的认证方法和装置
Wu et al. Vector-based attentive pooling for text-independent speaker verification.
CN111831989B (zh) 一种基于多模态ppg信号的身份认证方法及装置
CN104464738B (zh) 一种面向智能移动设备的声纹识别方法
CN110085236B (zh) 一种基于自适应语音帧加权的说话人识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110921