CN101887722A - 快速声纹认证方法 - Google Patents
快速声纹认证方法 Download PDFInfo
- Publication number
- CN101887722A CN101887722A CN2009100870846A CN200910087084A CN101887722A CN 101887722 A CN101887722 A CN 101887722A CN 2009100870846 A CN2009100870846 A CN 2009100870846A CN 200910087084 A CN200910087084 A CN 200910087084A CN 101887722 A CN101887722 A CN 101887722A
- Authority
- CN
- China
- Prior art keywords
- sample
- vocal print
- feature
- file
- template
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明属于身份识别技术领域,特别涉及通过人类声纹信息进行比对与认证的方法。本发明包括声纹信号的获取和处理,声纹特征的提取和处理,声纹模型的建立,声纹模型的比对。本发明具有比对结果准确率高、比对速度快等优点,可广泛应用于司法、公安、银行、国防等需要声纹比对、认证的部门和单位。
Description
技术领域
本发明为一种声纹比对认证方法,属于身份识别技术领域。
背景技术
司法声纹比对技术于上世纪中叶由美国率先应用于司法领域,后来俄罗斯、日本等国先后开始进入研究和实践阶段,我国起步于上世纪90年代初期,目前也正在进入实践和发展阶段。目前声纹比对认证的方法大概包括以下几种:1、基音轨迹图比对;2、语谱图(共振峰)比对;3、统计方法。
基音轨迹图比对方法:
(1)在样本和检材中,找出大量的相同词汇;
(2)对样本和检材中相同的词汇提取基音;
(3)比对样本中相同词汇基音轨迹图,提取样本基音轨迹图的稳定部分;
(4)比对检材中相同词汇基音轨迹图,提取检材基音轨迹图的稳定部分;
(5)比对样本基音轨迹图的稳定部分和检材基音轨迹图的稳定部分,得出比对结果;
语谱图(共振峰)比对方法:
(1)在样本和检材中,找出大量的相同词汇;
(2)对样本和检材中相同的词汇绘制语谱图;
(3)比对样本中相同词汇语谱图中的共振峰位置和走势,通常取前三条共振峰轨迹,若语音质量好也可取用第四条共振峰轨迹,通过比对得到共振峰轨迹的稳定部分;
(4)比对检材中相同词汇语谱图中的共振峰位置和走势,通常取前三条共振峰轨迹,若语音质量好也可取用第四条共振峰轨迹,通过比对得到共振峰轨迹的稳定部分;
(5)比对样本与检材相同词汇的共振峰轨迹的稳定部分,得出比对结果;
统计方法:
(1)从样本和检材中提取大量声纹特征,如基音、共振峰、倒谱等;
(2)以贝叶斯理论为基础,考察样本和检材间统计规律是否相符,得出最终比对结果。
以上三种方法中,前两种应用最为广泛,应用时间长,稳定性好,缺点是难于寻找稳定部分特征,且比对时间长,耗费大量时间和精力,第三种方法是近几年刚刚兴起的方法,应用简单,比对速度快,但稳定性不强,受环境噪声、信道差异、情绪等影响较大。
发明内容
本发明的目的在于提出一种快速并且稳定的声纹比对认证方法(1)通过计算得到样本内相同词汇的典型特征序列,通过典型特征序列与其余特征序列间的匹配值自动得到稳定的模板;(2)通过样本模板,计算与特征序列间的匹配值,得到统计均值和标准差数据,通过加权获得阈值;(3)计算样本模板和检材模板间的特征匹配值,及每维特征的相关系数,与阈值比对得出比对结果。
本发明的快速声纹认证方法,包括以下步骤:
(1)从磁带、CD、MP3等放音设备中提取出检材和样本的声纹文件,获取相应声纹信号;
(2)提取出检材文件和样本文件中均反复出现多次的词汇或短句,形成新的语音文件;
(3)将样本文件中提取的相同短语内容的M个文件送入特征提取单元,提取出M个样本声学特征参数;
(4)将检材文件中提取的相同短语内容的N个文件送入特征提取单元,提取出N个检材声学特征参数;
(5)将样本特征参数通过动态规划和加权处理,获得具有该组声纹特征共性的特征模板,并获得统计阈值;
(6)将检材特征参数通过动态规划和加权处理,获得具有该组声纹特征共性的特征模板;
(7)将样本特征模板与检材特征模板进行匹配计算,得到匹配结果;
上述方法中的(3)、(4)中的特征提取处理,以倒谱为例,该方法包括以下步骤:
(1)提取声纹信号的特征参数序列;
(2)计算特征参数的差分扩展参数序列作为补充参数;
(3)将特征参数与差分扩展参数合并为最终特征参数;
上述方法中(5)、(6)中特征模板提取,该方法包括以下步骤:
(1)寻找一组声纹特征中稳定性较好的一个信号;
(2)以该较稳定信号为初始模板,将其余信号与该较稳定信号对齐;
(3)求解各个对齐信号的权值,最后通过加权获得最终特征模板;
上述方法(5)中自适应阈值计算方法,该方法包括以下步骤:
(1)计算样本声纹特征模板与所有样本声纹特征间的帧间匹配值;
(2)求出匹配值的统计平均和标准差;
(3)使用统计平均和标准差,通过加权方式得到阈值;
上述方法中的(7)中模板匹配计算方法,该方法包括以下步骤:
(1)计算样本特征模板与检材特征模板间的帧间匹配距离值;
(2)与样本模板获得的统计阈值比较,得到比对结果。
本发明提出的快速声纹认证方法,能够自动提取声纹特征的稳定部分,不需人眼分辨,速度快、稳定性好,进一步提高了比对的效率和准确性。
附图说明
图1是本发明方法的系统流程图。
具体实施方式
本发明提出的快速声纹认证方法,首先从样本语音文件中找出多组和检材语音文件中相同的词汇,并将这些词汇对应的语音数据提取出来;然后将这些相同词汇的语音片段提取出声纹特征,如基音、共振峰、倒谱等;再将这些特征序列通过计算得到较稳定的信号,并最终获得样本特征模板和统计阈值;以同样方式提取检材语音文件中相对应词汇的声纹特征模板;最后比对样本声纹特征模板和检材声纹特征模板得出比对结果。
以下介绍本发明的一个实施例。
本发明的司法声纹快速比对实施例包括样本和检材语音文件中相同词汇或短语的查找,声纹特征的提取,样本和检材声纹特征模板的计算,样本特征间阈值计算,样本声纹特征模板和检材声纹特征模板的比对,说明如下:
本实施例的样本和检材文件中相同词汇提取步骤包括:
(1)对照样本语音的录音稿和检材语音的录音稿,找出5组以上相同词汇,且每个相同词汇在样本
和检材中数量均不低于3个;
(2)对照录音稿,听录音,将需提取的语音片段摘出,形成新的语音文件;
本实施例的特征提取(以美尔倒谱为例)步骤包括:
(1)取出样本中内容相同的语音文件,提取声纹信号。
(2)将每段声纹信号进行分帧、加窗处理,帧长为16毫秒,帧移为帧长一半,窗函数使用汉明窗,对每一帧信号提取其声纹特征,如16维美尔倒谱系数(MFCC),对通过计算其一阶、二阶差分,将特征扩展为48维,得到每段声纹信号的声纹特征序列;
(3)以(2)同样方法提取相应的检材声纹信号特征;
本实施例的声纹特征模板计算步骤包括:
(1)对一组相同词汇所对应的声纹特征,计算该组声纹信号较稳定的信号;
(2)以该较稳定信号特征为初始模板,将其余信号与该较稳定信号对齐;
(3)求解各个对齐信号的权值,最后通过加权获得最终特征模板;
本实施例的样本特征间阈值计算步骤包括:
(1)以特征模板为参考,使用动态规划方法将该模板对应的其余声纹特征对齐;
(2)计算各个特征与模板间的匹配距离,进而求解所有匹配距离的均值μ和标准差σ;
(3)以Th=αμ+βσ计算阈值,其中α、β为阈值调节系数,本实施例均取1;本实施例的样本声纹特征模板和检材声纹特征模板的比对步骤包括:
(1)以样本特征模板为参考,使用动态规划方法将检材模板对齐;
(2)计算样本模板和检材模板间的帧间匹配距离;
(3)将匹配距离值与阈值比较得出匹配结果。
Claims (5)
1.快速声纹认证方法,其特征在于该方法包括以下步骤:
(1)从磁带、CD、MP3等放音设备中提取出检材和样本的声纹文件,获取相应声纹信号;
(2)提取出检材文件和样本文件中均反复出现多次的词汇或短句,形成新的语音文件;
(3)将样本文件中提取的相同短语内容的M个文件送入特征提取单元,提取出M个样本声学特征参数;
(4)将检材文件中提取的相同短语内容的N个文件送入特征提取单元,提取出N个检材声学特征参数;
(5)将样本特征参数通过动态规划和加权处理,获得具有该组声纹特征共性的特征模板,并获得统计阈值;
(6)将检材特征参数通过动态规划和加权处理,获得具有该组声纹特征共性的特征模板;
(7)将样本特征模板与检材特征模板进行匹配计算,得到匹配结果;
2.如权力要求1所述方法,其特征在于步骤(3)、(4)中的特征提取处理,该方法包括以下步骤:
(1)提取声纹信号的特征参数序列;
(2)计算特征参数的差分扩展参数序列作为补充参数;
(3)将特征参数与差分扩展参数合并为最终特征参数;
3.如权力要求1所述方法,其特征在于步骤(5)、(6)中特征模板提取,该方法包括以下步骤:
(1)寻找一组声纹特征中稳定性较好的一个信号;
(2)以该较稳定信号为初始模板,将其余信号与该较稳定信号对齐;
(3)求解各个对齐信号的权值,最后通过加权获得最终特征模板;
4.如权力要求1所述方法,其特征在于步骤(5)中自适应阈值计算方法,该方法包括以下步骤:
(1)计算样本声纹特征模板与所有样本声纹特征间的帧间匹配值;
(2)求出匹配值的统计平均和标准差;
(3)使用统计平均和标准差,通过加权方式得到阈值;
5.如权力要求1所述方法,其特征在于步骤(7)中模板匹配计算方法,该方法包括以下步骤:
(1)计算样本特征模板与检材特征模板间的帧间匹配距离值;
(2)与样本模板获得的统计阈值比较,得到比对结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100870846A CN101887722A (zh) | 2009-06-18 | 2009-06-18 | 快速声纹认证方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100870846A CN101887722A (zh) | 2009-06-18 | 2009-06-18 | 快速声纹认证方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101887722A true CN101887722A (zh) | 2010-11-17 |
Family
ID=43073609
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009100870846A Pending CN101887722A (zh) | 2009-06-18 | 2009-06-18 | 快速声纹认证方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101887722A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102110438A (zh) * | 2010-12-15 | 2011-06-29 | 方正国际软件有限公司 | 一种基于语音的身份认证方法及系统 |
CN102393943A (zh) * | 2011-06-27 | 2012-03-28 | 中国建设银行股份有限公司 | 一种用于电话银行系统的安全处理装置和方法 |
CN103198838A (zh) * | 2013-03-29 | 2013-07-10 | 苏州皓泰视频技术有限公司 | 一种用于嵌入式系统的异常声音监控方法和监控装置 |
CN104022879A (zh) * | 2014-05-29 | 2014-09-03 | 金蝶软件(中国)有限公司 | 语音安全校验的方法及装置 |
CN105096432A (zh) * | 2015-09-14 | 2015-11-25 | 山东山大鸥玛软件有限公司 | 一种声纹密码锁控制系统 |
CN106921668A (zh) * | 2017-03-09 | 2017-07-04 | 福建省汽车工业集团云度新能源汽车股份有限公司 | 基于声纹识别的汽车用户快速验证方法及装置 |
CN109599121A (zh) * | 2019-01-04 | 2019-04-09 | 平安科技(深圳)有限公司 | 基于声纹识别的酒驾检测方法、装置、设备及存储介质 |
WO2019228135A1 (zh) * | 2018-05-30 | 2019-12-05 | Oppo广东移动通信有限公司 | 匹配阈值的调整方法、装置、存储介质及电子设备 |
CN111108552A (zh) * | 2019-12-24 | 2020-05-05 | 广州国音智能科技有限公司 | 一种声纹同一性鉴定方法和相关装置 |
CN111199729A (zh) * | 2018-11-19 | 2020-05-26 | 阿里巴巴集团控股有限公司 | 声纹识别方法及装置 |
CN113921017A (zh) * | 2021-12-14 | 2022-01-11 | 深圳市声扬科技有限公司 | 语音同一性的检验方法、装置、电子设备及存储介质 |
-
2009
- 2009-06-18 CN CN2009100870846A patent/CN101887722A/zh active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102110438A (zh) * | 2010-12-15 | 2011-06-29 | 方正国际软件有限公司 | 一种基于语音的身份认证方法及系统 |
CN102393943A (zh) * | 2011-06-27 | 2012-03-28 | 中国建设银行股份有限公司 | 一种用于电话银行系统的安全处理装置和方法 |
CN103198838A (zh) * | 2013-03-29 | 2013-07-10 | 苏州皓泰视频技术有限公司 | 一种用于嵌入式系统的异常声音监控方法和监控装置 |
CN104022879B (zh) * | 2014-05-29 | 2018-06-26 | 金蝶软件(中国)有限公司 | 语音安全校验的方法及装置 |
CN104022879A (zh) * | 2014-05-29 | 2014-09-03 | 金蝶软件(中国)有限公司 | 语音安全校验的方法及装置 |
CN105096432A (zh) * | 2015-09-14 | 2015-11-25 | 山东山大鸥玛软件有限公司 | 一种声纹密码锁控制系统 |
CN106921668A (zh) * | 2017-03-09 | 2017-07-04 | 福建省汽车工业集团云度新能源汽车股份有限公司 | 基于声纹识别的汽车用户快速验证方法及装置 |
WO2019228135A1 (zh) * | 2018-05-30 | 2019-12-05 | Oppo广东移动通信有限公司 | 匹配阈值的调整方法、装置、存储介质及电子设备 |
CN111199729A (zh) * | 2018-11-19 | 2020-05-26 | 阿里巴巴集团控股有限公司 | 声纹识别方法及装置 |
CN111199729B (zh) * | 2018-11-19 | 2023-09-26 | 阿里巴巴集团控股有限公司 | 声纹识别方法及装置 |
CN109599121A (zh) * | 2019-01-04 | 2019-04-09 | 平安科技(深圳)有限公司 | 基于声纹识别的酒驾检测方法、装置、设备及存储介质 |
WO2020140376A1 (zh) * | 2019-01-04 | 2020-07-09 | 平安科技(深圳)有限公司 | 基于声纹识别的酒驾检测方法、装置、设备及存储介质 |
CN111108552A (zh) * | 2019-12-24 | 2020-05-05 | 广州国音智能科技有限公司 | 一种声纹同一性鉴定方法和相关装置 |
CN113921017A (zh) * | 2021-12-14 | 2022-01-11 | 深圳市声扬科技有限公司 | 语音同一性的检验方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101887722A (zh) | 快速声纹认证方法 | |
EP3719798B1 (en) | Voiceprint recognition method and device based on memorability bottleneck feature | |
CN101136199B (zh) | 语音数据处理方法和设备 | |
CN108922541B (zh) | 基于dtw和gmm模型的多维特征参数声纹识别方法 | |
Patel et al. | Speech recognition and verification using MFCC & VQ | |
Chen et al. | Speaker verification against synthetic speech | |
CN104240706B (zh) | 一种基于GMM Token配比相似度校正得分的说话人识别方法 | |
CN103794207A (zh) | 一种双模语音身份识别方法 | |
CN111128128B (zh) | 一种基于互补模型评分融合的语音关键词检测方法 | |
CN104464724A (zh) | 一种针对刻意伪装语音的说话人识别方法 | |
CN102968990A (zh) | 说话人识别方法和系统 | |
CN108091340B (zh) | 声纹识别方法、声纹识别系统和计算机可读存储介质 | |
Ghahabi et al. | A robust voice activity detection for real-time automatic speech recognition | |
Pao et al. | Combining acoustic features for improved emotion recognition in mandarin speech | |
CN106297769B (zh) | 一种应用于语种识别的鉴别性特征提取方法 | |
Ilyas et al. | Speaker verification using vector quantization and hidden Markov model | |
CN114303186A (zh) | 用于在语音合成中适配人类说话者嵌入的系统和方法 | |
Zhang et al. | Speaker recognition based on dynamic time warping and Gaussian mixture model | |
Dai et al. | An improved feature fusion for speaker recognition | |
CN104240699A (zh) | 一种简单有效的短语语音识别方法 | |
Samal et al. | On the use of MFCC feature vector clustering for efficient text dependent speaker recognition | |
CN108564967A (zh) | 面向哭声检测系统的Mel能量声纹特征提取方法 | |
Phyu et al. | Building Speaker Identification Dataset for Noisy Conditions | |
Yue et al. | Speaker age recognition based on isolated words by using SVM | |
Bora et al. | Speaker identification for biometric access control using hybrid features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20101117 |