CN101887722A

CN101887722A - 快速声纹认证方法

Info

Publication number: CN101887722A
Application number: CN2009100870846A
Authority: CN
Inventors: 不公告发明人
Original assignee: BOSHIJIN (BEIJING) INFORMATION TECHNOLOGY Co Ltd
Current assignee: BOSHIJIN (BEIJING) INFORMATION TECHNOLOGY Co Ltd
Priority date: 2009-06-18
Filing date: 2009-06-18
Publication date: 2010-11-17

Abstract

本发明属于身份识别技术领域，特别涉及通过人类声纹信息进行比对与认证的方法。本发明包括声纹信号的获取和处理，声纹特征的提取和处理，声纹模型的建立，声纹模型的比对。本发明具有比对结果准确率高、比对速度快等优点，可广泛应用于司法、公安、银行、国防等需要声纹比对、认证的部门和单位。

Description

快速声纹认证方法

技术领域

本发明为一种声纹比对认证方法，属于身份识别技术领域。

背景技术

司法声纹比对技术于上世纪中叶由美国率先应用于司法领域，后来俄罗斯、日本等国先后开始进入研究和实践阶段，我国起步于上世纪90年代初期，目前也正在进入实践和发展阶段。目前声纹比对认证的方法大概包括以下几种：1、基音轨迹图比对；2、语谱图(共振峰)比对；3、统计方法。

基音轨迹图比对方法：

(1)在样本和检材中，找出大量的相同词汇；

(2)对样本和检材中相同的词汇提取基音；

(3)比对样本中相同词汇基音轨迹图，提取样本基音轨迹图的稳定部分；

(4)比对检材中相同词汇基音轨迹图，提取检材基音轨迹图的稳定部分；

(5)比对样本基音轨迹图的稳定部分和检材基音轨迹图的稳定部分，得出比对结果；

语谱图(共振峰)比对方法：

(1)在样本和检材中，找出大量的相同词汇；

(2)对样本和检材中相同的词汇绘制语谱图；

(3)比对样本中相同词汇语谱图中的共振峰位置和走势，通常取前三条共振峰轨迹，若语音质量好也可取用第四条共振峰轨迹，通过比对得到共振峰轨迹的稳定部分；

(4)比对检材中相同词汇语谱图中的共振峰位置和走势，通常取前三条共振峰轨迹，若语音质量好也可取用第四条共振峰轨迹，通过比对得到共振峰轨迹的稳定部分；

(5)比对样本与检材相同词汇的共振峰轨迹的稳定部分，得出比对结果；

统计方法：

(1)从样本和检材中提取大量声纹特征，如基音、共振峰、倒谱等；

(2)以贝叶斯理论为基础，考察样本和检材间统计规律是否相符，得出最终比对结果。

以上三种方法中，前两种应用最为广泛，应用时间长，稳定性好，缺点是难于寻找稳定部分特征，且比对时间长，耗费大量时间和精力，第三种方法是近几年刚刚兴起的方法，应用简单，比对速度快，但稳定性不强，受环境噪声、信道差异、情绪等影响较大。

发明内容

本发明的目的在于提出一种快速并且稳定的声纹比对认证方法(1)通过计算得到样本内相同词汇的典型特征序列，通过典型特征序列与其余特征序列间的匹配值自动得到稳定的模板；(2)通过样本模板，计算与特征序列间的匹配值，得到统计均值和标准差数据，通过加权获得阈值；(3)计算样本模板和检材模板间的特征匹配值，及每维特征的相关系数，与阈值比对得出比对结果。

本发明的快速声纹认证方法，包括以下步骤：

(1)从磁带、CD、MP3等放音设备中提取出检材和样本的声纹文件，获取相应声纹信号；

(2)提取出检材文件和样本文件中均反复出现多次的词汇或短句，形成新的语音文件；

(3)将样本文件中提取的相同短语内容的M个文件送入特征提取单元，提取出M个样本声学特征参数；

(4)将检材文件中提取的相同短语内容的N个文件送入特征提取单元，提取出N个检材声学特征参数；

(5)将样本特征参数通过动态规划和加权处理，获得具有该组声纹特征共性的特征模板，并获得统计阈值；

(6)将检材特征参数通过动态规划和加权处理，获得具有该组声纹特征共性的特征模板；

(7)将样本特征模板与检材特征模板进行匹配计算，得到匹配结果；

上述方法中的(3)、(4)中的特征提取处理，以倒谱为例，该方法包括以下步骤：

(1)提取声纹信号的特征参数序列；

(2)计算特征参数的差分扩展参数序列作为补充参数；

(3)将特征参数与差分扩展参数合并为最终特征参数；

上述方法中(5)、(6)中特征模板提取，该方法包括以下步骤：

(1)寻找一组声纹特征中稳定性较好的一个信号；

(2)以该较稳定信号为初始模板，将其余信号与该较稳定信号对齐；

(3)求解各个对齐信号的权值，最后通过加权获得最终特征模板；

上述方法(5)中自适应阈值计算方法，该方法包括以下步骤：

(1)计算样本声纹特征模板与所有样本声纹特征间的帧间匹配值；

(2)求出匹配值的统计平均和标准差；

(3)使用统计平均和标准差，通过加权方式得到阈值；

上述方法中的(7)中模板匹配计算方法，该方法包括以下步骤：

(1)计算样本特征模板与检材特征模板间的帧间匹配距离值；

(2)与样本模板获得的统计阈值比较，得到比对结果。

本发明提出的快速声纹认证方法，能够自动提取声纹特征的稳定部分，不需人眼分辨，速度快、稳定性好，进一步提高了比对的效率和准确性。

附图说明

图1是本发明方法的系统流程图。

具体实施方式

本发明提出的快速声纹认证方法，首先从样本语音文件中找出多组和检材语音文件中相同的词汇，并将这些词汇对应的语音数据提取出来；然后将这些相同词汇的语音片段提取出声纹特征，如基音、共振峰、倒谱等；再将这些特征序列通过计算得到较稳定的信号，并最终获得样本特征模板和统计阈值；以同样方式提取检材语音文件中相对应词汇的声纹特征模板；最后比对样本声纹特征模板和检材声纹特征模板得出比对结果。

以下介绍本发明的一个实施例。

本发明的司法声纹快速比对实施例包括样本和检材语音文件中相同词汇或短语的查找，声纹特征的提取，样本和检材声纹特征模板的计算，样本特征间阈值计算，样本声纹特征模板和检材声纹特征模板的比对，说明如下：

本实施例的样本和检材文件中相同词汇提取步骤包括：

(1)对照样本语音的录音稿和检材语音的录音稿，找出5组以上相同词汇，且每个相同词汇在样本

和检材中数量均不低于3个；

(2)对照录音稿，听录音，将需提取的语音片段摘出，形成新的语音文件；

本实施例的特征提取(以美尔倒谱为例)步骤包括：

(1)取出样本中内容相同的语音文件，提取声纹信号。

(2)将每段声纹信号进行分帧、加窗处理，帧长为16毫秒，帧移为帧长一半，窗函数使用汉明窗，对每一帧信号提取其声纹特征，如16维美尔倒谱系数(MFCC)，对通过计算其一阶、二阶差分，将特征扩展为48维，得到每段声纹信号的声纹特征序列；

(3)以(2)同样方法提取相应的检材声纹信号特征；

本实施例的声纹特征模板计算步骤包括：

(1)对一组相同词汇所对应的声纹特征，计算该组声纹信号较稳定的信号；

(2)以该较稳定信号特征为初始模板，将其余信号与该较稳定信号对齐；

本实施例的样本特征间阈值计算步骤包括：

(1)以特征模板为参考，使用动态规划方法将该模板对应的其余声纹特征对齐；

(2)计算各个特征与模板间的匹配距离，进而求解所有匹配距离的均值μ和标准差σ；

(3)以Th＝αμ+βσ计算阈值，其中α、β为阈值调节系数，本实施例均取1；本实施例的样本声纹特征模板和检材声纹特征模板的比对步骤包括：

(1)以样本特征模板为参考，使用动态规划方法将检材模板对齐；

(2)计算样本模板和检材模板间的帧间匹配距离；

(3)将匹配距离值与阈值比较得出匹配结果。

Claims

1.快速声纹认证方法，其特征在于该方法包括以下步骤：

2.如权力要求1所述方法，其特征在于步骤(3)、(4)中的特征提取处理，该方法包括以下步骤：