CN102254551A

CN102254551A - 声纹认证装置

Info

Publication number: CN102254551A
Application number: CN2010101799742A
Authority: CN
Inventors: 黄伟
Original assignee: Shengle Information Technolpogy Shanghai Co Ltd
Current assignee: Shanghai Zhangmen Science and Technology Co Ltd
Priority date: 2010-05-20
Filing date: 2010-05-20
Publication date: 2011-11-23

Abstract

本发明公开了一种声纹认证装置，包括声纹认证系统、背景噪声监测模块、动态阀值修正模块；背景噪声监测模块用于监测背景噪声，输出背景噪声信号；动态阀值修正模块，接收背景噪声信号并确定信噪比，根据所述信噪比动态确定一阀值；声纹认证系统，根据声纹测试分数和所述动态阀值修正模块确定的阈值之间的关系，给出声纹识别判决。本发明的声纹认证装置，能在各种不同的背景噪声环境下保持相对稳定的系统性能，不至于导致发生大量的用户的正确请求被拒绝或者错误请求被接受的情况。

Description

声纹认证装置

技术领域

本发明涉及身份识别技术，特别涉及一种声纹认证装置。

背景技术

声纹认证作为一种利用人的生物特征进行身份认证的技术，由于其便利性及准确性被广为关注。传统的声纹认证系统往往是根据系统开发阶段的测试，预先设定一个固定的判决阈值，在实际使用中，根据声纹测试分数和阈值之间的关系，给出一个声纹识别判决。

但是在实际使用环境中，面临着各种背景噪声以及信道干扰，而各种环境噪声的引入，导致实际应用的时候声纹测试评分的分布发生变化(变形、平移等等)，使预先设定的阈值与真实环境不符合，使得事先设定的阈值不起作用，导致正确的请求被拒绝，或者错误的请求被接受，声纹认证系统的用户体验往往受到极大的影响。

图1是噪声对声纹认证系统阈值的影响示意图，其中一环境下在错误接受率FA曲线和错误拒绝率FR曲线相交处，声纹认证系统具有相同的错误接受率和错误拒绝率，这一点称为等错误率点。通常，安静环境下的错误接受率FA1曲线同安静环境下的错误拒绝率FR1曲线相交处的阈值T₀被作为系统的阈值，因为风险最小。但是在噪声环境下由于噪声的引入，会导致声纹认证系统的评分分布发生整体的变形或偏移，此时，声纹认证系统的错误接受率FA2曲线和错误拒绝率FR2曲线相交处的阈值T₀’已偏离于安静环境下的错误接受率FA1曲线同安静环境下的错误拒绝率FR1曲线相交处的阈值T₀，若此时继续用安静环境下的错误接受率曲线FA1同安静环境下的错误拒绝率曲线FR1相交处的阈值T₀作为系统的阈值，声纹认证系统虽然有较低的错误接受率，但是错误拒绝率会有显著的上升，导致真实用户的多次请求被拒绝，从而影响到用户的体验。

采用固定阈值对声纹认证系统的影响如表1所示，一声纹认证系统采用相同的阀值，当信噪比由大变小时，错误接受率FA降低，但是错误拒绝率FR有显著的上升。

表1

SNR(dB)	FR	FA	阈值
				5	1.5	7.79	0.167
10	0.86	8.53	0.167
				15	0.29	9.0	0.167
20	0.28	9.86	0.167
				25	0	10.9	0.167
均值	0.59	9.22

发明内容

本发明要解决的技术问题是提供一种声纹认证装置，能在各种不同的背景噪声环境下保持相对稳定的系统性能，不至于导致发生大量的用户的正确请求被拒绝或者错误请求被接受的情况。

为解决上述技术问题，本发明的声纹认证装置，包括声纹认证系统，还包括背景噪声监测模块、动态阀值修正模块；

所述背景噪声监测模块，用于监测背景噪声，输出背景噪声信号到所述动态阀值修正模块；

所述动态阀值修正模块，接收背景噪声信号并确定信噪比，根据所述信噪比动态确定一阀值；

所述声纹认证系统，根据声纹测试分数和所述动态阀值修正模块确定的阈值之间的关系，给出声纹识别判决。

所述动态阀值修正模块确定的阈值可以为：

Th_FA＝C*log(SNR)+f(FA)，f(FA)＝D*FA²-E*FA+K，

式中Th_FA为对于一个固定的错误接受率的阈值，FA为错误接受率，SNR为信噪比，C、D、E、K为常数；例如，C＝0.08，D＝0.01，E＝0.12，K＝0.39。

所述动态阀值修正模块确定的阈值可以为：

Th_FR＝C*log(SNR)+f(FR)，f(FR)＝-(D*FR²-E*FR+K)，

式中Th_FR为对于一个固定的错误拒绝率的阈值，FR为错误拒绝率，SNR为信噪比，C、D、E、K为常数；例如C＝0.2，D＝0.01，E＝0.12，K＝0.39。

本发明的声纹认证装置，根据监测到的环境噪声水平，对系统判决阈值进行相应的调整，通过动态的去修正判决阈值，使得声纹认证系统在各种不同的背景噪声环境下，都能保持一种相对稳定的系统性能，不至于导致发生大量的用户的正确请求被拒绝或者错误请求被接受的情况。

附图说明

下面结合附图及具体实施方式对本发明作进一步详细说明。

图1是噪声对声纹认证系统阈值的影响示意图；

图2是本发明的声纹认证装置结构示意图；

图3是采用固定错误接受率FA时的阈值曲线；

图4是用固定错误拒绝率FR时的阈值曲线。

具体实施方式

本发明的声纹认证装置一实施方式如图2所示，包括背景噪声监测模块、动态阀值修正模块、声纹认证系统。

所述动态阀值修正模块，接收背景噪声信号并确定信噪比SNR，根据所述信噪比确定一阀值Th，所述阈值Th可以表示为一个与环境噪声相关的函数Th＝f(SNR)。

对于一个固定的错误接受率FA，所述动态阀值修正模块确定的阈值可以表示为：

Th_FA＝C*log(SNR)+f(FA)，f(FA)＝D*FA²-E*FA+K (1)

式(1)中Th_FA为对于一个固定的错误接受率的阈值，FA为错误接受率，SNR为信噪比，C、D、E、K为常数，其值可以通过仿真的方法得到，一实施例中，C＝0.08，D＝0.01，E＝0.12，K＝0.39；

而对于一个固定的错误拒绝率FR，所述动态阀值修正模块确定的阈值可以表示为：

Th_FR＝C*log(SNR)+f(FR)，f(FR)＝-(D*FR²-E*FR+K) (2)

式(2)中Th_FR为对于一个固定的错误拒绝率的阈值，FR为错误拒绝率，SNR为信噪比，C、D、E、K为常数，其值可以通过仿真的方法得到，一实施例中，C＝0.2，D＝0.01，E＝0.12，K＝0.39；

可以分别在不同噪音类别(如平稳噪音、不平稳噪音)情况下进行仿真得到所述阀值表示式(1)及(2)中的C、D、E、K的值。

采用固定错误接受率FA时的阈值曲线如图3所示，图中标有“0”的线为通过式(1)得到的阈值曲线，标有“*”的线为根据实际测量值得到的对应于各固定错误接受率FA的阈值曲线，通过对所述两种阀值曲线的拟合，可以得到式(1)中C、D、E、K的值。

采用固定错误拒绝率FR时的阈值曲线如图4所示，图中标有“0”的线为通过式(2)得到的阈值曲线，标有“*”的线为根据实际测量值得到的对应于各固定错误拒绝率FR的阈值曲线，通过对所述两种阀值曲线的拟合，可以得到式(2)中C、D、E、K的值。

所述声纹认证系统，根据声纹测试分数和所述动态阀值修正模块确定的阈值之间的关系，给出一个声纹识别判决。

Claims

1.一种声纹认证装置，包括声纹认证系统，其特征在于，还包括背景噪声监测模块、动态阀值修正模块；

2.根据权利要求1所述的声纹认证装置，其特征在于，所述动态阀值修正模块确定的阈值为：

Th_FA＝C*log(SNR)+f(FA)，f(FA)＝D*FA²-E*FA+K，

式中Th_FA为对于一个固定的错误接受率的阈值，FA为错误接受率，SNR为信噪比，C、D、E、K为常数。

3.根据权利要求2所述的声纹认证装置，其特征在于，C＝0.08，D＝0.01，E＝0.12，K＝0.39。

4.根据权利要求1所述的声纹认证装置，其特征在于，所述动态阀值修正模块确定的阈值为：

Th_FR＝C*log(SNR)+f(FR)，f(FR)＝-(D*FR²-E*FR+K)，

式中Th_FR为对于一个固定的错误拒绝率的阈值，FR为错误拒绝率，SNR为信噪比，C、D、E、K为常数。

5.根据权利要求4所述的声纹认证装置，其特征在于，C＝0.2，D＝0.01，E＝0.12，K＝0.39。