CN102254551A - 声纹认证装置 - Google Patents

声纹认证装置 Download PDF

Info

Publication number
CN102254551A
CN102254551A CN2010101799742A CN201010179974A CN102254551A CN 102254551 A CN102254551 A CN 102254551A CN 2010101799742 A CN2010101799742 A CN 2010101799742A CN 201010179974 A CN201010179974 A CN 201010179974A CN 102254551 A CN102254551 A CN 102254551A
Authority
CN
China
Prior art keywords
voiceprint
threshold value
signal
ratio
correcting module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010101799742A
Other languages
English (en)
Inventor
黄伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhangmen Science and Technology Co Ltd
Original Assignee
Shengle Information Technolpogy Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shengle Information Technolpogy Shanghai Co Ltd filed Critical Shengle Information Technolpogy Shanghai Co Ltd
Priority to CN2010101799742A priority Critical patent/CN102254551A/zh
Publication of CN102254551A publication Critical patent/CN102254551A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Collating Specific Patterns (AREA)

Abstract

本发明公开了一种声纹认证装置,包括声纹认证系统、背景噪声监测模块、动态阀值修正模块;背景噪声监测模块用于监测背景噪声,输出背景噪声信号;动态阀值修正模块,接收背景噪声信号并确定信噪比,根据所述信噪比动态确定一阀值;声纹认证系统,根据声纹测试分数和所述动态阀值修正模块确定的阈值之间的关系,给出声纹识别判决。本发明的声纹认证装置,能在各种不同的背景噪声环境下保持相对稳定的系统性能,不至于导致发生大量的用户的正确请求被拒绝或者错误请求被接受的情况。

Description

声纹认证装置
技术领域
本发明涉及身份识别技术,特别涉及一种声纹认证装置。
背景技术
声纹认证作为一种利用人的生物特征进行身份认证的技术,由于其便利性及准确性被广为关注。传统的声纹认证系统往往是根据系统开发阶段的测试,预先设定一个固定的判决阈值,在实际使用中,根据声纹测试分数和阈值之间的关系,给出一个声纹识别判决。
但是在实际使用环境中,面临着各种背景噪声以及信道干扰,而各种环境噪声的引入,导致实际应用的时候声纹测试评分的分布发生变化(变形、平移等等),使预先设定的阈值与真实环境不符合,使得事先设定的阈值不起作用,导致正确的请求被拒绝,或者错误的请求被接受,声纹认证系统的用户体验往往受到极大的影响。
图1是噪声对声纹认证系统阈值的影响示意图,其中一环境下在错误接受率FA曲线和错误拒绝率FR曲线相交处,声纹认证系统具有相同的错误接受率和错误拒绝率,这一点称为等错误率点。通常,安静环境下的错误接受率FA1曲线同安静环境下的错误拒绝率FR1曲线相交处的阈值T0被作为系统的阈值,因为风险最小。但是在噪声环境下由于噪声的引入,会导致声纹认证系统的评分分布发生整体的变形或偏移,此时,声纹认证系统的错误接受率FA2曲线和错误拒绝率FR2曲线相交处的阈值T0’已偏离于安静环境下的错误接受率FA1曲线同安静环境下的错误拒绝率FR1曲线相交处的阈值T0,若此时继续用安静环境下的错误接受率曲线FA1同安静环境下的错误拒绝率曲线FR1相交处的阈值T0作为系统的阈值,声纹认证系统虽然有较低的错误接受率,但是错误拒绝率会有显著的上升,导致真实用户的多次请求被拒绝,从而影响到用户的体验。
采用固定阈值对声纹认证系统的影响如表1所示,一声纹认证系统采用相同的阀值,当信噪比由大变小时,错误接受率FA降低,但是错误拒绝率FR有显著的上升。
表1
  SNR(dB)   FR   FA   阈值
  5   1.5   7.79   0.167
  10   0.86   8.53   0.167
  15   0.29   9.0   0.167
  20   0.28   9.86   0.167
  25   0   10.9   0.167
  均值   0.59   9.22
发明内容
本发明要解决的技术问题是提供一种声纹认证装置,能在各种不同的背景噪声环境下保持相对稳定的系统性能,不至于导致发生大量的用户的正确请求被拒绝或者错误请求被接受的情况。
为解决上述技术问题,本发明的声纹认证装置,包括声纹认证系统,还包括背景噪声监测模块、动态阀值修正模块;
所述背景噪声监测模块,用于监测背景噪声,输出背景噪声信号到所述动态阀值修正模块;
所述动态阀值修正模块,接收背景噪声信号并确定信噪比,根据所述信噪比动态确定一阀值;
所述声纹认证系统,根据声纹测试分数和所述动态阀值修正模块确定的阈值之间的关系,给出声纹识别判决。
所述动态阀值修正模块确定的阈值可以为:
ThFA=C*log(SNR)+f(FA),f(FA)=D*FA2-E*FA+K,
式中ThFA为对于一个固定的错误接受率的阈值,FA为错误接受率,SNR为信噪比,C、D、E、K为常数;例如,C=0.08,D=0.01,E=0.12,K=0.39。
所述动态阀值修正模块确定的阈值可以为:
ThFR=C*log(SNR)+f(FR),f(FR)=-(D*FR2-E*FR+K),
式中ThFR为对于一个固定的错误拒绝率的阈值,FR为错误拒绝率,SNR为信噪比,C、D、E、K为常数;例如C=0.2,D=0.01,E=0.12,K=0.39。
本发明的声纹认证装置,根据监测到的环境噪声水平,对系统判决阈值进行相应的调整,通过动态的去修正判决阈值,使得声纹认证系统在各种不同的背景噪声环境下,都能保持一种相对稳定的系统性能,不至于导致发生大量的用户的正确请求被拒绝或者错误请求被接受的情况。
附图说明
下面结合附图及具体实施方式对本发明作进一步详细说明。
图1是噪声对声纹认证系统阈值的影响示意图;
图2是本发明的声纹认证装置结构示意图;
图3是采用固定错误接受率FA时的阈值曲线;
图4是用固定错误拒绝率FR时的阈值曲线。
具体实施方式
本发明的声纹认证装置一实施方式如图2所示,包括背景噪声监测模块、动态阀值修正模块、声纹认证系统。
所述背景噪声监测模块,用于监测背景噪声,输出背景噪声信号到所述动态阀值修正模块;
所述动态阀值修正模块,接收背景噪声信号并确定信噪比SNR,根据所述信噪比确定一阀值Th,所述阈值Th可以表示为一个与环境噪声相关的函数Th=f(SNR)。
对于一个固定的错误接受率FA,所述动态阀值修正模块确定的阈值可以表示为:
ThFA=C*log(SNR)+f(FA),f(FA)=D*FA2-E*FA+K    (1)
式(1)中ThFA为对于一个固定的错误接受率的阈值,FA为错误接受率,SNR为信噪比,C、D、E、K为常数,其值可以通过仿真的方法得到,一实施例中,C=0.08,D=0.01,E=0.12,K=0.39;
而对于一个固定的错误拒绝率FR,所述动态阀值修正模块确定的阈值可以表示为:
ThFR=C*log(SNR)+f(FR),f(FR)=-(D*FR2-E*FR+K)     (2)
式(2)中ThFR为对于一个固定的错误拒绝率的阈值,FR为错误拒绝率,SNR为信噪比,C、D、E、K为常数,其值可以通过仿真的方法得到,一实施例中,C=0.2,D=0.01,E=0.12,K=0.39;
可以分别在不同噪音类别(如平稳噪音、不平稳噪音)情况下进行仿真得到所述阀值表示式(1)及(2)中的C、D、E、K的值。
采用固定错误接受率FA时的阈值曲线如图3所示,图中标有“0”的线为通过式(1)得到的阈值曲线,标有“*”的线为根据实际测量值得到的对应于各固定错误接受率FA的阈值曲线,通过对所述两种阀值曲线的拟合,可以得到式(1)中C、D、E、K的值。
采用固定错误拒绝率FR时的阈值曲线如图4所示,图中标有“0”的线为通过式(2)得到的阈值曲线,标有“*”的线为根据实际测量值得到的对应于各固定错误拒绝率FR的阈值曲线,通过对所述两种阀值曲线的拟合,可以得到式(2)中C、D、E、K的值。
所述声纹认证系统,根据声纹测试分数和所述动态阀值修正模块确定的阈值之间的关系,给出一个声纹识别判决。
本发明的声纹认证装置,根据监测到的环境噪声水平,对系统判决阈值进行相应的调整,通过动态的去修正判决阈值,使得声纹认证系统在各种不同的背景噪声环境下,都能保持一种相对稳定的系统性能,不至于导致发生大量的用户的正确请求被拒绝或者错误请求被接受的情况。

Claims (5)

1.一种声纹认证装置,包括声纹认证系统,其特征在于,还包括背景噪声监测模块、动态阀值修正模块;
所述背景噪声监测模块,用于监测背景噪声,输出背景噪声信号到所述动态阀值修正模块;
所述动态阀值修正模块,接收背景噪声信号并确定信噪比,根据所述信噪比动态确定一阀值;
所述声纹认证系统,根据声纹测试分数和所述动态阀值修正模块确定的阈值之间的关系,给出声纹识别判决。
2.根据权利要求1所述的声纹认证装置,其特征在于,所述动态阀值修正模块确定的阈值为:
ThFA=C*log(SNR)+f(FA),f(FA)=D*FA2-E*FA+K,
式中ThFA为对于一个固定的错误接受率的阈值,FA为错误接受率,SNR为信噪比,C、D、E、K为常数。
3.根据权利要求2所述的声纹认证装置,其特征在于,C=0.08,D=0.01,E=0.12,K=0.39。
4.根据权利要求1所述的声纹认证装置,其特征在于,所述动态阀值修正模块确定的阈值为:
ThFR=C*log(SNR)+f(FR),f(FR)=-(D*FR2-E*FR+K),
式中ThFR为对于一个固定的错误拒绝率的阈值,FR为错误拒绝率,SNR为信噪比,C、D、E、K为常数。
5.根据权利要求4所述的声纹认证装置,其特征在于,C=0.2,D=0.01,E=0.12,K=0.39。
CN2010101799742A 2010-05-20 2010-05-20 声纹认证装置 Pending CN102254551A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010101799742A CN102254551A (zh) 2010-05-20 2010-05-20 声纹认证装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101799742A CN102254551A (zh) 2010-05-20 2010-05-20 声纹认证装置

Publications (1)

Publication Number Publication Date
CN102254551A true CN102254551A (zh) 2011-11-23

Family

ID=44981763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101799742A Pending CN102254551A (zh) 2010-05-20 2010-05-20 声纹认证装置

Country Status (1)

Country Link
CN (1) CN102254551A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366743A (zh) * 2012-03-30 2013-10-23 北京千橡网景科技发展有限公司 操作语音命令的方法和装置
CN106033670A (zh) * 2015-03-19 2016-10-19 科大讯飞股份有限公司 声纹密码认证方法及系统
CN107886943A (zh) * 2017-11-21 2018-04-06 广州势必可赢网络科技有限公司 一种声纹识别方法及装置
CN108885873A (zh) * 2016-03-29 2018-11-23 英特尔公司 使用自适应阈值的说话者识别
CN111199729A (zh) * 2018-11-19 2020-05-26 阿里巴巴集团控股有限公司 声纹识别方法及装置
CN112951247A (zh) * 2021-03-23 2021-06-11 上海掌数科技有限公司 一种基于应用场景进行声纹快速验证的方法及其应用
WO2021179854A1 (zh) * 2020-03-12 2021-09-16 Oppo广东移动通信有限公司 声纹唤醒方法及装置、设备、存储介质
CN113593581A (zh) * 2021-07-12 2021-11-02 西安讯飞超脑信息科技有限公司 声纹判别方法、装置、计算机设备和存储介质
WO2023004561A1 (en) * 2021-07-27 2023-02-02 Qualcomm Incorporated Voice or speech recognition using contextual information and user emotion

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366743A (zh) * 2012-03-30 2013-10-23 北京千橡网景科技发展有限公司 操作语音命令的方法和装置
CN106033670A (zh) * 2015-03-19 2016-10-19 科大讯飞股份有限公司 声纹密码认证方法及系统
CN108885873A (zh) * 2016-03-29 2018-11-23 英特尔公司 使用自适应阈值的说话者识别
CN107886943A (zh) * 2017-11-21 2018-04-06 广州势必可赢网络科技有限公司 一种声纹识别方法及装置
CN111199729A (zh) * 2018-11-19 2020-05-26 阿里巴巴集团控股有限公司 声纹识别方法及装置
CN111199729B (zh) * 2018-11-19 2023-09-26 阿里巴巴集团控股有限公司 声纹识别方法及装置
WO2021179854A1 (zh) * 2020-03-12 2021-09-16 Oppo广东移动通信有限公司 声纹唤醒方法及装置、设备、存储介质
CN112951247A (zh) * 2021-03-23 2021-06-11 上海掌数科技有限公司 一种基于应用场景进行声纹快速验证的方法及其应用
CN113593581A (zh) * 2021-07-12 2021-11-02 西安讯飞超脑信息科技有限公司 声纹判别方法、装置、计算机设备和存储介质
CN113593581B (zh) * 2021-07-12 2024-04-19 西安讯飞超脑信息科技有限公司 声纹判别方法、装置、计算机设备和存储介质
WO2023004561A1 (en) * 2021-07-27 2023-02-02 Qualcomm Incorporated Voice or speech recognition using contextual information and user emotion

Similar Documents

Publication Publication Date Title
CN102254551A (zh) 声纹认证装置
Aneeja et al. Single frequency filtering approach for discriminating speech and nonspeech
CN102804261B (zh) 用于语音编码器的方法和语音活动检测器
US10242677B2 (en) Speaker dependent voiced sound pattern detection thresholds
CN110265020B (zh) 语音唤醒方法、装置及电子设备、存储介质
US20080228478A1 (en) Targeted speech
CN110517670A (zh) 提升唤醒性能的方法和装置
US9934793B2 (en) Method for determining alcohol consumption, and recording medium and terminal for carrying out same
CN104732978A (zh) 基于联合深度学习的文本相关的说话人识别方法
US20100329471A1 (en) Ambient noise compensation system
CN105448303A (zh) 语音信号的处理方法和装置
CN104464722A (zh) 基于时域和频域的语音活性检测方法和设备
WO2010138445A3 (en) Managed real-time transaction fraud analysis and decisioning
CN101452701B (zh) 基于反模型的置信度估计方法及装置
CN101510423B (zh) 一种分层次、交互式发音质量评估与诊断系统
US9792898B2 (en) Concurrent segmentation of multiple similar vocalizations
US20150073781A1 (en) Method and Apparatus for Detecting Correctness of Pitch Period
US11935524B1 (en) Authentication of impaired voices
CN1949364A (zh) 检测输入语音信号可识别度的系统与方法
US20150254054A1 (en) Audio Signal Processing
Sangwan et al. Studying the relationship between physical and language environments of children: Who's speaking to whom and where?
KR101621780B1 (ko) 차신호 주파수 프레임 비교법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치
CN106200950B (zh) 一种可调整字体大小的方法及移动终端
Berisha et al. Real-time implementation of a distributed voice activity detector
KR101276204B1 (ko) 멀티모달 융합을 위한 환경변수 측정방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
ASS Succession or assignment of patent right

Owner name: SHANGHAI ZHANGMEN TECHNOLOGY CO., LTD.

Free format text: FORMER OWNER: SHENGYUE INFORMATION TECHNOLOGY (SHANGHAI) CO., LTD.

Effective date: 20130603

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20130603

Address after: 201203 Pudong New Area Huaxia Road, Lane No. 958, No. 60, Shanghai

Applicant after: SHANGHAI ZHANGMEN TECHNOLOGY CO., LTD.

Address before: 201203 Shanghai Guo Shou Jing Road, Pudong New Area Zhangjiang hi tech Park No. 356

Applicant before: Shengle Information Technology (Shanghai) Co., Ltd.

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20111123