CN112951247A - 一种基于应用场景进行声纹快速验证的方法及其应用 - Google Patents

一种基于应用场景进行声纹快速验证的方法及其应用 Download PDF

Info

Publication number
CN112951247A
CN112951247A CN202110308700.7A CN202110308700A CN112951247A CN 112951247 A CN112951247 A CN 112951247A CN 202110308700 A CN202110308700 A CN 202110308700A CN 112951247 A CN112951247 A CN 112951247A
Authority
CN
China
Prior art keywords
voiceprint
voice
application
score
verification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110308700.7A
Other languages
English (en)
Inventor
刘建
高星
丁颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhangshu Technology Co ltd
Original Assignee
Shanghai Zhangshu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhangshu Technology Co ltd filed Critical Shanghai Zhangshu Technology Co ltd
Priority to CN202110308700.7A priority Critical patent/CN112951247A/zh
Publication of CN112951247A publication Critical patent/CN112951247A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/08Use of distortion metrics or a particular distance between probe pattern and reference templates

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明公开了一种基于应用场景进行声纹快速验证的方法及其应用,其步骤为:获取应用场景后,基于应用场景确定声纹判定阈值;获取待验证的语音并将待验证的语音输入概率线性区分性分析分类器,概率线性区分性分析分类器输出声纹得分;判断声纹得分是否大于等于声纹判定阈值,如是则声纹验证通过,反之则声纹验证不通过;概率线性区分性分析分类器的训练过程为以身份已知的语音为输入,以该语音的声纹得分为理论输出,不断调整参数的过程。本发明的方法,针对不同应用场景设定不同的阈值,缓解了数据处理量过大的问题,提高验证数据,改善用户体验,极具应用前景。

Description

一种基于应用场景进行声纹快速验证的方法及其应用
技术领域
本发明属于声纹验证技术领域,涉及一种基于应用场景进行声纹快速验证的方法及其应用,特别涉及一种基于不同应用场景设定声纹得分进而完成声纹快速验证的方法及其应用。
背景技术
近年来随着技术的不断进步,线上服务越来越成为了人们生活的日常,银行、证券、保险等行业的线上服务不断上线,由于安全的需要,近年来证券行业开始实施投资者适当性管理办法,办法要求在行业全面推行双录。双录主要是对客户办理业务的过程,特别是风险揭示过程进行留底,用这样的方式可以规范金融销售的行为,同时也为日后争议提供依据。远程双录具体是指投资者通过网络线上办理业务时,需要同步录音、录像,以规范业务办理、加强投资者保护。
声纹指语音波形中反映说话人生理和行为信息的声学参数特征,每个人的声纹具有唯一性、独特性,可用于进行身份识别。与指纹、人脸、虹膜等生物特征相比,声纹具有非接触获取、采集成本低、便于远程认证的优点。
声纹识别是一项提取说话人声音特征和说话内容信息,自动核验说话人身份的技术,在基于网络、电话的远程身份认证中有着得天独厚的的优势。
经过证券公司几年对金融科技的持续投入,在互联网端、移动终端等多渠道布局,投资者也倾向于通过APP来开户或者预约开通业务权限,目前对个人客户的多数办理需求已经实现了线上化支持,往往可以通过进行客户远程身份认证进而对个人客户进行远程授权,以方便个人客户进行线上办理业务。但是当前的身份认证均采用同一标准,其虽然具有安全性好的特点,但相对而已其对数据的调用量更大,对服务器要求较高,同时其处理速度较慢,一定程度上影响了客户用户体验,如客户登录账号等低风险操作也需要进行最高等级的声纹身份认证。
因此,开发一种基于应用场景进行声纹快速验证的方法极具现实意义。
发明内容
本发明的目的在于克服现有声纹验证数据处理量较大、未基于应用场景设计且用户体验较差的缺陷,提供一种基于应用场景进行声纹快速验证的方法及其应用。
为实现上述目的,本发明提供如下技术方案:
一种基于应用场景进行声纹快速验证的方法,应用于电子设备,其步骤如下:
(1)获取应用场景后,基于应用场景确定声纹判定阈值;
(2)获取待验证的语音并将待验证的语音输入概率线性区分性分析(PLDA)分类器,概率线性区分性分析(PLDA)分类器输出声纹得分;
(3)判断步骤(2)获取的声纹得分是否大于等于步骤(1)确定的声纹判定阈值,如是则声纹验证通过,反之则声纹验证不通过;
所述概率线性区分性分析(PLDA)分类器的训练过程为以身份已知的语音为输入,以该语音的声纹得分为理论输出,不断调整参数的过程,训练的终止条件为声纹验证的准确率与预定的声纹得分匹配(具体地,声纹验证的准确率与预定的声纹得分匹配是指声纹验证的准确率为99%与声纹得分为80分匹配,训练的目标是使得相同说话人的特征值相识度越来越好,不同说话人的特征值差异越来越大)。
本发明的基于应用场景进行声纹快速验证的方法,采用概率线性区分性分析(PLDA)分类器获取声纹得分,PLDA采用大量的跨信道、一人多条数据训练而成,比一般的余弦(Cosine)距离区分性、鲁棒性更好,为了便于计算评估,得分采用百分制,得分越高代表相似度越高,同时本发明针对不同的场景对声纹的严谨性要求不一样的这一问题,针对不同场景设定不同的声纹判定阈值(声纹判定阈值即是基于具体的场景测试集得到的较优经验值)。比如,在双录场景中,是利用声纹识别结果值辅助人工进行判断决策,这属于较宽松的应用场景,相对声纹准确率要求会有所降低。对此,本发明可在双录业务存量数据随机选取100人,每人2条语音作为测试集,1条用于声纹登记,1条用于声纹验证,正负样本进行交叉测试,根据该场景下声纹验证准确率99%为目标作为基准,反推得出声纹得分阈值为80分。那么得分超过80分的,则认定声纹验证通过,低于80分则不通过。
本发明针对不同应用场景设定不同的阈值,一方面缓解了数据处理量过大的问题,另一方面能够大大提高验证数据,改善用户体验,差异化阈值的设定在保证使用安全性的同时大大改善了用户体验,极具应用前景。
作为优选的技术方案:
如上所述的一种基于应用场景进行声纹快速验证的方法,所述声纹得分采用百分制。
如上所述的一种基于应用场景进行声纹快速验证的方法,所述声纹判定阈值是应用场景对应的语音测试集测试得到的经验值。
此外,本发明还提供了采用如上所述的一种基于应用场景进行声纹快速验证的方法的电子设备,包括一个或多个处理器、一个或多个存储器、一个或多个程序、用于获取待验证的语音的语音收集装置;
所述一个或多个程序被存储在所述存储器中,当所述一个或多个程序被所述处理器执行时,使得所述电子设备执行如上所述的基于应用场景进行声纹快速验证的方法。
有益效果:
本发明的基于应用场景进行声纹快速验证的方法,针对不同应用场景设定不同的阈值,一方面缓解了数据处理量过大的问题,另一方面能够大大提高验证数据,改善用户体验,差异化阈值的设定在保证使用安全性的同时大大改善了用户体验,极具应用前景。
附图说明
图1为本发明的基于应用场景进行声纹快速验证的方法的流程图。
具体实施方式
下面结合附图,对本发明的具体实施方式做进一步阐述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
实施例1
一种基于应用场景进行声纹快速验证的方法,应用于电子设备,其步骤如图1所示:
(1)获取应用场景后,基于应用场景确定声纹判定阈值;
(2)获取待验证的语音并将待验证的语音输入概率线性区分性分析分类器,概率线性区分性分析分类器输出声纹得分;
(3)判断步骤(2)获取的声纹得分是否大于等于步骤(1)确定的声纹判定阈值,如是则声纹验证通过,反之则声纹验证不通过;
概率线性区分性分析分类器的训练过程为以身份已知的语音为输入,以该语音的声纹得分为理论输出,不断调整参数的过程,声纹得分采用百分制,声纹验证的准确率为99%与声纹得分为80分匹配,训练的目标是使得相同说话人的特征值相识度越来越好,不同说话人的特征值差异越来越大;
声纹判定阈值是应用场景对应的语音测试集输入训练好的概率线性区分性分析分类器后测试得到的经验值。
经验证,本发明的基于应用场景进行声纹快速验证的方法,针对不同应用场景设定不同的阈值,一方面缓解了数据处理量过大的问题,另一方面能够大大提高验证数据,改善用户体验,差异化阈值的设定在保证使用安全性的同时大大改善了用户体验,极具应用前景。
实施例2
一种电子设备,包括一个或多个处理器、一个或多个存储器、一个或多个程序、用于获取待验证的语音的语音收集装置;
一个或多个程序被存储在存储器中,当一个或多个程序被处理器执行时,使得电子设备执行与实施例1相同的基于应用场景进行声纹快速验证的方法。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应该理解,这些仅是举例说明,在不违背本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改。

Claims (4)

1.一种基于应用场景进行声纹快速验证的方法,应用于电子设备,其特征在于,其步骤如下:
(1)获取应用场景后,基于应用场景确定声纹判定阈值;
(2)获取待验证的语音并将待验证的语音输入概率线性区分性分析分类器,概率线性区分性分析分类器输出声纹得分;
(3)判断步骤(2)获取的声纹得分是否大于等于步骤(1)确定的声纹判定阈值,如是则声纹验证通过,反之则声纹验证不通过;
所述概率线性区分性分析分类器的训练过程为以身份已知的语音为输入,以该语音的声纹得分为理论输出,不断调整参数的过程。
2.根据权利要求1所述的一种基于应用场景进行声纹快速验证的方法,其特征在于,所述声纹得分采用百分制。
3.根据权利要求1所述的一种基于应用场景进行声纹快速验证的方法,其特征在于,所述声纹判定阈值是应用场景对应的语音测试集测试得到的经验值。
4.采用如权利要求1~3任一项所述的一种基于应用场景进行声纹快速验证的方法的电子设备,其特征在于,包括一个或多个处理器、一个或多个存储器、一个或多个程序、用于获取待验证的语音的语音收集装置;
所述一个或多个程序被存储在所述存储器中,当所述一个或多个程序被所述处理器执行时,使得所述电子设备执行如权利要求1~3任一项所述的基于应用场景进行声纹快速验证的方法。
CN202110308700.7A 2021-03-23 2021-03-23 一种基于应用场景进行声纹快速验证的方法及其应用 Pending CN112951247A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110308700.7A CN112951247A (zh) 2021-03-23 2021-03-23 一种基于应用场景进行声纹快速验证的方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110308700.7A CN112951247A (zh) 2021-03-23 2021-03-23 一种基于应用场景进行声纹快速验证的方法及其应用

Publications (1)

Publication Number Publication Date
CN112951247A true CN112951247A (zh) 2021-06-11

Family

ID=76227603

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110308700.7A Pending CN112951247A (zh) 2021-03-23 2021-03-23 一种基于应用场景进行声纹快速验证的方法及其应用

Country Status (1)

Country Link
CN (1) CN112951247A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024119722A1 (zh) * 2022-12-05 2024-06-13 中兴通讯股份有限公司 语音鉴权方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254551A (zh) * 2010-05-20 2011-11-23 盛乐信息技术(上海)有限公司 声纹认证装置
CN105825553A (zh) * 2016-05-31 2016-08-03 广州势必可赢网络科技有限公司 声纹验证方法及其系统
CN105960628A (zh) * 2014-06-24 2016-09-21 谷歌公司 用于说话者验证的动态阈值
CN107864121A (zh) * 2017-09-30 2018-03-30 上海壹账通金融科技有限公司 用户身份验证方法及应用服务器
CN108647874A (zh) * 2018-05-04 2018-10-12 科大讯飞股份有限公司 门限阈值确定方法及装置
CN110517696A (zh) * 2019-08-19 2019-11-29 效生软件科技(上海)有限公司 一种可植入式离线声纹识别系统
WO2019228004A1 (zh) * 2018-05-28 2019-12-05 阿里巴巴集团控股有限公司 一种核身方法和装置
CN111199742A (zh) * 2018-11-20 2020-05-26 阿里巴巴集团控股有限公司 一种身份验证方法、装置及计算设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254551A (zh) * 2010-05-20 2011-11-23 盛乐信息技术(上海)有限公司 声纹认证装置
CN105960628A (zh) * 2014-06-24 2016-09-21 谷歌公司 用于说话者验证的动态阈值
CN105825553A (zh) * 2016-05-31 2016-08-03 广州势必可赢网络科技有限公司 声纹验证方法及其系统
CN107864121A (zh) * 2017-09-30 2018-03-30 上海壹账通金融科技有限公司 用户身份验证方法及应用服务器
CN108647874A (zh) * 2018-05-04 2018-10-12 科大讯飞股份有限公司 门限阈值确定方法及装置
WO2019228004A1 (zh) * 2018-05-28 2019-12-05 阿里巴巴集团控股有限公司 一种核身方法和装置
CN111199742A (zh) * 2018-11-20 2020-05-26 阿里巴巴集团控股有限公司 一种身份验证方法、装置及计算设备
CN110517696A (zh) * 2019-08-19 2019-11-29 效生软件科技(上海)有限公司 一种可植入式离线声纹识别系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘弘胤: "AI赋能下的声纹识别技术在公共安全领域的深度应用", 《中国安防》 *
梁宏宇等: "基于最大团的防骗贷算法研究", 《信息安全研究》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024119722A1 (zh) * 2022-12-05 2024-06-13 中兴通讯股份有限公司 语音鉴权方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
AU2017266971B2 (en) Identity authentication method and apparatus
CN104834849B (zh) 基于声纹识别和人脸识别的双因素身份认证方法及系统
Johnson et al. Multimodal fusion vulnerability to non-zero effort (spoof) imposters
CN105740683B (zh) 基于多因素、多引擎、人机相结合的身份验证方法与系统
US6810480B1 (en) Verification of identity and continued presence of computer users
US20210089635A1 (en) Biometric identity verification and protection software solution
WO2018082011A1 (zh) 活体指纹识别方法及装置
CN103841108A (zh) 用户生物特征的认证方法和系统
CN105991593B (zh) 一种识别用户风险的方法及装置
CN102142254A (zh) 基于声纹识别和语音识别的防录音假冒的身份确认方法
CN104376250A (zh) 基于音型像特征的真人活体身份验证方法
CN113257255B (zh) 一种伪造语音的识别方法、装置、电子设备及存储介质
CN111932270B (zh) 银行客户身份验证的方法及装置
CN106991312A (zh) 基于声纹识别的互联网反欺诈认证方法
CN112951247A (zh) 一种基于应用场景进行声纹快速验证的方法及其应用
CN111611437A (zh) 一种防止人脸声纹验证替换攻击的方法及装置
CN117853103A (zh) 基于智能手环的支付系统激活方法
CN111370000A (zh) 声纹识别算法评估方法、系统、移动终端及存储介质
CN112769872B (zh) 一种基于音频及视频特征融合的会议系统接入方法及系统
CN105245497B (zh) 一种身份认证方法及装置
CN110850419B (zh) 一种基于声学的手写签名识别方法
TWI778234B (zh) 語者驗證系統
Mohammed et al. Evaluation of Voice & Ear Biometrics Authentication System
TW202226015A (zh) 用於指紋認證的方法、設備和非瞬態計算機可讀存儲介質
Saleh et al. Multimodal person identification through the fusion of face and voice biometrics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210611

RJ01 Rejection of invention patent application after publication