CN110491389B - 一种话务系统的声纹识别方法 - Google Patents

一种话务系统的声纹识别方法 Download PDF

Info

Publication number
CN110491389B
CN110491389B CN201910766030.6A CN201910766030A CN110491389B CN 110491389 B CN110491389 B CN 110491389B CN 201910766030 A CN201910766030 A CN 201910766030A CN 110491389 B CN110491389 B CN 110491389B
Authority
CN
China
Prior art keywords
voiceprint
verification
pushing
engine
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910766030.6A
Other languages
English (en)
Other versions
CN110491389A (zh
Inventor
任超
钟亚希
陈志骏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Effective Software Technology Shanghai Co ltd
Original Assignee
Effective Software Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Effective Software Technology Shanghai Co ltd filed Critical Effective Software Technology Shanghai Co ltd
Priority to CN201910766030.6A priority Critical patent/CN110491389B/zh
Publication of CN110491389A publication Critical patent/CN110491389A/zh
Application granted granted Critical
Publication of CN110491389B publication Critical patent/CN110491389B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/04Training, enrolment or model building
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • H04M2203/6054Biometric subscriber identification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages

Abstract

本发明公开了一种话务系统的声纹识别方法,包括以下步骤:A、电话接入;B、查询用户ID是否声纹注册;如果未注册:通话结束后提取的有效时长大于30秒则进行声纹注册,否则注册失败,如果已注册:则进入验证环节;C、设置切入时间节点;D、话务系统截取部分音频;E、推送声纹服务器;F、返回初步验证结果;G、循环截取部分音频组合推送;H、返回最终验证结果,本发明采用语音流分包推送验证,声纹验证的次数更加多,避免了固定时长单词推送语音质量差导致的误识和误拒;并且采用新的推包的方式,免去核身的等待时间;同时会反馈出一系列的验证得分,可形成直观的验证曲线图表,更具有辨识度、提高用户的使用体验和业务处理效率。

Description

一种话务系统的声纹识别方法
技术领域
本发明涉及声音识别技术领域,具体是一种话务系统的声纹识别方法。
背景技术
随着移动网络信息换的发展,人们越来越依赖于通过电话手机来远程办理各种业务和服务,政府和企业也需要通过呼叫中心来服务客户,改善行政效率和加速商业进程。现有的预留问题/答案的验证方式和输入账号/密码的方式虽然简单方便,但安全性不高,用户的账号和密码很容易被窃取。预留问题和答案也很容易遗忘,延误业务和服务办理。因此,运用简单可靠的远程身份认证手段是呼叫中心的迫切需求。
在呼叫中心的日常业务中,用户很自然的会使用声音来传达信息,而对声音的身份验证,很自然的成为呼叫中心引入新身份认证手段的首选。声纹识别也特别适合呼叫中心,这是因为
(1)声纹具有表示用户身份的唯一性;
(2)声纹的识别可以远程实现,呼叫中心不需要为此添加额外的采音设备;
(3)声纹的获取是在用户通话中不知不觉获取的,因而不会引起用户的不方便感;
(4)声纹加密手段不容易被破解。
现有的声纹话务系统都基于对语音时长的硬性要求,采用了固定时长推送返回结果的方式,为追求验证的准确性甚至需对语音进行预处理提取足够时长有效语音再推送,至使验证响应效率大幅减小,也失去了实时验证的意义。
发明内容
本发明的目的在于提供一种话务系统的声纹识别方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种话务系统的声纹识别方法,包括以下步骤:
A、电话接入;
B、查询用户ID是否声纹注册;如果未注册:通话结束后提取的有效时长大于30秒则进行声纹注册,否则注册失败,如果已注册:则进入验证环节;
C、设置切入时间节点;
D、话务系统截取部分音频;
E、推送声纹服务器;
F、返回初步验证结果;
G、循环截取部分音频组合推送;
H、返回最终验证结果。
作为本发明的进一步技术方案:所述步骤A具体步骤是:企业话务系统平台部署声纹服务,选择指定分机在客服接听客户通话后进入声纹识别系统。
作为本发明的进一步技术方案:所述步骤B中声纹注册的具体步骤是:1)录音服务器将音频文件格式转换为Base64编码文件;2)将音频Base64文件和身份ID封装为引擎标准json格式数据;3)发送http协议的json数据至声纹引擎;4)声纹引擎通过声纹建模算法生成声纹模型;5)该声纹模型和用户ID存入声纹库中。
作为本发明的进一步技术方案:所述步骤E具体是:根据所选截取时间,推送用户ID和语音流至声纹服务器进行声纹验证。
作为本发明的进一步技术方案:所述声纹验证具体步骤是:1)录音服务器将音频文件格式转换为Base64编码文件;2)将音频Base64文件和身份ID封装为引擎标准json格式数据;3)发送http协议的json数据至声纹引擎;4)声纹引擎通过声纹建模算法生成声纹模型;5)引擎通过用户ID查找注册声纹模型与之验证模型比对。
作为本发明的进一步技术方案:步骤F具体是:根据推送部分的语音流进行声纹验证比对后返回验证得分,如果通过阈值则返回核身通过提示;验证得分未通过阈值则持续推送,可通过实时曲线图直观反映当前验证得分,所述阈值根据各厂商要求或按国家行业标准规范的声纹误识率和误拒率设定。
作为本发明的进一步技术方案:所述步骤G具体是:根据程序设定的最大语音推送时长,持续合并语音流推送声纹服务器进行验证。
作为本发明的进一步技术方案:所述步骤H具体是:根据设定的最大验证时长,推送至最后节点仍未通过声纹阈值则判定核身认证失败;或根据通话结束信令,发送该通话整段语音流的声纹验证结果。
与现有技术相比,本发明具有以下有益效果:1、采用语音流分包推送验证,声纹验证的次数更加多,避免了固定时长单词推送语音质量差导致的误识和误拒;2、采用新的推包的方式,免去核身的等待时间;3、验证的响应时间比原先方式快2~3倍;4、分流分包效率更高;5、会反馈出一系列的验证得分,可形成直观的验证曲线图表,更具有辨识度、提高用户的使用体验和业务处理效率。
附图说明
图1为声纹引擎识别流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,一种话务系统的声纹识别方法,包括以下步骤:
A、电话接入;企业话务系统平台部署声纹服务,选择指定分机在客服接听客户通话后进入声纹识别系统;
B、查询用户ID是否声纹注册;如果未注册:通话结束后提取的有效时长大于30秒则进行声纹注册,否则注册失败,如果已注册:则进入验证环节;
C、设置切入时间节点;由于大部分企业客服电话包含IVR播报音,避免机器音对声纹处理造成干扰,可以延后声纹推送服务的切入时间;
D、话务系统截取部分音频;该环节可以根据企业实际应用场景和需求,选择不同的语音流时间,eg:通话2s、4s、6s、8s、10s......持续推送验证结果是否为本人/非本人;通话3s、6s、9s、12s、15s...... 持续推送验证结果是否为本人/非本人;
E、推送声纹服务器;根据所选截取时间,推送用户ID和语音流至声纹服务器进行声纹验证;
F、返回初步验证结果;根据推送部分的语音流进行声纹验证比对后返回验证得分(声纹引擎验证得分区间为-15至+15。)如果通过阈值(该阈值可根据各厂商要求或按国家行业标准规范的声纹误识率和误拒率调整,默认当验证得分越大,越接近本人发音)则返回核身通过提示;验证得分未通过阈值则持续推送,可通过实时曲线图直观反映当前验证得分;
G、循环截取部分音频组合推送;根据程序设定的最大语音推送时长(e.g.当通话时长大于3分钟后,将不再进行声纹验证),持续合并语音流(e.g. 通话5秒、10秒、15秒、……的语音)推送声纹服务器进行验证;
H、返回最终验证结果,根据设定的最大验证时长,推送至最后节点仍未通过声纹阈值则判定核身认证失败;或根据通话结束信令,发送该通话整段语音流的声纹验证结果。
实施例2,在实施例1的基础上,声纹注册的具体步骤是:1)录音服务器将音频文件格式转换为Base64编码文件;2)将音频Base64文件和身份ID封装为引擎标准json格式数据;3)发送http协议的json数据至声纹引擎;4)声纹引擎通过声纹建模算法生成声纹模型;5)该声纹模型和用户ID存入声纹库中。
实施例3,在实施例1的基础上,声纹验证具体步骤是:1)录音服务器将音频文件格式转换为Base64编码文件;2)将音频Base64文件和身份ID封装为引擎标准json格式数据;3)发送http协议的json数据至声纹引擎;4)声纹引擎通过声纹建模算法生成声纹模型;5)引擎通过用户ID查找注册声纹模型与之验证模型比对。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (1)

1.一种话务系统的声纹识别方法,其特征在于,包括以下步骤:
电话接入:企业话务系统平台部署声纹服务,选择指定分机在客服接听客户通话后进入声纹识别系统;
查询用户ID是否声纹注册;如果未注册:通话结束后提取的有效时长大于30秒则进行声纹注册,否则注册失败,如果已注册:则进入验证环节,声纹注册的具体步骤是:1)录音服务器将音频文件格式转换为Base64编码文件;2)将音频Base64文件和身份ID封装为引擎标准json格式数据;3)发送http协议的json数据至声纹引擎;4)声纹引擎通过声纹建模算法生成声纹模型;5)该声纹模型和用户ID存入声纹库中;
设置切入时间节点;
话务系统截取部分音频;
推送声纹服务器,根据所选截取时间,推送用户ID和语音流至声纹服务器进行声纹验证,声纹验证具体步骤是:1)录音服务器将音频文件格式转换为Base64编码文件;2)将音频Base64文件和身份ID封装为引擎标准json格式数据;3)发送http协议的json数据至声纹引擎;4)声纹引擎通过声纹建模算法生成声纹模型;5)引擎通过用户ID查找注册声纹模型与之验证模型比对;
返回初步验证结果,根据推送部分的语音流进行声纹验证比对后返回验证得分,如果通过阈值则返回核身通过提示;验证得分未通过阈值则持续推送,可通过实时曲线图直观反映当前验证得分,所述阈值根据各厂商要求或按国家行业标准规范的声纹误识率和误拒率设定;
循环截取部分音频组合推送,根据程序设定的最大语音推送时长,持续合并语音流推送声纹服务器进行验证;
返回最终验证结果,根据设定的最大验证时长,推送至最后节点仍未通过声纹阈值则判定核身认证失败;或根据通话结束信令,发送该通话整段语音流的声纹验证结果。
CN201910766030.6A 2019-08-19 2019-08-19 一种话务系统的声纹识别方法 Active CN110491389B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910766030.6A CN110491389B (zh) 2019-08-19 2019-08-19 一种话务系统的声纹识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910766030.6A CN110491389B (zh) 2019-08-19 2019-08-19 一种话务系统的声纹识别方法

Publications (2)

Publication Number Publication Date
CN110491389A CN110491389A (zh) 2019-11-22
CN110491389B true CN110491389B (zh) 2021-12-14

Family

ID=68552098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910766030.6A Active CN110491389B (zh) 2019-08-19 2019-08-19 一种话务系统的声纹识别方法

Country Status (1)

Country Link
CN (1) CN110491389B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111343328B (zh) * 2020-02-14 2021-04-06 厦门快商通科技股份有限公司 基于声纹识别的通话管理方法、系统及移动终端
CN111600782B (zh) * 2020-04-28 2021-05-18 百度在线网络技术(北京)有限公司 智能语音设备的控制方法、装置、电子设备和存储介质
CN112002332A (zh) * 2020-08-28 2020-11-27 北京捷通华声科技股份有限公司 语音验证方法及装置、处理器
CN112929501A (zh) * 2021-01-25 2021-06-08 深圳前海微众银行股份有限公司 语音通话服务方法、装置、设备、介质及计算机程序产品

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101321387A (zh) * 2008-07-10 2008-12-10 中国移动通信集团广东有限公司 基于通信系统的声纹识别方法及系统
CN104282303A (zh) * 2013-07-09 2015-01-14 威盛电子股份有限公司 利用声纹识别进行语音辨识的方法及其电子装置
CN105788600A (zh) * 2014-12-26 2016-07-20 联想(北京)有限公司 声纹识别方法和电子设备
CN107993662A (zh) * 2017-12-20 2018-05-04 广州势必可赢网络科技有限公司 一种应用于电话客服的用户身份识别方法及装置
CN108447489A (zh) * 2018-04-17 2018-08-24 清华大学 一种带反馈的连续声纹认证方法及系统
CN108630208A (zh) * 2018-05-14 2018-10-09 平安科技(深圳)有限公司 服务器、基于声纹的身份验证方法及存储介质
CN108766446A (zh) * 2018-04-18 2018-11-06 上海问之信息科技有限公司 声纹识别方法、装置、存储介质及音箱

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3953368B2 (ja) * 2002-06-25 2007-08-08 トッパン・フォームズ株式会社 認証システム及び認証装置
US8725514B2 (en) * 2005-02-22 2014-05-13 Nuance Communications, Inc. Verifying a user using speaker verification and a multimodal web-based interface
US8494854B2 (en) * 2008-06-23 2013-07-23 John Nicholas and Kristin Gross CAPTCHA using challenges optimized for distinguishing between humans and machines
GB2517952B (en) * 2013-09-05 2017-05-31 Barclays Bank Plc Biometric verification using predicted signatures
CN104821934B (zh) * 2015-03-20 2018-11-20 百度在线网络技术(北京)有限公司 基于人工智能的声纹登录方法和装置
US10511712B2 (en) * 2016-08-19 2019-12-17 Andrew Horton Caller identification in a secure environment using voice biometrics

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101321387A (zh) * 2008-07-10 2008-12-10 中国移动通信集团广东有限公司 基于通信系统的声纹识别方法及系统
CN104282303A (zh) * 2013-07-09 2015-01-14 威盛电子股份有限公司 利用声纹识别进行语音辨识的方法及其电子装置
CN105788600A (zh) * 2014-12-26 2016-07-20 联想(北京)有限公司 声纹识别方法和电子设备
CN107993662A (zh) * 2017-12-20 2018-05-04 广州势必可赢网络科技有限公司 一种应用于电话客服的用户身份识别方法及装置
CN108447489A (zh) * 2018-04-17 2018-08-24 清华大学 一种带反馈的连续声纹认证方法及系统
CN108766446A (zh) * 2018-04-18 2018-11-06 上海问之信息科技有限公司 声纹识别方法、装置、存储介质及音箱
CN108630208A (zh) * 2018-05-14 2018-10-09 平安科技(深圳)有限公司 服务器、基于声纹的身份验证方法及存储介质

Also Published As

Publication number Publication date
CN110491389A (zh) 2019-11-22

Similar Documents

Publication Publication Date Title
CN110491389B (zh) 一种话务系统的声纹识别方法
US10410636B2 (en) Methods and system for reducing false positive voice print matching
CN105814535B (zh) 呼叫中的虚拟助理
CN105306657B (zh) 身份识别方法、装置及通讯终端
US10182148B2 (en) Method and system for filtering undesirable incoming telephone calls
US8812319B2 (en) Dynamic pass phrase security system (DPSS)
US9313312B2 (en) Speech recognition method of and system for determining the status of an answered telephone during the course of an outbound telephone call
US6973426B1 (en) Method and apparatus for performing speaker verification based on speaker independent recognition of commands
CN109036435B (zh) 基于声纹信息的身份认证及识别方法
CN109951743A (zh) 弹幕信息处理方法、系统及计算机设备
US9195641B1 (en) Method and apparatus of processing user text input information
US20070201443A1 (en) VoIP caller authentication by voice signature continuity
JP2001503156A (ja) 話者確認法
CN103577965A (zh) 一种事务提醒方法和装置
CN107464328A (zh) 智能锁的解锁方法、装置、存储介质以及智能锁
CN110517697A (zh) 用于交互式语音应答的提示音智能打断装置
AU2012205747B2 (en) Natural enrolment process for speaker recognition
EP3876507B1 (en) System and method for audio content verification
US11783804B2 (en) Voice communicator with voice changer
CN108766442B (zh) 一种基于声纹图形标识的身份认证方法及装置
US11606461B2 (en) Method for training a spoofing detection model using biometric clustering
CN109379499A (zh) 一种语音呼叫方法及装置
JP2004062076A (ja) 本人認証装置および本人認証方法、コンピュータプログラム
CA2712853C (en) Speech recognition method and system to determine the status of an outbound telephone call
CN112954693A (zh) 身份认证方法、身份认证服务器及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant