CN110491389B - 一种话务系统的声纹识别方法 - Google Patents
一种话务系统的声纹识别方法 Download PDFInfo
- Publication number
- CN110491389B CN110491389B CN201910766030.6A CN201910766030A CN110491389B CN 110491389 B CN110491389 B CN 110491389B CN 201910766030 A CN201910766030 A CN 201910766030A CN 110491389 B CN110491389 B CN 110491389B
- Authority
- CN
- China
- Prior art keywords
- voiceprint
- verification
- pushing
- engine
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification
- G10L17/04—Training, enrolment or model building
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/60—Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
- H04M2203/6054—Biometric subscriber identification
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
Abstract
本发明公开了一种话务系统的声纹识别方法,包括以下步骤:A、电话接入;B、查询用户ID是否声纹注册;如果未注册:通话结束后提取的有效时长大于30秒则进行声纹注册,否则注册失败,如果已注册:则进入验证环节;C、设置切入时间节点;D、话务系统截取部分音频;E、推送声纹服务器;F、返回初步验证结果;G、循环截取部分音频组合推送;H、返回最终验证结果,本发明采用语音流分包推送验证,声纹验证的次数更加多,避免了固定时长单词推送语音质量差导致的误识和误拒;并且采用新的推包的方式,免去核身的等待时间;同时会反馈出一系列的验证得分,可形成直观的验证曲线图表,更具有辨识度、提高用户的使用体验和业务处理效率。
Description
技术领域
本发明涉及声音识别技术领域,具体是一种话务系统的声纹识别方法。
背景技术
随着移动网络信息换的发展,人们越来越依赖于通过电话手机来远程办理各种业务和服务,政府和企业也需要通过呼叫中心来服务客户,改善行政效率和加速商业进程。现有的预留问题/答案的验证方式和输入账号/密码的方式虽然简单方便,但安全性不高,用户的账号和密码很容易被窃取。预留问题和答案也很容易遗忘,延误业务和服务办理。因此,运用简单可靠的远程身份认证手段是呼叫中心的迫切需求。
在呼叫中心的日常业务中,用户很自然的会使用声音来传达信息,而对声音的身份验证,很自然的成为呼叫中心引入新身份认证手段的首选。声纹识别也特别适合呼叫中心,这是因为
(1)声纹具有表示用户身份的唯一性;
(2)声纹的识别可以远程实现,呼叫中心不需要为此添加额外的采音设备;
(3)声纹的获取是在用户通话中不知不觉获取的,因而不会引起用户的不方便感;
(4)声纹加密手段不容易被破解。
现有的声纹话务系统都基于对语音时长的硬性要求,采用了固定时长推送返回结果的方式,为追求验证的准确性甚至需对语音进行预处理提取足够时长有效语音再推送,至使验证响应效率大幅减小,也失去了实时验证的意义。
发明内容
本发明的目的在于提供一种话务系统的声纹识别方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种话务系统的声纹识别方法,包括以下步骤:
A、电话接入;
B、查询用户ID是否声纹注册;如果未注册:通话结束后提取的有效时长大于30秒则进行声纹注册,否则注册失败,如果已注册:则进入验证环节;
C、设置切入时间节点;
D、话务系统截取部分音频;
E、推送声纹服务器;
F、返回初步验证结果;
G、循环截取部分音频组合推送;
H、返回最终验证结果。
作为本发明的进一步技术方案:所述步骤A具体步骤是:企业话务系统平台部署声纹服务,选择指定分机在客服接听客户通话后进入声纹识别系统。
作为本发明的进一步技术方案:所述步骤B中声纹注册的具体步骤是:1)录音服务器将音频文件格式转换为Base64编码文件;2)将音频Base64文件和身份ID封装为引擎标准json格式数据;3)发送http协议的json数据至声纹引擎;4)声纹引擎通过声纹建模算法生成声纹模型;5)该声纹模型和用户ID存入声纹库中。
作为本发明的进一步技术方案:所述步骤E具体是:根据所选截取时间,推送用户ID和语音流至声纹服务器进行声纹验证。
作为本发明的进一步技术方案:所述声纹验证具体步骤是:1)录音服务器将音频文件格式转换为Base64编码文件;2)将音频Base64文件和身份ID封装为引擎标准json格式数据;3)发送http协议的json数据至声纹引擎;4)声纹引擎通过声纹建模算法生成声纹模型;5)引擎通过用户ID查找注册声纹模型与之验证模型比对。
作为本发明的进一步技术方案:步骤F具体是:根据推送部分的语音流进行声纹验证比对后返回验证得分,如果通过阈值则返回核身通过提示;验证得分未通过阈值则持续推送,可通过实时曲线图直观反映当前验证得分,所述阈值根据各厂商要求或按国家行业标准规范的声纹误识率和误拒率设定。
作为本发明的进一步技术方案:所述步骤G具体是:根据程序设定的最大语音推送时长,持续合并语音流推送声纹服务器进行验证。
作为本发明的进一步技术方案:所述步骤H具体是:根据设定的最大验证时长,推送至最后节点仍未通过声纹阈值则判定核身认证失败;或根据通话结束信令,发送该通话整段语音流的声纹验证结果。
与现有技术相比,本发明具有以下有益效果:1、采用语音流分包推送验证,声纹验证的次数更加多,避免了固定时长单词推送语音质量差导致的误识和误拒;2、采用新的推包的方式,免去核身的等待时间;3、验证的响应时间比原先方式快2~3倍;4、分流分包效率更高;5、会反馈出一系列的验证得分,可形成直观的验证曲线图表,更具有辨识度、提高用户的使用体验和业务处理效率。
附图说明
图1为声纹引擎识别流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,一种话务系统的声纹识别方法,包括以下步骤:
A、电话接入;企业话务系统平台部署声纹服务,选择指定分机在客服接听客户通话后进入声纹识别系统;
B、查询用户ID是否声纹注册;如果未注册:通话结束后提取的有效时长大于30秒则进行声纹注册,否则注册失败,如果已注册:则进入验证环节;
C、设置切入时间节点;由于大部分企业客服电话包含IVR播报音,避免机器音对声纹处理造成干扰,可以延后声纹推送服务的切入时间;
D、话务系统截取部分音频;该环节可以根据企业实际应用场景和需求,选择不同的语音流时间,eg:通话2s、4s、6s、8s、10s......持续推送验证结果是否为本人/非本人;通话3s、6s、9s、12s、15s...... 持续推送验证结果是否为本人/非本人;
E、推送声纹服务器;根据所选截取时间,推送用户ID和语音流至声纹服务器进行声纹验证;
F、返回初步验证结果;根据推送部分的语音流进行声纹验证比对后返回验证得分(声纹引擎验证得分区间为-15至+15。)如果通过阈值(该阈值可根据各厂商要求或按国家行业标准规范的声纹误识率和误拒率调整,默认当验证得分越大,越接近本人发音)则返回核身通过提示;验证得分未通过阈值则持续推送,可通过实时曲线图直观反映当前验证得分;
G、循环截取部分音频组合推送;根据程序设定的最大语音推送时长(e.g.当通话时长大于3分钟后,将不再进行声纹验证),持续合并语音流(e.g. 通话5秒、10秒、15秒、……的语音)推送声纹服务器进行验证;
H、返回最终验证结果,根据设定的最大验证时长,推送至最后节点仍未通过声纹阈值则判定核身认证失败;或根据通话结束信令,发送该通话整段语音流的声纹验证结果。
实施例2,在实施例1的基础上,声纹注册的具体步骤是:1)录音服务器将音频文件格式转换为Base64编码文件;2)将音频Base64文件和身份ID封装为引擎标准json格式数据;3)发送http协议的json数据至声纹引擎;4)声纹引擎通过声纹建模算法生成声纹模型;5)该声纹模型和用户ID存入声纹库中。
实施例3,在实施例1的基础上,声纹验证具体步骤是:1)录音服务器将音频文件格式转换为Base64编码文件;2)将音频Base64文件和身份ID封装为引擎标准json格式数据;3)发送http协议的json数据至声纹引擎;4)声纹引擎通过声纹建模算法生成声纹模型;5)引擎通过用户ID查找注册声纹模型与之验证模型比对。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (1)
1.一种话务系统的声纹识别方法,其特征在于,包括以下步骤:
电话接入:企业话务系统平台部署声纹服务,选择指定分机在客服接听客户通话后进入声纹识别系统;
查询用户ID是否声纹注册;如果未注册:通话结束后提取的有效时长大于30秒则进行声纹注册,否则注册失败,如果已注册:则进入验证环节,声纹注册的具体步骤是:1)录音服务器将音频文件格式转换为Base64编码文件;2)将音频Base64文件和身份ID封装为引擎标准json格式数据;3)发送http协议的json数据至声纹引擎;4)声纹引擎通过声纹建模算法生成声纹模型;5)该声纹模型和用户ID存入声纹库中;
设置切入时间节点;
话务系统截取部分音频;
推送声纹服务器,根据所选截取时间,推送用户ID和语音流至声纹服务器进行声纹验证,声纹验证具体步骤是:1)录音服务器将音频文件格式转换为Base64编码文件;2)将音频Base64文件和身份ID封装为引擎标准json格式数据;3)发送http协议的json数据至声纹引擎;4)声纹引擎通过声纹建模算法生成声纹模型;5)引擎通过用户ID查找注册声纹模型与之验证模型比对;
返回初步验证结果,根据推送部分的语音流进行声纹验证比对后返回验证得分,如果通过阈值则返回核身通过提示;验证得分未通过阈值则持续推送,可通过实时曲线图直观反映当前验证得分,所述阈值根据各厂商要求或按国家行业标准规范的声纹误识率和误拒率设定;
循环截取部分音频组合推送,根据程序设定的最大语音推送时长,持续合并语音流推送声纹服务器进行验证;
返回最终验证结果,根据设定的最大验证时长,推送至最后节点仍未通过声纹阈值则判定核身认证失败;或根据通话结束信令,发送该通话整段语音流的声纹验证结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910766030.6A CN110491389B (zh) | 2019-08-19 | 2019-08-19 | 一种话务系统的声纹识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910766030.6A CN110491389B (zh) | 2019-08-19 | 2019-08-19 | 一种话务系统的声纹识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110491389A CN110491389A (zh) | 2019-11-22 |
CN110491389B true CN110491389B (zh) | 2021-12-14 |
Family
ID=68552098
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910766030.6A Active CN110491389B (zh) | 2019-08-19 | 2019-08-19 | 一种话务系统的声纹识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110491389B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111343328B (zh) * | 2020-02-14 | 2021-04-06 | 厦门快商通科技股份有限公司 | 基于声纹识别的通话管理方法、系统及移动终端 |
CN111600782B (zh) * | 2020-04-28 | 2021-05-18 | 百度在线网络技术(北京)有限公司 | 智能语音设备的控制方法、装置、电子设备和存储介质 |
CN112002332A (zh) * | 2020-08-28 | 2020-11-27 | 北京捷通华声科技股份有限公司 | 语音验证方法及装置、处理器 |
CN112929501A (zh) * | 2021-01-25 | 2021-06-08 | 深圳前海微众银行股份有限公司 | 语音通话服务方法、装置、设备、介质及计算机程序产品 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101321387A (zh) * | 2008-07-10 | 2008-12-10 | 中国移动通信集团广东有限公司 | 基于通信系统的声纹识别方法及系统 |
CN104282303A (zh) * | 2013-07-09 | 2015-01-14 | 威盛电子股份有限公司 | 利用声纹识别进行语音辨识的方法及其电子装置 |
CN105788600A (zh) * | 2014-12-26 | 2016-07-20 | 联想(北京)有限公司 | 声纹识别方法和电子设备 |
CN107993662A (zh) * | 2017-12-20 | 2018-05-04 | 广州势必可赢网络科技有限公司 | 一种应用于电话客服的用户身份识别方法及装置 |
CN108447489A (zh) * | 2018-04-17 | 2018-08-24 | 清华大学 | 一种带反馈的连续声纹认证方法及系统 |
CN108630208A (zh) * | 2018-05-14 | 2018-10-09 | 平安科技(深圳)有限公司 | 服务器、基于声纹的身份验证方法及存储介质 |
CN108766446A (zh) * | 2018-04-18 | 2018-11-06 | 上海问之信息科技有限公司 | 声纹识别方法、装置、存储介质及音箱 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3953368B2 (ja) * | 2002-06-25 | 2007-08-08 | トッパン・フォームズ株式会社 | 認証システム及び認証装置 |
US8725514B2 (en) * | 2005-02-22 | 2014-05-13 | Nuance Communications, Inc. | Verifying a user using speaker verification and a multimodal web-based interface |
US8494854B2 (en) * | 2008-06-23 | 2013-07-23 | John Nicholas and Kristin Gross | CAPTCHA using challenges optimized for distinguishing between humans and machines |
GB2517952B (en) * | 2013-09-05 | 2017-05-31 | Barclays Bank Plc | Biometric verification using predicted signatures |
CN104821934B (zh) * | 2015-03-20 | 2018-11-20 | 百度在线网络技术(北京)有限公司 | 基于人工智能的声纹登录方法和装置 |
US10511712B2 (en) * | 2016-08-19 | 2019-12-17 | Andrew Horton | Caller identification in a secure environment using voice biometrics |
-
2019
- 2019-08-19 CN CN201910766030.6A patent/CN110491389B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101321387A (zh) * | 2008-07-10 | 2008-12-10 | 中国移动通信集团广东有限公司 | 基于通信系统的声纹识别方法及系统 |
CN104282303A (zh) * | 2013-07-09 | 2015-01-14 | 威盛电子股份有限公司 | 利用声纹识别进行语音辨识的方法及其电子装置 |
CN105788600A (zh) * | 2014-12-26 | 2016-07-20 | 联想(北京)有限公司 | 声纹识别方法和电子设备 |
CN107993662A (zh) * | 2017-12-20 | 2018-05-04 | 广州势必可赢网络科技有限公司 | 一种应用于电话客服的用户身份识别方法及装置 |
CN108447489A (zh) * | 2018-04-17 | 2018-08-24 | 清华大学 | 一种带反馈的连续声纹认证方法及系统 |
CN108766446A (zh) * | 2018-04-18 | 2018-11-06 | 上海问之信息科技有限公司 | 声纹识别方法、装置、存储介质及音箱 |
CN108630208A (zh) * | 2018-05-14 | 2018-10-09 | 平安科技(深圳)有限公司 | 服务器、基于声纹的身份验证方法及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110491389A (zh) | 2019-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110491389B (zh) | 一种话务系统的声纹识别方法 | |
US10410636B2 (en) | Methods and system for reducing false positive voice print matching | |
CN105814535B (zh) | 呼叫中的虚拟助理 | |
CN105306657B (zh) | 身份识别方法、装置及通讯终端 | |
US10182148B2 (en) | Method and system for filtering undesirable incoming telephone calls | |
US8812319B2 (en) | Dynamic pass phrase security system (DPSS) | |
US9313312B2 (en) | Speech recognition method of and system for determining the status of an answered telephone during the course of an outbound telephone call | |
US6973426B1 (en) | Method and apparatus for performing speaker verification based on speaker independent recognition of commands | |
CN109036435B (zh) | 基于声纹信息的身份认证及识别方法 | |
CN109951743A (zh) | 弹幕信息处理方法、系统及计算机设备 | |
US9195641B1 (en) | Method and apparatus of processing user text input information | |
US20070201443A1 (en) | VoIP caller authentication by voice signature continuity | |
JP2001503156A (ja) | 話者確認法 | |
CN103577965A (zh) | 一种事务提醒方法和装置 | |
CN107464328A (zh) | 智能锁的解锁方法、装置、存储介质以及智能锁 | |
CN110517697A (zh) | 用于交互式语音应答的提示音智能打断装置 | |
AU2012205747B2 (en) | Natural enrolment process for speaker recognition | |
EP3876507B1 (en) | System and method for audio content verification | |
US11783804B2 (en) | Voice communicator with voice changer | |
CN108766442B (zh) | 一种基于声纹图形标识的身份认证方法及装置 | |
US11606461B2 (en) | Method for training a spoofing detection model using biometric clustering | |
CN109379499A (zh) | 一种语音呼叫方法及装置 | |
JP2004062076A (ja) | 本人認証装置および本人認証方法、コンピュータプログラム | |
CA2712853C (en) | Speech recognition method and system to determine the status of an outbound telephone call | |
CN112954693A (zh) | 身份认证方法、身份认证服务器及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |