CN112926042B - 一种跨通道生物语音识别验证系统及验证方法 - Google Patents

一种跨通道生物语音识别验证系统及验证方法 Download PDF

Info

Publication number
CN112926042B
CN112926042B CN202110395431.2A CN202110395431A CN112926042B CN 112926042 B CN112926042 B CN 112926042B CN 202110395431 A CN202110395431 A CN 202110395431A CN 112926042 B CN112926042 B CN 112926042B
Authority
CN
China
Prior art keywords
audio
user
module
database
voiceprint model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110395431.2A
Other languages
English (en)
Other versions
CN112926042A (zh
Inventor
张寅�
张翼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Effective Software Technology Shanghai Co ltd
Original Assignee
Effective Software Technology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Effective Software Technology Shanghai Co ltd filed Critical Effective Software Technology Shanghai Co ltd
Priority to CN202110395431.2A priority Critical patent/CN112926042B/zh
Publication of CN112926042A publication Critical patent/CN112926042A/zh
Application granted granted Critical
Publication of CN112926042B publication Critical patent/CN112926042B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/61Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Abstract

本发明的一种跨通道生物语音识别验证系统及验证方法,本申请的系统在验证时可以避免由于验证过程产生的声纹模型对主数据库中最高质量的宽带数据通道音频的声纹模型产生影响,且可以对不同通道发出的验证语音进行相对应的子数据库的声纹模型更新,防止不同通道发出的验证语音对统一数据库的声纹模型更新带来的影响,提升了不同通道语音验证的准确率且若干个子数据库依托于同一主数据库,不需要每个通道建立单独的数据库,使用及存储更加便捷。

Description

一种跨通道生物语音识别验证系统及验证方法
技术领域
本发明属于识别语音技术领域,具体来说是一种跨通道生物语音识别验证系统及验证方法。
背景技术
语音生物识别系统是通过将给定的声纹模型与已注册的声纹模型进行比较,通过语音识别个人的技术。语音生物识别系统精度的测量通常由相等误差率(EER)来衡量。当给定的声纹模型来自不同的信道或设备+时,当前一代语音生物识别系统会受到影响。Each数据通道或设备在音频文件上留下唯一的签名,如果注册位于与身份验证不同的通道或设备上,则等于错误率(EER)会降低。例如,如果系统将移动应用注册与IVR身份验证请求进行对比,则IVR身份验证请求的精度受到影响。
为了保持准确性,语音生物识别系统必须保留单独的数据库,但是不同的验证通道进行身份验证的时候需要进行不同的验证,不同的验证来自于不同的数据库,因此用户必须注册每个频道,会产生验证过程中不必要的复杂性,且不同的数据库的音频文件会存在一定差别,使得验证的错误率(EER)升高。
发明内容
1.发明要解决的技术问题
本发明的目的在于解决现有的语音生物识别系统在进行不同通道的验证过程中由于声纹模型更新的影响会影响不同通道的验证正确率的问题。
2.技术方案
为达到上述目的,本发明提供的技术方案为:
本发明的一种跨通道生物语音识别验证系统,包括相互通信连接的音频接收模块、音频匹配模块和主数据库,所述主数据库连接有若干个子数据库,所述主数据库内存储有用户的最高质量的宽带数据通道音频的声纹模型,若干个所述子数据库分别存储主数据库内的声纹模型经过不同通道后的声纹模型,所述音频接收模块包括若干个一一对应的音频接收单元和音频传输单元,若干个所述音频接收单元接收不同通道的语音音频数据并通过相对应的音频传输单元输送给音频匹配模块,若干个所述音频传输单元设有特定的用户ID与若干个子数据库一一对应,音频匹配模块根据音频传输单元的用户ID匹配相对应的子数据库并进行验证。
优选的,还包括音频更新模块,所述音频更新模块分别与音频接收模块、主数据库通信连接,所述音频更新模块更新匹配成功的子数据库中的声纹模型。
优选的,还包括音频存储模块,所述音频存储模块分别与音频接收模块、主数据库通信连接,所述音频存储模块用于存储新用户的最高质量的宽带数据通道音频的声纹模型并将其复制到各个子数据库。
优选的,所述音频更新模块包括声纹模型单元,所述声纹模型单元根据不同的用户ID创建相对应的声纹模型将用户的声纹模型输入在对应的子数据库内。
一种跨通道生物语音识别验证方法,所述方法采用上述的系统进行,所述方法具体为:新用户注册后通过音频接收模块将最高质量的宽带数据通道音频发送给音频存储模块,音频存储模块将最高质量的宽带数据通道音频根据声纹模型打印到主数据库中并复制到各个子数据库,当用户通过音频接收单元进行呼叫验证时,音频接收单元将用户的验证音频通过对应的音频传输单元发送给音频匹配模块,音频匹配模块根据音频接收单元所对应的用户ID选择相对应的子数据库,将用户的验证音频与相对应的子数据库中的声纹模型进行对比,当验证通过时,允许音频接收单元和音频传输单元建立通信,音频更新模块将通信的音频通过声纹模型打印到对应的子数据库进行更新存储。
优选的,所述方法包括如下步骤:
S100、注册声纹模型;
S200、用户身份验证;
S300、用户进行通信;
S400、更新声纹模型。
优选的,所述步骤S100中的注册声纹模型具体为新用户注册后通过音频接收模块将最高质量的宽带数据通道音频发送给音频存储模块,音频存储模块将最高质量的宽带数据通道音频根据声纹模型打印到主数据库中并复制到各个子数据库,所述音频接收模块中的音频接收单元设有与新用户一一对应的用户ID。
优选的,所述步骤S200中的用户身份验证具体为用户通过音频接收单元进行呼叫验证时,音频接收单元将用户的验证音频通过对应的音频传输单元发送给音频匹配模块,音频匹配模块根据音频接收单元所对应的用户ID选择相对应的子数据库,将用户的验证音频与相对应的子数据库中的声纹模型进行对比。
优选的,所述步骤S300中的用户进行通信具体为音频接收模块接收用户的语音并发送给相应的设备。
优选的,所述步骤S400中的更新声纹模型具体为音频更新模块将通信的音频通过声纹模型打印到对应的子数据库进行更新存储。
3.有益效果
采用本发明提供的技术方案,与现有技术相比,具有如下有益效果:
本发明的一种跨通道生物语音识别验证系统及验证方法,包括相互通信连接的音频接收模块、音频匹配模块和主数据库,主数据库连接有若干个子数据库,主数据库内存储有用户的最高质量的宽带数据通道音频的声纹模型,若干个子数据库分别存储主数据库内的声纹模型经过不同通道后的声纹模型,音频接收模块包括若干个一一对应的音频接收单元和音频传输单元,若干个音频接收单元接收不同通道的语音音频数据并通过相对应的音频传输单元输送给音频匹配模块,若干个音频传输单元设有特定的用户ID与若干个子数据库一一对应,音频匹配模块根据音频传输单元的用户ID匹配相对应的子数据库并进行验证。本申请的系统在验证时可以避免由于验证过程产生的声纹模型对主数据库中最高质量的宽带数据通道音频的声纹模型产生影响,且可以对不同通道发出的验证语音进行相对应的子数据库的声纹模型更新,防止不同通道发出的验证语音对统一数据库的声纹模型更新带来的影响,提升了不同通道语音验证的准确率且若干个子数据库依托于同一主数据库,不需要每个通道建立单独的数据库,使用及存储更加便捷。
附图说明
图1为本发明的一种跨通道生物语音识别验证系统的结构示意图;
图2为本发明的一种跨通道生物语音识别验证方法的流程图。
示意图中的标号说明:
300、音频接收模块;400、音频存储模块;500、音频匹配模块;600、音频更新模块;700、主数据库。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述,附图中给出了本发明的若干实施例,但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例,相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件;当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件;本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同;本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明;本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
实施例1
参照附图1-附图2,本实施例的一种跨通道生物语音识别验证系统,包括相互通信连接的音频接收模块300、音频匹配模块500和主数据库700,所述主数据库700连接有若干个子数据库,所述主数据库700内存储有用户的最高质量的宽带数据通道音频的声纹模型,若干个所述子数据库分别存储主数据库700内的声纹模型经过不同通道后的声纹模型,所述音频接收模块300包括若干个一一对应的音频接收单元和音频传输单元,若干个所述音频接收单元接收不同通道的语音音频数据并通过相对应的音频传输单元输送给音频匹配模块500,若干个所述音频传输单元设有特定的用户ID与若干个子数据库一一对应,音频匹配模块500根据音频传输单元的用户ID匹配相对应的子数据库并进行验证。本申请的系统在验证时可以避免由于验证过程产生的声纹模型对主数据库中最高质量的宽带数据通道音频的声纹模型产生影响,且可以对不同通道发出的验证语音进行相对应的子数据库的声纹模型更新,防止不同通道发出的验证语音对统一数据库的声纹模型更新带来的影响,提升了不同通道语音验证的准确率且若干个子数据库依托于同一主数据库,不需要每个通道建立单独的数据库,使用及存储更加便捷。
本实施例的系统还包括音频更新模块600,所述音频更新模块600分别与音频接收模块300、主数据库700通信连接,所述音频更新模块600更新匹配成功的子数据库中的声纹模型。
本实施例的系统还包括音频存储模块400,所述音频存储模块400分别与音频接收模块300、主数据库700通信连接,所述音频存储模块400用于存储新用户的最高质量的宽带数据通道音频的声纹模型并将其复制到各个子数据库。
本实施例包括子数据库1、子数据库2、子数据库3…子数据库N;音频接收单元1、音频接收单元2、音频接收单元3…音频接收单元N;音频传输单元1、音频传输单元2、音频传输单元3…音频传输单元N;音频传输单元1只用于接收音频接收单元1的音频数据,音频传输单元1设有特定的用户ID使得音频匹配模块500将音频传输单元1与子数据库1对应。
音频更新模块600包括声纹模型单元,所述声纹模型单元根据不同的用户ID创建相对应的声纹模型将用户的声纹模型输入在对应的子数据库内。
一种跨通道生物语音识别验证方法,所述方法采用上述的系统进行,所述方法具体为:新用户注册后通过音频接收模块300将最高质量的宽带数据通道音频发送给音频存储模块400,音频存储模块400将最高质量的宽带数据通道音频根据声纹模型打印到主数据库700中并复制到各个子数据库,当用户通过音频接收单元进行呼叫验证时,音频接收单元将用户的验证音频通过对应的音频传输单元发送给音频匹配模块500,音频匹配模块500根据音频接收单元所对应的用户ID选择相对应的子数据库,将用户的验证音频与相对应的子数据库中的声纹模型进行对比,当验证通过时,允许音频接收单元和音频传输单元建立通信,音频更新模块600将通信的音频通过声纹模型打印到对应的子数据库进行更新存储。
本实施例的方法包括如下步骤:
S100、注册声纹模型;
S200、用户身份验证;
S300、用户进行通信;
S400、更新声纹模型。
步骤S100中的注册声纹模型具体为新用户注册后通过音频接收模块300将最高质量的宽带数据通道音频发送给音频存储模块400,音频存储模块400将最高质量的宽带数据通道音频根据声纹模型打印到主数据库700中并复制到各个子数据库,所述音频接收模块300中的音频接收单元设有与新用户一一对应的用户ID。
步骤S200中的用户身份验证具体为用户通过音频接收单元进行呼叫验证时,音频接收单元将用户的验证音频通过对应的音频传输单元发送给音频匹配模块500,音频匹配模块500根据音频接收单元所对应的用户ID选择相对应的子数据库,将用户的验证音频与相对应的子数据库中的声纹模型进行对比。
步骤S300中的用户进行通信具体为音频接收模块300接收用户的语音并发送给相应的设备。
步骤S400中的更新声纹模型具体为音频更新模块600将通信的音频通过声纹模型打印到对应的子数据库进行更新存储。
以上所述实施例仅表达了本发明的某种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制;应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围;因此,本发明专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种跨通道生物语音识别验证系统,其特征在于:包括相互通信连接的音频接收模块(300)、音频匹配模块(500)和主数据库(700),所述主数据库(700)连接有若干个子数据库,所述主数据库(700)内存储有用户的最高质量的宽带数据通道音频的声纹模型,若干个所述子数据库分别存储主数据库(700)内的声纹模型经过不同通道后的声纹模型,所述音频接收模块(300)包括若干个一一对应的音频接收单元和音频传输单元,若干个所述音频接收单元接收不同通道的语音音频数据并通过相对应的音频传输单元输送给音频匹配模块(500),若干个所述音频传输单元设有特定的用户ID与若干个子数据库一一对应,音频匹配模块(500)根据音频传输单元的用户ID匹配相对应的子数据库并进行验证;
还包括音频存储模块(400),所述音频存储模块(400)分别与音频接收模块(300)、主数据库(700)通信连接,所述音频存储模块(400)用于存储新用户的最高质量的宽带数据通道音频的声纹模型并将其复制到各个子数据库。
2.根据权利要求1所述的一种跨通道生物语音识别验证系统,其特征在于:还包括音频更新模块(600),所述音频更新模块(600)分别与音频接收模块(300)、主数据库(700)通信连接,所述音频更新模块(600)更新匹配成功的子数据库中的声纹模型。
3.根据权利要求1所述的一种跨通道生物语音识别验证系统,其特征在于:音频更新模块(600)包括声纹模型单元,所述声纹模型单元根据不同的用户ID创建相对应的声纹模型将用户的声纹模型输入在对应的子数据库内。
4.一种跨通道生物语音识别验证方法,其特征在于,所述方法采用上述权利要求3所述的系统进行,所述方法具体为:新用户注册后通过音频接收模块(300)将最高质量的宽带数据通道音频发送给音频存储模块(400),音频存储模块(400)将最高质量的宽带数据通道音频根据声纹模型打印到主数据库(700)中并复制到各个子数据库,当用户通过音频接收单元进行呼叫验证时,音频接收单元将用户的验证音频通过对应的音频传输单元发送给音频匹配模块(500),音频匹配模块(500)根据音频接收单元所对应的用户ID选择相对应的子数据库,将用户的验证音频与相对应的子数据库中的声纹模型进行对比,当验证通过时,允许音频接收单元和音频传输单元建立通信,音频更新模块(600)将通信的音频通过声纹模型打印到对应的子数据库进行更新存储。
5.根据权利要求4所述的一种跨通道生物语音识别验证方法,其特征在于,所述方法包括如下步骤:
S100、注册声纹模型;
S200、用户身份验证;
S300、用户进行通信;
S400、更新声纹模型。
6.根据权利要求5所述的一种跨通道生物语音识别验证方法,其特征在于:所述步骤S100中的注册声纹模型具体为新用户注册后通过音频接收模块(300)将最高质量的宽带数据通道音频发送给音频存储模块(400),音频存储模块(400)将最高质量的宽带数据通道音频根据声纹模型打印到主数据库(700)中并复制到各个子数据库,所述音频接收模块(300)中的音频接收单元设有与新用户一一对应的用户ID。
7.根据权利要求5所述的一种跨通道生物语音识别验证方法,其特征在于:所述步骤S200中的用户身份验证具体为用户通过音频接收单元进行呼叫验证时,音频接收单元将用户的验证音频通过对应的音频传输单元发送给音频匹配模块(500),音频匹配模块(500)根据音频接收单元所对应的用户ID选择相对应的子数据库,将用户的验证音频与相对应的子数据库中的声纹模型进行对比。
8.根据权利要求5所述的一种跨通道生物语音识别验证方法,其特征在于:所述步骤S300中的用户进行通信具体为音频接收模块(300)接收用户的语音并发送给相应的设备。
9.根据权利要求5所述的一种跨通道生物语音识别验证方法,其特征在于:所述步骤S400中的更新声纹模型具体为音频更新模块(600)将通信的音频通过声纹模型打印到对应的子数据库进行更新存储。
CN202110395431.2A 2021-04-13 2021-04-13 一种跨通道生物语音识别验证系统及验证方法 Active CN112926042B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110395431.2A CN112926042B (zh) 2021-04-13 2021-04-13 一种跨通道生物语音识别验证系统及验证方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110395431.2A CN112926042B (zh) 2021-04-13 2021-04-13 一种跨通道生物语音识别验证系统及验证方法

Publications (2)

Publication Number Publication Date
CN112926042A CN112926042A (zh) 2021-06-08
CN112926042B true CN112926042B (zh) 2024-01-16

Family

ID=76174313

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110395431.2A Active CN112926042B (zh) 2021-04-13 2021-04-13 一种跨通道生物语音识别验证系统及验证方法

Country Status (1)

Country Link
CN (1) CN112926042B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104885071A (zh) * 2012-10-17 2015-09-02 纽昂斯通信有限公司 多设备智能语言模型同步
CN109378006A (zh) * 2018-12-28 2019-02-22 三星电子(中国)研发中心 一种跨设备声纹识别方法及系统
CN110503969A (zh) * 2018-11-23 2019-11-26 腾讯科技(深圳)有限公司 一种音频数据处理方法、装置及存储介质
CN112328994A (zh) * 2020-11-17 2021-02-05 携程计算机技术(上海)有限公司 声纹数据处理方法、装置、电子设备和存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102008058883B4 (de) * 2008-11-26 2023-07-27 Lumenvox Corporation Verfahren und Anordnung zur Steuerung eines Nutzerzugriffs
US9940934B2 (en) * 2015-11-18 2018-04-10 Uniphone Software Systems Adaptive voice authentication system and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104885071A (zh) * 2012-10-17 2015-09-02 纽昂斯通信有限公司 多设备智能语言模型同步
CN110503969A (zh) * 2018-11-23 2019-11-26 腾讯科技(深圳)有限公司 一种音频数据处理方法、装置及存储介质
CN109378006A (zh) * 2018-12-28 2019-02-22 三星电子(中国)研发中心 一种跨设备声纹识别方法及系统
CN112328994A (zh) * 2020-11-17 2021-02-05 携程计算机技术(上海)有限公司 声纹数据处理方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN112926042A (zh) 2021-06-08

Similar Documents

Publication Publication Date Title
US9799338B2 (en) Voice print identification portal
US7240007B2 (en) Speaker authentication by fusion of voiceprint match attempt results with additional information
US10529338B2 (en) Method and apparatus for performing speaker recognition
CA2267954C (en) Speaker verification method
CA2549092C (en) System and method for providing improved claimant authentication
USRE38101E1 (en) Methods and apparatus for performing speaker independent recognition of commands in parallel with speaker dependent recognition of names, words or phrases
AU2006306790B2 (en) System and method of subscription identity authentication utilizing multiple factors
US20160330198A1 (en) Biometric Authentication
CN104185868B (zh) 话音认证和语音识别系统及方法
US5917890A (en) Disambiguation of alphabetic characters in an automated call processing environment
US20040189441A1 (en) Apparatus and methods for verification and authentication employing voluntary attributes, knowledge management and databases
US20050273333A1 (en) Speaker verification for security systems with mixed mode machine-human authentication
CN104104664A (zh) 对验证码进行验证的方法、服务器、客户端和系统
JP2000259278A (ja) 生体情報を用いて個人認証を行う認証装置および方法
CN109150828A (zh) 一种验证注册方法及系统
US8441337B2 (en) Multicomputer data transferring and file accessing to authenticate online voting and registration in a secure database system
US20090079538A1 (en) Multicomputer Data Transferring and File Accessing to Authenticate Online Voting and Registration in a Secure Database System
CN112926042B (zh) 一种跨通道生物语音识别验证系统及验证方法
US20070250322A1 (en) Method and device for verifying the identity of a user of several telecommunication services using biometric characteristics
CN111444377A (zh) 一种声纹识别的认证方法和装置以及设备
WO1999000719A1 (en) Access-controlled computer system with automatic speech recognition
JP3977714B2 (ja) 個人認証システムおよび個人認証方法
CN106921668A (zh) 基于声纹识别的汽车用户快速验证方法及装置
JPH10116307A (ja) 電話取引支援システム及びその支援システムでの処理をコンピュータに実行させるためのプログラムを格納した記録媒体
KR20030001669A (ko) 음성인식을 이용한 보안 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant