CN112926042B

CN112926042B - 一种跨通道生物语音识别验证系统及验证方法

Info

Publication number: CN112926042B
Application number: CN202110395431.2A
Authority: CN
Inventors: 张寅�; 张翼
Original assignee: Effective Software Technology Shanghai Co ltd
Current assignee: Effective Software Technology Shanghai Co ltd
Priority date: 2021-04-13
Filing date: 2021-04-13
Publication date: 2024-01-16
Anticipated expiration: 2041-04-13
Also published as: CN112926042A

Abstract

本发明的一种跨通道生物语音识别验证系统及验证方法，本申请的系统在验证时可以避免由于验证过程产生的声纹模型对主数据库中最高质量的宽带数据通道音频的声纹模型产生影响，且可以对不同通道发出的验证语音进行相对应的子数据库的声纹模型更新，防止不同通道发出的验证语音对统一数据库的声纹模型更新带来的影响，提升了不同通道语音验证的准确率且若干个子数据库依托于同一主数据库，不需要每个通道建立单独的数据库，使用及存储更加便捷。

Description

一种跨通道生物语音识别验证系统及验证方法

技术领域

本发明属于识别语音技术领域，具体来说是一种跨通道生物语音识别验证系统及验证方法。

背景技术

语音生物识别系统是通过将给定的声纹模型与已注册的声纹模型进行比较，通过语音识别个人的技术。语音生物识别系统精度的测量通常由相等误差率(EER)来衡量。当给定的声纹模型来自不同的信道或设备+时，当前一代语音生物识别系统会受到影响。Each数据通道或设备在音频文件上留下唯一的签名，如果注册位于与身份验证不同的通道或设备上，则等于错误率(EER)会降低。例如，如果系统将移动应用注册与IVR身份验证请求进行对比，则IVR身份验证请求的精度受到影响。

为了保持准确性，语音生物识别系统必须保留单独的数据库，但是不同的验证通道进行身份验证的时候需要进行不同的验证，不同的验证来自于不同的数据库，因此用户必须注册每个频道，会产生验证过程中不必要的复杂性，且不同的数据库的音频文件会存在一定差别，使得验证的错误率(EER)升高。

发明内容

1.发明要解决的技术问题

本发明的目的在于解决现有的语音生物识别系统在进行不同通道的验证过程中由于声纹模型更新的影响会影响不同通道的验证正确率的问题。

2.技术方案

为达到上述目的，本发明提供的技术方案为：

本发明的一种跨通道生物语音识别验证系统，包括相互通信连接的音频接收模块、音频匹配模块和主数据库，所述主数据库连接有若干个子数据库，所述主数据库内存储有用户的最高质量的宽带数据通道音频的声纹模型，若干个所述子数据库分别存储主数据库内的声纹模型经过不同通道后的声纹模型，所述音频接收模块包括若干个一一对应的音频接收单元和音频传输单元，若干个所述音频接收单元接收不同通道的语音音频数据并通过相对应的音频传输单元输送给音频匹配模块，若干个所述音频传输单元设有特定的用户ID与若干个子数据库一一对应，音频匹配模块根据音频传输单元的用户ID匹配相对应的子数据库并进行验证。

优选的，还包括音频更新模块，所述音频更新模块分别与音频接收模块、主数据库通信连接，所述音频更新模块更新匹配成功的子数据库中的声纹模型。

优选的，还包括音频存储模块，所述音频存储模块分别与音频接收模块、主数据库通信连接，所述音频存储模块用于存储新用户的最高质量的宽带数据通道音频的声纹模型并将其复制到各个子数据库。

优选的，所述音频更新模块包括声纹模型单元，所述声纹模型单元根据不同的用户ID创建相对应的声纹模型将用户的声纹模型输入在对应的子数据库内。

一种跨通道生物语音识别验证方法，所述方法采用上述的系统进行，所述方法具体为：新用户注册后通过音频接收模块将最高质量的宽带数据通道音频发送给音频存储模块，音频存储模块将最高质量的宽带数据通道音频根据声纹模型打印到主数据库中并复制到各个子数据库，当用户通过音频接收单元进行呼叫验证时，音频接收单元将用户的验证音频通过对应的音频传输单元发送给音频匹配模块，音频匹配模块根据音频接收单元所对应的用户ID选择相对应的子数据库，将用户的验证音频与相对应的子数据库中的声纹模型进行对比，当验证通过时，允许音频接收单元和音频传输单元建立通信，音频更新模块将通信的音频通过声纹模型打印到对应的子数据库进行更新存储。

优选的，所述方法包括如下步骤：

S100、注册声纹模型；

S200、用户身份验证；

S300、用户进行通信；

S400、更新声纹模型。

优选的，所述步骤S100中的注册声纹模型具体为新用户注册后通过音频接收模块将最高质量的宽带数据通道音频发送给音频存储模块，音频存储模块将最高质量的宽带数据通道音频根据声纹模型打印到主数据库中并复制到各个子数据库，所述音频接收模块中的音频接收单元设有与新用户一一对应的用户ID。

优选的，所述步骤S200中的用户身份验证具体为用户通过音频接收单元进行呼叫验证时，音频接收单元将用户的验证音频通过对应的音频传输单元发送给音频匹配模块，音频匹配模块根据音频接收单元所对应的用户ID选择相对应的子数据库，将用户的验证音频与相对应的子数据库中的声纹模型进行对比。

优选的，所述步骤S300中的用户进行通信具体为音频接收模块接收用户的语音并发送给相应的设备。

优选的，所述步骤S400中的更新声纹模型具体为音频更新模块将通信的音频通过声纹模型打印到对应的子数据库进行更新存储。

3.有益效果

采用本发明提供的技术方案，与现有技术相比，具有如下有益效果：

本发明的一种跨通道生物语音识别验证系统及验证方法，包括相互通信连接的音频接收模块、音频匹配模块和主数据库，主数据库连接有若干个子数据库，主数据库内存储有用户的最高质量的宽带数据通道音频的声纹模型，若干个子数据库分别存储主数据库内的声纹模型经过不同通道后的声纹模型，音频接收模块包括若干个一一对应的音频接收单元和音频传输单元，若干个音频接收单元接收不同通道的语音音频数据并通过相对应的音频传输单元输送给音频匹配模块，若干个音频传输单元设有特定的用户ID与若干个子数据库一一对应，音频匹配模块根据音频传输单元的用户ID匹配相对应的子数据库并进行验证。本申请的系统在验证时可以避免由于验证过程产生的声纹模型对主数据库中最高质量的宽带数据通道音频的声纹模型产生影响，且可以对不同通道发出的验证语音进行相对应的子数据库的声纹模型更新，防止不同通道发出的验证语音对统一数据库的声纹模型更新带来的影响，提升了不同通道语音验证的准确率且若干个子数据库依托于同一主数据库，不需要每个通道建立单独的数据库，使用及存储更加便捷。

附图说明

图1为本发明的一种跨通道生物语音识别验证系统的结构示意图；

图2为本发明的一种跨通道生物语音识别验证方法的流程图。

示意图中的标号说明：

300、音频接收模块；400、音频存储模块；500、音频匹配模块；600、音频更新模块；700、主数据库。

具体实施方式

为了便于理解本发明，下面将参照相关附图对本发明进行更全面的描述，附图中给出了本发明的若干实施例，但是，本发明可以以许多不同的形式来实现，并不限于本文所描述的实施例，相反地，提供这些实施例的目的是使对本发明的公开内容更加透彻全面。

需要说明的是，当元件被称为“固设于”另一个元件，它可以直接在另一个元件上或者也可以存在居中的元件；当一个元件被认为是“连接”另一个元件，它可以是直接连接到另一个元件或者可能同时存在居中元件；本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同；本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本发明；本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。

实施例1

参照附图1-附图2，本实施例的一种跨通道生物语音识别验证系统，包括相互通信连接的音频接收模块300、音频匹配模块500和主数据库700，所述主数据库700连接有若干个子数据库，所述主数据库700内存储有用户的最高质量的宽带数据通道音频的声纹模型，若干个所述子数据库分别存储主数据库700内的声纹模型经过不同通道后的声纹模型，所述音频接收模块300包括若干个一一对应的音频接收单元和音频传输单元，若干个所述音频接收单元接收不同通道的语音音频数据并通过相对应的音频传输单元输送给音频匹配模块500，若干个所述音频传输单元设有特定的用户ID与若干个子数据库一一对应，音频匹配模块500根据音频传输单元的用户ID匹配相对应的子数据库并进行验证。本申请的系统在验证时可以避免由于验证过程产生的声纹模型对主数据库中最高质量的宽带数据通道音频的声纹模型产生影响，且可以对不同通道发出的验证语音进行相对应的子数据库的声纹模型更新，防止不同通道发出的验证语音对统一数据库的声纹模型更新带来的影响，提升了不同通道语音验证的准确率且若干个子数据库依托于同一主数据库，不需要每个通道建立单独的数据库，使用及存储更加便捷。

本实施例的系统还包括音频更新模块600，所述音频更新模块600分别与音频接收模块300、主数据库700通信连接，所述音频更新模块600更新匹配成功的子数据库中的声纹模型。

本实施例的系统还包括音频存储模块400，所述音频存储模块400分别与音频接收模块300、主数据库700通信连接，所述音频存储模块400用于存储新用户的最高质量的宽带数据通道音频的声纹模型并将其复制到各个子数据库。

本实施例包括子数据库1、子数据库2、子数据库3…子数据库N；音频接收单元1、音频接收单元2、音频接收单元3…音频接收单元N；音频传输单元1、音频传输单元2、音频传输单元3…音频传输单元N；音频传输单元1只用于接收音频接收单元1的音频数据，音频传输单元1设有特定的用户ID使得音频匹配模块500将音频传输单元1与子数据库1对应。

音频更新模块600包括声纹模型单元，所述声纹模型单元根据不同的用户ID创建相对应的声纹模型将用户的声纹模型输入在对应的子数据库内。

一种跨通道生物语音识别验证方法，所述方法采用上述的系统进行，所述方法具体为：新用户注册后通过音频接收模块300将最高质量的宽带数据通道音频发送给音频存储模块400，音频存储模块400将最高质量的宽带数据通道音频根据声纹模型打印到主数据库700中并复制到各个子数据库，当用户通过音频接收单元进行呼叫验证时，音频接收单元将用户的验证音频通过对应的音频传输单元发送给音频匹配模块500，音频匹配模块500根据音频接收单元所对应的用户ID选择相对应的子数据库，将用户的验证音频与相对应的子数据库中的声纹模型进行对比，当验证通过时，允许音频接收单元和音频传输单元建立通信，音频更新模块600将通信的音频通过声纹模型打印到对应的子数据库进行更新存储。

本实施例的方法包括如下步骤：

S100、注册声纹模型；

S200、用户身份验证；

S300、用户进行通信；

S400、更新声纹模型。

步骤S100中的注册声纹模型具体为新用户注册后通过音频接收模块300将最高质量的宽带数据通道音频发送给音频存储模块400，音频存储模块400将最高质量的宽带数据通道音频根据声纹模型打印到主数据库700中并复制到各个子数据库，所述音频接收模块300中的音频接收单元设有与新用户一一对应的用户ID。

步骤S200中的用户身份验证具体为用户通过音频接收单元进行呼叫验证时，音频接收单元将用户的验证音频通过对应的音频传输单元发送给音频匹配模块500，音频匹配模块500根据音频接收单元所对应的用户ID选择相对应的子数据库，将用户的验证音频与相对应的子数据库中的声纹模型进行对比。

步骤S300中的用户进行通信具体为音频接收模块300接收用户的语音并发送给相应的设备。

步骤S400中的更新声纹模型具体为音频更新模块600将通信的音频通过声纹模型打印到对应的子数据库进行更新存储。

以上所述实施例仅表达了本发明的某种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制；应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围；因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种跨通道生物语音识别验证系统，其特征在于：包括相互通信连接的音频接收模块(300)、音频匹配模块(500)和主数据库(700)，所述主数据库(700)连接有若干个子数据库，所述主数据库(700)内存储有用户的最高质量的宽带数据通道音频的声纹模型，若干个所述子数据库分别存储主数据库(700)内的声纹模型经过不同通道后的声纹模型，所述音频接收模块(300)包括若干个一一对应的音频接收单元和音频传输单元，若干个所述音频接收单元接收不同通道的语音音频数据并通过相对应的音频传输单元输送给音频匹配模块(500)，若干个所述音频传输单元设有特定的用户ID与若干个子数据库一一对应，音频匹配模块(500)根据音频传输单元的用户ID匹配相对应的子数据库并进行验证；

还包括音频存储模块(400)，所述音频存储模块(400)分别与音频接收模块(300)、主数据库(700)通信连接，所述音频存储模块(400)用于存储新用户的最高质量的宽带数据通道音频的声纹模型并将其复制到各个子数据库。

2.根据权利要求1所述的一种跨通道生物语音识别验证系统，其特征在于：还包括音频更新模块(600)，所述音频更新模块(600)分别与音频接收模块(300)、主数据库(700)通信连接，所述音频更新模块(600)更新匹配成功的子数据库中的声纹模型。

3.根据权利要求1所述的一种跨通道生物语音识别验证系统，其特征在于：音频更新模块(600)包括声纹模型单元，所述声纹模型单元根据不同的用户ID创建相对应的声纹模型将用户的声纹模型输入在对应的子数据库内。

4.一种跨通道生物语音识别验证方法，其特征在于，所述方法采用上述权利要求3所述的系统进行，所述方法具体为：新用户注册后通过音频接收模块(300)将最高质量的宽带数据通道音频发送给音频存储模块(400)，音频存储模块(400)将最高质量的宽带数据通道音频根据声纹模型打印到主数据库(700)中并复制到各个子数据库，当用户通过音频接收单元进行呼叫验证时，音频接收单元将用户的验证音频通过对应的音频传输单元发送给音频匹配模块(500)，音频匹配模块(500)根据音频接收单元所对应的用户ID选择相对应的子数据库，将用户的验证音频与相对应的子数据库中的声纹模型进行对比，当验证通过时，允许音频接收单元和音频传输单元建立通信，音频更新模块(600)将通信的音频通过声纹模型打印到对应的子数据库进行更新存储。

5.根据权利要求4所述的一种跨通道生物语音识别验证方法，其特征在于，所述方法包括如下步骤：

S100、注册声纹模型；

S200、用户身份验证；

S300、用户进行通信；

S400、更新声纹模型。

6.根据权利要求5所述的一种跨通道生物语音识别验证方法，其特征在于：所述步骤S100中的注册声纹模型具体为新用户注册后通过音频接收模块(300)将最高质量的宽带数据通道音频发送给音频存储模块(400)，音频存储模块(400)将最高质量的宽带数据通道音频根据声纹模型打印到主数据库(700)中并复制到各个子数据库，所述音频接收模块(300)中的音频接收单元设有与新用户一一对应的用户ID。

7.根据权利要求5所述的一种跨通道生物语音识别验证方法，其特征在于：所述步骤S200中的用户身份验证具体为用户通过音频接收单元进行呼叫验证时，音频接收单元将用户的验证音频通过对应的音频传输单元发送给音频匹配模块(500)，音频匹配模块(500)根据音频接收单元所对应的用户ID选择相对应的子数据库，将用户的验证音频与相对应的子数据库中的声纹模型进行对比。

8.根据权利要求5所述的一种跨通道生物语音识别验证方法，其特征在于：所述步骤S300中的用户进行通信具体为音频接收模块(300)接收用户的语音并发送给相应的设备。

9.根据权利要求5所述的一种跨通道生物语音识别验证方法，其特征在于：所述步骤S400中的更新声纹模型具体为音频更新模块(600)将通信的音频通过声纹模型打印到对应的子数据库进行更新存储。