CN105719651A

CN105719651A - 一种声纹采集和处理系统及其采集和处理方法

Info

Publication number: CN105719651A
Application number: CN201610083104.2A
Authority: CN
Inventors: 杨飞; 陈然然
Original assignee: Hefei Lianbao Information Technology Co Ltd
Current assignee: Hefei Lianbao Information Technology Co Ltd
Priority date: 2016-02-03
Filing date: 2016-02-03
Publication date: 2016-06-29

Abstract

本发明提供了一种声纹采集和处理系统及其采集和处理方法，所述系统根据收集到的用户的音频信息，获得其中的声纹特征，并扩充已建立的声纹特征信息库，同时辨别该声纹特征所属的用户编号；本发明提供的声纹采集和处理系统能够实时收集一区域内的音频信息，并对所收集的音频信息中的声纹特征进行分类，以判断与该声纹特征关联的用户，从而不断的扩展用户的声纹特征，由于在数据处理端会存有不断扩充的声纹特征，以使得其在声纹识别的效率和精确度上都得到了很大的改进。

Description

一种声纹采集和处理系统及其采集和处理方法

技术领域

本发明涉及一种音频处理领域，特别是一种声纹采集和处理系统及其采集和处理方法。

背景技术

目前，声音识别技术被广泛应用于多个领域，如安防、鉴权系统、目标认证、智能家居等。声音是每个人特有的生物特征，不会被复制或盗取，采用声音进行目标识别具有很高的安全性，识别的精确度与准确度和声纹数据库息息相关。现有的声音识别方式一般采用录制用户的语音的方式，其对录到的语音信号进行预处理，并提取语音信号中包含的用户的声纹特征，建立用户声纹模型；但是该方式训练样本较少，提取的声纹特征可能不完全，有可能会产生误判操作。另外采用的是本地处理器计算处理来识别声纹信息，具有处理器处理能力弱。复杂背景下无法胜任的缺点。

发明内容

本发明所要解决的技术问题是提供一种能够对提取的声纹特征进行分类存储并不断扩展存储的声纹采集和处理系统及其采集和处理方法。

为了解决上述技术问题，本发明采用了如下技术方案：

一种声纹采集和处理系统，根据收集到的用户的音频信息，获得其中的声纹特征，并扩充已建立的声纹特征信息库，同时辨别该声纹特征所属的用户编号。

其中，所述系统包括分布在一区域内不同位置处的用于采集音频信息的多个收音装置，与所述收音装置通信连接的数据处理端，所述数据处理端包括：

通信单元，其与所述收音装置通信连接；

声纹提取单元，其对所述收音装置转化后的音频信息进行处理并提取其中的声纹特征；

存储单元，其包括所述声纹特征信息库并存储有对应于各所述用户的声纹特征，每个所述用户以唯一的用户编号进行标识；

声纹对比单元，其将声纹特征与所述声纹特征信息库内的声纹特征进行对比，并判断所述存储单元内是否存在与该声纹特征为同类的声纹特征；

控制单元，其与所述通信单元、存储单元、声纹提取单元和声纹对比单元连接，并将所述收音装置转化后的音频信息发送至所述声纹提取单元以提取声纹特征，并将所提取的声纹特征发送至所述声纹对比单元，并根据所述声纹对比单元的判断结果控制所述存储单元将所述声纹特征与对应的用户编号关联存储。

其中，所述控制单元配置为当所述声纹对比单元判断为所述存储单元内存在与该声纹特征为同类的声纹特征时，将该声纹特征和与其同类的声纹特征的用户编号相关联存储；当所述声纹对比单元判断为所述存储单元内不存在与该声纹特征为同类的声纹特征时，将该声纹特征与新的用户编号相关联存储。

其中，所述数据处理端内还包括与所述控制单元电连接的身份识别单元，其配置为对声纹提取单元所提取的声纹特征分析以识别出用户的身份，所述用户的身份包括至少两类用户身份，所述存储单元内还将所述用户的身份与用户编号相关联存储。

其中，所述身份识别单元还配置为根据所述声纹出现的频率判定该用户的级别。

其中，所述控制单元还进一步配置为接收一第一预设值和第二预设值，其中第二预设值大于第一预设值，所述身份识别单元配置为同一用户的声纹特征出现的频率在第一预设值和第二预设值之间时，该用户被判定为访客。

其中，所述存储单元内包括：访客数据存储单元以及主要成员数据存储单元。

其中，所述数据处理端为具有浮点计算功能的云服务器。

本发明还提供了一种基于上述的声纹采集和处理系统的声纹采集和处理方法，其包括以下步骤：

收集一区域内用户的音频信息；

从所述音频信息中提取声纹特征；

将所述声纹特征存储在所述声纹特征信息库中，并辨别所述声纹特征所属的用户编号。

其中，所述辨别所述声纹特征所述的用户编号的方法包括以下步骤：

将提取的声纹特征与声纹特征信息库内的声纹特征进行对比，并判断所述声纹特征信息库内是否存在与该声纹特征相近的声纹特征；其中，所述声纹特征信息库内存储有对应于各所述用户的声纹特征，每个所述用户以唯一的用户编号进行标识；

控制单元根据所述声纹对比单元的判断结果控制所述声纹特征信息库将所述声纹特征与对应的用户编号关联存储。

与现有技术相比，本发明的有益效果在于：

1、本发明提供的声纹采集和处理系统能够实时收集一区域内的音频信息，并对所收集的音频信息中的声纹特征进行分类，以判断与该声纹特征关联的用户，从而不断的扩展用户的声纹特征，由于在数据处理端会存有不断扩充的声纹特征，以使得其在声纹识别的效率和精确度上都得到了很大的改进；

2、由于本发明中的数据处理端还可以通过用户的声纹特征来判断其属于成人或是儿童或是其他的身份，或者根据声纹特征出现的频率判断其属于访客还是主要成员等级别，从而通过对用户的身份的识别，可以在安防、智能家居等环境中设定其操作或工作权限，以达到安全防护的作用。

附图说明

图1为本发明实施例的一种声纹采集和处理系统的原料框图；

图2为本发明另一实施例的一种声纹采集和处理系统的原料框图；

图3为本发明实施例的一种声纹采集和处理系统的声纹采集和处理方法的流程图。

附图标记说明

1-收音装置2-数据处理端

21-通信单元22-声纹提取单元

23-存储单元24-声纹对比单元

25-控制单元26-身份识别单元

具体实施方式

下面结合附图和具体实施例对本发明作进一步详细描述，但不作为对本发明的限定。

本发明实施例所提供的声纹采集和处理系统，能够根据收集到的用户的音频信息，而获得其中的声纹特征，并扩充已建立的声纹特征信息库，以用于辨别用户的身份。本实施例中可以通过存储不断扩充的声纹特征以达到样本多样化的目的，而且还可以提高对用户的声纹的识别速度和识别精度，起到更加安全有效的效果。而且本实施例中用户的身份可以是成人和儿童，也可以是访客或主要成员。身份的识别可以应用到智能家居或安防等其他领域上，以根据用户的身份来限定其权限，以起到安全防护的作用。

如图1所示，为本发明实施例中的声纹采集和处理系统的原理框图，其中，所述系统可以包括分布在一区域内不同位置处的用于采集音频信息的多个收音装置1以及与收音装置1通信连接的数据处理端2，数据处理端2包括：通信单元21、声纹提取单元22、存储单元23、声纹对比单元24、控制单元25，其中，通信单元21与收音装置1通信连接，以接收音频信息；声纹提取单元22对收音装置1采集并转化后的音频信息进行处理并提取其中的声纹特征，本实施例中的声纹特征是指音频信号的频率、幅度相位等特征值，而且本实施例中的声纹提取单元22还可以识别出来自于电子设备的声音，如当识别为电视或广播的声音时，停止声纹的提取；存储单元23其包括如上所述的声纹特征信息库，且存储单元21内存储有对应于各所述用户的声纹特征，每个所述用户以唯一的用户编号进行标识；声纹对比单元24将声纹提取单元22提取出的声纹特征与声纹信息库内的声纹特征进行对比，并判断存储单元23内是否存在与该声纹特征为同类的声纹特征，由于每个用户在一般情况下发出的声音的声纹特征基本相同，因此，本实施例中将相似的声纹特征分成一类以对应于相同的用户；控制单元25与通信单元21、存储单元23、声纹提取单元22和声纹对比单元24电连接，并将通信单元21接收到的音频信息发送至声纹提取单元22以提取声纹特征，并将所提取的声纹特征发送至声纹对比单元24，并根据声纹对比单元24的判断结果控制存储单元23将所述声纹特征与对应的用户编号关联存储，其中，控制单元25配置为当声纹对比单元24判断为存储单元23内存在与该声纹特征为同类的声纹特征时，将该声纹特征和与其为同类的声纹特征的用户编号相关联存储；当声纹对比单元24判断为存储单元23内不存在与该声纹特征为同类的声纹特征时，将该声纹特征与新的用户编号相关联存储。通过这样的配置，可以将具有相同或相似声纹特征的音频信息与对应的用户分别存储，以此，方便统计数据和用户身份的管理。由于本发明实施中的数据量不断的扩展，这就要求数据处理端的强大运算功能和内存空间，因此，本发明实施例中的数据处理端可以是具有浮点计算功能的云服务器。

如图2所示，为本发明另一实施例中的声纹采集和处理系统的原料框图，其中，数据处理端2内还包括与控制单元25电连接的身份识别单元26，其配置为对声纹提取单元22所提取的声纹特征分析以识别出用户的身份，用户的身份包括至少两类用户身份，如成人和儿童，存储单元21内还将所识别出的用户的身份与用户编号相关联存储，身份识别单元26还配置为根据一定时间内声纹出现的频率判定该用户的级别，如可以判断为访客或主要成员身份。

控制单元25还可以通过通信单元21接收一第一预设值和第二预设值信息，其中第二预设值大于第一预设值，身份识别单元26可以在同一用户的声纹特征出现的频率在第一预设值和第二预设值之间时，该用户被判定为访客，而当用户声纹特征出现的频率大于第二预设值时，该用户的被判定为主要成员。同样的，存储单元内包括：访客数据存储单元以及主要成员数据存储单元，以对身份为访客或家庭成员的用户的声纹特征等数据分别存储。

如本实施例中设定样本采集周期T，对在这个周期T内采集的声纹特征进行分类存储，具有相似声纹特征的信号归为一类。例如，假设声纹具有a,b,c三个特征，

用户A的声纹特征为a’、b’、c’，则凡是采集到类似声纹特征为a’、b’、c’，则归为A类；用户B的声纹特征为a”、b”、c”，则凡是采集到类似声纹特征为a”、b”、c”，则归为B类：本实施例中的声纹提取单元22可以在周期T内采集了每个用户的N组声纹特征数据，并分别对特征a,b,c的N个数据进行正态分布的筛选，去除偏离较大的M个数据，然后对剩余的(N-M)个数据取平均得出最终的特征数据作为标本，以保存至存储单元。

而身份识别单元26可以对周期T内样本总数介于K-L(K为第一预定值，L为第二预定值)之间的值，认定为是访客非主要成员，而且可根据每个用户的声纹特征进行身份识别判断是大人还是儿童，这样可对儿童的关于智能家居系统的操作权限做出限定。

如图3所示，为本发明实施例中一种基于声纹采集和处理系统的声纹采集和处理方法，其包括以下步骤：

S1：利用收音装置收集一区域内用户的音频信息；

从所述音频信息中提取声纹特征；

而且，其中所述辨别所述用户编号的方法包括以下步骤：

将提取的声纹特征与声纹特征信息库内的声纹特征进行对比，并判断所述声纹特征信息库内是否存在与该声纹特征为同类的声纹特征；其中，声纹特征信息库内存储有对应于各所述用户的声纹特征，每个所述用户以唯一的用户编号进行标识；控制单元根据所述声纹对比单元的判断结果控制所述声纹特征信息库将所述声纹特征与对应的用户编号关联存储。

以上实施例仅为本发明的示例性实施例，不用于限制本发明，本发明的保护范围由权利要求书限定。本领域技术人员可以在本发明的实质和保护范围内，对本发明做出各种修改或等同替换，这种修改或等同替换也应视为落在本发明的保护范围内。

Claims

1.一种声纹采集和处理系统，其特征在于，根据收集到的用户的音频信息，获得其中的声纹特征，扩充已建立的声纹特征信息库，同时辨别该声纹特征所属的用户编号。

2.根据权利要求1所述的声纹采集和处理系统，其特征在于，所述系统包括分布在一区域内不同位置处的用于采集音频信息的多个收音装置，与所述收音装置通信连接的数据处理端，所述数据处理端包括：

通信单元，其与所述收音装置通信连接；

3.根据权利要求2所述的声纹采集和处理系统，其特征在于，所述控制单元配置为当所述声纹对比单元判断为所述存储单元内存在与该声纹特征为同类的声纹特征时，将该声纹特征和与其同类的声纹特征的用户编号相关联存储；当所述声纹对比单元判断为所述存储单元内不存在与该声纹特征为同类的声纹特征时，将该声纹特征与新的用户编号相关联存储。

4.根据权利要求2所述的声纹采集和处理系统，其特征在于，所述数据处理端内还包括与所述控制单元电连接的身份识别单元，其配置为对声纹提取单元所提取的声纹特征分析以识别出用户的身份，所述用户的身份包括至少两类用户身份，所述存储单元内还将所述用户的身份与用户编号相关联存储。

5.根据权利要求4所述的声纹采集和处理系统，其特征在于，所述身份识别单元还配置为根据所述声纹出现的频率判定该用户的级别。

6.根据权利要求4所述的声纹采集和处理系统，其特征在于，所述控制单元还进一步配置为接收一第一预设值和第二预设值，其中第二预设值大于第一预设值，所述身份识别单元配置为同一用户的声纹特征出现的频率在第一预设值和第二预设值之间时，该用户被判定为访客。

7.根据权利要求2所述的声纹采集和处理系统，其特征在于，所述存储单元内包括：访客数据存储单元以及主要成员数据存储单元。

8.根据权利要求2所述的声纹采集和处理系统，其特征在于，所述数据处理端为具有浮点计算功能的云服务器。

9.一种基于权利要求1-8中任意一项所述系统的声纹采集和处理方法，其特征在于，包括以下步骤：

收集一区域内用户的音频信息；

从所述音频信息中提取声纹特征；

10.根据权利要求9所述的方法，其特征在于，所述辨别所述声纹特征所述的用户编号的方法包括以下步骤：