CN112070949B

CN112070949B - 基于语音识别的智能化门禁识别系统

Info

Publication number: CN112070949B
Application number: CN202010851531.7A
Authority: CN
Inventors: 孙强; 祁立志
Original assignee: Huaibei Shengshi Haoming Technology Service Co ltd
Current assignee: Huaibei Shengshi Haoming Technology Co ltd
Priority date: 2020-08-21
Filing date: 2020-08-21
Publication date: 2022-02-15
Anticipated expiration: 2040-08-21
Also published as: CN112070949A

Abstract

本发明提供一种基于语音识别的智能化门禁识别系统，其包括第一声音传感器、第二声音传感器、第三声音传感器、特征量提取单元、信号处理电路、信号处理单元、信号发生单元、信号接收单元、智能门禁处理器、图像采集单元、图像对比单元以及门禁控制器，其中，第一声音传感器可实现对语音特征量的识别区分语音处理方式，进而使用第二声音传感器或第三声音传感器接收用户语音信号，再通过各自的信号处理方式对语音信号进行处理，如此能够大大提高语音识别的精度。

Description

基于语音识别的智能化门禁识别系统

技术领域

本发明涉及智能门禁领域，尤其涉及一种基于语音识别的智能化门禁识别系统。

背景技术

RFID（Radio Frequency Identification），即无线射频识别，是一种短距离无线通信技术。与其它短距离无线通信技术WLAN、蓝牙、红外、ZIGBEE、UWB 相比，最大的区别在于RFID 是被动工作模式。RFID 技术采用大规模集成电路计算、电子识别、计算机通信等技术，通过读写器和安装于载体上的RFID 标签，实现对载体的非接触识别和数据信息交换，加上其方便快捷、识别速度快、数据容量大、使用寿命长、标签数据可动态更改等特点，因此较条码而言具有更好的安全性、动态实时通等优点，所以被广泛应用于家庭、宾馆、公司等门禁系统。

ASR(Automatic Speech Recognition),即语音识别技术，其目标是将人类语音中的词汇内容转换为计算机可读的输入数据。ASR 技术所要解决的问题是让计算机能够“听懂”人类的语音，将语音中包含的文字信息“提取”出来。ASR 技术在“能听会说”的智能计算机系统中扮演着重要角色，相当于给计算机系统安装上“耳朵”，使其具备“能听”的功能，从而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和交互。

现在的门禁控制系统在使用语音识别功能进行识别时，未能对不同的语音进行区分有效处理，即语音识别的精度过低，而且未能配合其他识别方式共同保障识别的精准度。

发明内容

因此，为了克服上述问题，本发明提供一种基于语音识别的智能化门禁识别系统，其包括第一声音传感器、第二声音传感器、第三声音传感器、特征量提取单元、信号处理电路、信号处理单元、信号发生单元、信号接收单元、智能门禁处理器、图像采集单元、图像对比单元以及门禁控制器，其中，第一声音传感器可实现对语音特征量的识别区分语音处理方式，进而使用第二声音传感器或第三声音传感器接收用户语音信号，再通过各自的信号处理方式对语音信号进行处理，如此能够大大提高语音识别的精度。

本发明提供的基于语音识别的智能化门禁识别系统包括第一声音传感器、第二声音传感器、第三声音传感器、特征量提取单元、信号处理电路、信号处理单元、信号发生单元、信号接收单元、智能门禁处理器、图像采集单元、图像对比单元以及门禁控制器。

其中，第一声音传感器的输出端与特征量提取单元的输入端连接，第二声音传感器的输出端与信号处理电路的输入端连接，第三声音传感器的输出端与信号处理单元的输入端连接，特征量提取单元的输出端、信号处理电路的输出端以及信号处理单元的输出端均与智能门禁处理器的输入端连接，信号发生单元、信号接收单元以及智能门禁处理器依次连接，图像采集单元、图像对比单元以及智能门禁处理器依次连接，智能门禁处理器的输出端与门禁控制器的输入端连接。

其中，用户随身携带信号发生单元，信号发生单元进入信号接收单元的接收范围时，信号接收单元接收到信号发生单元所发射的射频信号，信号接收单元在接收到上述射频信号后，智能门禁处理器发出第一触发信号至图像采集单元，图像采集单元接收到第一触发信号后开始采集用户的面部图像信息，图像采集单元将采集到的面部图像信息传输至图像对比单元，图像对比单元内存储有被允许进入门禁人员的面部图像信息，若图像对比单元接收到的面部图像信息和图像对比单元内存储的面部图像信息之一相吻合，则智能门禁处理器发出第二触发信号至第一声音传感器，第一声音传感器在接收到第二触发信号后开始采集用户的语音信号，第一声音传感器将采集到的语音信号传输至特征量提取单元，特征量提取单元提取第一声音传感器采集的语音信号的特征量，特征量传感器将提取的特征量传输至智能门禁处理器，智能门禁处理器中包括一特征量比对模块，特征量比对模块内存储有第一特征量范围和第二特征量范围，智能门禁处理器将接收到的特征量和特征量比对模块内存储的第一特征量范围和第二特征量范围进行比对，若特征量在第一特征量范围内，则所示智能门禁处理器发出第三触发信号至第二声音传感器，并提示用户说出指定词汇，第二声音传感器在接收到第三触发信号后开始采集用户语音信号，第二声音传感器将采集到的语音信号传输至信号处理电路进行信号处理后再传输至智能门禁处理器，智能门禁处理器内还包括一标准语音波形比对模块，标准语音波形比对模块中存储有被允许进入门禁人员的语音波形，智能门禁处理器将接收到的第二声音传感器采集的语音信号传输至标准语音波形比对模块，若标准语音波形比对模块接收到的语音信号波形与其存储的被允许进入门禁人员的语音波形匹配，则智能门禁处理器控制门禁控制器打开门禁，若特征量在第二特征量范围内，则所示智能门禁处理器发出第四触发信号至第三声音传感器，并提示用户说出指定词汇，第三声音传感器在接收到第四触发信号后开始采集用户语音信号，第三声音传感器将采集到的语音信号传输至信号处理单元进行信号处理后再传输至智能门禁处理器，智能门禁处理器将接收到的第三声音传感器采集的语音信号传输至标准语音波形比对模块，若标准语音波形比对模块接收到的语音信号波形与其存储的被允许进入门禁人员的语音波形匹配，则智能门禁处理器控制门禁控制器打开门禁。

具体地，智能门禁处理器还包括一触发信号发射模块，触发信号发射模块根据智能门禁处理器的控制用于发射第一触发信号、第二触发信号、第三触发信号或第四触发信号。

具体地，信号处理电路包括运算放大器A、二极管D1、电感L1、电容C1-C3以及电阻R1-R5。

其中，第二声音传感器将采集到的语音信号V0传输至电感L1的一端，电容C1的一端接地，电容C1的另一端与电感L1的另一端连接，电感L1的另一端与二极管D1的阳极连接，电阻R2的一端接地，电阻R2的另一端与电阻R1的一端连接，电阻R1的另一端与二极管D1的阴极连接，电容C2的一端与电阻R2的一端连接，电容C2的另一端与电阻R1的另一端连接，电容C3的一端接地，电容C3的另一端与电阻R3的一端连接，电阻R3的另一端与电阻R4的一端连接，电阻R4的另一端与运算放大器A的同相输入端连接，电阻R5的一端与电阻R3的一端连接，电阻R5的另一端与运算放大器A的反相输入端连接，运算放大器A的输出端与智能门禁处理器的标准语音波形比对模块连接，运算放大器A输出电信号V1传输至标准语音波形比对模块。

具体地，第一声音传感器、第二声音传感器以及第三声音传感器均内置一个对声音敏感的电容式驻极体话筒，声波使话筒内的驻极体薄膜振动，导致电容的变化，而产生与之对应变化的电压信号。

具体地，第一声音传感器将采集到的语音信号传输至特征量提取单元，特征量提取单元提取第一声音传感器采集的语音信号的特征量，特征量为第一声音传感器采集到的语音信号的频率参数。

具体地，第三声音传感器将采集到的语音信号传输至信号处理单元进行信号处理，具体步骤如下：

步骤1：设定第三声音传感器采集的语音信号为：

其中，xi为第三声音传感器采集的语音信号，Si为第三声音传感器采集的语音信号中的有效信号，yi为噪声信号；

步骤2：设定噪声信号的表达式为：

其中，A为噪声信号yi的幅值，

为噪声信号yi的延时参数，△t为第三声音传感器的采样间隔时间，f为噪声信号yi的频率，i表示第三声音传感器的时间序列参数；

步骤3：计算噪声信号yi的幅值A，求取幅值A的函数Q：

其中，x为第三声音传感器采样的时间序列向量，c为噪声信号yi函数余弦向量，N为采样数量；

则有，

步骤4：求取噪声信号yi的频率f，则有频率修正函数△f，其中，

W为系数矩阵，由噪声信号yi的延时确定，则有，

s为噪声信号yi函数正弦向量，则有

则有，

其中，f0为噪声信号yi的初始频率值；

步骤5：令

，

为噪声信号yi函数的初始延时值，根据上述求出的A、f以及

求取yi；

步骤6：信号处理单元将

传输至智能门禁处理器。

与现有技术相比，本发明具有如下的有益效果：

（1）本发明提供一种基于语音识别的智能化门禁识别系统，其包括第一声音传感器、第二声音传感器、第三声音传感器、特征量提取单元、信号处理电路、信号处理单元、信号发生单元、信号接收单元、智能门禁处理器、图像采集单元、图像对比单元以及门禁控制器，其中，第一声音传感器可实现对语音特征量的识别区分语音处理方式，进而使用第二声音传感器或第三声音传感器接收用户语音信号，再通过各自的信号处理方式对语音信号进行处理，如此能够大大提高语音识别的精度。

（2）本发明提供的一种基于语音识别的智能化门禁识别系统，本发明的发明点还在于，信号处理电路一侧得到第二声音传感器的语音信号V0，信号处理电路的语音信号V0可从由二极管D1和电容C2构成的半波整流器获取。此电压信号由电阻R1和R2进一步分压，为了检测语音信号V0的变化，使用由电阻R3和电容C3构成的滤波器来过滤语音信号V0的峰值电压信号，以得到语音信号V0的均值，即可实现对语音信号V0输出功率的调节。

（3）本发明提供的一种基于语音识别的智能化门禁识别系统，本发明的发明点还在于，第三声音传感器将采集到的语音信号传输至信号处理单元进行信号处理，信号处理单元通过对第三传感器采集的信号的分析，分离有效信号和噪声信号。

附图说明

图1为本发明的基于语音识别的智能化门禁识别系统的功能图；

图2为本发明的智能门禁处理器的功能图；

图3为本发明的信号处理电路的示意图。

具体实施方式

下面结合附图和实施例对本发明提供的基于语音识别的智能化门禁识别系统进行详细说明。

如图1所示，本发明提供的基于语音识别的智能化门禁识别系统包括第一声音传感器、第二声音传感器、第三声音传感器、特征量提取单元、信号处理电路、信号处理单元、信号发生单元、信号接收单元、智能门禁处理器、图像采集单元、图像对比单元以及门禁控制器。

上述实施方式中，本发明提供的基于语音识别的智能化门禁识别系统，其包括第一声音传感器、第二声音传感器、第三声音传感器、特征量提取单元、信号处理电路、信号处理单元、信号发生单元、信号接收单元、智能门禁处理器、图像采集单元、图像对比单元以及门禁控制器，其中，第一声音传感器可实现对语音特征量的识别区分语音处理方式，进而使用第二声音传感器或第三声音传感器接收用户语音信号，再通过各自的信号处理方式对语音信号进行处理，如此能够大大提高语音识别的精度。

更进一步地，第一特征量范围为男声语音信号特征量范围，第二特征量范围为女声语音信号特征量范围，若特征量在第一特征量范围内，则判断用户为男性，若特征量在第二特征量范围内，则判断用户为女性。

如图2所示，智能门禁处理器还包括一触发信号发射模块，触发信号发射模块根据智能门禁处理器的控制用于发射第一触发信号、第二触发信号、第三触发信号或第四触发信号。

如图3所示，信号处理电路包括运算放大器A、二极管D1、电感L1、电容C1-C3以及电阻R1-R5。

上述实施方式中，运算放大器A的型号为LTC4125。

信号处理电路一侧得到第二声音传感器的语音信号V0，信号处理电路的语音信号V0可从由二极管D1和电容C2构成的半波整流器获取。此电压信号由电阻R1和R2进一步分压，为了检测语音信号V0的变化，使用由电阻R3和电容C3构成的滤波器来过滤语音信号V0的峰值电压信号，以得到语音信号V0的均值，即可实现对语音信号V0输出功率的调节。

当信号处理电路未获取足够电能时，运算放大器A应增加其输出功率。这可以通过为运算放大器A设置内部电压目标来实现。

优选的是，第一声音传感器、第二声音传感器以及第三声音传感器均内置一个对声音敏感的电容式驻极体话筒，声波使话筒内的驻极体薄膜振动，导致电容的变化，而产生与之对应变化的电压信号。

优选的是，第一声音传感器将采集到的语音信号传输至特征量提取单元，特征量提取单元提取第一声音传感器采集的语音信号的特征量，特征量为第一声音传感器采集到的语音信号的频率参数。

优选的是，第三声音传感器将采集到的语音信号传输至信号处理单元进行信号处理，具体步骤如下：

步骤1：设定第三声音传感器采集的语音信号为：

步骤2：设定噪声信号的表达式为：

其中，A为噪声信号yi的幅值，

步骤3：计算噪声信号yi的幅值A，求取幅值A的函数Q：

则有，

W为系数矩阵，由噪声信号yi的延时确定，则有，

s为噪声信号yi函数正弦向量，则有

则有，

其中，f0为噪声信号yi的初始频率值；

步骤5：令

，

为噪声信号yi函数的初始延时值，根据上述求出的A、f以及

求取yi；

步骤6：信号处理单元将

传输至智能门禁处理器。

最后所应说明的是，以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，对本发明的技术方案进行修改或者等同替换，都不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种基于语音识别的智能化门禁识别系统，其特征在于，所述基于语音识别的智能化门禁识别系统包括第一声音传感器、第二声音传感器、第三声音传感器、特征量提取单元、信号处理电路、信号处理单元、信号发生单元、信号接收单元、智能门禁处理器、图像采集单元、图像对比单元以及门禁控制器；

其中，所述第一声音传感器的输出端与所述特征量提取单元的输入端连接，所述第二声音传感器的输出端与所述信号处理电路的输入端连接，所述第三声音传感器的输出端与所述信号处理单元的输入端连接，所述特征量提取单元的输出端、所述信号处理电路的输出端以及所述信号处理单元的输出端均与所述智能门禁处理器的输入端连接，所述信号发生单元、所述信号接收单元以及所述智能门禁处理器依次连接，所述图像采集单元、所述图像对比单元以及所述智能门禁处理器依次连接，所述智能门禁处理器的输出端与所述门禁控制器的输入端连接；

其中，用户随身携带所述信号发生单元，所述信号发生单元进入所述信号接收单元的接收范围时，所述信号接收单元接收到所述信号发生单元所发射的射频信号，所述信号接收单元在接收到上述射频信号后，所述智能门禁处理器发出第一触发信号至所述图像采集单元，所述图像采集单元接收到第一触发信号后开始采集用户的面部图像信息，所述图像采集单元将采集到的面部图像信息传输至所述图像对比单元，所述图像对比单元内存储有被允许进入门禁人员的面部图像信息，若所述图像对比单元接收到的面部图像信息和所述图像对比单元内存储的面部图像信息之一相吻合，则所述智能门禁处理器发出第二触发信号至所述第一声音传感器，所述第一声音传感器在接收到第二触发信号后开始采集用户的语音信号，所述第一声音传感器将采集到的语音信号传输至所述特征量提取单元，所述特征量提取单元提取所述第一声音传感器采集的语音信号的特征量，所述特征量传感器将提取的特征量传输至所述智能门禁处理器，所述智能门禁处理器中包括一特征量比对模块，所述特征量比对模块内存储有第一特征量范围和第二特征量范围，所述智能门禁处理器将接收到的特征量和所述特征量比对模块内存储的所述第一特征量范围和所述第二特征量范围进行比对，若特征量在所述第一特征量范围内，则所示智能门禁处理器发出第三触发信号至所述第二声音传感器，并提示用户说出指定词汇，所述第二声音传感器在接收到第三触发信号后开始采集用户语音信号，所述第二声音传感器将采集到的语音信号传输至所述信号处理电路进行信号处理后再传输至所述智能门禁处理器，所述智能门禁处理器内还包括一标准语音波形比对模块，所述标准语音波形比对模块中存储有被允许进入门禁人员的语音波形，所述智能门禁处理器将接收到的所述第二声音传感器采集的语音信号传输至所述标准语音波形比对模块，若所述标准语音波形比对模块接收到的语音信号波形与其存储的被允许进入门禁人员的语音波形匹配，则所述智能门禁处理器控制所述门禁控制器打开门禁，若特征量在所述第二特征量范围内，则所示智能门禁处理器发出第四触发信号至所述第三声音传感器，并提示用户说出指定词汇，所述第三声音传感器在接收到第四触发信号后开始采集用户语音信号，所述第三声音传感器将采集到的语音信号传输至所述信号处理单元进行信号处理后再传输至所述智能门禁处理器，所述智能门禁处理器将接收到的所述第三声音传感器采集的语音信号传输至所述标准语音波形比对模块，若所述标准语音波形比对模块接收到的语音信号波形与其存储的被允许进入门禁人员的语音波形匹配，则所述智能门禁处理器控制所述门禁控制器打开门禁，所述第三声音传感器将采集到的语音信号传输至所述信号处理单元进行信号处理，具体步骤如下：

步骤1：设定所述第三声音传感器采集的语音信号为：

xi＝Si+yi

其中，xi为所述第三声音传感器采集的语音信号，Si为所述第三声音传感器采集的语音信号中的有效信号，yi为噪声信号；

步骤2：设定噪声信号的表达式为：

其中，A为噪声信号yi的幅值，τ为噪声信号yi的延时参数，△t为所述第三声音传感器的采样间隔时间，f为噪声信号yi的频率，i表示所述第三声音传感器的时间序列参数；

步骤3：计算噪声信号yi的幅值A，求取幅值A的函数Q：

其中，x为所述第三声音传感器采样的时间序列向量，c为噪声信号yi函数余弦向量，N为采样数量；

x^T＝(x1，x2，…，xN)

则有，

W为系数矩阵，由噪声信号yi的延时确定，则有，

s为噪声信号yi函数正弦向量，则有

则有，

f＝f₀+Δf

其中，f₀为噪声信号yi的初始频率值；

步骤5：令τ＝τ₀，τ₀为噪声信号yi函数的初始延时值，根据上述求出的A、f以及τ求取yi；

步骤6：所述信号处理单元将Si＝xi-yi 传输至所述智能门禁处理器。

2.根据权利要求1所述的基于语音识别的智能化门禁识别系统，其特征在于，所述智能门禁处理器还包括一触发信号发射模块，所述触发信号发射模块根据所述智能门禁处理器的控制用于发射第一触发信号、第二触发信号、第三触发信号或第四触发信号。

3.根据权利要求1所述的基于语音识别的智能化门禁识别系统，其特征在于，所述信号处理电路包括运算放大器A、二极管D1、电感L1、电容C1-C3以及电阻R1-R5；

其中，所述第二声音传感器将采集到的语音信号V0传输至电感L1的一端，电容C1的一端接地，电容C1的另一端与电感L1的另一端连接，电感L1的另一端与二极管D1的阳极连接，电阻R2的一端接地，电阻R2的另一端与电阻R1的一端连接，电阻R1的另一端与二极管D1的阴极连接，电容C2的一端与电阻R2的一端连接，电容C2的另一端与电阻R1的另一端连接，电容C3的一端接地，电容C3的另一端与电阻R3的一端连接，电阻R3的另一端与电阻R4的一端连接，电阻R4的另一端与运算放大器A的同相输入端连接，电阻R5的一端与电阻R3的一端连接，电阻R5的另一端与运算放大器A的反相输入端连接，运算放大器A的输出端与所述智能门禁处理器的所述标准语音波形比对模块连接，运算放大器A输出电信号V1传输至所述标准语音波形比对模块。

4.根据权利要求1所述的基于语音识别的智能化门禁识别系统，其特征在于，所述第一声音传感器、所述第二声音传感器以及第三声音传感器均内置一个对声音敏感的电容式驻极体话筒，声波使话筒内的驻极体薄膜振动，导致电容的变化，而产生与之对应变化的电压信号。

5.根据权利要求1所述的基于语音识别的智能化门禁识别系统，其特征在于，所述第一声音传感器将采集到的语音信号传输至所述特征量提取单元，所述特征量提取单元提取所述第一声音传感器采集的语音信号的特征量，所述特征量为所述第一声音传感器采集到的语音信号的频率参数。