CN112070949B - 基于语音识别的智能化门禁识别系统 - Google Patents

基于语音识别的智能化门禁识别系统 Download PDF

Info

Publication number
CN112070949B
CN112070949B CN202010851531.7A CN202010851531A CN112070949B CN 112070949 B CN112070949 B CN 112070949B CN 202010851531 A CN202010851531 A CN 202010851531A CN 112070949 B CN112070949 B CN 112070949B
Authority
CN
China
Prior art keywords
signal
sound sensor
voice
access control
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010851531.7A
Other languages
English (en)
Other versions
CN112070949A (zh
Inventor
孙强
祁立志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaibei Shengshi Haoming Technology Co ltd
Original Assignee
Huaibei Shengshi Haoming Technology Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaibei Shengshi Haoming Technology Service Co ltd filed Critical Huaibei Shengshi Haoming Technology Service Co ltd
Priority to CN202010851531.7A priority Critical patent/CN112070949B/zh
Publication of CN112070949A publication Critical patent/CN112070949A/zh
Application granted granted Critical
Publication of CN112070949B publication Critical patent/CN112070949B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/30Individual registration on entry or exit not involving the use of a pass
    • G07C9/32Individual registration on entry or exit not involving the use of a pass in combination with an identity check
    • G07C9/37Individual registration on entry or exit not involving the use of a pass in combination with an identity check using biometric data, e.g. fingerprints, iris scans or voice recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种基于语音识别的智能化门禁识别系统,其包括第一声音传感器、第二声音传感器、第三声音传感器、特征量提取单元、信号处理电路、信号处理单元、信号发生单元、信号接收单元、智能门禁处理器、图像采集单元、图像对比单元以及门禁控制器,其中,第一声音传感器可实现对语音特征量的识别区分语音处理方式,进而使用第二声音传感器或第三声音传感器接收用户语音信号,再通过各自的信号处理方式对语音信号进行处理,如此能够大大提高语音识别的精度。

Description

基于语音识别的智能化门禁识别系统
技术领域
本发明涉及智能门禁领域,尤其涉及一种基于语音识别的智能化门禁识别系统。
背景技术
RFID(Radio Frequency Identification),即无线射频识别,是一种短距离无线通信技术。与其它短距离无线通信技术WLAN、蓝牙、红外、ZIGBEE、UWB 相比,最大的区别在于RFID 是被动工作模式。RFID 技术采用大规模集成电路计算、电子识别、计算机通信等技术,通过读写器和安装于载体上的RFID 标签,实现对载体的非接触识别和数据信息交换,加上其方便快捷、识别速度快、数据容量大、使用寿命长、标签数据可动态更改等特点,因此较条码而言具有更好的安全性、动态实时通等优点,所以被广泛应用于家庭、宾馆、公司等门禁系统。
ASR(Automatic Speech Recognition),即语音识别技术,其目标是将人类语音中的词汇内容转换为计算机可读的输入数据。ASR 技术所要解决的问题是让计算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。ASR 技术在“能听会说”的智能计算机系统中扮演着重要角色,相当于给计算机系统安装上“耳朵”,使其具备“能听”的功能,从而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和交互。
现在的门禁控制系统在使用语音识别功能进行识别时,未能对不同的语音进行区分有效处理,即语音识别的精度过低,而且未能配合其他识别方式共同保障识别的精准度。
发明内容
因此,为了克服上述问题,本发明提供一种基于语音识别的智能化门禁识别系统,其包括第一声音传感器、第二声音传感器、第三声音传感器、特征量提取单元、信号处理电路、信号处理单元、信号发生单元、信号接收单元、智能门禁处理器、图像采集单元、图像对比单元以及门禁控制器,其中,第一声音传感器可实现对语音特征量的识别区分语音处理方式,进而使用第二声音传感器或第三声音传感器接收用户语音信号,再通过各自的信号处理方式对语音信号进行处理,如此能够大大提高语音识别的精度。
本发明提供的基于语音识别的智能化门禁识别系统包括第一声音传感器、第二声音传感器、第三声音传感器、特征量提取单元、信号处理电路、信号处理单元、信号发生单元、信号接收单元、智能门禁处理器、图像采集单元、图像对比单元以及门禁控制器。
其中,第一声音传感器的输出端与特征量提取单元的输入端连接,第二声音传感器的输出端与信号处理电路的输入端连接,第三声音传感器的输出端与信号处理单元的输入端连接,特征量提取单元的输出端、信号处理电路的输出端以及信号处理单元的输出端均与智能门禁处理器的输入端连接,信号发生单元、信号接收单元以及智能门禁处理器依次连接,图像采集单元、图像对比单元以及智能门禁处理器依次连接,智能门禁处理器的输出端与门禁控制器的输入端连接。
其中,用户随身携带信号发生单元,信号发生单元进入信号接收单元的接收范围时,信号接收单元接收到信号发生单元所发射的射频信号,信号接收单元在接收到上述射频信号后,智能门禁处理器发出第一触发信号至图像采集单元,图像采集单元接收到第一触发信号后开始采集用户的面部图像信息,图像采集单元将采集到的面部图像信息传输至图像对比单元,图像对比单元内存储有被允许进入门禁人员的面部图像信息,若图像对比单元接收到的面部图像信息和图像对比单元内存储的面部图像信息之一相吻合,则智能门禁处理器发出第二触发信号至第一声音传感器,第一声音传感器在接收到第二触发信号后开始采集用户的语音信号,第一声音传感器将采集到的语音信号传输至特征量提取单元,特征量提取单元提取第一声音传感器采集的语音信号的特征量,特征量传感器将提取的特征量传输至智能门禁处理器,智能门禁处理器中包括一特征量比对模块,特征量比对模块内存储有第一特征量范围和第二特征量范围,智能门禁处理器将接收到的特征量和特征量比对模块内存储的第一特征量范围和第二特征量范围进行比对,若特征量在第一特征量范围内,则所示智能门禁处理器发出第三触发信号至第二声音传感器,并提示用户说出指定词汇,第二声音传感器在接收到第三触发信号后开始采集用户语音信号,第二声音传感器将采集到的语音信号传输至信号处理电路进行信号处理后再传输至智能门禁处理器,智能门禁处理器内还包括一标准语音波形比对模块,标准语音波形比对模块中存储有被允许进入门禁人员的语音波形,智能门禁处理器将接收到的第二声音传感器采集的语音信号传输至标准语音波形比对模块,若标准语音波形比对模块接收到的语音信号波形与其存储的被允许进入门禁人员的语音波形匹配,则智能门禁处理器控制门禁控制器打开门禁,若特征量在第二特征量范围内,则所示智能门禁处理器发出第四触发信号至第三声音传感器,并提示用户说出指定词汇,第三声音传感器在接收到第四触发信号后开始采集用户语音信号,第三声音传感器将采集到的语音信号传输至信号处理单元进行信号处理后再传输至智能门禁处理器,智能门禁处理器将接收到的第三声音传感器采集的语音信号传输至标准语音波形比对模块,若标准语音波形比对模块接收到的语音信号波形与其存储的被允许进入门禁人员的语音波形匹配,则智能门禁处理器控制门禁控制器打开门禁。
具体地,智能门禁处理器还包括一触发信号发射模块,触发信号发射模块根据智能门禁处理器的控制用于发射第一触发信号、第二触发信号、第三触发信号或第四触发信号。
具体地,信号处理电路包括运算放大器A、二极管D1、电感L1、电容C1-C3以及电阻R1-R5。
其中,第二声音传感器将采集到的语音信号V0传输至电感L1的一端,电容C1的一端接地,电容C1的另一端与电感L1的另一端连接,电感L1的另一端与二极管D1的阳极连接,电阻R2的一端接地,电阻R2的另一端与电阻R1的一端连接,电阻R1的另一端与二极管D1的阴极连接,电容C2的一端与电阻R2的一端连接,电容C2的另一端与电阻R1的另一端连接,电容C3的一端接地,电容C3的另一端与电阻R3的一端连接,电阻R3的另一端与电阻R4的一端连接,电阻R4的另一端与运算放大器A的同相输入端连接,电阻R5的一端与电阻R3的一端连接,电阻R5的另一端与运算放大器A的反相输入端连接,运算放大器A的输出端与智能门禁处理器的标准语音波形比对模块连接, 运算放大器A输出电信号V1传输至标准语音波形比对模块。
具体地,第一声音传感器、第二声音传感器以及第三声音传感器均内置一个对声音敏感的电容式驻极体话筒,声波使话筒内的驻极体薄膜振动,导致电容的变化,而产生与之对应变化的电压信号。
具体地,第一声音传感器将采集到的语音信号传输至特征量提取单元,特征量提取单元提取第一声音传感器采集的语音信号的特征量,特征量为第一声音传感器采集到的语音信号的频率参数。
具体地,第三声音传感器将采集到的语音信号传输至信号处理单元进行信号处理,具体步骤如下:
步骤1:设定第三声音传感器采集的语音信号为:
Figure DEST_PATH_IMAGE002
其中,xi为第三声音传感器采集的语音信号,Si为第三声音传感器采集的语音信号中的有效信号,yi为噪声信号;
步骤2:设定噪声信号的表达式为:
Figure DEST_PATH_IMAGE004
其中,A为噪声信号yi的幅值,
Figure DEST_PATH_IMAGE006
为噪声信号yi的延时参数,△t为第三声音传感器的采样间隔时间,f为噪声信号yi的频率,i表示第三声音传感器的时间序列参数;
步骤3:计算噪声信号yi的幅值A,求取幅值A的函数Q:
Figure DEST_PATH_IMAGE008
其中,x为第三声音传感器采样的时间序列向量,c为噪声信号yi函数余弦向量,N为采样数量;
Figure DEST_PATH_IMAGE010
Figure DEST_PATH_IMAGE012
则有,
Figure DEST_PATH_IMAGE014
步骤4:求取噪声信号yi的频率f,则有频率修正函数△f,其中,
Figure DEST_PATH_IMAGE016
W为系数矩阵,由噪声信号yi的延时确定,则有,
Figure DEST_PATH_IMAGE018
s为噪声信号yi函数正弦向量,则有
Figure DEST_PATH_IMAGE020
则有,
Figure DEST_PATH_IMAGE022
其中,f0为噪声信号yi的初始频率值;
步骤5:令
Figure DEST_PATH_IMAGE024
Figure DEST_PATH_IMAGE026
为噪声信号yi函数的初始延时值,根据上述求出的A、f以及
Figure 515922DEST_PATH_IMAGE006
求取yi;
步骤6:信号处理单元将
Figure DEST_PATH_IMAGE028
传输至智能门禁处理器。
与现有技术相比,本发明具有如下的有益效果:
(1)本发明提供一种基于语音识别的智能化门禁识别系统,其包括第一声音传感器、第二声音传感器、第三声音传感器、特征量提取单元、信号处理电路、信号处理单元、信号发生单元、信号接收单元、智能门禁处理器、图像采集单元、图像对比单元以及门禁控制器,其中,第一声音传感器可实现对语音特征量的识别区分语音处理方式,进而使用第二声音传感器或第三声音传感器接收用户语音信号,再通过各自的信号处理方式对语音信号进行处理,如此能够大大提高语音识别的精度。
(2)本发明提供的一种基于语音识别的智能化门禁识别系统,本发明的发明点还在于,信号处理电路一侧得到第二声音传感器的语音信号V0,信号处理电路的语音信号V0可从由二极管D1和电容C2构成的半波整流器获取。此电压信号由电阻R1和R2进一步分压,为了检测语音信号V0的变化,使用由电阻R3和电容C3构成的滤波器来过滤语音信号V0的峰值电压信号,以得到语音信号V0的均值,即可实现对语音信号V0输出功率的调节。
(3)本发明提供的一种基于语音识别的智能化门禁识别系统,本发明的发明点还在于,第三声音传感器将采集到的语音信号传输至信号处理单元进行信号处理,信号处理单元通过对第三传感器采集的信号的分析,分离有效信号和噪声信号。
附图说明
图1为本发明的基于语音识别的智能化门禁识别系统的功能图;
图2为本发明的智能门禁处理器的功能图;
图3为本发明的信号处理电路的示意图。
具体实施方式
下面结合附图和实施例对本发明提供的基于语音识别的智能化门禁识别系统进行详细说明。
如图1所示,本发明提供的基于语音识别的智能化门禁识别系统包括第一声音传感器、第二声音传感器、第三声音传感器、特征量提取单元、信号处理电路、信号处理单元、信号发生单元、信号接收单元、智能门禁处理器、图像采集单元、图像对比单元以及门禁控制器。
其中,第一声音传感器的输出端与特征量提取单元的输入端连接,第二声音传感器的输出端与信号处理电路的输入端连接,第三声音传感器的输出端与信号处理单元的输入端连接,特征量提取单元的输出端、信号处理电路的输出端以及信号处理单元的输出端均与智能门禁处理器的输入端连接,信号发生单元、信号接收单元以及智能门禁处理器依次连接,图像采集单元、图像对比单元以及智能门禁处理器依次连接,智能门禁处理器的输出端与门禁控制器的输入端连接。
其中,用户随身携带信号发生单元,信号发生单元进入信号接收单元的接收范围时,信号接收单元接收到信号发生单元所发射的射频信号,信号接收单元在接收到上述射频信号后,智能门禁处理器发出第一触发信号至图像采集单元,图像采集单元接收到第一触发信号后开始采集用户的面部图像信息,图像采集单元将采集到的面部图像信息传输至图像对比单元,图像对比单元内存储有被允许进入门禁人员的面部图像信息,若图像对比单元接收到的面部图像信息和图像对比单元内存储的面部图像信息之一相吻合,则智能门禁处理器发出第二触发信号至第一声音传感器,第一声音传感器在接收到第二触发信号后开始采集用户的语音信号,第一声音传感器将采集到的语音信号传输至特征量提取单元,特征量提取单元提取第一声音传感器采集的语音信号的特征量,特征量传感器将提取的特征量传输至智能门禁处理器,智能门禁处理器中包括一特征量比对模块,特征量比对模块内存储有第一特征量范围和第二特征量范围,智能门禁处理器将接收到的特征量和特征量比对模块内存储的第一特征量范围和第二特征量范围进行比对,若特征量在第一特征量范围内,则所示智能门禁处理器发出第三触发信号至第二声音传感器,并提示用户说出指定词汇,第二声音传感器在接收到第三触发信号后开始采集用户语音信号,第二声音传感器将采集到的语音信号传输至信号处理电路进行信号处理后再传输至智能门禁处理器,智能门禁处理器内还包括一标准语音波形比对模块,标准语音波形比对模块中存储有被允许进入门禁人员的语音波形,智能门禁处理器将接收到的第二声音传感器采集的语音信号传输至标准语音波形比对模块,若标准语音波形比对模块接收到的语音信号波形与其存储的被允许进入门禁人员的语音波形匹配,则智能门禁处理器控制门禁控制器打开门禁,若特征量在第二特征量范围内,则所示智能门禁处理器发出第四触发信号至第三声音传感器,并提示用户说出指定词汇,第三声音传感器在接收到第四触发信号后开始采集用户语音信号,第三声音传感器将采集到的语音信号传输至信号处理单元进行信号处理后再传输至智能门禁处理器,智能门禁处理器将接收到的第三声音传感器采集的语音信号传输至标准语音波形比对模块,若标准语音波形比对模块接收到的语音信号波形与其存储的被允许进入门禁人员的语音波形匹配,则智能门禁处理器控制门禁控制器打开门禁。
上述实施方式中,本发明提供的基于语音识别的智能化门禁识别系统,其包括第一声音传感器、第二声音传感器、第三声音传感器、特征量提取单元、信号处理电路、信号处理单元、信号发生单元、信号接收单元、智能门禁处理器、图像采集单元、图像对比单元以及门禁控制器,其中,第一声音传感器可实现对语音特征量的识别区分语音处理方式,进而使用第二声音传感器或第三声音传感器接收用户语音信号,再通过各自的信号处理方式对语音信号进行处理,如此能够大大提高语音识别的精度。
更进一步地,第一特征量范围为男声语音信号特征量范围,第二特征量范围为女声语音信号特征量范围,若特征量在第一特征量范围内,则判断用户为男性,若特征量在第二特征量范围内,则判断用户为女性。
如图2所示,智能门禁处理器还包括一触发信号发射模块,触发信号发射模块根据智能门禁处理器的控制用于发射第一触发信号、第二触发信号、第三触发信号或第四触发信号。
如图3所示,信号处理电路包括运算放大器A、二极管D1、电感L1、电容C1-C3以及电阻R1-R5。
其中,第二声音传感器将采集到的语音信号V0传输至电感L1的一端,电容C1的一端接地,电容C1的另一端与电感L1的另一端连接,电感L1的另一端与二极管D1的阳极连接,电阻R2的一端接地,电阻R2的另一端与电阻R1的一端连接,电阻R1的另一端与二极管D1的阴极连接,电容C2的一端与电阻R2的一端连接,电容C2的另一端与电阻R1的另一端连接,电容C3的一端接地,电容C3的另一端与电阻R3的一端连接,电阻R3的另一端与电阻R4的一端连接,电阻R4的另一端与运算放大器A的同相输入端连接,电阻R5的一端与电阻R3的一端连接,电阻R5的另一端与运算放大器A的反相输入端连接,运算放大器A的输出端与智能门禁处理器的标准语音波形比对模块连接, 运算放大器A输出电信号V1传输至标准语音波形比对模块。
上述实施方式中,运算放大器A的型号为LTC4125。
信号处理电路一侧得到第二声音传感器的语音信号V0,信号处理电路的语音信号V0可从由二极管D1和电容C2构成的半波整流器获取。此电压信号由电阻R1和R2进一步分压,为了检测语音信号V0的变化,使用由电阻R3和电容C3构成的滤波器来过滤语音信号V0的峰值电压信号,以得到语音信号V0的均值,即可实现对语音信号V0输出功率的调节。
当信号处理电路未获取足够电能时,运算放大器A应增加其输出功率。这可以通过为运算放大器A设置内部电压目标来实现。
优选的是,第一声音传感器、第二声音传感器以及第三声音传感器均内置一个对声音敏感的电容式驻极体话筒,声波使话筒内的驻极体薄膜振动,导致电容的变化,而产生与之对应变化的电压信号。
优选的是,第一声音传感器将采集到的语音信号传输至特征量提取单元,特征量提取单元提取第一声音传感器采集的语音信号的特征量,特征量为第一声音传感器采集到的语音信号的频率参数。
优选的是,第三声音传感器将采集到的语音信号传输至信号处理单元进行信号处理,具体步骤如下:
步骤1:设定第三声音传感器采集的语音信号为:
Figure DEST_PATH_IMAGE002A
其中,xi为第三声音传感器采集的语音信号,Si为第三声音传感器采集的语音信号中的有效信号,yi为噪声信号;
步骤2:设定噪声信号的表达式为:
Figure DEST_PATH_IMAGE004A
其中,A为噪声信号yi的幅值,
Figure 826818DEST_PATH_IMAGE006
为噪声信号yi的延时参数,△t为第三声音传感器的采样间隔时间,f为噪声信号yi的频率,i表示第三声音传感器的时间序列参数;
步骤3:计算噪声信号yi的幅值A,求取幅值A的函数Q:
Figure DEST_PATH_IMAGE008A
其中,x为第三声音传感器采样的时间序列向量,c为噪声信号yi函数余弦向量,N为采样数量;
Figure DEST_PATH_IMAGE010A
Figure DEST_PATH_IMAGE012A
则有,
Figure DEST_PATH_IMAGE014A
步骤4:求取噪声信号yi的频率f,则有频率修正函数△f,其中,
Figure DEST_PATH_IMAGE016A
W为系数矩阵,由噪声信号yi的延时确定,则有,
Figure DEST_PATH_IMAGE018A
s为噪声信号yi函数正弦向量,则有
Figure DEST_PATH_IMAGE020A
则有,
Figure DEST_PATH_IMAGE022A
其中,f0为噪声信号yi的初始频率值;
步骤5:令
Figure 882015DEST_PATH_IMAGE024
Figure 352180DEST_PATH_IMAGE026
为噪声信号yi函数的初始延时值,根据上述求出的A、f以及
Figure 440222DEST_PATH_IMAGE006
求取yi;
步骤6:信号处理单元将
Figure 238413DEST_PATH_IMAGE028
传输至智能门禁处理器。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (5)

1.一种基于语音识别的智能化门禁识别系统,其特征在于,所述基于语音识别的智能化门禁识别系统包括第一声音传感器、第二声音传感器、第三声音传感器、特征量提取单元、信号处理电路、信号处理单元、信号发生单元、信号接收单元、智能门禁处理器、图像采集单元、图像对比单元以及门禁控制器;
其中,所述第一声音传感器的输出端与所述特征量提取单元的输入端连接,所述第二声音传感器的输出端与所述信号处理电路的输入端连接,所述第三声音传感器的输出端与所述信号处理单元的输入端连接,所述特征量提取单元的输出端、所述信号处理电路的输出端以及所述信号处理单元的输出端均与所述智能门禁处理器的输入端连接,所述信号发生单元、所述信号接收单元以及所述智能门禁处理器依次连接,所述图像采集单元、所述图像对比单元以及所述智能门禁处理器依次连接,所述智能门禁处理器的输出端与所述门禁控制器的输入端连接;
其中,用户随身携带所述信号发生单元,所述信号发生单元进入所述信号接收单元的接收范围时,所述信号接收单元接收到所述信号发生单元所发射的射频信号,所述信号接收单元在接收到上述射频信号后,所述智能门禁处理器发出第一触发信号至所述图像采集单元,所述图像采集单元接收到第一触发信号后开始采集用户的面部图像信息,所述图像采集单元将采集到的面部图像信息传输至所述图像对比单元,所述图像对比单元内存储有被允许进入门禁人员的面部图像信息,若所述图像对比单元接收到的面部图像信息和所述图像对比单元内存储的面部图像信息之一相吻合,则所述智能门禁处理器发出第二触发信号至所述第一声音传感器,所述第一声音传感器在接收到第二触发信号后开始采集用户的语音信号,所述第一声音传感器将采集到的语音信号传输至所述特征量提取单元,所述特征量提取单元提取所述第一声音传感器采集的语音信号的特征量,所述特征量传感器将提取的特征量传输至所述智能门禁处理器,所述智能门禁处理器中包括一特征量比对模块,所述特征量比对模块内存储有第一特征量范围和第二特征量范围,所述智能门禁处理器将接收到的特征量和所述特征量比对模块内存储的所述第一特征量范围和所述第二特征量范围进行比对,若特征量在所述第一特征量范围内,则所示智能门禁处理器发出第三触发信号至所述第二声音传感器,并提示用户说出指定词汇,所述第二声音传感器在接收到第三触发信号后开始采集用户语音信号,所述第二声音传感器将采集到的语音信号传输至所述信号处理电路进行信号处理后再传输至所述智能门禁处理器,所述智能门禁处理器内还包括一标准语音波形比对模块,所述标准语音波形比对模块中存储有被允许进入门禁人员的语音波形,所述智能门禁处理器将接收到的所述第二声音传感器采集的语音信号传输至所述标准语音波形比对模块,若所述标准语音波形比对模块接收到的语音信号波形与其存储的被允许进入门禁人员的语音波形匹配,则所述智能门禁处理器控制所述门禁控制器打开门禁,若特征量在所述第二特征量范围内,则所示智能门禁处理器发出第四触发信号至所述第三声音传感器,并提示用户说出指定词汇,所述第三声音传感器在接收到第四触发信号后开始采集用户语音信号,所述第三声音传感器将采集到的语音信号传输至所述信号处理单元进行信号处理后再传输至所述智能门禁处理器,所述智能门禁处理器将接收到的所述第三声音传感器采集的语音信号传输至所述标准语音波形比对模块,若所述标准语音波形比对模块接收到的语音信号波形与其存储的被允许进入门禁人员的语音波形匹配,则所述智能门禁处理器控制所述门禁控制器打开门禁,所述第三声音传感器将采集到的语音信号传输至所述信号处理单元进行信号处理,具体步骤如下:
步骤1:设定所述第三声音传感器采集的语音信号为:
xi=Si+yi
其中,xi为所述第三声音传感器采集的语音信号,Si为所述第三声音传感器采集的语音信号中的有效信号,yi为噪声信号;
步骤2:设定噪声信号的表达式为:
Figure DEST_PATH_IMAGE001
其中,A为噪声信号yi的幅值,τ为噪声信号yi的延时参数,△t为所述第三声音传感器的采样间隔时间,f为噪声信号yi的频率,i表示所述第三声音传感器的时间序列参数;
步骤3:计算噪声信号yi的幅值A,求取幅值A的函数Q:
Figure FDA0003402900070000021
其中,x为所述第三声音传感器采样的时间序列向量,c为噪声信号yi函数余弦向量,N为采样数量;
xT=(x1,x2,…,xN)
Figure DEST_PATH_DEST_PATH_IMAGE012
则有,
Figure FDA0003402900070000031
步骤4:求取噪声信号yi的频率f,则有频率修正函数△f,其中,
Figure FDA0003402900070000032
W为系数矩阵,由噪声信号yi的延时确定,则有,
Figure FDA0003402900070000033
s为噪声信号yi函数正弦向量,则有
Figure DEST_PATH_DEST_PATH_IMAGE020
则有,
f=f0+Δf
其中,f0为噪声信号yi的初始频率值;
步骤5:令τ=τ0,τ0为噪声信号yi函数的初始延时值,根据上述求出的A、f以及τ求取yi;
步骤6:所述信号处理单元将Si=xi-yi 传输至所述智能门禁处理器。
2.根据权利要求1所述的基于语音识别的智能化门禁识别系统,其特征在于,所述智能门禁处理器还包括一触发信号发射模块,所述触发信号发射模块根据所述智能门禁处理器的控制用于发射第一触发信号、第二触发信号、第三触发信号或第四触发信号。
3.根据权利要求1所述的基于语音识别的智能化门禁识别系统,其特征在于,所述信号处理电路包括运算放大器A、二极管D1、电感L1、电容C1-C3以及电阻R1-R5;
其中,所述第二声音传感器将采集到的语音信号V0传输至电感L1的一端,电容C1的一端接地,电容C1的另一端与电感L1的另一端连接,电感L1的另一端与二极管D1的阳极连接,电阻R2的一端接地,电阻R2的另一端与电阻R1的一端连接,电阻R1的另一端与二极管D1的阴极连接,电容C2的一端与电阻R2的一端连接,电容C2的另一端与电阻R1的另一端连接,电容C3的一端接地,电容C3的另一端与电阻R3的一端连接,电阻R3的另一端与电阻R4的一端连接,电阻R4的另一端与运算放大器A的同相输入端连接,电阻R5的一端与电阻R3的一端连接,电阻R5的另一端与运算放大器A的反相输入端连接,运算放大器A的输出端与所述智能门禁处理器的所述标准语音波形比对模块连接,运算放大器A输出电信号V1传输至所述标准语音波形比对模块。
4.根据权利要求1所述的基于语音识别的智能化门禁识别系统,其特征在于,所述第一声音传感器、所述第二声音传感器以及第三声音传感器均内置一个对声音敏感的电容式驻极体话筒,声波使话筒内的驻极体薄膜振动,导致电容的变化,而产生与之对应变化的电压信号。
5.根据权利要求1所述的基于语音识别的智能化门禁识别系统,其特征在于,所述第一声音传感器将采集到的语音信号传输至所述特征量提取单元,所述特征量提取单元提取所述第一声音传感器采集的语音信号的特征量,所述特征量为所述第一声音传感器采集到的语音信号的频率参数。
CN202010851531.7A 2020-08-21 2020-08-21 基于语音识别的智能化门禁识别系统 Active CN112070949B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010851531.7A CN112070949B (zh) 2020-08-21 2020-08-21 基于语音识别的智能化门禁识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010851531.7A CN112070949B (zh) 2020-08-21 2020-08-21 基于语音识别的智能化门禁识别系统

Publications (2)

Publication Number Publication Date
CN112070949A CN112070949A (zh) 2020-12-11
CN112070949B true CN112070949B (zh) 2022-02-15

Family

ID=73659878

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010851531.7A Active CN112070949B (zh) 2020-08-21 2020-08-21 基于语音识别的智能化门禁识别系统

Country Status (1)

Country Link
CN (1) CN112070949B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112785758A (zh) * 2021-01-20 2021-05-11 赣州市正途科技有限公司 一种人工智能识别人脸和声音的门锁

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268966A (zh) * 2014-09-28 2015-01-07 河北工业职业技术学院 一种非接触的复合模式门禁系统及门禁控制方法
CN104952138A (zh) * 2015-07-21 2015-09-30 金琥 一种语音交互式门禁系统及其实现方法
CN205068523U (zh) * 2015-08-21 2016-03-02 云南清眸科技有限公司 基于身份卡并结合人脸认证的智能门禁系统
CN107240397A (zh) * 2017-08-14 2017-10-10 广东工业大学 一种基于声纹识别的智能锁及其语音识别方法和系统
KR20180088554A (ko) * 2017-01-26 2018-08-06 경운대학교 산학협력단 안면 인식 보안 시스템
EP3487160A1 (en) * 2017-11-16 2019-05-22 Axis AB Image noise reduction based on a modulation transfer function of a camera dome

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10074224B2 (en) * 2015-04-20 2018-09-11 Gate Labs Inc. Access management system
GB201801661D0 (en) * 2017-10-13 2018-03-21 Cirrus Logic International Uk Ltd Detection of liveness

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268966A (zh) * 2014-09-28 2015-01-07 河北工业职业技术学院 一种非接触的复合模式门禁系统及门禁控制方法
CN104952138A (zh) * 2015-07-21 2015-09-30 金琥 一种语音交互式门禁系统及其实现方法
CN205068523U (zh) * 2015-08-21 2016-03-02 云南清眸科技有限公司 基于身份卡并结合人脸认证的智能门禁系统
KR20180088554A (ko) * 2017-01-26 2018-08-06 경운대학교 산학협력단 안면 인식 보안 시스템
CN107240397A (zh) * 2017-08-14 2017-10-10 广东工业大学 一种基于声纹识别的智能锁及其语音识别方法和系统
EP3487160A1 (en) * 2017-11-16 2019-05-22 Axis AB Image noise reduction based on a modulation transfer function of a camera dome

Also Published As

Publication number Publication date
CN112070949A (zh) 2020-12-11

Similar Documents

Publication Publication Date Title
CN107454508B (zh) 麦克风阵列的电视机及电视系统
US11830479B2 (en) Voice recognition method and apparatus, and air conditioner
US5749072A (en) Communications device responsive to spoken commands and methods of using same
CN106782563B (zh) 一种智能家居语音交互系统
CN103948398B (zh) 适用于Android系统的心音定位分段方法
CN109003604A (zh) 一种实现低功耗待机的语音识别方法及系统
CN112070949B (zh) 基于语音识别的智能化门禁识别系统
CN205788350U (zh) 一种智能语音电子锁
CN111227839A (zh) 一种行为识别方法及装置
CN108074581A (zh) 用于人机交互智能终端的控制系统
CN110716706A (zh) 智能人机交互指令转换方法及系统
Zhang et al. An overview of speech recognition technology
CN113259793A (zh) 智能麦克风及其信号处理方法
CN107357174A (zh) 一种分布式智能音箱语音控制系统
CN208538474U (zh) 语音识别系统
CN116129942A (zh) 语音交互设备和语音交互方法
CN112927691B (zh) 一种语音识别控制装置和方法
CN206021508U (zh) 一种音频识别报警系统
CN112883355B (zh) 一种基于rfid和卷积神经网络的非接触式用户身份认证方法
CN112735400A (zh) 一种语音识别智能传感器
CN104766610A (zh) 基于振动的声音识别系统和识别方法
CN114283798A (zh) 手持设备的收音方法及手持设备
CN113989828A (zh) 基于便携式智能设备和超声信号的手势识别方法及系统
CN112509589A (zh) 一种分布式强鲁棒无线音频控制方法、装置及介质
CN112885339A (zh) 语音唤醒系统及语音识别系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: Room 601, block a, building 3, Guogou Plaza (commercial), Xiangshan District, Huaibei City, Anhui Province

Patentee after: Huaibei Shengshi Haoming Technology Co.,Ltd.

Address before: Room 601, block a, building 3, Guogou Plaza (commercial), Xiangshan District, Huaibei City, Anhui Province

Patentee before: Huaibei Shengshi Haoming Technology Service Co.,Ltd.

CP01 Change in the name or title of a patent holder