CN115277279B - 智能床头柜控制方法、语音识别方法、计算机和存储介质 - Google Patents
智能床头柜控制方法、语音识别方法、计算机和存储介质 Download PDFInfo
- Publication number
- CN115277279B CN115277279B CN202210929668.9A CN202210929668A CN115277279B CN 115277279 B CN115277279 B CN 115277279B CN 202210929668 A CN202210929668 A CN 202210929668A CN 115277279 B CN115277279 B CN 115277279B
- Authority
- CN
- China
- Prior art keywords
- voice
- user
- server
- voiceprint feature
- voiceprint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000003860 storage Methods 0.000 title claims abstract description 19
- 238000001914 filtration Methods 0.000 claims abstract description 140
- 230000006870 function Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 13
- 210000000707 wrist Anatomy 0.000 claims description 4
- 230000001960 triggered effect Effects 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000010408 sweeping Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
- H04L12/282—Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供一种智能床头柜控制方法、语音识别方法、计算机和存储介质,该方法由智能床头柜首先获取用户的便携式可穿戴设备的设备标识,从而获得用户身份,从而获取与用户身份对应的滤波规则对用户语音进行滤波,使得智能床头柜这一端可以快速对用户语音进行滤波,并将滤波后的语音信息发送至服务器,服务器则根据与用户身份对应的声纹特征对语音信息进行解析,能够有效提高解析效率,并且提高了服务器解析语音精度,使得智能床头柜能够及时对用户的语音控制作出响应。
Description
技术领域
本发明涉及智能家居技术领域,特别涉及一种智能床头柜控制方法、语音识别方法、计算机和存储介质。
背景技术
智能床头柜能够为用户在卧室中提供各种便利的功能,比如,提供照明、提供蓝牙音乐、可通过指纹解锁、带有地灯照明、提供USB(Universal Serial Bus,通用串行总线)接口、提供插座等。
在一些智能床头柜上配备了语音识别功能,能够识别用户的语音,进而根据用户的语音控制床头柜工作。目前的语音识别的方式有两种,一种是在智能床头柜上设置相应的处理模块,通过该处理模块解析语音信息,另一种是将语音信息上传服务器,由服务器进行解析。第一种方式受限于床头柜上的处理模块的处理能力,语音解析的效率和精度都不高;第二种方式,服务器往往需要面对各种不同的终端上传的语音信息进行解析,在并发量较大时,服务器往往需要占用较大的计算资源,往往无法及时将解析得到的控制指令反馈至终端。
为此,需要提供一种能够使得服务器快速解析语音信息得到控制指令的方法。
发明内容
基于此,有必要针对上述技术问题,提供一种智能床头柜控制方法、语音识别方法、计算机和存储介质。
一种具有语音识别功能的智能床头柜控制方法,包括:
检测预设范围内的用户的便携式可穿戴设备,当在预设范围内检测到用户的便携式可穿戴设备,获取所述便携式可穿戴设备的设备标识;
基于所述设备标识,获取与所述设备标识对应的声纹特征标识;
将所述声纹特征标识发送至服务器;
接收所述服务器反馈的滤波规则,并发出提示信号;
接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息;
将所述语音信息以及所述声纹特征标识发送至服务器;
接收所述服务器基于所述语音信息以及所述声纹特征标识解析得到的控制指令;
基于所述控制指令控制工作单元工作。
在其中一个实施例中,所述便携式可穿戴设备包括手表、手环、手腕带和耳环。
在其中一个实施例中,所述检测预设范围内的用户的便携式可穿戴设备的步骤包括:
通过蓝牙检测预设范围内的用户的便携式可穿戴设备。
在其中一个实施例中,所述接收所述服务器反馈的滤波规则,并发出提示信号的步骤包括:
接收所述服务器反馈的滤波规则,并通过指示灯发出提示信号。
在其中一个实施例中,所述检测预设范围内的用户的便携式可穿戴设备的步骤之前还包括:
在预存模式下,获取用户的预存声音;
将所述预存声音发送至所述服务器;
接收由所述服务器发送的声纹特征标识,其中,所述声纹特征标识与所述服务器对所述预存声音解析得到的声纹特征对应。
一种语音识别方法,包括:
接收终端发送的声纹特征标识;
基于所述声纹特征标识,获取与所述声纹特征标识对应的滤波规则;
将所述滤波规则发送至终端;
接收所述终端的语音信息和声纹特征标识;
基于所述声纹特征标识获取对应的声纹特征;
基于所述声纹特征对所述语音信息进行特征匹配,获得特征匹配音频信息;
将所述特征匹配音频信息输入至预设语音解析模型进行解析,得到控制指令;
将所述控制指令发送至所述终端。
在其中一个实施例中,在所述接收终端发送的声纹特征标识的步骤之前还包括:
接收所述终端发送的预存声音;
对所述预存声音进行解析,得到所述声纹特征,生成与所述声纹特征对应的声纹特征标识;
将所述声纹特征标识发送至所述终端。
一种具有语音识别功能的智能床头柜控制方法,包括:
智能床头柜检测预设范围内的用户的便携式可穿戴设备,当在预设范围内检测到用户的便携式可穿戴设备,获取所述便携式可穿戴设备的设备标识;基于所述设备标识,获取与所述设备标识对应的声纹特征标识;将所述声纹特征标识发送至服务器;
所述服务器接收所述智能床头柜发送的声纹特征标识;基于所述声纹特征标识,获取与所述声纹特征标识对应的滤波规则;将所述滤波规则发送至智能床头柜;
所述智能床头柜接收所述服务器反馈的滤波规则,并发出提示信号;接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息;将所述语音信息以及所述声纹特征标识发送至服务器;
所述服务器接收所述终端的语音信息和声纹特征标识;基于所述声纹特征标识获取对应的声纹特征;基于所述声纹特征对所述语音信息进行特征匹配,获得特征匹配音频信息;将所述特征匹配音频信息输入至预设语音解析模型进行解析,得到控制指令;将所述控制指令发送至所述智能床头柜;
所述智能床头柜接收所述服务器基于所述语音信息以及所述声纹特征标识解析得到的控制指令;基于所述控制指令控制工作单元工作。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实实现上述任一实施例中所述的方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例中所述的方法。
上述智能床头柜控制方法、语音识别方法、计算机和存储介质,由智能床头柜首先获取用户的便携式可穿戴设备的设备标识,从而获得用户身份,从而获取与用户身份对应的滤波规则对用户语音进行滤波,使得智能床头柜这一端可以快速对用户语音进行滤波,并将滤波后的语音信息发送至服务器,服务器则根据与用户身份对应的声纹特征对语音信息进行解析,能够有效提高解析效率,并且提高了服务器解析语音精度,使得智能床头柜能够及时对用户的语音控制作出响应。
附图说明
图1为一个实施例中具有语音识别功能的智能床头柜控制方法的流程示意图;
图2为另一个实施例中具有语音识别功能的智能床头柜控制方法的流程示意图;
图3为又一个实施例中具有语音识别功能的智能床头柜控制方法的流程示意图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
实施例一
本实施例中,具有语音识别功能的智能床头柜控制方法适用于智能床头柜,但应该理解的是,本实施例中的方法还可以应用于家庭、办公室中的各种智能终端,比如,电视、冰箱、空调、扫地机器人等,本实施例中对此不一一列举。
本实施例中,如图1所示,提供了一种具有语音识别功能的智能床头柜控制方法,其包括:
步骤101,检测预设范围内的用户的便携式可穿戴设备,当在预设范围内检测到用户的便携式可穿戴设备,获取所述便携式可穿戴设备的设备标识。
本实施例中,该便携式可穿戴设备的设备标识为设备的唯一识别标识,也可以称为设备ID(Identity document),该设备标识用于标识用户身份。通过检测识别该设备标识,可识别出用户身份。
本实施例中,所述便携式可穿戴设备包括手表、手环、手腕带和耳环。本实施例中,手表、手环、手腕带和耳环分别具有蓝牙通信功能,能对外发送蓝牙广播或者接收蓝牙广播信号,并且还能够与其他终端实现蓝牙的一对一连接。
一个实施例中,通过蓝牙检测预设范围内的用户的便携式可穿戴设备。本实施例中,通过蓝牙广播检测预设范围内的用户的便携式可穿戴设备。该预设范围可以是3米内、5米内、10米内,预设范围的大小根据需要设置,由蓝牙广播的功率确定。在一些实施例中,智能床头柜检测便携式可穿戴设备发出的蓝牙广播,该蓝牙广播携带便携式可穿戴设备的广播标识,还携带设备标识,此时,该设备标识为便携式可穿戴设备的蓝牙广播的物理地址。
在另外的实施例中,蓝牙广播由智能床头柜发出,当便携式可穿戴设备检测到智能床头柜的蓝牙广播时,向智能床头柜发送便携式可穿戴设备的设备标识。
本实施例中,用户佩戴的便携式可穿戴设备与用户房间内的智能床头柜为对应关系,当用户佩戴便携式可穿戴设备进入房间时,则被该智能床头柜检测,并且获得设备标识,并且触发智能床头柜执行下述步骤。
步骤102,基于所述设备标识,获取与所述设备标识对应的声纹特征标识。
本步骤中,该声纹特征标识预存在智能床头柜的存储模块中,当识别出该设备标识后,即从本地读取与该设备标识对应的声纹特征标识。本实施例中,声纹特征为用户的语音的声音的特征,可以是该用户的声音的波形特征,也包括用户的语音的音色。在用户初始设置智能床头柜或者使用语音控制前,即可通过输入语音将声纹特征保存在服务器,并且对应的声纹特征标识则保存在智能床头柜本地。
本实施例中,不同的用户所佩戴的不同的设备标识,将对应不同的声纹特征标识,这样,不同的用户靠近该智能床头柜,将触发智能床头柜获得不同的声纹特征标识。
步骤103,将所述声纹特征标识发送至服务器。
本实施例中,该服务器与该智能床头柜通过网络连接。该服务器用于解析语音。本步骤中,服务器接收声纹特征标识后,获取该与该声纹特征标识对应的滤波规则,将该滤波规则发送至智能床头柜。
步骤104,接收所述服务器反馈的滤波规则,并发出提示信号。
本实施例中,该滤波规则用于对语音或者用户发出的声音进行滤波。在接收到服务器发送的滤波规则后,发出用于提示用户的提示信号。应该理解的是,服务器存储有多个滤波规则,每一滤波规则对应一声纹特征标识,对应一设备标识。一个实施例中,该提示信号为灯光信号。本实施例中,通过指示灯发出提示信号,以告知用户可进行语音控制。
一个实施例中,接收所述服务器反馈的滤波规则,根据接收到滤波规则,触发指示灯并发出提示信号。本实施例中,当智能床头柜接收到服务器反馈的滤波规则,则触发指示灯发出光,以提示用户可以进行语音输入,该智能床头柜进入语音控制模式。
步骤105,接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息。
本实施例中,在语音控制模式下,智能床头柜通过自带的麦克风采集用户的语音,在采集到用户语音后,通过滤波规则对语音进行滤波,能够有效去除噪音。具体地,在智能床头柜这一端,采集到的用户的语音,经过放大、滤波、模数转换,从而得到滤波后的数字语音信息。
本实施例中,该滤波规则为针对预设频率段的语音进行滤波的规则,该预设频率段为与该用户的设备标识对应的频率段,这样,能够充分高效地将噪音进行过滤,起到很好地滤波效果。
在一些实施例中,滤波规则为针对预设音色的语音进行滤波的规则。这样,基于该针对预设音色进行设置的滤波规则,能够充分高效地过滤与该预设音色不匹配的噪音,从而能够精确地得到用户的语音信息。
基于该滤波规则针对性地对用户的语音进行滤波,能够高效、精准地滤波,从而有效过滤杂音、噪音,从而高效、精准地获得用户的语音信息。
步骤106,将所述语音信息以及所述声纹特征标识发送至服务器。
本实施例中,在将语音信息上传服务器的同时,将该声纹特征标识一并发送服务器,这样,能够使得服务器在接收到该声纹特征标识时,能够通过该声纹特征标识获取对应的对该声纹特征对用户的语音信息进行解析,从而精准地获得控制指令。
步骤107,接收所述服务器基于所述语音信息以及所述声纹特征标识解析得到的控制指令。
本实施例中,智能床头柜接收服务器反馈的控制指令,该控制指令用于对智能床头柜进行控制。
步骤108,基于所述控制指令控制工作单元工作。
本实施例中,工作单元可以是智能床头柜上的指纹锁、台灯、地灯、USB接口、插座、蓝牙音箱等电气元件,也可以是室内与该智能床头柜连接的其他智能设备,比如,该智能床头柜还连接有空调、风扇、室内照明灯、冰箱、电视等智能家居设备,该智能床头柜可通过网络与空调、风扇、室内照明灯、冰箱、电视等智能家居设备连接,从而将控制指令发送至这些智能家居设备,从而实现对室内的各种智能家居设备的控制。用户仅需要在卧室向智能床头柜发送语音,即可实现对智能床头柜上的各电气元件以及室内的其他智能家居设备发起控制,使得用户的控制更为简便。
上述实施例中,由智能床头柜首先获取用户的便携式可穿戴设备的设备标识,从而获得用户身份,从而获取与用户身份对应的滤波规则对用户语音进行滤波,使得智能床头柜这一端可以快速对用户语音进行滤波,并将滤波后的语音信息发送至服务器,服务器则根据与用户身份对应的声纹特征对语音信息进行解析,能够有效提高解析效率,并且提高了服务器解析语音精度,使得智能床头柜能够及时对用户的语音控制作出响应。
为了获得用户的声纹特征,在其中一个实施例中,所述检测预设范围内的用户的便携式可穿戴设备的步骤之前还包括:在预存模式下,获取用户的预存声音;将所述预存声音发送至所述服务器;接收由所述服务器发送的声纹特征标识,其中,所述声纹特征标识与所述服务器对所述预存声音解析得到的声纹特征对应。
本实施例中,预先存储用户的声音,进行预先的声纹特征的解析,从而使得服务器内预存有用户的声纹特征。其过程为,用户首次持便携式可穿戴设备靠近智能床头柜,触发智能床头柜进入预存模式,在该预存模式下,用户根据智能床头柜的指示,发出声音,智能床头柜采集该声音,将该声音发送至服务器,由服务器对该声音进行解析,得到声纹特征,服务器生成声纹特征同时生成与该声纹特征对应的声纹特征标识,将声纹特征标识下发至智能床头柜,并且服务器存储该声纹特征标识以及声纹特征。这样,使得服务器能够预先保存用户的声纹特征,便于后续步骤对语音的解析。
为了使得声纹特征获得更为精准,在其中一个实施例中,所述在预存模式下,获取用户的预存声音的步骤包括:在预存模式下,通过扬声器播放预设音频以提示用户按预设音频的内容发出语音,并提示用户靠近麦克风,通过麦克风采集用户的语音,获得用户的预存声音。
本实施例中,预设音频的内容为预先设置,该预设音频的内容为易于识别,且频率分布较广,有利于清楚识别出不同人的音色和频率的内容。通过让用户发出具有与预设音频的内容相同的内容的语音,能够提高对该语音的识别效率。并且通过提示用户靠近麦克风进行语音的采集,能够有效降低外部早噪音的影响,使得初始采集用户语音而获得的预存声音无需经过滤波规则的滤波,在无滤波的情况下,依然使得预存声音解析得到的声纹特征更为精准。
在一个实施例中,所述接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息包括:在第一预设时间内检测是否接收到用户的语音,当在所述第一预设时间内未检测到用户的语音,则删除所述滤波规则;当在所述第一预设时间内检测到用户的语音,接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息。
应该理解的是,该滤波规则的数据量较大,如每次触发服务器下发滤波规则后,智能床头柜的存储模块将存储多个不同的滤波规则,导致智能床头柜在进行滤波时需要进行判断选择滤波算法,导致效率较低。因此,本实施例中,对于在第一预设时间内未收到语音时,将删除滤波规则。从而使得智能床头柜内保持存储至多一个的滤波规则,并且该滤波规则仅在用户的便携式可穿戴设备靠近时触发服务器下发,避免了智能床头柜存储较多的滤波规则而导致的判断选择效率低下的情况。
在一个实施例中,所述接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息包括:在第一预设时间内检测是否接收到用户的语音,当在所述第一预设时间内未检测到用户的语音,检测预设范围内是否还存在用户的便携式可穿戴设备,当预设范围内不存在用户的便携式可穿戴设备时,则删除所述滤波规则,当检测到预设范围内依然存在用户的便携式可穿戴设备时,则在第二预设时间后删除所述滤波规则,所述第二预设时间大于第一预设时间;当在所述第一预设时间内检测到用户的语音,接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息。
本实施例中,在第一预设时间内没有接收到用户语音时,并未直接删除该滤波规则,而是检测用户是否依然在预设范围内,当用户依然在预设范围内,则在第二时间后删除滤波规则,避免智能床头柜上存储多个滤波规则。而当用户不在预设范围内时,直接删除滤波规则。
应该理解的是,该智能床头柜设置有滤波器,该滤波规则可以用于定义智能床头柜的滤波器的滤波的规则,该滤波规则也可以是滤波算法,该滤波规则也可以是滤波算法中的参数。在一个实施例中,所述接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息的步骤包括:通过第一麦克风和第二麦克风分别采集获得用户的语音得到第一语音信号和第二语音信号,提取所述第一语音信号和第二语音信号的频率特征,得到第一频率特征和第二频率特征,将第一频率特征和第二频率特征对比,检测第一频率特征和第二频率特征之间的偏差是否大于预设偏差阈值,当第一频率特征和第二频率特征之间的偏差大于预设偏差阈值时,利用Gammatone滤波器分别对所述第一语音信号和第二语音信号进行滤波,得到第一语音信息和第二语音信息,基于时序将所述第一语音信息和所述第二语音信息进行合并,得到所述语音信息;当第一频率特征和第二频率特征之间的偏差小于或等于预设偏差阈值时,基于时序将所述第一语音信号和所述第二语音信号进行合并,得到语音合并信号,利用Gammatone滤波器对语音合并信号进行滤波;
其中,利用Gammatone滤波器对语音信号进行滤波的过程为:解析所述滤波规则得到滤波带宽参数;使用Gammatone滤波器对语音信号进行多频带划分,使用Gammatone滤波器采用等效矩形带宽的过滤方法对语音信号进行过滤,其中,Gammatone滤波器的时域表达式为:
h(t)=ctn-1e-2πbtcos(2πf0t+φ),t>0
h(t)=0,t<0
其中,c为比例系数,t为时间,n为滤波器阶数,b是与等效矩形带宽有关的参数;f0是滤波器中心频率,Φ是滤波器相位;
其中,滤波器的中心频率为:
其中,fl为滤波器的最低频率和fh为滤波器的最高频率,其中a为与滤波带宽参数,K为滤波器的数量。
本实施例中,语音信号指的是第一语音信号、第二语音信号以及语音合并信号,当第一频率特征和第二频率特征之间的偏差大于预设偏差阈值时,滤波器对第一语音信号、第二语音信号分别进行滤波,当第一频率特征和第二频率特征之间的偏差小于或等于预设偏差阈值时,滤波器对语音合并信号进行滤波。本实施例中,通过服务器下发的滤波带宽参数,基于该滤波带宽参数确定滤波器的中心频率,从而调整该滤波器的中心频率,使得滤波器能够适配用户的语音的频率进行滤波,从而精确地得到滤波后的语音信息。
本实施例中,智能床头柜设置两个麦克风,两个麦克风分别为第一麦克风和第二麦克风,第一麦克风和第二麦克风分别采集用户的语音信号,通过提取两个语音信号而得到的第一频率特征和第二频率特征,将第一频率特征和第二频率特征进行对比,可以检测出两个语音信号的受干扰的程度,当第一频率特征和第二频率特征之间的差值较大时,表明其中至少一个语音信号受到较大的噪音影响,因此,利用滤波器首先对两个语音信号进行滤波,在滤波后得到的语音进行合并,能够有效提高合并的语音的精确度,通过先过滤噪音,再合并语音,能够有效对滤波后的损失的信号进行补偿;此外,当第一频率特征和第二频率特征之间的差值较小时,表明两个语音信号较为接近,受到的噪音干扰较小,因此,可以直接将第一语音信号和第二语音信号进行合并,在合并后再进行滤波,从而能够提高滤波效率,相较于先滤波后合并而言,先合并再滤波能够有效减少滤波的次数和滤波的复杂度,提高了滤波效率。此外,通过服务器下发的滤波带宽参数调整滤波器的中心频率,能够使得滤波器的滤波特征匹配当前用户的发声的主要频率,从而实现高效、精准的滤波。
实施例二
本实施例中,提供一种语音识别方法,本方法应用于服务器端,如图2所示,该方法包括:
步骤201,接收终端发送的声纹特征标识。
本实施例中,该终端为智能床头柜。应该理解的是,该终端不限于智能床头柜,在其他的一些实施例中,该终端包括电视、冰箱、空调、扫地机器人。
步骤202,基于所述声纹特征标识,获取与所述声纹特征标识对应的滤波规则。
本实施例中,服务器中存储了多个声纹特征标识和与各声纹特征标识一一对应的多个滤波规则。在获取智能床头柜发送的声纹特征标识,服务器从多个滤波规则中确定一个与该声纹特征标识对应的滤波规则。
步骤203,将所述滤波规则发送至终端。
步骤204,接收所述终端的语音信息和声纹特征标识。
应该理解的是,在服务器附送滤波规则至智能床头柜后,智能床头柜可能存在长时间未反馈语音的情况,导致服务器将短暂或长时间断开与智能床头柜的连接,因此,智能床头柜需要在发送语音信息的同时发送声纹特征标识,以便服务器能够准确获取与该声纹特征标识对应的声纹特征。
步骤205,基于所述声纹特征标识获取对应的声纹特征。
步骤206,基于所述声纹特征对所述语音信息进行特征匹配,获得特征匹配音频信息。
本实施例中,由于该语音信息为经过滤波规则进行滤波得到的语音信息,虽然去除了噪音,但用户的语音音色、频率也受到干扰,此时,根据已有的预存的声纹特征对该用户的语音信息进行特征匹配,使得语音信息的频率分布与该声纹特征对应,从而得到音频信息,该音频信息即特征匹配后的语音信息。这样,由于该声纹特征为未经过滤波的声音,使得该声纹特征的音色、频率分布更接近于用户的真实的声音的音色、频率分布,采用该声纹特征对音频信息进行恢复、补偿,能够有效增强经过滤波发送的语音信息。应该理解的是,该声纹特征对应的声音是用户在靠近智能床头柜的麦克风的情况下录入,其环境噪音较小,因此,得到的声纹特征较为精确,在获得的语音信息需要根据声纹特征进行恢复、补偿,得到精确的音频信息。
步骤207,将所述特征匹配音频信息输入至预设语音解析模型进行解析,得到控制指令。
本实施例中,该预设语音解析模型为卷积神经网络获得了大量用户语音,并且基于此学习得到的语音解析模型。将频谱后的音频信息输入至预设语音解析模型进行解析,能够精确、高效地获得控制指令。
步骤208,将所述控制指令发送至所述终端。
在其中一个实施例中,在所述接收终端发送的声纹特征标识的步骤之前还包括:接收所述终端发送的预存声音;对所述预存声音进行解析,得到所述声纹特征,生成与所述声纹特征对应的声纹特征标识;将所述声纹特征标识发送至所述终端。
本实施例中,对用户初始化过程中预先发送的声音进行解析,得到声纹特征。智能床头柜在预存模式下,采集用户的声音。用户根据智能床头柜的指示,发出声音,智能床头柜采集该声音,将该声音发送至服务器,由服务器对该声音进行解析,得到声纹特征,服务器生成声纹特征同时生成与该声纹特征对应的声纹特征标识,将声纹特征标识下发至智能床头柜,并且服务器存储该声纹特征标识以及声纹特征。这样,使得服务器能够预先保存用户的声纹特征,便于后续步骤对语音的解析。
实施例三
在本实施例中,提供一种具有语音识别功能的智能床头柜控制方法,如图3所示,包括:
步骤301,智能床头柜检测预设范围内的用户的便携式可穿戴设备,当在预设范围内检测到用户的便携式可穿戴设备,获取所述便携式可穿戴设备的设备标识;基于所述设备标识,获取与所述设备标识对应的声纹特征标识;将所述声纹特征标识发送至服务器;
步骤302,所述服务器接收所述智能床头柜发送的声纹特征标识;基于所述声纹特征标识,获取与所述声纹特征标识对应的滤波规则;将所述滤波规则发送至智能床头柜;
步骤303,所述智能床头柜接收所述服务器反馈的滤波规则,并发出提示信号;接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息;将所述语音信息以及所述声纹特征标识发送至服务器;
步骤304,所述服务器接收所述终端的语音信息和声纹特征标识;基于所述声纹特征标识获取对应的声纹特征;基于所述声纹特征对所述语音信息进行特征匹配,获得特征匹配音频信息;将所述特征匹配音频信息输入至预设语音解析模型进行解析,得到控制指令;将所述控制指令发送至所述智能床头柜;
步骤305,所述智能床头柜接收所述服务器基于所述语音信息以及所述声纹特征标识解析得到的控制指令;基于所述控制指令控制工作单元工作。
应该理解的是,虽然图1至图3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1至图3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
实施例四
本实施例中,提供一种具有语音识别功能的智能床头柜控制装置,包括:
设备标识获取模块,用于检测预设范围内的用户的便携式可穿戴设备,当在预设范围内检测到用户的便携式可穿戴设备,获取所述便携式可穿戴设备的设备标识;
声纹特征标识获取模块,用于基于所述设备标识,获取与所述设备标识对应的声纹特征标识;
标识发送模块,用于将所述声纹特征标识发送至服务器;
滤波规则接收模块,用于接收所述服务器反馈的滤波规则,并发出提示信号;
滤波模块,用于接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息;
语音信息发送模块,用于将所述语音信息以及所述声纹特征标识发送至服务器;
控制指令接收模块,用于接收所述服务器基于所述语音信息以及所述声纹特征标识解析得到的控制指令;
指令控制模块,用于基于所述控制指令控制工作单元工作。
实施例五
本实施例中,提供一种语音识别装置,该装置应用于服务器,包括:
声纹特征标识接收模块,用于接收终端发送的声纹特征标识;
滤波规则获取模块,用于基于所述声纹特征标识,获取与所述声纹特征标识对应的滤波规则;
滤波规则发送模块,用于将所述滤波规则发送至终端;
语音信息接收模块,用于接收所述终端的语音信息和声纹特征标识;
声纹特征获取模块,用于基于所述声纹特征标识获取对应的声纹特征;
特征匹配模块,用于基于所述声纹特征对所述语音信息进行特征匹配,获得特征匹配音频信息;
语音解析模块,用于将所述特征匹配音频信息输入至预设语音解析模型进行解析,得到控制指令;
控制指令发送模块,用于将所述控制指令发送至所述终端。
关于具有语音识别功能的智能床头柜控制装置的具体限定可以参见上文中对于具有语音识别功能的智能床头柜控制方法的限定,在此不再赘述。上述具有语音识别功能的智能床头柜控制装置中的各个单元可全部或部分通过软件、硬件及其组合来实现。上述各单元可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个单元对应的操作。
实施例六
本实施例中,提供了计算机设备,本实施例中的计算机设备为床头柜,或者可以视为床头柜中内置的计算机设备。其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序,且该非易失性存储介质部署有数据库,该数据库用于存储声纹特征标识和与声纹特征标识的设备标识。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于通过网络与服务器通信。该计算机程序被处理器执行时以实现一种具有语音识别功能的智能床头柜控制方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是控制面板,或者是通过红外信号连接的遥控器,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。此外,该床头柜还设置有扬声器和麦克风。麦克风用于接收声音,扬声器用于输出音频信息。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
实施例七
在一个实施例中,一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实实现上述任一实施例中所述的方法。
实施例八
在一个实施例中,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例中所述的方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种具有语音识别功能的智能床头柜控制方法,其特征在于,包括:
检测预设范围内的用户的便携式可穿戴设备,当在预设范围内检测到用户的便携式可穿戴设备,获取所述便携式可穿戴设备的设备标识;
基于所述设备标识,获取与所述设备标识对应的声纹特征标识;
将所述声纹特征标识发送至服务器,服务器中存储了多个声纹特征标识和与各声纹特征标识一一对应的多个滤波规则,在获取智能床头柜发送的声纹特征标识,服务器从多个滤波规则中确定一个与该声纹特征标识对应的滤波规则;
接收所述服务器反馈的滤波规则,并发出提示信号;
接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息;
将所述语音信息以及所述声纹特征标识发送至服务器;
接收所述服务器基于所述语音信息以及所述声纹特征标识解析得到的控制指令;
基于所述控制指令控制工作单元工作;
其中,所述接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息包括:在第一预设时间内检测是否接收到用户的语音,当在所述第一预设时间内未检测到用户的语音,则删除所述滤波规则;当在所述第一预设时间内检测到用户的语音,接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息。
2.根据权利要求1所述的具有语音识别功能的智能床头柜控制方法,其特征在于,所述便携式可穿戴设备包括手表、手环、手腕带和耳环。
3.根据权利要求1所述的具有语音识别功能的智能床头柜控制方法,其特征在于,所述检测预设范围内的用户的便携式可穿戴设备的步骤包括:
通过蓝牙检测预设范围内的用户的便携式可穿戴设备。
4.根据权利要求1所述的具有语音识别功能的智能床头柜控制方法,其特征在于,所述接收所述服务器反馈的滤波规则,并发出提示信号的步骤包括:
接收所述服务器反馈的滤波规则,并通过指示灯发出提示信号。
5.根据权利要求1-4任一项中所述的具有语音识别功能的智能床头柜控制方法,其特征在于,所述检测预设范围内的用户的便携式可穿戴设备的步骤之前还包括:
在预存模式下,获取用户的预存声音;
将所述预存声音发送至所述服务器;
接收由所述服务器发送的声纹特征标识,其中,所述声纹特征标识与所述服务器对所述预存声音解析得到的声纹特征对应。
6.一种语音识别方法,其特征在于,包括:
接收终端发送的声纹特征标识;
基于所述声纹特征标识,获取与所述声纹特征标识对应的滤波规则,服务器中存储了多个声纹特征标识和与各声纹特征标识一一对应的多个滤波规则,在获取智能床头柜发送的声纹特征标识,服务器从多个滤波规则中确定一个与该声纹特征标识对应的滤波规则;
将所述滤波规则发送至终端;
接收所述终端的语音信息和声纹特征标识,其中,所述终端在第一预设时间内检测是否接收到用户的语音,当在所述第一预设时间内未检测到用户的语音,则删除所述滤波规则;当在所述第一预设时间内检测到用户的语音,接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息;
基于所述声纹特征标识获取对应的声纹特征;
基于所述声纹特征对所述语音信息进行特征匹配,获得特征匹配音频信息;
将所述特征匹配音频信息输入至预设语音解析模型进行解析,得到控制指令;
将所述控制指令发送至所述终端。
7.根据权利要求6所述的语音识别方法,其特征在于,在所述接收终端发送的声纹特征标识的步骤之前还包括:
接收所述终端发送的预存声音;
对所述预存声音进行解析,得到所述声纹特征,生成与所述声纹特征对应的声纹特征标识;
将所述声纹特征标识发送至所述终端。
8.一种具有语音识别功能的智能床头柜控制方法,其特征在于,包括:
智能床头柜检测预设范围内的用户的便携式可穿戴设备,当在预设范围内检测到用户的便携式可穿戴设备,获取所述便携式可穿戴设备的设备标识;基于所述设备标识,获取与所述设备标识对应的声纹特征标识;将所述声纹特征标识发送至服务器;
所述服务器接收所述智能床头柜发送的声纹特征标识;基于所述声纹特征标识,获取与所述声纹特征标识对应的滤波规则;所述服务器中存储了多个声纹特征标识和与各声纹特征标识一一对应的多个滤波规则,在获取智能床头柜发送的声纹特征标识,所述服务器从多个滤波规则中确定一个与该声纹特征标识对应的滤波规则,将所述滤波规则发送至智能床头柜;
所述智能床头柜接收所述服务器反馈的滤波规则,并发出提示信号;接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息;将所述语音信息以及所述声纹特征标识发送至服务器;;其中,所述接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息包括:在第一预设时间内检测是否接收到用户的语音,当在所述第一预设时间内未检测到用户的语音,则删除所述滤波规则;当在所述第一预设时间内检测到用户的语音,接收用户的语音,基于所述滤波规则对用户的所述语音进行滤波,得到语音信息
所述服务器接收所述终端的语音信息和声纹特征标识;基于所述声纹特征标识获取对应的声纹特征;基于所述声纹特征对所述语音信息进行特征匹配,获得特征匹配音频信息;将所述特征匹配音频信息输入至预设语音解析模型进行解析,得到控制指令;将所述控制指令发送至所述智能床头柜;
所述智能床头柜接收所述服务器基于所述语音信息以及所述声纹特征标识解析得到的控制指令;基于所述控制指令控制工作单元工作。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210929668.9A CN115277279B (zh) | 2022-08-03 | 2022-08-03 | 智能床头柜控制方法、语音识别方法、计算机和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210929668.9A CN115277279B (zh) | 2022-08-03 | 2022-08-03 | 智能床头柜控制方法、语音识别方法、计算机和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115277279A CN115277279A (zh) | 2022-11-01 |
CN115277279B true CN115277279B (zh) | 2023-04-07 |
Family
ID=83748521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210929668.9A Active CN115277279B (zh) | 2022-08-03 | 2022-08-03 | 智能床头柜控制方法、语音识别方法、计算机和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115277279B (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104778946A (zh) * | 2014-01-10 | 2015-07-15 | 中国电信股份有限公司 | 语音控制方法和系统 |
CN106128456A (zh) * | 2016-06-16 | 2016-11-16 | 美的集团股份有限公司 | 智能家电的语音控制方法、终端及系统 |
CN109450850B (zh) * | 2018-09-26 | 2022-10-11 | 深圳壹账通智能科技有限公司 | 身份验证方法、装置、计算机设备和存储介质 |
CN114839891B (zh) * | 2022-05-11 | 2023-03-07 | 海南创兴高科技有限公司 | 基于物联网的智能床头柜控制方法、计算机和存储介质 |
-
2022
- 2022-08-03 CN CN202210929668.9A patent/CN115277279B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN115277279A (zh) | 2022-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11605372B2 (en) | Time-based frequency tuning of analog-to-information feature extraction | |
CN105118257B (zh) | 智能控制系统及方法 | |
WO2020014899A1 (zh) | 语音控制方法、中控设备和存储介质 | |
US20160255447A1 (en) | Method for Fitting Hearing Aid in Individual User Environment-Adapted Scheme, and Recording Medium for Same | |
TWI639114B (zh) | 具有智慧語音服務功能之電子裝置及調整輸出聲音之方法 | |
CN110223690A (zh) | 基于图像与语音融合的人机交互方法及装置 | |
CN106775553A (zh) | 音量控制系统及音量控制方法 | |
CN109697989B (zh) | 音频数据处理方法、服务器及可读存储介质 | |
TW200300925A (en) | System and method for music identification | |
CN111081234B (zh) | 一种语音采集方法、装置、设备及存储介质 | |
CN107729433B (zh) | 一种音频处理方法及设备 | |
CN110223696B (zh) | 一种语音信号的采集方法、装置及终端设备 | |
CN110400566B (zh) | 识别方法和电子设备 | |
US20190164566A1 (en) | Emotion recognizing system and method, and smart robot using the same | |
CN112634897B (zh) | 设备唤醒方法、装置和存储介质及电子装置 | |
CN108279777B (zh) | 脑电波控制方法及相关设备 | |
CN115277279B (zh) | 智能床头柜控制方法、语音识别方法、计算机和存储介质 | |
CN110931019A (zh) | 公安语音数据采集方法、装置、设备和计算机存储介质 | |
CN109343481B (zh) | 一种控制设备的方法与设备 | |
US20070064105A1 (en) | Indoor apparatus of intercom system and method for controlling indoor apparatus | |
CN111986670A (zh) | 语音控制方法、装置、电子设备和计算机可读存储介质 | |
WO2018023523A1 (zh) | 一种运动及情感识别家居控制系统 | |
CN114839891B (zh) | 基于物联网的智能床头柜控制方法、计算机和存储介质 | |
CN109756821A (zh) | 一种基于声纹识别的音箱控制系统 | |
CN114283804A (zh) | 家用电器输出视听信息的控制方法、装置、存储介质及处理器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |