CN112056763A - 智能茶几、语音指令识别方法以及存储介质 - Google Patents
智能茶几、语音指令识别方法以及存储介质 Download PDFInfo
- Publication number
- CN112056763A CN112056763A CN202010918463.1A CN202010918463A CN112056763A CN 112056763 A CN112056763 A CN 112056763A CN 202010918463 A CN202010918463 A CN 202010918463A CN 112056763 A CN112056763 A CN 112056763A
- Authority
- CN
- China
- Prior art keywords
- voice
- signal
- tea table
- microphones
- instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241001122767 Theaceae Species 0.000 title claims abstract description 85
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000009467 reduction Effects 0.000 claims description 80
- 238000007781 pre-processing Methods 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 27
- 230000005236 sound signal Effects 0.000 claims description 19
- 238000012216 screening Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 description 12
- 238000013473 artificial intelligence Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A47—FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
- A47B—TABLES; DESKS; OFFICE FURNITURE; CABINETS; DRAWERS; GENERAL DETAILS OF FURNITURE
- A47B31/00—Service or tea tables, trolleys, or wagons
-
- A—HUMAN NECESSITIES
- A47—FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
- A47B—TABLES; DESKS; OFFICE FURNITURE; CABINETS; DRAWERS; GENERAL DETAILS OF FURNITURE
- A47B97/00—Furniture or accessories for furniture, not provided for in other groups of this subclass
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开一种智能茶几,所述智能茶几包括:多个麦克风,用于在接收到语音指令时,根据所述语音指令和所述语音指令的接收声压,分别生成具有不同声压的输入语音信号;控制器,用于在接收到所述多个麦克风发送的所述输入语音信号时,根据所述输入语音信号,获得降噪后的结果语音信号,并根据所述结果语音信号,获得与所述语音指令相应的控制指令。本发明还公开了一种语音指令识别方法和存储介质。结果语音信号与语音指令的匹配度较高,通过结果语音信号获得的控制指令准确率较高,用户使用智能茶几进行语音控制时,体验较好。
Description
技术领域
本发明涉及智能家居领域,特别涉及一种智能茶几、语音指令识别方法以及存储介质。
背景技术
相关技术中,公开了一种智能茶几,作为控制智能家电设备的AIoT(人工智能物联网)控制器,其中,智能家电设备可以包括空调机、电视机等。
智能茶几包括内置麦克风和控制器,内置麦克风在接收到用户的语音指令时,生成语音信号,控制器根据所述语音信号,获得与所述语音指令相应的控制指令,将所述控制指令发送至相应的智能家电设备,以使智能家电设备输出相应的操作。
但是,现有的智能茶几根据接收到的语音指令,获得的控制指令准确率较差。
发明内容
本发明的主要目的是提供一种智能茶几、语音指令识别方法以及存储介质,旨在解决现有技术中智能茶几根据接收到的语音指令,获得的控制指令准确率较差的技术问题。
为实现上述目的,本发明提出的一种智能茶几,所述智能茶几包括:
多个麦克风,用于在接收到语音指令时,根据所述语音指令和所述语音指令的接收声压,分别生成具有不同声压的输入语音信号;
控制器,用于在接收到所述多个麦克风发送的所述输入语音信号时,根据所述输入语音信号,获得降噪后的结果语音信号,并根据所述结果语音信号,获得与所述语音指令相应的控制指令。
可选的,所述智能茶几还包括声音功放器;
所述多个麦克风,还用于根据所述语音指令生成触发信号;
所述声音功放器,用于在输出音频信号时,接收所述多个麦克风发送的所述触发信号,并根据所述音频信号和所述触发信号,获得自降噪信号;
所述控制器,还用于在接收到所述多个麦克风发送的所述输入语音信号时,从所述声音功放器获取所述自降噪信号,根据所述输入语音信号和所述自降噪信号,获得具有不同声压的预处理语音信号,并根据所述预处理语音信号,获得降噪后的结果语音信号。
可选的,
所述多个麦克风,还用于在接收到语音指令时,在所述多个麦克风中筛选主麦克风,将另外的麦克风作为辅助麦克风,所述主麦克风根据所述语音指令和所述语音指令的接收声压,生成具有主声压的主输入语音信号,所述辅助麦克风根据所述语音指令和所述语音指令的接收声压,生成具有辅助声压的辅助输入语音信号;
所述控制器,还用于在从所述声音功放器获取到所述自降噪信号时,利用所述自降噪信号,对所述主输入语音信号和所述辅助输入语音信号进行降噪处理,获得具有主声压的预处理主语音信号和具有辅助声压的预处理辅助语音信号;以及,根据所述预处理主语音信号和所述预处理辅助语音信号,获得降噪后的结果语音信号。
可选的,
所述多个麦克风,还用于在接收到语音指令时,根据所述语音指令的接收时间,在所述多个麦克风中筛选最先接收到所述语音指令的主麦克风,将另外的麦克风作为辅助麦克风。
可选的,
所述控制器,还用于在获得具有主声压的预处理主语音信号和具有辅助声压的预处理辅助语音信号时,根据所述主声压和所述辅助声压,获得所述主声压与所述辅助声压的声压差,根据所述预处理主语音信号、所述预处理辅助语音信号以及所述声压差,获得外降噪信号,并根据所述外降噪信号和所述预处理主语音信号,获得降噪后的结果语音信号。
可选的,所述智能茶几还包括:
茶几本体,所述茶几本体具有侧壁;
其中,所述多个麦克风与所述侧壁一一对应设置。
可选的,所述多个麦克风分别设置于所述侧壁的中心。
可选的,所述多个麦克风包括四个,所述侧壁包括四个。
此外为实现上述目的,本发明还提出了一种语音指令识别方法,应用于智能茶几,所述智能茶几包括多个麦克风和控制器;所述方法包括以下步骤:
通过所述多个麦克风在接收到语音指令时,根据所述语音指令和所述语音指令的接收声压,分别生成具有不同声压的输入语音信号;
通过所述控制器在接收到所述多个麦克风发送的所述输入语音信号时,根据所述输入语音信号,获得降噪后的结果语音信号,并根据所述结果语音信号,获得与所述语音指令相应的控制指令。
此外为实现上述目的,本发明还提出了一种存储介质,所述存储介质上存储有语音指令识别程序,所述语音指令识别程序被处理器执行时实现如上述所述的语音指令识别方法的步骤。
本发明技术方案通过采用一种智能茶几,所述智能茶几包括:多个麦克风,用于在接收到语音指令时,根据所述语音指令和所述语音指令的接收声压,分别生成具有不同声压的输入语音信号;控制器,用于在接收到所述多个麦克风发送的所述输入语音信号时,根据所述输入语音信号,获得降噪后的结果语音信号,并根据所述结果语音信号,获得与所述语音指令相应的控制指令。由于,通过多个麦克风生成具有不同声压的输入语音信号,根据输入语音信号具有的不同声压,对输入语音信号进行降噪处理,获得结果语音信号,所以结果语音信号与语音指令的匹配度较高,通过结果语音信号获得的控制指令准确率较高,用户使用智能茶几进行语音控制时,体验较好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1是本发明智能茶几第一实施例的结构示意图;
图2为本发明智能茶几俯视图;
图3为本控制器的结构示意图;
图4为本发明智能茶几第二实施例的结构示意图;
图5为本发明智能茶几第二实施例的结构示意图;
图6为本发明语音指令识别方法第一实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
茶几作为家庭客厅的中心家具,在大多数家庭、会客室、办公室等场所都不可或缺的家具产品。随着科技的发展与人们对产品赋能的需求,家居也朝着智能化的方向发展。茶几作为客厅中心的家具,不应只作为摆设置物之用,在茶几的内部集成智能模块,即可作为家庭、会客室、办公室等场所的智能控制中心,即,智能茶几。智能茶几可搭载AI(人工智能)系统,通过AI语音控制所有周边电器设备,智能茶几就变成了AIOT(人工智能物联网)控制中心,以下简称智控中心。
智控中心包括触控功能显示屏与内置音箱以及内置麦克风、WIFI/BT(无线局域网/蓝牙)等功能,可随时语音交互、应答,看视频、听音乐、游戏娱乐等,主要功能为用户可以AI语音控制智能家电设备。用户只需智控中心一个设备,就能控制家里所有的智能设备,非常便捷智能。
参照图1,图1为本发明智能茶几第一实施例的结构示意图,所述智能茶几包括:多个麦克风101和控制器102。其中,
多个麦克风101,用于在接收到语音指令时,根据所述语音指令和所述语音指令的接收声压,分别生成具有不同声压的输入语音信号。
需要说明的是,麦克风数量可以是两个,也可以为其他数量,本发明不做限制。用户的语音指令可以是各种形式的语音指令,例如中文、方言或是英文,本发明不做限制。由于,同一时间,通常一个用户发出语音指令,位置是单一的,而多个麦克风的位置不同,所以多个麦克风与用户的位置均是不同的,多个麦克风的接收到语音指令的接收声压和接收时间也是不同的,此时,每个麦克风根据自己的接收声压和语音指令,生成具有声压的输入语音信号,各个麦克风生成的输入语音信号的声压是不同的。可以理解的是,一个麦克风生成一个具有声压的输入语音信号,一个输入语音信号的声压即为生成该输入语音信号的麦克风的接收声压,其中,一个麦克风根据一个语音指令,生成一个输入语音信号。
具体应用中,用户可以通过对智能茶几进行命名,在输入语音指令之前,通过输入智能茶几的命名,呼出智能茶几的语音指令识别功能。例如,智能茶几命名为:七七,用户发出预音:七七,智能茶几输出:我在,主任。以使用户继续发出语音指令。可以理解的是,此示例并不构成本发明的限制,用户可以根据自己的需求,设定启动语音识别功能的触发机制。
进一步的,所述智能茶几还包括:茶几本体,所述茶几本体具有侧壁;其中,所述多个麦克风与所述侧壁一一对应设置。
可以理解的是,智能茶几可能包括多个侧壁,为保证语音指令的接收效果较好,不同的侧壁均设置麦克风,每个侧壁可以至少设置一个麦克风,也可以设置多个麦克风,本发明不做限制。较优的,每个侧壁的中间设置麦克风。
可选的,所述多个麦克风分别设置于所述侧壁的中心。
可选的,所述多个麦克风包括四个,所述侧壁包括四个。
参照图2,图2为本发明智能茶几的俯视图,智能茶几1包括四个麦克风101,智能茶几具有四个侧壁,分别设置于四个侧壁的中间。在本实施例中,由于四个麦克风的位置关系,四个麦克风可接受到各个方向的语音指令,语音指令的接收效果更好,且四个麦克风的接收声压和接收时间区别较明显,更有利于对输入语音信号的降噪和主麦克风的筛选(主麦克风筛选参照下面的实施例,此处不做赘述)。
四个麦克风距离较大,获得的语音输入信号的声压区别较大,能更加精准滤除噪声,增强语音接收能力;同时,不同方向麦克风接收语音指令,可更好的判断用户所处位置与方向。
控制器102,用于在接收到所述多个麦克风101发送的所述输入语音信号时,根据所述输入语音信号,获得降噪后的结果语音信号,并根据所述结果语音信号,获得与所述语音指令相应的控制指令。
参照图3,图3为本发明控制器结构示意图,控制器包括:至少一个处理器301、存储器302以及存储在所述存储器上并可在所述处理器上运行的语音指令识别程序,所述语音指令识别程序配置为实现如前所述的语音指令识别方法的步骤。
处理器301可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器301可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器301也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(CentralProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器301可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。处理器301还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关语音指令识别方法操作,使得语音指令识别方法模型可以自主训练学习,提高效率和准确度。
存储器302可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器302还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器302中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器801所执行以实现本申请中方法实施例提供的语音指令识别方法。
在一些实施例中,终端还可选包括有:通信接口303和至少一个外围设备。处理器301、存储器302和通信接口303之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与通信接口303相连。具体地,外围设备包括:射频电路304、显示屏305和电源306中的至少一种。
通信接口303可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器301和存储器302。。在一些实施例中,处理器301、存储器302和通信接口303被集成在同一芯片或电路板上;在一些其他实施例中,处理器301、存储器302和通信接口303中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路304用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路304通过电磁信号与通信网络以及其他通信设备进行通信。射频电路304将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路304包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路304可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路304还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏305用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏305是触摸显示屏时,显示屏305还具有采集在显示屏305的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器301进行处理。此时,显示屏305还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏305可以为一个,电子设备的前面板;在另一些实施例中,显示屏305可以为至少两个,分别设置在电子设备的不同表面或呈折叠设计;在再一些实施例中,显示屏305可以是柔性显示屏,设置在电子设备的弯曲表面上或折叠面上。甚至,显示屏305还可以设置成非矩形的不规则图形,也即异形屏。显示屏305可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
电源306用于为电子设备中的各个组件进行供电。电源306可以是交流电、直流电、一次性电池或可充电电池。当电源306包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
需要说明的是,控制器根据多个麦克风分别生成的输入语音信号的不同声压,对输入语音信号进行降噪处理,获得结果语音信号,结果语音信号是经过降噪处理的,结果语音信号与语音指令的匹配度较高,通过结果语音信号获得的控制指令准确率较高。以使智能茶几可以根据较高准确率的控制指令,将控制指令发送给相应的电器设备,电器设备执行控制指令。
可以理解的是,未对输入语音信号进行降噪处理,获得结果语音信号,结果语音信号与语音指令的匹配度较低,通过结果语音信号获得的控制指令准确率较低,即噪声信号会对原语音指令产生影响,例如,语音指令为设置温度为28℃,还包括噪声信号,其中噪声信号为:报数语音27、28、29······未对麦克风根据语音指令生成的输入语音信号进行降噪处理,获得的结果语音信号可能为设置温度为27℃,此时,结果语音信号与语音指令不匹配,通过结果语音信号获得的控制指令也不准确,电器设备根据控制指令执行的动作也与语音指令不符。
通过下述具体例子解释本实施例的具体方案,如下:
例如,智能茶几包括A麦克风、B麦克风、C麦克风以及D麦克风,智能茶几还包括控制器,环境中存在噪声——电视机播放26、27、28······报数声音;用户输入语音指令:打开空调器,温度26℃。4个麦克风接收到语音指令,其中,四个麦克风根据语音指令和接收声压,分别生成四个具有不同声压的输入语音信号;控制器根据四个麦克风发送的四个具有不同声压的输入语音信号,获得外噪声——电视机播放26、27、28······报数声音,根据外噪声获得外降噪信号,然后外降噪信号与四个输入语音信号获得结果语音信号——打开空调器,温度26℃,控制器根据结果语音信号获得控制指令:代开空调器,温度26摄氏度,并将所述控制指令发送至空调器,由空调器执行控制指令。
本实施例通过采用一种智能茶几,所述智能茶几包括:多个麦克风,用于在接收到语音指令时,根据所述语音指令和所述语音指令的接收声压,分别生成具有不同声压的输入语音信号;控制器,用于在接收到所述多个麦克风发送的所述输入语音信号时,根据所述输入语音信号,获得降噪后的结果语音信号,并根据所述结果语音信号,获得与所述语音指令相应的控制指令。由于,通过多个麦克风生成具有不同声压的输入语音信号,根据输入语音信号具有的不同声压,对输入语音信号进行降噪处理,获得结果语音信号,所以结果语音信号与语音指令的匹配度较高,通过结果语音信号获得的控制指令准确率较高,用户使用智能茶几进行语音控制时,体验较好。
参照图4,图4为本发明实施例智能茶几第二实施例的结构示意图,所述智能茶几包括:多个麦克风401、控制器402以及声音功放器403。其中,
所述多个麦克风401,用于在接收到语音指令时,根据所述语音指令和所述语音指令的接收声压,分别生成具有不同声压的输入语音信号,并根据所述语音指令生成触发信号。
所述声音功放器403,用于在输出音频信号时,接收所述多个麦克风401发送的所述触发信号,并根据所述音频信号和所述触发信号,获得自降噪信号。
需要说明的是,本发明的声音功放器可以是任何类型的功放器,例如智能茶几内置的MP3,也可以是智能茶几的内置音乐播放模块,本发明不做限制。可以理解的是,声音功放器还可以包括处理器,用于根据所述触发信号对音频信号进行处理,获得自降噪信号。
可以理解的是,当多个麦克风接收到语音指令时,智能茶几的声音功放器在输出音频信号,多个麦克风接收到的语音指令会包括音频信号噪声(自噪声),导致难以从输入语音信号中获得与所述语音指令相应的控制指令,此时,需要利用音频信号,获得自降噪信号,以根据自降噪信号和输入语音信号获得不包括自噪声的语音信号,语音指令识别效果较好。
另外,所述触发信号可以是简单触发信号,也可以是其他类型的指令信号,本发明不做限制,可实现触发声音功放器根据音频信号,获得自降噪信号的信号均可。触发信号可以是多个麦克风中的主麦克风生成的,也可以是其他麦克风生成的,本发明不做限制。
所述控制器402,还用于在接收到所述多个麦克风401发送的所述输入语音信号时,从所述声音功放器403获取所述自降噪信号,根据所述输入语音信号和所述自降噪信号,获得具有不同声压的预处理语音信号,并根据所述预处理语音信号,获得降噪后的结果语音信号,并根据所述结果语音信号,获得与所述语音指令相应的控制指令。
需要说明的是,自降噪信号可以是与音频信号相位相反、振幅相等的自降噪信号,用于与输入语音信号叠加,以实现自噪声的降噪处理,由于自降噪信号与输入音频信号中的自噪声相位相反,幅度相同,所以,叠加后相互叠加抵消。
进一步的,所述多个麦克风401,还用于在接收到语音指令时,在所述多个麦克风401中筛选主麦克风,将另外的麦克风作为辅助麦克风,所述主麦克风根据所述语音指令和所述语音指令的接收声压,生成具有主声压的主输入语音信号,所述辅助麦克风根据所述语音指令和所述语音指令的接收声压,生成具有辅助声压的辅助输入语音信号;
相应的,所述控制器402,还用于在从所述声音功放器403获取到所述自降噪信号时,利用所述自降噪信号,对所述主输入语音信号和所述辅助输入语音信号进行降噪处理,获得具有主声压的预处理主语音信号和具有辅助声压的预处理辅助语音信号;以及,根据所述预处理主语音信号和所述预处理辅助语音信号,获得降噪后的结果语音信号,并根据所述结果语音信号,获得与所述语音指令相应的控制指令。
需要说明的是,所述多个麦克风,还用于在接收到语音指令时,根据所述语音指令的接收时间,在所述多个麦克风中筛选最先接收到所述语音指令的主麦克风,将另外的麦克风作为辅助麦克风。
可以理解的是,用户发出语音指令时,多个麦克风都会接收到语音指令,由于,多个麦克风的位置不同,接收到的语音指令会存在时间差与声压差。将最先接收到语音指令的麦克风设置为主麦克风,其他的为辅助麦克风,即距离语音指令声源最近的麦克风为主麦克风,其他麦克风为辅助麦克风。由于主麦克风与用户距离最近,主麦克风接收到的语音指令受到噪声影响较小,生成的输入语音信号包括的噪声信息也较少。主麦克风会根据用户的位置移动而切换,并非是固定某一个麦克风。另外,主输入语音信号与预处理主语音信号的主声压相同,同时,辅助输入语音信号与预处理辅助语音信号的辅助声压相同,即自降噪处理并不会消除掉信号本来具有的声压。
具有主声压的预处理主语音信号和具有辅助声压的预处理辅助语音信号是利用自降噪信号进行降噪处理获得的,需要继续对预处理主语音信号和预处理辅助语音信号进行降噪处理,即,对他们包括的外噪声进行外噪声消除处理,以获得降噪后的结果语音信号。
进一步的,所述控制器402,还用于在获得具有主声压的预处理主语音信号和具有辅助声压的预处理辅助语音信号时,根据所述主声压和所述辅助声压,获得所述主声压与所述辅助声压的声压差,根据所述预处理主语音信号、所述预处理辅助语音信号以及所述声压差,获得外降噪信号,并根据所述外降噪信号和所述预处理主语音信号,获得降噪后的结果语音信号,并根据所述结果语音信号,获得与所述语音指令相应的控制指令。
需要说明的是,根据所述主声压和所述辅助声压,获得所述主声压与所述辅助声压的声压差,获得输入语音信号包括的外噪声,根据外噪声,或的一个同等振幅相位相反的外降噪信号,将外降噪信号与预处理主语音信号叠加,外降噪信号与预处理主语音信号中的噪声信号相位相反,幅度相同,相互叠加抵消,实现外噪声信号的降噪处理,获得结果语音信号。
可以理解的是,获得的结果语音信号是经过自降噪(即,本发明自降噪信号与输入语音信号叠加)和外降噪(即,本发明外降噪信号与预处理语音信号叠加)处理的信号,结果语音信号与语音指令匹配度较高。形象的理解,输入语音信号包括两种杂音信号:智能茶几输出音频信号产生的杂音信号和外界环境存在的杂音信号,经过自降噪处理,消除掉智能茶几输出音频信号产生的杂音信,经过外降噪处理,消除掉外界环境存在的杂音信号,获得结果语音信号只包括语音指令,结果语音信号与语音指令匹配度极高,根据结果语音信号,获取到与语音指令相应的控制指令准确率较高。
反之,不经过降噪处理,结果语音信号包括较多的杂音信号,导致结果语音信号与语音指令匹配度极低,根据结果语音信号,获取到与语音指令相应的控制指令准确率也较低。例如,输入语音信号为打开空调器,温度26℃,此时,环境中存在噪声——电视机播放26、27、28······报数声音,输入语音信号包括了环境中存在的噪声,未经过外降噪处理,获得结果信号时,结果语音信号可能是:打开空调器,温度28℃,此时,结果语音信号与语音指令匹配度较低,获取到与语音指令相应的控制指令准确率较低。
下面用一个例子体现本发明本的本实施例的优势,如下:
智能茶几包括A麦克风、B麦克风、C麦克风以及D麦克风,且智能茶几的声音功放器输出音频信号:消愁(毛不易,歌曲),环境中存在噪声——电视机播放26、27、28······报数声音;用户输入语音指令:打开空调器,温度26℃。4个麦克风接收到语音指令,其中,A麦克风距离用户最近,A麦克风为主麦克风,根据语音指令和A麦克风的接收声压生成具有主声压的主输入语音信号,同时生成触发信号,其他三个麦克风作为辅助麦克风,根据语音指令和辅助麦克风的接收声压生成具有辅助声压的辅助输入语音信号,即,生成四个具有不同声压的输入语音信号和一个触发信号,其中四个输入语音信号均包括自噪声——消愁,还包括外噪声——电视机播放26、27、28······报数声音;声音功放器接收到A麦克风发送的触发信号,根据音频信号——消愁,获得与消愁同等振幅相位相反的自降噪信号,并将所述自降噪信号发送给控制器;控制器将四个麦克风发送的四个输入语音信号和自降噪信号叠加,消除四个输入语音信号中的自噪声,获得预处理语音信号,预处理语音信号包括具有主声压的预处理主语音信号和具有辅助声压的预处理辅助语音信号,控制器根据主声压与辅助声压的声压差,从预处理主语音信号和预处理辅助语音信号中分离出外噪声——电视机播放26、27、28······报数声音,然后根据外噪声获得外降噪信号,外降噪信号为与电视及播放电视节目的声音同等振幅相位相反的外降噪信号,然后,将外降噪信号与预处理主语音信号叠加,消除外噪音,获得结果语音信号——打开空调器,温度26℃,控制器根据结果语音信号获得控制指令:代开空调器,温度26摄氏度,并将所述控制指令发送至空调器,由空调器执行控制指令。
参照图5,图5为本发明智能茶几第三实施例的结构示意图。输入音频即为多个麦克风,功放模块和自噪音降噪模块的和声音功放器,音频混合器(左侧)、噪声分离模块、主动降噪模块、音频混合器(右侧)以及语音处理模块的和为控制器,其中,自音频即为音频信号,噪声即为外噪声,自音频反向信号即为自降噪信号,噪声反向信号即为外降噪信号。
其中,功放模块用于输出音频信息,自降噪模块用于根据触发信号和输出音频信息获得自降噪信号;音频混合器(左侧)用于利用自降噪信号对输入音频信号进行降噪处理,获得预处理语音信号;噪声分离模块用于根据预处理语音信号获得外噪声;主动降噪模块用于根据具有主声压的预处理主语音信号和具有辅助声压预处理辅助语音信号获得的外噪声,根据外噪声,获得外降噪语音信号;音频混合器(右侧)用于根据外降噪信号和预处理主语音信号获得结果语音信号;语音处理模块用于根据结果语音信号获得控制指令。具体细节不再赘述,参照上述实施例。
参照图6,图6为本发明语音指令识别方法第一实施例的流程示意图,所述语音指令识别应用于只能茶几,所述方法包括以下步骤:
步骤S11:通过所述多个麦克风在接收到语音指令时,根据所述语音指令和所述语音指令的接收声压,分别生成具有不同声压的输入语音信号;
步骤S12:通过所述控制器在接收到所述多个麦克风发送的所述输入语音信号时,根据所述输入语音信号,获得降噪后的结果语音信号,并根据所述结果语音信号,获得与所述语音指令相应的控制指令。
进一步的,所述智能茶几还包括声音功放器;所述步骤S11之前所述方法还包括:通过所述多个麦克风根据所述语音指令生成触发信号;通过所述声音功放器在输出音频信号时,接收所述多个麦克风发送的所述触发信号,并根据所述音频信号和所述触发信号,获得自降噪信号;
相应的,所述步骤S12包括:通过所述控制器在接收到所述多个麦克风发送的所述输入语音信号时,从所述声音功放器获取所述自降噪信号,根据所述输入语音信号和所述自降噪信号,获得具有不同声压的预处理语音信号,并根据所述预处理语音信号,获得降噪后的结果语音信号,并根据所述结果语音信号,获得与所述语音指令相应的控制指令。
进一步的,步骤S11包括:通过所述多个麦克风在接收到语音指令时,在所述多个麦克风中筛选主麦克风,将另外的麦克风作为辅助麦克风,所述主麦克风根据所述语音指令和所述语音指令的接收声压,生成具有主声压的主输入语音信号,所述辅助麦克风根据所述语音指令和所述语音指令的接收声压,生成具有辅助声压的辅助输入语音信号;
所述步骤S12包括:
通过所述控制器在接收到所述多个麦克风发送的所述输入语音信号时,从所述声音功放器获取所述自降噪信号,利用所述自降噪信号,对所述主输入语音信号和所述辅助输入语音信号进行降噪处理,获得具有主声压的预处理主语音信号和具有辅助声压的预处理辅助语音信号,并根据所述预处理主语音信号和所述预处理辅助语音信号,获得降噪后的结果语音信号,并根据所述结果语音信号,获得与所述语音指令相应的控制指令。
进一步的,所述步骤S11还包括:
通过所述多个麦克风在接收到语音指令时,根据所述语音指令的接收时间,在所述多个麦克风中筛选最先接收到所述语音指令的主麦克风,将另外的麦克风作为辅助麦克风。
进一步的,步骤S12还包括:通过所述控制器根据所述主声压和所述辅助声压,获得所述主声压与所述辅助声压的声压差,根据所述预处理主语音信号、所述预处理辅助语音信号以及所述声压差,获得外降噪信号,并根据所述外降噪信号和所述预处理主语音信号,获得降噪后的结果语音信号。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有语音指令识别程序,所述语音指令识别程序被处理器执行时实现如上文所述的语音指令识别方法的步骤。因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。确定为示例,程序指令可被部署为在一个智能茶几上执行,或者在位于一个地点的多个智能茶几上执行,又或者,在分布在多个地点且通过通信网络互连的多个智能茶几上执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,上述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本发明的可选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。
Claims (10)
1.一种智能茶几,其特征在于,所述智能茶几包括:
多个麦克风,用于在接收到语音指令时,根据所述语音指令和所述语音指令的接收声压,分别生成具有不同声压的输入语音信号;
控制器,用于在接收到所述多个麦克风发送的所述输入语音信号时,根据所述输入语音信号,获得降噪后的结果语音信号,并根据所述结果语音信号,获得与所述语音指令相应的控制指令。
2.如权利要求1所述的智能茶几,其特征在于,所述智能茶几还包括声音功放器;
所述多个麦克风,还用于根据所述语音指令生成触发信号;
所述声音功放器,用于在输出音频信号时,接收所述多个麦克风发送的所述触发信号,并根据所述音频信号和所述触发信号,获得自降噪信号;
所述控制器,还用于在接收到所述多个麦克风发送的所述输入语音信号时,从所述声音功放器获取所述自降噪信号,根据所述输入语音信号和所述自降噪信号,获得具有不同声压的预处理语音信号,并根据所述预处理语音信号,获得降噪后的结果语音信号。
3.如权利要求2所述的智能茶几,其特征在于,
所述多个麦克风,还用于在接收到语音指令时,在所述多个麦克风中筛选主麦克风,将另外的麦克风作为辅助麦克风,所述主麦克风根据所述语音指令和所述语音指令的接收声压,生成具有主声压的主输入语音信号,所述辅助麦克风根据所述语音指令和所述语音指令的接收声压,生成具有辅助声压的辅助输入语音信号;
所述控制器,还用于在从所述声音功放器获取到所述自降噪信号时,利用所述自降噪信号,对所述主输入语音信号和所述辅助输入语音信号进行降噪处理,获得具有主声压的预处理主语音信号和具有辅助声压的预处理辅助语音信号;以及,根据所述预处理主语音信号和所述预处理辅助语音信号,获得降噪后的结果语音信号。
4.如权利要求3所述的智能茶几,其特征在于,
所述多个麦克风,还用于在接收到语音指令时,根据所述语音指令的接收时间,在所述多个麦克风中筛选最先接收到所述语音指令的主麦克风,将另外的麦克风作为辅助麦克风。
5.如权利要求4所述的智能茶几,其特征在于,
所述控制器,还用于在获得具有主声压的预处理主语音信号和具有辅助声压的预处理辅助语音信号时,根据所述主声压和所述辅助声压,获得所述主声压与所述辅助声压的声压差,根据所述预处理主语音信号、所述预处理辅助语音信号以及所述声压差,获得外降噪信号,并根据所述外降噪信号和所述预处理主语音信号,获得降噪后的结果语音信号。
6.如权利要求1-5任一项所述的智能茶几,其特征在于,所述智能茶几还包括:
茶几本体,所述茶几本体具有侧壁;
其中,所述多个麦克风与所述侧壁一一对应设置。
7.如权利要求6所述的智能茶几,其特征在于,所述多个麦克风分别设置于所述侧壁的中心。
8.如权利要求7所述的智能茶几,其特征在于,所述多个麦克风包括四个,所述侧壁包括四个。
9.一种语音指令识别方法,其特征在于,应用于智能茶几,所述智能茶几包括多个麦克风和控制器;所述方法包括以下步骤:
通过所述多个麦克风在接收到语音指令时,根据所述语音指令和所述语音指令的接收声压,分别生成具有不同声压的输入语音信号;
通过所述控制器在接收到所述多个麦克风发送的所述输入语音信号时,根据所述输入语音信号,获得降噪后的结果语音信号,并根据所述结果语音信号,获得与所述语音指令相应的控制指令。
10.一种存储介质,其特征在于,所述存储介质上存储有语音指令识别程序,所述语音指令识别程序被处理器执行时实现如权利要求9所述的语音指令识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010918463.1A CN112056763A (zh) | 2020-09-08 | 2020-09-08 | 智能茶几、语音指令识别方法以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010918463.1A CN112056763A (zh) | 2020-09-08 | 2020-09-08 | 智能茶几、语音指令识别方法以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112056763A true CN112056763A (zh) | 2020-12-11 |
Family
ID=73666427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010918463.1A Pending CN112056763A (zh) | 2020-09-08 | 2020-09-08 | 智能茶几、语音指令识别方法以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112056763A (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104270489A (zh) * | 2014-09-10 | 2015-01-07 | 中兴通讯股份有限公司 | 一种从多个麦克风中确定主副麦克风的方法和系统 |
CN106782591A (zh) * | 2016-12-26 | 2017-05-31 | 惠州Tcl移动通信有限公司 | 一种在背景噪音下提高语音识别率的装置及其方法 |
CN106941549A (zh) * | 2017-04-28 | 2017-07-11 | 苏州科技大学 | 一种双麦克风降噪的手机通话装置及其处理方法 |
CN107454248A (zh) * | 2017-06-29 | 2017-12-08 | 努比亚技术有限公司 | 一种音频信号处理方法、装置及移动终端 |
CN107979790A (zh) * | 2017-11-28 | 2018-05-01 | 上海与德科技有限公司 | 一种通话降噪方法、装置、设备及介质 |
CN109545210A (zh) * | 2018-12-03 | 2019-03-29 | 北京云知声信息技术有限公司 | 一种提升语音识别稳健性的装置及其方法 |
CN110277103A (zh) * | 2019-06-25 | 2019-09-24 | 广东以诺通讯有限公司 | 基于语音识别的降噪方法及终端 |
US10593328B1 (en) * | 2016-12-27 | 2020-03-17 | Amazon Technologies, Inc. | Voice control of remote device |
CN111128192A (zh) * | 2019-12-31 | 2020-05-08 | 深圳市优必选科技股份有限公司 | 语音识别降噪方法、系统、移动终端及存储介质 |
US20200182539A1 (en) * | 2018-12-07 | 2020-06-11 | Lg Electronics Inc. | Refrigerator and method for controlling the same |
-
2020
- 2020-09-08 CN CN202010918463.1A patent/CN112056763A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104270489A (zh) * | 2014-09-10 | 2015-01-07 | 中兴通讯股份有限公司 | 一种从多个麦克风中确定主副麦克风的方法和系统 |
CN106782591A (zh) * | 2016-12-26 | 2017-05-31 | 惠州Tcl移动通信有限公司 | 一种在背景噪音下提高语音识别率的装置及其方法 |
US10593328B1 (en) * | 2016-12-27 | 2020-03-17 | Amazon Technologies, Inc. | Voice control of remote device |
CN106941549A (zh) * | 2017-04-28 | 2017-07-11 | 苏州科技大学 | 一种双麦克风降噪的手机通话装置及其处理方法 |
CN107454248A (zh) * | 2017-06-29 | 2017-12-08 | 努比亚技术有限公司 | 一种音频信号处理方法、装置及移动终端 |
CN107979790A (zh) * | 2017-11-28 | 2018-05-01 | 上海与德科技有限公司 | 一种通话降噪方法、装置、设备及介质 |
CN109545210A (zh) * | 2018-12-03 | 2019-03-29 | 北京云知声信息技术有限公司 | 一种提升语音识别稳健性的装置及其方法 |
US20200182539A1 (en) * | 2018-12-07 | 2020-06-11 | Lg Electronics Inc. | Refrigerator and method for controlling the same |
CN110277103A (zh) * | 2019-06-25 | 2019-09-24 | 广东以诺通讯有限公司 | 基于语音识别的降噪方法及终端 |
CN111128192A (zh) * | 2019-12-31 | 2020-05-08 | 深圳市优必选科技股份有限公司 | 语音识别降噪方法、系统、移动终端及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11251763B2 (en) | Audio signal adjustment method, storage medium, and terminal | |
CN108551636B (zh) | 一种扬声器控制方法及移动终端 | |
KR20100122030A (ko) | 세탁기를 제어하는 휴대 단말기 및 그 동작 방법 | |
CN110209452B (zh) | 移动终端的页面显示方法及移动终端 | |
US11068230B2 (en) | Bluetooth speaker, and intelligent control method for playing audio | |
CN206283621U (zh) | 一种智能遥控器 | |
CN106231514A (zh) | 一种移动终端的音腔装置及移动终端 | |
CN111078186A (zh) | 一种播放方法及电子设备 | |
CN111614329A (zh) | 一种功率放大器、电子设备、电压控制方法和装置 | |
CN111225315A (zh) | 一种音频播放装置、音频播放方法及电子设备 | |
CN109451146B (zh) | 一种振动处理方法及终端 | |
CN112689172B (zh) | 节目播放方法、装置、机顶盒以及存储介质 | |
CN113409805B (zh) | 人机交互方法、装置、存储介质及终端设备 | |
US20230370774A1 (en) | Bluetooth speaker control method and system, storage medium, and mobile terminal | |
CN111724783B (zh) | 智能设备的唤醒方法、装置、智能设备及介质 | |
CN203492168U (zh) | 一种智能音响结构 | |
JP2022539669A (ja) | 移動端末及び制御方法 | |
CN112056763A (zh) | 智能茶几、语音指令识别方法以及存储介质 | |
CN211063776U (zh) | 一种ks-2多功能k歌音响系统 | |
CN109217883B (zh) | 一种电压控制方法、移动终端 | |
US20190051300A1 (en) | Loudspeaker system | |
CN111756893A (zh) | 音频输出方法、电子设备及介质 | |
KR20220016552A (ko) | 음성 데이터 처리 방법 및 이를 지원하는 전자 장치 | |
CN113014998B (zh) | 音频输出方法、装置、电视机以及计算机可读存储介质 | |
CN204465844U (zh) | 音频设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201211 |