CN111412587B

CN111412587B - 空调器的语音处理方法、装置、空调器和存储介质

Info

Publication number: CN111412587B
Application number: CN202010246301.8A
Authority: CN
Inventors: 张新健; 霍伟明
Original assignee: Midea Group Co Ltd; GD Midea Air Conditioning Equipment Co Ltd
Current assignee: Midea Group Co Ltd; GD Midea Air Conditioning Equipment Co Ltd
Priority date: 2020-03-31
Filing date: 2020-03-31
Publication date: 2021-12-07
Anticipated expiration: 2040-03-31
Also published as: CN111412587A

Abstract

本发明提供了一种空调器的语音处理方法、装置、空调器和存储介质，其中，空调器的语音处理方法包括：响应于待播报的语音信息，确定语音信息中包含的方位信息；根据方位信息确定部署于对应方位的至少一个语音装置；控制语音装置对语音信息进行播报。通过本发明的技术方案，提升了语音处理方案的空间方位感，能够为用户提供环绕播报的音效，提升了用户的语音使用体验。

Description

空调器的语音处理方法、装置、空调器和存储介质

技术领域

本发明涉及语音技术领域，具体而言，涉及一种空调器的语音处理方法、一种空调器的语音处理装置、一种空调器和一种计算机可读存储介质。

背景技术

家电设备比如空调器、电风扇等作为生活电器，已成为人们必不可少的产品，随着人工智能技术的快速发展，具备语音处理功能的家电产品也层出不穷，极大的改善着我们与家电产品的交互和体验。

现有大多数空调语音处理系统都是唤醒后，用户通过语音对设备进行控制，比如开机、关机、左右摆风、上下摆风等，用户发出语音指令后，空调器不仅执行相应的指令动作，也做出相应的播报反馈。

但是，现有的空调器的播报方案普遍比较僵化，仅仅是一个固定方向的，对执行动作结果的反馈播报，没有方向感和独特性，另外，室内环境的杂音多，可能影响空调器执行语音指令的可靠性和准确性。

另外，整个说明书对背景技术的任何讨论，并不代表该背景技术一定是所属领域技术人员所知晓的现有技术，整个说明书中的对现有技术的任何讨论并不代表认为该现有技术一定是广泛公知的或一定构成本领域的公知常识。

发明内容

本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。

为此，本发明的一个目的在于提供一种空调器的语音处理方法。

本发明的另一个目的在于提供一种空调器的语音处理装置。

本发明的另一个目的在于提供一种空调器。

本发明的另一个目的在于提供一种计算机可读存储介质。

为了实现上述目的，根据本发明的第一方面的实施例，提供了一种空调器的语音处理方法，包括：响应于待播报的语音信息，确定所述语音信息中包含的方位信息；根据所述方位信息确定部署于对应方位的至少一个所述语音装置；控制所述语音装置对所述语音信息进行播报。

在该技术方案中，响应于待播报的语音信息，确定所述语音信息中包含的方位信息，并通过所述方位信息确定部署于对应方位的至少一个所述语音装置，进而通过控制所述语音装置对所述语音信息进行播报，来使用户收听到的语音信息由对应方位的语音装置播报，进而将语音信息与对应的方位向结合，来辅助提升用户对语音信息的识别率，有利于提升语音信息的收听体验和播报效果。

在上述任一技术方案中，优选地，所述语音装置包括部署于第一方位的第一语音装置和部署于第二方位的第二语音装置，所述语音处理方法还包括：响应于接收到的语音指令，生成对应的语音信息，所述语音信息被配置包含所述空调器是否执行指定方位上的运行参数和/或运行模式；根据所述语音信息控制所述第一语音装置或所述第二语音装置向所述目标声源播报。

在该技术方案中，所述语音信息被配置包含所述空调器是否执行指定方位上的运行参数和/或运行模式，通过根据所述语音信息控制所述第一语音装置或所述第二语音装置向所述目标声源播报，使用户根据不同方位的语音装置播报，来确定空调器的硬件动作的执行和变化。

在上述任一技术方案中，优选地，还包括：响应于所述第一语音指令或所述第二语音指令，生成对应的语音信息，所述语音信息被配置包含所述空调器执行的运行参数和/或运行模式；根据所述语音信息控制所述第一语音装置或所述第二语音装置向所述目标声源播报。

在该技术方案中，根据所述语音信息控制所述第一语音装置或所述第二语音装置向所述目标声源播报，具体包括：判断所述语音信息为所述空调器执行第一方向上的运行参数和/或运行模式或不执行第一方向上的运行参数和/或运行模式；判定所述语音信息为所述空调器执行第一方向上的运行参数和/或运行模式，控制所述第一语音装置向所述目标声源播报；判定所述语音信息为所述空调器不执行第一方向上的运行参数和/或运行模式，控制所述第二语音装置向所述目标声源播报。

在该技术方案中，通过判断所述语音信息为所述空调器执行第一方向上的运行参数和/或运行模式或不执行第一方向上的运行参数和/或运行模式，灵活控制第一语音装置或第二语音装置进行播报，进一步地丰富用户的收听体验。

若判定所述语音信息为所述空调器执行第一方向上的运行参数和/或运行模式，则控制所述第一语音装置向所述目标声源播报，语音指令为“风向我吹”，譬如，声源定位到用户在空调左边，则“风已向您吹”音频被配置于左声道声轨上，与右声道的“静音”合成播报音频，并由扬声器系统播放出来。

另外，判定所述语音信息为所述空调器不执行第一方向上的运行参数和/或运行模式，则控制所述第二语音装置向所述目标声源播报，语音指令为“风别吹我”，譬如，声源定位到用户在空调左边，“风已不吹您”音频被配置于右声道声轨上，与左声道的“静音”合成播报音频，并由扬声器系统播放出来。

譬如，对于单声道系统的空调器而言，以用户为参考端点，可以按照下表的方式执行语音指令和播报过程：

表1

在上述任一技术方案中，优选地，还包括：控制多个所述语音装置接收第一语音指令；确定发出所述第一语音指令的目标声源的位置信息；采用波束成形技术拾取来自所述目标声源的位置信息的第二语音指令。

在该技术方案中，通过控制多个所述语音装置接收第一语音指令，能够确定发出第一语音指令的目标声源的位置信息，进一步地，采用波束成形技术拾取来自所述目标声源的位置信息的第二语音指令，能够提高采集语音指令的可靠性和准确性，降低语音指令所在环境的噪音干扰，有利于提高语音指令的响应速率和可靠性。

譬如，多个语音装置接收第一语音指令的时间存在差别，根据时间差确定用户的位置信息，位置信息可以包括方位信息，譬如左侧和右侧，也可以包括方位角和具体的距离信息。

更进一步地，根据位置信息向用户反馈语音信息，结合多个语音装置的位置为用户提供环绕声播报，以提升用户的使用体验。

在上述任一技术方案中，优选地，确定发出所述第一语音指令的目标声源的位置信息，具体包括：对所述第一语音指令进行同声消除处理；对完成所述同声消除处理的所述第一语音指令，进行抗混响处理；对完成所述抗混响处理的所述第一语音指令，进行人声增强处理，并进行自动增益控制；根据所述自动增益控制的结果，确定所述目标声源的位置信息。

在该技术方案中，对所述第一语音指令进行同声消除处理，能够降低语音指令的重复性，以提升语音指令的识别效率。

另外，通过对完成所述同声消除处理的所述第一语音指令，进行抗混响处理，能有效的实现混响背景下的目标检测,并且能很好地克服多普勒失配带来的不利影响。

另外，对完成所述抗混响处理的所述第一语音指令，进行人声增强处理，并进行自动增益控制，主要是针对低分贝的语音指令能够进行更准确地识别。

最后，根据所述自动增益控制的结果，确定所述目标声源的位置信息，有利于提升目标声源位置的可靠性和准确性，以及检测精度。

在上述任一技术方案中，优选地，还包括：对完成所述自动增益控制的语音指令进行本地识别或进行在线识别；将完成识别的语音指令传输至仲裁器，以得到仲裁处理的语义信息；对所述语义信息进行声音变化处理，以得到所述语音信息。

在该技术方案中，对完成所述自动增益控制的语音指令进行本地识别或进行在线识别，有利于提升语音处理的可靠性和准确性，尤其是在线识别方案，云端的语音指令库包括大量语音文本、方言短语和俗语，降低了使用语音功能对用户的要求。

另外，通过将完成识别的语音指令传输至仲裁器，以得到仲裁处理的语义信息，能够进一步地提升语音指令识别的可靠性和准确性。

最后，通过对所述语义信息进行声音变化处理，以得到所述语音信息，对语音信息进行单声道或多声道播报，以进一步地提升用户的使用体验。

在上述任一技术方案中，优选地，采用波束成形拾取来自所述目标声源的位置信息的第二语音指令，具体包括：在确定所述目标声源的位置信息后，采用所述波束形成技术对所述目标声源进行端点检测，以拾取来自所述端点的第二语音指令。

在该技术方案中，在确定所述目标声源的位置信息后，采用所述波束形成技术对所述目标声源进行端点检测，以拾取来自所述端点的第二语音指令，能够降低目标声源位置的其他干扰，尤其是降低第二语音指令周围环境中的噪声干扰，有利于提升语音装置的工作效率和准确性。

根据本发明的第二方面的技术方案，提供了一种空调器的语音处理装置，包括：存储器和处理器，所述存储器被配置为能够存储计算机程序，所述计算机程序被所述处理器执行时能够实现如上述任一项技术方案所述的空调器的语音处理方法的步骤。

根据本发明的第三方面的技术方案，提供了一种空调器，包括：存储器和处理器，所述存储器被配置为能够存储计算机程序，所述计算机程序被所述处理器执行时能够实现如上述任一项技术方案所述的空调器的语音处理方法的步骤。

根据本发明的第四方面的技术方案，提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被执行时实现如上述任一项技术方案限定的空调器的语音处理方法的步骤。

本发明的附加方面和优点将在下面的描述部分中给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1示出了根据本发明的一个实施例的空调器的语音处理方法的示意流程图；

图2示出了根据本发明的另一个实施例的空调器的语音处理方案的示意图；

图3示出了根据本发明的另一个实施例的空调器的语音处理方案的示意图；

图4示出了根据本发明的一个实施例的空调器的语音处理装置的示意框图；

图5示出了根据本发明的一个实施例的空调器的示意框图；

图6示出了根据本发明的一个实施例的计算机可读存储介质的示意框图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

下面结合图1至图6对根据本发明的实施例的空调器的语音处理方法、装置、空调器和计算机可读存储介质的实施例进行具体说明。

如图1所示，根据本发明的实施例的空调器的语音处理方法，包括：步骤S102，响应于待播报的语音信息，确定所述语音信息中包含的方位信息；步骤S104，根据所述方位信息确定部署于对应方位的至少一个所述语音装置；步骤S106，控制所述语音装置对所述语音信息进行播报。

如图2所示，若判定所述语音信息为所述空调器执行响应的动作，则控制所述第一语音装置向所述目标声源播报，语音指令为“风向我吹”，譬如，声源定位到用户在空调左边，则“风已向左吹”音频被配置于左声道声轨上，与右声道的“静音”合成播报音频，并由扬声器系统播放出来。

如图3所示，若判定所述语音信息为所述空调器不执行响应的动作，则控制所述第二语音装置向所述目标声源播报，语音指令为“风向我吹”，譬如，声源定位到用户在空调左边，“风已不吹您”音频被配置于右声道声轨上，与左声道的“静音”合成播报音频，并由扬声器系统播放出来。

如图4所示，根据本发明的另一个实施例的空调器的语音处理装置400，包括：存储器402和处理器404，所述存储器402被配置为能够存储计算机程序，所述计算机程序被所述处理器404执行时能够实现如上述任一项技术方案所述的空调器的语音处理方法的步骤。

如图5所示，根据本发明的另一个实施例的空调器500，包括：存储器502和处理器504，所述存储器502被配置为能够存储计算机程序，所述计算机程序被所述处理器504执行时能够实现如上述任一项技术方案所述的空调器的语音处理方法的步骤。

具体地，空调器500又细分为语音信号处理、识别播报与通信两部分组成。

其中，语音信号处理部分由回声消除模块、抗混响模块、降噪与人声增强模块、自动增益控制模块、声源定位模块、波束形成模块、端点检测模块组合而成。

识别播报与通信处理部分由本地唤醒模块、本地识别模块、在线识别服务模块、仲裁器模块、Wi-Fi蓝牙程序模块、声音变换、播报控制等组合而成。

对于本发明第一个核心功能，正常情况下，多声道语音播报硬件又多个装配位置的多个扬声器组成，由播报控制模块输出的音频可以是单声道或多声道的，播报时可以实现由其中一个扬声器进行播报，也可以同时由其中多个扬声器进行播报，扬声器即语音装置的一种实施例，但不限于此。

由于声音的指向性特点，一般装配于空调器左侧的扬声器，输出的声音从空间听感上会给人以左侧的感觉，同理，装配于空调器右侧的扬声器，输出的声音从空间听感上会给人以右侧的感觉。

综上，针对不同的语音信息，实现多扬声器系统的播报调度，是本系统的核心功能之一。

如图6所示，根据本发明的实施例的计算机可读存储介质600，计算机可读存储介质上存储有计算机程序，计算机程序被空调器500执行时，实现如上述任一项技术方案限定的空调器的语音处理方法，具体包括以下步骤：响应于待播报的语音信息，确定所述语音信息中包含的方位信息；根据所述方位信息确定部署于对应方位的至少一个所述语音装置；控制所述语音装置对所述语音信息进行播报。

综上，该空调器的语音系统有两个核心功能：

(1)远场语音处理交互过程中，通过智能算法，系统可以提供具有空间感的声音信号输出，让风向指示，摆风导航等多种声音信号具有可感知的真实空间感，降低大脑对于声音判断的复杂度。

(2)通过虚拟环绕声技术，将原始单声道音频自动转换成多声道音频，合成的音频中，有效声信号配置于相应的声道声轨上，配合声源定位技术与实际的控制功能，形成与众不同的环绕效果。这个技术可以用于单声道播报的系统，也可以用于多声道播报的系统。对于单声道系统，只要播出的音频具备独特的声场特性，也可以营造出虚拟的声音空间感，从而一定程度上实现多声道系统的播放声效。

用户在通过语音设定风向摆风时，播报语音会智能根据用户的摆风方向，仅由某一侧的扬声器输出交互播报指示音，使用户不仅听到了指令在执行，也听到了声音的方向，简单来说就是“听声辨位”，让用户拥有可听到的真实空间感，使得如风向指示具有立体感，声音具有奇特的指示性，通过系统独特的播报特性，用户就算没有听清楚具体播报内容，也可以通过辨识方位感知到自己的操控被执行，一种新奇的交互体验。

本系统可以通过智能虚拟环绕声技术，将原始单声道音频自动转换成多声道音频，合成的音频中，有效声信号配置于相应的声道声轨上，配合声源定位技术与实际的控制功能，形成与众不同的环绕效果。这个技术可以用于单声道播报的系统，也可以用于多声道播报的系统。

以上结合附图详细说明了本发明的技术方案，本发明提供了一种空调器的语音处理方法、装置、空调器和计算机可读存储介质，通过响应于待播报的语音信息，确定所述语音信息中包含的方位信息，并通过所述方位信息确定部署于对应方位的至少一个所述语音装置，进而通过控制所述语音装置对所述语音信息进行播报，来使用户收听到的语音信息由对应方位的语音装置播报，进而将语音信息与对应的方位向结合，来辅助提升用户对语音信息的识别率，有利于提升语音信息的收听体验和播报效果。

本发明方法中的步骤可根据实际需要进行顺序调整、合并和删减。

本发明装置中的单元可根据实际需要进行合并、划分和删减。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质包括只读存储器(Read-Only Memory，ROM)、随机存储器(Random Access Memory，RAM)、可编程只读存储器(Programmable Read-only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种空调器的语音处理方法，其特征在于，所述空调器周向设置有多个语音装置，所述语音装置包括部署于第一方位的第一语音装置和部署于第二方位的第二语音装置，包括：

响应于待播报的语音信息，确定所述语音信息中包含的方位信息；

根据所述方位信息确定部署于对应方位的至少一个所述语音装置；

控制所述语音装置对所述语音信息进行播报；

响应于接收到的语音指令，生成对应的语音信息，所述语音信息被配置包含所述空调器是否执行指定方位上的运行参数和/或运行模式；

根据所述语音信息控制所述第一语音装置或所述第二语音装置向目标声源播报；

所述根据所述语音信息控制所述第一语音装置或所述第二语音装置向所述目标声源播报，具体包括：

判断所述语音信息为所述空调器执行第一方向上的运行参数和/或运行模式或不执行第一方向上的运行参数和/或运行模式；

判定所述语音信息为所述空调器执行第一方向上的运行参数和/或运行模式，控制所述第一语音装置向所述目标声源播报；

判定所述语音信息为所述空调器不执行第一方向上的运行参数和/或运行模式，控制所述第二语音装置向所述目标声源播报。

2.根据权利要求1所述的空调器的语音处理方法，其特征在于，还包括：

控制多个所述语音装置接收第一语音指令；

确定发出所述第一语音指令的目标声源的位置信息；

采用波束成形技术拾取来自所述目标声源的位置信息的第二语音指令。

3.根据权利要求2所述的空调器的语音处理方法，其特征在于，确定发出所述第一语音指令的目标声源的位置信息，具体包括：

对所述第一语音指令进行同声消除处理；

对完成所述同声消除处理的所述第一语音指令，进行抗混响处理；

对完成所述抗混响处理的所述第一语音指令，进行人声增强处理，并进行自动增益控制；

根据所述自动增益控制的结果，确定所述目标声源的位置信息。

4.根据权利要求3所述的空调器的语音处理方法，其特征在于，还包括：

对完成所述自动增益控制的语音指令进行本地识别或进行在线识别；

将完成识别的语音指令传输至仲裁器，以得到仲裁处理的语义信息；

对所述语义信息进行声音变化处理，以得到所述语音信息。

5.根据权利要求3或4所述的空调器的语音处理方法，其特征在于，采用波束成形拾取来自所述目标声源的位置信息的第二语音指令，具体包括：

在确定所述目标声源的位置信息后，采用所述波束形成技术对所述目标声源进行端点检测，以拾取来自所述端点的第二语音指令。

6.一种空调器的语音处理装置，其特征在于，包括：

存储器和处理器，所述存储器被配置为能够存储计算机程序，所述计算机程序被所述处理器执行时能够实现如权利要求1至5中任一项所述的空调器的语音处理方法的步骤。

7.一种空调器，其特征在于，包括：

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被执行时实现如权利要求1至5中任一项所述的空调器的语音处理方法。