CN114446299A

CN114446299A - 家居设备的控制方法、控制装置、存储介质及电子装置

Info

Publication number: CN114446299A
Application number: CN202210082549.4A
Authority: CN
Inventors: 王鹏飞; 岑淑娟; 熊剑
Original assignee: Gree Electric Appliances Inc of Zhuhai; Zhuhai Lianyun Technology Co Ltd
Current assignee: Gree Electric Appliances Inc of Zhuhai; Zhuhai Lianyun Technology Co Ltd
Priority date: 2022-01-24
Filing date: 2022-01-24
Publication date: 2022-05-06

Abstract

本发明提供了一种家居设备的控制方法、控制装置、存储介质及电子装置，方法包括：获取至少一个目标对象的语音信号；从语音信号中提取声纹特征，得到声纹特征信息；在声纹特征信息包括至少两个不同目标对象的声纹特征的情况下，基于语音信号和多个声纹特征，生成多个交谈文本信息；基于多个交谈文本信息，生成控制指令；基于控制指令调整家居设备的工作参数，工作参数包括如下至少之一：显示参数、音频参数、运动参数。采用本申请的技术方案，解决了现有技术中的家居设备存在的当检测到多个目标对象对话时无法根据语音信号调整工作参数的问题。

Description

家居设备的控制方法、控制装置、存储介质及电子装置

技术领域

本发明涉及家居设备控制技术领域，具体而言，涉及一种家居设备的控制方法、控制装置、存储介质及电子装置。

背景技术

随着家用电器越来越智能化，人们的生活与智能家用电器联系越来越紧密。但是在存在多个用户交流的情况下，家居设备通常无法自适应调整设备的工作参数。举例来说，多个用户在观看电视的同时进行语言交流时，电视无法智能降低音量等工作参数以保证不会打扰用户交谈，降低了用户的使用体验。因此现有技术中的家居设备存在着当检测到多个目标对象对话时无法根据语音信号调整工作参数的问题。

针对上述问题，目前尚未提出有效地解决方案。

发明内容

本发明的主要目的在于提供一种家居设备的控制方法、控制装置、存储介质及电子装置，以解决现有技术中的家居设备存在的当检测到多个目标对象对话时无法根据语音信号调整工作参数的问题。

为了实现上述目的，根据本发明的一个方面，提供了一种家居设备的控制方法，包括：获取至少一个目标对象的语音信号；从语音信号中提取声纹特征，得到声纹特征信息；在声纹特征信息包括至少两个不同目标对象的声纹特征的情况下，基于语音信号和多个声纹特征，生成多个交谈文本信息；基于多个交谈文本信息，生成控制指令；基于控制指令调整家居设备的工作参数，工作参数包括如下至少之一：显示参数、音频参数、运动参数。

进一步地，基于语音信号和多个声纹特征，生成多个交谈文本信息，包括：基于多种声纹特征，对语音信号进行分割，得到多个语音信号段；对多个语音信号段进行语义分析处理，得到多个交谈文本信息。

进一步地，基于多个交谈文本信息，生成控制指令，包括：将多个交谈文本信息进行比对，得到文本重合度；判断文本重合度是否大于第一预设值，在确定文本重合度大于第一预设值的情况下，生成控制指令。

进一步地，基于多个交谈文本信息，生成控制指令，还包括：分别提取多个交谈文本信息的关键词，得到多个关键词组；将多个关键词组进行比对，得到关键词重合度；判断关键词重合度是否大于第二预设值，在确定关键词重合度大于第二预设值的情况下，生成控制指令。

进一步地，获取至少一个目标对象的语音信号，包括：获取与云服务器通信的家居设备上传的语音信号，其中，家居设备至少包括如下之一：空调、音箱、冰箱、照明设备。

进一步地，工作参数包括播放列表，方法还包括：记录电视已播放的媒体信息，生成播放记录；将播放记录上传至云服务器中。

进一步地，方法还包括：获取至少一个目标对象的原始语音信号，对原始语音信号依次进行麦克风阵列语音增强处理、滤波处理和降噪处理，得到语音信号。

根据本发明其中一实施例，还提供了一种家居设备的控制装置，包括：获取模块，用于获取至少一个目标对象的语音信号；提取模块，用于从语音信号中提取声纹特征，得到声纹特征信息；第一生成模块，用于在声纹特征信息包括至少两个不同目标对象的声纹特征的情况下，基于语音信号和多个声纹特征，生成多个交谈文本信息；第二生成模块，用于基于多个交谈文本信息，生成控制指令；控制模块，用于基于控制指令调整家居设备的工作参数。

根据本发明其中一实施例，还提供了一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，其中，计算机程序被设置为运行时执行前述任一项中的方法。

根据本发明其中一实施例，还提供了一种电子装置，包括存储器和处理器，存储器中存储有计算机程序，处理器被设置为运行时执行前述任一项中的方法。

应用本发明的技术方案，通过获取至少一个目标对象的语音信号，从语音信号中提取声纹特征得到声纹特征信息，并且在声纹特征信息包括至少两个不同目标对象的声纹特征的情况下，基于语音信号和多个声纹特征生成多个交谈文本信息，以及基于多个交谈文本信息生成控制指令，基于控制指令调整家居设备的工作参数，达到了使家居设备在检测到多个不同目标对象同时发声时能够根据目标对象的语音信号调整工作参数的目的，取得了提高家居设备的智能化程度的技术效果，解决了现有技术中的家居设备存在的当检测到多个目标对象对话时无法根据语音信号调整工作参数的问题。

附图说明

构成本申请的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明其中一实施例的家居设备的控制方法的计算机终端的硬件结构框图；

图2是根据本发明其中一可选实施例的家居设备的控制方法的流程图；

图3是根据本发明其中一可选实施例的家居设备的控制装置的模块示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本申请实施例所提供的方法实施例可以在计算机终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例，图1是本发明实施例的一种家居设备的控制方法的计算机终端的硬件结构框图。如图1所示，计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104，在一个示例性实施例中，上述计算机终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述计算机终端的结构造成限定。例如，计算机终端还可包括比图1中所示更多或者更少的组件，或者具有与图1所示等同功能或比图1所示功能更多的不同的配置。

存储器104可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的家居设备的控制方法对应的计算机程序，处理器102通过运行存储在存储器104内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(Network Interface Controller，简称为NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(Radio Frequency，简称为RF)模块，其用于通过无线方式与互联网进行通讯。

本实施例中提供了一种运行于上述计算机终端的家居设备的控制方法，图2是根据本发明其中一实施例的家居设备的控制方法的流程图，如图2所示，该流程包括如下步骤：

步骤S31，获取至少一个目标对象的语音信号；

可选地，使用麦克风组件以预设频率获取目标对象的语音信号。

步骤S32，从语音信号中提取声纹特征，得到声纹特征信息；

步骤S33，在声纹特征信息包括至少两个不同目标对象的声纹特征的情况下，基于语音信号和多个声纹特征，生成多个交谈文本信息；

声纹特征信息包括至少两个不同目标对象的声纹特征可以理解为家居设备获取的语音信号中至少有两个目标对象在发出声音。也就是说，首先判断声纹特征信息是否包括至少两个不同目标对象的声纹特征，在确定声纹特征信息包括至少两个不同目标对象的声纹特征的情况下，基于语音信号和多个声纹特征，生成多个交谈文本信息。

步骤S34，基于多个交谈文本信息，生成控制指令；

步骤S35，基于控制指令调整家居设备的工作参数，工作参数包括如下至少之一：显示参数、音频参数、运动参数。

通过上述步骤，通过获取至少一个目标对象的语音信号，从语音信号中提取声纹特征得到声纹特征信息，并且在声纹特征信息包括至少两个不同目标对象的声纹特征的情况下，基于语音信号和多个声纹特征生成多个交谈文本信息，以及基于多个交谈文本信息生成控制指令，基于控制指令调整家居设备的工作参数，达到了使家居设备在检测到多个不同目标对象同时发声时能够根据目标对象的语音信号调整工作参数的目的，取得了提高家居设备的智能化程度的技术效果，解决了现有技术中的家居设备存在的当检测到多个目标对象对话时无法根据语音信号调整工作参数的问题。

在一个示例性实施例中，工作参数包括显示参数、音频参数。当电视进行播放任务时，电视获取的语音信号中至少有两个目标对象在发出声音，基于多个交谈文本信息，生成控制指令，控制指令为降低显示参数、音频参数。

在另一个示例性实施例中，工作参数包括运动参数。当家居设备工作时，家居设备获取的语音信号中至少有两个目标对象在发出声音，基于多个交谈文本信息，生成控制指令，控制指令为调整家居设备的运动参数，以使家居设备实现对目标对象的追踪。进一步地，基于多个交谈文本信息生成控制指令包括：检测交谈文本信息中是否存在预设操作词，如“转向”、“面向”、“加速”、“移动”，当检测到交谈文本信息存在预设操作词时，获取目标对象的位置信息，基于预设操作词生成控制指令，控制指令用于改变家居设备的运动参数(如转动方向、转动参数)，以使家居设备实现追踪或避让发出语音信号的目标对象。

可选地，基于语音信号和多个声纹特征，生成多个交谈文本信息，包括：基于多种声纹特征，对语音信号进行分割，得到多个语音信号段；对多个语音信号段进行语义分析处理，得到多个交谈文本信息。

也就是说，各交谈文本信息对应的声纹特征不相同，即各交谈文本信息对应的语音信号的发出者为不同的目标对象。

举例来说，多个交谈文本信息包括第一交谈文本信息、第二交谈文本信息，当第一交谈文本信息包括预设关键词“飞机”、“火车”、“出行”，第二交谈文本信息包括预设关键词“飞机”、“票价”、“假期”时，计算关键词重合度为三分之一，当关键词重合度大于第二预设值(四分之一)时，家居设备生成降低音量控制指令。

可选地，家居设备可通过有线通信或无线通信的方式与云服务器进行通信，可通过将家居设备与云服务器的预设id关联的方式实现添加家居设备。

在一个可选地实施例中，家居设备为影音设备时，检测到当前存在多个目标对象发出声音时，记录电视已播放的媒体信息生成播放记录并将播放记录上传至云服务器中，以便目标对象交谈结束后从服务器查看播放记录，提高影音设备的智能化程度。

也就是说，获取至少一个目标对象的原始语音信号之后，应当对原始语音信号进行预处理，防止检测噪声等因素影响语音信号的声纹提取。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例的方法。

在本实施例中还提供了一种家居设备的控制装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图3是根据本发明其中一实施例的一种家居设备的控制装置的模块示意图，如图3所示，该装置包括：获取模块42，用于获取至少一个目标对象的语音信号；提取模块44，用于从语音信号中提取声纹特征，得到声纹特征信息；第一生成模块46，用于在声纹特征信息包括至少两个不同目标对象的声纹特征的情况下，基于多个声纹特征、语音信号，生成多个交谈文本信息；第二生成模块48，用于基于多个交谈文本信息，生成控制指令；控制模块50，用于基于控制指令调整家居设备的工作参数。

通过上述装置，通过获取至少一个目标对象的语音信号，从语音信号中提取声纹特征得到声纹特征信息，并且在声纹特征信息包括至少两个不同目标对象的声纹特征的情况下，基于多个声纹特征、语音信号生成多个交谈文本信息，以及基于多个交谈文本信息生成控制指令，基于控制指令调整家居设备的工作参数，达到了使家居设备在检测到多个不同目标对象同时发声时能够根据目标对象的语音信号调整工作参数的目的，取得了提高家居设备的智能化程度的技术效果，解决了现有技术中的家居设备存在的当检测到多个目标对象对话时无法根据语音信号调整工作参数的问题。

需要说明的是，上述各个模块是可以通过软件或硬件来实现的，对于后者，可以通过以下方式实现，但不限于此：上述模块均位于同一处理器中；或者，上述各个模块以任意组合的形式分别位于不同的处理器中。

本发明的实施例还提供了一种计算机可读存储介质，该存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的计算机程序：

S1，获取至少一个目标对象的语音信号；

S2，从语音信号中提取声纹特征，得到声纹特征信息；

S3，在声纹特征信息包括至少两个不同目标对象的声纹特征的情况下，基于语音信号和多个声纹特征，生成多个交谈文本信息；

S4，基于多个交谈文本信息，生成控制指令；

S5，基于控制指令调整家居设备的工作参数，工作参数包括如下至少之一：显示参数、音频参数、运动参数。

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(Read-Only Memory，简称为ROM)、随机存取存储器(Random Access Memory，简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

本发明的实施例还提供了一种电子装置，包括存储器和处理器，存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S1，获取至少一个目标对象的语音信号；

S2，从语音信号中提取声纹特征，得到声纹特征信息；

S4，基于多个交谈文本信息，生成控制指令；

在一个可选地实施例中，家居设备记录预设时间段内的交谈文本信息和控制指令，并打包作为历史数据上传至服务器中。

在另一个可选地实施例中，家居设备设置有图像采集装置，以预设频率采集图像信息，并识别图像信息中的目标对象，根据目标对象与家居设置时间的相对位置信息，生成控制指令以调整家居设备的运动参数。

可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种家居设备的控制方法，其特征在于，包括：

获取至少一个目标对象的语音信号；

从所述语音信号中提取声纹特征，得到声纹特征信息；

在所述声纹特征信息包括至少两个不同所述目标对象的所述声纹特征的情况下，基于所述语音信号和多个所述声纹特征，生成多个交谈文本信息；

基于多个所述交谈文本信息，生成控制指令；

基于所述控制指令调整家居设备的工作参数，所述工作参数包括如下至少之一：显示参数、音频参数、运动参数。

2.根据权利要求1所述的方法，其特征在于，基于所述语音信号和多个所述声纹特征，生成多个交谈文本信息，包括：

基于多种所述声纹特征，对所述语音信号进行分割，得到多个语音信号段；

对多个所述语音信号段进行语义分析处理，得到多个交谈文本信息。

3.根据权利要求1所述的方法，其特征在于，基于多个所述交谈文本信息，生成控制指令，包括：

将多个所述交谈文本信息进行比对，得到文本重合度；

判断所述文本重合度是否大于第一预设值，在确定所述文本重合度大于所述第一预设值的情况下，生成所述控制指令。

4.根据权利要求1所述的方法，其特征在于，基于多个所述交谈文本信息，生成控制指令，还包括：

分别提取多个所述交谈文本信息的关键词，得到多个关键词组；

将多个所述关键词组进行比对，得到关键词重合度；

判断所述关键词重合度是否大于第二预设值，在确定所述关键词重合度大于所述第二预设值的情况下，生成所述控制指令。

5.根据权利要求1所述的方法，其特征在于，获取至少一个目标对象的语音信号，包括：

获取与云服务器通信的家居设备上传的所述语音信号，其中，所述家居设备至少包括如下之一：空调、音箱、冰箱、照明设备。

6.根据权利要求5所述的方法，其特征在于，所述工作参数包括播放列表，所述方法还包括：

记录电视已播放的媒体信息，生成播放记录；

将所述播放记录上传至所述云服务器中。

7.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取至少一个所述目标对象的原始语音信号，对所述原始语音信号依次进行麦克风阵列语音增强处理、滤波处理和降噪处理，得到所述语音信号。

8.一种家居设备的控制装置，其特征在于，包括：

获取模块，用于获取至少一个目标对象的语音信号；

提取模块，用于从所述语音信号中提取声纹特征，得到声纹特征信息；

第一生成模块，用于在所述声纹特征信息包括至少两个不同所述目标对象的所述声纹特征的情况下，基于所述语音信号和多个所述声纹特征，生成多个交谈文本信息；

第二生成模块，用于基于多个所述交谈文本信息，生成控制指令；

控制模块，用于基于所述控制指令调整家居设备的工作参数。

9.一种计算机可读存储介质，其特征在于，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行所述权利要求1至7中任意一项所述的方法。

10.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器用于运行程序，其中，所述程序运行时执行权利要求1至7中任意一项所述的方法。