CN109065056A

CN109065056A - 一种语音控制空调的方法及装置

Info

Publication number: CN109065056A
Application number: CN201811122566.6A
Authority: CN
Inventors: 张新; 王慧君; 董明珠; 廖海霖; 毛跃辉; 刘健军; 廖湖锋
Original assignee: Gree Electric Appliances Inc of Zhuhai
Current assignee: Gree Electric Appliances Inc of Zhuhai
Priority date: 2018-09-26
Filing date: 2018-09-26
Publication date: 2018-12-21
Anticipated expiration: 2038-09-26
Also published as: CN109065056B

Abstract

本发明提供一种语音控制空调的方法及装置，用于提高空调语音识别的准确性，提高用户语音控制空调的体验度。方法包括：接收至少一个用户中每个用户录入的至少一段语音信息；为所述每个用户创建对应的语音库；接收第一用户录入第一语音信息；根据所述第一语音信息确定所述第一用户的声纹特征数据，并根据所述第一用户的声纹特征数据确定是否存在所述第一用户对应的语音库；若存在，则根据所述第一用户对应的语音库获得所述第一语音信息对应的控制指令；否则，解析所述第一语音信息，获得所述第一语音信息对应的控制指令。

Description

一种语音控制空调的方法及装置

技术领域

本发明涉及智能家居领域，特别涉及一种语音控制空调的方法及装置。

背景技术

近年来，语音识别技术不断在智能家居领域被应用，比如用户可以通过语音来控制空调按照指定功能运行。但是，目前语音识别的准确性却始终不如人意，这是因为不同用户在说话时的停顿、节奏、旋律等不同，导致空调经常误识别，无法正确响应用户的语音命令。

发明内容

本发明实施例提供一种语音控制空调的方法及装置，用于提高空调语音识别的准确性，提高用户语音控制空调的体验度。

第一方面，本发明实施例提供一种语音控制空调的方法，包括：

接收至少一个用户中每个用户录入的至少一段语音信息，所述至少一段语音信息中的每段语音信息对应于控制空调的一个控制指令；

为所述每个用户创建对应的语音库；所述每个用户对应的语音库中存储有该用户录入的至少一段语音信息、该用户录入的至少一段语音信息中每段语音信息对应的控制指令以及该用户的声纹特征数据；

接收第一用户录入第一语音信息；根据所述第一语音信息确定所述第一用户的声纹特征数据，并根据所述第一用户的声纹特征数据确定是否存在所述第一用户对应的语音库；

若存在，则根据所述第一用户对应的语音库获得所述第一语音信息对应的控制指令；

否则，解析所述第一语音信息，获得所述第一语音信息对应的控制指令。

在本实施方式中，预先为至少一个用户中每个用户建立对应的语音库，每个用户的语音库中保存有该用户对应的语音特征数据，在收到任一用户输入的语音信息后，首先根据该用户输入的语音信息确定该用户的声纹特征，然后基于该用户的声纹特征确定是否存在该用户对应的语音库，若存在，则直接根据该用户对应的语音库获得对应的控制指令，若不存在，再解析该用户输入的语音信息获得对应的控制指令。通过预先为不同的用户建立不同的语音库的方式，使得在识别用户语音信息时，可根据该用户的声纹特征确定该用户的语音库并基于确定出的语音库对该用户的语音信息进行识别，有效提高空调语音识别的准确性和效率，进而提高用户语音控制空调的体验度。

可选的，为所述每个用户创建对应的语音库，包括：

在所述每个用户对应的语音库中将该用户录入的至少一段语音信息中的每段语音信息与所述每段语音信息对应的控制指令进行关联地存储；以及

对所述每个用户录入的至少一段语音信息进行声纹预处理及特征提取处理，得到该用户的声纹特征数据，在该用户对应的语音库中存储该用户的声纹特征数据。

本实施方式，通过在语音库中存储用户的声纹特征数据以及在语音库中将语音信息与控制指令进行关联地存储，使得在识别用户输入的语音信息时可以根据该用户的声纹特征迅速地确定出该用户对应的语音库，然后在该用户对应的语音库中迅速地确定出与该用户输入的语音信息对应的控制指令，有效提高空调语音识别的准确性和效率，提高用户语音控制空调的体验度。

可选的，根据所述第一用户对应的语音库获得所述第一语音信息对应的控制指令，包括：

判断所述第一用户对应的语音库中是否存储有所述第一语音信息；若为是，则从所述第一用户对应的语音库筛选出所述第一语音信息对应的控制指令；否则，解析所述第一语音信息，获得所述第一语音信息对应的控制指令。

本实施方式，如果第一用户对应的语音库中存储有第一语音信息，则从第一用户对应的语音库筛选出第一语音信息对应的控制指令，如果第一用户对应的语音库中存储没有第一语音信息，则解析第一语音信息获得对应的控制指令，保证了空调语音识别的可靠性。

可选的，在获得所述第一语音信息对应的控制指令之后，还包括：

将所述第一语音信息对应的控制指令发送给所述空调，以使所述空调执行所述第一语音信息对应的控制指令。

通过本实施方式，可以有效提高空调语音识别的准确性和效率，提高用户语音控制空调的体验度。

可选的，在将所述第一语音信息对应的控制指令发送给所述空调之后，还包括：

在确定所述空调执行所述第一语音信息对应的控制指令失败后，将所述第一语音信息对应的控制指令呈现在UI上，并播放所述第一语音信息；

接收用户输入的校正信息，基于所述校正信息校正所述第一语音信息对应的控制指令，并将所述第一语音信息以及校正后的控制指令关联地存储到所述第一用户对应的错词库中；

当再次接收到所述第一用户录入的第一语音信息时，根据所述第一用户对应的错词库获得所述第一语音信息对应的控制指令。

本实施方式，通过判断语音信息对应的控制指令是否被空调成功执行确定语音识别是否准确，并对误识别的语音信息进行记录和校正，进一步提高语音识别的准确性，提高用户语音控制空调的体验度。

在确定所述空调执行所述第一语音信息对应的控制指令失败时，在错词库中保存所述第一语音信息预定期限；

在确定所述预定期限内所述空调执行所述第一语音信息对应的控制指令失败的次数达到预设次数时，将所述第一语音信息对应的控制指令呈现在UI上，并播放所述第一语音信息；

本实施方式，通过判断语音信息对应的控制指令是否被空调成功执行确定语音识别是否准确，对误识别的语音信息进行记录，在同一语音信息在预设期限内多次被误识别时，对其进行校正，进一步提高语音识别的准确性，提高用户语音控制空调的体验度。

可选的，在解析所述第一语音信息，获得所述第一语音信息对应的控制指令之后，还包括：

在确定所述空调执行所述第一语音信息对应的控制指令成功时，将所述第一语音信息以及解析获得的控制指令关联地存储到所述第一用户对应的语音库中。

本实施方式，可以自动对语音库缺少的语音信息和控制指令进行补充，进一步提高空调语音识别的准确性和效率，提高用户语音控制空调的体验度。

第二方面，本发明实施例提供一种语音控制空调的装置，包括：

接收单元，用于接收至少一个用户中每个用户录入的至少一段语音信息，所述至少一段语音信息中的每段语音信息对应于控制空调的一个控制指令；

处理单元，用于为所述每个用户创建对应的语音库；所述每个用户对应的语音库中存储有该用户录入的至少一段语音信息、该用户录入的至少一段语音信息中每段语音信息对应的控制指令以及该用户的声纹特征数据；

所述接收单元还用于：接收第一用户录入第一语音信息；

所述处理单元还用于：根据所述第一语音信息确定所述第一用户的声纹特征数据，并根据所述第一用户的声纹特征数据确定是否存在所述第一用户对应的语音库；若存在，则根据所述第一用户对应的语音库获得所述第一语音信息对应的控制指令；否则，解析所述第一语音信息，获得所述第一语音信息对应的控制指令。

可选的，所述处理单元具体用于：

可选的，所述装置还包括：

发送单元，用于在所述处理单元获得所述第一语音信息对应的控制指令之后，将所述第一语音信息对应的控制指令发送给所述空调，以使所述空调执行所述第一语音信息对应的控制指令。

可选的，所述处理单元还用于：

在所述发送单元将所述第一语音信息对应的控制指令发送给所述空调之后，在确定所述空调执行所述第一语音信息对应的控制指令失败后，将所述第一语音信息对应的控制指令呈现在UI上，并播放所述第一语音信息；

所述接收单元还用于：接收用户输入的校正信息；

所述处理单元还用于：基于所述校正信息校正所述第一语音信息对应的控制指令，并将所述第一语音信息以及校正后的控制指令关联地存储到所述第一用户对应的错词库中；当所述接收单元再次接收到所述第一用户录入的第一语音信息时，根据所述第一用户对应的错词库获得所述第一语音信息对应的控制指令。

可选的，所述处理单元还用于：

在所述发送单元将所述第一语音信息对应的控制指令发送给所述空调之后，在确定所述空调执行所述第一语音信息对应的控制指令失败时，在错词库中保存所述第一语音信息预定期限；在确定所述预定期限内所述空调执行所述第一语音信息对应的控制指令失败的次数达到预设次数时，将所述第一语音信息对应的控制指令呈现在UI上，并播放所述第一语音信息；

所述接收单元还用于：接收用户输入的校正信息；

可选的，所述处理单元还用于：

在解析所述第一语音信息，获得所述第一语音信息对应的控制指令之后，在确定所述空调执行所述第一语音信息对应的控制指令成功时，将所述第一语音信息以及解析获得的控制指令关联地存储到所述第一用户对应的语音库中。

第三方面，本发明实施例提供一种语音控制空调的装置，包括：

存储器，用于存储计算机指令；

通信接口，用于与网络设备进行通信；

处理器，与所述存储器以及所述通信接口通信连接，用于执行所述存储器中的计算机指令，以在执行所述计算机指令时执行本发明实施例第一方面所述的方法。

第四方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，当所述计算机指令在计算机上运行时，使得计算机执行本发明实施例第一方面所述的方法。

本发明实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

预先为至少一个用户中每个用户建立对应的语音库，每个用户的语音库中保存有该用户对应的语音特征数据，在收到任一用户输入的语音信息后，首先根据该用户输入的语音信息确定该用户的声纹特征，然后基于该用户的声纹特征确定是否存在该用户对应的语音库，若存在，则直接根据该用户对应的语音库获得对应的控制指令，若不存在，再解析该用户输入的语音信息获得对应的控制指令。通过预先为不同的用户建立不同的语音库的方式，使得在识别用户语音信息时，可根据该用户的声纹特征确定该用户的语音库并基于确定出的语音库对该用户的语音信息进行识别，有效提高空调语音识别的准确性和效率，进而提高用户语音控制空调的体验度。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例中一种可能的应用场景示意图；

图2为本发明实施例中语音控制空调的方法的流程图；

图3为本发明实施例中语音控制空调的装置的结构示意图；

图4为本发明实施例中语音控制空调的装置的结构示意图。

具体实施方式

下面通过附图以及具体实施例对本发明技术方案做详细的说明，应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明，而不是对本发明技术方案的限定，在不冲突的情况下，本发明实施例以及实施例中的技术特征可以相互组合。

需要理解的是，在本发明实施例的描述中，“第一”、“第二”等词汇，仅用于区分描述的目的，而不能理解为指示或暗示相对重要性，也不能理解为指示或暗示顺序。在本发明实施例的描述中“多个”，是指两个或两个以上。

本发明实施例中的术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

其中，执行该语音控制空调的方法的设备可以是服务器、空调、手机、电脑、可穿戴式设备、音/视频播放设备等任何具有计算能力的电子设备，或者多个这样的电子设备组成的电子设备系统，本发明实施例不做具体限制。例如，图1为该语音控制空调的方法的一种可能的应用场景，其中服务器为执行该语音控制空调的方法的设备，移动设备为语音输入设备，移动设备在收到用户输入的语音信息后将收到的语音信息发送给服务器。当然，此处只是一种举例，本发明实施例对该语音控制空调的方法具体应用场景不做限制。

下面以执行主体为图1所示的服务器为例，对本发明实施例提供的语音控制空调的方法做详细的说明。参照图2，该方法具体包括：

S11：接收至少一个用户中每个用户录入的至少一段语音信息；

该至少一段语音信息中的每段语音信息对应于控制空调的一个控制指令，控制指令用于被空调执行以实现预设的功能。

服务器接收来自移动终端发送的至少一个用户中每个用户录入的至少一段语音信息。移动终端上安装有控制空调的应用程序(Application，APP)，用户在安静环境下，打开APP，按照预设的次序依次录入控制指令对应的语音信息。下表为对控制指令的举例：

S12：为所述每个用户创建对应的语音库；

具体的，服务器在接收到移动终端发送的语音信息后，对每个用户录入的语音信息进行声纹预处理及特征提取处理，得到每个用户的声纹特征数据；根据声纹特征区分不同用户的语音信息，为每个用户创建对应的语音库；在每个用户对应的语音库中存储该用户的声纹特征数据，并将该用户录入的每段语音信息与每段语音信息对应的控制指令进行关联地存储。在此过程中，还可以为每个用户对应的语音库创建相应的用户标识，该用户标识可以是用户通过APP自定义的，也可以是服务器自动生成的，本发明实施例不做具体限制。

S13：接收第一用户录入第一语音信息；根据所述第一语音信息确定所述第一用户的声纹特征数据；

具体的，对第一语音信息进行声纹预处理及特征提取处理，得到第一用户的声纹特征数据。

S14：根据所述第一用户的声纹特征数据确定是否存在所述第一用户对应的语音库；若存在，则执行S15；否则，执行S16；

具体的，将第一用户的声纹特征数据与所有语音库中的声纹数据进行比较，确定出相似度满足阈值的语音库作为第一用户对应的语音库，若不存在相似度满足阈值的语音库，则确定不存在与第一用户对应的语音库。

S15：根据所述第一用户对应的语音库获得所述第一语音信息对应的控制指令；

具体的，判断第一用户对应的语音库中是否存储有第一语音信息；若为是，则从第一用户对应的语音库筛选出第一语音信息对应的控制指令；否则，解析第一语音信息，获得第一语音信息对应的控制指令。

S16：解析所述第一语音信息，获得所述第一语音信息对应的控制指令。

在这种情况下，在获得第一语音信息对应的控制指令之后，如果确定空调成功执行第一语音信息对应的控制指令，还可以进一步将第一语音信息以及解析获得的控制指令关联地存储到第一用户对应的语音库中，当再次接收到第一语音信息后，可直接根据语音库获得第一语音信息对应的控制指令。

在本发明实施例中，在服务器中预先为至少一个用户中每个用户建立对应的语音库，每个用户的语音库中保存有该用户对应的语音特征数据，在收到任一用户输入的语音信息后，首先根据该用户输入的语音信息确定该用户的声纹特征，然后基于该用户的声纹特征确定是否存在该用户对应的语音库，若存在，则直接根据该用户对应的语音库获得对应的控制指令，若不存在，再解析该用户输入的语音信息获得对应的控制指令。通过预先为不同的用户建立不同的语音库的方式，使得在识别用户语音信息时，可根据该用户的声纹特征确定该用户的语音库并基于确定出的语音库对该用户的语音信息进行识别，有效提高空调语音识别的准确性和效率，进而提高用户语音控制空调的体验度。

进一步的，为了进一步提高语音识别的准确性，还可以通过判断语音信息对应的控制指令是否被空调成功执行确定语音识别是否准确，并对误识别的语音信息进行记录和校正。

以上述第一语音信息为例：服务器在获得第一语音信息对应的控制指令之后，将第一语音信息对应的控制指令发送给空调，以使空调执行第一语音信息对应的控制指令；当空调执行第一语音信息对应的控制指令失败后，将执行失败的控制指令和第一语音信息发送用户终端，显示在APP的用户界面(User Interface，UI)上，用户听取第一语音信息，输入校正信息对第一语音信息对应的控制指令进行校正；服务器根据用户输入的校正信息校正第一语音信息对应的控制指令，将第一语音信息以及校正后的控制指令关联地存储到第一用户对应的错词库中，当再次接收到第一用户录入的第一语音信息时，根据第一用户对应的错词库获得第一语音信息对应的控制指令。

在具体实施过程中，为了节省服务器的功耗，保证服务器的运行效率，可以在同一语音信息在预设期限内多次被误识别时，再对其进行校正。

仍以上述第一语音信息为例：服务器在确定空调执行第一语音信息对应的控制指令失败时，在错词库中保存第一语音信息预定期限；在确定预定期限内空调执行第一语音信息对应的控制指令失败的次数达到预设次数时，将第一语音信息对应的控制指令呈现在UI上，并播放第一语音信息；接收用户输入的校正信息，基于校正信息校正第一语音信息对应的控制指令，并将第一语音信息以及校正后的控制指令关联地存储到第一用户对应的错词库中；当再次接收到第一用户录入的第一语音信息时，根据第一用户对应的错词库获得第一语音信息对应的控制指令。

在本发明实施例中，通过判断语音信息对应的控制指令是否被空调成功执行确定语音识别是否准确，并对误识别的语音信息进行记录和校正，进一步提高语音识别的准确性，提高用户语音控制空调的体验度。

基于同一发明构思，本发明实施例还提供一种语音控制空调的装置，参照图3，包括：

接收单元21，用于接收至少一个用户中每个用户录入的至少一段语音信息，所述至少一段语音信息中的每段语音信息对应于控制空调的一个控制指令；

处理单元22，用于为所述每个用户创建对应的语音库；所述每个用户对应的语音库中存储有该用户录入的至少一段语音信息、该用户录入的至少一段语音信息中每段语音信息对应的控制指令以及该用户的声纹特征数据；

所述接收单元21还用于：接收第一用户录入第一语音信息；

所述处理单元22还用于：根据所述第一语音信息确定所述第一用户的声纹特征数据，并根据所述第一用户的声纹特征数据确定是否存在所述第一用户对应的语音库；若存在，则根据所述第一用户对应的语音库获得所述第一语音信息对应的控制指令；否则，解析所述第一语音信息，获得所述第一语音信息对应的控制指令。

可选的，所述处理单元22具体用于：

可选的，所述装置还包括：

发送单元，用于在所述处理单元22获得所述第一语音信息对应的控制指令之后，将所述第一语音信息对应的控制指令发送给所述空调，以使所述空调执行所述第一语音信息对应的控制指令。

可选的，所述处理单元22还用于：

所述接收单元21还用于：接收用户输入的校正信息；

所述处理单元22还用于：基于所述校正信息校正所述第一语音信息对应的控制指令，并将所述第一语音信息以及校正后的控制指令关联地存储到所述第一用户对应的错词库中；当所述接收单元21再次接收到所述第一用户录入的第一语音信息时，根据所述第一用户对应的错词库获得所述第一语音信息对应的控制指令。

可选的，所述处理单元22还用于：

所述接收单元21还用于：接收用户输入的校正信息；

可选的，所述处理单元22还用于：

基于同一发明构思，本发明实施例还提供一种语音控制空调的装置，参照图4，包括：

存储器31，用于存储计算机指令；

通信接口32，用于与网络设备进行通信；

处理器33，与所述存储器31以及所述通信接口32通信连接，用于执行所述存储器31中的计算机指令，以在执行所述计算机指令时执行本发明实施例所述的方法。

基于同一发明构思，本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，当所述计算机指令在计算机上运行时，使得计算机执行本发明实施例所述的方法。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种语音控制空调的方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，为所述每个用户创建对应的语音库，包括：

3.如权利要求1所述的方法，其特征在于，根据所述第一用户对应的语音库获得所述第一语音信息对应的控制指令，包括：

4.如权利要求1-3任一项所述的方法，其特征在于，在获得所述第一语音信息对应的控制指令之后，还包括：

5.如权利要求4所述的方法，其特征在于，在将所述第一语音信息对应的控制指令发送给所述空调之后，还包括：

在确定所述空调执行所述第一语音信息对应的控制指令失败后，将所述第一语音信息对应的控制指令呈现在用户界面UI上，并播放所述第一语音信息；

6.如权利要求4所述的方法，其特征在于，在将所述第一语音信息对应的控制指令发送给所述空调之后，还包括：

7.如权利要求1所述的方法，其特征在于，在解析所述第一语音信息，获得所述第一语音信息对应的控制指令之后，还包括：

8.一种语音控制空调的装置，其特征在于，包括：

所述接收单元还用于：接收第一用户录入第一语音信息；

9.如权利要求8所述的装置，其特征在于，所述处理单元具体用于：

10.如权利要求8所述的装置，其特征在于，所述处理单元具体用于：

11.如权利要求8-10任一项所述的装置，其特征在于，所述装置还包括：

12.如权利要求11所述的装置，其特征在于，所述处理单元还用于：

所述接收单元还用于：接收用户输入的校正信息；

13.如权利要求11所述的装置，其特征在于，所述处理单元还用于：

在所述发送单元将所述第一语音信息对应的控制指令发送给所述空调之后，

在确定所述空调执行所述第一语音信息对应的控制指令失败时，在错词库中保存所述第一语音信息预定期限；在确定所述预定期限内所述空调执行所述第一语音信息对应的控制指令失败的次数达到预设次数时，将所述第一语音信息对应的控制指令呈现在UI上，并播放所述第一语音信息；

所述接收单元还用于：接收用户输入的校正信息；

14.如权利要求8所述的装置，其特征在于，所述处理单元还用于：

15.一种语音控制空调的装置，其特征在于，包括：

存储器，用于存储计算机指令；

通信接口，用于与网络设备进行通信；

处理器，与所述存储器以及所述通信接口通信连接，用于执行所述存储器中的计算机指令，以在执行所述计算机指令时执行如权利要求1至7中任一项所述的方法。

16.一种计算机可读存储介质，其特征在于：

所述计算机可读存储介质存储有计算机指令，当所述计算机指令在计算机上运行时，使得计算机执行如权利要求1至7中任一项所述的方法。