CN105654953B

CN105654953B - 语音控制方法以及系统

Info

Publication number: CN105654953B
Application number: CN201610164850.4A
Authority: CN
Inventors: 何伟旭
Original assignee: Midea Group Co Ltd
Current assignee: Midea Intelligent Lighting and Controls Technology Co Ltd
Priority date: 2016-03-22
Filing date: 2016-03-22
Publication date: 2019-05-17
Anticipated expiration: 2036-03-22
Also published as: CN105654953A

Abstract

本发明涉及家电技术领域，公开了一种语音控制方法以及系统，该方法包括：接收第一语音信号，其中第一语音信号包括用于标识第一语音信号的语言种类的标识词；根据标识词以及特征数据库中的语言种类集合确定接收到的第一语音信号的语言种类；根据确定的第一语音信号的语言种类在特征数据库中提取该语言种类对应的命令词集合；接收第二语音信号，其中第二语音信号包括控制设备执行操作的指令，以及第一语音信号的语言种类与第二语音信号的语言种类相同；以及根据第二语音信号和所提取的命令词集合控制设备执行操作。本发明能够实现自动识别来自用户的多语言种类的语音控制命令，提高了语音控制的智能化、全面化、自动化水平，用户体验更佳。

Description

语音控制方法以及系统

技术领域

本发明涉及家电技术领域，具体地，涉及一种语音控制方法以及一种语音控制系统。

背景技术

传统的家用设备(例如家用电器)通过遥控器和/或控制面板的按键进行人机交互。随着科技的发展，语音识别技术越来越多的应用于家用设备的控制，成为一种新的人机交互方式。

但是，目前语音控制技术只针对特定语种(例如标准普通话)进行识别，无法实现多语言种类(例如中国各地方言等)自动识别。现有的解决方案是需要用户手工选择所要识别的方言，例如一款在手机上运行的语音助手应用程序(APP)，可支持标准普通话、四川话、河南话、广东话等方言识别，但需要用户在设置菜单中选择所要识别的方言，不够智能、用户体验较差。即现有技术中缺少一种更智能、更全面、用户体验更佳的多语言种类自动识别的语音控制方法和/或系统。

发明内容

针对现有技术中存在的语音控制不能支持多语种自动识别的技术问题，本发明提供了一种语音控制方法，该方法包括：接收第一语音信号，其中所述第一语音信号包括用于标识所述第一语音信号的语言种类的标识词；根据所述标识词以及特征数据库中的语言种类集合确定接收到的第一语音信号的语言种类；根据所确定的所述第一语音信号的语言种类在特征数据库中提取该语言种类对应的命令词集合；接收第二语音信号，其中所述第二语音信号包括控制设备执行操作的指令，以及所述第一语音信号的语言种类与所述第二语音信号的语言种类相同；以及根据所述第二语音信号和所提取的命令词集合控制设备执行操作。

相应地，本发明还提供了一种语音控制系统，该系统包括：语音接收单元，用于接收第一语音信号和第二语音信号，其中所述第一语音信号包括用于标识所述第一语音信号的语言种类的标识词，所述第二语音信号包括控制设备执行操作的指令，以及所述第一语音信号的语言种类与所述第二语音信号的语言种类相同；语言种类识别单元，用于根据所述标识词以及特征数据库中的语言种类集合确定接收到的第一语音信号的语言种类；语言种类提取单元，用于根据所确定的所述第一语音信号的语言种类在特征数据库中提取该语言种类对应的命令词集合；控制单元，用于根据所述第二语音信号和所提取的命令词集合控制设备执行操作。

采用本发明提供的语音控制方法以及系统，通过接收包括用于标识所述第一语音信号的语言种类的标识词的第一语音信号，根据所述标识词以及特征数据库中的语言种类集合确定接收到的第一语音信号的语言种类，之后根据所确定的所述第一语音信号的语言种类在特征数据库中提取该语言种类对应的命令词集合，然后接收包括控制设备执行操作的指令的第二语音信号(所述第一语音信号的语言种类与所述第二语音信号的语言种类相同)，以及最后根据所述第二语音信号和所提取的命令词集合控制设备执行操作，能够实现自动识别来自用户的多语言种类的语音控制命令，提高了语音控制的智能化、全面化、自动化水平，用户体验更佳。

本发明的其它特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本发明的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本发明，但并不构成对本发明的限制。在附图中：

图1是根据本发明的一种实施方式的示例语音控制系统的结构示意图；

图2是根据本发明的一种实施方式的示例特征数据库的结构示意图；

图3是根据本发明的一种实施方式的示例语音控制系统执行的流程图；以及

图4是根据本发明的一种实施方式的示例语音控制方法的流程图。

附图标记说明

10 语音接收单元 20语言种类识别单元

30 语言种类提取单元 40控制单元

100语音控制系统

具体实施方式

以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本发明，并不用于限制本发明。

下面将举例说明本发明的思想，但应当理解的这些示例为非局限性示例，本发明的保护范围不限于此：

为了更加清楚地说明本发明的思想，以语音控制系统100为例进行详细地说明。图1是根据本发明的一种实施方式的示例语音控制系统的结构示意图，如图1所示，该系统可以包括：语音接收单元10，用于接收第一语音信号和第二语音信号，其中所述第一语音信号包括用于标识所述第一语音信号的语言种类的标识词，所述第二语音信号包括控制设备执行操作的指令，以及所述第一语音信号的语言种类与所述第二语音信号的语言种类相同；语言种类识别单元20，用于根据所述标识词以及特征数据库中的语言种类集合确定接收到的第一语音信号的语言种类；语言种类提取单元30，用于根据所确定的所述第一语音信号的语言种类在特征数据库中提取该语言种类对应的命令词集合；控制单元40，用于根据所述第二语音信号和所提取的命令词集合控制设备执行操作。

采用这样的实施方式，可以自动识别用户的命令的语言种类并执行该命令的对应操作，实现更加智能地、自动地、全面地人机交互，获得良好的用户体验。

具体来说，为了实现自动识别语言重种类，该系统100还可以包括特征数据库，图2是根据本发明的一种实施方式的示例特征数据库的结构示意图，如图2所示，该特征数据库可以包括语言种类集合A和多个命令词集合，所述语言种类集合A包括关于标识语音信号的语言种类的标识词的多个语言种类的特征数据，所述语言种类包括标准普通话以及中国各地方言(例如粤语、四川话、河南话、天津话、东北话等等)。例如，语言种类集合A可以包括a1、a2、a3…am…an，假设使用“美的空调”作为A集合中的标识词，则a1可以对应粤语发音“美的空调”的特征数据，a2可以对应标准普通话发音“美的空调”的特征数据，a3可以对应四川话发音“美的空调”的特征数据，a4可以对应河南话发音“美的空调”的特征数据等等。

多个命令词集合可以为命令词集合b1、b2、b3…bm…bn，其中的每一个命令词集合与A集合中的每一语言种类对应(如图2中箭头所示)，即每一个命令词集合包括控制设备执行操作的该语言种类的多个命令词的特征数据。例如，命令词集合b1可以是粤语发音“开机”、“关机”、“调高一度”、“调低一度”……等命令词的特征数据，命令词集合b2可以是标准普通话发音“开机”、“关机”、“调高一度”、“调低一度”……等命令词的特征数据，命令词集合b3可以是四川话发音“开机”、“关机”、“调高一度”、“调低一度”……等命令词的特征数据，命令词集合b4可以是河南话发音“开机”、“关机”、“调高一度”、“调低一度”……等命令词的特征数据。

配置好特征数据库后，系统即可以开始工作，以家用设备为例(例如空调)来描述详细人机交互过程，图3是根据本发明的一种实施方式的示例语音控制系统执行的流程图，如图3所示：

语音接收单元10首先可以接收第一语音信号，其中所述第一语音信号包括用于标识所述第一语音信号的语言种类的标识词。例如，第一语音信号可以是用户以粤语说出“美的空调”。其中所述语音接收单元10可以是任何适当地语音接收元件或设备，例如其可以是麦克风或者麦克风、放大器等的组合。

接着，语言种类识别单元20可以根据所述标识词以及特征数据库中的语言种类集合确定接收到的第一语音信号的语言种类。根据本发明的一种实施方式，语言种类识别单元20可以在所述标识词与所述语言种类集合中的一种语言种类的特征数据匹配的情况下，将所述特征数据库中该语言种类确定为所述第一语音信号的语言种类。例如，语言种类识别单元20可以确定用户所说的语言种类为粤语，即对应于特征数据库A集合中的a1，从而系统匹配到用户正在使用a1语言种类与空调进行语音交互。反之，如果匹配失败，则返回到标识词监听，重新确定语言种类。这里的具体语音识别过程与现有技术相似，为了不混淆本发明的保护范围，在此不再赘述。

在确定了用户的语言种类后，语言种类提取单元30可以根据所确定的所述第一语音信号的语言种类在特征数据库中提取该语言种类对应的命令词集合。例如，如图2所示，根据特征数据库A集合中的a1，在特征数据库中提取该语言种类对应的命令词集合b1。

接着，用户继续与空调进行交互，说出已经识别出的语言种类的命令词，即第二语音信号(所述第二语音信号包括控制设备执行操作的指令以及所述第一语音信号的语言种类与所述第二语音信号的语言种类相同)，例如用户说出的控制命令“开机”、“关机”、“调高一度”、“调低一度”……等命令词。语音接收单元10可以接收该第二语音信号。接着，控制单元40可以根据所述第二语音信号和所提取的命令词集合控制设备执行操作，具体地，在所述第二语音信号与所述命令词集合中的一个命令词的特征数据匹配的情况下，确定控制设备执行该命令词对应的操作。例如，将用户说出的命令词“开机”与命令词集合b1中发音特征数据进行匹配，在匹配到“开机”的情况下，控制单元可以控制设备(例如空调)执行“开机”操作。相反，如果匹配失败，则返回到命令词监听，重新确定命令词。对于用户说出的其他指令也进行相似地匹配过程，在此不再赘述。

此外，当系统在收到退出识别的命令后，可以重新进入A集标识词监听状态。退出识别命令可以是语音命令如“退出”、“再见”等。或者，当用户长时间没有进行语音交互时，例如超过预定阈值(该阈值可以根据实际情况进行预先设置)，系统可以自动退出识别状态进入A集标识词监听状态。

采用本发明提供的上述实施方式，能够实现自动识别来自用户的多语言种类的语音控制命令，提高了语音控制的智能化、全面化、自动化水平，用户体验更佳。

图4是根据本发明的一种实施方式的示例语音控制方法的流程图，如图4所示，该方法包括以下步骤：

步骤1001，接收第一语音信号，其中所述第一语音信号包括用于标识所述第一语音信号的语言种类的标识词；

步骤1002，根据所述标识词以及特征数据库中的语言种类集合确定接收到的第一语音信号的语言种类；

步骤1003，根据所确定的所述第一语音信号的语言种类在特征数据库中提取该语言种类对应的命令词集合；

步骤1004，接收第二语音信号，其中所述第二语音信号包括控制设备执行操作的指令，以及所述第一语音信号的语言种类与所述第二语音信号的语言种类相同；以及

步骤1005，根据所述第二语音信号和所提取的命令词集合控制设备执行操作。

优选地，所述语言种类集合包括关于所述标识词的多个语言种类的特征数据。

优选地，所述命令词集合包括控制设备执行操作的该语言种类的多个命令词的特征数据。

优选地，根据所述标识词以及特征数据库中的语言种类集合确定接收到的第一语音信号的语言种类包括：在所述标识词与所述语言种类集合中的一种语言种类的特征数据匹配的情况下，将所述特征数据库中该语言种类确定为所述第一语音信号的语言种类。

优选地，根据所述第二语音信号和所提取的命令词集合控制设备执行操作包括：在所述第二语音信号与所述命令词集合中的一个命令词的特征数据匹配的情况下，确定控制设备执行该命令词对应的操作。

优选地，所述语言种类包括标准普通话以及中国各地方言。

应当理解的是，上述语音控制方法的各个具体实施方式，均已在示例在语音控制系统的实施方式中做了详细地说明(如上所述)，在此不再赘述。并且，本领域技术人员可以根据本发明的公开选择上述各种实施方式中的任一者，或者选择上述各种实施方式的组合来进行配置，并且其他的替换实施方式也落入本发明的保护范围。

本发明所提供的语音控制方法以及系统可以应用于各种需要进行语音控制的设备(例如空调、烤箱、微波炉、电视、电风扇等的家用电器)，能够实现自动识别来自用户的多语言种类的语音控制命令，具有很高的智能性、人性化程度较高，满足了不同语言习惯的用户的需要，用户体验较佳。

以上结合附图详细描述了本发明的优选实施方式，但是，本发明并不限于上述实施方式中的具体细节，在本发明的技术构思范围内，可以对本发明的技术方案进行多种简单变型，这些简单变型均属于本发明的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，为了避免不必要的重复，本发明对各种可能的组合方式不再另行说明。

此外，本发明的各种不同的实施方式之间也可以进行任意组合，只要其不违背本发明的思想，其同样应当视为本发明所公开的内容。

Claims

1.一种语音控制方法，其特征在于，该方法包括：

接收第一语音信号，其中所述第一语音信号包括用于标识所述第一语音信号的语言种类的标识词；

根据所述标识词以及特征数据库中的语言种类集合确定接收到的第一语音信号的语言种类；

根据所确定的所述第一语音信号的语言种类在特征数据库中提取该语言种类对应的命令词集合；

接收第二语音信号，其中所述第二语音信号包括控制设备执行操作的指令，以及所述第一语音信号的语言种类与所述第二语音信号的语言种类相同；以及

根据所述第二语音信号和所提取的命令词集合控制设备执行操作。

2.根据权利要求1所述的方法，其特征在于，所述语言种类集合包括关于所述标识词的多个语言种类的特征数据。

3.根据权利要求1所述的方法，其特征在于，所述命令词集合包括控制设备执行操作的该语言种类的多个命令词的特征数据。

4.根据权利要求2所述的方法，其特征在于，根据所述标识词以及特征数据库中的语言种类集合确定接收到的第一语音信号的语言种类包括：在所述标识词与所述语言种类集合中的一种语言种类的特征数据匹配的情况下，将所述特征数据库中该语言种类确定为所述第一语音信号的语言种类。

5.根据权利要求3所述的方法，其特征在于，根据所述第二语音信号和所提取的命令词集合控制设备执行操作包括：在所述第二语音信号与所述命令词集合中的一个命令词的特征数据匹配的情况下，确定控制设备执行该命令词对应的操作。

6.根据权利要求1-5中任一项权利要求所述的方法，其特征在于，所述语言种类包括标准普通话以及中国各地方言。

7.一种语音控制系统，其特征在于，该系统包括：

语音接收单元，用于接收第一语音信号和第二语音信号，其中所述第一语音信号包括用于标识所述第一语音信号的语言种类的标识词，所述第二语音信号包括控制设备执行操作的指令，以及所述第一语音信号的语言种类与所述第二语音信号的语言种类相同；

语言种类识别单元，用于根据所述标识词以及特征数据库中的语言种类集合确定接收到的第一语音信号的语言种类；

语言种类提取单元，用于根据所确定的所述第一语音信号的语言种类在特征数据库中提取该语言种类对应的命令词集合；

控制单元，用于根据所述第二语音信号和所提取的命令词集合控制设备执行操作。

8.根据权利要求7所述的系统，其特征在于，该系统还包括特征数据库，该特征数据库包括语言种类集合和多个命令词集合，所述语言种类集合包括关于所述标识词的多个语言种类的特征数据，所述命令词集合包括控制设备执行操作的该语言种类的多个命令词的特征数据。

9.根据权利要求8所述的系统，其特征在于，所述语言种类识别单元还用于：在所述标识词与所述语言种类集合中的一种语言种类的特征数据匹配的情况下，将所述特征数据库中该语言种类确定为所述第一语音信号的语言种类。

10.根据权利要求8所述的系统，其特征在于，所述控制单元还用于：在所述第二语音信号与所述命令词集合中的一个命令词的特征数据匹配的情况下，确定控制设备执行该命令词对应的操作。

11.根据权利要求7-10中任一项权利要求所述的系统，其特征在于，所述语言种类包括标准普通话以及中国各地方言。