WO2022141990A1

WO2022141990A1 - 家电设备及其语音控制方法、语音装置、计算机存储介质

Info

Publication number: WO2022141990A1
Application number: PCT/CN2021/090041
Authority: WO
Inventors: 颜林; 霍伟明; 张新健; 徐浩; 席红艳; 陈柏仰
Original assignee: 广东美的制冷设备有限公司; 美的集团股份有限公司
Priority date: 2020-12-31
Filing date: 2021-04-26
Publication date: 2022-07-07
Also published as: CN112820290A

Abstract

一种家电设备的语音控制方法，通过语音装置对家电设备进行语音控制，包括：接收语音唤醒指令，并根据语音唤醒指令唤醒语音装置（S110）；采集并识别周边环境的语音信息，并在识别到语音指令时，根据语音指令的类型进行语音模式切换(S120)。还公开了一种家电设备、语音装置及计算机存储介质。

Description

家电设备及其语音控制方法、语音装置、计算机存储介质

本申请要求于2020年12月31日申请的、申请号为202011645138.9 的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及家电设备领域，尤其涉及家电设备及其语音控制方法、语音装置、计算机存储介质。

背景技术

随着家电设备的智能化发展，人们对家电设备的智能化要求也越来越高，例如通过语音控制家电设备，人们希望与家电设备之间的语音交流能更顺畅，甚至达到人与人之间的自然交流。

但是目前家电设备的语音控制技术在语音交互的流畅度方面仍有待提升。

技术问题

本申请实施例通过提供一种家电设备及其语音控制方法、语音装置、计算机存储介质，解决了现有技术中家电设备的语音交互的流畅度的技术问题。

技术解决方案

本申请实施例提供了一种家电设备的语音控制方法，通过语音装置对家电设备进行语音控制；所述语音控制方法包括以下步骤：

接收语音唤醒指令，并根据所述语音唤醒指令唤醒所述语音装置；

采集并识别周边环境的语音信息，并在识别到语音指令时，根据语音指令的类型进行语音模式切换；所述语音模式包括全双工模式和非全双工模式。

本申请一实施例中，所述采集并识别周边环境的语音信息包括：

按当前的语音模式拾取周边的环境语音，并对拾取到的环境语音进行处理，获得语音特征信息；

将获得的语音特征信息与语音指令的类型对应的语音特征信息进行匹配，并根据匹配结果判断所述环境语音的语音指令的类型。

本申请一实施例中，在对拾取到的环境语音进行语音识别之前，还包括：

对采集到的环境语音进行分段处理，同时对分段后的环境语音进行语音识别。

本申请一实施例中，所述语音控制方法还包括：

若一预置时间内未识别到语音指令，则退出当前语音模式，并退出唤醒状态。

本申请一实施例中，所述语音控制方法还包括：

非全双工模式下，控制家电设备执行识别到的语音指令，并根据非全双工模式的类型确定是否退出唤醒状态。

本申请一实施例中，所述语音控制方法还包括：

接收到移动终端发送的进入全双工模式的指令时，进入全双工模式。

本申请一实施例中，所述语音控制方法还包括：

若拾取到的环境语音被识别为语音指令时，则停止当前的语音播报，并控制所述家电设备执行所述语音控制指令。

本申请实施例还提供一种语音装置，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现上述实施例的语音控制方法的步骤，对家电设备进行语音控制。

本申请实施例还提供一种家电设备，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现上述实施例的语音控制方法的步骤，对家电设备的进行语音控制。

本申请实施例还提供一种计算机存储介质，所述可读存储介质上存储有语音控制应用程序，所述语音控制应用程序被处理器执行实现上述任一种实施方式的家电设备的语音控制方法的步骤，实现对家电设备的语音控制。

有益效果

本申请实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

（1）本申请实施例根据发出的语音类型进行全双工模式和非全双工模式的自动切换，既满足了不同的使用场景的需求，又实现了模式的简单切换，使得语音控制更加顺畅；

（2）通过全双工语音模式中，语音拾取功能和语音播报功能并行工作，使得使用者对家电设备的语音控制更加顺畅，而且可以根据个人情况打断语音播报而进行语音控制，使得语音控制操作更加简单快捷且灵活；

（3）通过本申请实施例的语音处理，实现了语音边采集边识别，不但可以快速识别到语音控制指令，并打断当前语音播报，从而避免了噪声的误打断而且可以及时获知使用者的意图，提升了语音识别效率；

（4）本申请实施例中，通过对采集到的语音信息进行分段处理，从而可以提前对分好段的语音信息进行语音识别，从而提升了语音识别效率；

（5）通过语音控制的时间设置，既能实现有效的语音控制，又避免了使用者的隐私安全。

附图说明

图1是本申请一实施例的家电设备的语音控制方法的流程示意图；

图2是本申请实施例中进入全双工模式时语音拾取功能和语音播报功能的工作示例图；

图3是本申请一实施例的家电设备的语音控制方法中，对采集的环境语音进行语音识别的细化流程示意图；

图4是本申请实施例中进入全双工模式时语音拾取功能和语音播报功能的工作示例图；

图5是本申请实施例的语音控制方法的一应用示例；

图6是本申请实施例的语音控制方法的一应用示例。

本发明的实施方式

为了更好的理解上述技术方案，下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例，然而应当理解，可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本申请，并且能够将本申请的范围完整的传达给本领域的技术人员。

现有技术中对家电设备的语音控制时，需要使用者说出符合要求的唤醒词，例如“天猫精灵”、“小爱同学”等，将家电设备唤醒，才能对家电设备进行语音控制，例如“打开空调”、“播放歌曲”等。这种语音控制可以精准实现语音控制，但是只能发出一次语音控制指令，如需再次发出语音控制指令，例如调节空调温度等，则需要将家电设备再次唤醒，如此使得语音控制操作繁琐。对此，现有技术中出现新的语音控制模式，即家电设备在被唤醒后，进行交替式地语音拾取以及语音播报，因此家电设备被唤醒后，不再需要重复唤醒，而是在语音播报结束后发出新的语音控制指令即可继续语音控制家电设备。该语音控制方式比前一种语音控制方式，解决了家电设备多次唤醒的问题，但是在语音控制的流畅度上仍有待提升。

本申请技术方案主要提供一种家电设备的语音控制方案，该语音控制方案中包括全双工模式和非全双工模式，其中全双工模式中，家电设备的语音拾取和语音播报能并行工作，就像人与人之间的自然对话，使得对家电设备的语音控制更加顺畅；而且使用者还可以根据情况打断语音播报，进行语音控制，如此使得对家电设备的语音控制更加简便快捷且灵活。另外，根据发出的语音类型进行全双工模式和非全双工模式的自动切换，既满足了不同的使用场景的需求，又实现了模式的简单切换，使得语音控制更加顺畅。

如图1所示，图1是本申请一实施例的家电设备的语音控制方法的流程示意图。该实施例中的家电设备的语音控制方法包括以下步骤：

步骤S110，接收语音唤醒指令，并根据所述语音唤醒指令唤醒所述语音装置；

步骤S120，采集并识别周边环境的语音信息，并在识别到语音指令时，根据语音指令的类型进行语音模式切换。

上述步骤S110的语音唤醒指令可以包括默认设置的唤醒词，例如“小美小美”，当然也可以通过家电设备的控制终端进行唤醒词的个性化设置。上述语音装置可以为设置于家电设备上的一功能组件；也可以为独立于家电设备的一语音设备，实现语音拾取功能和语音播报功能，当然还具有网络通信功能，例如与家电设备网络进行通信，将采集到的语音信息进行语音识别并转换为语音指令后，发给家电设备，实现对家电设备的语音控制。

步骤S120中，语音模式包括全双工模式和非全双工模式，根据不同的语音指令进入对应的语音模式。其中，全双工模式为根据人与人之间的持续对话的特点而设置，语音装置能同时进行语音拾取和语音播报，因此全双工模式中，使用者只需要唤醒一次，即可持续地发出语音指令，同时也能进行语音播报，反馈指令执行的结果。例如语音装置包括语音拾取模块和语音播报模块两个功能模块，且该两个功能模块独立运行，互不干涉。通过语音拾取模块和语音播报模块使得语音装置实现一边采集周围环境中的语音，一边播报需要播报的语音内容。

如图2所示，图2是本申请实施例中进入全双工模式时语音拾取功能和语音播报功能的工作示例图。语音拾取模块采集并识别到语音唤醒指令后，确定是否进入全双工模式，当进入全双工模式的条件满足后，则确定进入全双工模式，该全双工模式中，语音拾取功能和语音播报功能均处于工作状态。图2中，语音拾取模块采集并识别到语音控制指令1时，控制家电设备执行该语音控制指令1，随后语音播报模块将执行结果或执行状态进行语音播报。在语音播报模块进行语音播报的同时，语音拾取模块可以采集周边环境的语音信息，即语音拾取功能和语音播报功能并不冲突，两者可以同时运行。

非全双工模式例如包括单轮交互模式、多轮交互模式等模式，其中非全双工模式中，语音拾取模块和语音播报模块均为交替运行，即语音拾取模块采集并识别到语音控制指令后，都需要及时地反馈识别结果，即通过语音播报反馈识别结果；两者的主要区别在于，单轮交互模式在发出每条语音控制指令之前都需要唤醒，而多轮交互模式在一次唤醒后，可以发出多条语音控制指令，但必须在语音播报模块停止播报，语音拾取模块工作的时候。

本申请实施例中，根据发出的语音类型进行全双工模式和非全双工模式的自动切换，既满足了不同的使用场景的需求，又实现了语音模式的简单切换，使得语音控制更加顺畅。另外，通过全双工模式，语音拾取功能和语音播报功能并行工作，使得使用者对家电设备的语音控制更加顺畅。

进一步地，如图3所示，图3是本申请一实施例中家电设备的语音控制方法中，对采集的环境语音进行语音识别的细化流程示意图。上述实施例的步骤S120中对于语音指令的类型判断可包括以下步骤：

步骤S121，按当前的语音模式拾取周边的环境语音，并对拾取到的环境语音进行处理，获得语音特征信息；

步骤S122，将获得的语音特征信息与语音指令的类型对应的语音特征信息进行匹配，并根据匹配结果判断所述环境语音的语音指令的类型。

具体地，上述语音装置中通过语音拾取模块拾取周围环境的语音信号，并对拾取到的语音信号进行语音识别。该语音拾取模块例如包括麦克风及语音识别的相关组件。该麦克风可以设置一个、两个或多个，通过设置两个或多个麦克风，可以从多个方向采集语音信息，并采用差分消除噪声的处理算法，从而提高语音采集的质量，进而提高语音识别率。

一实施例中，该语音拾取模块对周围环境的语音信号进行边采集边识别，例如语音拾取模块采用至少两个运行进程，一个进程用于采集周围环境的语音信号，另一个进程用于对采集到的语音信号进行语音识别。如此，语音拾取模块可以快速地进行识别，并及时获知使用者的意图。另一实施例中，该语音拾取模块可与云服务器建立通信，语音拾取模块采集周围环境的语音信号，并将采集到的语音信号发送至云服务器，云服务器对接收到的语音信号进行语音识别，该实施例的架构中，语音拾取模块可以采用本地差分降噪算法进行语音采集处理，以快速、高效的完成语音信息连续动态收集过程，并结合云端的语音识别算法，从而进一步提升了语音识别效率，及时获知使用者的意图。

在语音拾取模块采集到周围环境的语音信息后，还可以先对采集到的环境语音进行降噪处理，然后对采集到的环境语音进行语义识别处理，提取语音特征信息。一实施例中，可以预设语音特征的数据库，将语义识别的特征词与预设的数据库进行比较筛选，获得最终的语音特征信息。

本申请一实施例中，全双工模式的语音指令（全双工指令）包括控制类型的指令词（语音特征信息），无需根据输入的语音指令词进行即时反馈，而是根据对语音指令的执行结果进行反馈。该指令词具有对应的语法结构，以“关闭设备”举例，语法结构具体如下：

非全双工模式的语音指令（非全双工指令）包括自然对话类型的指令词（语音特征信息），需要根据输入的语音指令即时反馈识别结果，例如能够理解则语音回应，不能理解则语音反馈无法识别。该指令词并不像全双工模式的语音指令，具有对应的语法结构，其指令词可以更加随意、灵活。具体举例如下：

根据上述全双工指令和非全双工指令对应的语音特征信息，对步骤S121获得的语音特征信息进行识别，当拾取到的环境语音被识别为全双工指令时，则进入全双工模式；当拾取到的环境语音被识别为非全双工指令时，则进入非全双工模式。

另一实施例中，还可以根据历史语音指令进行全双工指令以及非全双工指令的判断。该历史语音指令例如包括默认设置的语音控制指令、使用过程中通过及机器学习识别到的语音控制指令、使用者手动添加的语音控制指令、升级更新的语音控制指令等等。每个历史语音指令包括全双工指令和非全双工指令对应的语音特征信息。根据历史语音指令能获知全双工模式和非全双工模式下相关语音控制指令，从而可以判断语音特征信息是否为全双工模式的语音控制指令。通过历史语音指令的判断，可以使得全双工指令和非全双工指令的判断更加精准。

上述实施例中，根据语音指令的类型进行语音模式的切换，例如语音装置在被唤醒后，若当前识别到的语音指令为全双工指令，则语音装置进入全双工模式，该全双工模式下，语音装置的语音拾取模块和语音播报模块并行工作，且语音拾取模块采用边拾取边识别，当识别到全双工指令，则执行该全双工指令，并将指令结果进行语音播报。当识别到非全双工指令，则退出全双工模式，进入非全双工模式，且控制家电设备执行识别到的非全双工指令，并根据具体的非全双工模式确定是否退出唤醒状态，若采用单轮交互模式则退出唤醒状态，若采用多轮交互模式则不退出唤醒状态。

再例如，若语音装置在被唤醒后，若当前识别到的语音指令为非全双工指令，则语音装置进入非全双工模式，该非全双工模式下，控制家电设备执行识别到的非全双工指令，并根据具体的非全双工模式确定是否退出唤醒状态，若采用单轮交互模式则退出唤醒状态，若采用多轮交互模式则不退出唤醒状态。当多轮交互模式下，识别到全双工指令，则语音装置退出非全双工模式，进入全双工模式。

进一步地，全双工指令中可包括多个语音对话场景，例如“空调控制”、“睡眠控制”等等。以语音对话场景为“空调控制”举例，该场景下相关的语音指令例如包括，“温度设置为26℃”、“风速设置为中档”、“风向设置为上下扫风”、“湿度设置为60%”、“开启制冷模式”等等。若获得语音特征信息为“中档风”、“风速中档”、“风速调为中档”等，则判断该语音特征信息为该对话场景下的语音控制指令，即“风速设置为中档”。若获得语音特征信息为“上下扫风”、“扫风”等，则判断该语音特征信息为该对话场景下的语音控制指令，即“风向设置为上下扫风”。在进行语音识别时，可以先根据当前场景下的历史语音指令进行指令识别，从而可以更快地进行识别。如果当前场景下无法识别到语音指令，则根据其他场景下的历史语音指令进行指令识别，直到无法识别到语音指令，确定采集到的语音信息为噪音。

进一步地，上述语音拾取模块在采集周围的环境语音后，还将对采集到的环境语音进行分段处理，同时对分段后的环境语音进行语音识别。通过对采集到的语音信息进行分段处理，从而可以提前对分好段的语音信息进行语音识别，从而提升了语音识别效率。

具体地，一实施例中，可以根据语音信息的音量大小进行分段处理，在进行语音采集时，将采集到的语音信息拆分成多个语音段。例如设置一音量阈值（如3000），将低于该音量阈值的语音信息判断为未说话，因此根据该音量阈值，在采集到语音信息的音量低于该音量阈值的，则将其分段处理，同时将分段后的语音信息进行语音识别。另一实施例中，可以根据语音信息之间的停顿时间，对语音信息进行分段处理，在进行语音采集时，将采集到的语音信息拆分成多个语音段。例如设置一时间阈值（0.5秒），将停顿时间高于该时间阈值的语音信息判断为未说话，因此根据该时间阈值，在采集到语音信息之间的停顿时间高于该时间阈值的，则将其分段处理，同时将分段后的语音信息进行语音识别。

进一步地，对分段处理后的语音信息进行语音识别时，还将结合前后段的语音信息的识别结果，进行语音控制指令的判断。由于语音信息经过分段处理，可能需要结合前后连续几段的语音信息，才能准确分析出相应的语音控制指令，例如使用者说“好冷啊....调高温度”，经过分段处理可能将分成多段语音信息，如此仅根据一段语音信息的识别结果无法准确知道使用者的真实意图，只有将前后段的语音信息结合进行分析，才能确定使用者的真实意图是“将空调器的目标温度调高”，由此产生“升高目标温度”的语音控制指令。

进一步地，上述全双工模式的进入除了通过全双工的语音指令的方式，还可以通过其他的方式：通过安装相关插件的第三方控制设备控制进入全双工模式。即接收到移动终端发送的进入全双工模式的指令时，确定进入全双工模式。该移动终端可安装有控制语音装置的插件/应用程序，通过该插件可以实现对语音装置的配置管理，也可以实现对语音装置的功能启动。

进一步地，上述全双工模式的退出除了通过非全双工指令的方式，还可以通过其他的方式：一实施例中，通过退出全双工的语音指令的方式，例如“关闭全双工模式”、“退出全双工模式”等等；另一实施例中，在进入全双工模式后，一预置时间内未识别到语音控制指令，则退出全双工模式，并退出唤醒状态。

在进入全双工模式或非全双工模式后，虽然能采集到语音指令，但是周围环境中发出的非语音指令也会被语音装置采集到，尤其是全双工模式，语音拾取装置处于持续的语音拾取状态，而使用者为了个人隐私的安全，往往不希望自己发出的非语音指令的语音信息被采集，因此本实施例中，设置一预置时间，例如30秒，在该预置时间内，若未识别到语音控制指令，则退出当前语音模式，并退出唤醒状态。

本申请实施例中，通过语音模式的时间设置，既能实现有效的语音控制，又避免了使用者的隐私安全。

进一步地，上述步骤S120进入全双工模式时，还包括：若拾取到的语音信息识别为语音指令，则停止当前的语音播报，并控制所述家电设备执行所述语音控制指令。

上述语音装置的语音拾取模块和语音播报模块这两个功能模块还将受语音装置的处理器的控制，该处理器可以随时发出控制指令，控制语音拾取模块和语音播报模块停止工作。例如在语音播报模块进行语音播报时，处理器可以根据语音拾取模块的采集内容而控制语音播报模块停止播报工作，就像人与人在交流时，可以根据对方的说话内容而选择聆听对方的讲话，也可以根据对方的说话内容而选择打断对方的讲话。

具体地，由于周围环境的语音信号为边采集边识别，因此在未采集到完整的语音信号之前，就能预测使用者的语音意图，从而确认该语音信号是否为语音控制指令，如果是则控制停止语音播报，并控制家电设备执行该语音控制指令。由于停止了语音播报，语音拾取模块可以更准确地拾取到使用者发出的语音信息，因此还可以在采集到完整的语音信号并再次确认为语音控制指令后，再控制家电设备执行该语音控制指令。

上述实施例中，若识别到环境语音为非语音指令，也就是说，既不是全双工指令，也不是非全双工指令，即确定环境语音为噪音，则语音装置仍然维持当前的语音模式，如果当前语音播报模块处于语音播报状态，则继续进行语音播报，从而避免了噪音的误打断。

如图4所示，图4是本申请实施例中进入全双工模式时语音拾取功能和语音播报功能的工作示例图。该全双工模式中，语音拾取功能和语音播报功能均处于工作状态。图4中，语音拾取模块采集并识别到语音控制指令2时，控制家电设备执行该语音控制指令2，随后语音播报模块将执行结果或执行状态进行语音播报。在语音播报模块进行语音播报的同时，语音拾取模块采集并识别到语音控制指令3时，控制语音播报模块停止播报工作。而图2中，在语音播报模块进行语音播报的同时，语音拾取模块采集并识别到不是语音控制指令（即噪音）时，语音播报模块继续播报工作。

通过本实施例中的语音识别处理，可以快速识别到全双工模式的语音控制指令，并打断当前语音播报，不但提升了语音识别效率，使得语音控制更加顺畅，而且还避免了噪声的误打断。

进一步地，上述实施例的语音播报模块在接收到待播报的语音内容时，对待播报的语音播报内容进行解析，并根据解析结果选择对应的语音播报模式进行语音播报。

一实施例中，语音播报模块对待播放的语音播报内容进行解析，例如对语音播报内容进行分词、断句处理，确定播报的关键信息，并控制语音播报时的音量、语速以及词语之间的停顿时间等等，从而使得语音播报效果更佳，提升使用体验。

进一步地，上述实施例的语音播报模块在接收到待播报的语音内容时，还可以根据播报控制，采用适合使用者的语音模式进行语音播报。例如语音拾取模块在采集到周围环境的语音信息后，并对其进行语音识别，以识别出当前使用者的用户类型，例如老人、小孩或男人、女人，从而可以根据识别出的用户类型，选择相应的语音模式进行语音播报，进一步提升使用体验。

以下将通过空调设备的语音控制举例说明本申请实施例的语音控制过程。

如图5所示，图5是本申请实施例的语音控制方法的一应用示例。使用者发出语音“小美小美”，语音装置采集并识别到该环境语音为唤醒指令，则通过语音播报进行语音反馈“我在呢”。例如还可以设置为其他的反馈语音，“请吩咐”等。使用者再发出语音“打开自然对话”，此时语音装置采集并识别到该环境语音为全双工指令，则语音装置进入全双工模式，并通过语音播报进行语音反馈“现在可以自由对话了”。该全双工模式下，使用者不需要再重复唤醒，语音装置的语音拾取功能和语义播报功能启动且并行工作，当使用者发出语音“打开空调”，此时语音装置采集并识别到该环境语音为全双工指令，则控制空调打开，并通过语音播报进行语音反馈“空调已开机，制冷模式，26℃，自然风”。在该语音播报的同时，使用者可以再次发出语音指令，例如“温度调至24℃，强劲风”，此时语音装置采集并识别到该环境语音为全双工指令，继续保持全双工模式，即控制空调调节目标温度及风速，并通过语音播报进行语音反馈“温度已调至24℃，风速已调至强劲风”。此时，若使用者发出“播放舒缓的歌曲”的语音指令，此时语音装置采集并识别到该环境语音为非全双工指令，则退出全双工模式，进入非全双工模式，则通过语音播报反馈识别结果“好的，马上为主人播放”，然后再控制语音装置播放选好的歌曲。如果该非全双工模式采用单轮交互模式则，退出唤醒状态，需要重新进行语音控制则需要再次唤醒；如果非全双工模式采用多轮交互模式，则不用退出唤醒状态，按多轮交互模式的方式进行语音控制。

如图6所示，图6是本申请实施例的语音控制方法的一应用示例。使用者发出语音“小美小美”，语音装置采集并识别到该环境语音为唤醒指令，则通过语音播报进行语音反馈“我在呢”。例如还可以设置为其他的反馈语音，“请吩咐”等。当使用者发出语音“打开空调”，此时语音装置采集并识别到该环境语音为全双工指令，则进入全双工模式，并控制空调打开，然后通过语音播报进行语音反馈“空调已开机，制冷模式，26℃，自然风”。在该语音播报的同时，使用者可以再次发出语音指令，若使用者在预置时间（例如30秒）内未发出任何语音指令，此时语音装置未采集到语音指令，则通过语音播报进行语音反馈“先退下啦，后面记得唤醒我”，然后退出当前语音模式，并退出唤醒状态。

上述提及的家电设备和语音装置均可包括处理器、存储器以及通信模块。而且，该存储器可作为一种计算机存储介质，该存储器中可以包括操作系统以及家电设备的语音控制程序。该语音控制程序供家电设备的处理器调用，以执行上述实施例中家电设备的语音控制方法的步骤。或者该语音控制程序供语音装置的处理器调用，以执行上述实施例中家电设备的语音控制方法的步骤。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

应当注意的是，在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本申请可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

一种家电设备的语音控制方法，其中，通过语音装置对家电设备进行语音控制；所述语音控制方法包括以下步骤：

接收语音唤醒指令，并根据所述语音唤醒指令唤醒所述语音装置；

采集并识别周边环境的语音信息，并在识别到语音指令时，根据语音指令的类型进行语音模式切换；所述语音模式包括全双工模式和非全双工模式。
如权利要求1所述的家电设备的语音控制方法，其中，所述采集并识别周边环境的语音信息包括：

按当前的语音模式拾取周边的环境语音，并对拾取到的环境语音进行处理，获得语音特征信息；

将获得的语音特征信息与语音指令的类型对应的语音特征信息进行匹配，并根据匹配结果判断所述环境语音的语音指令的类型。
如权利要求2所述的家电设备的语音控制方法，其中，在对拾取到的环境语音进行语音识别之前，还包括：

对采集到的环境语音进行分段处理，同时对分段后的环境语音进行语音识别。
如权利要求1-3中任一项所述的家电设备的语音控制方法，其中，所述语音控制方法还包括：

若一预置时间内未识别到语音指令，则退出当前语音模式，并退出唤醒状态。
如权利要求1-3中任一项所述的家电设备的语音控制方法，其中，所述语音控制方法还包括：

非全双工模式下，控制家电设备执行识别到的语音指令，并根据非全双工模式的类型确定是否退出唤醒状态。
如权利要求1所述的家电设备的语音控制方法，其中，所述语音控制方法还包括：

接收到移动终端发送的进入全双工模式的指令时，进入全双工模式。
如权利要求1所述的家电设备的语音控制方法，其中，所述语音控制方法还包括：

若拾取到的环境语音被识别为语音指令时，则停止当前的语音播报，并控制所述家电设备执行所述语音指令。
一种语音装置，其中，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述的家电设备的语音控制方法的步骤，对家电设备进行语音控制。
一种家电设备，其中，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1-7中任一项所述的家电设备的语音控制方法的步骤。
一种计算机存储介质，其中，所述计算机存储介质上存储有语音控制程序，所述语音控制程序被处理器执行实现如权利要求1-7中任意一项所述的家电设备的语音控制方法的步骤。