CN113763958A

CN113763958A - 语音唤醒方法、装置、电子设备和存储介质

Info

Publication number: CN113763958A
Application number: CN202111146220.1A
Authority: CN
Inventors: 于云涛
Original assignee: Hisense Visual Technology Co Ltd
Current assignee: Hisense Visual Technology Co Ltd
Priority date: 2021-09-28
Filing date: 2021-09-28
Publication date: 2021-12-07
Anticipated expiration: 2041-09-28
Also published as: CN113763958B

Abstract

本申请提供了一种语音唤醒方法、装置、电子设备和存储介质，采集用户的语音数据；根据对语音数据进行处理的处理结果，获取语音数据对应的控制信号；根据控制信号，在确定出处于待机状态的设备满足预设唤醒条件时，控制设备执行唤醒操作，预设唤醒条件包括控制信号为低电平信号且设备中的数字信号处理模块的供电状态为通电状态，或，控制信号为至少一个脉冲信号。本申请提供的技术方案在控制信号为低电平信号且设备中的数字信号处理模块的供电状态为通电状态，或，控制信号为至少一个脉冲信号时，控制设备执行唤醒操作，能够避免其他信号的干扰使得设备被异常唤醒的问题，从而提高了语音唤醒的准确度。

Description

语音唤醒方法、装置、电子设备和存储介质

技术领域

本申请涉及语音控制技术领域。更具体地讲，涉及一种语音唤醒方法、装置、电子设备和存储介质。

背景技术

智能语音交互已经成为人工智能产品不可或缺的功能，用户可以通过智能语音交互功能控制电子设备执行相应的操作，例如，通过语音唤醒待机状态下的电子设备，即控制电子设备的开关机，成者，通过语音控制电子设备播放音乐等。智能语音交互能够解放用户的双手，为用户的生活带来极大地便利。

目前，语音唤醒设备的方法主要是通过设备外置的麦克风阵列采集用户的语音，并通过系统内置的数字信号处理模块对采集的语音进行识别。在语音识别成功后，控制拾音模块输出低电平信号，电子设备的系统在接收到低电平信号时，控制待机状态下的电子设备执行相应的操作。此外，用户不需要语音唤醒功能时，可以将语音唤醒功能关闭，将数字信号处理模块处于断电状态，使得用户在说出相应的语音时，电子设备不执行任何操作。

但是，在语音唤醒功能处于关闭状态时，处于断电状态的数字信号处理模块可能会处于失控模式，使得其信号线上的内阻与系统主板上的弱上拉电阻形成分压，造成系统检测到低电平信号，并将检测到的低电平信号误以为语音信号而控制电子设备执行相应的操作，从而导致语音唤醒的准确度较低。

发明内容

本申请示例性的实施方式提供一种语音唤醒方法、装置、电子设备和存储介质，能够避免电子设备被异常唤醒的情况，极大的提升了语音唤醒的准确度。

第一方面，本申请实施例提供一种语音唤醒方法，包括：

采集用户的语音数据。

根据对所述语音数据进行处理的处理结果，获取所述语音数据对应的控制信号。

根据所述控制信号，在确定出处于待机状态的设备满足预设唤醒条件时，控制所述设备执行唤醒操作，所述预设唤醒条件包括所述控制信号为低电平信号且所述设备中的数字信号处理模块的供电状态为通电状态，或，所述控制信号为至少一个脉冲信号。

在一种可能的实现方式中，所述预设唤醒条件包括所述控制信号为低电平信号且所述设备中的数字信号处理模块的供电状态为通电状态。

根据所述控制信号，确定处于待机状态的设备满足预设唤醒条件，包括：

若检测出所述控制信号为低电平信号，则确定所述低电平信号的持续时间是否大于预设时长。

若所述低电平信号的持续时间大于所述预设时长，且所述数字信号处理模块的供电状态为通电状态，则确定所述处于待机状态的设备满足所述预设唤醒条件。

在一种可能的实现方式中，所述根据对所述语音数据进行处理的处理结果，获取所述语音数据对应的控制信号，包括：

提取所述语音数据中的特征信息。

判断所述特征信息与开机语音的标准特征信息之间的相似度是否大于预设阈值。

若所述相似度大于所述预设阈值，则获取所述语音数据对应的控制信号。

在一种可能的实现方式中，所述方法还包括：

采集所述开机语音。

将所述开机语音输入预先训练的声学模型中，得到所述标准特征信息，所述声学模型为根据样本语音对初始声学模型进行训练后得到的。

在一种可能的实现方式中，所述方法还包括：

若所述控制信号为高电平信号，和/或，所述数字信号处理模块的供电状态为断电状态，则控制所述待机状态的设备保持待机状态。

在一种可能的实现方式中，所述方法还包括：

若所述控制信号为低电平信号，且所述低电平信号的持续时间不大于所述预设时长，则控制所述待机状态的设备保持待机状态。

第二方面，本申请实施例提供一种语音唤醒装置，包括：

采集模块，用于采集用户的语音数据。

获取模块，用于根据对所述语音数据进行处理的处理结果，获取所述语音数据对应的控制信号。

控制模块用于根据所述控制信号，在确定出处于待机状态的设备满足预设唤醒条件时，控制所述设备执行唤醒操作，所述预设唤醒条件包括所述控制信号为低电平信号且所述设备中的数字信号处理模块的供电状态为通电状态，或，所述控制信号为至少一个脉冲信号。

在一种可能的实现方式中，所述预设唤醒条件包括所述控制信号为低电平信号且所述设备中的数字信号处理模块的供电状态为通电状态；所述控制模块，具体用于在检测出所述控制信号为低电平信号时，确定所述低电平信号的持续时间是否大于预设时长；在所述低电平信号的持续时间大于所述预设时长，且所述数字信号处理模块的供电状态为通电状态时，确定所述处于待机状态的设备满足所述预设唤醒条件。

在一种可能的实现方式中，所述获取单元，具体用于提取所述语音数据中的特征信息；判断所述特征信息与开机语音的标准特征信息之间的相似度是否大于预设阈值；在所述相似度大于所述预设阈值时，获取所述语音数据对应的控制信号。

在一种可能的实现方式中，所述采集模块，还用于采集所述开机语音；将所述开机语音输入预先训练的声学模型中，得到所述标准特征信息，所述声学模型为根据样本语音对初始声学模型进行训练后得到的。

在一种可能的实现方式中，所述控制模块，还用于在所述控制信号为高电平信号，和/或，所述数字信号处理模块的供电状态为断电状态时，控制所述待机状态的设备保持待机状态。

在一种可能的实现方式中，所述控制模块，还用于在所述控制信号为低电平信号，且所述低电平信号的持续时间不大于所述预设时长时，控制所述待机状态的设备保持待机状态。

第三方面，本申请实施例还提供了一种电子设备，该电子设备包括：处理器，以及与所述处理器通信连接的存储器。

所述存储器存储计算机执行指令。

所述处理器执行所述存储器存储的计算机执行指令，以上述第一方面任一种可能的实现方式中所述的语音唤醒方法。

第四方面，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现上述第一方面任一种可能的实现方式中所述的语音唤醒方法。

第五方面，本申请实施例还提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时，实现上述第一方面任一种可能的实现方式中所述的语音唤醒方法。

本申请提供的语音唤醒方法、装置、电子设备和存储介质，采集用户的语音数据；根据对语音数据进行处理的处理结果，获取语音数据对应的控制信号；根据控制信号，在确定出处于待机状态的设备满足预设唤醒条件时，控制设备执行唤醒操作，预设唤醒条件包括控制信号为低电平信号且设备中的数字信号处理模块的供电状态为通电状态，或，控制信号为至少一个脉冲信号。本申请提供的技术方案在控制信号为低电平信号且设备中的数字信号处理模块的供电状态为通电状态，或，控制信号为至少一个脉冲信号时，控制设备执行唤醒操作，能够避免仅在关闭语音唤醒功能时，误将数字信号处理模块输出的低电平信号误以为唤醒信号而控制设备执行唤醒操作的问题，从而提高了语音唤醒的准确度。

本申请的这些和其它方面在以下(多个)实施例的描述中会更加简明易懂。

附图说明

为了更清楚地说明本申请实施例或相关技术中的实施方式，下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种语音唤醒方法的应用场景示意图；

图2为申请实施例提供的一种显示设备的硬件配置示意图；

图3为本申请实施例提供的一种语音唤醒方法的流程示意图；

图4为本申请实施例提供的另一种语音唤醒方法的流程示意图；

图5为本申请实施例提供的再一种语音唤醒方法的流程示意图；

图6为本申请一实施例提供的语音唤醒装置的结构示意图。

具体实施方式

为使本申请的目的、实施方式和优点更加清楚，下面将结合本申请示例性实施例中的附图，对本申请示例性实施方式进行清楚、完整地描述，显然，所描述的示例性实施例仅是本申请一部分实施例，而不是全部的实施例。

基于本申请描述的示例性实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请所附权利要求保护的范围。此外，虽然本申请中公开内容按照示范性一个或几个实例来介绍，但应理解，可以就这些公开内容的各个方面也可以单独构成一个完整实施方式。

需要说明的是，本申请中对于术语的简要说明，仅是为了方便理解接下来描述的实施方式，而不是意图限定本申请的实施方式。除非另有说明，这些术语应当按照其普通和通常的含义理解。

本申请中说明书和权利要求书及上述附图中的术语″第一″、″第二″、″第三″等是用于区别类似或同类的对象或实体，而不必然意味着限定特定的顺序或先后次序，除非另外注明(Unless otherwise indicated)。应该理解这样使用的用语在适当情况下可以互换，例如能够根据本申请实施例图示或描述中给出那些以外的顺序实施。

此外，术语″包括″和″具有″以及他们的任何变形，意图在于覆盖但不排他的包含，例如，包含了一系列组件的产品或设备不必限于清楚地列出的那些组件，而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。

本申请中使用的术语″模块″，是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合，能够执行与该元件相关的功能。

本申请提供的语音唤醒方法可以应用于智能语音交互的场景中。示例的，在智能设备工作时，通过麦克风阵列拾取音频，就采集用户的语音，通过语音识别算法，用户可以与智能设备通过语音这种最自然的交互方式完成影视、新闻、音乐等媒体资源的搜索，或者，为用户的生活提供一些辅助功能，例如，查天气、导航、点外卖等，或者，新型应用场景的交互场景，例如，远程教育、视频会议等。对于部分智能设备，还可以通过语音唤醒功能完成对设备的开关机控制。例如，对着智能电视喊″AAA请开机″，可以通过语音将智能电视打开，能够避免用户在找不到智能电视的遥控设备时，无法打开智能设备的问题，能够提升用户使用电视的智能交互体验。

以智能电视为例，在智能电视处于开机模式时，可以通过USB(Universal SerialBus，通用串行总线)等数据通信接口，实现智能电视的系统级芯片(System on Chip，简称SOC)与拾音模块的唤醒事件的传输和音频流的输送。在智能电视关机进入待机模式时，USB等常用的数据通信接口无法工作，仅待机有电功能的通用型之输入输出(General-purposeinput/output，简称GPIO)可响应智能电视的外部中断事件。因此，智能电视在待机模式时，可以通过PM功能的GPIO实现智能语音唤醒的功能。

现有技术中，在唤醒待机模式的设备时，可以通过设备外置的前端麦克风阵列采集用户的语音，并通过数字信号处理(Digital Signal Process，简称DSP)模块内置的语音算法完成唤醒词识别，例如，唤醒词可以为″开机″。在拾音模块唤醒词识别成功时，DSP模块对外输出低电平信号，低电平信号的持续时间可以为500ms。设备的系统端在检测到电平信号变化时，(无语音唤醒事件时保持高电平)，将开机信号输入事件响应中，控制设备执行开机和点亮屏幕等操作，以完成语音唤醒设备。可以理解的是，在不存在语音唤醒事件时，即在未采集到用户关于控制设备执行开机操作的指令时，设备的系统端在检测到高电平。其中，麦克风阵列可以为大于或等于两颗麦克风形成的收音装置，DSP模块可以实现对麦克风传输的原始音频信号进行噪声抑制、去混响、波束形成、声源定位等算法处理。

示例的，为了提高设备的语音唤醒功能的唤醒率，DSP模块可以在全功率模式下工作，以增加语音唤醒设备的唤醒率。此外，在设备的显示界面上可以设备语音唤醒功能的控制开关，仅在语音唤醒功能开启的情况下，设备可以响应于用户的语音执行相应的操作。在语音唤醒功能关闭的情况下，设备处于待机模式，即最小功率模式。

但是，在语音唤醒功能关闭的情况下，DSP模块可能会处于失控模式，使得其信号线上出现内阻，该内阻与系统级芯片上的弱上拉电阻形成分压，使得检测到GPIO电平下拉至低电平，系统级芯片在检测到GPIO的电平信号由高电平信号变化为低电平信号时，可能会将该低电平信号误判为语音唤醒产生的低电平信号，控制设备执行唤醒操作，从而导致语音唤醒的准确度较低。此外，外部信号可能会产生信号抖动，使得系统检测到低电平信号而被唤醒。

考虑到在语音唤醒功能关闭的情况下，DSP模块可能会输出错误的信号，导致设备误执行唤醒操作，而导致语音唤醒的准确度较低的问题，可以改变设备执行语音唤醒操作的判定条件，可以将判定条件设置为控制信号为低电平信号且DSP模块的供电状态为通电状态，或者，控制信号为至少一个脉冲信号，能够避免因低电平信号导致的设备误执行唤醒操作的问题，从而提升语音唤醒功能的准确度。

在本申请中，设备可以以各种形式来实施。例如，设备可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant，简称PDA)、便捷式媒体播放器(Portable Media Player，简称PMP)、导航装置、可穿戴设备、智能手环、计步器等移动设备，以及诸如数字TV、台式计算机等固定设备。本申请实施例对于具体的设备不做任何限定。

以设备为智能电视为例，图1为本申请实施例提供的一种语音唤醒方法的应用场景示意图。图1中所示的智能电视具有语音唤醒功能，即可以通过采集用户的语音控制智能电视播放音乐或开机关机等操作。在智能电视处于待机状态，且语音唤醒功能开启时，智能电视在采集到用户的语音时，可通过DSP模块进行语音处理，在确定采集到的语音对应的音频为控制智能电视开机操作的音频时，系统会检测到GPIO输出的控制信号，在控制信号为低电平信号且智能电视中的数字信号处理模块，即DSP模块，的供电状态为通电状态，或，控制信号为至少一个脉冲信号时，可以控制待机状态的智能电视执行开机操作，能够解放用户的双手，提升用户的体验。

示例的，在设备为显示设备时，例如，智能电视等，可参见图2所示，图2为本申请实施例提供的一种显示设备200的硬件配置示意图。

在一些实施例中，显示设备200中包括控制器250、调谐解调器210、通信器220、检测器230、输入/输出接口255、显示器275，音频输出接口285、存储器260、供电电源290、用户接口265、外部装置接口240中的至少一种。

在一些实施例中，显示器275，用于接收源自第一处理器输出的图像信号，进行显示视频内容和图像以及菜单操控界面的组件。

在一些实施例中，显示器275，包括用于呈现画面的显示屏组件，以及驱动图像显示的驱动组件。

在一些实施例中，显示视频内容，可以来自广播电视内容，也可以是说，可通过有线或无线通信协议接收的各种广播信号。或者，可显示来自网络通信协议接收来自网络服务器端发送的各种图像内容。

在一些实施例中，显示器275用于呈现显示设备200中产生且用于控制显示设备200的用户操控UI界面。

在一些实施例中，根据显示器275类型不同，还包括用于驱动显示的驱动组件。

在一些实施例中，显示器275为一种投影显示器，还可以包括一种投影装置和投影屏幕。

在一些实施例中，通信器220是用于根据各种通信协议类型与外部设备或外部服务器进行通信的组件。例如：通信器可以包括Wifi芯片，蓝牙通信协议芯片，有线以太网通信协议芯片等其他网络通信协议芯片或近场通信协议芯片，以及红外接收器中的至少一种。

在一些实施例中，显示设备200可以通过通信器220与外部控制设备100或内容提供设备之间建立控制信号和数据信号发送和接收。

在一些实施例中，用户接口265，可用于接收控制装置100(如：红外遥控器等)红外控制信号。

在一些实施例中，检测器230是显示设备200用于采集外部环境或与外部交互的信号。

在一些实施例中，检测器230包括光接收器，用于采集环境光线强度的传感器，可以通过采集环境光可以自适应性显示参数变化等。

在一些实施例中，检测器230还可以包括语音采集器，用于采集输入的语音信息。

在一些实施例中，检测器230还可以包括图像采集器，如相机、摄像头等，可以用于采集外部环境场景，以及用于采集用户的属性或与用户交互手势，可以自适应变化显示参数，也可以识别用户手势，以实现与用户之间互动的功能。

在一些实施例中，检测器230还可以包括温度传感器等，如通过感测环境温度。

在一些实施例中，显示设备200可自适应调整图像的显示色温。如当温度偏高的环境时，可调整显示设备200显示图像色温偏冷色调，或当温度偏低的环境时，可以调整显示设备200显示图像偏暖色调。

在一些实施例中，检测器230还可声音采集器等，如麦克风，可以用于接收用户的声音。示例性的，包括用户控制显示设备200的控制指令的语音信号，或采集环境声音，用于识别环境场景类型，使得显示设备200可以自适应适应环境噪声。

在一些实施例中，如图2所示，输入/输出接口255被配置为，可进行控制器250与外部其他设备或其他控制器250之间的数据传输。如接收外部设备的视频信号数据和音频信号数据、或命令指令数据等。

在一些实施例中，外部装置接口240可以包括，但不限于如下：可以高清多媒体接口HDMI接口、模拟或数据高清分量输入接口、复合视频输入接口、USB输入接口、RGB端口等任一个或多个接口。也可以是上述多个接口形成复合性的输入/输出接口。

在一些实施例中，如图2所示，调谐解调器210被配置为，通过有线或无线接收方式接收广播电视信号，可以进行放大、混频和谐振等调制解调处理，从多多个无线或有线广播电视信号中解调出音视频信号，该音视频信号可以包括用户所选择电视频道频率中所携带的电视音视频信号，以及EPG数据信号。

在一些实施例中，调谐解调器210解调的频点受到控制器250的控制，控制器250可根据用户选择发出控制信号，以使的调制解调器响应用户选择的电视信号频率以及调制解调该频率所携带的电视信号。

在一些实施例中，广播电视信号可根据电视信号广播制式不同区分为地面广播信号、有线广播信号、卫星广播信号或互联网广播信号等。或者根据调制类型不同可以区分为数字调制信号，模拟调制信号等。或者根据信号种类不同区分为数字信号、模拟信号等。

在一些实施例中，控制器250和调谐解调器210可以位于不同的分体设备中，即调谐解调器210也可在控制器250所在的主体设备的外置设备中，如外置机顶盒等。这样，机顶盒将接收到的广播电视信号调制解调后的电视音视频信号输出给主体设备，主体设备经过第一输入/输出接口接收音视频信号。

在一些实施例中，控制器250，通过存储在存储器上中各种软件控制程序，来控制显示设备的工作和响应用户的操作。控制器250可以控制显示设备200的整体操作。例如：响应于接收到用于选择在显示器275上显示UI对象的用户命令，控制器250便可以执行与由用户命令选择的对象有关的操作。示例的，控制器250还可以用于响应于在显示设备的UI界面上关闭语音唤醒功能的操作，控制显示设备关闭语音唤醒功能。

在一些实施例中，所述对象可以是可选对象中的任何一个，例如超链接或图标。与所选择的对象有关操作，例如：显示连接到超链接页面、文档、图像等操作，或者执行与所述图标相对应程序的操作。用于选择UI对象用户命令，可以是通过连接到显示设备200的各种输入装置(例如，鼠标、键盘、触摸板等)输入命令或者与由用户说出语音相对应的语音命令。

如图2所示，控制器250包括随机存取存储器251(Random Access Memory，RAM)、只读存储器252(Read-Only Memory，ROM)、视频处理器270、音频处理器280、其他处理器253(例如：图形处理器(Graphics Processing Unit，GPU)、中央处理器254(CentralProcessing Unit，CPU)、通信接口(Communication Interface)，以及通信总线256(Bus)中的至少一种。其中，通信总线连接各个部件。

在一些实施例中，RAM 251用于存储操作系统或其他正在运行中的程序的临时数据在一些实施例中，ROM 252用于存储各种系统启动的指令。

在一些实施例中，ROM 252用于存储一个基本输入输出系统，称为基本输入输出系统(Basic Input Output System，BIOS)。用于完成对系统的加电自检、系统中各功能模块的初始化、系统的基本输入/输出的驱动程序及引导操作系统。

在一些实施例中，在收到开机信号时，显示设备200电源开始启动，CPU运行ROM252中系统启动指令，将存储在存储器的操作系统的临时数据拷贝至RAM 251中，以便于启动或运行操作系统。当操作系统启动完成后，CPU再将存储器中各种应用程序的临时数据拷贝至RAM 251中，然后，以便于启动或运行各种应用程序。

在一些实施例中，CPU处理器254，用于执行存储在存储器中操作系统和应用程序指令。以及根据接收外部输入的各种交互指令，来执行各种应用程序、数据和内容，以便最终显示和播放各种音视频内容。

在一些示例性实施例中，CPU处理器254，可以包括多个处理器。多个处理器可包括一个主处理器以及一个或多个子处理器。主处理器，用于在预加电模式中执行显示设备200一些操作，和/或在正常模式下显示画面的操作。一个或多个子处理器，用于在待机模式等状态下一种操作。

在一些实施例中，图形处理器253，用于产生各种图形对象，如：图标、操作菜单、以及用户输入指令显示图形等。包括运算器，通过接收用户输入各种交互指令进行运算，根据显示属性显示各种对象。以及包括渲染器，对基于运算器得到的各种对象，进行渲染，上述渲染后的对象用于显示在显示器上。

在一些实施例中，视频处理器270被配置为将接收外部视频信号，根据输入信号的标准编解码协议，进行解压缩、解码、缩放、降噪、帧率转换、分辨率转换、图像合成等等视频处理，可得到直接可显示设备200上显示或播放的信号。

在一些实施例中，视频处理器270，包括解复用模块、视频解码模块、图像合成模块、帧率转换模块、显示格式化模块等。

其中，解复用模块，用于对输入音视频数据流进行解复用处理，如输入MPEG-2，则解复用模块进行解复用成视频信号和音频信号等。

视频解码模块，则用于对解复用后的视频信号进行处理，包括解码和缩放处理等。

图像合成模块，如图像合成器，其用于将图形生成器根据用户输入或自身生成的GUI信号，与缩放处理后视频图像进行叠加混合处理，以生成可供显示的图像信号。

帧率转换模块，用于对转换输入视频帧率，如将60Hz帧率转换为120Hz帧率或240Hz帧率，通常的格式采用如插帧方式实现。

显示格式化模块，则用于将接收帧率转换后视频输出信号，改变信号以符合显示格式的信号，如输出RGB数据信号。

在一些实施例中，图形处理器253可以和视频处理器可以集成设置，也可以分开设置，集成设置的时候可以执行输出给显示器的图形信号的处理，分离设置的时候可以分别执行不同的功能，例如GPU+FRC(Frame Rate Conversion))架构。

在一些实施例中，音频处理器280，用于接收外部的音频信号，根据输入信号的标准编解码协议，进行解压缩和解码，以及降噪、数模转换、和放大处理等处理，得到可以在扬声器中播放的声音信号。

在一些实施例中，视频处理器270可以包括一颗或多颗芯片组成。音频处理器，也可以包括一颗或多颗芯片组成。

在一些实施例中，视频处理器270和音频处理器280，可以单独的芯片，也可以于控制器一起集成在一颗或多颗芯片中。

在一些实施例中，音频输出，在控制器250的控制下接收音频处理器280输出的声音信号，如：扬声器286，以及除了显示设备200自身携带的扬声器之外，可以输出至外接设备的发生装置的外接音响输出端子，如：外接音响接口或耳机接口等，还可以包括通信接口中的近距离通信模块，例如：用于进行蓝牙扬声器声音输出的蓝牙模块。

供电电源290，在控制器250控制下，将外部电源输入的电力为显示设备200提供电源供电支持。供电电源290可以包括安装显示设备200内部的内置电源电路，也可以是安装在显示设备200外部电源，在显示设备200中提供外接电源的电源接口。

用户接口265，用于接收用户的输入信号，然后，将接收用户输入信号发送给控制器250。用户输入信号可以是通过红外接收器接收的遥控器信号，可以通过网络通信模块接收各种用户控制信号。

在一些实施例中，用户通过控制装置100或移动终端300输入用户命令，用户输入接口则根据用户的输入，显示设备200则通过控制器250响应用户的输入。

在一些实施例中，用户可在显示器275上显示的图形用户界面(GUI)输入用户命令，则用户输入接口通过图形用户界面(GUI)接收用户输入命令。或者，用户可通过输入特定的声音或手势进行输入用户命令，则用户输入接口通过传感器识别出声音或手势，来接收用户输入命令。

在一些实施例中，″用户界面″，是应用程序或操作系统与用户之间进行交互和信息交换的介质接口，它实现信息的内部形式与用户可以接受形式之间的转换。用户界面常用的表现形式是图形用户界面(Graphic User Interface，GUI)，是指采用图形方式显示的与计算机操作相关的用户界面。它可以是在电子设备的显示屏中显示的一个图标、窗口、控件等界面元素，其中控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、Widget等可视的界面元素。

存储器260，包括存储用于驱动显示设备200的各种软件模块。如：第一存储器中存储的各种软件模块，包括：基础模块、检测模块、通信模块、显示控制模块、浏览器模块、和各种服务模块等中的至少一种。

基础模块用于显示设备200中各个硬件之间信号通信、并向上层模块发送处理和控制信号的底层软件模块。检测模块用于从各种传感器或用户输入接口中收集各种信息，并进行数模转换以及分析管理的管理模块。

例如，语音识别模块中包括语音解析模块和语音指令数据库模块。显示控制模块用于控制显示器进行显示图像内容的模块，可以用于播放多媒体图像内容和UI界面等信息。通信模块，用于与外部设备之间进行控制和数据通信的模块。浏览器模块，用于执行浏览服务器之间数据通信的模块。服务模块，用于提供各种服务以及各类应用程序在内的模块。同时，存储器260还用存储接收外部数据和用户数据、各种用户界面中各个项目的图像以及焦点对象的视觉效果图等。

下面，将通过具体的实施例对本申请提供的语音唤醒方法进行详细地说明。可以理解的是，下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

图3为本申请实施例提供的一种语音唤醒方法的流程示意图。该语音唤醒方法可以由软件和/或硬件装置执行，例如，该硬件装置可以为语音唤醒装置，该语音唤醒装置可以为终端或者终端中的处理芯片。示例的，请参见图3所示，该语音唤醒方法可以包括：

S301、采集用户的语音数据。

示例的，在采集用户的语音数据时，可以通过设备内置的语音采集装置进行采集，例如设备内置的麦克风装置，或者，使用与设备外接的装置进行采集，例如，通过与智能电视连接的遥控装置进行采集，对于采集用户的语音数据的装置本申请实施例不做任何限定。为了能够提高语音唤醒的灵敏度，可以对用户的语音数据进行实时采集，也可以根据实际情况进行设定，本申请实施例对于语音采集的时间不做任何限定。

在采集到用户的语音数据后，可以执行下述S302：

S302、根据对语音数据进行处理的处理结果，获取语音数据对应的控制信号。

在根据对语音数据进行处理的处理结果，获取语音数据对应的控制信号时，可以提取语音数据中的特征信息；判断特征信息与开机语音的标准特征信息之间的相似度是否大于预设阈值；若相似度大于预设阈值，则获取语音数据对应的控制信号。

示例的，在提取语音数据中的特征信息时，可以对采集到的用户的语音数据进行噪声抑制、去混响、波束形成、波源定位等算法处理，得到语音数据中的特征信息，也可以通过其他算法进行提取，本申请实施例对此不做任何限定。

可以理解的是，在判断特征信息与开机语音的标准特征信息之间的相似度是否大于预设阈值时，可以判断特征信息中的波形与标准特征信息中的波形的相似度，或者，判断特征信息对应的文字与标准特征信息对应的文字的相似度，例如，标准特征信息对应的文字为″AA开机″，则特征信息对应的文字含有″AA″和″开机″时，才能够确定相似度大于预设阈值。本申请实施例仅以上述方法为例进行说明，具体的可根据实际情况进行设定。

在本申请实施例中，在用户的语音数据的特征信息与标准特征信息之间的相似度大于预设阈值时，获取语音数据对应的控制信号，增加了获取控制信号的准确度，从而进一步提高了语音唤醒的准确度。

示例的，可以通过采集开机语音；将开机语音输入预先训练的声学模型中，得到标准特征信息，声学模型为根据样本语音对初始声学模型进行训练后得到的。其中，开机语音可以包括多种不同的语音数据，例如，男士的语音数据，女士的语音数据，小孩的语音数据等，且语音数据的形式不同，例如，在控制设备关机时，语音可以为″BCD请关机″，或者″BCD帮我关闭设备″，或者″关闭设备″等。本申请实施例对于开机语音不做具体限定、

在本申请实施例中，通过声学模型得到标准特征信息，能够提升得到的标准特征信息的准确度，从而提升了根据标准特征信息得到的控制信号的准确度。

示例的，获取的控制信号为数字信号处理模块，即DSP模块，控制GPIO输出的控制信号，获取为DSP模块直接输出的控制模块，本申请实施例仅以GPIO输出的控制信号为例进行说明，但并不代表本申请实施例仅局限于此。

S303、根据控制信号，在确定出处于待机状态的设备满足预设唤醒条件时，控制设备执行唤醒操作，预设唤醒条件包括控制信号为低电平信号且设备中的数字信号处理模块的供电状态为通电状态，或，控制信号为至少一个脉冲信号。

在一种可能的实现方式中，预设唤醒条件包括控制信号为低电平信号且设备中的数字信号处理模块的供电状态为通电状态，在根据控制信号，确定处于待机状态的设备满足预设唤醒条件时，若检测出控制信号为低电平信号，则确定低电平信号的持续时间是否大于预设时长；若低电平信号的持续时间大于预设时长，且数字信号处理模块的供电状态为通电状态，则确定处于待机状态的设备满足预设唤醒条件。

可以理解的是，在确定低电平信号的持续时间是否大于预设时长时，可以直接判断低电平信号的持续时间，也可以通过延后检测的方式，确定低电平信号的持续时间是否大于预设时长，例如，若正常情况下低电平信号的持续时间为500ms，则可以每隔400ms检测一次低电平信号，或者每隔400ms输出一次低电平信号。具体的判断方式可以根据实际情况进行设定，本申请实施例对此不做任何限定。

由于外部信号产生的低电平信号的持续时间较短，因此，确定低电平信号的持续时间是否大于预设时长能够排除外部信号产生的干扰。

在本申请实施例中，确定低电平信号的持续时间是否大于预设时长，可以避免因外部的信号产生的低电平信号造成的干扰，此外，在数字信号处理模块的供电状态为通电状态时，确定处于待机状态的设备满足预设唤醒条件，能够避免在数字信号处理模块断电处理失控状态造成的干扰，从而提高了语音唤醒的准确度。

在另一种可能的实现方式中，预设唤醒条件包括控制信号为至少一个脉冲信号，在根据控制信号，确定处于待机状态的设备满足预设唤醒条件时，GPIO输出的控制信号可以为至少一个脉冲信号，例如，控制信号为3个脉冲信号，周期为200ms，占空比为50％，本申请实施例对于脉冲信号的数量不作任何限定。由于DSP模块处于失控模式时，无法控制输出脉冲信号，因此，可以避免DSP模块造成的干扰。

由此可见，本申请实施例提供的语音唤醒方法，采集用户的语音数据；根据对语音数据进行处理的处理结果，获取语音数据对应的控制信号；根据控制信号，在确定出处于待机状态的设备满足预设唤醒条件时，控制设备执行唤醒操作，预设唤醒条件包括控制信号为低电平信号且设备中的数字信号处理模块的供电状态为通电状态，或，控制信号为至少一个脉冲信号。本申请提供的技术方案在控制信号为低电平信号且设备中的数字信号处理模块的供电状态为通电状态，或，控制信号为至少一个脉冲信号时，控制设备执行唤醒操作，能够避免数字信号处理模块失控或者外部信号产生的低电平信号对语音唤醒功能产生的干扰，从而提高了语音唤醒的准确度。

示例的，在本申请实施例中，若控制信号为高电平信号，和/或，数字信号处理模块的供电状态为断电状态，则控制待机状态的设备保持待机状态，能够准确的控制设备的待机状态，避免被异常唤醒。

示例的，在本申请实施例中，若控制信号为低电平信号，且低电平信号的持续时间不大于预设时长，则控制待机状态的设备保持待机状态，能够避免因外部信号产生的干扰造成设备异常唤醒的问题，使得设备能够准确地保持其状态。

为了便于理解本申请实施例提供的语音唤醒方法，下面，将以智能电视为例，在控制信号为至少一个脉冲信号时，对本申请实施例提供的技术方案进行详细的描述，具体的可参见图4所示，图4为本申请实施例提供的另一种语音唤醒方法的流程示意图。

根据图4所示，在控制信号为至少一个脉冲信号时，语音唤醒方法可以包括下述步骤：

步骤1、端点检测。对用户的语音数据进行端点检测，以对语音和非语音的区域进行区分，使得得到的语音数据更加清晰准确。

步骤2、信号处理。对步骤1中端点检测的用于的语音数据进行处理，可以为去噪等处理，本申请实施例对于具体的处理方式不做任何限定。

步骤3、特征提取和声学模型。对信号处理后的语音数据，进行特征提取，提取出用户的语音数据的特征信息，同时通过声学模型确定标准特征信息，标准特征信息的获取方法可参见上述实施例所述，本申请实施例对此不再赘述。

步骤4、算法解码，计算相似度。通过预设的算法对特征信息和标准特征信息进行解码处理，计算二者的相似度。

步骤5、判断相似度是否大于唤醒阈值。判断相似度是否大于预设阈值，其中唤醒阈值即预设阈值可根据实际情况进行设定，本申请实施例对此不做任何限定。

步骤6、若相似度阈值小于或等于唤醒阈值，则检测到电平信号无变化，唤醒失败。

步骤7、若相似度阈值大于唤醒阈值，则输出3个脉冲信号，控制电视开机。其中，3个脉冲信号的周期可以为200ms，占空比可以为50％。本申请实施例仅以此脉冲信号为例进行说明，但并不代表本申请实施例仅局限于此。

示例的，在本申请实施例中，将以设备为智能电视为例，控制信号为低电平信号且设备中的数字信号处理模块的供电状态为通电状态，进行说明，具体的可参见图5所示，图5为本申请实施例提供的再一种语音唤醒方法的流程示意图。

步骤7、若相似度阈值大于唤醒阈值，则输出延时400ms输出低电平信号。

步骤8、响应于用户对于待机唤醒开关设置，判断数字信号处理模块是否为通电状态，在数字信号处理模块为通电状态时，结合步骤7中检测到的低电平信号，控制电视开机。示例的，在待机唤醒开关设置为开启状态时，数字信号处理模块为通电状态，在待机唤醒开关设置为关闭状态时，数字信号处理模块为断电状态。此外，数字信号处理模块为断电状态时，设备保持待机状态。

在本实施例步骤8中的判断数字信号处理模块是否为通电状态，可以与其他步骤同时进行，也可以依次进行，本申请实施例对此不做任何限定。

综上所述，本申请提供的技术方案应用于智能电视时，能够更加准确的唤醒电视，避免待机状态的电视被外部信号干扰影响出现唤醒的问题，并且在待机唤醒开关为关闭状态时，即使检测到用户的唤醒语音，依然控制设备处于待机状态，从而提高语音唤醒的准确度。

图6为本申请一实施例提供的语音唤醒装置的结构示意图。如图6所示，本申请实施例提供的语音唤醒装置60包括：

采集模块601，用于采集用户的语音数据。

获取模块602，用于根据对语音数据进行处理的处理结果，获取语音数据对应的控制信号。

控制模块603，用于根据控制信号，在确定出处于待机状态的设备满足预设唤醒条件时，控制设备执行唤醒操作，预设唤醒条件包括控制信号为低电平信号且设备中的数字信号处理模块的供电状态为通电状态，或，控制信号为至少一个脉冲信号。

可选的，预设唤醒条件包括控制信号为低电平信号且设备中的数字信号处理模块的供电状态为通电状态；控制模块603，具体用于在检测出控制信号为低电平信号时，确定低电平信号的持续时间是否大于预设时长；在低电平信号的持续时间大于预设时长，且数字信号处理模块的供电状态为通电状态时，确定处于待机状态的设备满足预设唤醒条件。

可选的，获取单元602，具体用于提取语音数据中的特征信息；判断特征信息与开机语音的标准特征信息之间的相似度是否大于预设阈值；在相似度大于预设阈值时，获取语音数据对应的控制信号。

可选的，采集模块601，还用于采集开机语音；将开机语音输入预先训练的声学模型中，得到标准特征信息，声学模型为根据样本语音对初始声学模型进行训练后得到的。

可选的，控制模块603，还用于在控制信号为高电平信号，和/或，数字信号处理模块的供电状态为断电状态时，控制待机状态的设备保持待机状态。

可选的，控制模块603，还用于在控制信号为低电平信号，且低电平信号的持续时间不大于预设时长时，控制待机状态的设备保持待机状态。

需要说明的是，本实施例提供的装置可用于执行上述的开机唤醒方法，其实现方式和技术效果类似，本实施例此处不再赘述。

需要说明的是，应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。例如，处理模块可以为单独设立的处理元件，也可以集成在上述装置的某一个芯片中实现，此外，也可以以程序代码的形式存储于上述装置的存储器中，由上述装置的某一个处理元件调用并执行以上处理模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。这里的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

例如，以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个ASIC(Application Specific Integrated Circuit，特定集成电路)，或，一个或多个DSP(Digital Signal Processor，数字信号处理器)，或，一个或者多个FPGA(FieldProgrammable Gate Array，现场可编程门阵列)等。再如，当以上某个模块通过处理元件调度程序代码的形式实现时，该处理元件可以是通用处理器，例如CPU或其它可以调用程序代码的处理器。再如，这些模块可以集成在一起，以SOC(System-on-a-Chip，片上系统)的形式实现。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机程序。在计算机上加载和执行计算机程序指令时，全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机程序可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，计算机程序可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘solid state disk(SSD))等。

本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，当计算机程序被处理器执行时实现如上任一方法实施例所述的信息显示方法。

本申请实施例还提供一种计算机程序产品，该计算机程序产品包括计算机程序，该计算机程序存储在计算机可读存储介质中，至少一个处理器可以从该计算机可读存储介质中读取计算机程序，该至少一个处理器执行计算机程序时可实现如上任一方法实施例所述的信息显示方法。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

为了方便解释，已经结合具体的实施方式进行了上述说明。但是，上述示例性的讨论不是意图穷尽或者将实施方式限定到上述公开的具体形式。根据上述的教导，可以得到多种修改和变形。上述实施方式的选择和描述是为了更好的解释原理以及实际的应用，从而使得本领域技术人员更好的使用实施方式以及适于具体使用考虑的各种不同的变形的实施方式。

Claims

1.一种语音唤醒方法，其特征在于，包括：

采集用户的语音数据；

根据对所述语音数据进行处理的处理结果，获取所述语音数据对应的控制信号；

2.根据权利要求1所述的方法，其特征在于，所述预设唤醒条件包括所述控制信号为低电平信号且所述设备中的数字信号处理模块的供电状态为通电状态；

若检测出所述控制信号为低电平信号，则确定所述低电平信号的持续时间是否大于预设时长；

3.根据权利要求1所述的方法，其特征在于，所述根据对所述语音数据进行处理的处理结果，获取所述语音数据对应的控制信号，包括：

提取所述语音数据中的特征信息；

判断所述特征信息与开机语音的标准特征信息之间的相似度是否大于预设阈值；

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

采集所述开机语音；

5.根据权利要求1-4任一项所述的方法，其特征在于，所述方法还包括：

6.根据权利要求2所述的方法，其特征在于，所述方法还包括：

7.一种语音唤醒装置，其特征在于，包括：

采集模块，用于采集用户的语音数据；

获取模块，用于根据对所述语音数据进行处理的处理结果，获取所述语音数据对应的控制信号；

控制模块，用于根据所述控制信号，在确定出处于待机状态的设备满足预设唤醒条件时，控制所述设备执行唤醒操作，所述预设唤醒条件包括所述控制信号为低电平信号且所述设备中的数字信号处理模块的供电状态为通电状态，或，所述控制信号为至少一个脉冲信号。

8.一种电子设备，包括：处理器，以及与所述处理器通信连接的存储器；

所述存储器存储计算机执行指令；

所述处理器执行所述存储器存储的计算机执行指令，以实现如权利要求1-6中任一项所述的方法。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如权利要求1至6任一项所述的方法。

10.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时，实现上述权利要求1-6任一项所述的方法。