CN106792048A

CN106792048A - 一种识别智能电视用户语音命令的方法和装置

Info

Publication number: CN106792048A
Application number: CN201611186388.4A
Authority: CN
Inventors: 刘远凤
Original assignee: TCL Corp
Current assignee: TCL Corp
Priority date: 2016-12-20
Filing date: 2016-12-20
Publication date: 2017-05-31
Anticipated expiration: 2036-12-20
Also published as: CN106792048B

Abstract

本发明属于语音识别领域，提供了一种识别智能电视用户语音命令的方法和装置，以提高智能电视用户语音命令的识别率。所述方法包括：判断当前语音命令是否结束；若所述当前语音命令已经结束，则将所述当前语音命令添加语音命令结束标识；将所述添加了语音命令结束标识的当前语音命令进行语义转换，并按照所述语义转换得到的转换结果执行所述当前语音命令。本发提供的技术方案既能够确定当前语音命令已经结束，正常停止对语音命令的识别，又能够防止在语音信号静默阶段但语音命令尚未结束时错误地停止了对语音命令的识别，从而提高对语音命令的识别成功率。

Description

一种识别智能电视用户语音命令的方法和装置

技术领域

本发明属于语音识别领域，尤其涉及一种识别智能电视用户语音命令的方法和装置。

背景技术

智能电视拥有传统电视厂商所不具备的应用平台优势。智能电视将实现网络搜索、IP电视、BBTV网视通、视频点播(VOD)、数字音乐、网络新闻、网络视频电话等各种应用服务。智能电视正在成为继计算机、手机之后的第三种信息访问终端，用户可随时访问自己需要的信息；电视机也将成为一种智能设备，实现电视、网络和程序之间跨平台搜索；智能电视还将是一个“娱乐中心”。

智能电视是基于互联网(Internet)浪潮冲击形成的新产品，其目的是带给用户更便捷的体验，目前已经成为电视的潮流趋势。由于智能电视具有全开放式平台，搭载了各操作系统，因此，用户在欣赏传统电视内容的同时，可自行安装和卸载各类应用软件，持续对功能进行扩充和升级；智能电视能够不断地给用户带来丰富的个性化体验。智能电视的语音控制到现在已经非常普及，仅需一个遥控器或手机多屏互动程序便能实现。语音控制需要电视强大的处理运算能力，首先需要通过遥控器或手机识别声音，将智能电视用户的语音命令转化为文字，再通过语音知识库来进行匹配识别，接着还需要系统自动执行相应的任务，进行音量调节、换台、切换模式等。

然而，现有的智能电视用户语音命令的识别方案中，由于语音命令录入的方式各有不同，例如语音、语速等存在差异，有时候系统没有截取到语音命令的尾音，致使系统提示语音命令识别失败。

对于上述问题，业界目前并没有提供好的解决方案。

发明内容

本发明的目的在于提供一种识别智能电视用户语音命令的方法和装置，以提高智能电视用户语音命令的识别率。

本发明第一方面提供一种识别智能电视用户语音命令的方法，所述方法包括：

判断当前语音命令是否结束；

若所述当前语音命令已经结束，则将所述当前语音命令添加语音命令结束标识；

将所述添加了语音命令结束标识的当前语音命令进行语义转换，并按照所述语义转换得到的转换结果执行所述当前语音命令。

本发明第二方面提供一种识别智能电视用户语音命令的装置，所述装置包括：

判断模块，用于判断当前语音命令是否结束；

标识添加模块，用于若所述判断模块的判断结果为所述当前语音命令已经结束，则将所述当前语音命令添加语音命令结束标识；

执行模块，用于将所述添加了语音命令结束标识的当前语音命令进行语义转换，并按照所述语义转换得到的转换结果执行所述当前语音命令。

从上述本发明技术方案可知，在判断当前语音命令已经结束后，将当前语音命令添加语音命令结束标识。将当前语音命令添加语音命令结束标识后，当后续信号处理逻辑检测到语音命令结束标识，则既能够确定当前语音命令已经结束，正常停止对语音命令的识别，又能够防止在语音信号静默阶段但语音命令尚未结束时错误地停止了对语音命令的识别，从而提高对语音命令的识别成功率。

附图说明

图1是本发明实施例一提供的识别智能电视用户语音命令的方法的实现流程示意图；

图2是本发明实施例二提供的识别智能电视用户语音命令的装置的结构示意图；

图3是本发明实施例三提供的识别智能电视用户语音命令的装置的结构示意图；

图4是本发明实施例四提供的识别智能电视用户语音命令的装置的结构示意图；

图5-a是本发明实施例五提供的识别智能电视用户语音命令的装置的结构示意图；

图5-b是本发明实施例六提供的识别智能电视用户语音命令的装置的结构示意图；

图5-c是本发明实施例七提供的识别智能电视用户语音命令的装置的结构示意图；

图6-a是本发明实施例八提供的识别智能电视用户语音命令的装置的结构示意图；

图6-b是本发明实施例九提供的识别智能电视用户语音命令的装置的结构示意图；

图6-c是本发明实施例十提供的识别智能电视用户语音命令的装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明实施例提供一种识别智能电视用户语音命令的方法和装置，所述方法包括：判断当前语音命令是否结束；若所述当前语音命令已经结束，则将所述当前语音命令添加语音命令结束标识；将所述添加了语音命令结束标识的当前语音命令进行语义转换，并按照所述语义转换得到的转换结果执行所述当前语音命令。本发明实施例还提供相应的识别智能电视用户语音命令的装置。以下分别进行详细说明。

请参阅附图1，是本发明实施例一提供的识别智能电视用户语音命令的方法的实现流程示意图，主要包括以下步骤S101至步骤S103，详细说明如下：

S101，判断当前语音命令是否结束。

需要说明的是，在判断当前语音命令是否结束之前，系统有一个初始化的过程，具体地，设定语音识别引擎的基本工作环境，包括引擎、识别上下文、语法、音频和事件等的初始化，手机端使用多屏互动连接电视，智能电视用户通过智能电视的遥控器或手机进行语音操作，语音识别引擎进行语音录音输入，Start和Stop用来控制开始和停止接受语音识别，提取智能电视用户通过遥控器或手机输入的语音命令，并将语音命令进行数据压缩，通过网络发送到智能电视终端，等等。在本发明实施例中，判断当前语音命令是否结束可通过如下步骤S1011至S1013实现：

S1011，提取当前语音命令对应语音信号的最后一帧语音数据，并将当前语音命令对应语音信号的最后一帧语音数据设置为监测点。

具体而言，在收到用户通过遥控器或者智能手机传送过来的当前语音命令后，进行语音数据的完整性检测，即，将当前语音命令对应语音信号进行分帧处理，提取当前语音命令对应语音信号的最后一帧语音数据，并将当前语音命令对应语音信号的最后一帧语音数据设置为监测点。

S1012，检测监测点的功率电平。

S1013，若经步骤S1012的检测，监测点的功率电平与参考点的功率电平相等，则确定当前语音命令已经结束。

在本发明实施例中，参考点是设置当前语音命令对应语音信号在时间轴上的一个时刻，参考点的功率电平可以是底层提供的一个基准功率，其值可以是例如1000MVA。若监测点的功率电平与参考点的功率电平相等，则表明当前语音信号已经较弱，智能电视用户已经没再输入语音命令了，即当前语音命令已宣告结束。

S102，若判断当前语音命令已经结束，则将当前语音命令添加语音命令结束标识。

在本发明实施例中，之所以在判断当前语音命令已经结束后，还要强行将当前语音命令添加语音命令结束标识，是因为不添加这个语音命令结束标识，后续处理逻辑在收到当前语音命令时，可能无法确定当前语音命令其实已经结束，从而不能正常停止语音的识别。

作为本发明一个实施例，在判断当前语音命令已经结束后，将当前语音命令添加语音命令结束标识可以是：在当前语音命令对应语音信号的结束处添加零电平，这个零电平以尾部数据的方式附加在当前语音命令对应语音信号的结束处。

S103，将添加了语音命令结束标识的当前语音命令进行语义转换，并按照所述语义转换得到的转换结果执行所述当前语音命令。

在本发明实施例中，将添加了语音命令结束标识的当前语音命令进行语义转换可采用第三方引擎实现。在将添加了语音命令结束标识的当前语音命令进行语义转换后，按照语义转换得到的转换结果执行当前语音命令，例如，按照语义转换得到的转换结果进行功能查找，查找到匹配的功能后，进行页面跳转等操作。进一步地，在本发明实施例中，还可以将语义转换得到的转换结果，例如文本信息显示给智能电视用户，以便智能电视用户可以确认对当前语音命令的识别是否正确。

考虑到语音信号的静默阶段，即智能电视用户输入了语音命令的一部分后停顿一段时间会继续输入余下部分的语音命令，可能对语音命令的识别造成困扰，例如，错误地将静默阶段视为智能电视用户的当前语音命令已经输入结束，在本发明实施例中，将当前语音命令添加语音命令结束标识之后，将添加了语音命令结束标识的当前语音命令进行语义转换之前，还可以：删除已添加了语音命令结束标识的当前语音命令对应语音信号的无声音部分，具体可以通过如下方式实现，即：检测所述已添加了语音命令结束标识的当前语音命令对应语音信号的若干连续周期内信号的功率，若所述若干连续周期内信号的功率小于预设功率阈值且变化率小于预设变化率阈值，则截除所述功率小于预设功率阈值且变化率小于预设变化率阈值的若干连续周期内信号。

从上述附图1示例的识别智能电视用户语音命令的方法可知，在判断当前语音命令已经结束后，将当前语音命令添加语音命令结束标识。将当前语音命令添加语音命令结束标识后，当后续信号处理逻辑检测到语音命令结束标识，则既能够确定当前语音命令已经结束，正常停止对语音命令的识别，又能够防止在语音信号静默阶段但语音命令尚未结束时错误地停止了对语音命令的识别，从而提高对语音命令的识别成功率。

请参阅附图2，是本发明实施例二提供的识别智能电视用户语音命令的装置的结构示意图。为了便于说明，附图2仅示出了与本发明实施例相关的部分。附图2示例的识别智能电视用户语音命令的装置可以是附图1示例的识别智能电视用户语音命令的方法的执行主体，其主要包括判断模块201、标识添加模块202和执行模块203，其中：

判断模块201，用于判断当前语音命令是否结束；

标识添加模块202，用于若判断模块201的判断结果为当前语音命令已经结束，则将当前语音命令添加语音命令结束标识；

执行模块203，用于将添加了语音命令结束标识的当前语音命令进行语义转换，并按照语义转换得到的转换结果执行当前语音命令。

需要说明的是，以上附图2示例的识别智能电视用户语音命令的装置的实施方式中，各功能模块的划分仅是举例说明，实际应用中可以根据需要，例如相应硬件的配置要求或者软件的实现的便利考虑，而将上述功能分配由不同的功能模块完成，即将所述识别智能电视用户语音命令的装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。而且，实际应用中，本实施例中的相应的功能模块可以是由相应的硬件实现，也可以由相应的硬件执行相应的软件完成，例如，前述的判断模块，可以是具有执行前述判断当前语音命令是否结束的硬件，例如判断器，也可以是能够执行相应计算机程序从而完成前述功能的一般处理器或者其他硬件设备；再如前述的标识添加模块，可以是若判断模块(或判断器)的判断结果为当前语音命令已经结束，则将当前语音命令添加语音命令结束标识的硬件，例如标识添加器，也可以是能够执行相应计算机程序从而完成前述功能的一般处理器或者其他硬件设备(本说明书提供的各个实施例都可应用上述描述原则)。

附图2示例的判断模块201可以包括监测点设置单元301、第一检测单元302和确定单元303，如附图3所示本发明实施例三提供的识别智能电视用户语音命令的装置，其中：

监测点设置单元301，用于提取当前语音命令对应语音信号的最后一帧语音数据，并将当前语音命令对应语音信号的最后一帧语音数据设置为监测点；

第一检测单元302，用于检测监测点的功率电平；

确定单元303，用于若监测点的功率电平与参考点的功率电平相等，则确定当前语音命令已经结束。

附图2示例的标识添加模块202可以包括零电平添加单元401，如附图4所示本发明实施例四提供的识别智能电视用户语音命令的装置。零电平添加单元401用于在当前语音命令对应语音信号的结束处添加零电平。

附图2至4任一示例的识别智能电视用户语音命令的装置还可以包括无声信号删除模块501，如附图5-a至5-c任一示例提供的识别智能电视用户语音命令的装置。无声信号删除模块501用于标识添加模块202将当前语音命令添加语音命令结束标识之后，执行模块203将添加了语音命令结束标识的当前语音命令进行语义转换之前，删除已添加了语音命令结束标识的当前语音命令对应语音信号的无声音部分。

附图5-a至5-c任一示例的无声信号删除模块可以包括第二检测单元601和信号截除单元602，如附图6-a至6-c任一示例提供的识别智能电视用户语音命令的装置，其中：

第二检测单元601，用于检测已添加了语音命令结束标识的当前语音命令对应语音信号的若干连续周期内信号的功率；

信号截除单元602，用于若所述若干连续周期内信号的功率小于预设功率阈值且变化率小于预设变化率阈值，则截除所述功率小于预设功率阈值且变化率小于预设变化率阈值的若干连续周期内信号。

需要说明的是，上述装置各模块/单元之间的信息交互、执行过程等内容，由于与本发明方法实施例基于同一构思，其带来的技术效果与本发明方法实施例相同，具体内容可参见本发明方法实施例中的叙述，此处不再赘述。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取存储器(RAM，RandomAccess Memory)、磁盘或光盘等。

以上对本发明实施例所提供的识别智能电视用户语音命令的方法和装置进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种识别智能电视用户语音命令的方法，其特征在于，所述方法包括：

判断当前语音命令是否结束；

2.如权利要求1所述的方法，其特征在于，所述判断当前语音命令是否结束，包括：

提取所述当前语音命令对应语音信号的最后一帧语音数据，并将所述最后一帧语音数据设置为监测点；

检测所述监测点的功率电平；

若所述监测点的功率电平与参考点的功率电平相等，则确定当前语音命令已经结束。

3.如权利要求1所述的方法，其特征在于，所述若所述当前语音命令已经结束，则将所述当前语音命令添加语音命令结束标识，包括：在所述当前语音命令对应语音信号的结束处添加零电平。

4.如权利要求1至3任意一项所述的方法，其特征在于，所述将所述当前语音命令添加语音命令结束标识之后，将所述添加了语音命令结束标识的当前语音命令进行语义转换之前，所述方法还包括：

删除所述已添加了语音命令结束标识的当前语音命令对应语音信号的无声音部分。

5.如权利要求4所述的方法，其特征在于，所述删除所述已添加了语音命令结束标识的当前语音命令对应语音信号的无声音部分，包括：

检测所述已添加了语音命令结束标识的当前语音命令对应语音信号的若干连续周期内信号的功率；

若所述若干连续周期内信号的功率小于预设功率阈值且变化率小于预设变化率阈值，则截除所述功率小于预设功率阈值且变化率小于预设变化率阈值的若干连续周期内信号。

6.一种识别智能电视用户语音命令的装置，其特征在于，所述装置包括：

判断模块，用于判断当前语音命令是否结束；

7.如权利要求6所述的装置，其特征在于，所述判断模块包括：

监测点设置单元，用于提取所述当前语音命令对应语音信号的最后一帧语音数据，并将所述最后一帧语音数据设置为监测点；

第一检测单元，用于检测所述监测点的功率电平；

确定单元，用于若所述监测点的功率电平与参考点的功率电平相等，则确定当前语音命令已经结束。

8.如权利要求6所述的装置，其特征在于，所述标识添加模块包括：

零电平添加单元，用于在所述当前语音命令对应语音信号的结束处添加零电平。

9.如权利要求6至8任意一项所述的装置，其特征在于，所述装置还包括：

无声信号删除模块，用于所述标识添加模块将所述当前语音命令添加语音命令结束标识之后，所述执行模块将所述添加了语音命令结束标识的当前语音命令进行语义转换之前，删除所述已添加了语音命令结束标识的当前语音命令对应语音信号的无声音部分。

10.如权利要求9所述的装置，其特征在于，所述无声信号删除模块包括：

第二检测单元，用于检测所述已添加了语音命令结束标识的当前语音命令对应语音信号的若干连续周期内信号的功率；

信号截除单元，用于若所述若干连续周期内信号的功率小于预设功率阈值且变化率小于预设变化率阈值，则截除所述功率小于预设功率阈值且变化率小于预设变化率阈值的若干连续周期内信号。