WO2017028601A1

WO2017028601A1 - 智能终端的语音控制方法、装置及电视机系统

Info

Publication number: WO2017028601A1
Application number: PCT/CN2016/084476
Authority: WO
Inventors: 韩菁
Original assignee: 深圳Tcl数字技术有限公司
Priority date: 2015-08-20
Filing date: 2016-06-02
Publication date: 2017-02-23
Also published as: CN105161106A

Abstract

一种智能终端的语音控制方法，包括：在接收到语音输入设备发送的语音指令时，采集智能终端当前展示页面上所有可控控件对象的参数信息（S10）；将所述语音指令经过语音语义识别后获得的语义文本信息与所采集的所有可控控件对象的参数信息中的文本信息进行匹配，获得与所述语音指令的语义文本信息匹配的可控控件对象（S20）；触发所述可控控件对象相应的控制操作（S30）。一种智能终端的语音控制装置及电视机系统。

Description

智能终端的语音控制方法、装置及电视机系统

技术领域

本发明涉及语音控制技术领域，尤其涉及一种智能终端的语音控制方法、装置及电视机系统。

背景技术

在三网融合的大潮流下，智能终端逐渐成为家庭娱乐的中心。面对智能终端复杂的新功能和种类日益繁多的应用软件，通过使用手工操作已经无法满足消费者对于简单、便捷控制智能终端的需求。目前，智能手机有Siri、小i机器人等主流的语音助手工具，而智能电视在智能语音助手方面还处于空白阶段。以智能电视为例，很多智能电视目前使用的语音助手工具都只是预置用户说话的模板及其对应的数据，或者仅仅是以聊天娱乐为主题的语音交互，并没有真正意义上的做到对电视机的全程语音控制，也就无法使用户丢掉遥控器而通过语音实现对电视机的全局功能控制。

发明内容

本发明的主要目的在于提供一种智能终端的语音控制方法、装置及电视机系统，旨在解决现有智能终端不能实现全程语音控制的问题。

为实现上述目的，本发明提供一种智能终端的语音控制方法，所述智能终端的语音控制方法包括：

S10、在接收到语音输入设备发送的语音指令时，采集智能终端当前展示页面上所有可控控件对象的参数信息；

S20、将所述语音指令经过语音语义识别后获得的语义文本信息与所采集的所有可控控件对象的参数信息中的文本信息进行匹配，获得与所述语音指令的语义文本信息匹配的可控控件对象；

S30、触发所述可控控件对象相应的控制操作；

其中，所述语音输入设备发送的语音指令为音频流。

为实现上述目的，本发明还提供一种智能终端的语音控制装置，所述智能终端的语音控制装置包括：

采集模块，用于在接收到语音输入设备发送的语音指令时，根据智能终端当前展示页面的视图属性采集当前展示页面上所有可控控件对象的参数信息；

匹配模块，用于将所述语音指令经过语音语义识别后获得的语义文本信息与所采集的所有可控控件对象的参数信息中的文本信息进行匹配，获得与所述语音指令的语义文本信息匹配的可控控件对象；

触发模块，用于触发所述可控控件对象相应的控制操作。

为实现上述目的，本发明还提供一种电视机系统，其特征在于，所述电视机系统包括电视机、语音输入设备、语音语义识别服务器，所述电视机上设有语音接收装置、语音控制装置；所述语音接收装置接收所述语音输入设备输入的语音指令，并将其发送至所述语音语义识别服务器进行语音语义识别，获得语义文本信息；所述语音控制装置为上述智能终端的语音控制装置，用于获得所述电视机当前展示页面上与所述语义文本信息匹配的可控控件对象，并触发所述可控控件对象相应的控制操作。

本发明提出一种智能终端的语音控制方法、装置及电视机系统，在接收到语音输入设备发送的语音指令时，能够基于智能终端后台系统的系统层采集到当前展示页面上所有的可控控件对象的参数信息，进而实现对当前展示页面上任意可控控件对象的语音控制；由于能够采集到各个展示页面上所有的可控控件对象，从而实现了对智能终端的全程语音控制。

附图说明

图1为本发明智能终端的语音控制方法第一实施例的流程示意图；

图2为本发明智能终端的语音控制方法第二实施例中采集智能终端当前展示页面上所有可控控件对象的参数信息的第一细化流程示意图；

图3为本发明智能终端的语音控制方法第三实施例中获取语音指令对应的可控控件对象的第一细化流程示意图；

图4为本发明智能终端的语音控制方法第四实施例中采集智能终端当前展示页面上所有可控控件对象的参数信息的第二细化流程示意图；

图5为本发明智能终端的语音控制方法第五实施例中获取语音指令对应的可控控件对象的第二细化流程示意图；

图6为本发明智能终端的语音控制装置第一实施例的功能模块示意图；

图7为本发明智能终端的语音控制装置第二实施例中采集模块的第一细化功能模块示意图；

图8为本发明智能终端的语音控制装置第三实施例中匹配模块的第一细化功能模块示意图；

图9为本发明智能终端的语音控制装置第四实施例中采集模块的第二细化功能模块示意图；

图10为本发明智能终端的语音控制装置第五实施例中匹配模块的第二细化功能模块示意图；

图11为本发明电视机系统的结构示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明提供一种智能终端的语音控制方法，如图1所示，示出了本发明智能终端的语音控制方法第一实施例的流程示意图，包括：

语音输入设备可以是移动终端，也可以是遥控器。所述移动终端可以是手机、平板电脑等可借助即时通讯语音模块或多屏互动语音模块进行语音输入的终端，例如，在电视机中，手机可以通过安装微信电视应用软件来实现语音控制电视机的操作。所述遥控器可以是所有支持语音输入功能的遥控器。

展示页面上的控件分为可控控件和非可控控件，可控控件能够根据指令执行进一步的操作，其控件属性为可控；非可控控件可用于在页面上展示内容，不能执行进一步的操作，其控件属性为不可控。所述采集的可控控件对象的参数信息包括可控控件对象的文本信息、控件标识、控件对象所属的控件类型（例如，按钮类、单选框类、列表类等）、控件对象的URL地址等。

用户使用移动终端或遥控器等语音输入设备输入语音指令，在用户输入语音指令的同时，语音输入设备将用户正在输入的语音指令实时转化为音频流并发送给智能终端。所述智能终端可以是智能电视，也可以是手机、平板电脑等智能移动终端。所述智能终端在接收到所述语音指令的音频流时，即开始在智能终端后台系统的系统层采集智能终端当前展示页面上所有控件对象的控件信息，并根据控件的属性从所采集的控件对象中筛选出可控属性为可控的控件对象，进而得到可控控件对象的参数信息。其中，在所述智能终端后台系统的系统层中定义有各个控件所基于的控件基类，所有的控件对象所属的控件类型均基于所述控件基类派生而成。

所述智能终端在接收完所述语音指令的音频流后，将所述音频流发送到语音识别器，其中，所述语音识别器可以是所述智能终端中的一个模块或单元，也可以是第三方的一个语音识别服务器。所述语音识别器接收所述音频流后对其进行识别并输出最终的识别结果，即语音文本信息，然后将所述语音文本信息返回给所述智能终端。

所述智能终端在接收到所述语音文本信息后将其发送到语义识别器，其中，所述语义识别器可以是所述智能终端中的一个模块或单元，也可以是第三方的一个语义识别服务器。所述语义识别器接收所述语音文本信息后对其进行分词分析，理解出关键动词和关键搜索对象，并输出最终的识别结果，即语义文本信息，然后将所述语义文本信息返回给所述智能终端。

此外，还存在这样的识别场景：所述智能终端在接收完所述语音指令的音频流后，将所述音频流发送到语音语义识别服务器，所述语音语义识别服务器将输入的音频流进行语音识别后再进行语义识别；在经过语音语义识别得到最终的语义文本信息后，将所述语义文本信息返回给所述智能终端。

所述智能终端在接收到所述语义文本信息后，将所述语义文本信息与所述采集的当前展示页面的所有可控控件对象的文本信息进行匹配，从而获得匹配后的文本信息；根据所述匹配后的文本信息和所述采集的所有可控控件对象的参数信息，即可获得与所述语音指令的语义文本信息匹配的可控控件对象。在进行匹配时可采用模糊匹配算法，所述模糊匹配算法可以是现有模糊匹配算法中的任一算法，例如，快速中文字符串模糊匹配算法。

S30、触发所述可控控件对象相应的控制操作。

例如，在获得的与所述语音指令的语义文本信息匹配的所述可控控件对象为播放节目按钮时，触发播放所述节目的相应操作；在获得的与所述语音指令的语义文本信息匹配的所述可控控件对象为下拉列表时，触发展开所述下拉列表并显示下拉列表内容的相应操作；在获得的与所述语音指令的语义文本信息匹配的所述可控控件对象为对话框中的“确定”按钮时，触发执行所述“确定”按钮相应的操作；在获得的与所述语音指令的语义文本信息匹配的所述可控控件对象为网页上的一个链接时，触发跳转到所述链接相应的网页上的操作。

本发明提出的智能终端的语音控制方法是在智能终端后台系统的系统层进行控件的采集，可以采集到所有基于系统层的控件基类而实现的控件的参数信息，适用于任意第三方应用，达到了统一适配的效果，使得语音控制在智能终端中的覆盖面和可控范围得到大幅提升，实现了真正意义上的全程语音控制。

进一步地，基于第一实施例提出本发明智能终端的语音控制方法第二实施例，在本实施例中，如图2所示，上述步骤S10包括：

S11、在所述当前展示页面的视图属性为对话框或图像展示页面时，采集智能终端当前展示页面上所有控件对象的参数信息，并从中筛选出所有的可控控件对象；

所有展示页面都有一个视图属性，本实施例中，所述视图属性被分为3类，分别为对话框视图类、网页视图类、图像展示视图类。

获取当前展示页面的参数信息，参数信息中包括当前展示页面的视图属性和页面上所有的控件对象。根据所述参数信息和所述定义的控件基类，在当前展示页面的视图属性为对话框或图像展示页面时，采集智能终端当前展示页面上所有控件对象的参数信息，所述参数信息包括控件对象的文本信息、可控属性、控件标识、所属控件类型等。根据控件对象的可控属性是否为可控，从所述采集的所有控件对象中筛选出所有的可控控件对象。

S12、根据所述所有的可控控件对象所属的控件类型，提取出所有可控控件对象的参数信息。

根据所述所有的可控控件对象所属的控件类型构建分类控件对象列表，在所述分类控件对象列表中，属于同一控件类型的所有可控控件对象的参数信息存储在同一列表中，所述参数信息包括控件对象的文本信息、控件标识、所属控件类型。在构建所述分类控件对象列表完成后，将所有可控控件对象的文本信息和控件标识以JSON数据格式进行封装（所述文本信息和控件标识呈对应关系），从而获得所有可控控件对象的参数信息。

本发明第二实施例提出的采集智能终端当前展示页面上所有可控控件对象的参数信息的方法，根据当前展示页面的视图属性，在智能终端后台系统的系统层基于各个控件对象所基于的控件基类进行参数采集，能够采集到智能终端当前展示页面中所有继承自所述控件基类的所有可控控件对象的参数信息，适用于任意第三方应用上各类控件的采集。

进一步地，基于第二实施例提出本发明智能终端的语音控制方法第三实施例，在本实施例中，如图3所示，上述步骤S20包括：

S21、将所述语音指令经过语音语义识别后获得的语义文本信息与所采集的所有可控控件对象的参数信息中的文本信息进行匹配，获得匹配后的文本信息；

S22、根据所述文本信息和控件标识的对应关系，获得与所述匹配后的文本信息对应的可控控件对象的控件标识，以根据该控件标识触发所述可控控件对象相应的控制操作。

本实施例中，在获得所述匹配后的文本信息对应的可控控件对象的控件标识后，再根据所述构建的分类控件对象列表，获得所述控件标识对应的可控控件对象，以根据所述获得的可控控件对象和其所属的控件类型实现所述可控控件对象相应的控制操作。

本发明第三实施例提出的获得与所述语音指令的语义文本信息匹配的可控控件对象的方法，通过控件标识查找得到所述匹配后的文本信息对应的可控控件对象，使查找过程的步骤更简单，易于实现。

进一步地，基于第一实施例提出本发明智能终端的语音控制方法第四实施例，在本实施例中，如图4所示，上述步骤S10包括：

S13、在所述当前展示页面的视图属性为网页时，对网页进行解析，获得网页解析信息；所述网页解析信息包括标签信息、文本信息、URL地址；

在视图属性为网页时，通过对当前展示页面进行网页解析，获得所述网页的HTML源码，在所述HTML源码中能够获取到所有控件对象的标签信息、文本信息、URL地址等。

S14、根据所述标签信息，从所述网页解析信息中提取出所有可控控件对象的参数信息。

根据所有控件对象的标签信息，从所述网页解析信息中筛选出标签属性为可链接的所有可控控件对象的参数信息，所述参数信息包括控件对象的文本信息和URL地址。然后将所述参数信息以JSON数据格式进行封装（所述文本信息和URL地址呈对应关系），从而获得所有可控控件对象的参数信息。

本发明第四实施例提出的采集智能终端当前展示页面上所有可控控件对象的参数信息的方法，根据网页解析后的可控控件对象的标签信息获取当前网页上所有可控控件对象的参数信息，采集步骤简单易于实现。

进一步地，基于第四实施例提出本发明智能终端的语音控制方法第五实施例，在本实施例中，如图5所示，上述步骤S20包括：

S23、将所述语音指令经过语音语义识别后获得的语义文本信息与所采集的所有可控控件对象的参数信息中的文本信息进行匹配，获得匹配后的文本信息；

S24、根据所述文本信息和URL的对应关系，获得与所述匹配后的文本信息对应的可控控件对象的URL地址，以根据该URL地址触发所述可控控件对象相应的控制操作。

本发明第五实施例提出的根据所述匹配后的文本信息查找对应的可控控件对象的方法，适用于所有基于网页的可控控件对象的查找，查找步骤简单易于实现。

本发明还提供一种智能终端的语音控制装置，如图6所示，示出了本发明智能终端的语音控制装置第一实施例的功能模块示意图，包括：

采集模块100，用于在接收到语音输入设备发送的语音指令时，根据智能终端当前展示页面的视图属性采集当前展示页面上所有可控控件对象的参数信息；

所述语音输入设备可以是移动终端，也可以是遥控器。所述移动终端可以是手机、平板电脑等可借助即时通讯语音模块或多屏互动语音模块进行语音输入的终端，例如，在电视机中，手机可以通过安装微信电视应用软件来实现语音控制电视机的操作。所述遥控器可以是所有支持语音输入功能的遥控器。展示页面上的控件分为可控控件和非可控控件，所述可控控件能够根据指令执行进一步的操作，其控件属性为可控；所述非可控控件可用于在页面上展示内容，不能执行进一步的操作，其控件属性为不可控。

所述采集的可控控件对象的参数信息包括可控控件对象的文本信息、控件标识、控件对象所属的控件类型（例如，按钮类、单选框类、列表类等）、控件对象的URL地址等。

用户使用移动终端或遥控器等语音输入设备输入语音指令，在用户输入语音指令的同时，语音输入设备将用户正在输入的语音指令实时转化为音频流并发送给智能终端。所述智能终端可以是智能电视，也可以是手机、平板电脑等智能移动终端。所述智能终端在接收到所述语音指令的音频流时，所述采集模块100即开始在智能终端后台系统的系统层采集智能终端当前展示页面上所有控件对象的控件信息，并根据控件属性从所采集的控件对象中筛选出可控属性为可控的控件对象，进而得到可控控件对象的参数信息。其中，在所述智能终端后台系统的系统层中定义有各个控件所基于的控件基类，所有的控件对象所属的控件类型均基于所述控件基类派生而成。

匹配模块200，用于将所述语音指令经过语音语义识别后获得的语义文本信息与所采集的所有可控控件对象的参数信息中的文本信息进行匹配，获得与所述语音指令的语义文本信息匹配的可控控件对象；

此外，还存在这样的识别场景：所述智能终端在接收完所述语音指令的音频流后，将所述音频流发送到语音语义识别服务器，所述语音语义识别服务器将输入的所述音频流进行语音识别后再进行语义识别；在经过语音语义识别得到最终的语义文本信息后，将所述语义文本信息返回给所述智能终端。

所述智能终端在接收到所述语义文本信息后，匹配模块200将所述语义文本信息与所述采集的当前展示页面的所有可控控件对象的文本信息进行匹配，从而获得匹配后的文本信息；根据所述匹配后的文本信息和所述采集的所有可控控件对象的参数信息，即可获得与所述语音指令的语义文本信息匹配的可控控件对象。在进行匹配时可采用模糊匹配算法，模糊匹配算法可以是现有模糊匹配算法中的任一算法，例如，快速中文字符串模糊匹配算法。

触发模块300，用于触发所述可控控件对象相应的控制操作。

例如，在获得的与所述语音指令的语义文本信息匹配的所述可控控件对象为播放节目按钮时，触发模块300触发播放所述节目的相应操作；在获得的与所述语音指令的语义文本信息匹配的所述可控控件对象为下拉列表时，触发模块300触发展开所述下拉列表并显示下拉列表内容的相应操作；在获得的与所述语音指令的语义文本信息匹配的所述可控控件对象为对话框中的“确定”按钮时，触发模块300触发执行所述“确定”按钮相应的操作；在获得的与所述语音指令的语义文本信息匹配的所述可控控件对象为网页上的一个链接时，触发模块300触发跳转到所述链接相应的网页上的操作。

本发明提出的智能终端的语音控制装置是在智能终端后台系统的系统层进行控件的采集，可以采集到所有基于系统层的控件基类而实现的控件的参数信息，适用于任意第三方应用，达到了统一适配的效果，使得语音控制在智能终端中的覆盖面和可控范围得到大幅提升，实现了真正意义上的全程语音控制。

进一步地，参照图7，基于上述图6所示的第一实施例提出本发明智能终端的语音控制装置第二实施例，基于上述图6所示的实施例，所述采集模块100包括：

第一采集单元101，用于在所述当前展示页面的视图属性为对话框或图像展示页面时，采集智能终端当前展示页面上所有控件对象的参数信息，并从中筛选出所有的可控控件对象；

所有展示页面都有一个视图属性，本实施例中，所述视图属性被分为3类，分别为对话框视图类、网页视图类、图像展示视图类。所述第一采集单元101获取当前展示页面的参数信息，所述参数信息中包括当前展示页面的视图属性和页面上所有的控件对象。根据所述参数信息和所述定义的控件基类，在当前展示页面的视图属性为对话框或图像展示页面时，所述第一采集单元101采集智能终端当前展示页面上所有控件对象的参数信息，所述所有控件对象的参数信息包括控件对象的文本信息、可控属性、控件标识、所属控件类型等。根据控件对象的可控属性是否为可控，所述第一采集单元101从所述采集的所有控件对象中筛选出所有的可控控件对象。

第一获取单元102，用于根据所述所有的可控控件对象所属的控件类型，提取出所有可控控件对象的参数信息。

所述第一获取单元102根据所述所有的可控控件对象所属的控件类型构建分类控件对象列表，在所述分类控件对象列表中，属于同一控件类型的所有可控控件对象的参数信息存储在同一列表中，所述参数信息包括控件对象的文本信息、控件标识、所属控件类型。在构建所述分类控件对象列表完成后，所述第一获取单元102将所有可控控件对象的文本信息和控件标识以JSON数据格式进行封装（所述文本信息和控件标识呈对应关系），从而获得所有可控控件对象的参数信息。

本发明第二实施例提出的智能终端的语音控制装置，根据当前展示页面的视图属性，在智能终端后台系统的系统层基于各个控件对象所基于的控件基类进行参数采集，能够采集到当前展示页面中所有继承自所述控件基类的所有可控控件对象的参数信息，适用于任意第三方应用上各类控件的采集。

进一步地，参照图8，基于上述图7所示的第二实施例提出本发明智能终端的语音控制装置第三实施例，基于上述图6所示的实施例，所述匹配模块200包括：

第一匹配单元201，用于将所述语音指令经过语音语义识别后获得的语义文本信息与所采集的所有可控控件对象的参数信息中的文本信息进行匹配，获得匹配后的文本信息；

第二获取单元202，用于根据所述文本信息和控件标识的对应关系，获得与所述匹配后的文本信息对应的可控控件对象的控件标识，以根据该控件标识触发所述可控控件对象相应的控制操作。

本实施例中，在获得所述匹配后的文本信息对应的可控控件对象的控件标识后，所述第二获取单元202再根据所述构建的分类控件对象列表，获得所述控件标识对应的可控控件对象，以根据所述获得的可控控件对象和其所属的控件类型实现所述可控控件对象相应的控制操作。

本发明第三实施例提出的智能终端的语音控制装置，实现了通过控件标识查找得到所述匹配后的文本信息对应的可控控件对象，操作简单且易于实现。

进一步地，参照图9，基于上述图6所示的第一实施例提出本发明智能终端的语音控制装置第四实施例，基于上述图6所示的实施例，所述采集模块100包括：

第二采集单元103，用于在所述当前展示页面的视图属性为网页时，对网页进行解析，获得网页解析信息；所述网页解析信息包括标签信息、文本信息、URL地址；

在视图属性为网页时，所述第二采集单元103通过对当前展示页面进行网页解析，获得所述网页的HTML源码，在所述HTML源码中能够获取到所有控件对象的标签信息、文本信息、URL地址等。

第三获取单元104，用于根据所述标签信息，从所述网页解析信息中提取出所有可控控件对象的参数信息。

所述第三获取单元104根据所述所有控件对象的标签信息，从所述网页解析信息中筛选出标签属性为可链接的所有可控控件对象的参数信息，所述参数信息包括控件对象的文本信息和URL地址。然后将所述参数信息以JSON数据格式进行封装（所述文本信息和URL地址呈对应关系），从而获得所有可控控件对象的参数信息。

本发明第四实施例提出的智能终端的语音控制装置，实现了根据网页解析后的可控控件对象的标签信息获取当前网页上所有可控控件对象的参数信息，操作简单且易于实现。

进一步地，参照图10，基于上述图9所示的第四实施例提出本发明智能终端的语音控制装置第五实施例，基于上述图6所示的实施例，所述匹配模块200包括：

第二匹配单元203，用于将所述语音指令经过语音语义识别后获得的语义文本信息与所采集的所有可控控件对象的参数信息中的文本信息进行匹配，获得匹配后的文本信息；

第四获取单元204，用于根据所述文本信息和URL的对应关系，获得与所述匹配后的文本信息对应的可控控件对象的URL地址，以根据该URL地址触发所述可控控件对象相应的控制操作。

本发明第五实施例提出的智能终端的语音控制装置，适用于所有基于网页的可控控件对象的查找，操作简单且易于实现。

本发明还提供一种电视机系统，如图11所示，示出了本发明电视机系统的结构示意图。所述电视机系统包括电视机500、语音输入设备400、语音语义识别服务器600，所述电视机上设有语音接收装置、语音控制装置；所述语音接收装置接收所述语音输入设备400输入的语音指令，并将其发送至所述语音语义识别服务器600进行语音语义识别，获得语义文本信息；所述语音控制装置为上述任一智能终端的语音控制装置，用于获得所述电视机当前展示页面上与所述语义文本信息匹配的可控控件对象，并触发所述可控控件对象相应的控制操作。

所述语音语义识别服务器600可以是一个服务器，所述服务器既能够进行语音识别又能够进行语义识别；也可以是两个单独的服务器，即一个语音识别服务器，一个语义识别服务器。

可以理解，所述电视机系统中的语音语义识别服务器600可以由所述电视机500的所述语音控制装置中的语音语义识别模块来替代，所述语音语义识别模块具有与所述语音语义识别服务器600同样的语音语义识别功能。

本发明提出的电视机系统支持语音全程控制电视机操作，所述电视机系统中的电视机上设有语音接收装置、语音控制装置，能够支持语音对电视机的控制，且所述语音控制装置是基于电视机后台系统的系统层对当前展示页面的所有可控控件对象进行参数采集，可以采集到所有基于系统层的控件基类而实现的控件的参数信息，适用于任意第三方应用，达到了统一适配的效果，使得语音控制在电视机中的覆盖面和可控范围得到大幅提升，实现了真正意义上的全程语音控制。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

一种智能终端的语音控制方法，其特征在于，所述智能终端的语音控制方法包括：

S10、在接收到语音输入设备发送的语音指令时，采集智能终端当前展示页面上所有可控控件对象的参数信息；

S20、将所述语音指令经过语音语义识别后获得的语义文本信息与所采集的所有可控控件对象的参数信息中的文本信息进行匹配，获得与所述语音指令的语义文本信息匹配的可控控件对象；

S30、触发所述可控控件对象相应的控制操作；

其中，所述语音输入设备发送的语音指令为音频流。
如权利要求1所述的智能终端的语音控制方法，其特征在于，步骤S10包括：

在所述当前展示页面的视图属性为对话框或图像展示页面时，采集智能终端当前展示页面上所有控件对象的参数信息，并从中筛选出所有的可控控件对象；

根据所述所有的可控控件对象所属的控件类型，提取出所有可控控件对象的参数信息。
如权利要求2所述的智能终端的语音控制方法，其特征在于，所述参数信息包括文本信息和控件标识，且所述文本信息和控件标识呈对应关系；步骤S20包括：

将所述语音指令经过语音语义识别后获得的语义文本信息与所采集的所有可控控件对象的参数信息中的文本信息进行匹配，获得匹配后的文本信息；

根据所述文本信息和控件标识的对应关系，获得与所述匹配后的文本信息对应的可控控件对象的控件标识，以根据该控件标识触发所述可控控件对象相应的控制操作。
如权利要求1所述的智能终端的语音控制方法，其特征在于，步骤S10包括：

在所述当前展示页面的视图属性为网页时，对网页进行解析，获得网页解析信息；所述网页解析信息包括标签信息、文本信息、URL地址；

根据所述标签信息，从所述网页解析信息中提取出所有可控控件对象的参数信息。
如权利要求4所述的智能终端的语音控制方法，其特征在于，所述参数信息包括文本信息和URL地址，且文本信息和URL地址呈对应关系；步骤S20包括：

将所述语音指令经过语音语义识别后获得的语义文本信息与所采集的所有可控控件对象的参数信息中的文本信息进行匹配，获得匹配后的文本信息；

根据所述文本信息和URL地址的对应关系，获得与所述匹配后的文本信息对应的可控控件对象的URL地址，以根据该URL地址触发所述可控控件对象相应的控制操作。
如权利要求2所述的智能终端的语音控制方法，其特征在于，控件对象的参数信息至少包括以下之一：控件对象的文本信息、可控属性、控件标识、所属控件类型。
如权利要求6所述的智能终端的语音控制方法，其特征在于，所述从中筛选出所有的可控控件对象包括：

根据控件对象的可控属性是否为可控，从采集的所有控件对象中筛选出所有的可控控件对象。
如权利要求4所述的智能终端的语音控制方法，其特征在于，所述在所述当前展示页面的视图属性为网页时，对网页进行解析，获得网页解析信息包括：

对当前展示页面进行网页解析，以获得所述网页的HTML源码；

将所述HTML源码中所有控件对象的标签信息、文本信息、URL地址，作为所述网页解析信息。
如权利要求8所述的智能终端的语音控制方法，其特征在于，所述根据所述标签信息，从所述网页解析信息中提取出所有可控控件对象的参数信息包括：

根据所述标签信息，从所述网页解析信息中筛选出标签属性为可链接的所有可控控件对象的参数信息，其中，所述参数信息包括控件对象的文本信息和URL地址；将所述参数信息以JSON数据格式进行封装。
一种智能终端的语音控制装置，其特征在于，所述智能终端的语音控制装置包括：

采集模块，用于在接收到语音输入设备发送的语音指令时，根据智能终端当前展示页面的视图属性采集当前展示页面上所有可控控件对象的参数信息；

匹配模块，用于将所述语音指令经过语音语义识别后获得的语义文本信息与所采集的所有可控控件对象的参数信息中的文本信息进行匹配，获得与所述语音指令的语义文本信息匹配的可控控件对象；

触发模块，用于触发所述可控控件对象相应的控制操作。
如权利要求10所述的智能终端的语音控制装置，其特征在于，所述采集模块包括：

第一采集单元，用于在所述当前展示页面的视图属性为对话框或图像展示页面时，采集智能终端当前展示页面上所有控件对象的参数信息，并从中筛选出所有的可控控件对象；

第一获取单元，用于根据所述所有的可控控件对象所属的控件类型，提取出所有可控控件对象的参数信息。
如权利要求11所述的智能终端的语音控制装置，其特征在于，所述参数信息包括文本信息和控件标识，且所述文本信息和控件标识呈对应关系；所述匹配模块包括：

第一匹配单元，用于将所述语音指令经过语音语义识别后获得的语义文本信息与所采集的所有可控控件对象的参数信息中的文本信息进行匹配，获得匹配后的文本信息；

第二获取单元，用于根据所述文本信息和控件标识的对应关系，获得与所述匹配后的文本信息对应的可控控件对象的控件标识，以根据该控件标识触发所述可控控件对象相应的控制操作。
如权利要求10所述的智能终端的语音控制装置，其特征在于，所述采集模块包括：

第二采集单元，用于在所述当前展示页面的视图属性为网页时，对网页进行解析，获得网页解析信息；所述网页解析信息包括标签信息、文本信息、URL地址；

第三获取单元，用于根据所述标签信息，从所述网页解析信息中提取出所有可控控件对象的参数信息。
如权利要求13所述的智能终端的语音控制装置，其特征在于，所述参数信息包括文本信息和URL地址，且文本信息和URL地址呈对应关系；所述匹配模块包括：

第二匹配单元，用于将所述语音指令经过语音语义识别后获得的语义文本信息与所采集的所有可控控件对象的参数信息中的文本信息进行匹配，获得匹配后的文本信息；

第四获取单元，用于根据所述文本信息和URL地址的对应关系，获得与所述匹配后的文本信息对应的可控控件对象的URL地址，以根据该URL地址触发所述可控控件对象相应的控制操作。
一种电视机系统，其特征在于，所述电视机系统包括电视机、语音输入设备、语音语义识别服务器，所述电视机上设有语音接收装置、语音控制装置；所述语音接收装置接收所述语音输入设备输入的语音指令，并将其发送至所述语音语义识别服务器进行语音语义识别，获得语义文本信息；所述语音控制装置为权利要求10所述的智能终端的语音控制装置，用于获得所述电视机当前展示页面上与所述语义文本信息匹配的可控控件对象，并触发所述可控控件对象相应的控制操作。