CN106782526B

CN106782526B - 语音控制方法和装置

Info

Publication number: CN106782526B
Application number: CN201611142383.1A
Authority: CN
Inventors: 刘远凤
Original assignee: Shenzhen TCL Digital Technology Co Ltd
Current assignee: Shenzhen TCL Digital Technology Co Ltd
Priority date: 2016-12-12
Filing date: 2016-12-12
Publication date: 2020-12-29
Anticipated expiration: 2036-12-12
Also published as: CN106782526A

Abstract

本发明公开了一种语音控制方法，包括：将接收到的语音信号转换为文字信息，并在预设的语音数据库中获取所述文字信息匹配的控制指令；在获取不到所述文字信息匹配的控制指令时，获取所述文字信息中的关键词；根据所述关键词以及预存的操作习惯信息获取所述文字信息对应的控制指令，所述操作习惯信息包括预设时间间隔内所述关键词关联的控制指令的响应次数；响应获取的所述控制指令，并更新所述控制指令的响应次数。本发明还公开了一种语音控制装置。本发明可在识别不出用户基于语音信号触发的控制指令时，可通过预存的用户的操作习惯信息获取到用户可能触发的控制指令，实现对智能设备的控制。

Description

语音控制方法和装置

技术领域

本发明涉及语音控制技术领域，尤其涉及一种语音控制方法和装置。

背景技术

自从智能设备问世人们对它的依赖越来越严重,与它的交互越来越频繁,但现在智能设备的控制普遍依赖于遥控器，遥控器包括智能设备自带的遥控器以及移动终端安装的虚拟遥控器，但遥控器的操控方式复杂、效率低下，迫切的需要一种更为简单的操作方式。

语音交互就是智能交互的一个重要基础，随着人工算法实现功能上的智能化、大数据形成大量的语言模型，智能电视端的语音交互将会真正成为智能助手。但是由于用户有时说话语速快或者有口音会造成室内设备无法识别用户输入的语音信号，语音识别准确率低，导致语音控制对智能设备控制的准确性较低。

发明内容

本发明提供一种语音控制方法和装置，其主要目的在于解决语音控制对智能设备控制的便捷性降低的技术问题。

为实现上述目的，本发明提供一种语音控制方法，所述语音控制方法包括：

将接收到的语音信号转换为文字信息，并在预设的语音数据库中获取所述文字信息匹配的控制指令；

在获取不到所述文字信息匹配的控制指令时，获取所述文字信息中的关键词；

根据所述关键词以及预存的操作习惯信息获取所述文字信息对应的控制指令，所述操作习惯信息包括预设时间间隔内所述关键词关联的控制指令的响应次数；

响应获取的所述控制指令，并更新所述控制指令的响应次数。

可选地，所述根据所述关键词以及预存的操作习惯信息获取所述文字信息对应的控制指令的步骤包括：

获取所述关键词关联的所述控制指令中的响应次数最高的控制指令；

将响应次数最高的所述控制指令作为所述文字信息对应的控制指令。

获取所述关键词关联的所述控制指令中预设数量的控制指令，其中，获取的所述控制指令的响应次数大于所述关键词关联的所述控制指令中未获取的控制指令；

显示获取的所述控制指令对应的指令信息；

在检测到基于显示的所述指令信息触发的选择操作时，将触发选择操作的指令信息关联的控制指令作为所述文字信息对应的控制指令。

可选地，所述在预设的语音数据库中获取所述文字信息匹配的控制指令的步骤包括：

获取所述文字信息中的第一字节数，并根据所述语音信号的输入时长以及语音采样率获取所述语音信号对应的第二字节数；

在所述第一字节数小于所述第二字节数时，获取所述文字信息中的关键词；

根据所述关键词以及预存的输入习惯信息对所述文字信息进行补全，其中所述输入习惯信息包括所述关键词关联的文字信息的输入次数；

在预设的语音数据库中获取补全后的所述文字信息匹配的控制指令。

所述在预设的语音数据库中获取所述文字信息匹配的控制指令的步骤之后包括：

更新补全得到的所述文字信息的输入次数。

可选地，所述根据预存的输入习惯信息对所述文字信息进行补全的步骤包括：

获取所述关键词关联的所述文字信息中字节数等于所述第二字节数的文字信息；

采用字节数等于所述第二字节数的文字信息中输入次数最多的文字信息更新所述语音信号对应的文字信息。

此外，为实现上述目的，本发明还提出一种语音控制装置，所述语音控制装置包括：

转换模块，用于将接收到的语音信号转换为文字信息；

获取模块，用于在预设的语音数据库中获取所述文字信息匹配的控制指令，并在获取不到所述文字信息匹配的控制指令时，获取所述文字信息中的关键词，以及根据所述关键词以及预存的操作习惯信息获取所述文字信息对应的控制指令，所述操作习惯信息包括预设时间间隔内所述关键词关联的控制指令的响应次数；

响应模块，用于响应获取的所述控制指令；

更新模块，用于更新所述控制指令的响应次数。

可选地，所述获取模块包括：

第一获取单元，用于获取所述关键词关联的所述控制指令中的响应次数最高的控制指令；

第一处理单元，用于将响应次数最高的所述控制指令作为所述文字信息对应的控制指令。

可选地，所述获取模块包括：

第二获取单元，用于获取所述关键词关联的所述控制指令中预设数量的控制指令，其中，获取的所述控制指令的响应次数大于所述关键词关联的所述控制指令中未获取的控制指令；

显示单元，用于显示获取的所述控制指令对应的指令信息；

第二处理单元，用于在检测到基于显示的所述指令信息触发的选择操作时，将触发选择操作的指令信息关联的控制指令作为所述文字信息对应的控制指令。

可选地，所述获取模块还包括：

第三获取单元，用于获取所述文字信息中的第一字节数，以及根据所述语音信号的输入时长以及语音采样率获取所述语音信号对应的第二字节数，并在所述第一字节数小于所述第二字节数时，获取所述文字信息中的关键词；

补全单元，用于根据所述关键词以及预存的输入习惯信息对所述文字信息进行补全，其中所述输入习惯信息包括所述关键词关联的文字信息的输入次数；

所述第三获取单元，还用于在预设的语音数据库中获取补全后的所述文字信息匹配的控制指令；

所述更新模块，还用于更新补全得到的所述文字信息的输入次数

可选地，所述补全单元包括：

获取子单元，用于获取所述关键词关联的所述文字信息中字节数等于所述第二字节数的文字信息；

更新子单元，用于采用字节数等于所述第二字节数的文字信息中输入次数最多的文字信息更新所述语音信号对应的文字信息。

本发明提出的语音控制方法和装置，将接收到的语音信号转换为文字信息，并在语音数据库中获取不到所述文字信息匹配的控制指令时，获取所述文字信息中的关键词，根据所述关键词以及预存的操作习惯信息获取所述文字信息对应的控制指令，该操作习惯信息包括预设时间间隔内所述关键词关联的控制指令的响应次数，根据控制指令的响应次数直接可以获取到用户常用的控制指令，并响应获取的所述控制指令，然后更新所述控制指令的响应次数，以使得在识别不出用户基于语音信号触发的控制指令时，可通过预存的用户的操作习惯信息获取到用户可能触发的控制指令，实现对智能设备的控制。

附图说明

图1为本发明语音控制方法第一实施例的流程示意图；

图2为本发明语音控制方法第二实施例的流程示意图；

图3为本发明语音控制方法第三实施例的流程示意图；

图4为本发明语音控制方法第四实施例的流程示意图；

图5为本发明语音控制装置第一实施例的功能模块示意图；

图6为本发明语音控制装置第二实施例中获取模块的细化功能模块示意图；

图7为本发明语音控制装置第三实施例中获取模块的细化功能模块示意图；

图8为本发明语音控制装置第四实施例中获取模块的细化功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明提供一种语音控制显示方法。

参照图1，图1为本发明语音控制方法第一实施例的流程示意图。

本实施例提出一种语音控制方法，该语音控制方法包括：

步骤S10，将接收到的语音信号转换为文字信息。

步骤S20，在预设的语音数据库中获取所述文字信息匹配的控制指令。

接收智能设备的麦克风传输的语音信号，将该语音信号通过智能设备中的语音引擎转换为文字信息，语音数据库中存储有文字信息与控制指令之间的关联关系，根据转换得到的文字信息即可得到语音信号对应的控制指令。

步骤S30，在获取不到所述文字信息匹配的控制指令时，获取所述文字信息中的关键词。

获取不到与文字信息匹配的控制指令，则说明语音数据库中的文字信息与控制指令之间的关联关系均与转换得到的文字信息不匹配，说明语音引擎可能对语音信号的识别有误。

文字信息中的关键词可包括智能设备中安装的应用、智能设备中存储的图片和视频等数据及/或智能设备的控制参数等，在智能设备为电视机时该关键词还可包括电视节目和电视频道等。在智能设备安装应用以及存储数据时可更新其存储的关键词。将文字信息与预存的关键词进行匹配，在文件信息有部分字节与预存的关键词匹配时，将匹配的关键词作为该文字信息的关键词。

步骤S40，根据所述关键词以及预存的操作习惯信息获取所述文字信息对应的控制指令，所述操作习惯信息包括预设时间间隔内所述关键词关联的控制指令的响应次数。

可将关键词对应的控制指令的响应次数存储至智能设备的数据库中作为用户的操作习惯信息，例如针对关键词“微信”的控制指令可包括启动微信、关闭微信、登录微信、搜索微信联系人等等，不同的控制指令用户的使用频次不同。可以理解的是不同的控制指令对应的文字信息的字节数可能不同，则可先获取语音信号对应的文字信息的第一字节数，并获取关键词对应的控制指令所关联的文字信息中字节数等于第一字节数的文字信息，并将根据该文字信息对应的控制指令的响应次数获取接收到的语音信号对应的控制指令。

在本实施例中，可直接获取关键词对应的控制指令中响应次数最高的控制指令作为语音信号对应的控制指令，或者，也可显示关键词对应的控制指令中响应次数较高几个控制指令的指令信息，由用户选择其输入的控制指令。预设时间间隔可由用户或者开发人员根据需要设置，比如可为一周、一个月或者一个季度。

步骤S50，响应获取的所述控制指令，并更新所述控制指令的响应次数。

在获取到语音信号转换得到的文字信息匹配的控制指令时，可直接响应该控制指令，并更新控制指令的响应次数。在本实施例中，语音引擎转换得到的文字信息中可能识别不出关键词，此时说明语音识别失败，此时可输出提示信息提示用户重新输入语音；或者，在用户首次输入时，根据关键词以及预存的操作习惯信息可能获取不到文字信息对应的控制指令，此时可提示用户重新输入语音。

可以理解的是，该控制指令的响应次数不仅仅指基于语音控制触发的控制指令的响应次数，也包括通过其它方式如遥控器触发的控制指令的响应次数，即智能设备每次响应控制指令后均更新响应的控制指令的响应次数。

本实施例提出的语音控制方法，将接收到的语音信号转换为文字信息，并在语音数据库中获取不到所述文字信息匹配的控制指令时，获取所述文字信息中的关键词，根据所述关键词以及预存的操作习惯信息获取所述文字信息对应的控制指令，该操作习惯信息包括预设时间间隔内所述关键词关联的控制指令的响应次数，根据控制指令的响应次数直接可以获取到用户常用的控制指令，并响应获取的所述控制指令，然后更新所述控制指令的响应次数，以使得在识别不出用户基于语音信号触发的控制指令时，可通过预存的用户的操作习惯信息获取到用户可能触发的控制指令，实现对智能设备的控制。

进一步地，参照图2，基于第一实施例提出本发明语音控制方法第二实施例，在本实施例中，所述步骤S40包括：

步骤S41，获取所述关键词关联的所述控制指令中的响应次数最高的控制指令；

步骤S42，将响应次数最高的所述控制指令作为所述文字信息对应的控制指令。

可以理解的是，在获取到响应次数最高的控制指令时，可确定该获取到的控制指令与智能设备当前的运行状态是否冲突，例如响应次数最高的控制指令为开启微信但微信当前已经处于开启状态，则认为获取到的控制指令与智能设备当前的运行状态冲突，则可按照控制指令的响应次数由高到低的顺序获取与当前运行状态不冲突的控制指令；或者，可直接获取关键词关联的控制指令中与当前运行状态不冲突的控制指令，并获取不冲突的控制指令中响应次数最高的控制指令。

由于有的控制指令关联的文字信息的字节数与转换得到的文字信息的字节数不一致，则可直接获取键词关联的所述控制指令中字节数与转换得到的文字信息一致控制指令，并确定获取到的控制指令中响应次数最高的控制指令，将该响应次数最该的控制指令作为文字信息对应的控制指令。

在关键词关联的所述控制指令中的响应次数最高的控制指令为多个时，可根据控制指令的优先级取优先级最高的控制指令，或者，也可根据智能设备的运行状态确定响应次数最高的各个控制指令中与接收到的语音信号匹配的控制指令。

本实施例公开的方案，在语音信号转换的文字信息匹配不到控制指令时，可直接将文字信息中关键词关联的各个控制指令中响应次数最高的控制指令，作为接收到的语音信号对应的控制指令，可较为快速准确的响应语音信号，避免重新输入语音信号。

进一步地，参照图3，基于第一实施例提出本发明语音控制方法第三实施例，在本实施例中，所述步骤S40包括：

步骤S43，获取所述关键词关联的所述控制指令中预设数量的控制指令，其中，获取的所述控制指令的响应次数大于所述关键词关联的所述控制指令中未获取的控制指令；

步骤S44，显示获取的所述控制指令对应的指令信息；

步骤S45，在检测到基于显示的所述指令信息触发的选择操作时，将触发选择操作的指令信息关联的控制指令作为所述文字信息对应的控制指令。

该预设数量可由用户或者开发人员根据需要进行设置，例如该预设数量为3个，则可显示响应次数较高的三个控制指令，由用户选择其输入的语音信号对应的控制指令。根据文字信息的字节数获取关键词关联的控制指令在第一实施例以及第二实施例均进行了详细描述，在此不再赘述。

在本实施例中，在检测到基于显示的所述指令信息触发的选择操作时，将触发选择操作的指令信息关联的控制指令作为所述文字信息对应的控制指令之后，可更新用户选择的控制指令的次数，在用户连续基于同一文字信息选择同一控制指令的次数大于预设次数时，在再次接收到该文字信息对应的语音信号时，可直接响应该选择次数大于预设次数的控制指令。

本实施例提出的方案中，在语音信号转换的文字信息匹配不到控制指令时，可直接显示文字信息中关键词关联的各个控制指令中响应次数较高的几个控制指令由用户进行选择，可较为快速准确的响应语音信号，避免重新输入语音信号。

进一步地，参照图4，基于第一至第三任一实施例提出本发明语音控制方法第四实施例，在本实施例中，步骤S20包括：

步骤S21，获取所述文字信息中的第一字节数，并根据所述语音信号的输入时长以及语音采样率获取所述语音信号对应的第二字节数；

步骤S22，在所述第一字节数小于所述第二字节数时，获取所述文字信息中的关键词；

步骤S23，根据所述关键词以及预存的输入习惯信息对所述文字信息进行补全，其中所述输入习惯信息包括所述关键词关联的文字信息的输入次数；

步骤S24，在预设的语音数据库中获取补全后的所述文字信息匹配的控制指令；

步骤S20之后还包括：

步骤S60，更新补全得到的所述文字信息的输入次数。

图4为本发明第四实施例的一种示意图，该步骤S60可在步骤S20之后的任一步骤之后，也可与步骤S20之后的任一步骤同时执行。可以理解的是根据所述关键词以及预存的输入习惯信息对所述文字信息进行补全时，可将输入字数最高的文字信息作为语音信号对应的文字信息，即步骤S24包括：

由于用户在输入语音信号时有的字节发音不清楚或者某个字节的音量较低，导致语音引擎在将接收到的语音信号转换为文字信息时丢失某些字节，则可根据采样率以及语音信号的输入时长获取语音信号输入的第二字节数，在语音引擎转换得到的文字信息的第一字节数少于第二字节数时，说明语音引擎转换得到的文字信息有误，此时可对语音信息进行补全。具体可根据输入习惯信息进行补全，例如用户可直接将关键词关联的文字信息输入次数最高的文字信息作为语音信号对应的文字信息，需要强调的是，该输入次数最高的文字信息的字节数等于第二字节数，即获取关键词关联的文字信息中字节数等于第二字节数的文字信息，将字节数等于第二字节数的文字信息中输入次数最高的文字信息作为语音信号对应的文字信息。

可以理解的是，也可直接显示输入次数较高的几个文字信息由用户选择来进行补全，具体过程参照第三实施例在此不再赘述。或者在其它实施例中也可采用以下方案进行补全，即将获取到的文字信息与关键词对应的文字信息进行匹配，将与获取到的文字信息匹配字节数最多，且字节数等于第二字节数的文字信息作为语音信号对应的文字信息。

本实施例中公开的方案，在语音信号识别补全时很据用户的输入习惯进行语音信号的补全，提高对智能设备控制的准确性。

本发明进一步提供一种语音控制装置。

参照图5，图5为本发明语音控制装置第一实施例的功能模块示意图。

需要强调的是，对本领域的技术人员来说，图5所示功能模块图仅仅是一个较佳实施例的示例图，本领域的技术人员围绕图5所示的语音控制装置的功能模块，可轻易进行新的功能模块的补充；各功能模块的名称是自定义名称，仅用于辅助语音控制装置的各个程序功能块，不用于限定本发明的技术方案，本发明技术方案的核心是，各自定义名称的功能模块所要达成的功能。

本实施例提出一种语音控制装置，该语音控制装置包括：

转换模块10，用于将接收到的语音信号转换为文字信息；

获取模块20，用于在预设的语音数据库中获取所述文字信息匹配的控制指令，并在获取不到所述文字信息匹配的控制指令时，获取所述文字信息中的关键词，以及根据所述关键词以及预存的操作习惯信息获取所述文字信息对应的控制指令，所述操作习惯信息包括预设时间间隔内所述关键词关联的控制指令的响应次数；

响应模块30，用于响应获取的所述控制指令；

更新模块40，用于更新所述控制指令的响应次数。

本实施例提出的语音控制装置，将接收到的语音信号转换为文字信息，并在语音数据库中获取不到所述文字信息匹配的控制指令时，获取所述文字信息中的关键词，根据所述关键词以及预存的操作习惯信息获取所述文字信息对应的控制指令，该操作习惯信息包括预设时间间隔内所述关键词关联的控制指令的响应次数，根据控制指令的响应次数直接可以获取到用户常用的控制指令，并响应获取的所述控制指令，然后更新所述控制指令的响应次数，以使得在识别不出用户基于语音信号触发的控制指令时，可通过预存的用户的操作习惯信息获取到用户可能触发的控制指令，实现对智能设备的控制。

进一步地，参照图6，基于第一实施例提出本发明语音控制装置第二实施例，在本实施例中，所述获取模块20包括：

第一获取单元21，用于获取所述关键词关联的所述控制指令中的响应次数最高的控制指令；

第一处理单元22，用于将响应次数最高的所述控制指令作为所述文字信息对应的控制指令。

进一步地，参照图7，基于第一实施例提出本发明语音控制方法第三实施例，在本实施例中，所述获取模块20包括：

第二获取单元23，用于获取所述关键词关联的所述控制指令中预设数量的控制指令，其中，获取的所述控制指令的响应次数大于所述关键词关联的所述控制指令中未获取的控制指令；

显示单元24，用于显示获取的所述控制指令对应的指令信息；

第二处理单元25，用于在检测到基于显示的所述指令信息触发的选择操作时，将触发选择操作的指令信息关联的控制指令作为所述文字信息对应的控制指令。

进一步地，参照图8，基于第一至第三任一实施例提出本发明语音控制方法第四实施例，在本实施例中，获取模块20还包括：

第三获取单元26，用于获取所述文字信息中的第一字节数，以及根据所述语音信号的输入时长以及语音采样率获取所述语音信号对应的第二字节数，并在所述第一字节数小于所述第二字节数时，获取所述文字信息中的关键词；

补全单元27，用于根据所述关键词以及预存的输入习惯信息对所述文字信息进行补全，其中所述输入习惯信息包括所述关键词关联的文字信息的输入次数；

所述更新模块40，还用于更新补全得到的所述文字信息的输入次数

可以理解的是根据所述关键词以及预存的输入习惯信息对所述文字信息进行补全时，可将输入字数最高的文字信息作为语音信号对应的文字信息，即补全单元27包括：

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，云端服务器，空调器，或者网络设备等)执行本发明各个实施例的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种语音控制方法，其特征在于，所述语音控制方法包括：

将接收到的语音信号转换为文字信息；

根据所述关键词以及预存的输入习惯信息对所述文字信息进行补全；

在预设的语音数据库中获取补全后的所述文字信息匹配的控制指令；

2.如权利要求1所述的语音控制方法，其特征在于，所述根据所述关键词以及预存的操作习惯信息获取所述文字信息对应的控制指令的步骤包括：

3.如权利要求1所述的语音控制方法，其特征在于，所述根据所述关键词以及预存的操作习惯信息获取所述文字信息对应的控制指令的步骤包括：

显示获取的所述控制指令对应的指令信息；

4.如权利要求1-3任一项所述的语音控制方法，其特征在于，所述在预设的语音数据库中获取所述文字信息匹配的控制指令的步骤之后包括：

更新补全得到的所述文字信息的输入次数。

5.如权利要求1所述的语音控制方法，其特征在于，根据预存的输入习惯信息对所述文字信息进行补全的步骤包括：

6.一种语音控制装置，其特征在于，所述语音控制装置包括：

转换模块，用于将接收到的语音信号转换为文字信息；

获取模块，所述获取模块包括第三获取单元和补全单元，用于获取所述文字信息中的第一字节数，以及根据所述语音信号的输入时长以及语音采样率获取所述语音信号对应的第二字节数，并在所述第一字节数小于所述第二字节数时，获取所述文字信息中的关键词，所述补全单元用于根据所述关键词以及预存的输入习惯信息对所述文字信息进行补全，其中所述输入习惯信息包括所述关键词关联的文字信息的输入次数；所述第三获取单元，还用于在预设的语音数据库中获取补全后的所述文字信息匹配的控制指令；在获取不到所述文字信息匹配的控制指令时，获取所述文字信息中的关键词，以及根据所述关键词以及预存的操作习惯信息获取所述文字信息对应的控制指令，所述操作习惯信息包括预设时间间隔内所述关键词关联的控制指令的响应次数；

响应模块，用于响应获取的所述控制指令；

更新模块，用于更新所述控制指令的响应次数。

7.如权利要求6所述的语音控制装置，其特征在于，所述获取模块包括：

8.如权利要求6所述的语音控制装置，其特征在于，所述获取模块包括：

显示单元，用于显示获取的所述控制指令对应的指令信息；

9.如权利要求6所述的语音控制装置，其特征在于，所述获取模块还包括：

所述更新模块，还用于更新补全得到的所述文字信息的输入次数。

10.如权利要求6-8任一项所述的语音控制装置，其特征在于，所述补全单元包括：