CN107832035B

CN107832035B - 一种智能终端的语音输入方法

Info

Publication number: CN107832035B
Application number: CN201711112882.0A
Authority: CN
Inventors: 程守宝; 赵桂银
Original assignee: Shenzhen Sihao Intelligent Technology Co ltd
Current assignee: Shenzhen Sihao Intelligent Technology Co.,Ltd.
Priority date: 2017-11-13
Filing date: 2017-11-13
Publication date: 2021-03-12
Anticipated expiration: 2037-11-13
Also published as: CN107832035A

Abstract

本发明基于用户当前的语音输入所在的编辑环境建立与其对应的第一输入词库，并结合该第一输入词库和输入法自带输入词库供用户进行语音匹配，由于该第一输入词库是基于当前编辑环境建立的，因此该第一输入词库的文本数量少，进而节约了终端的存储空间；其次，由于该第一输入词库是基于当前编辑环境建立的，词库中文本更符合用户当前的输入需求，因此该第一输入词库的可匹配性更高，从而提高了用户的语音输入效率，改善了用户的输入体验；再次，该第一输入词库根据用户的编辑场景的不同而不同，词库设置的灵活性大大提高，是一种小而精的词库；此外，该第一输入词库可以根据编辑环境的存储路径进行合并或者相近路径的调用，提高了该词库的适用性。

Description

一种智能终端的语音输入方法

技术领域

本申请涉及智能终端控制的技术领域，尤其涉及一种智能终端的语音输入方法。

背景技术

经过多年的技术发展，语音输入作为一种重要的非键盘输入方法已经在平板电脑、智能手机等设备上得到了广泛的应用。采用语音进行信息数据输入，语音输入质量的高低对语音识别的准确性具有决定性作用，而语音识别的准确性又在很大程度上影响了用户体验的好坏。然而，现有的语音输入技术通常都需要服务器的支持，例如通过客户端录制声音，上传给服务器后，服务器进行语音识别，匹配获得对应的输入候选文本并返回给客户端，由客户端负责后续处理。该种方式的语音识别与输入候选文本匹配主要在网络端实现，依赖于网络连接，且需要庞大的数据模型。对于处理速度、带宽等都受限的用户设备来讲，该种方式不利于用户的使用体验。

针对上述问题，文献CN103699530A提供一种用于在用户设备中根据语音输入信息在目标应用中进行文本输入的方法与设备；通过获取用户通过用户设备的语音采集装置所输入的语音输入信息；对该语音输入信息进行语音识别处理，以获得与该语音输入信息相对应的语言字符串；根据该语言字符串，在与该目标应用所对应的输入法相对应的输入词库中进行匹配查询，以获得与该语言字符串相匹配的一个或多个输入候选文本，将该一个或多个输入候选文本中至少一个提供给该目标应用。

然而，上述方法也存在许多缺陷，首先，上述方法虽然实现了输入词库的本地匹配，但匹配的输入词库由输入法提供，而用户终端的输入法往往有多种，这就会造成用户在终端本地存储多个输入词库，由此造成占用大量的终端存储空间，因此，这种输入匹配与存储的方法效率低下；此外，由于上述方法提供的词库是固定不变的，无法根据用户的使用过程灵活调整，由此造成用户体验不佳；最后，上述方法仅仅针对应用程序进行语音输入与控制，并未考虑用户对终端进行语音输入的其他场景，因此，上述方法的应用存在局限性。

发明内容

针对上述问题，本发明提供一种智能终端的语音输入方法，所述方法包括如下步骤：

S1，检测用户是否启用所述智能终端中输入法中的语音输入功能；如果启用所述语音输入功能，则进入步骤S2；如果未启用所述语音输入功能，则不做任何操作；

S2，检测用户当前输入光标所在的编辑环境中是否存在文本信息，如果存在所述文本信息，则进入步骤S3；如果不存在所述文本信息，则进入步骤S4；

S3，获取所述文本信息，并基于所述文本信息建立与当前编辑环境对应的第一输入词库，所述第一输入词库的调用优先级高于所述输入法自带输入词库的调用优先级；基于所述第一输入词库和所述自带输入词库对用户的语音输入信息进行识别与匹配查询，如果所述语音输入信息与所述第一输入词库匹配成功且所述语音输入信息与所述自带输入词库匹配成功，则直接将所述匹配成功的文本输入到文本编辑区；否则，进入步骤S5；

S4，基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询，将所述匹配结果提供给所述用户进行选择与输入；

S5，为用户提供输入候选文本以供用户选择，并将用户选择的所述候选文本更新到所述第一输入词库。

作为一种优选的实施方式，将所述第一输入词库存储到与其对应的文本编辑环境相同的存储路径内；检测所述存储路径的子目录和父目录内是否有其他输入词库，如果有，则合并所述第一输入词库和其他输入词库为同路径输入词库，并建立所述同路径输入词库与所述路径下语音输入的对应关系，以供在所述路径下进行语音输入过程中对所述同路径输入词库的调用，所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级；如果无，则在所述存储路径的子目录和父目录进行语音输入过程中给用户提供语音输入的所述第一输入词库的调用建议。

作为一种优选的实施方式，所述基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询，将所述匹配结果提供给所述用户进行选择与输入，具体包括：

检测当前文本编辑环境的存储路径的子目录和父目录内是否有所述同路径输入词库，如果有，则建立所述同路径输入词库和所述输入法自带输入词库与所述当前文本编辑环境的语音输入的对应关系，以供在所述路径下进行语音输入过程中对所述同路径输入词库和所述输入法自带输入词库的调用，所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级；如果无，则基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询，将所述匹配结果提供给所述用户进行选择与输入。

作为一种优选的实施方式，检测用户是否对所述文本编辑区内语音识别输入的文本进行替换操作，如果进行所述替换操作，则在所述第一输入词库中用替换后的文本替换被替换的文本；如果未进行所述替换操作，则不做任何操作。

本发明基于用户当前的语音输入所在的编辑环境建立与其对应的第一输入词库，并结合该第一输入词库和输入法自带输入词库供用户进行语音匹配，由于该第一输入词库是基于当前编辑环境建立的，因此该第一输入词库的文本数量少，进而节约了终端的存储空间；其次，由于该第一输入词库是基于当前编辑环境建立的，词库中文本更符合用户当前的输入需求，因此该第一输入词库的可匹配性更高，从而提高了用户的语音输入效率，改善了用户的输入体验；再次，该第一输入词库根据用户的编辑场景的不同而不同，词库设置的灵活性大大提高，是一种小而精的词库；此外，该第一输入词库可以根据编辑环境的存储路径进行合并或者相近路径的调用，进一步提高了该词库的适用性；最后，本发明的语音输入所在的编辑环境不受限制，应用范围广阔。

此外，发明提供一种智能终端的语音输入装置，所述装置包括如下模块：

语音输入启用模块，用于检测用户是否启用所述智能终端中输入法中的语音输入功能；如果启用所述语音输入功能，则执行文本信息监测模块；如果未启用所述语音输入功能，则不做任何操作；

文本信息监测模块，用于检测用户当前输入光标所在的编辑环境中是否存在文本信息，如果存在所述文本信息，则执行输入词库匹配模块；如果不存在所述文本信息，则执行第一输入模块；

输入词库匹配模块，用于获取所述文本信息，并基于所述文本信息建立与当前编辑环境对应的第一输入词库，所述第一输入词库的调用优先级高于所述输入法自带输入词库的调用优先级；基于所述第一输入词库和所述自带输入词库对用户的语音输入信息进行识别与匹配查询，如果所述语音输入信息与所述第一输入词库匹配成功且所述语音输入信息与所述自带输入词库匹配成功，则直接将所述匹配成功的文本输入到文本编辑区；否则，执行第二输入模块；

第一输入模块，用于基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询，将所述匹配结果提供给所述用户进行选择与输入；

第二输入模块，用于为用户提供输入候选文本以供用户选择，并将用户选择的所述候选文本更新到所述第一输入词库。

附图说明

图1是本发明的一种智能终端的语音输入装置示意图。

具体实施方式

以下结合附图进一步说明本发明的实施例。

实施例一：

本发明提供一种智能终端的语音输入方法，所述方法包括如下步骤：

S1，检测用户是否启用所述智能终端中输入法中的语音输入功能；如果启用所述语音输入功能，则进入步骤S2；如果未启用所述语音输入功能，则不做任何操作；需要说明的是，用户通过与智能终端的交互，通过其上的语音采集装置输入语音输入信息，如通过麦克风输入语音输入信息，该语音输入信息对应于该用户拟在该用户设备的目标应用中输入的文本；上述语音输入功能通过输入法应用程序中的插件实现，用户通过操作该插件的开关按钮来启动或者关闭语音输入功能。

S2，检测用户当前输入光标所在的编辑环境中是否存在文本信息，如果存在所述文本信息，则进入步骤S3；如果不存在所述文本信息，则进入步骤S4；需要说明的是，上述文本信息可以是文字、字母、数字、标点符号，或者其他标记，在此不作限制。上述输入光标所在的编辑环境可以在文档中，也可以在应用程序的搜索输入框中。

S3，获取所述文本信息，并基于所述文本信息建立与当前编辑环境对应的第一输入词库，所述第一输入词库的调用优先级高于所述输入法自带输入词库的调用优先级；基于所述第一输入词库和所述自带输入词库对用户的语音输入信息进行识别与匹配查询，如果所述语音输入信息与所述第一输入词库匹配成功且所述语音输入信息与所述自带输入词库匹配成功，则直接将所述匹配成功的文本输入到文本编辑区；否则，进入步骤S5；需要说明的是，示例性的，如果输入光标所在的编辑环境为文档，则上述文本信息为文档中的文本；如果输入光标所在的编辑环境为应用程序的搜索输入框，则上述文本信息为搜索输入框中的文本。并基于上述文本建立第一输入词库，该第一输入词库的建立方式与本领域中常规的词库建立方式相同，在此不做赘述。如果所述语音输入信息同时与上述两个词库匹配成功，则表明语音输入匹配的正确性是很高的，此时直接将匹配成功的文本输入到文本编辑区，以提高用户的输入效率；相反，如果上述两个词库只有一个匹配成功或者两个词库都匹配失败，此时无法判断匹配成功的文本是否准确，此时不宜直接将匹配成功的文本输入到文本编辑区，因此，对上述两种情形进行区分。

S4，基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询，将所述匹配结果提供给所述用户进行选择与输入；需要说明的是，由于当前编辑场景下没有可供用户参考的文本信息，此时不需要建立第一输入词库，进而只能调用与匹配自带输入词库，这种情形与本领域比较常规的输入方式比较类似，在此不作赘述。

S5，为用户提供输入候选文本以供用户选择，并将用户选择的所述候选文本更新到所述第一输入词库。需要说明的是，上述候选文本可以为一个或者多个。为用户提供输入候选文本可以根据上述两个不同的词库来进行区分显示，例如，第一输入词库的候选文本显示在第一行，自带输入词库的候选文本显示在第二行，此外，也可以通过不同的颜色标记上述候选文本，以便于用户进行区分与选择。由于该第一输入词库是基于当前编辑环境建立的，因此该第一输入词库的文本数量少，进而节约了终端的存储空间；其次，由于该第一输入词库是基于当前编辑环境建立的，词库中文本更符合用户当前的输入需求，因此该第一输入词库的可匹配性更高，从而提高了用户的语音输入效率。

需要说明的是，上述智能终端包括但不限于任何可通过语音采集装置与用户进行交互的设备，如手机、笔记本、平板电脑等移动设备，或诸如智能冰箱、智能微波炉等智能家具，或大楼的地图展示器等，本领域技术人员应能理解上述用户设备仅为举例，其他现有的或今后可能出现的用户设备如可适用于本发明，也应包含在本发明保护范围以内，并在此以引用方式包含于此。

作为一种优选的实施方式，将所述第一输入词库存储到与其对应的文本编辑环境相同的存储路径内；检测所述存储路径的子目录和父目录内是否有其他输入词库，如果有，则合并所述第一输入词库和其他输入词库为同路径输入词库，并建立所述同路径输入词库与所述路径下语音输入的对应关系，以供在所述路径下进行语音输入过程中对所述同路径输入词库的调用，所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级；如果无，则在所述存储路径的子目录和父目录进行语音输入过程中给用户提供语音输入的所述第一输入词库的调用建议。例如，文档A及其第一输入词库存储在路径/E/d/a，文档C及其第二输入词库存储在路径/E/d/a/c，由于文档C存储在文档A的子目录下，此时，合并所述第一输入词库和第二输入词库为同路径输入词库AC，并建立所述同路径输入词库AC与路径/E/d/a或者路径/E/d/a/c下语音输入的对应关系，以供在所述路径下进行语音输入过程中对所述同路径输入词库AC的调用；通过上述词库的合并，避免了相同路径或者相似路径下不同词库之间的数据冗余，从而进一步降低了对存储空间的占用。此外，由于同路径输入词库是基于当前编辑环境建立的，同路径输入词库与语音输入匹配正确的概率要高于输入法自带输入词库，因此，设置其调用优先级高于所述输入法自带输入词库的调用优先级。

检测当前文本编辑环境的存储路径的子目录和父目录内是否有所述同路径输入词库，如果有，则建立所述同路径输入词库和所述输入法自带输入词库与所述当前文本编辑环境的语音输入的对应关系，以供在所述路径下进行语音输入过程中对所述同路径输入词库和所述输入法自带输入词库的调用，所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级；如果无，则基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询，将所述匹配结果提供给所述用户进行选择与输入。例如，文档A及其第一输入词库存储在路径/E/d/a，文档B存储在路径/E/d，由于文档B存储在文档A的父目录下，且文档B没有建立对应的输入词库，此时，如果当前文本编辑环境为文档B，则检测当前文本编辑环境的文档B存储在路径/E/d的子目录/E/d/a和父目录/E内是否有所述同路径输入词库，由于在子目录/E/d/a存在文档A对应的第一输入词库，此时建立所述同路径的第一输入词库和输入法自带输入词库与所述当前文本编辑环境的语音输入的对应关系，以供在路径/E/d下进行语音输入过程中对所述同路径的第一输入词库和所述输入法自带输入词库的调用。此时，调用第一输入词库是考虑到用户通常会将相同或者相似功能、用途的文档、程序存储在相同或者接近的存储路径内；该第一输入词库可以根据编辑环境的存储路径进行合并或者相近路径的调用，进一步提高了该词库的适用性。

作为一种优选的实施方式，检测用户是否对所述文本编辑区内语音识别输入的文本进行替换操作，如果进行所述替换操作，则在所述第一输入词库中用替换后的文本替换被替换的文本；如果未进行所述替换操作，则不做任何操作。需要说明的是，如果用户对语音识别输入的文本进行了替换，比如将A替换为了B，则表明该替换了的文本A不正确的，此时需要对第一输入词库进行错误更新，即将其中的文本A替换为文本B，这样就可以在下次进行相同的语音输入时避免存在同样的错误，从而提高了用户的语音输入效率。这里的文本可以是一次语音输入中的全部或者部分，例如，可以是一次语音输入中的一句话或者是其中的一个或者几个字。

实施例二：

如图1所示，发明提供一种智能终端的语音输入装置，所述装置包括如下模块：

语音输入启用模块，用于检测用户是否启用所述智能终端中输入法中的语音输入功能；如果启用所述语音输入功能，则执行文本信息监测模块；如果未启用所述语音输入功能，则不做任何操作；需要说明的是，用户通过与智能终端的交互，通过其上的语音采集装置输入语音输入信息，如通过麦克风输入语音输入信息，该语音输入信息对应于该用户拟在该用户设备的目标应用中输入的文本；上述语音输入功能通过输入法应用程序中的插件实现，用户通过操作该插件的开关按钮来启动或者关闭语音输入功能。

文本信息监测模块，用于检测用户当前输入光标所在的编辑环境中是否存在文本信息，如果存在所述文本信息，则执行输入词库匹配模块；如果不存在所述文本信息，则执行第一输入模块；需要说明的是，上述文本信息可以是文字、字母、数字、标点符号，或者其他标记，在此不作限制。上述输入光标所在的编辑环境可以在文档中，也可以在应用程序的搜索输入框中。

输入词库匹配模块，用于获取所述文本信息，并基于所述文本信息建立与当前编辑环境对应的第一输入词库，所述第一输入词库的调用优先级高于所述输入法自带输入词库的调用优先级；基于所述第一输入词库和所述自带输入词库对用户的语音输入信息进行识别与匹配查询，如果所述语音输入信息与所述第一输入词库匹配成功且所述语音输入信息与所述自带输入词库匹配成功，则直接将所述匹配成功的文本输入到文本编辑区；否则，执行第二输入模块；需要说明的是，示例性的，如果输入光标所在的编辑环境为文档，则上述文本信息为文档中的文本；如果输入光标所在的编辑环境为应用程序的搜索输入框，则上述文本信息为搜索输入框中的文本。并基于上述文本建立第一输入词库，该第一输入词库的建立方式与本领域中常规的词库建立方式相同，在此不做赘述。如果所述语音输入信息同时与上述两个词库匹配成功，则表明语音输入匹配的正确性是很高的，此时直接将匹配成功的文本输入到文本编辑区，以提高用户的输入效率；相反，如果上述两个词库只有一个匹配成功或者两个词库都匹配失败，此时无法判断匹配成功的文本是否准确，此时不宜直接将匹配成功的文本输入到文本编辑区，因此，对上述两种情形进行区分。

第一输入模块，用于基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询，将所述匹配结果提供给所述用户进行选择与输入；需要说明的是，由于当前编辑场景下没有可供用户参考的文本信息，此时不需要建立第一输入词库，进而只能调用与匹配自带输入词库，这种情形与本领域比较常规的输入方式比较类似，在此不作赘述。

第二输入模块，用于为用户提供输入候选文本以供用户选择，并将用户选择的所述候选文本更新到所述第一输入词库。需要说明的是，上述候选文本可以为一个或者多个。为用户提供输入候选文本可以根据上述两个不同的词库来进行区分显示，例如，第一输入词库的候选文本显示在第一行，自带输入词库的候选文本显示在第二行，此外，也可以通过不同的颜色标记上述候选文本，以便于用户进行区分与选择。由于该第一输入词库是基于当前编辑环境建立的，因此该第一输入词库的文本数量少，进而节约了终端的存储空间；其次，由于该第一输入词库是基于当前编辑环境建立的，词库中文本更符合用户当前的输入需求，因此该第一输入词库的可匹配性更高，从而提高了用户的语音输入效率。

实施例三：

本发明还提供一种智能终端的语音输入系统，所述语音输入系统执行上述智能终端的语音输入方法。本领域技术人员应当能够理解，上述实施例的方法或者装置实现的语音输入功能均可通过对应的方式在该智能终端的语音输入系统中实现，在此不做赘述。

本技术领域技术人员可以理解，可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来生成机器，从而通过计算机或其他可编程数据处理方法的处理器来执行的指令创建了用于实现结构图和/或框图和/或流图的框或多个框中指定的方法。

本技术领域技术人员可以理解，本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地，具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地，现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种智能终端的语音输入方法，其特征在于，所述方法包括如下步骤：

S4，基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询，将匹配结果提供给所述用户进行选择与输入；

S5，为用户提供输入候选文本以供用户选择，并将用户选择的所述候选文本更新到所述第一输入词库；

还包括：

将所述第一输入词库存储到与其对应的文本编辑环境相同的存储路径内；检测所述存储路径的子目录和父目录内是否有其他输入词库，如果有，则合并所述第一输入词库和其他输入词库为同路径输入词库，并建立所述同路径输入词库与所述路径下语音输入的对应关系，以供在所述路径下进行语音输入过程中对所述同路径输入词库的调用，所述同路径输入词库的调用优先级高于所述输入法自带输入词库的调用优先级；如果无，则在所述存储路径的子目录和父目录进行语音输入过程中给用户提供语音输入的所述第一输入词库的调用建议。

2.根据权利要求1所述的方法，其特征在于，所述基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询，将所述匹配结果提供给所述用户进行选择与输入，具体包括：

3.根据权利要求1所述的方法，其特征在于：

检测用户是否对所述文本编辑区内语音识别输入的文本进行替换操作，如果进行所述替换操作，则在所述第一输入词库中用替换后的文本替换被替换的文本；如果未进行所述替换操作，则不做任何操作。

4.一种智能终端的语音输入装置，其特征在于，所述装置包括如下模块：

第一输入模块，用于基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询，将匹配结果提供给所述用户进行选择与输入；

第二输入模块，用于为用户提供输入候选文本以供用户选择，并将用户选择的所述候选文本更新到所述第一输入词库；

还包括：

5.根据权利要求4所述的装置，其特征在于，所述基于所述自带输入词库对用户的语音输入信息进行识别与匹配查询，将所述匹配结果提供给所述用户进行选择与输入，具体包括：

6.根据权利要求4所述的装置，其特征在于：

7.一种智能终端的语音输入系统，其特征在于，所述语音输入系统执行权利要求1-3的所述智能终端的语音输入方法。