CN107894882A

CN107894882A - 一种移动终端的语音输入方法

Info

Publication number: CN107894882A
Application number: CN201711161400.0A
Authority: CN
Inventors: 马博
Original assignee: 马博
Current assignee: NANJING GUIJI INTELLIGENT TECHNOLOGY Co.,Ltd.
Priority date: 2017-11-21
Filing date: 2017-11-21
Publication date: 2018-04-10
Anticipated expiration: 2037-11-21
Also published as: CN107894882B

Abstract

本发明提供一种移动终端的语音输入方法，同时基于两种不同的输入法对用户输入的语音信息进行识别，并对两个识别结果进行比较，根据比较结果为用户展示识别结果，由于采用多个输入法进行识别匹配，从而提高了语音识别的准确性；此外，基于用户对识别结果的选择对两种输入法进行累计评分，并在所述评分达到阈值后淘汰积分低的输入法的语音识别模块，实现了基于输入法单个模块的保留与删除，增加了输入法设置的灵活性，提高了用户体验，同时提高对终端存储空间的利用率；最后，增加新的输入法或语音输入模块取代被淘汰的输入法或语音输入模块，体现出在语音识别过程中的优胜劣汰，进一步提高了语音识别的准确性，进而提升了用户体验。

Description

一种移动终端的语音输入方法

技术领域

本申请涉及智能终端控制的技术领域，尤其涉及一种移动终端的语音输入方法。

背景技术

经过多年的技术发展，语音输入作为一种重要的非键盘输入方法已经在平板电脑、智能手机等设备上得到了广泛的应用。采用语音进行信息数据输入，语音输入质量的高低对语音识别的准确性具有决定性作用，而语音识别的准确性又在很大程度上影响了用户体验的好坏。然而，现有的语音输入技术通常都需要服务器的支持，例如通过客户端录制声音，上传给服务器后，服务器进行语音识别，匹配获得对应的输入候选文本并返回给客户端，由客户端负责后续处理。该种方式的语音识别与输入候选文本匹配主要在网络端实现，依赖于网络连接，且需要庞大的数据模型。对于处理速度、带宽等都受限的用户设备来讲，该种方式不利于用户的使用体验。

针对上述问题，文献CN103699530A提供一种用于在用户设备中根据语音输入信息在目标应用中进行文本输入的方法与设备；通过获取用户通过用户设备的语音采集装置所输入的语音输入信息；对该语音输入信息进行语音识别处理，以获得与该语音输入信息相对应的语言字符串；根据该语言字符串，在与该目标应用所对应的输入法相对应的输入词库中进行匹配查询，以获得与该语言字符串相匹配的一个或多个输入候选文本，将该一个或多个输入候选文本中至少一个提供给该目标应用。

然而，上述方法虽然实现了在本地进行匹配查询，但在匹配效率方面却无改进，首先，由于上述方法需要将输入词库存储在本地，因此会占用大量终端存储空间，造成输入词库的利用率较低；其次，上述方法中输入法相对应的输入词库比较单一，而由于输入法程序开发公司的技术优势不同，单一输入法的词库存在“系统误差”，由此会造成匹配效率低下；最后，上述方法用户仅仅能针对输入法程序整体进行使用感知，由此用户只会对程序整体进行保留或者删除，而没有根据使用体验对输入法程序的某个模块进行保留与删除，不利于用户的个性化使用，影响了用户的使用体验。

发明内容

针对上述问题，本发明提供一种移动终端的语音输入方法，所述方法包括如下步骤：

S1，检测用户是否启用所述智能终端的语音输入功能；如果启用所述语音输入功能，则进入步骤S2；如果未启用所述语音输入功能，则不做任何操作；

S2，所述智能终端接收所述用户的语音输入信息，开启所述智能终端的第一输入法应用程序的第一语音输入插件和第二输入法应用程序的第二语音输入插件，所述第一语音输入插件和所述第二语音输入插件分别接收语音输入信息，并对所述语音输入信息进行识别，所述智能终端获取所述第一输入法应用程序的第一识别结果和所述第二输入法应用程序的第二识别结果；

S3，所述智能终端对所述第一识别结果和所述第二识别结果进行比较，如果所述第一识别结果和所述第二识别结果相同，则直接将所述识别结果的文本输入到文本编辑区；如果所述第一识别结果和所述第二识别结果不同，则进入步骤S4；

S4，分别为所述用户提供所述第一识别结果和所述第二识别结果的输入候选文本以供用户选择，并为所述用户选择的识别结果对应的输入法应用程序累积分加一分；

S5，所述智能终端获取所述累积分，并与输入法应用程序累积分胜出阈值进行比较，如果所述第一/第二输入法应用程序的累积分大于等于所述输入法应用程序累积分胜出阈值，则提示所述用户所述第二/第一输入法应用程序的语音输入插件为低效能插件，是否对所述低效能的语音输入插件进行删除，并根据所述用户的操作对所述低效能的语音输入插件进行删除或者保留。

作为一种优选的实施方式，所述步骤S3还包括：

S31，所述智能终端对所述第一识别结果和所述第二识别结果进行比较，如果所述第一识别结果和所述第二识别结果的相似度大于等于相似度阈值，则认为所述第一识别结果和所述第二识别结果相同，并进入步骤S32；如果所述第一识别结果和所述第二识别结果的相似度小于相似度阈值，则认为所述第一识别结果和所述第二识别结果不同，则进入步骤S4；

S32，比较所述第一输入法应用程序和第二输入法应用程序的所述累积分并将累积分较高的所述输入法应用程序对应的识别结果的文本输入到文本编辑区。

作为一种优选的实施方式，所述步骤S5还包括：

如果所述用户删除所述低效能的语音输入插件，则为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件；如果所述用户接收推荐所述第三输入法应用程序及其语音输入插件，则在所述用户启用所述语音输入功能时，用所述第三输入法应用程序及其语音输入插件取代所述低效能的语音输入插件对应的输入法应用程序；并将所述第三输入法应用程序的累积分置零，将大于等于所述输入法应用程序的累积分胜出阈值的输入法应用程序的累积分清零。

作为一种优选的实施方式，所述为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件，还包括：

检测所述智能终端是否有已安装的第三输入法应用程序；

如果有，则检测所述第三输入法应用程序是否已经安装语音输入插件，如果已安装所述语音输入插件，则为用户推荐所述第三输入法应用程序及其语音输入插件；如果未安装所述语音输入插件，则自动安装所述第三输入法应用程序的语音输入插件，并在安装成功后为用户推荐所述第三输入法应用程序及其语音输入插件；

如果没有，则根据服务器中输入法应用程序的下载数量，为所述用户推荐安装除所述第一输入法应用程序和所述第二输入法应用程序以外下载数量最多的输入法应用程序及其语音输入插件。

此外，发明提供一种移动终端的语音输入装置，所述装置包括如下模块：

语音输入功能启动检测模块，用于检测用户是否启用所述智能终端的语音输入功能；如果启用所述语音输入功能，则执行语音识别模块；如果未启用所述语音输入功能，则不做任何操作；

语音识别模块，用于所述智能终端接收所述用户的语音输入信息，开启所述智能终端的第一输入法应用程序的第一语音输入插件和第二输入法应用程序的第二语音输入插件，所述第一语音输入插件和所述第二语音输入插件分别接收语音输入信息，并对所述语音输入信息进行识别，所述智能终端获取所述第一输入法应用程序的第一识别结果和所述第二输入法应用程序的第二识别结果；

结果比较模块，用于所述智能终端对所述第一识别结果和所述第二识别结果进行比较，如果所述第一识别结果和所述第二识别结果相同，则直接将所述识别结果的文本输入到文本编辑区；如果所述第一识别结果和所述第二识别结果不同，则执行积分计算模块；

积分计算模块，用于分别为所述用户提供所述第一识别结果和所述第二识别结果的输入候选文本以供用户选择，并为所述用户选择的识别结果对应的输入法应用程序累积分加一分；

更新模块，用于所述智能终端获取所述累积分，并与输入法应用程序累积分胜出阈值进行比较，如果所述第一/第二输入法应用程序的累积分大于等于所述输入法应用程序累积分胜出阈值，则提示所述用户所述第二/第一输入法应用程序的语音输入插件为低效能插件，是否对所述低效能的语音输入插件进行删除，并根据所述用户的操作对所述低效能的语音输入插件进行删除或者保留。

作为一种优选的实施方式，所述结果比较模块还包括：

相似度判断模块，用于所述智能终端对所述第一识别结果和所述第二识别结果进行比较，如果所述第一识别结果和所述第二识别结果的相似度大于等于相似度阈值，则认为所述第一识别结果和所述第二识别结果相同，并执行积分比较模块；如果所述第一识别结果和所述第二识别结果的相似度小于相似度阈值，则认为所述第一识别结果和所述第二识别结果不同，则执行积分计算模块；

积分比较模块，用于比较所述第一输入法应用程序和第二输入法应用程序的所述累积分并将累积分较高的所述输入法应用程序对应的识别结果的文本输入到文本编辑区。

作为一种优选的实施方式，所述更新模块还包括：

检测所述智能终端是否有已安装的第三输入法应用程序；

附图说明

图1是本发明的一种移动终端的语音输入装置示意图。

具体实施方式

以下结合附图进一步说明本发明的实施例。

实施例一：

本发明提供一种移动终端的语音输入方法，所述方法包括如下步骤：

S1，检测用户是否启用所述智能终端的语音输入功能；如果启用所述语音输入功能，则进入步骤S2；如果未启用所述语音输入功能，则不做任何操作；需要说明的是，用户通过与智能终端的交互，通过其上的语音采集装置输入语音输入信息，如通过麦克风输入语音输入信息，该语音输入信息对应于该用户拟在该用户设备的目标应用中输入的文本；上述语音输入功能通过输入法应用程序中的插件实现，用户通过操作该插件的开关按钮来启动或者关闭语音输入功能。

S2，所述智能终端接收所述用户的语音输入信息，开启所述智能终端的第一输入法应用程序的第一语音输入插件和第二输入法应用程序的第二语音输入插件，所述第一语音输入插件和所述第二语音输入插件分别接收语音输入信息，并对所述语音输入信息进行识别，所述智能终端获取所述第一输入法应用程序的第一识别结果和所述第二输入法应用程序的第二识别结果；示例性的，所述第一输入法应用程序为搜狗输入法，所述第二输入法应用程序为讯飞输入法；所述第一语音输入插件和所述第二语音输入插件分别接收语音输入信息，可以为上述两个输入法程序同时开放语音接收功能，即将麦克风接收的语音信息同时提供给两个输入法程序的两个语音输入插件，以采集语音输入信息；需要说明的是，上述搜狗输入法的语音输入插件基于该输入法提供的数据库进行语音识别，上述讯飞输入法的语音输入插件基于该输入法提供的数据库进行语音识别，两个输入法的语音识别是分别独立进行的，互相不受影响，此时，由于两个不同输入法程序开发公司的技术优势不同，两个输入法的语音识别独立进行可以有效避免“系统误差”，充分发挥各自的技术优势，从而提高匹配效率。

S3，所述智能终端对所述第一识别结果和所述第二识别结果进行比较，如果所述第一识别结果和所述第二识别结果相同，则直接将所述识别结果的文本输入到文本编辑区；如果所述第一识别结果和所述第二识别结果不同，则进入步骤S4；需要说明的是，如果两个不同输入法的语音输入模块的识别结果相同，则说明两者都匹配的正确性是很高的，此时直接将匹配成功的文本输入到文本编辑区，以提高用户的输入效率。

S4，分别为所述用户提供所述第一识别结果和所述第二识别结果的输入候选文本以供用户选择，并为所述用户选择的识别结果对应的输入法应用程序累积分加一分；需要说明的是，如果上述两个不同输入法的语音输入模块的识别结果不同，此时无法准确判断哪一个语音输入模块是匹配成功的，此时不宜直接将匹配成功的文本输入到文本编辑区，因此，对上述两种情形进行区分。此外，设置累积分的方式以记录输入法应用程序匹配成功的次数，以便后续对两个输入法程序的匹配效率进行比较，进而作出更优选择。

S5，所述智能终端获取所述累积分，并与输入法应用程序累积分胜出阈值进行比较，如果所述第一/第二输入法应用程序的累积分大于等于所述输入法应用程序累积分胜出阈值，则提示所述用户所述第二/第一输入法应用程序的语音输入插件为低效能插件，是否对所述低效能的语音输入插件进行删除，并根据所述用户的操作对所述低效能的语音输入插件进行删除或者保留。需要说明的是，由于用户选择次数就是对应输入法程序的语音输入模块的积分，因此，上述累积分准确的反映了输入法程序的语音输入模块准确识别出语音信息的次数；如果输入法应用程序累积分高于累积分胜出阈值，则另外一个输入法程序则明显影响用户的使用体验；例如，第一输入法程序搜狗输入法的累积分为36分，第二输入法程序讯飞输入法的累积分为78分，上述累积分胜出阈值为60分，则第二输入法程序讯飞输入法的累积分已经高于累积分胜出阈值60分，此时，提示所述用户所述第一输入法应用程序搜狗输入法的语音输入插件为低效能插件，是否对所述低效能的搜狗输入法语音输入插件进行删除，并根据所述用户的操作对所述低效能的搜狗输入法语音输入插件进行删除或者保留。这里基于用户对识别结果的选择对两种输入法进行累计评分，并在所述评分达到阈值后淘汰积分低的输入法的语音识别模块，实现了基于输入法单个模块即语音输入模块的保留与删除，此时用户可以保留并正常使用搜狗输入法的其他输入模块，如键盘输入模块；由此增加了输入法设置的灵活性，提高了用户体验，同时提高对终端存储空间的利用率。

作为一种优选的实施方式，所述步骤S3还包括：

S31，所述智能终端对所述第一识别结果和所述第二识别结果进行比较，如果所述第一识别结果和所述第二识别结果的相似度大于等于相似度阈值，则认为所述第一识别结果和所述第二识别结果相同，并进入步骤S32；如果所述第一识别结果和所述第二识别结果的相似度小于相似度阈值，则认为所述第一识别结果和所述第二识别结果不同，则进入步骤S4；需要说明的是，这里设置了相似度及相似度阈值的识别结果比较方式，从而提高了比较的容错性，更加具有实用性。

作为一种优选的实施方式，所述步骤S5还包括：

如果所述用户删除所述低效能的语音输入插件，则为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件；如果所述用户接收推荐所述第三输入法应用程序及其语音输入插件，则在所述用户启用所述语音输入功能时，用所述第三输入法应用程序及其语音输入插件取代所述低效能的语音输入插件对应的输入法应用程序；并将所述第三输入法应用程序的累积分置零，将大于等于所述输入法应用程序的累积分胜出阈值的输入法应用程序的累积分清零。需要说明的是，由于上述进行比较的两种输入法程序中的搜狗输入法的语音输入模块已经被删除，此时则无法实现语音输入功能的比较，因此，这里需要增加一种新的语音输入法来作为比较的对象；例如，为用户推荐第三输入法应用程序五笔输入法及其语音输入插件，在用户对该五笔输入法及其语音输入插件进行正确安装后，在所述用户启用所述语音输入功能时，用第三输入法应用程序五笔输入法及其语音输入插件取代搜狗输入法的输入法应用程序，进而执行上述搜狗输入法和讯飞输入法程序再语音识别过程中的比较操作，此时，实现了在语音输入过程中的五笔输入法取代搜狗输入法，在此不做赘述。此外，需要将原来保留的讯飞输入法的累积分清零，以实现讯飞输入法和五笔输入法在后续语音输入过程中的公平比较；进一步的，在讯飞输入法和五笔输入法中某个输入法程序的累积分达到上述累积分阈值后，继续执行上述的删除与推荐操作，在此不做赘述。

检测所述智能终端是否有已安装的第三输入法应用程序；

如果有，则检测所述第三输入法应用程序是否已经安装语音输入插件，如果已安装所述语音输入插件，则为用户推荐所述第三输入法应用程序及其语音输入插件；如果未安装所述语音输入插件，则自动安装所述第三输入法应用程序的语音输入插件，并在安装成功后为用户推荐所述第三输入法应用程序及其语音输入插件；需要说明的是，这里为用户提供输入法应用程序的语音输入插件的安装推荐，用于进行后续语音输入过程中的语音识别与识别结果的比较操作。此外，优选的，由于用户已经安装的输入法程序一般具有较好的使用体验，这里优先选择已经被用户终端安装的输入法应用程序及其语音输入插件，以减少输入法程序对用户终端存储空间的占用。

如果没有，则根据服务器中输入法应用程序的下载数量，为所述用户推荐安装除所述第一输入法应用程序和所述第二输入法应用程序以外下载数量最多的输入法应用程序及其语音输入插件。需要说明的是，由于输入法应用程序的下载数量越多，则其多多数用户的使用体验越好，因此，优先推荐下载数量较多的输入法应用程序供用户进行选择。

实施例二：

如图1所示，发明提供一种移动终端的语音输入装置，所述装置包括如下模块：

语音输入功能启动检测模块，用于检测用户是否启用所述智能终端的语音输入功能；如果启用所述语音输入功能，则执行语音识别模块；如果未启用所述语音输入功能，则不做任何操作；需要说明的是，用户通过与智能终端的交互，通过其上的语音采集装置输入语音输入信息，如通过麦克风输入语音输入信息，该语音输入信息对应于该用户拟在该用户设备的目标应用中输入的文本；上述语音输入功能通过输入法应用程序中的插件实现，用户通过操作该插件的开关按钮来启动或者关闭语音输入功能。

语音识别模块，用于所述智能终端接收所述用户的语音输入信息，开启所述智能终端的第一输入法应用程序的第一语音输入插件和第二输入法应用程序的第二语音输入插件，所述第一语音输入插件和所述第二语音输入插件分别接收语音输入信息，并对所述语音输入信息进行识别，所述智能终端获取所述第一输入法应用程序的第一识别结果和所述第二输入法应用程序的第二识别结果；示例性的，所述第一输入法应用程序为搜狗输入法，所述第二输入法应用程序为讯飞输入法；所述第一语音输入插件和所述第二语音输入插件分别接收语音输入信息，可以为上述两个输入法程序同时开放语音接收功能，即将麦克风接收的语音信息同时提供给两个输入法程序的两个语音输入插件，以采集语音输入信息；需要说明的是，上述搜狗输入法的语音输入插件基于该输入法提供的数据库进行语音识别，上述讯飞输入法的语音输入插件基于该输入法提供的数据库进行语音识别，两个输入法的语音识别是分别独立进行的，互相不受影响，此时，由于两个不同输入法程序开发公司的技术优势不同，两个输入法的语音识别独立进行可以有效避免“系统误差”，充分发挥各自的技术优势，从而提高匹配效率。

结果比较模块，用于所述智能终端对所述第一识别结果和所述第二识别结果进行比较，如果所述第一识别结果和所述第二识别结果相同，则直接将所述识别结果的文本输入到文本编辑区；如果所述第一识别结果和所述第二识别结果不同，则执行积分计算模块；需要说明的是，如果两个不同输入法的语音输入模块的识别结果相同，则说明两者都匹配的正确性是很高的，此时直接将匹配成功的文本输入到文本编辑区，以提高用户的输入效率。

积分计算模块，用于分别为所述用户提供所述第一识别结果和所述第二识别结果的输入候选文本以供用户选择，并为所述用户选择的识别结果对应的输入法应用程序累积分加一分；需要说明的是，如果上述两个不同输入法的语音输入模块的识别结果不同，此时无法准确判断哪一个语音输入模块是匹配成功的，此时不宜直接将匹配成功的文本输入到文本编辑区，因此，对上述两种情形进行区分。此外，设置累积分的方式以记录输入法应用程序匹配成功的次数，以便后续对两个输入法程序的匹配效率进行比较，进而作出更优选择。

更新模块，用于所述智能终端获取所述累积分，并与输入法应用程序累积分胜出阈值进行比较，如果所述第一/第二输入法应用程序的累积分大于等于所述输入法应用程序累积分胜出阈值，则提示所述用户所述第二/第一输入法应用程序的语音输入插件为低效能插件，是否对所述低效能的语音输入插件进行删除，并根据所述用户的操作对所述低效能的语音输入插件进行删除或者保留。需要说明的是，由于用户选择次数就是对应输入法程序的语音输入模块的积分，因此，上述累积分准确的反映了输入法程序的语音输入模块准确识别出语音信息的次数；如果输入法应用程序累积分高于累积分胜出阈值，则另外一个输入法程序则明显影响用户的使用体验；例如，第一输入法程序搜狗输入法的累积分为36分，第二输入法程序讯飞输入法的累积分为78分，上述累积分胜出阈值为60分，则第二输入法程序讯飞输入法的累积分已经高于累积分胜出阈值60分，此时，提示所述用户所述第一输入法应用程序搜狗输入法的语音输入插件为低效能插件，是否对所述低效能的搜狗输入法语音输入插件进行删除，并根据所述用户的操作对所述低效能的搜狗输入法语音输入插件进行删除或者保留。这里基于用户对识别结果的选择对两种输入法进行累计评分，并在所述评分达到阈值后淘汰积分低的输入法的语音识别模块，实现了基于输入法单个模块即语音输入模块的保留与删除，此时用户可以保留并正常使用搜狗输入法的其他输入模块，如键盘输入模块；由此增加了输入法设置的灵活性，提高了用户体验，同时提高对终端存储空间的利用率。

作为一种优选的实施方式，所述结果比较模块还包括：

相似度判断模块，用于所述智能终端对所述第一识别结果和所述第二识别结果进行比较，如果所述第一识别结果和所述第二识别结果的相似度大于等于相似度阈值，则认为所述第一识别结果和所述第二识别结果相同，并进入步骤S32；如果所述第一识别结果和所述第二识别结果的相似度小于相似度阈值，则认为所述第一识别结果和所述第二识别结果不同，则执行积分计算模块；

作为一种优选的实施方式，所述更新模块还包括：

检测所述智能终端是否有已安装的第三输入法应用程序；

实施例三：

本发明还提供一种智能终端的语音输入系统，所述语音输入系统执行上述智能终端的语音输入方法。本领域技术人员应当能够理解，上述实施例的方法或者装置实现的语音输入功能均可通过对应的方式在该智能终端的语音输入系统中实现，在此不做赘述。

本技术领域技术人员可以理解，可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来生成机器，从而通过计算机或其他可编程数据处理方法的处理器来执行的指令创建了用于实现结构图和/或框图和/或流图的框或多个框中指定的方法。

本技术领域技术人员可以理解，本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地，具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地，现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种移动终端的语音输入方法，其特征在于，所述方法包括如下步骤：

2.根据权利要求1所述的方法，其特征在于，所述步骤S3还包括：

3.根据权利要求1所述的方法，其特征在于，所述步骤S5还包括：

4.根据权利要求3所述的方法，其特征在于，所述为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件，还包括：

检测所述智能终端是否有已安装的第三输入法应用程序；

5.一种移动终端的语音输入装置，其特征在于，所述装置包括如下模块：

6.根据权利要求5所述的装置，其特征在于，所述结果比较模块还包括：

7.根据权利要求6所述的装置，其特征在于，所述更新模块还包括：

8.根据权利要求7所述的装置，其特征在于，所述为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件，还包括：

检测所述智能终端是否有已安装的第三输入法应用程序；

9.一种移动终端的语音输入系统，其特征在于，所述语音输入系统执行权利要求1-4的所述智能终端的语音输入方法。