CN107894882A - 一种移动终端的语音输入方法 - Google Patents

一种移动终端的语音输入方法 Download PDF

Info

Publication number
CN107894882A
CN107894882A CN201711161400.0A CN201711161400A CN107894882A CN 107894882 A CN107894882 A CN 107894882A CN 201711161400 A CN201711161400 A CN 201711161400A CN 107894882 A CN107894882 A CN 107894882A
Authority
CN
China
Prior art keywords
input method
application program
method application
recognition result
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711161400.0A
Other languages
English (en)
Other versions
CN107894882B (zh
Inventor
马博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NANJING GUIJI INTELLIGENT TECHNOLOGY Co.,Ltd.
Original Assignee
马博
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 马博 filed Critical 马博
Priority to CN201711161400.0A priority Critical patent/CN107894882B/zh
Publication of CN107894882A publication Critical patent/CN107894882A/zh
Application granted granted Critical
Publication of CN107894882B publication Critical patent/CN107894882B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stored Programmes (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明提供一种移动终端的语音输入方法,同时基于两种不同的输入法对用户输入的语音信息进行识别,并对两个识别结果进行比较,根据比较结果为用户展示识别结果,由于采用多个输入法进行识别匹配,从而提高了语音识别的准确性;此外,基于用户对识别结果的选择对两种输入法进行累计评分,并在所述评分达到阈值后淘汰积分低的输入法的语音识别模块,实现了基于输入法单个模块的保留与删除,增加了输入法设置的灵活性,提高了用户体验,同时提高对终端存储空间的利用率;最后,增加新的输入法或语音输入模块取代被淘汰的输入法或语音输入模块,体现出在语音识别过程中的优胜劣汰,进一步提高了语音识别的准确性,进而提升了用户体验。

Description

一种移动终端的语音输入方法
技术领域
本申请涉及智能终端控制的技术领域,尤其涉及一种移动终端的语音输入方法。
背景技术
经过多年的技术发展,语音输入作为一种重要的非键盘输入方法已经在平 板电脑、智能手机等设备上得到了广泛的应用。采用语音进行信息数据输入,语音输入质量的高低对语音识别的准确性具有决定性作用,而语音识别的准确性又在很大程度上影响了用户体验的好坏。然而,现有的语音输入技术通常都需要服务器的支持,例如通过客户端录制声音,上传给服务器后,服务器进行语音识别,匹配获得对应的输入候选文本并返回给客户端,由客户端负责后续处理。该种方式的语音识别与输入候选文本匹配主要在网络端实现,依赖于网络连接,且需要庞大的数据模型。对于处理速度、带宽等都受限的用户设备来讲,该种方式不利于用户的使用体验。
针对上述问题,文献CN103699530A提供一种用于在用户设备中根据语音输入信息在目标应用中进行文本输入的方法与设备;通过获取用户通过用户设备的语音采集装置所输入的语音输入信息;对该语音输入信息进行语音识别处理,以获得与该语音输入信息相对应的语言字符串;根据该语言字符串,在与该目标应用所对应的输入法相对应的输入词库中进行匹配查询,以获得与该语言字符串相匹配的一个或多个输入候选文本,将该一个或多个输入候选文本中至少一个提供给该目标应用。
然而,上述方法虽然实现了在本地进行匹配查询,但在匹配效率方面却无改进,首先,由于上述方法需要将输入词库存储在本地,因此会占用大量终端存储空间,造成输入词库的利用率较低;其次,上述方法中输入法相对应的输入词库比较单一,而由于输入法程序开发公司的技术优势不同,单一输入法的词库存在“系统误差”,由此会造成匹配效率低下;最后,上述方法用户仅仅能针对输入法程序整体进行使用感知,由此用户只会对程序整体进行保留或者删除,而没有根据使用体验对输入法程序的某个模块进行保留与删除,不利于用户的个性化使用,影响了用户的使用体验。
发明内容
针对上述问题,本发明提供一种移动终端的语音输入方法,所述方法包括如下步骤:
S1,检测用户是否启用所述智能终端的语音输入功能;如果启用所述语音输入功能,则进入步骤S2;如果未启用所述语音输入功能,则不做任何操作;
S2,所述智能终端接收所述用户的语音输入信息,开启所述智能终端的第一输入法应用程序的第一语音输入插件和第二输入法应用程序的第二语音输入插件,所述第一语音输入插件和所述第二语音输入插件分别接收语音输入信息,并对所述语音输入信息进行识别,所述智能终端获取所述第一输入法应用程序的第一识别结果和所述第二输入法应用程序的第二识别结果;
S3,所述智能终端对所述第一识别结果和所述第二识别结果进行比较,如果所述第一识别结果和所述第二识别结果相同,则直接将所述识别结果的文本输入到文本编辑区;如果所述第一识别结果和所述第二识别结果不同,则进入步骤S4;
S4,分别为所述用户提供所述第一识别结果和所述第二识别结果的输入候选文本以供用户选择,并为所述用户选择的识别结果对应的输入法应用程序累积分加一分;
S5,所述智能终端获取所述累积分,并与输入法应用程序累积分胜出阈值进行比较,如果所述第一/第二输入法应用程序的累积分大于等于所述输入法应用程序累积分胜出阈值,则提示所述用户所述第二/第一输入法应用程序的语音输入插件为低效能插件,是否对所述低效能的语音输入插件进行删除,并根据所述用户的操作对所述低效能的语音输入插件进行删除或者保留。
作为一种优选的实施方式,所述步骤S3还包括:
S31,所述智能终端对所述第一识别结果和所述第二识别结果进行比较,如果所述第一识别结果和所述第二识别结果的相似度大于等于相似度阈值,则认为所述第一识别结果和所述第二识别结果相同,并进入步骤S32;如果所述第一识别结果和所述第二识别结果的相似度小于相似度阈值,则认为所述第一识别结果和所述第二识别结果不同,则进入步骤S4;
S32,比较所述第一输入法应用程序和第二输入法应用程序的所述累积分并将累积分较高的所述输入法应用程序对应的识别结果的文本输入到文本编辑区。
作为一种优选的实施方式,所述步骤S5还包括:
如果所述用户删除所述低效能的语音输入插件,则为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件;如果所述用户接收推荐所述第三输入法应用程序及其语音输入插件,则在所述用户启用所述语音输入功能时,用所述第三输入法应用程序及其语音输入插件取代所述低效能的语音输入插件对应的输入法应用程序;并将所述第三输入法应用程序的累积分置零,将大于等于所述输入法应用程序的累积分胜出阈值的输入法应用程序的累积分清零。
作为一种优选的实施方式,所述为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件,还包括:
检测所述智能终端是否有已安装的第三输入法应用程序;
如果有,则检测所述第三输入法应用程序是否已经安装语音输入插件,如果已安装所述语音输入插件,则为用户推荐所述第三输入法应用程序及其语音输入插件;如果未安装所述语音输入插件,则自动安装所述第三输入法应用程序的语音输入插件,并在安装成功后为用户推荐所述第三输入法应用程序及其语音输入插件;
如果没有,则根据服务器中输入法应用程序的下载数量,为所述用户推荐安装除所述第一输入法应用程序和所述第二输入法应用程序以外下载数量最多的输入法应用程序及其语音输入插件。
本发明提供一种移动终端的语音输入方法,同时基于两种不同的输入法对用户输入的语音信息进行识别,并对两个识别结果进行比较,根据比较结果为用户展示识别结果,由于采用多个输入法进行识别匹配,从而提高了语音识别的准确性;此外,基于用户对识别结果的选择对两种输入法进行累计评分,并在所述评分达到阈值后淘汰积分低的输入法的语音识别模块,实现了基于输入法单个模块的保留与删除,增加了输入法设置的灵活性,提高了用户体验,同时提高对终端存储空间的利用率;最后,增加新的输入法或语音输入模块取代被淘汰的输入法或语音输入模块,体现出在语音识别过程中的优胜劣汰,进一步提高了语音识别的准确性,进而提升了用户体验。
此外,发明提供一种移动终端的语音输入装置,所述装置包括如下模块:
语音输入功能启动检测模块,用于检测用户是否启用所述智能终端的语音输入功能;如果启用所述语音输入功能,则执行语音识别模块;如果未启用所述语音输入功能,则不做任何操作;
语音识别模块,用于所述智能终端接收所述用户的语音输入信息,开启所述智能终端的第一输入法应用程序的第一语音输入插件和第二输入法应用程序的第二语音输入插件,所述第一语音输入插件和所述第二语音输入插件分别接收语音输入信息,并对所述语音输入信息进行识别,所述智能终端获取所述第一输入法应用程序的第一识别结果和所述第二输入法应用程序的第二识别结果;
结果比较模块,用于所述智能终端对所述第一识别结果和所述第二识别结果进行比较,如果所述第一识别结果和所述第二识别结果相同,则直接将所述识别结果的文本输入到文本编辑区;如果所述第一识别结果和所述第二识别结果不同,则执行积分计算模块;
积分计算模块,用于分别为所述用户提供所述第一识别结果和所述第二识别结果的输入候选文本以供用户选择,并为所述用户选择的识别结果对应的输入法应用程序累积分加一分;
更新模块,用于所述智能终端获取所述累积分,并与输入法应用程序累积分胜出阈值进行比较,如果所述第一/第二输入法应用程序的累积分大于等于所述输入法应用程序累积分胜出阈值,则提示所述用户所述第二/第一输入法应用程序的语音输入插件为低效能插件,是否对所述低效能的语音输入插件进行删除,并根据所述用户的操作对所述低效能的语音输入插件进行删除或者保留。
作为一种优选的实施方式,所述结果比较模块还包括:
相似度判断模块,用于所述智能终端对所述第一识别结果和所述第二识别结果进行比较,如果所述第一识别结果和所述第二识别结果的相似度大于等于相似度阈值,则认为所述第一识别结果和所述第二识别结果相同,并执行积分比较模块;如果所述第一识别结果和所述第二识别结果的相似度小于相似度阈值,则认为所述第一识别结果和所述第二识别结果不同,则执行积分计算模块;
积分比较模块,用于比较所述第一输入法应用程序和第二输入法应用程序的所述累积分并将累积分较高的所述输入法应用程序对应的识别结果的文本输入到文本编辑区。
作为一种优选的实施方式,所述更新模块还包括:
如果所述用户删除所述低效能的语音输入插件,则为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件;如果所述用户接收推荐所述第三输入法应用程序及其语音输入插件,则在所述用户启用所述语音输入功能时,用所述第三输入法应用程序及其语音输入插件取代所述低效能的语音输入插件对应的输入法应用程序;并将所述第三输入法应用程序的累积分置零,将大于等于所述输入法应用程序的累积分胜出阈值的输入法应用程序的累积分清零。
作为一种优选的实施方式,所述为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件,还包括:
检测所述智能终端是否有已安装的第三输入法应用程序;
如果有,则检测所述第三输入法应用程序是否已经安装语音输入插件,如果已安装所述语音输入插件,则为用户推荐所述第三输入法应用程序及其语音输入插件;如果未安装所述语音输入插件,则自动安装所述第三输入法应用程序的语音输入插件,并在安装成功后为用户推荐所述第三输入法应用程序及其语音输入插件;
如果没有,则根据服务器中输入法应用程序的下载数量,为所述用户推荐安装除所述第一输入法应用程序和所述第二输入法应用程序以外下载数量最多的输入法应用程序及其语音输入插件。
本发明提供一种移动终端的语音输入方法,同时基于两种不同的输入法对用户输入的语音信息进行识别,并对两个识别结果进行比较,根据比较结果为用户展示识别结果,由于采用多个输入法进行识别匹配,从而提高了语音识别的准确性;此外,基于用户对识别结果的选择对两种输入法进行累计评分,并在所述评分达到阈值后淘汰积分低的输入法的语音识别模块,实现了基于输入法单个模块的保留与删除,增加了输入法设置的灵活性,提高了用户体验,同时提高对终端存储空间的利用率;最后,增加新的输入法或语音输入模块取代被淘汰的输入法或语音输入模块,体现出在语音识别过程中的优胜劣汰,进一步提高了语音识别的准确性,进而提升了用户体验。
附图说明
图1是本发明的一种移动终端的语音输入装置示意图。
具体实施方式
以下结合附图进一步说明本发明的实施例。
实施例一:
本发明提供一种移动终端的语音输入方法,所述方法包括如下步骤:
S1,检测用户是否启用所述智能终端的语音输入功能;如果启用所述语音输入功能,则进入步骤S2;如果未启用所述语音输入功能,则不做任何操作;需要说明的是,用户通过与智能终端的交互,通过其上的语音采集装置输入语音输入信息,如通过麦克风输入语音输入信息,该语音输入信息对应于该用户拟在该用户设备的目标应用中输入的文本;上述语音输入功能通过输入法应用程序中的插件实现,用户通过操作该插件的开关按钮来启动或者关闭语音输入功能。
S2,所述智能终端接收所述用户的语音输入信息,开启所述智能终端的第一输入法应用程序的第一语音输入插件和第二输入法应用程序的第二语音输入插件,所述第一语音输入插件和所述第二语音输入插件分别接收语音输入信息,并对所述语音输入信息进行识别,所述智能终端获取所述第一输入法应用程序的第一识别结果和所述第二输入法应用程序的第二识别结果;示例性的,所述第一输入法应用程序为搜狗输入法,所述第二输入法应用程序为讯飞输入法;所述第一语音输入插件和所述第二语音输入插件分别接收语音输入信息,可以为上述两个输入法程序同时开放语音接收功能,即将麦克风接收的语音信息同时提供给两个输入法程序的两个语音输入插件,以采集语音输入信息;需要说明的是,上述搜狗输入法的语音输入插件基于该输入法提供的数据库进行语音识别,上述讯飞输入法的语音输入插件基于该输入法提供的数据库进行语音识别,两个输入法的语音识别是分别独立进行的,互相不受影响,此时,由于两个不同输入法程序开发公司的技术优势不同,两个输入法的语音识别独立进行可以有效避免“系统误差”,充分发挥各自的技术优势,从而提高匹配效率。
S3,所述智能终端对所述第一识别结果和所述第二识别结果进行比较,如果所述第一识别结果和所述第二识别结果相同,则直接将所述识别结果的文本输入到文本编辑区;如果所述第一识别结果和所述第二识别结果不同,则进入步骤S4;需要说明的是,如果两个不同输入法的语音输入模块的识别结果相同,则说明两者都匹配的正确性是很高的,此时直接将匹配成功的文本输入到文本编辑区,以提高用户的输入效率。
S4,分别为所述用户提供所述第一识别结果和所述第二识别结果的输入候选文本以供用户选择,并为所述用户选择的识别结果对应的输入法应用程序累积分加一分;需要说明的是,如果上述两个不同输入法的语音输入模块的识别结果不同,此时无法准确判断哪一个语音输入模块是匹配成功的,此时不宜直接将匹配成功的文本输入到文本编辑区,因此,对上述两种情形进行区分。此外,设置累积分的方式以记录输入法应用程序匹配成功的次数,以便后续对两个输入法程序的匹配效率进行比较,进而作出更优选择。
S5,所述智能终端获取所述累积分,并与输入法应用程序累积分胜出阈值进行比较,如果所述第一/第二输入法应用程序的累积分大于等于所述输入法应用程序累积分胜出阈值,则提示所述用户所述第二/第一输入法应用程序的语音输入插件为低效能插件,是否对所述低效能的语音输入插件进行删除,并根据所述用户的操作对所述低效能的语音输入插件进行删除或者保留。需要说明的是,由于用户选择次数就是对应输入法程序的语音输入模块的积分,因此,上述累积分准确的反映了输入法程序的语音输入模块准确识别出语音信息的次数;如果输入法应用程序累积分高于累积分胜出阈值,则另外一个输入法程序则明显影响用户的使用体验;例如,第一输入法程序搜狗输入法的累积分为36分,第二输入法程序讯飞输入法的累积分为78分,上述累积分胜出阈值为60分,则第二输入法程序讯飞输入法的累积分已经高于累积分胜出阈值60分,此时,提示所述用户所述第一输入法应用程序搜狗输入法的语音输入插件为低效能插件,是否对所述低效能的搜狗输入法语音输入插件进行删除,并根据所述用户的操作对所述低效能的搜狗输入法语音输入插件进行删除或者保留。这里基于用户对识别结果的选择对两种输入法进行累计评分,并在所述评分达到阈值后淘汰积分低的输入法的语音识别模块,实现了基于输入法单个模块即语音输入模块的保留与删除,此时用户可以保留并正常使用搜狗输入法的其他输入模块,如键盘输入模块;由此增加了输入法设置的灵活性,提高了用户体验,同时提高对终端存储空间的利用率。
作为一种优选的实施方式,所述步骤S3还包括:
S31,所述智能终端对所述第一识别结果和所述第二识别结果进行比较,如果所述第一识别结果和所述第二识别结果的相似度大于等于相似度阈值,则认为所述第一识别结果和所述第二识别结果相同,并进入步骤S32;如果所述第一识别结果和所述第二识别结果的相似度小于相似度阈值,则认为所述第一识别结果和所述第二识别结果不同,则进入步骤S4;需要说明的是,这里设置了相似度及相似度阈值的识别结果比较方式,从而提高了比较的容错性,更加具有实用性。
S32,比较所述第一输入法应用程序和第二输入法应用程序的所述累积分并将累积分较高的所述输入法应用程序对应的识别结果的文本输入到文本编辑区。
作为一种优选的实施方式,所述步骤S5还包括:
如果所述用户删除所述低效能的语音输入插件,则为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件;如果所述用户接收推荐所述第三输入法应用程序及其语音输入插件,则在所述用户启用所述语音输入功能时,用所述第三输入法应用程序及其语音输入插件取代所述低效能的语音输入插件对应的输入法应用程序;并将所述第三输入法应用程序的累积分置零,将大于等于所述输入法应用程序的累积分胜出阈值的输入法应用程序的累积分清零。需要说明的是,由于上述进行比较的两种输入法程序中的搜狗输入法的语音输入模块已经被删除,此时则无法实现语音输入功能的比较,因此,这里需要增加一种新的语音输入法来作为比较的对象;例如,为用户推荐第三输入法应用程序五笔输入法及其语音输入插件,在用户对该五笔输入法及其语音输入插件进行正确安装后,在所述用户启用所述语音输入功能时,用第三输入法应用程序五笔输入法及其语音输入插件取代搜狗输入法的输入法应用程序,进而执行上述搜狗输入法和讯飞输入法程序再语音识别过程中的比较操作,此时,实现了在语音输入过程中的五笔输入法取代搜狗输入法,在此不做赘述。此外,需要将原来保留的讯飞输入法的累积分清零,以实现讯飞输入法和五笔输入法在后续语音输入过程中的公平比较;进一步的,在讯飞输入法和五笔输入法中某个输入法程序的累积分达到上述累积分阈值后,继续执行上述的删除与推荐操作,在此不做赘述。
作为一种优选的实施方式,所述为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件,还包括:
检测所述智能终端是否有已安装的第三输入法应用程序;
如果有,则检测所述第三输入法应用程序是否已经安装语音输入插件,如果已安装所述语音输入插件,则为用户推荐所述第三输入法应用程序及其语音输入插件;如果未安装所述语音输入插件,则自动安装所述第三输入法应用程序的语音输入插件,并在安装成功后为用户推荐所述第三输入法应用程序及其语音输入插件;需要说明的是,这里为用户提供输入法应用程序的语音输入插件的安装推荐,用于进行后续语音输入过程中的语音识别与识别结果的比较操作。此外,优选的,由于用户已经安装的输入法程序一般具有较好的使用体验,这里优先选择已经被用户终端安装的输入法应用程序及其语音输入插件,以减少输入法程序对用户终端存储空间的占用。
如果没有,则根据服务器中输入法应用程序的下载数量,为所述用户推荐安装除所述第一输入法应用程序和所述第二输入法应用程序以外下载数量最多的输入法应用程序及其语音输入插件。需要说明的是,由于输入法应用程序的下载数量越多,则其多多数用户的使用体验越好,因此,优先推荐下载数量较多的输入法应用程序供用户进行选择。
本发明提供一种移动终端的语音输入方法,同时基于两种不同的输入法对用户输入的语音信息进行识别,并对两个识别结果进行比较,根据比较结果为用户展示识别结果,由于采用多个输入法进行识别匹配,从而提高了语音识别的准确性;此外,基于用户对识别结果的选择对两种输入法进行累计评分,并在所述评分达到阈值后淘汰积分低的输入法的语音识别模块,实现了基于输入法单个模块的保留与删除,增加了输入法设置的灵活性,提高了用户体验,同时提高对终端存储空间的利用率;最后,增加新的输入法或语音输入模块取代被淘汰的输入法或语音输入模块,体现出在语音识别过程中的优胜劣汰,进一步提高了语音识别的准确性,进而提升了用户体验。
实施例二:
如图1所示,发明提供一种移动终端的语音输入装置,所述装置包括如下模块:
语音输入功能启动检测模块,用于检测用户是否启用所述智能终端的语音输入功能;如果启用所述语音输入功能,则执行语音识别模块;如果未启用所述语音输入功能,则不做任何操作;需要说明的是,用户通过与智能终端的交互,通过其上的语音采集装置输入语音输入信息,如通过麦克风输入语音输入信息,该语音输入信息对应于该用户拟在该用户设备的目标应用中输入的文本;上述语音输入功能通过输入法应用程序中的插件实现,用户通过操作该插件的开关按钮来启动或者关闭语音输入功能。
语音识别模块,用于所述智能终端接收所述用户的语音输入信息,开启所述智能终端的第一输入法应用程序的第一语音输入插件和第二输入法应用程序的第二语音输入插件,所述第一语音输入插件和所述第二语音输入插件分别接收语音输入信息,并对所述语音输入信息进行识别,所述智能终端获取所述第一输入法应用程序的第一识别结果和所述第二输入法应用程序的第二识别结果;示例性的,所述第一输入法应用程序为搜狗输入法,所述第二输入法应用程序为讯飞输入法;所述第一语音输入插件和所述第二语音输入插件分别接收语音输入信息,可以为上述两个输入法程序同时开放语音接收功能,即将麦克风接收的语音信息同时提供给两个输入法程序的两个语音输入插件,以采集语音输入信息;需要说明的是,上述搜狗输入法的语音输入插件基于该输入法提供的数据库进行语音识别,上述讯飞输入法的语音输入插件基于该输入法提供的数据库进行语音识别,两个输入法的语音识别是分别独立进行的,互相不受影响,此时,由于两个不同输入法程序开发公司的技术优势不同,两个输入法的语音识别独立进行可以有效避免“系统误差”,充分发挥各自的技术优势,从而提高匹配效率。
结果比较模块,用于所述智能终端对所述第一识别结果和所述第二识别结果进行比较,如果所述第一识别结果和所述第二识别结果相同,则直接将所述识别结果的文本输入到文本编辑区;如果所述第一识别结果和所述第二识别结果不同,则执行积分计算模块;需要说明的是,如果两个不同输入法的语音输入模块的识别结果相同,则说明两者都匹配的正确性是很高的,此时直接将匹配成功的文本输入到文本编辑区,以提高用户的输入效率。
积分计算模块,用于分别为所述用户提供所述第一识别结果和所述第二识别结果的输入候选文本以供用户选择,并为所述用户选择的识别结果对应的输入法应用程序累积分加一分;需要说明的是,如果上述两个不同输入法的语音输入模块的识别结果不同,此时无法准确判断哪一个语音输入模块是匹配成功的,此时不宜直接将匹配成功的文本输入到文本编辑区,因此,对上述两种情形进行区分。此外,设置累积分的方式以记录输入法应用程序匹配成功的次数,以便后续对两个输入法程序的匹配效率进行比较,进而作出更优选择。
更新模块,用于所述智能终端获取所述累积分,并与输入法应用程序累积分胜出阈值进行比较,如果所述第一/第二输入法应用程序的累积分大于等于所述输入法应用程序累积分胜出阈值,则提示所述用户所述第二/第一输入法应用程序的语音输入插件为低效能插件,是否对所述低效能的语音输入插件进行删除,并根据所述用户的操作对所述低效能的语音输入插件进行删除或者保留。需要说明的是,由于用户选择次数就是对应输入法程序的语音输入模块的积分,因此,上述累积分准确的反映了输入法程序的语音输入模块准确识别出语音信息的次数;如果输入法应用程序累积分高于累积分胜出阈值,则另外一个输入法程序则明显影响用户的使用体验;例如,第一输入法程序搜狗输入法的累积分为36分,第二输入法程序讯飞输入法的累积分为78分,上述累积分胜出阈值为60分,则第二输入法程序讯飞输入法的累积分已经高于累积分胜出阈值60分,此时,提示所述用户所述第一输入法应用程序搜狗输入法的语音输入插件为低效能插件,是否对所述低效能的搜狗输入法语音输入插件进行删除,并根据所述用户的操作对所述低效能的搜狗输入法语音输入插件进行删除或者保留。这里基于用户对识别结果的选择对两种输入法进行累计评分,并在所述评分达到阈值后淘汰积分低的输入法的语音识别模块,实现了基于输入法单个模块即语音输入模块的保留与删除,此时用户可以保留并正常使用搜狗输入法的其他输入模块,如键盘输入模块;由此增加了输入法设置的灵活性,提高了用户体验,同时提高对终端存储空间的利用率。
作为一种优选的实施方式,所述结果比较模块还包括:
相似度判断模块,用于所述智能终端对所述第一识别结果和所述第二识别结果进行比较,如果所述第一识别结果和所述第二识别结果的相似度大于等于相似度阈值,则认为所述第一识别结果和所述第二识别结果相同,并进入步骤S32;如果所述第一识别结果和所述第二识别结果的相似度小于相似度阈值,则认为所述第一识别结果和所述第二识别结果不同,则执行积分计算模块;
积分比较模块,用于比较所述第一输入法应用程序和第二输入法应用程序的所述累积分并将累积分较高的所述输入法应用程序对应的识别结果的文本输入到文本编辑区。
作为一种优选的实施方式,所述更新模块还包括:
如果所述用户删除所述低效能的语音输入插件,则为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件;如果所述用户接收推荐所述第三输入法应用程序及其语音输入插件,则在所述用户启用所述语音输入功能时,用所述第三输入法应用程序及其语音输入插件取代所述低效能的语音输入插件对应的输入法应用程序;并将所述第三输入法应用程序的累积分置零,将大于等于所述输入法应用程序的累积分胜出阈值的输入法应用程序的累积分清零。需要说明的是,由于上述进行比较的两种输入法程序中的搜狗输入法的语音输入模块已经被删除,此时则无法实现语音输入功能的比较,因此,这里需要增加一种新的语音输入法来作为比较的对象;例如,为用户推荐第三输入法应用程序五笔输入法及其语音输入插件,在用户对该五笔输入法及其语音输入插件进行正确安装后,在所述用户启用所述语音输入功能时,用第三输入法应用程序五笔输入法及其语音输入插件取代搜狗输入法的输入法应用程序,进而执行上述搜狗输入法和讯飞输入法程序再语音识别过程中的比较操作,此时,实现了在语音输入过程中的五笔输入法取代搜狗输入法,在此不做赘述。此外,需要将原来保留的讯飞输入法的累积分清零,以实现讯飞输入法和五笔输入法在后续语音输入过程中的公平比较;进一步的,在讯飞输入法和五笔输入法中某个输入法程序的累积分达到上述累积分阈值后,继续执行上述的删除与推荐操作,在此不做赘述。
作为一种优选的实施方式,所述为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件,还包括:
检测所述智能终端是否有已安装的第三输入法应用程序;
如果有,则检测所述第三输入法应用程序是否已经安装语音输入插件,如果已安装所述语音输入插件,则为用户推荐所述第三输入法应用程序及其语音输入插件;如果未安装所述语音输入插件,则自动安装所述第三输入法应用程序的语音输入插件,并在安装成功后为用户推荐所述第三输入法应用程序及其语音输入插件;需要说明的是,这里为用户提供输入法应用程序的语音输入插件的安装推荐,用于进行后续语音输入过程中的语音识别与识别结果的比较操作。此外,优选的,由于用户已经安装的输入法程序一般具有较好的使用体验,这里优先选择已经被用户终端安装的输入法应用程序及其语音输入插件,以减少输入法程序对用户终端存储空间的占用。
如果没有,则根据服务器中输入法应用程序的下载数量,为所述用户推荐安装除所述第一输入法应用程序和所述第二输入法应用程序以外下载数量最多的输入法应用程序及其语音输入插件。需要说明的是,由于输入法应用程序的下载数量越多,则其多多数用户的使用体验越好,因此,优先推荐下载数量较多的输入法应用程序供用户进行选择。
本发明提供一种移动终端的语音输入方法,同时基于两种不同的输入法对用户输入的语音信息进行识别,并对两个识别结果进行比较,根据比较结果为用户展示识别结果,由于采用多个输入法进行识别匹配,从而提高了语音识别的准确性;此外,基于用户对识别结果的选择对两种输入法进行累计评分,并在所述评分达到阈值后淘汰积分低的输入法的语音识别模块,实现了基于输入法单个模块的保留与删除,增加了输入法设置的灵活性,提高了用户体验,同时提高对终端存储空间的利用率;最后,增加新的输入法或语音输入模块取代被淘汰的输入法或语音输入模块,体现出在语音识别过程中的优胜劣汰,进一步提高了语音识别的准确性,进而提升了用户体验。
实施例三:
本发明还提供一种智能终端的语音输入系统,所述语音输入系统执行上述智能终端的语音输入方法。本领域技术人员应当能够理解,上述实施例的方法或者装置实现的语音输入功能均可通过对应的方式在该智能终端的语音输入系统中实现,在此不做赘述。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来生成机器,从而通过计算机或其他可编程数据处理方法的处理器来执行的指令创建了用于实现结构图和/或框图和/或流图的框或多个框中指定的方法。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种移动终端的语音输入方法,其特征在于,所述方法包括如下步骤:
S1,检测用户是否启用所述智能终端的语音输入功能;如果启用所述语音输入功能,则进入步骤S2;如果未启用所述语音输入功能,则不做任何操作;
S2,所述智能终端接收所述用户的语音输入信息,开启所述智能终端的第一输入法应用程序的第一语音输入插件和第二输入法应用程序的第二语音输入插件,所述第一语音输入插件和所述第二语音输入插件分别接收语音输入信息,并对所述语音输入信息进行识别,所述智能终端获取所述第一输入法应用程序的第一识别结果和所述第二输入法应用程序的第二识别结果;
S3,所述智能终端对所述第一识别结果和所述第二识别结果进行比较,如果所述第一识别结果和所述第二识别结果相同,则直接将所述识别结果的文本输入到文本编辑区;如果所述第一识别结果和所述第二识别结果不同,则进入步骤S4;
S4,分别为所述用户提供所述第一识别结果和所述第二识别结果的输入候选文本以供用户选择,并为所述用户选择的识别结果对应的输入法应用程序累积分加一分;
S5,所述智能终端获取所述累积分,并与输入法应用程序累积分胜出阈值进行比较,如果所述第一/第二输入法应用程序的累积分大于等于所述输入法应用程序累积分胜出阈值,则提示所述用户所述第二/第一输入法应用程序的语音输入插件为低效能插件,是否对所述低效能的语音输入插件进行删除,并根据所述用户的操作对所述低效能的语音输入插件进行删除或者保留。
2.根据权利要求1所述的方法,其特征在于,所述步骤S3还包括:
S31,所述智能终端对所述第一识别结果和所述第二识别结果进行比较,如果所述第一识别结果和所述第二识别结果的相似度大于等于相似度阈值,则认为所述第一识别结果和所述第二识别结果相同,并进入步骤S32;如果所述第一识别结果和所述第二识别结果的相似度小于相似度阈值,则认为所述第一识别结果和所述第二识别结果不同,则进入步骤S4;
S32,比较所述第一输入法应用程序和第二输入法应用程序的所述累积分并将累积分较高的所述输入法应用程序对应的识别结果的文本输入到文本编辑区。
3.根据权利要求1所述的方法,其特征在于,所述步骤S5还包括:
如果所述用户删除所述低效能的语音输入插件,则为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件;如果所述用户接收推荐所述第三输入法应用程序及其语音输入插件,则在所述用户启用所述语音输入功能时,用所述第三输入法应用程序及其语音输入插件取代所述低效能的语音输入插件对应的输入法应用程序;并将所述第三输入法应用程序的累积分置零,将大于等于所述输入法应用程序的累积分胜出阈值的输入法应用程序的累积分清零。
4.根据权利要求3所述的方法,其特征在于,所述为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件,还包括:
检测所述智能终端是否有已安装的第三输入法应用程序;
如果有,则检测所述第三输入法应用程序是否已经安装语音输入插件,如果已安装所述语音输入插件,则为用户推荐所述第三输入法应用程序及其语音输入插件;如果未安装所述语音输入插件,则自动安装所述第三输入法应用程序的语音输入插件,并在安装成功后为用户推荐所述第三输入法应用程序及其语音输入插件;
如果没有,则根据服务器中输入法应用程序的下载数量,为所述用户推荐安装除所述第一输入法应用程序和所述第二输入法应用程序以外下载数量最多的输入法应用程序及其语音输入插件。
5.一种移动终端的语音输入装置,其特征在于,所述装置包括如下模块:
语音输入功能启动检测模块,用于检测用户是否启用所述智能终端的语音输入功能;如果启用所述语音输入功能,则执行语音识别模块;如果未启用所述语音输入功能,则不做任何操作;
语音识别模块,用于所述智能终端接收所述用户的语音输入信息,开启所述智能终端的第一输入法应用程序的第一语音输入插件和第二输入法应用程序的第二语音输入插件,所述第一语音输入插件和所述第二语音输入插件分别接收语音输入信息,并对所述语音输入信息进行识别,所述智能终端获取所述第一输入法应用程序的第一识别结果和所述第二输入法应用程序的第二识别结果;
结果比较模块,用于所述智能终端对所述第一识别结果和所述第二识别结果进行比较,如果所述第一识别结果和所述第二识别结果相同,则直接将所述识别结果的文本输入到文本编辑区;如果所述第一识别结果和所述第二识别结果不同,则执行积分计算模块;
积分计算模块,用于分别为所述用户提供所述第一识别结果和所述第二识别结果的输入候选文本以供用户选择,并为所述用户选择的识别结果对应的输入法应用程序累积分加一分;
更新模块,用于所述智能终端获取所述累积分,并与输入法应用程序累积分胜出阈值进行比较,如果所述第一/第二输入法应用程序的累积分大于等于所述输入法应用程序累积分胜出阈值,则提示所述用户所述第二/第一输入法应用程序的语音输入插件为低效能插件,是否对所述低效能的语音输入插件进行删除,并根据所述用户的操作对所述低效能的语音输入插件进行删除或者保留。
6.根据权利要求5所述的装置,其特征在于,所述结果比较模块还包括:
相似度判断模块,用于所述智能终端对所述第一识别结果和所述第二识别结果进行比较,如果所述第一识别结果和所述第二识别结果的相似度大于等于相似度阈值,则认为所述第一识别结果和所述第二识别结果相同,并执行积分比较模块;如果所述第一识别结果和所述第二识别结果的相似度小于相似度阈值,则认为所述第一识别结果和所述第二识别结果不同,则执行积分计算模块;
积分比较模块,用于比较所述第一输入法应用程序和第二输入法应用程序的所述累积分并将累积分较高的所述输入法应用程序对应的识别结果的文本输入到文本编辑区。
7.根据权利要求6所述的装置,其特征在于,所述更新模块还包括:
如果所述用户删除所述低效能的语音输入插件,则为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件;如果所述用户接收推荐所述第三输入法应用程序及其语音输入插件,则在所述用户启用所述语音输入功能时,用所述第三输入法应用程序及其语音输入插件取代所述低效能的语音输入插件对应的输入法应用程序;并将所述第三输入法应用程序的累积分置零,将大于等于所述输入法应用程序的累积分胜出阈值的输入法应用程序的累积分清零。
8.根据权利要求7所述的装置,其特征在于,所述为用户推荐已安装的或者未安装的第三输入法应用程序及其语音输入插件,还包括:
检测所述智能终端是否有已安装的第三输入法应用程序;
如果有,则检测所述第三输入法应用程序是否已经安装语音输入插件,如果已安装所述语音输入插件,则为用户推荐所述第三输入法应用程序及其语音输入插件;如果未安装所述语音输入插件,则自动安装所述第三输入法应用程序的语音输入插件,并在安装成功后为用户推荐所述第三输入法应用程序及其语音输入插件;
如果没有,则根据服务器中输入法应用程序的下载数量,为所述用户推荐安装除所述第一输入法应用程序和所述第二输入法应用程序以外下载数量最多的输入法应用程序及其语音输入插件。
9.一种移动终端的语音输入系统,其特征在于,所述语音输入系统执行权利要求1-4的所述智能终端的语音输入方法。
CN201711161400.0A 2017-11-21 2017-11-21 一种移动终端的语音输入方法 Active CN107894882B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711161400.0A CN107894882B (zh) 2017-11-21 2017-11-21 一种移动终端的语音输入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711161400.0A CN107894882B (zh) 2017-11-21 2017-11-21 一种移动终端的语音输入方法

Publications (2)

Publication Number Publication Date
CN107894882A true CN107894882A (zh) 2018-04-10
CN107894882B CN107894882B (zh) 2021-02-09

Family

ID=61805608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711161400.0A Active CN107894882B (zh) 2017-11-21 2017-11-21 一种移动终端的语音输入方法

Country Status (1)

Country Link
CN (1) CN107894882B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109599095A (zh) * 2018-11-21 2019-04-09 百度在线网络技术(北京)有限公司 一种语音数据的标注方法、装置、设备和计算机存储介质
CN109634496A (zh) * 2018-12-06 2019-04-16 北京金山安全软件有限公司 一种用于终端输入的方法、装置及终端
CN111144939A (zh) * 2019-12-23 2020-05-12 上海擎感智能科技有限公司 一种产品分析方法、装置、计算机存储介质及系统
CN112241487A (zh) * 2019-07-17 2021-01-19 北京搜狗科技发展有限公司 一种信息推荐方法、装置和电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040153319A1 (en) * 2003-01-30 2004-08-05 Sherif Yacoub Two-engine speech recognition
CN1969257A (zh) * 2004-06-09 2007-05-23 西姆毕恩软件有限公司 选择计算装置中插件程序代码模块的方法
CN103399766A (zh) * 2013-07-29 2013-11-20 百度在线网络技术(北京)有限公司 更新输入法系统的方法和设备
CN103559894A (zh) * 2013-11-08 2014-02-05 安徽科大讯飞信息科技股份有限公司 口语评测方法及系统
CN106128462A (zh) * 2016-06-21 2016-11-16 东莞酷派软件技术有限公司 语音识别方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040153319A1 (en) * 2003-01-30 2004-08-05 Sherif Yacoub Two-engine speech recognition
CN1969257A (zh) * 2004-06-09 2007-05-23 西姆毕恩软件有限公司 选择计算装置中插件程序代码模块的方法
CN103399766A (zh) * 2013-07-29 2013-11-20 百度在线网络技术(北京)有限公司 更新输入法系统的方法和设备
CN103559894A (zh) * 2013-11-08 2014-02-05 安徽科大讯飞信息科技股份有限公司 口语评测方法及系统
CN106128462A (zh) * 2016-06-21 2016-11-16 东莞酷派软件技术有限公司 语音识别方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109599095A (zh) * 2018-11-21 2019-04-09 百度在线网络技术(北京)有限公司 一种语音数据的标注方法、装置、设备和计算机存储介质
CN109634496A (zh) * 2018-12-06 2019-04-16 北京金山安全软件有限公司 一种用于终端输入的方法、装置及终端
CN112241487A (zh) * 2019-07-17 2021-01-19 北京搜狗科技发展有限公司 一种信息推荐方法、装置和电子设备
CN111144939A (zh) * 2019-12-23 2020-05-12 上海擎感智能科技有限公司 一种产品分析方法、装置、计算机存储介质及系统

Also Published As

Publication number Publication date
CN107894882B (zh) 2021-02-09

Similar Documents

Publication Publication Date Title
CN107507612B (zh) 一种声纹识别方法及装置
US11030412B2 (en) System and method for chatbot conversation construction and management
CN107978311B (zh) 一种语音数据处理方法、装置以及语音交互设备
CN108287858B (zh) 自然语言的语义提取方法及装置
CN106534548B (zh) 语音纠错方法和装置
CN109885713A (zh) 基于语音情绪识别的表情图像推荐方法以及装置
CN107894882A (zh) 一种移动终端的语音输入方法
CN109766013A (zh) 诗词语句输入推荐方法、装置和电子设备
CN109949071A (zh) 基于语音情绪分析的产品推荐方法、装置、设备和介质
CN106407178A (zh) 一种会话摘要生成方法及装置
CN109637537B (zh) 一种自动获取标注数据优化自定义唤醒模型的方法
CN105979376A (zh) 一种推荐方法和装置
CN105068661A (zh) 基于人工智能的人机交互方法和系统
CN106649253B (zh) 基于后验证的辅助控制方法及系统
CN103092928B (zh) 语音查询方法及系统
CN103559880B (zh) 语音输入系统和方法
CN109724215A (zh) 空调控制方法、空调控制装置、空调设备及存储介质
CN115587175A (zh) 人机对话及预训练语言模型训练方法、系统及电子设备
EP3627498A1 (en) Method and system, for generating speech recognition training data
CN109741735A (zh) 一种建模方法、声学模型的获取方法和装置
CN104850241A (zh) 一种在移动终端中进行文字输入的方法及移动终端
CN111710337A (zh) 语音数据的处理方法、装置、计算机可读介质及电子设备
US20220058213A1 (en) Systems and methods for identifying dynamic types in voice queries
CN110431547A (zh) 电子设备和控制方法
CN110782875A (zh) 一种基于人工智能的语音韵律处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210122

Address after: 210012 4th floor, building C, Wanbo Science Park, 20 Fengxin Road, Yuhuatai District, Nanjing City, Jiangsu Province

Applicant after: NANJING GUIJI INTELLIGENT TECHNOLOGY Co.,Ltd.

Address before: 333000 588 North Road, new village street, Zhushan, Jingdezhen, Jiangxi

Applicant before: Ma Bo

GR01 Patent grant
GR01 Patent grant