CN107193914A - 一种语音输入方法及移动终端 - Google Patents

一种语音输入方法及移动终端 Download PDF

Info

Publication number
CN107193914A
CN107193914A CN201710339137.3A CN201710339137A CN107193914A CN 107193914 A CN107193914 A CN 107193914A CN 201710339137 A CN201710339137 A CN 201710339137A CN 107193914 A CN107193914 A CN 107193914A
Authority
CN
China
Prior art keywords
voice messaging
phonetic entry
input field
user
mobile terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710339137.3A
Other languages
English (en)
Inventor
李滨何
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Lemon Electronic Technology Co Ltd
Original Assignee
Guangdong Lemon Electronic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Lemon Electronic Technology Co Ltd filed Critical Guangdong Lemon Electronic Technology Co Ltd
Priority to CN201710339137.3A priority Critical patent/CN107193914A/zh
Publication of CN107193914A publication Critical patent/CN107193914A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • G06F16/634Query by example, e.g. query by humming
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本发明实施例公开了一种语音输入方法及移动终端,其中,该方法包括:检测移动终端当前显示界面中的目标输入栏,该目标输入栏为未输入文字信息的输入栏;接收用户按照预设方式触发的语音输入开启指令;根据该语音输入开启指令,开启语音输入模式;在该语音输入模式下,接收输入的语音信息;在目标输入栏中显示该语音信息对应的文字信息。实施本发明实施例,能够提高语音输入的操作效率。

Description

一种语音输入方法及移动终端
技术领域
本发明涉及电子技术领域,尤其涉及一种语音输入方法及移动终端。
背景技术
语音输入又称声控输入,是一种根据操作者的讲话,自动识别成文字的输入方法,其与文字输入法相较,更为快捷易用。当前,诸如智能手机、平板电脑等移动终端大多具备语音输入的功能。实践发现,当用户进入移动终端中的某一应用程序进行语音输入时,一般需先点击输入栏,再查找语音输入的按钮,通过点击按钮来进行语音输入,输入完毕后识别成文字显示在输入栏中。然而,有时候语音输入的按钮并不明显,用户需要花费较长时间查找,且每一次进行语音输入之前都需要手动去点击输入栏,从而使得整个语音输入的操作效率低下。
发明内容
本发明实施例公开了一种语音输入方法及移动终端,能够提高语音输入的操作效率。
本发明实施例第一方面公开一种语音输入方法,包括:
检测移动终端当前显示界面中的目标输入栏,所述目标输入栏为未输入文字信息的输入栏;
接收用户按照预设方式触发的语音输入开启指令;
根据所述语音输入开启指令,开启语音输入模式;
在所述语音输入模式下,接收输入的语音信息;
在所述目标输入栏中显示所述语音信息对应的文字信息。
作为一种可选的实施方式,在本发明实施例第一方面中,所述检测移动终端当前显示界面中的目标输入栏,包括:
获取移动终端当前显示界面所属应用程序的注册接口;
获取所述注册接口的状态信息;
判断所述状态信息是否为预设状态信息,所述预设状态信息用于指示输入栏未输入文字信息;
如果所述状态信息为所述预设状态信息,确定所述注册接口对应的输入栏为目标输入栏。
作为一种可选的实施方式,在本发明实施例第一方面中,所述接收用户按照预设方式触发的语音输入开启指令,包括以下情况中的一种或几种的组合:
接收用户通过操作预设物理按键所触发的语音输入开启指令;
接收用户通过操作预设虚拟按键所触发的语音输入开启指令;
接收用户通过输入预设手势所触发的语音输入开启指令;
接收用户通过输入预设生物特征信息所触发的语音输入开启指令。
作为一种可选的实施方式,在本发明实施例第一方面中,所述在所述目标输入栏中显示所述语音信息对应的文字信息之前,所述方法还包括:
对接收到的所述语音信息进行预处理,以获得预处理后的语音信息;
对所述预处理后的语音信息进行识别,以得出所述预处理后的语音信息所包含的内容;
其中,所述在所述目标输入栏中显示所述语音信息对应的文字信息,包括:
在所述目标输入栏中以文字的形式显示所述预处理后的语音信息所包含的内容。
作为一种可选的实施方式,在本发明实施例第一方面中,所述对所述预处理后的语音信息进行识别,以得出所述预处理后的语音信息所包含的内容,包括:
将所述预处理后的语音信息与预设语音模型进行匹配,以获得匹配结果;
当所述预处理后的语音信息与所述预设语音模型进行匹配的匹配率低于预设值时,输出至少一条识别内容;
接收用户针对所述至少一条识别内容中的其中一条输入的选取指令;
根据所述选取指令,确定用户选取的识别内容为所述预处理后的语音信息所包含的内容。
本发明实施例第二方面公开一种移动终端,包括:
检测单元,用于检测移动终端当前显示界面中的目标输入栏,所述目标输入栏为未输入文字信息的输入栏;
第一接收单元,用于接收用户按照预设方式触发的语音输入开启指令;
开启指令,用于根据所述语音输入开启指令,开启语音输入模式;
第二接收单元,用于在所述语音输入模式下,接收输入的语音信息;
显示单元,用于在所述目标输入栏中显示所述语音信息对应的文字信息。
作为一种可选的实施方式,在本发明实施例第二方面中,所述检测单元包括:
第一获取子单元,用于获取移动终端当前显示界面所属应用程序的注册接口;
第二获取子单元,用于获取所述注册接口的状态信息;
判断子单元,用于判断所述状态信息是否为预设状态信息,所述预设状态信息用于指示输入栏未输入文字信息;
第一确定子单元,用于当所述判断子单元判断出所述状态信息为所述预设状态信息时,确定所述注册接口对应的输入栏为目标输入栏。
作为一种可选的实施方式,在本发明实施例第二方面中,所述第一接收单元接收用户按照预设方式触发的语音输入开启指令的方式具体包括以下情况中的一种或几种的组合:
所述第一接收单元接收用户通过操作预设物理按键所触发的语音输入开启指令;
所述第一接收单元接收用户通过操作预设虚拟按键所触发的语音输入开启指令;
所述第一接收单元接收用户通过输入预设手势所触发的语音输入开启指令;
所述第一接收单元接收用户通过输入预设生物特征信息所触发的语音输入开启指令。
作为一种可选的实施方式,在本发明实施例第二方面中,所述移动终端还包括:
预处理单元,用于在所述显示单元在所述目标输入栏中显示所述语音信息对应的文字信息之前,对接收到的所述语音信息进行预处理,以获得预处理后的语音信息;
识别单元,用于对所述预处理后的语音信息进行识别,以得出所述预处理后的语音信息所包含的内容;
所述显示单元具体用于在所述目标输入栏中以文字的形式显示所述预处理后的语音信息所包含的内容。
作为一种可选的实施方式,在本发明实施例第二方面中,所述识别单元包括:
匹配子单元,用于将所述预处理后的语音信息与预设语音模型进行匹配,以获得匹配结果;
输出子单元,用于当所述匹配子单元将所述预处理后的语音信息与所述预设语音模型进行匹配的匹配率低于预设值时,输出至少一条识别内容;
接收子单元,用于接收用户针对所述至少一条识别内容中的其中一条输入的选取指令;
第二确定子单元,用于根据所述选取指令,确定用户选取的识别内容为所述预处理后的语音信息所包含的内容。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,当检测到移动终端当前显示界面中存在未输入文字信息的目标输入栏时,可以接收用户触发的语音输入开启指令,根据该语音输入开启指令来开启移动终端的语音输入模式,并在该语音输入模式下接收输入的语音信息,可以在该目标输入栏中显示该语音信息对应的文字信息。可见,实施本发明实施例,移动终端通过自动检测当前显示界面上空闲的文字输入栏,并接收用户按照预设方式输入的语音输入开启指令来快速开启语音输入功能以进行语音输入,而用户无需手动点击待输入的文字输入栏,也无需用户花时间去查找当前应用程序所提供的语音输入按钮。这样,自动检测空闲的文字输入栏,并采用快捷方式启动语音输入功能,能够提高语音输入的操作效率,有效改善用户进行语音输入的体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种语音输入方法的流程示意图;
图2是本发明实施例公开的另一种语音输入方法的流程示意图;
图3是本发明实施例公开的一种通过语音输入进行导航的具体操作示意图;
图4是本发明实施例公开的一种移动终端的结构示意图;
图5是本发明实施例公开的另一种移动终端的结构示意图;
图6是本发明实施例公开的又一种移动终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了一种语音输入方法及移动终端,能够提高语音输入的操作效率。以下将结合附图进行详细描述。
实施例一
请参阅图1,图1是本发明实施例公开的一种语音输入方法的流程示意图。其中,该语音输入方法可以应用于移动终端中。如图1所示,该语音输入方法可以包括以下步骤。
101、检测移动终端当前显示界面中的目标输入栏。
本发明实施例中,移动终端可以包括但不限于移动手机、移动平板、个人数字助理(Personal Digital Assistant,PDA)、多媒体播放器、电子阅读器、可穿戴设备、移动互联网设备(Mobile Internet Device,MID)等各种终端设备。
本发明实施例中,移动终端可以实时或每隔特定时间检测自身当前显示界面中是否存在目标输入栏。其中,目标输入栏可以为未输入文字信息的输入栏,即目标输入栏当前处于空闲状态,可以输入文字信息。当前显示界面可以是移动终端当前进入的某一应用程序的操作界面,如短信聊天界面、资讯搜索界面等等。在本发明实施例中,移动终端是自动检测目标输入栏的,而无需用户去手动点击输入栏。具体的,移动终端可以根据光标的位置或者输入栏的状态变化来自动检测是否为空闲的目标输入栏。
102、接收用户按照预设方式触发的语音输入开启指令。
本发明实施例中,移动终端在自动检测到当前显示界面中的目标输入栏后,可以接收用户触发的语音输入开启指令,该语音输入开启指令用于开启移动终端的语音输入模式。具体的,移动终端可以实时或每隔一定时间检测是否接收到用户按照预设方式所触发的语音输入开启指令。
作为一种可选的实施方式,步骤102接收用户按照预设方式触发的语音输入开启指令的具体实施方式可以包括但不限于以下情况中的一种或多种的组合:
11)接收用户通过操作预设物理按键所触发的语音输入开启指令;
12)接收用户通过操作预设虚拟按键所触发的语音输入开启指令;
13)接收用户通过输入预设手势所触发的语音输入开启指令;
14)接收用户通过输入预设生物特征信息所触发的语音输入开启指令。
在该实施方式中,预设方式可以是操作预设物理按键,该预设物理按键可以是一个或多个物理按键的组合,如用户通过长按或短按音量键来触发语音输入开启指令。预设方式可以是操作预设虚拟按键,该预设虚拟按键可以是一个或多个虚拟按键的组合,如用户通过长按或短按主菜单Home键来触发语音输入开启指令。预设方式也可以是输入预设手势,该预设手势可以包括但不限于针对移动终端触摸屏的预设触控轨迹、改变移动终端姿态的预设摇晃轨迹等,通过获取用户输入的手势与该预设手势进行匹配来确定语音输入开启指令,当匹配率高于预设值时,两者匹配成功,接收到的是语音输入开启指令;当匹配率不高于预设值时,两者匹配失败,接收到的不是语音输入开启指令,如用户通过在移动终端的触摸屏上输入某一特定触控轨迹来触发语音输入开启指令,或者用户按照某一特定摇晃轨迹摇动移动终端来触发语音输入开启指令。预设方式还可以是输入预设生物特征信息,该预设生物特征信息可以包括但不限于预设人脸特征信息、预设虹膜特征信息、预设声纹特征信息、预设指纹特征信息等中的至少一种,如通过获取用户输入的指纹信息与预设指纹信息进行匹配,当匹配成功,则接收到的为语音输入开启指令。此外,还可以通过其他快捷方式来触发语音输入开启指令,该实施方式不作限定。通过实施该实施方式,用户无需去查找当前应用程序提供的语音输入按钮,尤其对于一些不提供语音输入按钮的应用程序,可以通过上述方式快捷的开启移动终端的语音输入功能来进行语音输入,提高输入的效率。
可以理解的是,步骤101可以先于步骤102执行,也可以后于步骤102执行,也可以与步骤102交叉或同步执行,本发明实施例不作限定。
103、根据该语音输入开启指令,开启语音输入模式。
本发明实施例中,当移动终端接收到用户触发的语音输入开启指令时,可以响应该语音输入开启指令来开启移动终端的语音输入模式。其中,语音输入模式为允许用户或外部其他设备向移动终端输入语音信息的一种模式。
104、在该语音输入模式下,接收输入的语音信息。
本发明实施例中,当移动终端进入语音输入模式时,此时可以接收用户或外部设备输入的语音信息。具体的,移动终端在语音输入模式下可以开启自身中的麦克风、话筒或特定的声音采集器,从而可以实时采集外部输入的语音信息。
105、在目标输入栏中显示该语音信息对应的文字信息。
本发明实施例中,移动终端在接收到输入的语音信息后,可以将该语音信息转化为对应的文字信息,并显示在空闲的目标输入栏中。语音信息转化为文字信息可以采用语音识别的方法,其具体实现过程可以参考当前现有的语音识别技术。
可见,实施图1所描述的方法,移动终端通过自动检测当前显示界面上空闲的文字输入栏,并接收用户按照预设方式输入的语音输入开启指令来快速开启语音输入功能以进行语音输入,而无需用户手动点击待输入的文字输入栏,也无需用户花时间去查找当前应用程序所提供的语音输入按钮。这样,自动检测空闲的文字输入栏,并采用快捷方式启动语音输入功能,能够提高语音输入的操作效率,有效改善用户进行语音输入的体验。
实施例二
请参阅图2,图2是本发明实施例公开的另一种语音输入方法的流程示意图。其中,该语音输入方法可以应用于移动终端中。如图2所示,该语音输入方法可以包括以下步骤。
201、检测移动终端当前显示界面中的目标输入栏。
本发明实施例中,目标输入栏可以为当前显示界面中未输入文字信息的输入栏,即处于空闲状态的输入栏。
作为一种可选的实施方式,步骤201检测移动终端当前显示界面中的目标输入栏的具体实施方式可以包括以下步骤:
21)获取移动终端当前显示界面所属应用程序的注册接口;
22)获取该注册接口的状态信息;
23)判断该状态信息是否为预设状态信息,预设状态信息用于指示输入栏未输入文字信息;
24)如果该状态信息为预设状态信息,确定该注册接口对应的输入栏为目标输入栏。
在该实施方式中,应用程序可以通过设置注册接口来关联输入栏,一般一个输入栏关联一个注册接口,通过实时监测注册接口的状态来确定其关联的输入栏是否空闲。具体的,移动终端先确定当前显示界面所属的应用程序,再获取该应用程序的一个或多个注册接口,分别获取每一个注册接口的状态信息,并判断每一个注册接口的状态信息是否为预设状态信息,如果一个注册接口的状态信息为预设状态信息,则说明该注册接口对应关联的输入栏为未输入文字信息的空闲输入栏,即目标输入栏。如果一个注册接口的状态信息不为预设状态信息,则说明该注册接口对应关联的输入栏为已输入有文字信息的非空闲输入栏。当在空闲输入栏中输入文字信息后,其关联的注册接口的状态信息将发生变化,以及将非空闲输入栏中的文字信息清空后,其关联的注册接口的状态信息也将发生变化。例如,假设预设状态信息为“0”,当一注册接口的状态信息为“0”时,则该注册接口对应的输入栏为空闲输入栏;当该注册接口的状态信息为“1”时,则该注册接口对应的输入栏为非空闲输入栏。
202、接收用户按照预设方式触发的语音输入开启指令。
具体的,移动终端可以接收用户通过操作预设物理按键、预设虚拟按键、输入预设手势以及输入预设生物特征信息等中的一种或多种方式触发的语音输入开启指令。
203、根据该语音输入开启指令,开启语音输入模式。
204、在该语音输入模式下,接收输入的语音信息。
205、对接收到的该语音信息进行预处理,以获得预处理后的语音信息。
本发明实施例中,移动终端接收到的语音信息可能因为存在噪声而影响语音识别结果,因此需要对接收到的语音信息进行预处理。其具体实施方式可以包括但不限于:按照预设好的降噪值对语音信息进行去噪滤波处理,和/或,根据预设的音频分贝值对语音信息再次进行滤波处理(例如将语音信息中的分贝值低于预设的音频分贝值的内容进行滤除),以去除语音信息中的各种噪声,避免呼吸声、杂音异响等干扰,从而提升语音信息识别成文本的精度。
206、对预处理后的语音信息进行识别,以得出预处理后的语音信息所包含的内容。
本发明实施例中,对预处理后的语音信息进行识别,以识别出其中所包含的内容的具体实施方式可以为:将预处理后的语音信息与预设语音模型进行匹配,识别出预处理后的语音信息所包含的内容。具体的,可以提取出预处理后的语音信息中的特征参数,并与移动终端中事先存储的预设语音模型进行匹配,从而将匹配率最高的语音模型作为识别结果。预设语音模型中可以包括多个语音字词的训练模型,可以采用孤立词语音识别、隐马尔可夫模型(Hidden Markov Model,HMM)、动态时间规整(Dynamic Time Warping,DTW)等方法来完成语音识别过程。
作为一种可选的实施方式,步骤206对预处理后的语音信息进行识别,以得出预处理后的语音信息所包含的内容的具体实施方式可以包括以下步骤:
25)将预处理后的语音信息与预设语音模型进行匹配,以获得匹配结果;
26)当预处理后的语音信息与预设语音模型进行匹配的匹配率低于预设值时,输出至少一条识别内容;
27)接收用户针对上述至少一条识别内容中的其中一条输入的选取指令;
28)根据该选取指令,确定用户选取的识别内容为预处理后的语音信息所包含的内容。
在该实施方式中,当语音信息中存在部分内容与预设语音模型中的所有模型进行匹配时,得到的所有匹配率均低于预设值,说明语音音质差或发音不太标准,导致语音识别的准确率低。为了避免识别错误,可以以文字的形式同时输出至少一条识别内容,这至少一条识别内容可以取其中匹配率较高的几条。用户可以在输出的几条识别内容中选取正确的那一条作为最终的识别结果,即语音信息识别成的文字信息。如果输出的几条识别内容均不符合用户的需求,则此时用户可以重复之前的操作开启语音输入模式来再次输入语音信息。
207、在目标输入栏中以文字的形式显示预处理后的语音信息所包含的内容。
在一具体的实施方式中,请参阅图3,图3是本发明实施例公开的一种通过语音输入进行导航的具体操作示意图。如图3所示,在进入地图应用APP后,首先检测输入栏的状态,当为未输入状态后,可以按下预设的物理按键,开启语音输入模式,并接收用户语音输入的目的地,并实时将接收到的目的地转化为文字显示在输入栏中,此时点击导航按钮即可根据地图算法生成相应的路径。当输入的目的地不太精准时,此时将生成多个候选地点和路径供用户选择,用户可以手动选择其中一个,也可以再次按下预设物理按键进入语音输入模式来再次输入正确的目的地,识别输入结果后,根据结果自动开始导航。通过实施上述操作,无需用户手动点击输入栏和查找语音输入按钮,从而可以提升语音输入的操作效率,从而提高导航的效率。
本发明实施例中,如果移动终端当前显示界面上存在多个输入栏时,可以逐一检测各个输入栏的状态,在将输入的语音信息识别为文字后显示在其中一个空闲输入栏后,可以按照顺序依次在下一个空闲输入栏中显示新一轮的语音识别成的文字信息,而无需用户每次进行语音输入前均手动点击相应的输入栏,从而进一步提高了语音输入的操作效率。
可见,实施图2所描述的方法,移动终端通过自动检测当前显示界面上空闲的文字输入栏,并接收用户按照预设方式输入的语音输入开启指令来快速开启语音输入功能以进行语音输入,而无需用户手动点击待输入的文字输入栏,也无需用户花时间去查找当前应用程序所提供的语音输入按钮。这样,自动检测空闲的文字输入栏,并采用快捷方式启动语音输入功能,能够提高语音输入的操作效率,有效改善用户进行语音输入的体验。
实施例三
请参阅图4,图4是本发明实施例公开的一种移动终端的结构示意图,可以用于执行上述公开的语音输入方法。如图4所示,该移动终端可以包括:
检测单元401,用于检测移动终端当前显示界面中的目标输入栏。
其中,该目标输入栏可以为未输入文字信息的输入栏,即目标输入栏当前处于空闲状态,可以输入文字信息。当前显示界面可以是移动终端当前进入的某一应用程序的操作界面,如短信聊天界面、资讯搜索界面等等。
第一接收单元402,用于接收用户按照预设方式触发的语音输入开启指令。
本发明实施例中,该语音输入开启指令用于开启移动终端的语音输入模式。在检测单元401检测到目标输入栏后,可以发送一触发指令,以触发第一接收单元402去接收语音输入开启指令。
作为一种可选的实施方式,第一接收单元402接收用户按照预设方式触发的语音输入开启指令的具体实施方式可以包括但不限于以下情况中的一种或几种的组合:
第一接收单元402接收用户通过操作预设物理按键所触发的语音输入开启指令;
第一接收单元402接收用户通过操作预设虚拟按键所触发的语音输入开启指令;
第一接收单元402接收用户通过输入预设手势所触发的语音输入开启指令;
第一接收单元402接收用户通过输入预设生物特征信息所触发的语音输入开启指令。
其中,预设物理按键可以是一个或多个物理按键的组合;预设虚拟按键可以是一个或多个虚拟按键的组合;预设手势可以包括但不限于针对移动终端触摸屏的预设触控轨迹、改变移动终端姿态的预设摇晃轨迹等;预设生物特征信息可以包括但不限于预设人脸特征信息、预设虹膜特征信息、预设声纹特征信息、预设指纹特征信息等中的至少一种。
开启指令403,用于根据该语音输入开启指令,开启语音输入模式。
第二接收单元404,用于在该语音输入模式下,接收输入的语音信息。
显示单元405,用于在检测单元401检测出的目标输入栏中显示该语音信息对应的文字信息。
其中,实施图4所描述的移动终端,通过自动检测当前显示界面上空闲的文字输入栏,并接收用户按照预设方式输入的语音输入开启指令来快速开启语音输入功能以进行语音输入,而用户无需手动点击待输入的文字输入栏,也无需用户花时间去查找当前应用程序所提供的语音输入按钮。这样,自动检测空闲的文字输入栏,并采用快捷方式启动语音输入功能,能够提高语音输入的操作效率,有效改善用户进行语音输入的体验。
实施例四
请参阅图5,图5是本发明实施例公开的另一种移动终端的结构示意图,可以用于执行上述公开的语音输入方法。其中,图5所示的移动终端是由图4所示的移动终端进行优化得到的。与图4所示的移动终端相比较,图5所示的移动终端还可以包括:
预处理单元406,用于在显示单元405在目标输入栏中显示该语音信息对应的文字信息之前,对第二接收单元404接收到的该语音信息进行预处理,以获得预处理后的语音信息;
识别单元407,用于对预处理后的语音信息进行识别,以得出预处理后的语音信息所包含的内容;
相应地,显示单元405具体用于在检测单元401检测出的目标输入栏中以文字的形式显示预处理后的语音信息所包含的内容。
作为一种可选的实施方式,检测单元401可以进一步包括:
第一获取子单元4011,用于获取移动终端当前显示界面所属应用程序的注册接口;
第二获取子单元4012,用于获取该注册接口的状态信息;
判断子单元4013,用于判断该状态信息是否为预设状态信息,该预设状态信息用于指示输入栏未输入文字信息;
第一确定子单元4014,用于当判断子单元4013判断出该状态信息为预设状态信息时,确定该注册接口对应的输入栏为目标输入栏。
作为一种可选的实施方式,请一并参阅图6,图6是本发明实施例公开的又一种移动终端的结构示意图,可以用于执行上述公开的语音输入方法。其中,图6所示的移动终端是由图5所示的移动终端进行优化得到的。与图5所示的移动终端相比较,图6所示的移动终端中识别单元407可以进一步包括:
匹配子单元4071,用于将预处理后的语音信息与预设语音模型进行匹配,以获得匹配结果;
输出子单元4072,用于当匹配子单元4071将预处理后的语音信息与预设语音模型进行匹配的匹配率低于预设值时,输出至少一条识别内容;
接收子单元4073,用于接收用户针对上述至少一条识别内容中的其中一条输入的选取指令;
第二确定子单元4074,用于根据该选取指令,确定用户选取的识别内容为预处理后的语音信息所包含的内容。
其中,实施图6所描述的移动终端,通过自动检测当前显示界面上空闲的文字输入栏,并接收用户按照预设方式输入的语音输入开启指令来快速开启语音输入功能以进行语音输入,而用户无需手动点击待输入的文字输入栏,也无需用户花时间去查找当前应用程序所提供的语音输入按钮。这样,自动检测空闲的文字输入栏,并采用快捷方式启动语音输入功能,能够提高语音输入的操作效率,有效改善用户进行语音输入的体验。
具体地,本发明实施例中介绍的移动终端可以实施本发明结合图1或图2介绍的语音输入方法实施例中的部分或全部流程。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例移动终端中的单元或子单元可以根据实际需要进行合并、划分和删减。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种语音输入方法及移动终端进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种语音输入方法,其特征在于,包括:
检测移动终端当前显示界面中的目标输入栏,所述目标输入栏为未输入文字信息的输入栏;
接收用户按照预设方式触发的语音输入开启指令;
根据所述语音输入开启指令,开启语音输入模式;
在所述语音输入模式下,接收输入的语音信息;
在所述目标输入栏中显示所述语音信息对应的文字信息。
2.根据权利要求1所述的方法,其特征在于,所述检测移动终端当前显示界面中的目标输入栏,包括:
获取移动终端当前显示界面所属应用程序的注册接口;
获取所述注册接口的状态信息;
判断所述状态信息是否为预设状态信息,所述预设状态信息用于指示输入栏未输入文字信息;
如果所述状态信息为所述预设状态信息,确定所述注册接口对应的输入栏为目标输入栏。
3.根据权利要求1或2所述的方法,其特征在于,所述接收用户按照预设方式触发的语音输入开启指令,包括以下情况中的一种或几种的组合:
接收用户通过操作预设物理按键所触发的语音输入开启指令;
接收用户通过操作预设虚拟按键所触发的语音输入开启指令;
接收用户通过输入预设手势所触发的语音输入开启指令;
接收用户通过输入预设生物特征信息所触发的语音输入开启指令。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述在所述目标输入栏中显示所述语音信息对应的文字信息之前,所述方法还包括:
对接收到的所述语音信息进行预处理,以获得预处理后的语音信息;
对所述预处理后的语音信息进行识别,以得出所述预处理后的语音信息所包含的内容;
其中,所述在所述目标输入栏中显示所述语音信息对应的文字信息,包括:
在所述目标输入栏中以文字的形式显示所述预处理后的语音信息所包含的内容。
5.根据权利要求4所述的方法,其特征在于,所述对所述预处理后的语音信息进行识别,以得出所述预处理后的语音信息所包含的内容,包括:
将所述预处理后的语音信息与预设语音模型进行匹配,以获得匹配结果;
当所述预处理后的语音信息与所述预设语音模型进行匹配的匹配率低于预设值时,输出至少一条识别内容;
接收用户针对所述至少一条识别内容中的其中一条输入的选取指令;
根据所述选取指令,确定用户选取的识别内容为所述预处理后的语音信息所包含的内容。
6.一种移动终端,其特征在于,包括:
检测单元,用于检测移动终端当前显示界面中的目标输入栏,所述目标输入栏为未输入文字信息的输入栏;
第一接收单元,用于接收用户按照预设方式触发的语音输入开启指令;
开启指令,用于根据所述语音输入开启指令,开启语音输入模式;
第二接收单元,用于在所述语音输入模式下,接收输入的语音信息;
显示单元,用于在所述目标输入栏中显示所述语音信息对应的文字信息。
7.根据权利要求6所述的移动终端,其特征在于,所述检测单元包括:
第一获取子单元,用于获取移动终端当前显示界面所属应用程序的注册接口;
第二获取子单元,用于获取所述注册接口的状态信息;
判断子单元,用于判断所述状态信息是否为预设状态信息,所述预设状态信息用于指示输入栏未输入文字信息;
第一确定子单元,用于当所述判断子单元判断出所述状态信息为所述预设状态信息时,确定所述注册接口对应的输入栏为目标输入栏。
8.根据权利要求6或7所述的移动终端,其特征在于,所述第一接收单元接收用户按照预设方式触发的语音输入开启指令的方式具体包括以下情况中的一种或几种的组合:
所述第一接收单元接收用户通过操作预设物理按键所触发的语音输入开启指令;
所述第一接收单元接收用户通过操作预设虚拟按键所触发的语音输入开启指令;
所述第一接收单元接收用户通过输入预设手势所触发的语音输入开启指令;
所述第一接收单元接收用户通过输入预设生物特征信息所触发的语音输入开启指令。
9.根据权利要求6-8中任一项所述的移动终端,其特征在于,还包括:
预处理单元,用于在所述显示单元在所述目标输入栏中显示所述语音信息对应的文字信息之前,对接收到的所述语音信息进行预处理,以获得预处理后的语音信息;
识别单元,用于对所述预处理后的语音信息进行识别,以得出所述预处理后的语音信息所包含的内容;
所述显示单元具体用于在所述目标输入栏中以文字的形式显示所述预处理后的语音信息所包含的内容。
10.根据权利要求9所述的移动终端,其特征在于,所述识别单元包括:
匹配子单元,用于将所述预处理后的语音信息与预设语音模型进行匹配,以获得匹配结果;
输出子单元,用于当所述匹配子单元将所述预处理后的语音信息与所述预设语音模型进行匹配的匹配率低于预设值时,输出至少一条识别内容;
接收子单元,用于接收用户针对所述至少一条识别内容中的其中一条输入的选取指令;
第二确定子单元,用于根据所述选取指令,确定用户选取的识别内容为所述预处理后的语音信息所包含的内容。
CN201710339137.3A 2017-05-15 2017-05-15 一种语音输入方法及移动终端 Pending CN107193914A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710339137.3A CN107193914A (zh) 2017-05-15 2017-05-15 一种语音输入方法及移动终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710339137.3A CN107193914A (zh) 2017-05-15 2017-05-15 一种语音输入方法及移动终端

Publications (1)

Publication Number Publication Date
CN107193914A true CN107193914A (zh) 2017-09-22

Family

ID=59873630

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710339137.3A Pending CN107193914A (zh) 2017-05-15 2017-05-15 一种语音输入方法及移动终端

Country Status (1)

Country Link
CN (1) CN107193914A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107819946A (zh) * 2017-10-27 2018-03-20 维沃移动通信有限公司 一种语音识别的方法、装置及移动终端
CN108986833A (zh) * 2018-08-21 2018-12-11 广州市保伦电子有限公司 基于麦克风阵列的拾音方法、系统、电子设备及存储介质
CN109346077A (zh) * 2018-11-01 2019-02-15 汤强 一种适用于便携智能设备的语音系统及其使用方法
CN110334352A (zh) * 2019-07-08 2019-10-15 腾讯科技(深圳)有限公司 引导信息显示方法、装置、终端及存储介质
CN110491377A (zh) * 2018-05-14 2019-11-22 成都野望数码科技有限公司 一种输入方法和装置
CN110597378A (zh) * 2019-09-09 2019-12-20 北京字节跳动网络技术有限公司 智能终端节电方法、装置和电子设备
CN111538470A (zh) * 2020-04-14 2020-08-14 北京小米移动软件有限公司 信息输入方法、装置及终端设备
CN112399017A (zh) * 2020-11-16 2021-02-23 广东商路信息科技有限公司 Ip话机语音输入编辑短信的方法及系统
CN114697717A (zh) * 2020-12-28 2022-07-01 深圳Tcl新技术有限公司 一种文本输入方法和终端设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104090652A (zh) * 2014-06-13 2014-10-08 北京搜狗科技发展有限公司 一种语音输入方法和装置
CN105843839A (zh) * 2016-02-01 2016-08-10 乐视移动智能信息技术(北京)有限公司 一种语音式搜索方法及装置
CN106610810A (zh) * 2016-12-06 2017-05-03 深圳市全智达科技有限公司 一种语音输入方法及装置
CN106648926A (zh) * 2016-08-05 2017-05-10 乐视控股(北京)有限公司 信息输入方法和装置
CN106648535A (zh) * 2016-12-28 2017-05-10 广州虎牙信息科技有限公司 直播客户端语音输入方法及终端设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104090652A (zh) * 2014-06-13 2014-10-08 北京搜狗科技发展有限公司 一种语音输入方法和装置
CN105843839A (zh) * 2016-02-01 2016-08-10 乐视移动智能信息技术(北京)有限公司 一种语音式搜索方法及装置
CN106648926A (zh) * 2016-08-05 2017-05-10 乐视控股(北京)有限公司 信息输入方法和装置
CN106610810A (zh) * 2016-12-06 2017-05-03 深圳市全智达科技有限公司 一种语音输入方法及装置
CN106648535A (zh) * 2016-12-28 2017-05-10 广州虎牙信息科技有限公司 直播客户端语音输入方法及终端设备

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107819946A (zh) * 2017-10-27 2018-03-20 维沃移动通信有限公司 一种语音识别的方法、装置及移动终端
CN110491377A (zh) * 2018-05-14 2019-11-22 成都野望数码科技有限公司 一种输入方法和装置
CN108986833A (zh) * 2018-08-21 2018-12-11 广州市保伦电子有限公司 基于麦克风阵列的拾音方法、系统、电子设备及存储介质
CN109346077A (zh) * 2018-11-01 2019-02-15 汤强 一种适用于便携智能设备的语音系统及其使用方法
CN109346077B (zh) * 2018-11-01 2022-03-25 汤强 一种适用于便携智能设备的语音系统及其使用方法
CN110334352A (zh) * 2019-07-08 2019-10-15 腾讯科技(深圳)有限公司 引导信息显示方法、装置、终端及存储介质
CN110597378A (zh) * 2019-09-09 2019-12-20 北京字节跳动网络技术有限公司 智能终端节电方法、装置和电子设备
CN111538470A (zh) * 2020-04-14 2020-08-14 北京小米移动软件有限公司 信息输入方法、装置及终端设备
CN111538470B (zh) * 2020-04-14 2023-09-26 北京小米移动软件有限公司 信息输入方法、装置及终端设备
CN112399017A (zh) * 2020-11-16 2021-02-23 广东商路信息科技有限公司 Ip话机语音输入编辑短信的方法及系统
CN114697717A (zh) * 2020-12-28 2022-07-01 深圳Tcl新技术有限公司 一种文本输入方法和终端设备

Similar Documents

Publication Publication Date Title
CN107193914A (zh) 一种语音输入方法及移动终端
JP4416643B2 (ja) マルチモーダル入力方法
US10748530B2 (en) Centralized method and system for determining voice commands
US7054817B2 (en) User interface for speech model generation and testing
CN107436691B (zh) 一种输入法进行纠错的方法、客户端、服务器及装置
EP3655863A1 (en) Automatic integration of image capture and recognition in a voice-based query to understand intent
WO2017204843A1 (en) Unit-selection text-to-speech synthesis based on predicted concatenation parameters
EP3001414A1 (en) Method and apparatus for executing voice command in electronic device
US20100241431A1 (en) System and Method for Multi-Modal Input Synchronization and Disambiguation
KR101545881B1 (ko) 휴대 단말기의 입력 처리 장치 및 방법
KR101474854B1 (ko) 음성인식을 통해 컨트롤 객체를 선택하기 위한 장치 및 방법
CN109599108A (zh) 一种听写辅助方法及听写辅助装置
US11615784B2 (en) Control method and control apparatus for speech interaction
CN106971723A (zh) 语音处理方法和装置、用于语音处理的装置
CN110544473B (zh) 语音交互方法和装置
CN106415719A (zh) 使用说话者识别的语音信号的稳健端点指示
CN110534109B (zh) 语音识别方法、装置、电子设备及存储介质
CN110147216A (zh) 应用程序的页面切换方法、装置、计算机设备和存储介质
US10770077B2 (en) Electronic device and method
US9870772B2 (en) Guiding device, guiding method, program, and information storage medium
JP2011059676A (ja) 発話入力に基づいて複数の機能を有効にするためのシステム及び方法
KR20150027885A (ko) 전자 필기 운용 방법 및 이를 지원하는 전자 장치
CN109671309A (zh) 一种错误读音识别方法及电子设备
CN112562723B (zh) 发音准确度确定方法、装置、存储介质和电子设备
JP6682007B2 (ja) 電子機器、電子機器の制御方法及び電子機器の制御プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170922