CN112445453A - 一种输入方法、装置和电子设备 - Google Patents

一种输入方法、装置和电子设备 Download PDF

Info

Publication number
CN112445453A
CN112445453A CN202011250864.0A CN202011250864A CN112445453A CN 112445453 A CN112445453 A CN 112445453A CN 202011250864 A CN202011250864 A CN 202011250864A CN 112445453 A CN112445453 A CN 112445453A
Authority
CN
China
Prior art keywords
input
preset
intention
user
symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011250864.0A
Other languages
English (en)
Other versions
CN112445453B (zh
Inventor
曹进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN202011250864.0A priority Critical patent/CN112445453B/zh
Publication of CN112445453A publication Critical patent/CN112445453A/zh
Application granted granted Critical
Publication of CN112445453B publication Critical patent/CN112445453B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0489Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using dedicated keyboard keys or combinations thereof
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供了一种输入方法、装置和电子设备,其中,所述方法包括:获取用户输入的语音数据;对所述语音数据进行符号转换;若符号转换成功,则将转换得到的符号上屏;进而实现语音输入符号。且在输入过程中,无需特意切换至符号键盘输入符号,也无需反复修改,实现语音的连贯流畅输入。

Description

一种输入方法、装置和电子设备
技术领域
本发明涉及数据处理技术领域,特别是涉及一种输入方法、装置和电子设备。
背景技术
随着计算机技术的发展,诸如手机、平板电脑等电子设备越来越普及,给人们的生活、学习、工作带来了极大的便利。这些电子设备通常安装有输入法应用程序(简称输入法),使得用户可使用该输入法进行信息输入。
目前输入法仅能将获取到的语音数据识别成对应的文本信息,例如,用户采用汉语输入“今天天气很好”的语音后,输入法语音识别出文本“今天天气很好”。又例如,用户采用英语输入“the weather is nice today”的语音后,输入法语音识别出文本“theweather is nice today”。因此在用户意图输入符号如“,”时,若用户以输入语音“逗号”,则输入法会将“逗号”这两个文本上屏,导致用户无法使用语音输入符号。
发明内容
本发明实施例提供一种输入方法,以实现语音输入符号。
相应的,本发明实施例还提供了一种输入装置和一种电子设备,用以保证上述方法的实现及应用。
为了解决上述问题,本发明实施例公开了一种输入方法,具体包括:获取用户输入的语音数据;对所述语音数据进行符号转换;若符号转换成功,则将转换得到的符号上屏。
可选地,所述的方法还包括:判断用户是否具有预设意图,其中,所述预设意图是输入英文、数字和符号中的一种或多种的意图;若确定用户具有预设意图,则执行所述对所述语音数据进行符号转换的步骤。
可选地,所述判断用户是否具有预设意图,包括:判断输入框是否具有预设属性;所述预设属性包括:账号属性、密码属性、邮箱属性或验证属性;若输入框具有预设属性,则确定用户具有预设意图。
可选地,所述判断用户是否具有预设意图,包括:判断输入法键盘是否处于预设状态,所述预设状态包括:英文状态、数字状态或符号状态;若输入法键盘处于预设状态,则确定用户具有预设意图。
可选地,所述判断用户是否具有预设意图,包括:对所述语音数据进行语音识别,得到所述语音数据对应的语音识别文本信息;判断所述语音识别文本信息是否满足预设条件;若所述语音识别文本信息满足预设条件,则确定用户具有预设意图。
可选地,所述判断用户是否具有预设意图,包括:获取输入关联信息;依据所述输入关联信息进行意图分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图。
可选地,所述判断用户是否具有预设意图,包括:获取当前输入页面的内容;依据所述当前输入页面的内容进行分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图。
可选地,所述对所述语音数据进行符号转换,包括:获取所述语音数据对应的语音识别文本信息;依据预设模型对所述语音数据进行符号转换。
可选地,所述的方法还包括训练预设模型的步骤:收集训练数据,所述训练数据包括符号和各符号对应的符号名称;采用所述训练语料对预设模型进行训练。
可选地,所述的方法还包括:判断是否存在所述语音数据对应的符号;若存在所述语音数据对应的符号,则生成上屏符号的提示信息并展示;若接收到第一执行信息,则执行所述对所述语音数据进行符号转换的步骤。
可选地,所述的方法还包括:若接收到第二执行信息,则将所述语音数据对应的语音识别文本信息上屏。
可选地,所述的方法还包括:若符号转换失败,则将所述语音数据对应的语音识别文本信息上屏。
本发明实施例还公开了一种输入装置,具体包括:获取模块,用于获取用户输入的语音数据;转换模块,用于对所述语音数据进行符号转换;第一上屏模块,用于若符号转换成功,则将转换得到的符号上屏。
可选地,所述的装置还包括:意图判断模块,用于判断用户是否具有预设意图,其中,所述预设意图是输入英文、数字和符号中的一种或多种的意图;所述转换模块,用于若确定用户具有预设意图,则执行所述对所述语音数据进行符号转换的步骤。
可选地,所述意图判断模块,包括:属性判断子模块,用于判断输入框是否具有预设属性;所述预设属性包括:账号属性、密码属性、邮箱属性或验证属性;若输入框具有预设属性,则确定用户具有预设意图。
可选地,所述意图判断模块,包括:状态判断子模块,用于判断输入法键盘是否处于预设状态,所述预设状态包括:英文状态、数字状态或符号状态;若输入法键盘处于预设状态,则确定用户具有预设意图。
可选地,所述意图判断模块,包括:条件判断子模块,用于对所述语音数据进行语音识别,得到所述语音数据对应的语音识别文本信息;判断所述语音识别文本信息是否满足预设条件;若所述语音识别文本信息满足预设条件,则确定用户具有预设意图。
可选地,所述意图判断模块,包括:第一分析判断子模块,用于获取输入关联信息;依据所述输入关联信息进行意图分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图。
可选地,所述意图判断模块,包括:第二分析判断子模块,用于获取当前输入页面的内容;依据所述当前输入页面的内容进行分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图。
可选地,所述转换模块,用于获取所述语音数据对应的语音识别文本信息;依据预设模型对所述语音数据进行符号转换。
可选地,所述的装置还包括:训练模块,用于收集训练数据,所述训练数据包括符号和各符号对应的符号名称;采用所述训练语料对预设模型进行训练。
可选地,所述的装置还包括:符号判断模块,用于判断是否存在所述语音数据对应的符号;提示模块,用于若存在所述语音数据对应的符号,则生成上屏符号的提示信息并展示;所述转换模块,用于若接收到第一执行信息,则执行所述对所述语音数据进行符号转换的步骤。
可选地,所述的装置还包括:第二上屏模块,用于若接收到第二执行信息,则将所述语音数据对应的语音识别文本信息上屏。
可选地,所述的装置还包括:第三上屏模块,用于若符号转换失败,则将所述语音数据对应的语音识别文本信息上屏。
本发明实施例还公开了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如本发明实施例任一所述的输入方法。
本发明实施例还公开了一种电子设备,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取用户输入的语音数据;对所述语音数据进行符号转换;若符号转换成功,则将转换得到的符号上屏。
可选地,还包含用于进行以下操作的指令:判断用户是否具有预设意图,其中,所述预设意图是输入英文、数字和符号中的一种或多种的意图;若确定用户具有预设意图,则执行所述对所述语音数据进行符号转换的步骤。
可选地,所述判断用户是否具有预设意图,包括:判断输入框是否具有预设属性;所述预设属性包括:账号属性、密码属性、邮箱属性或验证属性;若输入框具有预设属性,则确定用户具有预设意图。
可选地,所述判断用户是否具有预设意图,包括:判断输入法键盘是否处于预设状态,所述预设状态包括:英文状态、数字状态或符号状态;若输入法键盘处于预设状态,则确定用户具有预设意图。
可选地,所述判断用户是否具有预设意图,包括:对所述语音数据进行语音识别,得到所述语音数据对应的语音识别文本信息;判断所述语音识别文本信息是否满足预设条件;若所述语音识别文本信息满足预设条件,则确定用户具有预设意图。
可选地,所述判断用户是否具有预设意图,包括:获取输入关联信息;依据所述输入关联信息进行意图分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图。
可选地,所述判断用户是否具有预设意图,包括:获取当前输入页面的内容;依据所述当前输入页面的内容进行分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图。
可选地,所述对所述语音数据进行符号转换,包括:获取所述语音数据对应的语音识别文本信息;依据预设模型对所述语音数据进行符号转换。
可选地,还包含用于进行以下训练预设模型的指令:收集训练数据,所述训练数据包括符号和各符号对应的符号名称;采用所述训练语料对预设模型进行训练。
可选地,还包含用于进行以下操作的指令:判断是否存在所述语音数据对应的符号;若存在所述语音数据对应的符号,则生成上屏符号的提示信息并展示;若接收到第一执行信息,则执行所述对所述语音数据进行符号转换的步骤。
可选地,还包含用于进行以下操作的指令:若接收到第二执行信息,则将所述语音数据对应的语音识别文本信息上屏。
可选地,还包含用于进行以下操作的指令:若符号转换失败,则将所述语音数据对应的语音识别文本信息上屏。
本发明实施例包括以下优点:
本发明实施例中,可以获取用户输入的语音数据,然后对所述语音数据进行符号转换;若符号转换成功,则将转换得到的符号上屏;进而实现语音输入符号。且在输入过程中,无需特意切换至符号键盘输入符号,也无需反复修改,实现语音的连贯流畅输入。
附图说明
图1是本发明的一种输入方法实施例的步骤流程图;
图2是本发明的一种输入方法可选实施例的步骤流程图;
图3是本发明的另一种输入方法可选实施例的步骤流程图;
图4是本发明的又一种输入方法可选实施例的步骤流程图;
图5是本发明的再一种输入方法可选实施例的步骤流程图;
图6是本发明的还一种输入方法可选实施例的步骤流程图;
图7是本发明的又一种输入方法实施例的步骤流程图;
图8是本发明的一种输入装置实施例的结构框图;
图9是本发明的一种输入装置可选实施例的结构框图;
图10根据一示例性实施例示出的一种用于输入的电子设备的结构框图;
图11是本发明根据另一示例性实施例示出的一种用于输入的电子设备的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本发明实施例提供的输入方法,可以应用于多种电子设备的语音输入场景,如应用在电视的语音输入场景中,又如应用在学习机的语音输入场景中,还如应用在智能手表的语音输入场景中等,本发明实施例对此不作限制。
本发明实施例的核心构思之一是,在获取到用户输入的语音数据后,对所述语音数据进行符号转换,并在成功将所述语音数据转换为符号后,将符号上屏;从而实现语音输入符号。且在输入过程中,无需特意切换至符号键盘输入符号,也无需反复修改,实现语音的连贯流畅输入。
参照图1,示出了本发明的一种输入方法实施例的步骤流程图,具体可以包括如下步骤:
步骤102、获取用户输入的语音数据。
步骤104、对所述语音数据进行符号转换。
步骤106、若符号转换成功,则将转换得到的符号上屏。
本发明实施例中,用户在使用输入法进行输入的过程中,可以采用语音进行输入;其中,用户可以采用各种语种进行语音输入,如中文、英文、日文、韩文等等,本发明实施例对此不作限制。
在用户语音输入过程中,输入法可以获取用户输入的语音数据;然后可以对语音数据进行符号转换。其中,对所述语音数据进行符号转换,可以是指将语音数据转换为符号的过程;所述符号可以包括标点符号如“,”、“。”、“.”等,数学符号如“*”,“/”、“+”、“-”、“&”等;单位符号如“%”等,货币符号如“¥”等,还有其他符号如“@”等等,本发明实施例对此不作限制。
其中,对所述语音数据进行符号转换,可能能够将语音数据转换为对应的符号(即符号转换成功),也可能无法将语音数据转换为对应的符号(即符号转换失败)。若符号转换成功,则可以将转换得到的符号上屏。若符号转换失败,则可以将对语音数据进行语音识别得到的语音识别文本信息上屏。
综上,本发明实施例中,可以获取用户输入的语音数据,然后对所述语音数据进行符号转换;若符号转换成功,则将转换得到的符号上屏;进而实现语音输入符号。且在输入过程中,无需特意切换至符号键盘输入符号,也无需反复修改,实现语音的连贯流畅输入。
本发明的一个可选实施例中,所述的方法还可以包括:判断用户是否具有预设意图;若确定用户具有预设意图,则执行所述对所述语音数据进行符号转换的步骤。其中,所述预设意图是输入英文、数字和符号中的一个或多种的意图,可以包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图等意图。
其中,可以在获取用户输入的语音数据之前,判断用户是否具有预设意图;也可以是在获取用户输入的语音数据时,判断用户是否具有预设意图;还可以是在获取用户输入的语音数据之后,判断用户是否具有预设意图,本发明实施例对此不作限制。
本发明实施例中,判断用户是否具有预设意图的方式可以包括多种,例如根据当前的输入框判断,根据输入法键盘的状态判断,根据对语音数据的语音识别结果判断,根据输入关联信息判断,以及根据当前输入页面的内容判断等等;本发明实施例对此不作限制。其中,所述输入关联信息,可以包括所有与输入相关的信息,如交互信息、位置信息、其他应用程序的关联信息如界面信息等,本发明实施例对此不作限制。所述其他应用程序可以是指除输入法之外的应用程序。以下以在获取用户输入的语音数据之后,判断用户是否具有预设意图为例,分别对判断用户是否具有预设意图的各种方式进行说明。
本发明的一个可选实施例中,可以根据当前的输入框,来判断用户是否具有预设意图。可以应用于仅支持输入英文、数字和符号中一种或多种的语音输入场景中,如输入账号的场景、输入密码的场景、输入邮箱的场景、输入验证信息的场景等等,本发明实施例对此不作限制。可以如下:
参照图2,示出了本发明的一种输入方法可选实施例的步骤流程图,具体可以包括如下步骤:
步骤202、获取用户输入的语音数据。
本发明实施例中,当用户需要在输入框中输入信息时,可以调起输入法;然后采用输入法进行语音输入,将所需输入的信息输入至输入框中。
步骤204、判断输入框是否具有预设属性;所述预设属性包括:账号属性、密码属性、邮箱属性或验证属性。
其中,输入框具有属性,如搜索属性、聊天属性、评论属性、账号属性、密码属性、邮箱属性、验证属性等等。其中,具有搜索属性的输入框可以用于输入搜索信息,所述搜索信息可以包括各种语种的字词、符号、数字、图片等;具有聊天属性的输入框可以用于输入交互信息,所述交互信息可以包括各种语种的字词、符号、数字、图片等;具有评论属性的输入框可以用于输入评论信息,所述评论信息可以包括各种语种的字词、符号、数字、图片等。具有账号属性的输入框可以用于输入账号,所述账号可以包括英文、数字和符号中的一种或多种;具有密码属性的输入框可以用于输入密码,所述密码可以包括英文、数字和符号中的一种或多种;具有邮箱属性的输入框可以用于输入邮箱名称,所述邮箱名称可以包括英文、数字和符号中的一种或多种;具有验证属性的输入框可以用于输入验证信息,所述验证信息可以包括英文、数字和符号中的一种或多种。
本发明实施例中,可以在用户语音输入账号、密码、邮箱、验证信息等,仅支持输入英文、数字和符号中的一种或多种的场景中,支持语音输入符号;便于用户快速输入账号、密码、邮箱、验证信息等信息。进而本发明实施例中,可以将仅支持输入英文、数字、符号中的一种或多种的输入框对应的属性,设置为预设属性;例如可以将账号属性、密码属性、邮箱属性或验证属性,设置为预设属性。然后通过判断输入框是否具有预设属性,来判断用户是否具有预设意图。当然还可以将仅支持输入英文、数字、符号中的一种或多种的输入框对应的其它属性,设置为预设属性,本发明实施例对此不作限制。
本发明实施例可以获取当前输入框的属性,然后判断当前输入框的属性是否是预设属性中的一种;若当前输入框的属性是预设属性中的一种,则可以确定输入框具有预设属性,此时,可以确定用户具有预设意图;可以执行步骤206。若当前输入法的属性不是预设属性中的任意一种,则可以确定输入框不具有预设属性,此时,可以确定用户不具有预设意图,可以执行步骤212。
其中,所述对所述语音数据进行符号转换,可以参照如下步骤206~步骤208:
步骤206、若输入框具有预设属性,则获取所述语音数据对应的语音识别文本信息。
步骤208、依据预设模型对所述语音识别文本信息进行符号转换。
本发明实施例中,可以对语音数据进行语音识别,确定对应的语音识别文本信息。
一个示例中,可以将语音识别文本信息输入至预先训练的预设模型中,由预设模型对语音识别文本信息进行处理,输出对应的符号。
本发明的一个可选实施例中,一种训练预设模型的步骤如下子步骤S22~子步骤S24:
子步骤S22:收集训练数据,所述训练数据包括符号和各符号对应的符号名称。
子步骤S24:采用所述训练数据对预设模型进行训练。
一个示例中,训练语料可以如下表1所示:
Figure BDA0002771553070000101
Figure BDA0002771553070000111
表1
其中,表1中仅示出了部分符号,以及各符号对应的符号名称。此外,表1中仅示出了中文的符号名称,各符号对应的符号名称可以是其他语种,本发明实施例对此不作限制。
其中,一个符号和其对应的一个符号名称,可以称为一组训练数据;然后可以采用多组训练数据对预设模型进行训练。其中,针对每组训练数据,可以将该组训练数据中的符号名称输入至预设模型中进行前向计算,得到预设模型输出的各符号的概率;然后可以对该预设模型进行反向训练,使得预设模型输出该组训练数据中符号的概率最大为止。
在使用该训练后的预设模型进行符号转换时,可以先对语音识别文本信息进行分词,得到对应的多个分词片段;然后再依次将各分词片段输入至训练后的预设模型中。针对每一个分词片段,预设模型可以输出概率最大的符号。其中,当该分词片段命中某一个符号名称时,预设模型可以确定该符号名称对应的符号的概率最大,可以输出该符号;此时,可以确定对该分词片段的符号转换成功。当该分词片段未命中任一符号名称时,预设模型可以输出其它信息;此时可以对将该分词片段的符号转换失败。
其中,针对符号转换成功的分词片段,可以将该分词片段对应符号上屏,即执行步骤210。
针对符号转换失败的分词片段,若该分词片段是英文或数字,则可以将该分词片段上屏,即执行步骤212。
步骤210、若符号转换成功,则将转换得到的符号上屏。
步骤212、若输入框不具有预设属性或符号转换失败,则将所述语音数据对应的语音识别文本信息上屏。
本发明实施例中,若确定用户不具有预设意图,则可以对语音数据进行语音识别,得到对应的语音识别文本信息;然后可以将该语音识别文本信息上屏。
以及针对符号转换失败的分词片段,若该分词片段是英文或数字,则也可以将该分词片段上屏;也就是将语音数据对应的部分语音识别文本信息上屏。
本发明的一个示例中,符号转换得到的符号可以是英文符号。
例如,语音数据为“逗号”,若输入框具有账号属性,则对所述语音数据进行符号转换,得到英文符号“,”上屏。
又例如,语音数据为“人民币”,若输入框具有密码属性,则对所述语音数据进行符号转换,得到符号“¥”上屏。
又例如,语音数据为“ABC下划线”,若输入框具有邮箱属性,则对所述语音数据进行符号转换;其中,可以部分语音数据“下划线”符号转换成功,得到符号“_”,对另一部分语音数据“ABC”符号识别,得到语音识别文本信息“ABC”;然后可以将“ABC_”上屏。
综上,本发明实施例中,判断输入框是否具有预设属性;所述预设属性包括:账号属性、密码属性、邮箱属性或验证属性;若输入框具有预设属性,则确定用户具有预设意图;进而能够准确地判断出用户是否是输入账号、密码、邮箱、验证信息等,并实现在用户账号、密码、邮箱、验证信息等场景下的语音输入符号,有利于提高用户的输入效率,提高用户体验。
本发明的一个可选实施例中,可以根据输入法键盘当前的状态,来判断用户是否具有预设意图。可以应用于仅支持输入英文、数字和符号中一种或多种的语音输入场景中,如输入账号的场景、输入密码的场景、输入邮箱的场景、输入验证信息的场景等等,本发明实施例对此不作限制。可以如下:
参照图3,示出了本发明的另一种输入方法可选实施例的步骤流程图,具体可以包括如下步骤:
步骤302、获取用户输入的语音数据。
步骤304、判断输入法键盘是否处于预设状态,所述预设状态包括:英文状态、数字状态或符号状态。
本发明实施例中,在语音输入账号、密码、邮箱、验证信息等,仅支持输入英文、数字和符号中的一种或多种的场景中,当前输入框的属性可以是上述预设属性;进而在用户在当前输入框中调起输入法键盘时,输入法键盘可以自动切换状态,如切换为英文状态、数字状态或符号状态。进而可以将英文状态、数字状态或符号状态,设置为预设状态;然后通过判断输入法键盘是否处于预设状态,来判断用户是否具有预设意图。
若输入法键盘处于预设状态,则确定用户具有预设意图,可以执行步骤306;若输入法键盘未处于预设状态,则确定用户不具有预设意图,可以执行步骤312。
步骤306、若输入法键盘处于预设状态,则获取所述语音数据对应的语音识别文本信息。
步骤308、依据预设模型对所述语音识别文本信息进行符号转换。
其中,步骤306~步骤308,与上述步骤206~步骤208类似,在此不再赘述。
需要注意的是,由于输入法键盘处于英文状态时,无法确定用户是输入账号、密码、邮箱、验证信息,还是采用英文输入如搜索信息、交互信息、评论信息等信息;因此当输入法键盘处于英文状态时,若语音识别文本信息命中英文的符号名称,则预设模型可以输出其它信息。进而在用户采用英文输入除账号、密码、邮箱、验证信息之外的信息时,防止语音误输入符号。
步骤310、若符号转换成功,则将转换得到的符号上屏。
其中,步骤310与上述步骤210类似,在此不再赘述。
步骤312、若输入法键盘未处于预设状态或符号转换失败,则将所述语音数据对应的语音识别文本信息上屏。
其中,步骤312与上述步骤212类似,在此不再赘述。
本发明的一个示例中,符号转换得到的符号可以是英文符号。
综上,本发明实施例中,可以判断输入法键盘是否处于预设状态,所述预设状态包括:英文状态、数字状态或符号状态;若输入法键盘处于预设状态,则确定用户具有预设意图;进而能够快速地判断出用户是否是输入账号、密码、邮箱、验证信息等,并实现在用户账号、密码、邮箱、验证信息等场景下的语音输入符号,有利于提高用户的输入效率,提高用户体验。
本发明的一个可选实施例中,可以根据语音数据,来判断用户是否具有预设意图;可以应用于支持输入各种信息如字词、英文、数字和符号中一种或多种的语音输入场景中,如输入搜索信息的场景、输入交互信息的场景、输入评论信息的场景、输入账号的场景、输入密码的场景、输入邮箱的场景、输入验证信息的场景等等。可以如下:
参照图4,示出了本发明的又一种输入方法可选实施例的步骤流程图,具体可以包括如下步骤:
步骤402、获取用户输入的语音数据。
步骤404、对所述语音数据进行语音识别,得到所述语音数据对应的语音识别文本信息。
本发明实施例中,可以对语音数据进行语音识别,得到所述语音数据对应的语音识别文本信息;然后基于对语音识别文本信息的分析,判断当前输入场景是否为预设输入场景,可以参照步骤406:
步骤406、判断所述语音识别文本信息是否满足预设条件。
本发明实施例中,可以预先设置预设条件,所述预设条件用于判断用户是否具有预设意图。其中,预设条件可以包括预设模式,如“艾特+邮箱后缀”的模式,“大写+英文”的模式、“小写+英文”的模式、如“符号名称”的模式等等。
进而可以判断语音识别文本信息是否符合任意一种预设模式;若语音识别文本信息符合一种预设模式,则可以确定语音识别文本信息满足预设条件,此时可以确定用户具有预设意图,可以执行408。若语音识别文本信息不符合任意一种预设模式,则可以确定语音识别文本信息不满足预设条件,此时可以确定用户不具有预设意图,可以执行412。
步骤408、若所述语音识别文本信息满足预设条件,则依据预设模型对所述语音识别文本信息进行符号转换。
步骤408与上述步骤208类似,在此不再赘述。
步骤410、若符号转换成功,则将转换得到的符号上屏。
其中,步骤410与上述步骤210类似,在此不再赘述。
步骤412、若所述语音识别文本信息不满足预设条件或符号转换失败,则将所述语音数据对应的语音识别文本信息上屏。
其中,步骤412与上述步骤212类似,在此不再赘述。
本发明的一个示例中,所述符号转换得到的符号可以是中文符号,也可以是英文符号。
综上,本发明实施例中,可以对所述语音数据进行语音识别,得到所述语音数据对应的语音识别文本信息;判断所述语音识别文本信息是否满足预设条件;若所述语音识别文本信息满足预设条件,则确定用户具有预设意图;进而无需获取输入框的属性,也无需获取输入法键盘的状态,直接基于语音数据的语音识别文本信息,能够快速的判断用户是否是输入账号、密码、邮箱、验证信息等,并实现在用户账号、密码、邮箱、验证信息等场景下的语音输入符号,有利于提高用户的输入效率,提高用户体验。
本发明的一个可选实施例中,可以根据输入关联信息,来判断用户是否具有预设意图。可以应用于支持输入各种信息如字词、英文、数字和符号中一种或多种的语音输入场景中,如输入搜索信息的场景、输入交互信息的场景、输入评论信息的场景、输入账号的场景、输入密码的场景、输入邮箱的场景、输入验证信息的场景等等。可以如下:
参照图5,示出了本发明的再一种输入方法可选实施例的步骤流程图,具体可以包括如下步骤:
步骤502、获取用户输入的语音数据。
步骤504、获取输入关联信息。
其中,所述输入关联信息可以包括如交互信息、其他应用程序关联信息等;所述其他应用程序关联信息可以包括所有与调用输入法的其他应用程序相关的信息,如其他应用程序调用输入法界面的界面信息等。
步骤506、依据所述输入关联信息进行意图分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图。
例如,输入关联信息包括其他应用程序调用输入法界面的界面信息,则分析该界面是否是登录界面,若该界面是登录界面,则可以确定用户具有预设意图。
又例如,输入关联信息包括交互信息,如对端用户:“你给我你的账号和密码吧”,本端用户“好的,这就给你”;则可以确定用户具有预设意图。
当确定用户具有预设意图,则可以执行步骤508;当确定用户不具有预设意图,则可以执行步骤514。
步骤508、获取所述语音数据对应的语音识别文本信息。
步骤510、依据预设模型对所述语音识别文本信息进行符号转换。
其中,步骤508~步骤510,与上述步骤206~步骤208类似,在此不再赘述。
步骤512、若符号转换成功,则将转换得到的符号上屏。
其中,步骤512与上述步骤210类似,在此不再赘述。
步骤514、若确定用户不具有预设意图或符号转换失败,则将所述语音数据对应的语音识别文本信息上屏。
其中,步骤514与上述步骤212类似,在此不再赘述。
本发明的一个示例中,所述符号转换得到的符号可以是中文符号,也可以是英文符号。
综上,本发明实施例中,可以获取输入关联信息;然后依据所述输入关联信息进行意图分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图;进而通过输入意图的判断,准确地确定当前输入场景是否是预设输入场景;并实现在用户账号、密码、邮箱、验证信息等场景下的语音输入符号,有利于提高用户的输入效率,提高用户体验。
本发明的一个可选实施例中,可以根据当前输入页面的内容,来判断用户是否具有预设意图;可以应用于支持输入各种信息如字词、英文、数字和符号中一种或多种的语音输入场景中,如输入搜索信息的场景、输入交互信息的场景、输入评论信息的场景、输入账号的场景、输入密码的场景、输入邮箱的场景、输入验证信息的场景等等。可以如下:
参照图6,示出了本发明的还一种输入方法可选实施例的步骤流程图。
步骤602、获取用户输入的语音数据。
步骤604、获取当前输入页面的内容。
本发明实施例中,可以对当前输入页面进行截图,得到当前输入页面的图像。一个示例中,可以将当前输入页面的图像,作为当前输入页面的内容。另一示例中,可以对当前输入页面的图像进行图像识别,例如采用OCR(Optical Character Recognition,光学字符识别)识别技术对图像进行识别,得到图像识别结果;然后将图像识别结果作为当前输入页面的内容。
步骤606、依据所述当前输入页面的内容进行分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图。
本发明实施例中,预先可以获取包含仅支持输入英文、数字和符号中一种或多种的输入框的页面的图像,如邮箱登录页面,**会员登录页面,银行账号登录页面等等。并将这些页面的图像进行存储,为了便于后续说明,可以将这些页面称为预设页面。进而在获取当前输入页面的图像后,可以将当前输入页面的图像与预设页面的图像进行比对,来判断用户是否具有预设意图。当确定当前输入页面的图像与预设页面的图像相似度高于相似度阈值时,可以确定用户具有预设意图。当当前输入页面的图像与预设页面的图像相似度低于相似度阈值时,可以确定用户不具有预设意图。所述相似度阈值可以按照需求设置,本发明实施例对此不作限制。
本发明实施例中,预设还可以对预设页面进行图像识别,得到预设页面对应的图像识别结果。然后可以从图像识别结果提取关键词,以及各关键词的位置关系,作为预设信息并存储。例如从邮箱登录页面的识别结果中提取的关键词如:账号和密码;两者的位置关系是:“密码”位于“账号”的下一行,且两者对齐。进而在得到当前输入页面的图像识别结果后,可以将当前输入页面的图像识别结果与预设信息进行比对,来判断用户是否具有预设意图。当当前输入页面的图像识别结果与预设信息匹配时,可以确定用户具有预设意图。当当前输入页面的图像识别结果与预设信息不匹配时,可以确定用户不具有预设意图。
当确定用户具有预设意图,则可以确定用户具有预设意图,可以执行步骤608;当确定用户不具有预设意图,则可以确定用户不具有预设意图,可以执行步骤614。
步骤608、获取所述语音数据对应的语音识别文本信息。
步骤610、依据预设模型对所述语音识别文本信息进行符号转换。
其中,步骤608~步骤610,与上述步骤206~步骤208类似,在此不再赘述。
步骤612、若符号转换成功,则将转换得到的符号上屏。
其中,步骤612与上述步骤210类似,在此不再赘述。
步骤614、若确定用户不具有预设意图或符号转换失败,则将所述语音数据对应的语音识别文本信息上屏。
其中,步骤614与上述步骤212类似,在此不再赘述。
综上,本发明实施例中,可以获取当前输入页面的内容,依据所述当前输入页面的内容进行分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图;进而能够快速地判断出用户是否是输入账号、密码、邮箱、验证信息等,并实现在用户账号、密码、邮箱、验证信息等场景下的语音输入键盘指令,有利于提高用户的输入效率,提高用户体验。
本发明的一个可选实施例中,为了防止语音误输入符号,可以在获取语音数据后,判断是否存在所述语音数据对应的符号;当确定存在所述语音数据对应的符号时,生成提示信息;以提示用户是输入符号,还是输入文本信息。可以应用于支持输入各种信息如字词、英文、数字和符号中一种或多种的语音输入场景中,如输入搜索信息的场景、输入交互信息的场景、输入评论信息的场景、输入账号的场景、输入密码的场景、输入邮箱的场景、输入验证信息的场景等等。
参照图7,示出了本发明的又一种输入方法实施例的步骤流程图。
步骤702、获取用户输入的语音数据。
步骤704、判断是否存在所述语音数据对应的符号。
本发明实施例中,在获取语音数据后,可以先判断是否存在所述语音数据对应的符号。其中,可以对语音数据进行语音识别,确定对应的语音识别文本信息;然后基于该语音识别文本信息,判断是否存在所述语音数据对应的符号。
其中,可以将语音识别文本信息与训练数据中的符号名称进行比对。若语音识别文本信息命中符号名称,则可以确定存在语音数据对应的符号;若语音识别文本信息未命中符号名称,则可以确定不存在语音数据对应的符号。
步骤706、若存在所述语音数据对应的符号,则生成上屏符号的提示信息并展示。
若确定存在语音数据对应的符号,则可以生成上屏符号的提示信息并展示。一个示例中,以弹窗的方式对提示信息进行展示。
一个示例中,弹窗对提示信息进行展示的方式包括多种,例如展示“是否上屏符号”这个文本信息,并展示“是”和“否”两个选项。又例如,直接展示两个选项“上屏符号”和“上屏文本”。还例如,展示“是上屏符号,还是上屏文本”,并展示“符号”和“文本”两个选项。
步骤708、若接收到第一执行信息,则对所述语音数据进行符号转换。
当用户确定执行输入符号时,可以选取对应的选项;对应的,输入法可以接收到第一执行信息,所述第一执行信息可以是指执行上屏符号的确认信息;然后可以对语音数据进行符号转换。
其中,可以将语音识别文本信息输入至预设模型中进行符号转换,得到预设模型输出的符号。
步骤710、若符号转换成功,则将转换得到的符号上屏。
步骤712、若不存在所述语音数据对应的符号,或接收到第二执行信息,则将所述语音数据对应的语音识别文本信息上屏。
当用户确定执行上屏文本时,可以选取对应的选项;对应的,输入法可以接收到第二执行信息,所述第二执行信息可以是指执行上屏文本信息的确认信息;将所述语音数据对应的语音识别文本信息上屏。
当然,在不存在所述语音数据对应的符号时,也可以将所述语音数据对应的语音识别文本信息上屏。
需要注意的是,若采用步骤304,来判断用户是否具有预设意图,则当输入法键盘处于英文状态时,由于本发明实施例生成上屏符号的提示信息并展示,进而若语音识别文本信息命中英文的符号名称,则预设模型可以输出对应的符号。
本发明的一个示例中,符号转换得到的符号可以是英文符号,也可以是中文符号。
综上,本发明实施例中,若确定用户具有预设意图,则判断是否存在所述语音数据对应的符号;若所述语音数据存在对应的符号,生成上屏符号的提示信息并展示;若接收到第一执行信息,则执行所述对所述语音数据进行符号转换的步骤。进而通过展示提示信息给用户进行二次确认,可以有效的防止符号的误输入。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图8,示出了本发明的一种输入装置实施例的结构框图,具体可以包括如下模块:
获取模块802,用于获取用户输入的语音数据;
转换模块804,用于对所述语音数据进行符号转换;
第一上屏模块806,用于若符号转换成功,则将转换得到的符号上屏。
参照图9,示出了本发明的一种输入装置可选实施例的结构框图。
本发明一个可选的实施例中,所述的装置还包括:
意图判断模块808,用于判断用户是否具有预设意图,其中,所述预设意图是输入英文、数字和符号中的一种或多种的意图;
所述转换模块804,用于若确定用户具有预设意图,则执行所述对所述语音数据进行符号转换的步骤。
本发明一个可选的实施例中,所述意图判断模块808,包括:
属性判断子模块8082,用于判断输入框是否具有预设属性;所述预设属性包括:账号属性、密码属性、邮箱属性或验证属性;若输入框具有预设属性,则确定用户具有预设意图。
本发明一个可选的实施例中,所述意图判断模块808,包括:
状态判断子模块8084,用于判断输入法键盘是否处于预设状态,所述预设状态包括:英文状态、数字状态或符号状态;若输入法键盘处于预设状态,则确定用户具有预设意图。
本发明一个可选的实施例中,所述意图判断模块808,包括:
条件判断子模块8086,用于对所述语音数据进行语音识别,得到所述语音数据对应的语音识别文本信息;判断所述语音识别文本信息是否满足预设条件;若所述语音识别文本信息满足预设条件,则确定用户具有预设意图。
本发明一个可选的实施例中,所述意图判断模块808,包括:
第一分析判断子模块8088,用于获取输入关联信息;依据所述输入关联信息进行意图分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图。
本发明一个可选的实施例中,所述意图判断模块808,包括:
第二分析判断子模块80810,用于获取当前输入页面的内容;依据所述当前输入页面的内容进行分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图。
本发明一个可选的实施例中,所述转换模块804,用于获取所述语音数据对应的语音识别文本信息;依据预设模型对所述语音数据进行符号转换。
本发明一个可选的实施例中,所述的装置还包括:
训练模块810,用于收集训练数据,所述训练数据包括符号和各符号对应的符号名称;采用所述训练语料对预设模型进行训练。
本发明一个可选的实施例中,所述的装置还包括:
符号判断模块812,用于判断是否存在所述语音数据对应的符号;
提示模块814,用于若存在所述语音数据对应的符号,则生成上屏符号的提示信息并展示;
所述转换模块804,用于若接收到第一执行信息,则执行所述对所述语音数据进行符号转换的步骤。
本发明一个可选的实施例中,所述的装置还包括:
第二上屏模块816,用于若接收到第二执行信息,则将所述语音数据对应的语音识别文本信息上屏。
本发明一个可选的实施例中,所述的装置还包括:
第三上屏模块818,用于若符号转换失败,则将所述语音数据对应的语音识别文本信息上屏。
综上,本发明实施例中,可以获取用户输入的语音数据,然后对所述语音数据进行符号转换;若符号转换成功,则将转换得到的符号上屏;进而实现语音输入符号。且在输入过程中,无需特意切换至符号键盘输入符号,也无需反复修改,实现语音的连贯流畅输入。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
图10是根据一示例性实施例示出的一种用于输入的电子设备1000的结构框图。例如,电子设备1000可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图10,电子设备1000可以包括以下一个或多个组件:处理组件1002,存储器1004,电力组件1006,多媒体组件1008,音频组件1010,输入/输出(I/O)的接口1012,传感器组件1014,以及通信组件1016。
处理组件1002通常控制电子设备1000的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件1002可以包括一个或多个处理器1020来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件1002可以包括一个或多个模块,便于处理组件1002和其他组件之间的交互。例如,处理部件1002可以包括多媒体模块,以方便多媒体组件1008和处理组件1002之间的交互。
存储器1004被配置为存储各种类型的数据以支持在电子设备1000的操作。这些数据的示例包括用于在电子设备1000上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器1004可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件1006为电子设备1000的各种组件提供电力。电力组件1006可以包括电源管理系统,一个或多个电源,及其他与为电子设备1000生成、管理和分配电力相关联的组件。
多媒体组件1008包括在所述电子设备1000和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件1008包括一个前置摄像头和/或后置摄像头。当电子设备1000处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件1010被配置为输出和/或输入音频信号。例如,音频组件1010包括一个麦克风(MIC),当电子设备1000处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1004或经由通信组件1016发送。在一些实施例中,音频组件1010还包括一个扬声器,用于输出音频信号。
I/O接口1012为处理组件1002和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件1014包括一个或多个传感器,用于为电子设备1000提供各个方面的状态评估。例如,传感器组件1014可以检测到电子设备1000的打开/关闭状态,组件的相对定位,例如所述组件为电子设备1000的显示器和小键盘,传感器组件1014还可以检测电子设备1000或电子设备1000一个组件的位置改变,用户与电子设备1000接触的存在或不存在,电子设备1000方位或加速/减速和电子设备1000的温度变化。传感器组件1014可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1014还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件1014还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件1016被配置为便于电子设备1000和其他设备之间有线或无线方式的通信。电子设备1000可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件1014经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件1014还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,电子设备1000可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1004,上述指令可由电子设备1000的处理器1020执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种输入方法,所述方法包括:获取用户输入的语音数据;对所述语音数据进行符号转换;若符号转换成功,则将转换得到的符号上屏。
可选地,所述的方法还包括:判断用户是否具有预设意图,其中,所述预设意图是输入英文、数字和符号中的一种或多种的意图;若确定用户具有预设意图,则执行所述对所述语音数据进行符号转换的步骤。
可选地,所述判断用户是否具有预设意图,包括:判断输入框是否具有预设属性;所述预设属性包括:账号属性、密码属性、邮箱属性或验证属性;若输入框具有预设属性,则确定用户具有预设意图。
可选地,所述判断用户是否具有预设意图,包括:判断输入法键盘是否处于预设状态,所述预设状态包括:英文状态、数字状态或符号状态;若输入法键盘处于预设状态,则确定用户具有预设意图。
可选地,所述判断用户是否具有预设意图,包括:对所述语音数据进行语音识别,得到所述语音数据对应的语音识别文本信息;判断所述语音识别文本信息是否满足预设条件;若所述语音识别文本信息满足预设条件,则确定用户具有预设意图。
可选地,所述判断用户是否具有预设意图,包括:获取输入关联信息;依据所述输入关联信息进行意图分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图。
可选地,所述判断用户是否具有预设意图,包括:获取当前输入页面的内容;依据所述当前输入页面的内容进行分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图。
可选地,所述对所述语音数据进行符号转换,包括:获取所述语音数据对应的语音识别文本信息;依据预设模型对所述语音数据进行符号转换。
可选地,所述的方法还包括训练预设模型的步骤:收集训练数据,所述训练数据包括符号和各符号对应的符号名称;采用所述训练语料对预设模型进行训练。
可选地,所述的方法还包括:判断是否存在所述语音数据对应的符号;若存在所述语音数据对应的符号,则生成上屏符号的提示信息并展示;若接收到第一执行信息,则执行所述对所述语音数据进行符号转换的步骤。
可选地,所述的方法还包括:若接收到第二执行信息,则将所述语音数据对应的语音识别文本信息上屏。
可选地,所述的方法还包括:若符号转换失败,则将所述语音数据对应的语音识别文本信息上屏。
图11是本发明根据另一示例性实施例示出的一种用于输入的电子设备1100的结构示意图。该电子设备1100可以是服务器,该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1122(例如,一个或一个以上处理器)和存储器1132,一个或一个以上存储应用程序1142或数据1144的存储介质1130(例如一个或一个以上海量存储设备)。其中,存储器1132和存储介质1130可以是短暂存储或持久存储。存储在存储介质1130的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1122可以设置为与存储介质1130通信,在服务器上执行存储介质1130中的一系列指令操作。
服务器还可以包括一个或一个以上电源1126,一个或一个以上有线或无线网络接口1150,一个或一个以上输入输出接口1158,一个或一个以上键盘1156,和/或,一个或一个以上操作系统1141,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
在示例性实施例中,服务器经配置以由一个或者一个以上中央处理器1122执行一个或者一个以上程序包含用于进行以下操作的指令:获取用户输入的语音数据;对所述语音数据进行符号转换;若符号转换成功,则将转换得到的符号上屏。
可选地,所述的方法还包括:判断用户是否具有预设意图,其中,所述预设意图是输入英文、数字和符号中的一种或多种的意图;若确定用户具有预设意图,则执行所述对所述语音数据进行符号转换的步骤。
可选地,所述判断用户是否具有预设意图,包括:判断输入框是否具有预设属性;所述预设属性包括:账号属性、密码属性、邮箱属性或验证属性;若输入框具有预设属性,则确定用户具有预设意图。
可选地,所述判断用户是否具有预设意图,包括:判断输入法键盘是否处于预设状态,所述预设状态包括:英文状态、数字状态或符号状态;若输入法键盘处于预设状态,则确定用户具有预设意图。
可选地,所述判断用户是否具有预设意图,包括:对所述语音数据进行语音识别,得到所述语音数据对应的语音识别文本信息;判断所述语音识别文本信息是否满足预设条件;若所述语音识别文本信息满足预设条件,则确定用户具有预设意图。
可选地,所述判断用户是否具有预设意图,包括:获取输入关联信息;依据所述输入关联信息进行意图分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图。
可选地,所述判断用户是否具有预设意图,包括:获取当前输入页面的内容;依据所述当前输入页面的内容进行分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图。
可选地,所述对所述语音数据进行符号转换,包括:获取所述语音数据对应的语音识别文本信息;依据预设模型对所述语音数据进行符号转换。
可选地,所述的方法还包括训练预设模型的步骤:收集训练数据,所述训练数据包括符号和各符号对应的符号名称;采用所述训练语料对预设模型进行训练。
可选地,所述的方法还包括:判断是否存在所述语音数据对应的符号;若存在所述语音数据对应的符号,则生成上屏符号的提示信息并展示;若接收到第一执行信息,则执行所述对所述语音数据进行符号转换的步骤。
可选地,所述的方法还包括:若接收到第二执行信息,则将所述语音数据对应的语音识别文本信息上屏。
可选地,所述的方法还包括:若符号转换失败,则将所述语音数据对应的语音识别文本信息上屏。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种输入方法、一种输入装置和一种电子设备,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种输入方法,其特征在于,包括:
获取用户输入的语音数据;
对所述语音数据进行符号转换;
若符号转换成功,则将转换得到的符号上屏。
2.根据权利要求1所述的方法,其特征在于,所述的方法还包括:
判断用户是否具有预设意图,其中,所述预设意图是输入英文、数字和符号中的一种或多种的意图;
若确定用户具有预设意图,则执行所述对所述语音数据进行符号转换的步骤。
3.根据权利要求2所述的方法,其特征在于,所述判断用户是否具有预设意图,包括:
判断输入框是否具有预设属性;所述预设属性包括:账号属性、密码属性、邮箱属性或验证属性;
若输入框具有预设属性,则确定用户具有预设意图。
4.根据权利要求2所述的方法,其特征在于,所述判断用户是否具有预设意图,包括:
判断输入法键盘是否处于预设状态,所述预设状态包括:英文状态、数字状态或符号状态;
若输入法键盘处于预设状态,则确定用户具有预设意图。
5.根据权利要求2所述的方法,其特征在于,所述判断用户是否具有预设意图,包括:
对所述语音数据进行语音识别,得到所述语音数据对应的语音识别文本信息;
判断所述语音识别文本信息是否满足预设条件;
若所述语音识别文本信息满足预设条件,则确定用户具有预设意图。
6.根据权利要求2所述的方法,其特征在于,所述判断用户是否具有预设意图,包括:
获取输入关联信息;
依据所述输入关联信息进行意图分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图。
7.根据权利要求2所述的方法,其特征在于,所述判断用户是否具有预设意图,包括:
获取当前输入页面的内容;
依据所述当前输入页面的内容进行分析,判断用户是否具有预设意图,所述预设意图包括:账号输入意图、密码输入意图、邮箱输入意图和验证信息输入意图。
8.一种输入装置,其特征在于,包括:
获取模块,用于获取用户输入的语音数据;
转换模块,用于对所述语音数据进行符号转换;
第一上屏模块,用于若符号转换成功,则将转换得到的符号上屏。
9.一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
获取用户输入的语音数据;
对所述语音数据进行符号转换;
若符号转换成功,则将转换得到的符号上屏。
10.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1-7任一所述的输入方法。
CN202011250864.0A 2020-11-10 2020-11-10 一种输入方法、装置和电子设备 Active CN112445453B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011250864.0A CN112445453B (zh) 2020-11-10 2020-11-10 一种输入方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011250864.0A CN112445453B (zh) 2020-11-10 2020-11-10 一种输入方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN112445453A true CN112445453A (zh) 2021-03-05
CN112445453B CN112445453B (zh) 2024-09-13

Family

ID=74735775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011250864.0A Active CN112445453B (zh) 2020-11-10 2020-11-10 一种输入方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN112445453B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1235312A (zh) * 1998-05-13 1999-11-17 国际商业机器公司 连续语音识别中的标点符号自动生成装置及方法
US20110112836A1 (en) * 2008-07-03 2011-05-12 Mobiter Dicta Oy Method and device for converting speech
US20140350918A1 (en) * 2013-05-24 2014-11-27 Tencent Technology (Shenzhen) Co., Ltd. Method and system for adding punctuation to voice files
CN106024014A (zh) * 2016-05-24 2016-10-12 努比亚技术有限公司 一种语音转换方法、装置及移动终端
CN107450746A (zh) * 2017-08-18 2017-12-08 联想(北京)有限公司 一种表情符号的插入方法、装置和电子设备
CN107564526A (zh) * 2017-07-28 2018-01-09 北京搜狗科技发展有限公司 处理方法、装置和机器可读介质
CN108255841A (zh) * 2016-12-28 2018-07-06 北京新唐思创教育科技有限公司 一种题目搜索的方法及其装置
CN109213469A (zh) * 2018-08-27 2019-01-15 四川长虹电器股份有限公司 语音输入法词库优先级自动调整方法及系统
CN109817210A (zh) * 2019-02-12 2019-05-28 百度在线网络技术(北京)有限公司 语音写作方法、装置、终端和存储介质
CN111651961A (zh) * 2020-04-15 2020-09-11 北京捷通华声科技股份有限公司 一种基于语音的输入方法和装置
CN111881655A (zh) * 2020-08-05 2020-11-03 深圳乐华高科实业有限公司 一种语音输入标点符号快速切换方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1235312A (zh) * 1998-05-13 1999-11-17 国际商业机器公司 连续语音识别中的标点符号自动生成装置及方法
US20110112836A1 (en) * 2008-07-03 2011-05-12 Mobiter Dicta Oy Method and device for converting speech
US20140350918A1 (en) * 2013-05-24 2014-11-27 Tencent Technology (Shenzhen) Co., Ltd. Method and system for adding punctuation to voice files
CN106024014A (zh) * 2016-05-24 2016-10-12 努比亚技术有限公司 一种语音转换方法、装置及移动终端
CN108255841A (zh) * 2016-12-28 2018-07-06 北京新唐思创教育科技有限公司 一种题目搜索的方法及其装置
CN107564526A (zh) * 2017-07-28 2018-01-09 北京搜狗科技发展有限公司 处理方法、装置和机器可读介质
CN107450746A (zh) * 2017-08-18 2017-12-08 联想(北京)有限公司 一种表情符号的插入方法、装置和电子设备
CN109213469A (zh) * 2018-08-27 2019-01-15 四川长虹电器股份有限公司 语音输入法词库优先级自动调整方法及系统
CN109817210A (zh) * 2019-02-12 2019-05-28 百度在线网络技术(北京)有限公司 语音写作方法、装置、终端和存储介质
CN111651961A (zh) * 2020-04-15 2020-09-11 北京捷通华声科技股份有限公司 一种基于语音的输入方法和装置
CN111881655A (zh) * 2020-08-05 2020-11-03 深圳乐华高科实业有限公司 一种语音输入标点符号快速切换方法

Also Published As

Publication number Publication date
CN112445453B (zh) 2024-09-13

Similar Documents

Publication Publication Date Title
CN107688399B (zh) 一种输入方法和装置、一种用于输入的装置
CN107291260B (zh) 一种信息输入方法和装置、及用于信息输入的装置
CN110781813A (zh) 图像识别方法及装置、电子设备和存储介质
CN111046210B (zh) 一种信息推荐方法、装置和电子设备
CN110069143B (zh) 一种信息防误纠方法、装置和电子设备
CN109725736B (zh) 一种候选排序方法、装置及电子设备
CN106792604B (zh) 在通信过程中进行服务提示的方法及装置
CN110858099B (zh) 候选词生成方法及装置
CN110795014A (zh) 一种数据处理方法、装置和用于数据处理的装置
CN112199032A (zh) 一种表情推荐方法、装置和电子设备
CN111381685B (zh) 一种句联想方法和装置
CN109887492B (zh) 一种数据处理方法、装置和电子设备
CN110908523B (zh) 一种输入方法及装置
CN110780749B (zh) 一种字符串纠错方法和装置
CN112331194A (zh) 一种输入方法、装置和电子设备
CN112035628B (zh) 对话数据清洗方法、装置及存储介质
CN113127613B (zh) 聊天信息处理方法及装置
CN112445453B (zh) 一种输入方法、装置和电子设备
CN112068793B (zh) 一种语音输入方法及装置
CN112463105B (zh) 一种数据处理方法、装置和电子设备
CN113805707A (zh) 一种输入方法、装置和用于输入的装置
CN109558017B (zh) 一种输入方法、装置和电子设备
CN113589949A (zh) 一种输入方法、装置和电子设备
CN112199033B (zh) 一种语音输入方法、装置和电子设备
CN112102843B (zh) 一种语音识别方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant