CN111142832A - 一种输入识别方法、装置、存储介质及终端 - Google Patents
一种输入识别方法、装置、存储介质及终端 Download PDFInfo
- Publication number
- CN111142832A CN111142832A CN201911352676.6A CN201911352676A CN111142832A CN 111142832 A CN111142832 A CN 111142832A CN 201911352676 A CN201911352676 A CN 201911352676A CN 111142832 A CN111142832 A CN 111142832A
- Authority
- CN
- China
- Prior art keywords
- input
- command
- executed
- user
- instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000006870 function Effects 0.000 claims description 36
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 230000003213 activating effect Effects 0.000 claims 1
- 230000004913 activation Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
- G06F3/04883—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请实施例公开了一种输入识别方法、装置、存储介质及终端。该输入识别方法包括:接收开启指令,根据所述开启指令开启输入识别功能;当检测到用户在显示屏上的输入操作时,获取所述输入操作的输入信息;根据所述输入信息生成至少一个待执行命令,并将待执行命令显示在当前显示界面;从至少一个待执行命令中确定目标执行命令;基于所述目标执行命令完成对应的操作。本实施例通过对用户在显示屏的输入操作进行识别为用户意图,方便用户选择相应执行指令,帮助用户快速完成相关操作,可以有效提高终端输入识别的效率。
Description
技术领域
本申请涉及移动终端应用领域,具体涉及一种输入识别方法、装置、存储介质及终端。
背景技术
语音识别技术,也被称为自动语音识别(Automatic Speech Recognition,简称ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
语音命令输入因为其便捷、交互自然,在智能终端设备上普及程度越来越广,尤其在手机和平板电脑上,成为许多用户设置一系列简单重复操作的首选。但是使用语音助理时存在使用场合受限问题,在不方便使用语音命令的场景下,用户需要执行繁琐的操作步骤与移动终端进行交互,影响操作体验和效率。
发明内容
本申请实施例提供一种输入识别方法、装置、存储介质及终端,可以有效提高终端输入识别的效率。
本申请实施例提供了一种输入识别方法,包括:
接收开启指令,根据所述开启指令开启输入识别功能;
当检测到用户在显示屏上的输入操作时,获取所述输入操作的输入信息;
根据所述输入信息生成至少一个待执行命令,并将待执行命令显示在当前显示界面;
从至少一个待执行命令中确定目标执行命令;
基于所述目标执行命令完成对应的操作。
相应的,本申请实施例还提供了一种输入识别装置,包括:
开启单元,用于接收开启指令,根据所述开启指令开启输入识别功能;
获取单元,用于当检测到用户在显示屏上的输入操作时,获取所述输入操作的输入信息;
显示单元,用于根据所述输入信息生成至少一个待执行命令,并将待执行命令显示在当前显示屏界面;
确定单元,用于从至少一个待执行命令中确定目标执行命令;
操作单元,用于基于所述目标执行命令完成对应的操作。
相应的,本申请实施例还提供了一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行如上所述的输入识别方法中的步骤。
相应的,本申请实施例还提供了一种终端,包括处理器和存储器,所述存储器存储有多条指令,所述处理器加载所述指令以执行如上所述的输入识别方法中的步骤。
本申请实施例公开了一种输入识别方法、装置、存储介质及终端。该输入识别方法包括:接收开启指令,根据所述开启指令开启输入识别功能;当检测到用户在显示屏上的输入操作时,获取所述输入操作的输入信息;根据所述输入信息生成至少一个待执行命令,并将待执行命令显示在当前显示界面;从至少一个待执行命令中确定目标执行命令;基于所述目标执行命令完成对应的操作。本实施例通过对用户在显示屏的输入操作进行识别为用户意图,方便用户选择相应执行指令,帮助用户快速完成相关操作,可以有效提高终端输入识别的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的第一种输入识别方法的流程示意图。
图2为本申请实施例提供的第二种输入识别方法的流程示意图。
图3为本申请实施例提供的一种输入识别方法的用户输入界面示意图。
图4为本申请实施例提供的一种输入识别方法的执行命令显示界面示意图。
图5为本申请实施例提供的一种输入识别装置的结构框图。
图6为本申请实施例提供的终端的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
基于上述问题,本申请实施例提供第一种输入识别方法、装置、存储介质及终端,可以有效提高终端输入识别的效率。以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
请参考图1,图1为本申请实施例提供的一种输入识别方法的流程示意图。该输入识别方法可以应用于诸如手机、平板电脑、笔记本电脑,掌上电脑、便携式媒体播放器(Portable Media Player,PMP)等移动终端,以及诸如台式计算机等固定终端。该输入识别方法的具体流程可以如下:
101、接收开启指令,根据开启指令开启输入识别功能。
在本实施例中,接受开启指令,该开启指令可以通过用户触发,比如,开启执行可以通过用户对终端的触摸操作,打开相应的程序,即可以执行输入识别功能。本步骤中需要用户手动开启输入识别功能是为了避免终端误将用户输入执行为单一输入指令,因此在开启输入识别功能之后,在获取到用户的输入操作时,可以执行输入操作以及输入识别操作。
在一些实施例中,在步骤“根据所述开启指令开启输入识别功能”之后,还可以包括以下步骤:
若预设时间段内未检测到用户在显示屏上的输入操作,则检测是否接收到用户语音输入;
若是,则获取语音信息,并从所述语音信息中提取声音特征;
将所述声音特征与样本声音特征进行匹配;
若匹配成功,则基于所述语音输入执行相关指令。
具体的,在预设时间段内检测用户在显示屏的输入操作,用户在显示屏的输入操作可以为多种,比如,手写输入,键盘输入等等输入方式。在预设时间段内,检测用户是否在显示屏进行输入操作,若检测到用户在显示屏进行输入操作,则可以执行步骤201;若未检测到用户显示屏的输入操作,则可以检测是否接收到用户的语音输入。
当检测到用户语音输入时,可以根据获取到的语音输入中提取用户语音输入的声音特征。其中,声音特征可以包括多种特征,例如,音调,音量和音色等等。在提取到声音特征之后,可以将声音特征与样本声音特征进行匹配,具体的,可以将声音特征包括的音调、音量和音色信息与样本声音特征包括的音调、音量和音色信息进行匹配。
通过将声音特征包括的音调、音量和音色信息与样本声音特征包括的音调、音量和音色信息进行匹配,可以判定当前语音输入的用户是否有权限对当前终端进行操作,从而可以避免终端误操作给终端用户带来不便的体验。
在将声音特征包括的音调、音量和音色信息与样本声音特征包括的音调、音量和音色信息进行匹配之后,若匹配成功,则可以执行语音输入对应的相关指令。例如,获取到的语音输入可以为“打开通讯录”,则可以打开通讯录,并将当前显示界面切换为通讯录界面等;若匹配失败,则可以结束相应操作,继续检测用户的输入操作。
102、当检测到用户在显示屏上的输入操作时,获取输入操作的输入信息。
具体的,在预设时间内检测到用户在显示屏上的输入操作时,可以获取输入操作的输入信息。其中,用户在进行输入操作时,可以输入多种内容,例如,输入内容可以为文字、字母或者图形等等。
在检测到用户的输入操作之后,可以获取用户输入操作的输入信息。例如,用户在当前显示界面输入的内容可以为“娱乐”等等,则可以从用户输入的内容中获取到的输入信息为“娱乐”。
103、根据输入信息生成至少一个待执行命令,并将待执行命令显示在当前显示界面。
具体的,在获取到用户输入操作的输入信息之后,可以根据输入信息生成待执行命令,在此过程中,需要将基于用户输入操作获取的输入信息通过ASR(Automatic SpeechRecognition,自动语音识别技术)进行识别,然后通过NLP(Neuro-LinguisticProgramming,神经语言程序学)编程语言确定用户意图,获取对应的待执行命令。
其中,ASR是一种将人的语音转换为文本的技术。语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。语音识别系统的性能大致取决于以下4类因素:1、识别词汇表的大小和语音的复杂性;2、语音信号的质量;3、单个说话人还是多说话人;4、硬件。
NPL表示:N(Neuro)指的是神经系统,包括大脑和思维过程。L(Linguistic)是指语言,更准确点说,是指从感觉信号的输入到构成意思的过程。P(Programming)是指为产生某种后果而要执行的一套具体指令。即指我们思维上及行为上的习惯,就如同电脑中的程序,可以透过更新软件而改变。故此,NLP被解释为研究我们的大脑如何工作的学问。也因此,NLP译为"身心语法程式学"或"神经语言程序学"。
在一些实施例中,步骤“根据所述输入信息生成至少一个待执行命令”,可以包括以下流程:
对所述输入信息进行内容识别,得到识别结果;
基于所述识别结果确定关键字,并将所述关键字与样本关键字进行匹配;
若匹配成功,则将所述样本关键字对应的样本指令,确定为待执行指令。
具体的,对输入信息进行识别可以通过NPL技术对输入信息进行识别,得到识别结果,从而可以根据用户输入的信息确定用户意图。
例如,获取到的用户输入信息可以为“娱乐”,则可以通过NPL确定用户意图可以为打开娱乐相关应用等等,那么对用户输入信息的识别结果可以为打开娱乐相关应用,也即为用户意图。
在确定用户意图之后,可以根据用户意图确定关键字,该关键字可以由一个或多个文字组成,不同的关键字可以对应多个不同的应用程序,比如,若关键字为“电话”,则可以对应的应用程序为通讯录或者拨号等等。
当获取到关键字之后,可以将获取到的关键字与样本关键字进行匹配,其中,样本关键字可以预先设置在存储器中,该存储器中可以包括至少一个样本关键字,每一个样本关键字可以对应至少一个样本指令。其中,根据关键字确定指令可以通过获取程序的API(Application Program Interface,应用程序接口)来获取应用程序。
具体的,应用程序接口是一组定义、程序及协议的集合,通过API接口实现计算机软件之间的相互通信。API的一个主要功能是提供通用功能集。程序员通过调用API函数对应用程序进行开发,可以减轻编程任务。API同时也是一种中间件,为各种不同平台提供数据共享。
具体的,将关键字与样本关键字进行匹配,可以通过将关键字与存储器中的样本关键字进行匹配,判断是否存在与关键字相同的样本关键字,若存在,则可以将存储器汇总样本关键字对应的样本指令确定为待执行指令。
例如,获取到识别结果可以为“打开娱乐相关应用”,根据识别结果可以提取到关键字为“娱乐应用”,然后将关键字“娱乐应用”与存储器中的多个样本关键字进行匹配,样本关键字可以为“电话”、“支付应用”、“娱乐应用”等等。则可以判定获取的关键字与样本关键字匹配成功,可以将样本关键字对应的样本指令作为待执行指令。在存储器中,样本关键字“娱乐应用”对应的样本指令可以包括:打开视频应用A、打开音频应用B或者打开游戏应用C等等。则可以确定待执行指令为:打开视频应用A、打开音频应用B或者打开游戏应用C。
在一些实施例中,还可以包括以下步骤:
若所述关键字与样本关键字匹配失败,则提示用户重新进行输入操作。
具体的,当关键字与样本关键字匹配失败,则可以执行提示操作,该提示操作可以为多种形式提示,比如,可以通过震动终端提示用户,或者在当前显示界面显示提示消息。
例如,根据用户输入操作获取到的关键字可以为“游戏”,样本关键字可以为“电话”、“支付”、“视频”等等,则可以判定关键字与样本关键字匹配失败,此时可以在显示界面显示提示消息“请重新输入!”等等提示消息来提示用户重新输入。
在确定待执行指令之后,可以将待执行指令显示在当前显示界面,在一些实施例中,步骤“将待执行命令显示在当前显示界面”,可以包括以下流程:
获取待执行命令的历史执行频率;
基于所述历史执行频率对多个待执行命令进行排序,得到待执行命令列表;
将所述待执行命令列表显示在当前显示界面。
具体的,获取待执行命令的历史执行频率,历史执行频率也即为历史执行次数,可以通过从后台数据库中获取得到。
例如,待执行命令可以为:打开视频应用A、打开音频应用B或者打开游戏应用C,则分别获取打开视频应用A、打开音频应用B或者打开游戏应用C的历史执行次数,打开视频应用A的历史执行次数可以为10次,打开音频应用B的历史执行次数可以为20次,打开游戏应用C的历史执行次数可以为30次,等等。
在获取到待执行指令对应的历史执行频率之后,可以根据历史执行频率对待执行指令进行排序,排序方式可以包括多种,例如:可以按照历史执行频率从小到大或者从大到小等等多种方式进行排序,则可以根据排序结果得到待执行命令列表。
例如,获取到打开视频应用A的历史执行次数可以为10次,打开音频应用B的历史执行次数可以为20次,打开游戏应用C的历史执行次数可以为30次,排序方式可以是按照历史执行频率从大到小的方式进行排序,则可以得到排序结果为:打开游戏应用C、打开音频应用B、打开视频应用A,然后可以按照排序结果将待执行命令依次显示在当前显示界面。
在一些实施例中,在步骤“将所述待执行命令列表显示在当前显示界面”之后,还包括:
在预设时间段内,若未检测到用户针对显示屏的触摸操作,则从所述待执行命令列表中确定历史执行频率最高的执行命令,作为目标执行命令。
具体的,在将待执行命令显示在当前显示界面之后,为了避免终端一直处于工作状态,可以设置预设时间段,在预设时间段内检测用户针对显示屏的触摸操作。若在预设时间段内没有检测到用户针对显示屏的触摸操作,则可以从当前显示界面的待执行命令列表中确定历史执行频率最高的执行命令,作为目标执行命令。
例如,在预设时间段内未检测到用户的触摸操作,当前显示界面显示的待执行命令列表中,执行频率最高的待执行命令可以为打开游戏应用C,则可以将“打开游戏应用C”作为目标执行命令。
104、从至少一个待执行命令中确定目标执行命令。
具体的,若在预设时间段内检测到用户针对显示屏的触摸操作,则可以基于用户的触摸操作确定目标执行命令。
在一些实施例中,步骤“从待执行命令中确定目标执行命令”,可以包括以下流程:
当检测到用户在当前显示屏界面的触摸操作时,获取所述触摸操作的第一位置区域;
获取待执行命令在当前显示界面对应的第二位置区域;
将所述第一位置区域与所述第二位置区域进行匹配;
根据匹配结果确定所述目标执行命令。
具体的,当检测到用户在当前显示界面的触摸操作时,可以获取用户触摸操作的第一位置区域,其中,第一位置区域可以包括用户触摸操作的触摸坐标点。
例如,根据获取到的用户触摸操作的第一位置区域,可以得到触摸坐标点为(x,y),其中,x的取值可以小于显示区域的宽度,y的取值可以小于显示区域的高度。
具体的,获取待执行命令在当前显示界面对应的第二位置区域,其中,第二位置区域包括了所有待执行命令的显示区域范围,可以包括多个坐标点。其中,第二位置区域可以包括多个区域,每个子区域可以对应一个待执行命令。
例如,待执行命令可以包括:打开视频应用A、打开音频应用B或者打开游戏应用C,则打开视频应用A对应的子区域可以为第一子区域,打开音频应用B可以为第二子区域,打开游戏应用C可以为第三子区域。
在确定用户触摸操作的触摸坐标点之后,可以将触摸坐标点与第二位置区域进行匹配,判断当前触摸坐标点在第二位置区域所处的位置。然后基于当前触摸坐标点在第二位置区域所处的位置,可以确定用户选择执行的目标执行指令。
例如,检测到当前触摸坐标点(x,y)所处的区域为第一位置子区域,则可以执行命令:打开视频应用A;若检测到当前触摸坐标点(x,y)所处的区域为第二位置子区域,则可以执行命令:打开音频应用B;若检测到当前触摸坐标点(x,y)所处的区域为第三位置子区域,则可以执行命令:打开游戏应用C。可以通过用户选择,快速准确执行相应指令。
105、基于目标执行命令完成对应的操作。
在确定目标执行命令之后,则可以进行目标执行命令对应的各种操作,例如,目标执行命令可以为:打开视频应用A,则可以获取视频应用A的API,打开视频应用A的功能,则可以将当前显示界面切换为视频应用界面,根据用户指令执行各种操作。
本申请实施例公开了一种输入识别方法,该输入识别方法包括:接收开启指令,根据所述开启指令开启输入识别功能;当检测到用户在显示屏上的输入操作时,获取所述输入操作的输入信息;根据所述输入信息生成至少一个待执行命令,并将待执行命令显示在当前显示界面;从至少一个待执行命令中确定目标执行命令;基于所述目标执行命令完成对应的操作。本实施例通过对用户在显示屏的输入操作进行识别为用户意图,方便用户选择相应执行指令,帮助用户快速完成相关操作,可以有效提高终端输入识别的效率。
参考图2,图2为本申请实施例提供的第二种输入识别方法的流程示意图。该输入识别方法的具体场景应用可以如下:
201、终端开启输入识别功能。
具体的,用户当前需要使用输入识别功能,可以触发终端打开输入识别应用,从而终端开启输入识别功能。
202、终端检测到用户的输入操作时,判断输入操作是否为触摸输入操作。
具体的,终端检测当前用户当前的输入操作,输入操作可以为多种,比如,语音输入、触摸输入等等。
例如,终端检测到用户在当前显示界面的触摸操作,可以判定当前的输入操作为触摸输入操作,则可以执行步骤203。又例如,终端检测到用户的语音输入时,则可以判定当前的输入操作不为触摸输入操作,则可以执行步骤207。
203、终端获取触摸输入操作的输入信息。
具体的,在检测到用户在当前显示界面的触摸输入操作之后,可以获取用户触摸操作的输入信息,其中,用户输入的内容可以为多种,例如,文字,字母,图形,符号等等。请参考图3,图3为本申请实施例提供的一种输入识别方法的用户输入界面示意图。图3表示用户触摸输入的内容为“WX”。则根据用户输入的内容可以获取到用户输入信息为“WX”。
204、终端对输入信息进行识别,得到关键字。
在终端获取到用户输入信息之后,可以对输入信息进行识别,可以得到关键字,关键字可以表示为根据识别用户输入的结果,以及根据用户日常应用频率判断并生成可能的意图关键字。
例如,终端根据用户输入信息“WX”可以生成的关键字为:WX(应用软件缩写)、wangxing(人名)等等关键字。
205、终端基于关键字确定待执行指令,并将待执行指令显示在当前显示界面。
具体的,终端基于关键字确定待执行指令,例如,若获取到的关键字为WX,则可以生成指令:打开WX应用;若获取到的关键字为wangxing,则可以生成指令,打电话给wangxing,等等。
当确定待执行指令之后,则可以将待执行指令显示在当前显示界面,供用户自行选择对应的指令,请参考图4,图4为本申请实施例提供的一种输入识别方法的执行命令显示界面示意图。图4示出了终端根据用户输入生成的待执行指令,用户可以在当前显示界面选择需要执行的指令。
206、终端根据待执行指令确定目标执行指令,并完成目标执行指令对应的操作。
具体的,终端根据待执行指令确定目标执行指令,可以通过获取用户针对当前显示界面的触摸操作,获取触摸操作位置点,例如,获取到用户触摸操作位置点可以在待执行指令“打开WX应用”区域时,则用户当前需要执行的操作为打开WX应用,在用户触摸操作之后,终端将当前显示界面切换为WX应用界面,并执行相应功能。
又例如,获取到用户触摸操作位置点可以在待执行指令“打电话给wnagxing”区域时,则用户当前需要执行的操作为打电话给wnagxing,在用户触摸操作之后,终端将当前显示界面切换为拨号给wnagxing界面,并执行相应功能。
207、终端结束操作。
终端未检测到用户在当前显示界面的触摸输入操作,为了节省终端功耗,可以结束操作,可以切换为待机状态。
本申请实施例公开了一种输入识别方法,该输入识别方法包括:接收开启指令,根据所述开启指令开启输入识别功能;当检测到用户在显示屏上的输入操作时,获取所述输入操作的输入信息;根据所述输入信息生成至少一个待执行命令,并将待执行命令显示在当前显示界面;从待执行命令中确定目标执行命令;基于所述目标执行命令完成对应的操作。本实施例通过对用户在显示屏的输入操作进行识别为用户意图,方便用户选择相应执行指令,帮助用户快速完成相关操作,可以有效提高终端输入识别的效率。
为便于更好的实施本申请实施例提供的输入识别方法,本申请实施例还提供一种基于上述输入识别方法的装置。其中名词的含义与上述输入识别方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图5,图5为本申请实施例提供的一种输入识别装置的结构框图,该输入识别装置可以应用于诸如手机、平板电脑、笔记本电脑,掌上电脑、便携式媒体播放器(Portable Media Player,PMP)等移动终端,以及诸如台式计算机等固定终端。该输入识别装置可以包括:
开启单元301,用于接收开启指令,根据所述开启指令开启输入识别功能;
获取单元302,用于当检测到用户在显示屏上的输入操作时,获取所述输入操作的输入信息;
显示单元303,用于根据所述输入信息生成至少一个待执行命令,并将待执行命令显示在当前显示屏界面;
确定单元304,用于从至少一个待执行命令中确定目标执行命令;
操作单元305,用于基于所述目标执行命令完成对应的操作。
在一些实施例中,所述显示单元303可以包括:
第一获取子单元,用于获取待执行命令的历史执行频率;
排序子单元,用于基于所述历史执行频率对多个待执行命令进行排序,得到待执行命令列表;
显示子单元,用于将所述待执行命令列表显示在当前显示界面。
在一些实施例中,所述显示子单元303还可以包括:
第一确定子单元,用于在预设时间段内,若未检测到用户针对显示屏的触摸操作,则从所述待执行命令列表中确定历史执行频率最高的执行命令,作为目标执行命令。
在一些实施例中,所述确定单元304可以包括:
第二获取子单元,用于当检测到用户在当前显示屏界面的触摸操作时,获取所述触摸操作的第一位置区域;
第三获取子单元,用于获取执行命令在当前显示屏界面对应的第二位置区域;
第一匹配子单元,用于将所述第一位置区域与所述第二位置区域进行匹配;
执行子单元,用于根据匹配结果确定所述目标执行命令。
在一些实施例中,显示单元303还可以包括:
识别子单元,用于对所述输入信息进行内容识别,得到识别结果;
第二匹配子单元,用于基于所述识别结果确定关键字,并将所述关键字与样本关键字进行匹配;
第二确定子单元,用于若匹配成功,则将所述样本关键字对应的样本指令,确定为待执行指令。
在一些实施例中,显示单元303还可以包括:
提示子单元,用于若所述关键字与样本关键字匹配失败,则提示用户重新进行输入操作。
本申请实施例公开了一种输入识别装置,该输入识别装置包括:接收开启指令,根据所述开启指令开启输入识别功能;当检测到用户在显示屏上的输入操作时,获取所述输入操作的输入信息;根据所述输入信息生成至少一个待执行命令,并将待执行命令显示在当前显示界面;从至少一个待执行命令中确定目标执行命令;基于所述目标执行命令完成对应的操作。本实施例通过对用户在显示屏的输入操作进行识别为用户意图,方便用户选择相应执行指令,帮助用户快速完成相关操作,可以有效提高终端输入识别的效率。
本申请实施例还提供一种终端。如图6所示,该终端可以包括射频(RF,RadioFrequency)电路601、包括有一个或一个以上存储介质的存储器602、输入单元603、显示单元604、传感器605、音频电路606、无线保真(WiFi,Wireless Fidelity)模块607、包括有一个或者一个以上处理核心的处理器608、以及电源609等部件。本领域技术人员可以理解,图6中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路601可用于收发信息过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器608处理;另外,将涉及上行的数据发送给基站。通常,RF电路601包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM,Subscriber Identity Module)卡、收发信机、耦合器、低噪声放大器(LNA,LowNoise Amplifier)、双工器等。此外,RF电路601还可以通过无线通信与网络和其他设备通信。
存储器602可用于存储软件程序以及模块,处理器608通过运行存储在存储器602的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器602还可以包括存储器控制器,以提供处理器608和输入单元603对存储器602的访问。
输入单元603可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元603可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。除了触敏表面,输入单元603还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元604可用于显示由用户输入的信息或提供给用户的信息以及服务器的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元604可包括显示面板,可选的,可以采用液晶显示器(LCD,Liquid CrystalDisplay)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器608以确定触摸事件的类型,随后处理器608根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图6中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。
终端还可包括至少一种传感器605,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在服务器移动到耳边时,关闭显示面板和背光。
音频电路606、扬声器,传声器可提供用户与服务器之间的音频接口。音频电路606可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路606接收后转换为音频数据,再将音频数据输出处理器608处理后,经RF电路601以发送给比如终端,或者将音频数据输出至存储器602以便进一步处理。音频电路606还可能包括耳塞插孔,以提供外设耳机与服务器的通信。
WiFi属于短距离无线传输技术,终端通过WiFi模块607可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图6示出了WiFi模块607,但是可以理解的是,其并不属于终端的必须构成,完全可以根据需要在不改变申请的本质的范围内而省略。
处理器608是终端的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器602内的软件程序和模块,以及调用存储在存储器602内的数据,执行服务器的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器608可包括一个或多个处理核心;优选的,处理器608可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器608中。
终端还包括给各个部件供电的电源609(比如电池),优选的,电源可以通过电源管理系统与处理器608逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源609还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
具体在本实施例中,终端中的处理器608会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器602中,并由处理器608来运行存储在存储器602中的应用程序,从而实现各种功能:
接收开启指令,根据所述开启指令开启输入识别功能;
当检测到用户在显示屏上的输入操作时,获取所述输入操作的输入信息;
根据所述输入信息生成至少一个待执行命令,并将待执行命令显示在当前显示界面;
从至少一个待执行命令中确定目标执行命令;
基于所述目标执行命令完成对应的操作。
本申请实施例公开了一种输入识别方法、装置、存储介质及终端。该输入识别方法包括:接收开启指令,根据所述开启指令开启输入识别功能;当检测到用户在显示屏上的输入操作时,获取所述输入操作的输入信息;根据所述输入信息生成至少一个待执行命令,并将待执行命令显示在当前显示界面;从至少一个待执行命令中确定目标执行命令;基于所述目标执行命令完成对应的操作。本实施例通过对用户在显示屏的输入操作进行识别为用户意图,方便用户选择相应执行指令,帮助用户快速完成相关操作,可以有效提高终端输入识别的效率。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种输入识别方法中的步骤。例如,该指令可以执行如下步骤:
接收开启指令,根据所述开启指令开启输入识别功能;当检测到用户在显示屏上的输入操作时,获取所述输入操作的输入信息;根据所述输入信息生成至少一个待执行命令,并将待执行命令显示在当前显示界面;从待执行命令中确定目标执行命令;基于所述目标执行命令完成对应的操作。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种输入识别方法中的步骤,因此,可以实现本申请实施例所提供的任一种输入识别方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的输入识别方法、装置、存储介质及终端进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种输入识别方法,其特征在于,包括:
接收开启指令,根据所述开启指令开启输入识别功能;
当检测到用户在显示屏上的输入操作时,获取所述输入操作的输入信息;
根据所述输入信息生成至少一个待执行命令,并将待执行命令显示在当前显示界面;
从至少一个待执行命令中确定目标执行命令;
基于所述目标执行命令完成对应的操作。
2.根据权利要求1所述的方法,其特征在于,所述将待执行命令显示在当前显示界面,包括:
获取待执行命令的历史执行频率;
基于所述历史执行频率对多个待执行命令进行排序,得到待执行命令列表;
将所述待执行命令列表显示在当前显示界面。
3.根据权利要求2所述的方法,其特征在于,在将所述待执行命令列表显示在当前显示界面之后,还包括:
在预设时间段内,若未检测到用户针对显示屏的触摸操作,则从所述待执行命令列表中确定历史执行频率最高的执行命令,作为目标执行命令。
4.根据权利要求1所述的方法,其特征在于,所述从至少一个待执行命令中确定目标执行命令,包括:
当检测到用户在当前显示屏界面的触摸操作时,获取所述触摸操作的第一位置区域;
获取待执行命令在当前显示屏界面对应的第二位置区域;
将所述第一位置区域与所述第二位置区域进行匹配;
根据匹配结果确定所述目标执行命令。
5.根据权利要求1所述的方法,其特征在于,所述根据所述输入信息生成至少一个待执行命令,包括:
对所述输入信息进行内容识别,得到识别结果;
基于所述识别结果确定关键字,并将所述关键字与样本关键字进行匹配;
若匹配成功,则将所述样本关键字对应的样本指令,确定为待执行指令。
6.根据权利要求5所述的方法,其特征在于,还包括:
若所述关键字与样本关键字匹配失败,则提示用户重新进行输入操作。
7.根据权利要求1所述的方法,其特征在于,在根据所述开启指令开启输入识别功能之后,还包括:
若预设时间段内未检测到用户在显示屏上的输入操作,则检测是否接收到用户语音输入;
若是,则获取语音信息,并从所述语音信息中提取声音特征;
将所述声音特征与样本声音特征进行匹配;
若匹配成功,则基于所述语音输入执行相关指令。
8.一种输入识别装置,其特征在于,包括:
开启单元,用于接收开启指令,根据所述开启指令开启输入识别功能;
获取单元,用于当检测到用户在显示屏上的输入操作时,获取所述输入操作的输入信息;
显示单元,用于根据所述输入信息生成至少一个待执行命令,并将待执行命令显示在当前显示屏界面;
确定单元,用于从至少一个待执行命令中确定目标执行命令;
操作单元,用于基于所述目标执行命令完成对应的操作。
9.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至7任一项所述的输入识别方法中的步骤。
10.一种终端,其特征在于,包括处理器和存储器,所述存储器存储有多条指令,所述处理器加载所述指令以执行权利要求1至7任一项所述的输入识别方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911352676.6A CN111142832A (zh) | 2019-12-25 | 2019-12-25 | 一种输入识别方法、装置、存储介质及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911352676.6A CN111142832A (zh) | 2019-12-25 | 2019-12-25 | 一种输入识别方法、装置、存储介质及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111142832A true CN111142832A (zh) | 2020-05-12 |
Family
ID=70519823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911352676.6A Pending CN111142832A (zh) | 2019-12-25 | 2019-12-25 | 一种输入识别方法、装置、存储介质及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111142832A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101968714A (zh) * | 2010-09-30 | 2011-02-09 | 中兴通讯股份有限公司 | 识别在移动终端界面上输入的操作轨迹的方法和系统 |
CN102298485A (zh) * | 2010-06-22 | 2011-12-28 | 广东国笔科技股份有限公司 | 一种基于触摸屏的实时调用系统 |
CN102316162A (zh) * | 2011-09-01 | 2012-01-11 | 深圳市子栋科技有限公司 | 基于语音命令的车辆远程控制方法、装置及系统 |
CN102880302A (zh) * | 2012-07-17 | 2013-01-16 | 重庆优腾信息技术有限公司 | 一种基于多词连续输入的字词识别方法、装置和系统 |
CN103631389A (zh) * | 2013-11-29 | 2014-03-12 | 乐视致新电子科技(天津)有限公司 | 一种语音输入方法及装置 |
CN104423800A (zh) * | 2013-08-23 | 2015-03-18 | 三星电子株式会社 | 电子设备以及执行其应用程序的方法 |
CN105353909A (zh) * | 2015-11-04 | 2016-02-24 | 北京汇冠新技术股份有限公司 | 一种带有语音控制功能的触摸识别装置及方法 |
CN105895096A (zh) * | 2016-03-30 | 2016-08-24 | 乐视控股(北京)有限公司 | 一种身份识别与语音交互操作的方法及装置 |
CN108304434A (zh) * | 2017-09-04 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 信息反馈方法和终端设备 |
CN108521505A (zh) * | 2018-03-27 | 2018-09-11 | 维沃移动通信有限公司 | 一种来电处理方法及移动终端 |
CN108881610A (zh) * | 2018-04-27 | 2018-11-23 | 努比亚技术有限公司 | 一种终端控制方法、终端及计算机可读存储介质 |
-
2019
- 2019-12-25 CN CN201911352676.6A patent/CN111142832A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102298485A (zh) * | 2010-06-22 | 2011-12-28 | 广东国笔科技股份有限公司 | 一种基于触摸屏的实时调用系统 |
CN101968714A (zh) * | 2010-09-30 | 2011-02-09 | 中兴通讯股份有限公司 | 识别在移动终端界面上输入的操作轨迹的方法和系统 |
CN102316162A (zh) * | 2011-09-01 | 2012-01-11 | 深圳市子栋科技有限公司 | 基于语音命令的车辆远程控制方法、装置及系统 |
CN102880302A (zh) * | 2012-07-17 | 2013-01-16 | 重庆优腾信息技术有限公司 | 一种基于多词连续输入的字词识别方法、装置和系统 |
CN104423800A (zh) * | 2013-08-23 | 2015-03-18 | 三星电子株式会社 | 电子设备以及执行其应用程序的方法 |
CN103631389A (zh) * | 2013-11-29 | 2014-03-12 | 乐视致新电子科技(天津)有限公司 | 一种语音输入方法及装置 |
CN105353909A (zh) * | 2015-11-04 | 2016-02-24 | 北京汇冠新技术股份有限公司 | 一种带有语音控制功能的触摸识别装置及方法 |
CN105895096A (zh) * | 2016-03-30 | 2016-08-24 | 乐视控股(北京)有限公司 | 一种身份识别与语音交互操作的方法及装置 |
CN108304434A (zh) * | 2017-09-04 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 信息反馈方法和终端设备 |
CN108521505A (zh) * | 2018-03-27 | 2018-09-11 | 维沃移动通信有限公司 | 一种来电处理方法及移动终端 |
CN108881610A (zh) * | 2018-04-27 | 2018-11-23 | 努比亚技术有限公司 | 一种终端控制方法、终端及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3396665B1 (en) | Voice data processing method and electronic device supporting the same | |
CN108549519B (zh) | 分屏处理方法、装置、存储介质和电子设备 | |
CN108108142A (zh) | 语音信息处理方法、装置、终端设备及存储介质 | |
WO2020001165A1 (zh) | 语音控制方法、装置、存储介质及电子设备 | |
WO2015043200A1 (en) | Method and apparatus for controlling applications and operations on a terminal | |
CN107870674B (zh) | 一种程序启动方法和移动终端 | |
CN107731241B (zh) | 处理音频信号的方法、装置和存储介质 | |
CN108958587B (zh) | 分屏处理方法、装置、存储介质和电子设备 | |
CN112230877A (zh) | 一种语音操作方法、装置、存储介质及电子设备 | |
US20200125603A1 (en) | Electronic device and system which provides service based on voice recognition | |
CN104184890A (zh) | 一种信息处理方法及电子设备 | |
CN110780751B (zh) | 一种信息处理方法及电子设备 | |
CN110688051B (zh) | 一种录屏操作方法、装置、计算机可读存储介质及终端 | |
CN110335629B (zh) | 音频文件的音高识别方法、装置以及存储介质 | |
CN106486119B (zh) | 一种识别语音信息的方法和装置 | |
US20150088525A1 (en) | Method and apparatus for controlling applications and operations on a terminal | |
CN111079438A (zh) | 身份验证方法、装置、电子设备及存储介质 | |
EP3547310A1 (en) | Electronic device for processing user voice | |
CN111897916A (zh) | 语音指令识别方法、装置、终端设备及存储介质 | |
CN110312995B (zh) | 应用程序加速启动方法、装置及终端 | |
CN112653789A (zh) | 语音模式切换方法、终端及存储介质 | |
CN111580911A (zh) | 一种终端的操作提示方法、装置、存储介质及终端 | |
EP3779963A1 (en) | Voice recognition service operating method and electronic device supporting same | |
CN109040427B (zh) | 分屏处理方法、装置、存储介质和电子设备 | |
CN107957789B (zh) | 一种文本输入方法及移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200512 |