CN104077105B - 一种信息处理方法以及一种电子设备 - Google Patents

一种信息处理方法以及一种电子设备 Download PDF

Info

Publication number
CN104077105B
CN104077105B CN201310109241.5A CN201310109241A CN104077105B CN 104077105 B CN104077105 B CN 104077105B CN 201310109241 A CN201310109241 A CN 201310109241A CN 104077105 B CN104077105 B CN 104077105B
Authority
CN
China
Prior art keywords
speech recognition
recognition module
state
voice
operating mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310109241.5A
Other languages
English (en)
Other versions
CN104077105A (zh
Inventor
董芳菲
侯欣如
彭世峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201310109241.5A priority Critical patent/CN104077105B/zh
Priority to CN201810300016.2A priority patent/CN108491182A/zh
Publication of CN104077105A publication Critical patent/CN104077105A/zh
Application granted granted Critical
Publication of CN104077105B publication Critical patent/CN104077105B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种信息处理方法以及一种电子设备,所述方法应用于电子设备中,所述电子设备包括一显示单元和一语音识别模组,所述方法包括:当所述语音识别模组处于工作状态且所述电子设备处于待输入场景时,获得第一语音输入;基于所述语音识别模组对所述第一语音输入进行识别,获得第一识别结果,所述第一识别结果为所述第一语音输入对应的字符;当将所述第一识别结果输入到所述待输入场景的输入区域时,控制语音识别模组的工作状态处于收听状态,以使得用户直接进行第二语音输入。

Description

一种信息处理方法以及一种电子设备
技术领域
本发明涉及电子技术领域,特别涉及一种信息处理方法以及一种电子设备。
背景技术
目前,随着电子技术的发展,电子设备拥有了越来越多的功能。
当用户操作电子设备(如手机,笔记本电脑,一体机等)时,电子设备不但可以接受用户的触摸输入,以执行对应的控制指令,还可以接受用户的语音输入,通过对用户的语音识别,获得对应的控制指令。
例如用户对手机进行一次语音输入:讲个笑话,然后点击识别。此时手机会对该语音进行识别,并寻找出对应的笑话显示在手机屏幕上。
而本申请人在实现本申请的过程中,发现现有技术中的电子设备,在对用户的语音输入进行识别时,只能够接受用户的单次语音输入。若用户在第一次输入语言之后,需要进行第二次语音输入,则必须对电子设备进行重新操作。例如,电子设备中具有一语音识别程序,当用户需要使用该程序时,会打开该程序输入语音信息。而对于电子设备来说,在接收到用户的语音输入之后,则会关闭接受语音输入的功能,对该语音信息进行识别。若此时用户需要再一次输入语音信息,则必须重新打开该程序的接收语音输入的功能。即现有技术中的电子设备存在只能够接收用户的单次语音输入的技术问题。
发明内容
本发明提供一种信息处理方法以及一种电子设备,用以解决现有技术中的电子设备只能够接收用户的单次语音输入的技术问题。
一方面,本发明通过本申请的一个实施例,提供如下技术方案:
一种信息处理方法,所述方法应用于电子设备中,所述电子设备包括一显示单元和一语音识别模组,所述方法包括:当所述语音识别模组处于工作状态且所述电子设备处于待输入场景时,获得第一语音输入;基于所述语音识别模组对所述第一语音输入进行识别,获得第一识别结果,所述第一识别结果为所述第一语音输入对应的字符;当将所述第一识别结果输入到所述待输入场景的输入区域时,控制语音识别模组的工作状态处于收听状态,以使得用户直接进行第二语音输入。
优选的,所述显示单元上显示有语音图标标识;所述当将所述第一识别结果输入到所述待输入场景的输入区域时,控制语音识别模组的工作状态处于收听状态,以使得用户直接进行第二语音输入,具体为:当将所述第一识别结果输入至所述待输入场景的输入区域时,控制所述语音图标标识以所述待输入场景下的第二显示效果显示,以提示所述语音识别模组处于所述收听状态,以使得用户直接进行第二语音输入。
优选的,所述方法还包括:当所述语音识别模组处于工作状态且所述电子设备处于命令场景时,获得第三语音输入;基于所述语音识别模组对所述第三语音输入进行识别,获得第二识别结果;所述第二识别结果至少包括控制指令;在响应所述第二识别结果的过程中,控制语音识别模组的工作状态处于待命状态,且控制所述语音图标标识以所述命令场景下的第一显示效果显示,以提示所述语音识别模块处于所述待命状态,以使得用户操作所述语音图标标识控制所述语音识别模块进入收听状态。
另一方面,本发明通过本申请的另一个实施例提供:
一种电子设备,所述电子设备包括一显示单元和一语音识别模组,所述电子设备包括:第一获得单元,用于当所述语音识别模组处于工作状态且所述电子设备处于待输入场景时,获得第一语音输入;第二获得单元,用于基于所述语音识别模组对所述第一语音输入进行识别,获得第一识别结果,所述第一识别结果为所述第一语音输入对应的字符;第一控制单元,用于当将所述第一识别结果输入到所述待输入场景的输入区域时,控制语音识别模组的工作状态处于收听状态,以使得用户直接进行第二语音输入。
优选的,所述电子设备还包括:第三获得单元,用于当所述语音识别模组处于工作状态且所述电子设备处于命令场景时,获得第三语音输入;第四获得单元,用于基于所述语音识别模组对所述第三语音输入进行识别,获得第二识别结果;所述第二识别结果至少包括控制指令;第二控制单元,用于在响应所述第二识别结果的过程中,控制语音识别模组的工作状态处于待命状态,且控制所述语音图标标识以所述命令场景下的第一显示效果显示,以提示所述语音识别模块处于所述待命状态,以使得用户操作所述语音图标标识控制所述语音识别模块进入收听状态。
另一方面,本发明通过本申请的另一个实施例提供:
一种信息处理方法,所述方法应用于电子设备中,所述电子设备包括一显示单元和一语音识别模组,所述方法包括:当所述语音识别模组处于工作状态时,获得一判断参数,所述判断参数用于判断处于所述工作状态下的所述语音识别模组的工作模式;当所述判断参数满足第一预定条件时,控制所述语音识别模组处于第一工作模式;当所述判断参数满足第二预定条件时,控制所述语音识别模组处于第二工作模式。
优选的,在所述第一工作模式下,所述语音识别模组具有:待命状态、收听状态、识别状态;当所述语音识别模块处于所述第一工作模式时,所述语音识别模组针对一次语音输入识别完成时返回至所述收听状态;在所述第二工作模式下,所述语音识别模组具有:待命状态,收听状态,识别状态;当所述语音识别模块处于所述第二工作模式时所述语音识别模组针对一次语音输入识别完成时返回至所述待命状态。
优选的,所述显示单元上具有语音图标标识;当所述语音识别模块处于所述第一工作模式且在所述第一工作模式下完成一次语音输入识别完成时直接进行下一次语音输入;当所述语音识别模块处于所述第二工作模式且在所述第二工作模式下完成一次语音输入识别完成时通过获得用户操作针对所述语音图标标识控制所述语音识别模块进入收听状态以进行下一次语音输入。
优选的,当所述语音识别模组处于第一工作模式时控制以第一显示效果显示语音图标标识表征所述语音识别模组处于所述第一工作模式的待命状态;当所述语音识别模组处于第一工作模式时控制以第二显示效果显示语音图标标识表征所述语音识别模组处于所述第一工作模式的收听状态;当所述语音识别模组处于第一工作模式时控制以第三显示效果显示语音图标标识表征所述语音识别模组处于所述第一工作模式的识别状态;或者当所述语音识别模组处于第二工作模式时控制以第一显示效果显示语音图标标识表征所述语音识别模组处于所述第二工作模式的待命状态;当所述语音识别模组处于第二工作模式时控制以第二显示效果显示语音图标标识表征所述语音识别模组处于所述第二工作模式的收听状态;当所述语音识别模组处于第二工作模式时控制以第三显示效果显示语音图标标识表征所述语音识别模组处于所述第二工作模式的识别状态。
优选的,所述显示单元上具有语音图标标识;所述语音图标标识可以存在于所述显示单元的任意位置,并且所述语音图标标识在所述显示单元上任意移动,另外,当具有应用程序的显示界面在所述显示单元上显示时,所述语音图标标识在所述显示界面上置顶显示。
另一方面,本发明通过本申请的另一个实施例提供:
一种电子设备,所述电子设备包括一显示单元和一语音识别模组,所述电子设备包括:第一获得模块,用于当所述语音识别模组处于工作状态时,获得一判断参数,所述判断参数用于判断处于所述工作状态下的所述语音识别模组的工作模式;第一控制模块,用于当所述判断参数满足第一预定条件时,控制所述语音识别模组处于第一工作模式;第二控制模块,用于当所述判断参数满足第二预定条件时,控制所述语音识别模组处于第二工作模式。
优选的,在所述第一工作模式下,所述语音识别模组具有:待命状态、收听状态、识别状态;当所述语音识别模块处于所述第一工作模式时,所述语音识别模组针对一次语音输入识别完成时返回至所述收听状态;在所述第二工作模式下,所述语音识别模组具有:待命状态,收听状态,识别状态;当所述语音识别模块处于所述第二工作模式时所述语音识别模组针对一次语音输入识别完成时返回至所述待命状态。
优选的,所述显示单元上具有语音图标标识;当所述语音识别模块处于所述第一工作模式且在所述第一工作模式下完成一次语音输入识别完成时直接进行下一次语音输入;当所述语音识别模块处于所述第二工作模式且在所述第二工作模式下完成一次语音输入识别完成时通过获得用户操作针对所述语音图标标识控制所述语音识别模块进入收听状态以进行下一次语音输入。
上述技术方案中的一个或多个技术方案,具有如下技术效果或优点:
在本技术方案中的一个或多个技术方案中,首先提供了一种信息处理方法。在该信息处理方法中,首先会接受用户的语音输入,而在接受用户的语音输入时,具有一定的条件:语音识别模组处于工作状态,且电子设备处于待输入场景。当不满足这两个条件时,则不能够获得用户的语音输入。进一步的,当获得了语音输入时,会对该语音输入进行识别,并识别为对应的字符。进一步的,当将字符输入到待输入场景的输入区域时,则会控制语音识别模组的工作状态处于收听状态,以使得用户直接进行第二语音输入。因此,使用该方法在用户进行了第一语音输入之后,电子设备会对其进行识别,并且在将识别的结果输入输入区域时,此时的电子设备还可以直接接收用户的第二语音输入,而不会像现有技术中的电子设备,只能够接受一次用户的语音输入。本申请描述的方法,能够多次接受用户的语音输入,因此,避免了用户多次操作电子设备进行语音输入的情况,减少了电子设备的损耗,并且延长了电子设备的使用寿命。
进一步的,语音识别模组的具体工作状态是通过语音图标标识来进行表征的,因此,语音图标标识以待输入场景下的第二显示效果显示时,能够提示用户该语音识别模组处于收听状态,以使得用户直接进行第二语音输入。
进一步的,在命令场景下,语音识别模组在识别用户的语音输入时,会处于待命状态。此时,语音图标标识会以命令场景下的第一显示效果显示,用来提示语音识别模块处于待命状态,以使得用户操作语音图标标识控制语音识别模块进入收听状态。
进一步的,语音识别模组的具体的工作模式可以进行调整,具体的调整方式是,通过分析语音识别模组处于工作状态时获得的判断参数,进而确定语音识别模组具体的工作模式。
进一步的,当语音识别模组在识别用户的语音输入时,在不同的工作模式下,语音识别模组的工作状态各有不同,具体的,在第一工作模式下,语音识别模组具有:待命状态、收听状态、识别状态;当语音识别模块处于第一工作模式时,语音识别模组针对一次语音输入识别完成时返回至收听状态。在第二工作模式下,语音识别模组具有:待命状态,收听状态,识别状态;当语音识别模块处于第二工作模式时语音识别模组针对一次语音输入识别完成时返回至待命状态。
附图说明
图1为本申请实施例中待输入场景下信息处理方法的流程图;
图2A-图2C为本申请实施例中在待输入场景下语音图标标识的示意图;
图3为本申请实施例中语音图标标识置顶显示的示意图;
图4A-图4C为本申请实施例中在待输入场景下,音乐软件界面上的语音图标标识的效果显示示意图;
图5为本申请实施例中命令场景下信息处理方法的流程图;
图6A-图6C为本申请实施例中在命令场景下语音图标标识的示意图;
图7A-图7C为本申请实施例中在命令场景下,音乐软件界面上的语音图标标识的效果显示示意图;
图8为本申请实施例中确定语音识别模组的工作模式的方法流程图;
图9为本申请实施例三中的电子设备示意图;
图10为本申请实施例四中的电子设备示意图。
具体实施方式
为了解决现有技术中的电子设备只能够接收出用户的单次语音输入的技术问题,本发明实施例提出了一种信息处理方法以及一种电子设备,其解决方案总体思路如下:
本发明提供了一种信息处理方法,首先,在接受用户的语音输入时,具有一定的条件:语音识别模组处于工作状态,且电子设备处于待输入场景。当不满足这两个条件时,则不能够获得用户的语音输入。
进一步的,当获得了语音输入时,会对该语音输入进行识别,并识别为对应的字符。
进一步的,当将字符输入到待输入场景的输入区域时,则会控制语音识别模组的工作状态处于收听状态,以使得用户直接进行第二语音输入。
下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本发明实施例和实施例中的具体特征是对本发明技术方案的详细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。
实施例一:
在本申请实施例中,提出了一种信息处理方法。
其中,该方法应用于电子设备中,电子设备包括一显示单元和一语音识别模组。
具体的,语音识别模组具体的作用是:当用户在对电子设备进行语音输入时,语音识别模组可以对用户输入的语音进行分析识别。在实际应用中,语音识别模组可以由多种设备构成,比如麦克风和语音识别引擎共同构成的语音识别模组。而在本申请实施例中的语音识别模组,使用语音图标标识来表示,语音图标标识类似于图标,代表了语音识别引擎和麦克风。
具体的,请参看图1,本申请实施例中的信息处理方法的具体实施过程如下:
S101,当语音识别模组处于工作状态且电子设备处于待输入场景时,获得第一语音输入。
具体的,语音识别模组在工作时,具有两种工作模式。第一工作模式具体为转写模式,第二工作模式为命令模式。在语音识别模组处于工作状态时,可以处于转写模式下的工作状态,也可以处于命令模式下的工作状态。
更为具体的,当电子设备处于待输入场景时,若此时的语音识别模组处于工作状态,则处于转写模式下的工作状态。当电子设备处于命令场景时,若此时的语音识别模组处于工作状态,则处于命令模式下的工作状态。
更进一步的,在转写模式下,若语音识别模组处于工作状态,在识别用户的输入的语音时,会将识别出的语音转化为文字,然后执行文字对应的控制命令。
在命令模式下,若语音识别模组处于工作状态,语音识别模组直接识别用户输入的语音,然后执行该语音对应的控制指令。
在执行S101的过程中,待输入场景表达的含义是:需要用户进行语音输入,并且需要将用户的语音输入转换为字符显示时的场景。例如电子设备的显示单元上显示有一QQ对话框,需要用户进行语音输入,并且需要将该语音输入转换为文字,那么此时语音识别模组处于转写模式下的工作状态。
另外,待输入场景还可以是其他需要将用户输入的语音转换为字符的场景。例如word文档中,若此时需要用户进行语音输入,并且需要将用户的语音输入转换为字符显示,此时的场景也为待输入场景。另外,短消息应用程序,网页搜索程序等等,需要将用户的语音输入转换为字符使用的场景都属于待输入场景。
因此,当电子设备满足两个条件:第一,语音识别模组处于工作状态;第二,电子设备处于待输入场景。此时,则可以获得第一语音输入,并进一步执行S102中的步骤。
S102,基于语音识别模组对第一语音输入进行识别,获得第一识别结果。
第一识别结果为第一语音输入对应的字符。
当获得了第一语音输入之后,由于第一语音输入其实是用户输入的一段语音信息,因此,当对其进行识别时,获得的第一识别结果则为第一语音输入对应的字符。
如用户的在进行第一语音输入时,输入的语音为:明天下午三点在广场见面。
当语音识别模组对其进行识别时,则会将这段语音识别为对应的字符,此时的字符则为第一识别结果。
S103,当将第一识别结果输入到待输入场景的输入区域时,控制语音识别模组的工作状态处于收听状态,以使得用户直接进行第二语音输入。
具体的,在待输入场景下,语音识别模组在处于工作状态时,具体会呈现三种状态:待命状态,收听状态,识别状态。
当语音识别模组处于待命状态时,表明语音识别模组准备接收语音输入,或者即将接收语音输入。
当语音识别模组处于收听状态时,表明语音识别模组正在接受用户的语音输入。
当语音识别模组已经接收了用户的语音输入,则语音识别模组会处于识别状态,将输入的语音转换为对应的字符。
进一步的,在识别完成之后,将字符输入到输入区域的第一时刻,直到识别完该字符的第二时刻。在由第一时刻开始,直到第二时刻结束的这一个时间段之内,语音识别模组都可以处于收听状态,用来接收用户的再一次语音输入。
具体的,当语音识别模组使用语音图标标识进行表征时,语音图标标识具有的显示效果表示语音识别模组的具体工作状态。此时,显示单元上则会显示有语音图标标识。
此时,在待输入场景下,语音图标标识在呈现不同的显示效果时,语音识别模组会具有不同的工作状态,具体如下:
下面请参看图2A,此时的语音图标标识为圆形图标,在圆形区域的外边缘具有一枝丫,在圆形区域的中心具有一黑色方形区域,而在黑色方形区域上方具有一只笔与其重叠。此时的语音图标的显示效果为第一显示效果,在此显示效果下,语音识别模组的工作状态为:待命状态。
下面请参看图2B,此时的语音图标标识在由黑色方形区域以及白色笔形状构成的区域周围,具有一圈一圈圆形的波纹形状向圆形图标的边缘扩散。此时的语音图标的显示效果为第二显示效果,当语音图标标识为此显示效果时,语音识别模组的工作状态为:收听状态。
下面请参看图2C,此时,语音图标标识的圆形图标的外边缘的枝丫与白色笔的相对位置发生变化。此时的语音图标的显示效果为第三显示效果,在此显示效果下,语音识别模组的工作状态为:识别状态。
当然,在图2A-图2C中描述的语音图标标识的具体形态仅用于说明和解释本发明,并不用于限定本发明,在实际情况中,还可以使用其他形态的语音图标标识进行表征,在此本申请不再举例。
进一步的,语音图标标识可以存在于显示单元的任意位置,并且可以在显示单元的任意位置进行移动。另外,在有其他的程序显示在显示单元上时,语音图标标识会置顶显示。在语音图标标识置顶显示时,即便其他程序显示在显示单元上,语音图标标识仍旧会显示在最上面。
例如图3所示,显示单元301为图中的长方形框表示的区域,在该区域中,显示有三个应用程序的显示界面:电子书程序的显示界面01,WORD程序的显示界面02,QQ对话框的显示界面03。其中,电子书程序的显示界面01被WORD程序的显示界面02遮挡,WORD程序的显示界面02被QQ对话框的显示界面03遮挡,QQ对话框的显示界面03存在于显示单元201的最上方,能够被用户观看到。
而语音图标标识04为一圆形图标,此时的语音图标标识04识置顶显示,显示在QQ对话框的显示界面03的前面。并且,不管上面三个程序的显示界面如何切换,语音图标标识04都不会被遮挡。
进一步的,当语音识别模组使用语音图标标识表征时,当将第一识别结果输入到待输入场景的输入区域时,则会控制语音图标标识以待输入场景下的第二显示效果显示,以提示语音识别模组处于收听状态,以使得用户直接进行第二语音输入。
上面的实施例描述的是在电子设备处于待输入场景下,语音识别模组接收用户的语音输入,将该语音输入识别为对应的字符,并在将该字符输入对应的输入区域时,语音识别模组会一直处于收听状态,以便于接收用户的再一次语音输入。
下面使用具体的示例对上面的实施过程进行说明。
首先,如图4A所示,显示单元301上显示有语音图标标识04以及音乐软件的界面05,音乐软件的界面05上具有搜索框051,能够接受用户的输入的文字搜索对应的音乐。此时,语音图标标识04置顶显示,即显示在音乐软件的界面05的前方。而此时的音乐软件需要接受用户的语音输入,并且将该语音输入转换为对应的字符。
若用户需要搜索的歌曲名称是:贝壳风铃。
此时,用户则会触发语音识别模组开始工作。
当语音识别模组处于工作状态时,语音图标标识04首先会处于第一显示效果,即如图4A中的语音图标标识04显示的状态,此时的语音识别模组处于待命状态,表示等待接收用户的语音输入。
此时,若用户输入语音“贝壳风铃”,那么语音识别模组则会获得该语音输入。
并且,在接受该语音输入的第一时刻,语音识别模组会触发从待命状态切换为收听状态,以便收听用户的语音输入。如图4B所示,此时的语音图标标识04处于第二显示效果。当语音图标标识04处于此效果时,则表示语音识别模组为收听状态。能够接受用户的语音输入。此时,语音识别模组接收到的语音输入为“贝壳风铃”。
当接受了语音输入之后,语音识别模组则会对该语音输入进行识别。
具体的,在识别时,语音识别模组会从收听状态切换为识别状态。识别状态对应的显示效果如图4C所示,此时,语音图标标识04的圆形图标的外边缘的枝丫与白色笔的相对位置发生变化,即处于第三显示效果。
在此识别状态下,语音识别模组会将语音输入“贝壳风铃”识别为对应的字符“贝壳风铃”。
进一步的,在识别出字符“贝壳风铃”之后,则会将其输入到音乐软件的搜索框051中。
具体的,在开始输入字符“贝壳风铃”到搜索框051这一刻开始,语音图标标识04会从第三显示效果转换为第二显示效果,即从图4C中语音图标标识04描述的显示效果切换到图4B中语音图标标识04的显示效果。此时,则表明了语音识别模组从识别状态切换为收听状态。
进一步的,在语音识别模组处于收听状态之后,直到音乐软件对其进行识别完成这一段时间之内,语音识别模组都会处于收听状态,以便于用户对其进行第二次语音输入。
此时若用户需要再一次进行语音输入,则可以直接输入语音,而不必操作语音识别模组从待命状态切换为收听状态。例如用户此时输入人名“张三”,语音识别模组则会直接接受用户的语音输入“张三”,然后将其状态从收听状态切换为识别状态,以对该语音输入进行识别。
在识别之后,会将识别出的字符“张三”输入到搜索框051中,并进一步将语音识别模组的状态从识别状态重新切换为收听状态,以待用户进行其他语音输入,并以此循环。
而对于音乐软件来说,当字符输入到搜索框051之后,若用户点击“确认”搜索之后,则会对其进行识别,并搜索出对应的内容。
进一步的,将对应的字符输入到搜索框051之后,若在一定的阈值范围内没有其他的字符输入,可以在搜索框051中的字符后面做上标点符号。当然,在实际应用中,此时的标点符号可以根据实际情况判断是否需要输入。
在上面的实施例中,描述的是在撰写模式下识别用户的语音输入的具体实施过程,当然,当语音识别模组处于其他场景时,还具有另外的实施方式。
下面请参看图5,即为语音识别模组处于其他场景时的具体实施过程。
S501,当语音识别模组处于工作状态且电子设备处于命令场景时,获得第三语音输入。
具体的,命令场景的具体含义是除了待输入场景之外的其他任意场景。在命令场景下,可以直接识别并执行用户的语音输入,而不需要将其转换为对应的字符进行执行。
例如,在控制电子设备(如电脑)的音量加减时,则可以直接使用语音输入进行控制。
因此,若此时语音识别模组处于工作状态,并且需要用户语音输入控制电脑的音量加减时,则会获得用户的第三语音输入,然后执行S502。
S502,基于语音识别模组对第三语音输入进行识别,获得第二识别结果。第二识别结果至少包括控制指令。
具体的,在对第三语音输入进行识别时,至少会分析出该语音输入包含的控制命令。而除了控制命令之外,第二识别结果还可以包括其他内容。
例如用户输入的语音为:输入XX的歌曲,当语音识别模组在对该语音输入进行识别时,除了识别出该语音输入包含的控制指令之外,还可以对该用户的声纹进行识别,进而识别出输入该语音的用户的具体身份,如性别,年龄等等。
S503,在响应第二识别结果的过程中,控制语音识别模组的工作状态处于待命状态,且控制语音图标标识以第一显示效果显示。
具体的,控制语音识别模组的工作状态处于待命状态,且控制语音图标标识以第一显示效果显示的具体目的,是为了提示语音识别模组处于待命状态,以使得用户操作语音图标标识控制语音识别模组进入收听状态。
具体的,在该命令场景下,语音识别模组在工作状态时,具体会呈现三种状态:待命状态,收听状态,识别状态。
此时,可以使用语音图标标识进行表征,语音图标标识具有的显示效果表示语音识别模组的具体工作状态。
此时,语音识别模组在呈现不同的工作状态时,语音图标标识会具有不同的显示效果,具体如下:
下面请参看图6A,此时的语音图标标识为圆形图标,在圆形区域的外边缘具有一枝丫,在圆形区域的中心具有一黑色麦克风。此时的语音图标的显示效果为第一显示效果,在此显示效果下,语音识别模组的工作状态为:待命状态。
下面请参看图6B,此时的语音图标标识在黑色麦克风周围,具有一圈一圈圆形的波纹形状向圆形图标的边缘扩散。此时的语音图标的显示效果为第二显示效果,当语音图标标识为此显示效果时,语音识别模组的工作状态为:收听状态。
下面请参看图6C,此时,语音图标标识的圆形图标的外边缘的枝丫与白色笔的相对位置发生变化。此时的语音图标的显示效果为第三显示效果,在此显示效果下,语音识别模组的工作状态为:识别状态。
当然,在图6A-图6C中描述的语音图标标识的具体形态仅用于说明和解释本发明,并不用于限定本发明,在实际情况中,还可以使用其他形态的语音图标标识进行表征,在此本申请不再举例。
进一步的,此时的语音图标标识也可以存在于显示单元的任意位置,并且可以在显示单元的任意位置进行移动。另外,在有多个应用程序的界面显示在显示单元上时,语音图标标识可以置顶显示,其含义为:即便其他程序显示在显示单元上,语音图标标识仍旧会显示在最上面。具体的描述请参看图3,在此本申请不再赘述。
当语音图标标识具有第一显示效果时,说明语音识别模组处于待命状态,并进一步表明语音识别模组准备接收语音输入,或者即将接收语音输入。
当语音图标标识具有第二显示效果时,说明语音识别模组处于收听状态时,并进一步表明语音识别模组正在接受用户的语音输入。
当语音识别模组已经接收了用户的语音输入,则语音图标标识具有第三显示效果,说明语音识别模组会处于识别状态,并进一步表明对用户输入的语音进行识别。
进一步的,在对其进行识别时,会识别出用户输入的语音对应的控制指令和其他一些内容。
此处在上面已经举例说明,在此本申请不再赘述。
当识别完成之后,会执行对应的控制指令。
进一步的,在响应第二识别结果的过程中,即相当于在识别出该控制指令开始,直到执行控制指令的这段时间内。在这段时间的任意时刻,语音识别模组的工作状态都可以处于待命状态。而在待命状态下,此时用于表征语音识别模组的控制语音图标标识会以命令场景下的第一显示效果显示,以提示语音识别模组处于待命状态,以使得用户操作语音图标标识控制语音识别模组进入收听状态。
具体的,在语音识别模组识别并执行控制指令的时候,语音识别模组处于待命状态。此时若用户需要再次输入语言,则需要对语音图标标识进行操作,将其从待命状态切换为收听状态才能够输入。
下面使用具体的例子对上面的实施过程进行详细的说明。
首先,如图7A所示,显示单元301上显示有语音图标标识04以及音乐软件的界面05,音乐软件的界面05上具有音乐面板052,能够接受用户的语音输入。
此时,语音图标标识04置顶显示,即显示在音乐软件的界面05的前方。而此时的音乐软件需要接受用户的语音输入,并执行对应的控制指令。
若用户需要搜索的歌曲名称是:贝壳风铃。
此时,用户则会触发语音识别模组开始工作。
当语音识别模组处于工作状态时,语音图标标识04会处于第一显示效果,即如图7A中的语音图标标识04显示的状态,此时的语音识别模组处于待命状态,表示等待接收用户的语音输入。
此时,若用户输入语音:“搜索贝壳风铃”,那么语音识别模组则会获得该语音输入。
并且,在接受该语音输入时,语音识别模组会从待命状态切换为收听状态,以便收听用户的语音输入。如图7B所示,此时的语音图标标识04处于第二显示效果。当语音图标标识04处于此效果时,则表示语音识别模组为收听状态。能够接受用户的语音输入。此时,语音识别模组接收到的语音输入为“搜索贝壳风铃”。
当接受了语音输入之后,语音识别模组则会对该语音输入进行识别。
具体的,在识别时,语音识别模组会从收听状态切换为识别状态。识别状态对应的显示效果如图7C所示,此时,语音图标标识04的圆形图标的外边缘的枝丫与白色笔的相对位置发生变化,即处于第三显示效果。
在此识别状态下,语音识别模组会识别出“搜索贝壳风铃”对应的控制指令。
进一步的,当识别出对应的控制指令之后,音乐面板052会执行该控制指令,搜索贝壳风铃这首歌曲。
具体的,在响应第二识别结果的过程中,即相当于在识别出该控制指令开始,语音识别模组会处于待命状态,即从图7C中描述的显示效果切换到图7A中的显示效果。直到执行控制指令的这段时间内。在这段时间的任意时刻,语音识别模组的工作状态都可以处于待命状态。
进一步的,在语音识别模组处于待命状态之后,若此时若用户需要再一次进行语音输入,需要对语音图标标识04进行操作之后,才能够将其从待命状态切换为收听状态,并进行下一次的语音输入,例如点击语音图标标识04进行切换以进行语音输入。例如用户此时需要再次输入人名“张三”,则会点击语音图标标识04,将语音识别模组从待命状态切换为收听状态,然后输入语言“张三”。
此时,语音识别模组会从收听状态切换为识别状态,以对该语音输入进行识别,获得对应的控制指令进行执行。
在上面的实施例中,公开了在待输入场景下以及命令场景下,语音识别模组接受用户的语音输入并进行识别的信息处理过程。进一步的,在这两种待输入场景下,语音识别模组的工作模式可以任意进行切换,具体请参看下面的实施例。
实施例二:
在本申请实施例中,一种信息处理方法。
进一步的,该方法应用于电子设备中。
进一步的,电子设备包括一显示单元和一语音识别模组。
具体的,语音识别模组在实施例一中已经具有详细的描述,在此本申请不再赘述。
下面请参看图8,本申请实施例中的信息处理方法的实施过程如下:
S801,当语音识别模组处于工作状态时,获得一判断参数。
其中,该判断参数用于判断处于工作状态下的语音识别模组的工作模式。
具体的,语音识别模组在工作时,具有两种工作模式。第一工作模式具体为转写模式,第二工作模式为命令模式。在语音识别模组处于工作状态时,可以处于转写模式下的工作状态,也可以处于命令模式下的工作状态。
更为具体的,当电子设备处于待输入场景时,若此时的语音识别模组处于工作状态,则处于转写模式下的工作状态。当电子设备处于命令场景时,若此时的语音识别模组处于工作状态,则处于命令模式下的工作状态。
更进一步的,在转写模式下,若语音识别模组处于工作状态,在识别用户的输入的语音时,会将识别出的语音转化为文字,然后执行文字对应的控制命令。
在命令模式下,若语音识别模组处于工作状态,语音识别模组直接识别用户输入的语音,然后执行该语音对应的控制命令。
因此,在执行S801的过程中,判断参数可以是针对场景的判断参数,也可以是针对语音图标标识的操作手势的判断参数。
具体的,当判断参数具体为针对场景的判断参数时,该判断参数具体可以为:待输入场景的判断参数,或者除待输入场景之外的其他场景(即命令场景)下的判断参数。当此判断参数为待输入场景的判断参数,则可以说明此时的语音识别模组处于转写模式下的工作状态。当此判断参数为命令场景的判断参数,则可以说明此时的语音识别模组处于命令模式下的工作状态。
当判断参数具体为针对语音图标标识的操作手势的判断参数时,不同的手势所具有的判断参数可以对应不同的工作模式,例如,点击对应的判断参数,对应第一工作模式;点击对应的判断参数之外的其他判断参数(例如滑动对应的判断参数),对应第二工作模式。
因此,当获得了判断参数之后,则会执行下面的步骤。
S802,当判断参数满足第一预定条件时,控制语音识别模组处于第一工作模式。
S803,当判断参数满足第二预定条件时,控制语音识别模组处于第二工作模式。
具体的,在执行S802之前,会对该判断参数进行判断,具体的做法是:判断该判断参数是否满足第一预定条件。
若其满足第一预定条件,则执行S802中的步骤。
若其不满足第一预定条件,则证明其满足第二预定条件,进而执行S802中的步骤。
具体的此时的第二预定条件和第一预定条件是相反的两个条件,例如,当第一预定条件是:该判断参数为待输入场景中的判断参数。那么第二预定条件则为除待输入场景之外的其他场景的判断参数,如命令场景下的判断参数。
因此,当判断出该判断参数不是待输入场景中的判断参数,则不符合第一预定条件,此时,则必定符合第二预定条件。
上述过程描述的是判断语音识别模组的具体工作模式的实施过程。而在不同的工作模式下,语音识别模组具有不同的工作状态。
具体的,在第一工作模式下:
语音识别模组具有:待命状态、收听状态、识别状态。
当语音识别模组处于第一工作模式时,语音识别模组针对一次语音输入识别完成时返回至收听状态。
当语音识别模组处于待命状态时,表明语音识别模组准备接收语音输入,或者即将接收语音输入。
当语音识别模组处于收听状态时,表明语音识别模组正在接受用户的语音输入。
当语音识别模组已经接收了用户的语音输入,则语音识别模组会处于识别状态,将输入的语音转换为对应的字符。
进一步的,在识别完成之后,将字符输入到输入区域的第一时刻,直到识别完该字符的第二时刻。在由第一时刻开始,直到第二时刻结束的这一个时间段之内,语音识别模组都可以处于收听状态,用来接收用户的再一次语音输入。
具体的,当语音识别模组使用语音图标标识进行表征时,语音图标标识的显示效果表示语音识别模组的具体的工作状态,此时,显示单元上则会显示有语音图标标识。
此时,在待输入场景下,语音图标标识在呈现不同的显示效果时,语音识别模组会具有不同的工作状态。
当语音识别模组处于第一工作模式时控制以第一显示效果显示语音图标标识表征语音识别模组处于第一工作模式的待命状态。
当语音识别模组处于第一工作模式时控制以第二显示效果显示语音图标标识表征语音识别模组处于第一工作模式的收听状态。
当语音识别模组处于第一工作模式时控制以第三显示效果显示语音图标标识表征语音识别模组处于第一工作模式的识别状态。
而在第一工作模式下不同的工作状态,以及在第一工作模式下对应的显示效果在图2A-图2C中已经具有详细的描述,在此本申请不再赘述。
当语音识别模组处于第一工作模式,且在第一工作模式下完成一次语音输入识别完成时直接进行下一次语音输入。
进一步的,当语音识别模组使用语音图标标识表征时,当将第一识别结果输入到待输入场景的输入区域时,则会控制语音图标标识以待输入场景下的第二显示效果显示,以提示语音识别模组处于收听状态,以使得用户直接进行第二语音输入。
在第二工作模式下:
语音识别模组具有:待命状态,收听状态,识别状态。
当语音识别模组处于第二工作模式时语音识别模组针对一次语音输入识别完成时返回至待命状态。
更为具体的,当语音识别模组处于待命状态时,表明语音识别模组准备接收语音输入,或者即将接收语音输入。
当语音识别模组处于收听状态时,表明语音识别模组正在接受用户的语音输入。
当语音识别模组已经接收了用户的语音输入,则语音识别模组会处于识别状态,对输入的语音进行识别,并获得对应的控制指令。
具体的,当语音识别模组使用语音图标标识进行表征时,语音图标标识的显示效果表示语音识别模组的具体的工作状态,此时,显示单元上则会显示有语音图标标识。
此时,在待输入场景下,语音图标标识在呈现不同的显示效果时,语音识别模组会具有不同的工作状态。
当语音识别模组处于第二工作模式时控制以第一显示效果显示语音图标标识表征语音识别模组处于第二工作模式的待命状态。
当语音识别模组处于第二工作模式时控制以第二显示效果显示语音图标标识表征语音识别模组处于第二工作模式的收听状态。
当语音识别模组处于第二工作模式时控制以第三显示效果显示语音图标标识表征语音识别模组处于第二工作模式的识别状态。
而在第二工作模式下不同的工作状态,以及在第二工作模式下对应的显示效果在图6A-图6C中已经具有详细的描述,在此本申请不再赘述。
当语音识别模组处于第二工作模式,且在第二工作模式下完成一次语音输入识别完成时,通过获得用户操作针对语音图标标识控制语音识别模组进入收听状态以进行下一次语音输入。
具体的,在响应第二识别结果的过程中,即相当于在识别出该控制指令开始,语音识别模组会处于待命状态,即从图6C中描述的显示效果切换到图6A中的显示效果。直到执行控制指令的这段时间内。在这段时间的任意时刻,语音识别模组的工作状态都可以处于待命状态。
更为具体的,当语音识别模组使用语音图标标识进行表征时,此时的语音图标标识也可以存在于显示单元的任意位置,并且可以在显示单元的任意位置进行移动。另外,在有多个应用程序的界面显示在显示单元上时,语音图标标识可以置顶显示,其含义为:即便其他程序显示在显示单元上,语音图标标识仍旧会显示在最上面。具体的描述请参看图3,在此本申请不再赘述。
具体的,基于同一发明构思,在实施例一中具体介绍了在待输入场景下的信息处理方法的实施过程,下面的实施例,介绍其对应的电子设备。
实施例三:
在本申请实施例中,提供了一种电子设备。
具体的,电子设备包括一显示单元和一语音识别模组。
具体的,语音识别模组在上述实施例中已经具有详细的描述,在此本申请不再赘述。
下面请参看图9,电子设备包括:
第一获得单元901,用于当语音识别模组处于工作状态且电子设备处于待输入场景时,获得第一语音输入;
第二获得单元902,用于基于语音识别模组对第一语音输入进行识别,获得第一识别结果,第一识别结果为第一语音输入对应的字符;
第一控制单元903,用于当将第一识别结果输入到待输入场景的输入区域时,控制语音识别模组的工作状态处于收听状态,以使得用户直接进行第二语音输入。
进一步的,电子设备还包括:
第三获得单元,用于当语音识别模组处于工作状态且电子设备处于命令场景时,获得第三语音输入;
第四获得单元,用于基于语音识别模组对第三语音输入进行识别,获得第二识别结果;第二识别结果至少包括控制指令;
第二控制单元,用于在响应第二识别结果的过程中,控制语音识别模组的工作状态处于待命状态,且控制语音图标标识以命令场景下的第一显示效果显示,以提示语音识别模块处于待命状态,以使得用户操作语音图标标识控制语音识别模块进入收听状态。
具体的,基于同一发明构思,在实施例二中具体介绍了如何判断语音识别模组的工作模式的信息处理方法的实施过程,下面的实施例,介绍其对应的电子设备。
实施例四:
在本申请实施例中,描述了一种电子设备。
具体的,电子设备包括一显示单元和一语音识别模组。
具体的,语音识别模组在上述实施例中已经具有详细的描述,在此本申请不再赘述。
下面请参看图10,电子设备包括:
第一获得模块1001,用于当语音识别模组处于工作状态时,获得一判断参数,判断参数用于判断处于工作状态下的语音识别模组的工作模式;
第一控制模块1002,用于当判断参数满足第一预定条件时,控制语音识别模组处于第一工作模式;
第二控制模块1003,用于当判断参数满足第二预定条件时,控制语音识别模组处于第二工作模式。
进一步的,在第一工作模式下,语音识别模组具有:待命状态、收听状态、识别状态;
当语音识别模块处于第一工作模式时,语音识别模组针对一次语音输入识别完成时返回至收听状态;
在第二工作模式下,语音识别模组具有:待命状态,收听状态,识别状态;
当语音识别模块处于第二工作模式时语音识别模组针对一次语音输入识别完成时返回至待命状态。
进一步的,显示单元上具有语音图标标识;
当语音识别模块处于第一工作模式且在第一工作模式下完成一次语音输入识别完成时直接进行下一次语音输入;
当语音识别模块处于第二工作模式且在第二工作模式下完成一次语音输入识别完成时通过获得用户操作针对语音图标标识控制语音识别模块进入收听状态以进行下一次语音输入。
通过本发明的一个或多个实施例,可以实现如下技术效果:
在本申请实施例的一个或多个实施例中,首先提供了一种信息处理方法。在该信息处理方法中,首先会接受用户的语音输入,而在接受用户的语音输入时,具有一定的条件:语音识别模组处于工作状态,且电子设备处于待输入场景。当不满足这两个条件时,则不能够获得用户的语音输入。进一步的,当获得了语音输入时,会对该语音输入进行识别,并识别为对应的字符。进一步的,当将字符输入到待输入场景的输入区域时,则会控制语音识别模组的工作状态处于收听状态,以使得用户直接进行第二语音输入。因此,使用该方法在用户进行了第一语音输入之后,电子设备会对其进行识别,并且在将识别的结果输入输入区域时,此时的电子设备还可以直接接收用户的第二语音输入,而不会像现有技术中的电子设备,只能够接受一次用户的语音输入。本申请描述的方法,能够多次接受用户的语音输入,因此,避免了用户多次操作电子设备进行语音输入的情况,减少了电子设备的损耗,并且延长了电子设备的使用寿命。
进一步的,语音识别模组的具体工作状态是通过语音图标标识来进行表征的,因此,语音图标标识以待输入场景下的第二显示效果显示时,能够提示用户该语音识别模组处于收听状态,以使得用户直接进行第二语音输入
进一步的,在命令场景下,语音识别模组在识别用户的语音输入时,会处于待命状态。此时,语音图标标识会以命令场景下的第一显示效果显示,用来提示语音识别模块处于待命状态,以使得用户操作语音图标标识控制语音识别模块进入收听状态。
进一步的,语音识别模组的具体的工作模式可以进行调整,具体的调整方式是,通过分析语音识别模组处于工作状态时获得的判断参数,进而确定语音识别模组具体的工作模式。
进一步的,当语音识别模组在识别用户的语音输入时,在不同的工作模式下,语音识别模组的工作状态各有不同,具体的,在第一工作模式下,语音识别模组具有:待命状态、收听状态、识别状态;当语音识别模块处于第一工作模式时,语音识别模组针对一次语音输入识别完成时返回至收听状态。在第二工作模式下,语音识别模组具有:待命状态,收听状态,识别状态;当语音识别模块处于第二工作模式时语音识别模组针对一次语音输入识别完成时返回至待命状态。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器,CD-ROM,光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (11)

1.一种信息处理方法,所述方法应用于电子设备中,所述电子设备包括一显示单元和一语音识别模组,其特征在于,所述方法包括:
当所述语音识别模组处于工作状态且所述电子设备处于待输入场景时,获得第一语音输入;
基于所述语音识别模组对所述第一语音输入进行识别,获得第一识别结果,所述第一识别结果为所述第一语音输入对应的字符;
当将所述第一识别结果输入到所述待输入场景的输入区域时,控制所述语音识别模组的工作状态处于收听状态,以使得用户直接进行第二语音输入;
当所述语音识别模组处于工作状态且所述电子设备处于命令场景时,获得第三语音输入;
基于所述语音识别模组对所述第三语音输入进行识别,获得第二识别结果;所述第二识别结果至少包括控制指令;
在响应所述第二识别结果的过程中,控制所述语音识别模组的工作状态处于待命状态,且控制语音图标标识以所述命令场景下的第一显示效果显示,以提示所述语音识别模组处于所述待命状态,以使得用户操作所述语音图标标识控制所述语音识别模组进入收听状态。
2.如权利要求1所述的方法,其特征在于,所述显示单元上显示有所述语音图标标识;
所述当将所述第一识别结果输入到所述待输入场景的输入区域时,控制所述语音识别模组的工作状态处于收听状态,以使得用户直接进行第二语音输入,具体为:
当将所述第一识别结果输入至所述待输入场景的输入区域时,控制所述语音图标标识以所述待输入场景下的第二显示效果显示,以提示所述语音识别模组处于所述收听状态,以使得用户直接进行第二语音输入。
3.一种电子设备,所述电子设备包括一显示单元和一语音识别模组,其特征在于,所述电子设备包括:
第一获得单元,用于当所述语音识别模组处于工作状态且所述电子设备处于待输入场景时,获得第一语音输入;
第二获得单元,用于基于所述语音识别模组对所述第一语音输入进行识别,获得第一识别结果,所述第一识别结果为所述第一语音输入对应的字符;
第一控制单元,用于当将所述第一识别结果输入到所述待输入场景的输入区域时,控制所述语音识别模组的工作状态处于收听状态,以使得用户直接进行第二语音输入;
其中,所述电子设备还包括:
第三获得单元,用于当所述语音识别模组处于工作状态且所述电子设备处于命令场景时,获得第三语音输入;
第四获得单元,用于基于所述语音识别模组对所述第三语音输入进行识别,获得第二识别结果;所述第二识别结果至少包括控制指令;
第二控制单元,用于在响应所述第二识别结果的过程中,控制所述语音识别模组的工作状态处于待命状态,且控制语音图标标识以所述命令场景下的第一显示效果显示,以提示所述语音识别模组处于所述待命状态,以使得用户操作所述语音图标标识控制所述语音识别模组进入收听状态。
4.一种信息处理方法,所述方法应用于电子设备中,所述电子设备包括一显示单元和一语音识别模组,其特征在于,所述方法包括:
当所述语音识别模组处于工作状态时,获得一判断参数,所述判断参数用于判断处于所述工作状态下的所述语音识别模组的工作模式;
当所述判断参数满足第一预定条件时,控制所述语音识别模组处于第一工作模式;所述第一工作模式为在识别用户的输入的语音时,会将识别出的语音转化为文字;
当所述判断参数满足第二预定条件时,控制所述语音识别模组处于第二工作模式;所述第二工作模式为直接识别用户输入的语音,并执行该语音对应的控制指令,且在执行该语音对应的控制指令的过程中,控制所述语音识别模组的工作状态处于待命状态,且控制语音图标标识以所述第二工作模式下的第一显示效果显示,以提示所述语音识别模组处于所述待命状态,以使得用户操作所述语音图标标识控制所述语音识别模组进入收听状态。
5.如权利要求4所述的方法,其特征在于,
在所述第一工作模式下,所述语音识别模组具有:待命状态、收听状态、识别状态;
当所述语音识别模组处于所述第一工作模式时,所述语音识别模组针对一次语音输入识别完成时返回至所述收听状态;
在所述第二工作模式下,所述语音识别模组具有:待命状态,收听状态,识别状态;
当所述语音识别模组处于所述第二工作模式时所述语音识别模组针对一次语音输入识别完成时返回至所述待命状态。
6.如权利要求5所述的方法,其特征在于,所述显示单元上具有所述语音图标标识;
当所述语音识别模组处于所述第一工作模式且在所述第一工作模式下完成一次语音输入识别完成时直接进行下一次语音输入;
当所述语音识别模组处于所述第二工作模式且在所述第二工作模式下完成一次语音输入识别完成时通过获得用户操作针对所述语音图标标识控制所述语音识别模组进入收听状态以进行下一次语音输入。
7.如权利要求6所述的方法,其特征在于,
当所述语音识别模组处于所述第一工作模式时控制以第一显示效果显示所述语音图标标识表征所述语音识别模组处于所述第一工作模式的待命状态;
当所述语音识别模组处于所述第一工作模式时控制以第二显示效果显示所述语音图标标识表征所述语音识别模组处于所述第一工作模式的收听状态;
当所述语音识别模组处于所述第一工作模式时控制以第三显示效果显示所述语音图标标识表征所述语音识别模组处于所述第一工作模式的识别状态;
或者
当所述语音识别模组处于所述第二工作模式时控制以第一显示效果显示所述语音图标标识表征所述语音识别模组处于所述第二工作模式的待命状态;
当所述语音识别模组处于所述第二工作模式时控制以第二显示效果显示所述语音图标标识表征所述语音识别模组处于所述第二工作模式的收听状态;
当所述语音识别模组处于所述第二工作模式时控制以第三显示效果显示所述语音图标标识表征所述语音识别模组处于所述第二工作模式的识别状态。
8.如权利要求4所述的方法,其特征在于,所述显示单元上具有所述语音图标标识;
所述语音图标标识可以存在于所述显示单元的任意位置,并且所述语音图标标识在所述显示单元上任意移动,另外,当具有应用程序的显示界面在所述显示单元上显示时,所述语音图标标识在所述显示界面上置顶显示。
9.一种电子设备,所述电子设备包括一显示单元和一语音识别模组,其特征在于,所述电子设备包括:
第一获得模块,用于当所述语音识别模组处于工作状态时,获得一判断参数,所述判断参数用于判断处于所述工作状态下的所述语音识别模组的工作模式;
第一控制模块,用于当所述判断参数满足第一预定条件时,控制所述语音识别模组处于第一工作模式;所述第一工作模式为在识别用户的输入的语音时,会将识别出的语音转化为文字;
第二控制模块,用于当所述判断参数满足第二预定条件时,控制所述语音识别模组处于第二工作模式;所述第二工作模式为直接识别用户输入的语音,并执行该语音对应的控制指令,在执行该语音对应的控制指令的过程中,所述第二控制模块还用于控制所述语音识别模组的工作状态处于待命状态,且控制语音图标标识以所述第二工作模式下的第一显示效果显示,以提示所述语音识别模组处于所述待命状态,以使得用户操作所述语音图标标识控制所述语音识别模组进入收听状态。
10.如权利要求9所述的电子设备,其特征在于,
在所述第一工作模式下,所述语音识别模组具有:待命状态、收听状态、识别状态;
当所述语音识别模组处于所述第一工作模式时,所述语音识别模组针对一次语音输入识别完成时返回至所述收听状态;
在所述第二工作模式下,所述语音识别模组具有:待命状态,收听状态,识别状态;
当所述语音识别模组处于所述第二工作模式时所述语音识别模组针对一次语音输入识别完成时返回至所述待命状态。
11.如权利要求10所述的电子设备,其特征在于,
所述显示单元上具有所述语音图标标识;
当所述语音识别模组处于所述第一工作模式且在所述第一工作模式下完成一次语音输入识别完成时直接进行下一次语音输入;
当所述语音识别模组处于所述第二工作模式且在所述第二工作模式下完成一次语音输入识别完成时通过获得用户操作针对所述语音图标标识控制所述语音识别模组进入收听状态以进行下一次语音输入。
CN201310109241.5A 2013-03-29 2013-03-29 一种信息处理方法以及一种电子设备 Active CN104077105B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201310109241.5A CN104077105B (zh) 2013-03-29 2013-03-29 一种信息处理方法以及一种电子设备
CN201810300016.2A CN108491182A (zh) 2013-03-29 2013-03-29 一种信息处理方法以及一种电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310109241.5A CN104077105B (zh) 2013-03-29 2013-03-29 一种信息处理方法以及一种电子设备

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201810300016.2A Division CN108491182A (zh) 2013-03-29 2013-03-29 一种信息处理方法以及一种电子设备

Publications (2)

Publication Number Publication Date
CN104077105A CN104077105A (zh) 2014-10-01
CN104077105B true CN104077105B (zh) 2018-04-27

Family

ID=51598384

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201810300016.2A Pending CN108491182A (zh) 2013-03-29 2013-03-29 一种信息处理方法以及一种电子设备
CN201310109241.5A Active CN104077105B (zh) 2013-03-29 2013-03-29 一种信息处理方法以及一种电子设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201810300016.2A Pending CN108491182A (zh) 2013-03-29 2013-03-29 一种信息处理方法以及一种电子设备

Country Status (1)

Country Link
CN (2) CN108491182A (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462186A (zh) * 2014-10-17 2015-03-25 百度在线网络技术(北京)有限公司 一种语音搜索方法及装置
CN107148614B (zh) * 2014-12-02 2020-09-08 索尼公司 信息处理设备、信息处理方法和程序
CN107680592B (zh) * 2017-09-30 2020-09-22 惠州Tcl移动通信有限公司 一种移动终端语音识别方法、及移动终端及存储介质
CN108334272B (zh) * 2018-01-23 2020-08-21 维沃移动通信有限公司 一种控制方法及移动终端
CN111722893A (zh) * 2019-03-20 2020-09-29 华为技术有限公司 一种电子设备图形用户界面交互方法、装置和终端设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101557432A (zh) * 2008-04-08 2009-10-14 Lg电子株式会社 移动终端及其菜单控制方法
CN102117317A (zh) * 2010-12-28 2011-07-06 北京航空航天大学 一种基于语音技术的盲人互联网系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60113787T2 (de) * 2000-11-22 2006-08-10 Matsushita Electric Industrial Co., Ltd., Kadoma Verfahren und Vorrichtung zur Texteingabe durch Spracherkennung
JP2002312318A (ja) * 2001-04-13 2002-10-25 Nec Corp 電子装置、本人認証方法およびプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101557432A (zh) * 2008-04-08 2009-10-14 Lg电子株式会社 移动终端及其菜单控制方法
CN102117317A (zh) * 2010-12-28 2011-07-06 北京航空航天大学 一种基于语音技术的盲人互联网系统

Also Published As

Publication number Publication date
CN104077105A (zh) 2014-10-01
CN108491182A (zh) 2018-09-04

Similar Documents

Publication Publication Date Title
US9865264B2 (en) Selective speech recognition for chat and digital personal assistant systems
EP2223046B1 (de) Multimodale benutzerschnittstelle eines fahrerassistenzsystems zur eingabe und präsentation von informationen
EP3288024B1 (en) Method and apparatus for executing a user function using voice recognition
KR102084041B1 (ko) 펜 기능 운용 방법 및 시스템
CN104077105B (zh) 一种信息处理方法以及一种电子设备
JP6434199B2 (ja) メッセージベースの対話機能運用方法及びこれを支援する端末機
US11194448B2 (en) Apparatus for vision and language-assisted smartphone task automation and method thereof
KR101411129B1 (ko) 음성 인식 결과의 통합
JP5421239B2 (ja) 複数モードの入力メソッドエディタ
CN105989841B (zh) 车载语音控制方法及装置
CN111767021A (zh) 语音交互方法、车辆、服务器、系统和存储介质
RU2013144921A (ru) Способ и устройство для выполнения режима предварительно установленной операции с использованием распознования речи
JP2013504808A (ja) 触覚強化テキストインターフェースのためのシステム及び方法
JP2013543201A (ja) 画面外の目に見えるオブジェクトの表面化
EP3593346B1 (en) Graphical data selection and presentation of digital content
EP2849054A1 (en) Apparatus and method for selecting a control object by voice recognition
CN103187055B (zh) 基于车载应用的数据处理系统
KR101474856B1 (ko) 음성인식을 통해 이벤트를 발생시키기 위한 장치 및 방법
Cox et al. Tlk or txt? Using voice input for SMS composition
EP2909702B1 (en) Contextually-specific automatic separators
US9189158B2 (en) Methods, devices and systems for entering textual representations of words into a computing device by processing user physical and verbal interactions with the computing device
CN109741741A (zh) 智能终端的控制方法、智能终端及计算机可读存储介质
CN109376228A (zh) 一种信息推荐方法、装置、设备及介质
WO2014183587A1 (zh) 一种联想输入的方法及终端
CN115877997B (zh) 一种面向交互元素的语音交互方法、系统及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant