CN104111728A - 基于操作手势的语音指令输入方法及电子设备 - Google Patents

基于操作手势的语音指令输入方法及电子设备 Download PDF

Info

Publication number
CN104111728A
CN104111728A CN201410294979.8A CN201410294979A CN104111728A CN 104111728 A CN104111728 A CN 104111728A CN 201410294979 A CN201410294979 A CN 201410294979A CN 104111728 A CN104111728 A CN 104111728A
Authority
CN
China
Prior art keywords
application
gesture
voice
input
electronic equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410294979.8A
Other languages
English (en)
Other versions
CN104111728B (zh
Inventor
陆林轩
高澍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201410294979.8A priority Critical patent/CN104111728B/zh
Publication of CN104111728A publication Critical patent/CN104111728A/zh
Application granted granted Critical
Publication of CN104111728B publication Critical patent/CN104111728B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephone Function (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例公开了一种基于操作手势的语音指令输入方法,包括:获得用户选择第一应用的手势指令;当所述手势指令为激活该第一应用的语音服务手势指令时,根据输入的手势指令,启动所述第一应用的语音接收功能;接收用户输入的针对所述第一应用的语音;对所述语音进行识别,确定要执行的第一操作对象;针对所述第一操作对象,执行所述第一应用对应的第一功能。本发明实施例还公开了一种电子设备。本发明实施例减少了用户记忆指令的记忆量,使电子设备的语音服务操作更实用,用户体验效果更佳。

Description

基于操作手势的语音指令输入方法及电子设备
技术领域
本发明涉及语音指令识别技术,尤其涉及一种基于操作手势的语音指令输入方法及电子设备。
背景技术
随着电子设备的处理能力越来越强,电子设备中所安装的应用也越来越多,用户在使用电子设备时,需要从众多的应用中选择出自己感兴趣的应用,并启动该所选的应用。
目前的手机、电脑等电子设备中都支持语音输入技术,一些常规的操作指令都可采用语音输入方式,如语音拨号、联系人语音查找等。但在使用语音服务时,电子设备需要语音输入两部分指令内容:打开应用的语音指令和打开该应用后对应的操作对象的语音,电子设备才能完成用户想执行的操作。例如:要进行给中国移动打电话,就需要用户语音输入“拨号”,再加上“中国移动”。电子设备需要先根据识别出的“拨号”,找到对应的拨号应用打开,再根据识别出的“中国移动”,拨打电话簿中“中国移动”对应的电话号码,从而完成本次操作。如果是上网搜索的话,需要用户语音输入“上网搜索”和关键词。电子设备需要先根据识别出的“上网搜索”,找到对应的浏览器应用打开,再根据识别出的关键词,执行上网搜索的功能,从而完成本次操作。
这样一来,用户必须记忆针对不同应用的各种不同的语音指令,当规定的语音指令不正确时,例如:如果电子设备用于打电话的语音指令是“拨号”,如果用户语音输入“打电话”,就无法正常使用拨号服务。另外,随着应用越来越多,可能会出现相近似的语音指令,这样也增加了电子设备识别的错误率。
由此可见,本来是为简化操作路径的语音服务提供,反而因需用户进行一些语音操作训练,而导致语音服务很难被电子设备用户接受,不仅导致电子设备的语音服务功能不被用户所应用,用户体验也较差。
发明内容
为解决上述技术问题,本发明实施例提供一种基于操作手势的语音指令输入方法及电子设备,减少用户记忆指令的记忆量,使电子设备的语音服务操作更实用。
本发明实施例的技术方案是这样实现的:
一种基于操作手势的语音指令输入方法,应用于电子设备,所述方法包括:
获得用户选择第一应用的手势指令;
当所述手势指令为激活该第一应用的语音服务手势指令时,根据输入的手势指令,启动所述第一应用的语音接收功能;
接收用户输入的针对所述第一应用的语音;
对所述语音进行识别,确定要执行的第一操作对象;
针对所述第一操作对象,执行所述第一应用对应的第一功能。
一种电子设备,所述电子设备包括:获得单元、第一确定单元、启动单元、接收单元、识别单元和第一执行单元,其中:
获得单元,用于获得用户选择第一应用的手势指令;
第一确定单元,用于判断所述手势指令是否为激活该第一应用的语音服务手势指令,是时触发启动单元;
启动单元,用于根据输入的手势指令,启动所述第一应用的语音接收功能;
接收单元,用于接收用户输入的针对所述第一应用的语音;
识别单元,用于对所述语音进行识别,确定要执行的第一操作对象;
第一执行单元,用于针对所述第一操作对象,执行所述第一应用对应的第一功能。
本发明的实施例中,获得用户选择第一应用的手势指令后,判断所述手势指令是否为激活该第一应用的语音服务手势指令,是时,根据输入的手势指令,启动所述第一应用的语音接收功能;接收用户输入的针对所述第一应用的语音;对所述语音进行识别,确定要执行的第一操作对象;针对所述第一操作对象,执行所述第一应用对应的第一功能。本发明实施例通过特定手势来激活该第一应用的语音服务,并且,当通过特定手势来激活该第一应用的语音服务时,该第一应用的语音服务仅支持特定的语音指令,例如拨号应用,当用户输入对应的语音时,拨号应用将识别该语音对应的联系人,并默认该语音指令是向该语音指令对应的联系人发起呼叫。本发明实施例的技术方案,当利用设定手势打开了应用后,该应用将支持最常用的特定的语音指令输入,用户不需要记忆打开应用所需要的其他语音指令,从而减少了用户语音指令的记忆量,提升了电子设备用户的体验。
附图说明
图1为本发明实施例一的基于操作手势的语音指令输入方法的流程图;
图2为本发明实施例二的基于操作手势的语音指令输入方法的流程图;
图3为本发明实施例的基于操作操作手势的语音指令输入的具体应用场景示意图;
图4为本发明实施例三的基于操作手势的语音指令输入方法的流程图;
图5为本发明实施例四的基于操作手势的语音指令输入方法的流程图;
图6为本发明实施例五的电子设备的组成结构示意图;
图7为本发明实施例六的电子设备的组成结构示意图;
图8为本发明实施例七的电子设备的组成结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下举实施例并参照附图,对本发明进一步详细说明。
图1为本发明实施例一的基于操作手势的语音指令输入方法的流程图。如图1所示,本示例的基于操作手势的语音指令输入方法应用于电子设备中,本发明实施例的电子设备包括但不限于:手机、一体式电脑、平板电脑、电子阅读器、个人数字助理等。本发明实施例优选的电子设备为手机。本示例的基于操作手势的语音指令输入方法包括以下步骤:
步骤101,获得用户选择第一应用的手势指令。
本步骤中,用户通过电子设备的触摸屏等输入针对应用的手势指令,这些手势一般是设定手势。当电子设备检测到这些设定手势时,将开启应用的特定的语音指令接收功能,即虽然应用支持多种语音指令的输入,但当用户输入特殊的手势后,电子设备识别该手势,并启动应用的常用语音指令输入功能。例如手机中的拨号应用,当用户输入对应的语音时,拨号应用将识别该语音对应的联系人,并默认该语音指令是向该语音指令对应的联系人发起呼叫。例如QQ应用,当用户输入联系人昵称的语音后,QQ应用将识别该语音对应的联系人,并自动发起与该联系人的文字聊天界面。对于浏览器IE应用,当用户输入网站的语音后,IE应用将识别该语音对应的网站,并自动发起对该网站网址的访问。
步骤102,当所述手势指令为激活该第一应用的语音服务手势指令时,根据输入的手势指令,启动所述第一应用的语音接收功能。
当电子设备判断用户输入的手势为设定的设定手势,如当手势为双击手势、或向上或向下的滑动手势、或画圈手势、或画叉手势等时,第一应用将启动自身的特定语音指令接收功能。也就是说,第一应用将开启对特定语音指令的接收及识别功能,而对于自身的其他常用的语音指令功能,并不开启。也就是说,第一应用仅识别有限的语音指令,并不会识别自身支持的所有语音指令。这样,在使用过程中,用户也不必记忆该应用的所有语音指令。
步骤103,接收用户输入的针对所述第一应用的语音。
接收用户输入的针对第一应用的语音指令。例如,对于前述的手机中的拨号应用,用户仅需输入联系人名称的语音,拨号应用接收到用户输入的联系人名称后,将识别出该联系人,并会查找出该联系人对应的联系号码,并将默认当前的语音指令是与该联系人建立语音通话,而发起对该联系人对应的联系号码的呼叫;而对于QQ应用,用户仅需输入好友的昵称的语音,QQ应用识别出该好友,并自动发起与该好友的文字聊天界面。对于IE应用,当用户输入网站名称的语音时,IE应用识别出该网站的站名,并自动发起到该网站的访问。本发明实施例仅以拨号应用、QQ应用和IE应用为例进行了示例性说明,需要说明的是,本发明的技术方案同样适用其他支持语音输入的应用。本发明实施例是通过设定手势来开启应用最常用的语音指令接收功能,从而使电子设备用户不必记忆许多语音指令,而仅记住最常用的语音指令即可,这大大方便了用户对电子设备的语音指令输入功能的使用,大大提升了用户体验。
步骤104,对所述语音进行识别,确定要执行的第一操作对象。
对用户输入的语音进行识别,确定出要执行的第一操作对象。当第一应用为手机中的拨号应用时,当识别出用户输入的语音为如张三时,将会查找出张三的电话号码,并自动发起向张三的语音呼叫。当查找出张三的电话号码有两个以上时,默认向第一个电话号码发起呼叫,或者任意选取一个电话号码并发起呼叫。此时,第一操作对象即是联系人或联系人的电话号码。当第一应用为QQ应用时,用户输入好友昵称的语音时,QQ应用识别并查找出该好友昵称对应的QQ号,并发起与该QQ号的文字聊天界面。此时,第一操作对象即是QQ好友或QQ好友的QQ号码。当第一应用为IE应用时,用户输入网站名称如“联想”,IE应用将识别出“联想”的网站地址,并自动发起对“联想”网站的访问。此时,第一操作对象即是网站网址。
步骤105,针对所述第一操作对象,执行所述第一应用对应的第一功能。
针对不同的第一操作,开启第一应用对应的第一功能。例如,当前述的第一操作对象为通讯录中的联系人电话号码时,发起对该联系人电话号码的呼叫。当前述的第一操作对象为QQ中的好友时,建立与该QQ好友的文字聊天界面,用户与该QQ好友直接进行文字聊天。当前述的第一操作对象为网站时,IE应用将发起对该网站的访问。
图2为本发明实施例二的基于操作手势的语音指令输入方法的流程图。如图2所示,本示例的基于操作手势的语音指令输入方法应用于电子设备中,本发明实施例的电子设备包括但不限于:手机、一体式电脑、平板电脑、电子阅读器、个人数字助理等。本发明实施例优选的电子设备为手机。本示例的基于操作手势的语音指令输入方法包括以下步骤:
步骤201,获得用户选择第一应用的手势指令。
本发明实施例中,电子设备具有显示单元,所述显示单元中具有第一显示区域和第二显示区域,所述第一显示区域的面积小于所述第二显示区域的面积;所述第一应用对应的应用接口图标位于所述第一显示区域中;为所述第一应用对应的应用接口图标设置手势指令的输入区域。本发明实施例中,显示单元可以是电子设备的显示屏、投影屏幕等。第一显示区域尤其指电子设备中的DOCK图标区。一般而言,电子设备的DOCK图标区位于显示屏幕的下端,基本呈条状显示。该DOCK图标区中的应用图标一般是电子设备常用的应用图标,如拨号图标、联系人图标、信息图标等;DOCK图标区中的应用图标可以根据用户的需求而设置,但一旦设定,其图标将不支持分屏显示,其他区域的图标无论如何分屏显示变换,该DOCK图标区中的应用图标却是不分屏显示而是固定的。第二显示区域可以是电子设备的Launcher图标区,而Launcher图标区比较大,其中的图标也比较多。由于图标比较多,其一般支持分屏显示,用户可以通过手指滑动等对Launcher区中的图标进行滑动翻屏,从而获取其中欲选择的图标。当然,本发明实施例的第一显示区域并不限定于DOCK图标区,同样地,本发明实施例的第二显示区域并不限定于Launcher图标区。
本发明实施例中,将支持语音输入的应用置放于DOCK图标区中,由于DOCK图标区中的应用不会随用户的翻页操作而翻页等,这样更有利于用户开启DOCK图标区中的应用。
对应地,所述获得用户选择第一应用的手势指令,包括:
在所述输入区域中检测到针对所述第一应用对应的应用接口图标的设定手势时,生成选择第一应用的手势指令。
本步骤中,用户通过电子设备的显示单元的输入区域输入针对应用的手势指令,这些手势一般是设定手势。当电子设备检测到这些设定手势时,将开启应用的特定的语音指令接收功能,即虽然应用支持多种语音指令的输入,但当用户输入特殊的手势后,电子设备识别该手势,并启动应用的常用语音指令输入功能。例如手机中的拨号应用,当用户输入对应的语音时,拨号应用将识别该语音对应的联系人,并默认该语音指令是向该语音指令对应的联系人发起呼叫。例如QQ应用,当用户输入联系人昵称的语音后,QQ应用将识别该语音对应的联系人,并自动发起与该联系人的文字聊天界面。对于浏览器IE应用,当用户输入网站的语音后,IE应用将识别该语音对应的网站,并自动发起对该网站网址的访问。
步骤202,当所述手势指令为激活该第一应用的语音服务手势指令时,根据输入的手势指令,启动所述第一应用的语音接收功能;并为所述第一应用对应的应用接口图标设置手势指令的输入区域。
本发明实施例中,考虑到第一显示区域在实际应用中区域面积较小,其中的每一图标之间的间距也较小,当用户使用手指等进行图标选定操作时,难免会先碰触到第一显示区域中的其他非用户选择的图标,从而造成用户的选择错误,非常不方便使用。如图3所示,本发明实施例为便于用户对DOCK图标区中的应用进行操作,设置了如图3中左图所示的操作区域,该操作区域是以用户手指为圆心,虚线所示的整个扇形的区域。也就是说,当用户需要开启DOCK图标区中的应用时,在该应用对应的输入区域输入相应的手势即可。这样,本发明实施例增加了手势输入的容错机制。
本示例中,输入区域是相对较大的一区域,该区域大小以方便用户输入操作手势为标准。由于输入区域设置的比较大一些,因此该区域一般要超出于第一显示区域之外。通过设置面积较大的输入区域,用户可以在该输入区域中输入针对第一显示区域中的应用的操作手势,与直接在第一显示区域中对应用图标输入操作手势相比,不易对其他图标对应的应用误操作。
本示例中,以第一显示区域为DOCK图标区为例进行说明。当用户需要启动第一显示区域中的某一应用图标时,对该应用图标进行相应操作;电子设备检测到用户输入的操作手势,并在确定该手势为设定手势时,将开启第一应用的特定语音指令接收功能。本发明实施例中,设定手势可以是如当手势为双击手势、或向上或向下的滑动手势、或画圈手势、或画叉手势等。也就是说,第一应用将开启对特定语音指令的接收及识别功能,而对于自身的其他常用的语音指令功能,并不开启。也就是说,第一应用仅识别有限的语音指令,并不会识别自身支持的所有语音指令。这样,在使用过程中,用户也不必记忆该应用的所有语音指令。
步骤203,接收用户输入的针对所述第一应用的语音。
接收用户输入的针对第一应用的语音指令。例如,对于前述的手机中的拨号应用,用户仅需输入联系人名称的语音,拨号应用接收到用户输入的联系人名称后,将识别出该联系人,并会查找出该联系人对应的联系号码,并将默认当前的语音指令是与该联系人建立语音通话,而发起对该联系人对应的联系号码的呼叫;而对于QQ应用,用户仅需输入好友的昵称的语音,QQ应用识别出该好友,并自动发起与该好友的文字聊天界面。对于IE应用,当用户输入网站名称的语音时,IE应用识别出该网站的站名,并自动发起到该网站的访问。本发明实施例仅以拨号应用、QQ应用和IE应用为例进行了示例性说明,需要说明的是,本发明的技术方案同样适用其他支持语音输入的应用。本发明实施例是通过设定手势来开启应用最常用的语音指令接收功能,从而使电子设备用户不必记忆许多语音指令,而仅记住最常用的语音指令即可,这大大方便了用户对电子设备的语音指令输入功能的使用,大大提升了用户体验。
如图3所示,当用户输入“中国移动”的语音指令后,拨号应用将直接识别出“中国移动”的官方号码“10086”,并自动发起对“10086”的呼叫。需要说明的是,“中国移动”可以作为手机中的公共联系人。
步骤204,对所述语音进行识别,确定要执行的第一操作对象。
对用户输入的语音进行识别,确定出要执行的第一操作对象。当第一应用为手机中的拨号应用时,当识别出用户输入的语音为如张三时,将会查找出张三的电话号码,并自动发起向张三的语音呼叫。当查找出张三的电话号码有两个以上时,默认向第一个电话号码发起呼叫,或者任意选取一个电话号码并发起呼叫。此时,第一操作对象即是联系人或联系人的电话号码。当第一应用为QQ应用时,用户输入好友昵称的语音时,QQ应用识别并查找出该好友昵称对应的QQ号,并发起与该QQ号的文字聊天界面。此时,第一操作对象即是QQ好友或QQ好友的QQ号码。当第一应用为IE应用时,用户输入网站名称如“联想”,IE应用将识别出“联想”的网站地址,并自动发起对“联想”网站的访问。此时,第一操作对象即是网站网址。
步骤205,针对所述第一操作对象,执行所述第一应用对应的第一功能。
针对不同的第一操作,开启第一应用对应的第一功能。例如,当前述的第一操作对象为通讯录中的联系人电话号码时,发起对该联系人电话号码的呼叫。当前述的第一操作对象为QQ中的好友时,建立与该QQ好友的文字聊天界面,用户与该QQ好友直接进行文字聊天。当前述的第一操作对象为网站时,IE应用将发起对该网站的访问。
图4为本发明实施例三的基于操作手势的语音指令输入方法的流程图。如图4所示,本示例的基于操作手势的语音指令输入方法应用于电子设备中,本发明实施例的电子设备包括但不限于:手机、一体式电脑、平板电脑、电子阅读器、个人数字助理等。本发明实施例优选的电子设备为手机。本示例的基于操作手势的语音指令输入方法包括以下步骤:
步骤401,获得用户选择第一应用的手势指令。
本步骤中,用户通过电子设备的触摸屏等输入针对应用的手势指令,这些手势一般是设定手势。当电子设备检测到这些设定手势时,将开启应用的特定的语音指令接收功能,即虽然应用支持多种语音指令的输入,但当用户输入特殊的手势后,电子设备识别该手势,并启动应用的常用语音指令输入功能。例如手机中的拨号应用,当用户输入对应的语音时,拨号应用将识别该语音对应的联系人,并默认该语音指令是向该语音指令对应的联系人发起呼叫。例如QQ应用,当用户输入联系人昵称的语音后,QQ应用将识别该语音对应的联系人,并自动发起与该联系人的文字聊天界面。对于浏览器IE应用,当用户输入网站的语音后,IE应用将识别该语音对应的网站,并自动发起对该网站网址的访问。
步骤402,确定所述第一应用不支持语音接收功能时,生成第一指令;执行所述第一指令,关闭所述第一应用,并输出第一信息。
本步骤中,当接收到用户对第一应用的特定手势指令后,判断第一应用是否支持语音接收功能,如果不支持语音接收功能,则直接关闭该第一应用,并输出第一信息。该第一信息为提示用户第一应用不支持语音接收功能的信息。当第一应用支持语音接收功能时,执行步骤403至406的流程。
步骤403,当所述手势指令为激活该第一应用的语音服务手势指令时,根据输入的手势指令,启动所述第一应用的语音接收功能。
当电子设备判断用户输入的手势为设定的设定手势,如当手势为双击手势、或向上或向下的滑动手势、或画圈手势、或画叉手势等时,第一应用将启动自身的特定语音指令接收功能。也就是说,第一应用将开启对特定语音指令的接收及识别功能,而对于自身的其他常用的语音指令功能,并不开启。也就是说,第一应用仅识别有限的语音指令,并不会识别自身支持的所有语音指令。这样,在使用过程中,用户也不必记忆该应用的所有语音指令。
步骤404,接收用户输入的针对所述第一应用的语音。
接收用户输入的针对第一应用的语音指令。例如,对于前述的手机中的拨号应用,用户仅需输入联系人名称的语音,拨号应用接收到用户输入的联系人名称后,将识别出该联系人,并会查找出该联系人对应的联系号码,并将默认当前的语音指令是与该联系人建立语音通话,而发起对该联系人对应的联系号码的呼叫;而对于QQ应用,用户仅需输入好友的昵称的语音,QQ应用识别出该好友,并自动发起与该好友的文字聊天界面。对于IE应用,当用户输入网站名称的语音时,IE应用识别出该网站的站名,并自动发起到该网站的访问。本发明实施例仅以拨号应用、QQ应用和IE应用为例进行了示例性说明,需要说明的是,本发明的技术方案同样适用其他支持语音输入的应用。本发明实施例是通过设定手势来开启应用最常用的语音指令接收功能,从而使电子设备用户不必记忆许多语音指令,而仅记住最常用的语音指令即可,这大大方便了用户对电子设备的语音指令输入功能的使用,大大提升了用户体验。
步骤405,对所述语音进行识别,确定要执行的第一操作对象。
对用户输入的语音进行识别,确定出要执行的第一操作对象。当第一应用为手机中的拨号应用时,当识别出用户输入的语音为如张三时,将会查找出张三的电话号码,并自动发起向张三的语音呼叫。当查找出张三的电话号码有两个以上时,默认向第一个电话号码发起呼叫,或者任意选取一个电话号码并发起呼叫。此时,第一操作对象即是联系人或联系人的电话号码。当第一应用为QQ应用时,用户输入好友昵称的语音时,QQ应用识别并查找出该好友昵称对应的QQ号,并发起与该QQ号的文字聊天界面。此时,第一操作对象即是QQ好友或QQ好友的QQ号码。当第一应用为IE应用时,用户输入网站名称如“联想”,IE应用将识别出“联想”的网站地址,并自动发起对“联想”网站的访问。此时,第一操作对象即是网站网址。
步骤406,针对所述第一操作对象,执行所述第一应用对应的第一功能。
针对不同的第一操作,开启第一应用对应的第一功能。例如,当前述的第一操作对象为通讯录中的联系人电话号码时,发起对该联系人电话号码的呼叫。当前述的第一操作对象为QQ中的好友时,建立与该QQ好友的文字聊天界面,用户与该QQ好友直接进行文字聊天。当前述的第一操作对象为网站时,IE应用将发起对该网站的访问。
图5为本发明实施例四的基于操作手势的语音指令输入方法的流程图。如图5所示,本示例的基于操作手势的语音指令输入方法应用于电子设备中,本发明实施例的电子设备包括但不限于:手机、一体式电脑、平板电脑、电子阅读器、个人数字助理等。本发明实施例优选的电子设备为手机。本示例的基于操作手势的语音指令输入方法包括以下步骤:
步骤501,获得用户选择第一应用的手势指令。
本步骤中,用户通过电子设备的触摸屏等输入针对应用的手势指令,这些手势一般是设定手势。当电子设备检测到这些设定手势时,将开启应用的特定的语音指令接收功能,即虽然应用支持多种语音指令的输入,但当用户输入特殊的手势后,电子设备识别该手势,并启动应用的常用语音指令输入功能。例如手机中的拨号应用,当用户输入对应的语音时,拨号应用将识别该语音对应的联系人,并默认该语音指令是向该语音指令对应的联系人发起呼叫。例如QQ应用,当用户输入联系人昵称的语音后,QQ应用将识别该语音对应的联系人,并自动发起与该联系人的文字聊天界面。对于浏览器IE应用,当用户输入网站的语音后,IE应用将识别该语音对应的网站,并自动发起对该网站网址的访问。
步骤502,当所述手势指令为激活该第一应用的语音服务手势指令时,根据输入的手势指令,启动所述第一应用的语音接收功能。
当电子设备判断用户输入的手势为设定的设定手势,如当手势为双击手势、或向上或向下的滑动手势、或画圈手势、或画叉手势等时,第一应用将启动自身的特定语音指令接收功能。也就是说,第一应用将开启对特定语音指令的接收及识别功能,而对于自身的其他常用的语音指令功能,并不开启。也就是说,第一应用仅识别有限的语音指令,并不会识别自身支持的所有语音指令。这样,在使用过程中,用户也不必记忆该应用的所有语音指令。
步骤503,在设定的第一阈值时段内未接收用户输入的针对所述第一应用的语音时,关闭所述第一应用。
本步骤中,当第一应用启动语音接收功能后,即进入等待用户输入语音指令的状态,当在设定时长内未接收到用户输入的语音指令时,将关闭该第一应用。例如,设定时长为30秒,或1分钟等。本发明实施例中,当第一应用开启语音接收功能后,如果长时间用户不输入语音指令,将会导致该第一应用的语音接收功能长期开启,当用户无意说话时,容易被当作语音指令执行,也会导致电子设备浪费电能。
步骤504,接收用户输入的针对所述第一应用的语音。
接收用户输入的针对第一应用的语音指令。例如,对于前述的手机中的拨号应用,用户仅需输入联系人名称的语音,拨号应用接收到用户输入的联系人名称后,将识别出该联系人,并会查找出该联系人对应的联系号码,并将默认当前的语音指令是与该联系人建立语音通话,而发起对该联系人对应的联系号码的呼叫;而对于QQ应用,用户仅需输入好友的昵称的语音,QQ应用识别出该好友,并自动发起与该好友的文字聊天界面。对于IE应用,当用户输入网站名称的语音时,IE应用识别出该网站的站名,并自动发起到该网站的访问。本发明实施例仅以拨号应用、QQ应用和IE应用为例进行了示例性说明,需要说明的是,本发明的技术方案同样适用其他支持语音输入的应用。本发明实施例是通过设定手势来开启应用最常用的语音指令接收功能,从而使电子设备用户不必记忆许多语音指令,而仅记住最常用的语音指令即可,这大大方便了用户对电子设备的语音指令输入功能的使用,大大提升了用户体验。
步骤505,对所述语音进行识别,确定要执行的第一操作对象。
对用户输入的语音进行识别,确定出要执行的第一操作对象。当第一应用为手机中的拨号应用时,当识别出用户输入的语音为如张三时,将会查找出张三的电话号码,并自动发起向张三的语音呼叫。当查找出张三的电话号码有两个以上时,默认向第一个电话号码发起呼叫,或者任意选取一个电话号码并发起呼叫。此时,第一操作对象即是联系人或联系人的电话号码。当第一应用为QQ应用时,用户输入好友昵称的语音时,QQ应用识别并查找出该好友昵称对应的QQ号,并发起与该QQ号的文字聊天界面。此时,第一操作对象即是QQ好友或QQ好友的QQ号码。当第一应用为IE应用时,用户输入网站名称如“联想”,IE应用将识别出“联想”的网站地址,并自动发起对“联想”网站的访问。此时,第一操作对象即是网站网址。
步骤506,针对所述第一操作对象,执行所述第一应用对应的第一功能。
针对不同的第一操作,开启第一应用对应的第一功能。例如,当前述的第一操作对象为通讯录中的联系人电话号码时,发起对该联系人电话号码的呼叫。当前述的第一操作对象为QQ中的好友时,建立与该QQ好友的文字聊天界面,用户与该QQ好友直接进行文字聊天。当前述的第一操作对象为网站时,IE应用将发起对该网站的访问。
图6为本发明实施例五的电子设备的组成结构示意图,如图6所示,本发明实施例的电子设备包括获得单元60、第一确定单元61、启动单元62、接收单元63、识别单元64和第一执行单元65,其中:
获得单元60,用于获得用户选择第一应用的手势指令;
第一确定单元61,用于判断所述手势指令是否为激活该第一应用的语音服务手势指令,是时触发启动单元62;
启动单元62,用于根据输入的手势指令,启动所述第一应用的语音接收功能;
接收单元63,用于接收用户输入的针对所述第一应用的语音;
识别单元64,用于对所述语音进行识别,确定要执行的第一操作对象;
第一执行单元65,用于针对所述第一操作对象,执行所述第一应用对应的第一功能。
本示例的电子设备包括但不限于:手机、一体式电脑、平板电脑、电子阅读器、个人数字助理等。本发明实施例优选的电子设备为手机。
用户通过电子设备的触摸屏等输入针对应用的手势指令,这些手势一般是设定手势。当电子设备检测到这些设定手势时,将开启应用的特定的语音指令接收功能,即虽然应用支持多种语音指令的输入,但当用户输入特殊的手势后,电子设备识别该手势,并启动应用的常用语音指令输入功能。例如手机中的拨号应用,当用户输入对应的语音时,拨号应用将识别该语音对应的联系人,并默认该语音指令是向该语音指令对应的联系人发起呼叫。例如QQ应用,当用户输入联系人昵称的语音后,QQ应用将识别该语音对应的联系人,并自动发起与该联系人的文字聊天界面。对于浏览器IE应用,当用户输入网站的语音后,IE应用将识别该语音对应的网站,并自动发起对该网站网址的访问。
所述设定手势包括以下手势的至少一种:
双击手势、向上或向下的滑动手势、画圈手势、画叉手势。
所述电子设备还具有显示单元(图6中未示出),所述显示单元中具有第一显示区域和第二显示区域,所述第一显示区域的面积小于所述第二显示区域的面积;所述第一应用对应的应用接口图标位于所述第一显示区域中;为所述第一应用对应的应用接口图标设置手势指令的输入区域;
对应地,所述获得单元60,还用于在所述输入区域中检测到针对所述第一应用对应的应用接口图标的设定手势时,生成选择第一应用的手势指令。
本领域技术人员应当理解,本示例的电子设备中各处理单元的功能,可参照前述的基于操作手势的语音指令输入方法的相关描述而理解,本示例的电子设备中各处理单元,可通过实现本示例所述的功能的模拟电路而实现,也可以通过执行本示例所述的功能的软件在智能设备上的运行而实现。
图7为本发明实施例六的电子设备的组成结构示意图,如图7所示,在图6所示的电子设备的基础上,本示例的电子设备还包括第二确定单元66、生成单元67和第二执行单元68,其中:
第二确定单元66,用于确定所述第一应用是否支持语音接收功能,不支持语音接收功能时,触发生成单元67;
生成单元67,用于生成第一指令;
第二执行单元68,用于执行所述第一指令,关闭所述第一应用,并输出第一信息。
所述电子设备还具有显示单元(图6中未示出),所述显示单元中具有第一显示区域和第二显示区域,所述第一显示区域的面积小于所述第二显示区域的面积;所述第一应用对应的应用接口图标位于所述第一显示区域中;为所述第一应用对应的应用接口图标设置手势指令的输入区域;
对应地,所述获得单元60,还用于在所述输入区域中检测到针对所述第一应用对应的应用接口图标的设定手势时,生成选择第一应用的手势指令。
本示例的电子设备包括但不限于:手机、一体式电脑、平板电脑、电子阅读器、个人数字助理等。本发明实施例优选的电子设备为手机。
所述设定手势包括以下手势的至少一种:
双击手势、向上或向下的滑动手势、画圈手势、画叉手势。
本示例中,所述输入区域中仅包含一个所述第一显示区域中的图标,且覆盖区域超出所述第一显示区域。
本领域技术人员应当理解,本示例的电子设备中各处理单元的功能,可参照前述的基于操作手势的语音指令输入方法的相关描述而理解,本示例的电子设备中各处理单元,可通过实现本示例所述的功能的模拟电路而实现,也可以通过执行本示例所述的功能的软件在智能设备上的运行而实现。
图8为本发明实施例七的电子设备的组成结构示意图,如图8所示,如图8所示,在图6所示的电子设备的基础上,本示例的电子设备还包括:第三确定单元69和关闭单元610,其中:
第三确定单元69,用于确定在设定的第一阈值时段内所述接收单元63是否接收用户输入的针对所述第一应用的语音,未接收到时,触发关闭单元610;
关闭单元610,用于关闭所述第一应用。
所述电子设备还具有显示单元(图6中未示出),所述显示单元中具有第一显示区域和第二显示区域,所述第一显示区域的面积小于所述第二显示区域的面积;所述第一应用对应的应用接口图标位于所述第一显示区域中;为所述第一应用对应的应用接口图标设置手势指令的输入区域;
对应地,所述获得单元60,还用于在所述输入区域中检测到针对所述第一应用对应的应用接口图标的设定手势时,生成选择第一应用的手势指令。
本示例的电子设备包括但不限于:手机、一体式电脑、平板电脑、电子阅读器、个人数字助理等。本发明实施例优选的电子设备为手机。
所述设定手势包括以下手势的至少一种:
双击手势、向上或向下的滑动手势、画圈手势、画叉手势。
本示例中,所述输入区域中仅包含一个所述第一显示区域中的图标,且覆盖区域超出所述第一显示区域。
本领域技术人员应当理解,本示例的电子设备中各处理单元的功能,可参照前述的基于操作手势的语音指令输入方法的相关描述而理解,本示例的电子设备中各处理单元,可通过实现本示例所述的功能的模拟电路而实现,也可以通过执行本示例所述的功能的软件在智能设备上的运行而实现。
本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
在本发明所提供的几个实施例中,应该理解到,所揭露的方法和智能设备,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明实施例上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。

Claims (11)

1.一种基于操作手势的语音指令输入方法,应用于电子设备,其特征在于,所述方法包括:
获得用户选择第一应用的手势指令;
当所述手势指令为激活该第一应用的语音服务手势指令时,根据输入的手势指令,启动所述第一应用的语音接收功能;
接收用户输入的针对所述第一应用的语音;
对所述语音进行识别,确定要执行的第一操作对象;
针对所述第一操作对象,执行所述第一应用对应的第一功能。
2.根据权利要求1所述的方法,其特征在于,所述电子设备具有显示单元,所述显示单元中具有第一显示区域和第二显示区域,所述第一显示区域的面积小于所述第二显示区域的面积;所述第一应用对应的应用接口图标位于所述第一显示区域中;为所述第一应用对应的应用接口图标设置手势指令的输入区域;
对应地,所述获得用户选择第一应用的手势指令,包括:
在所述输入区域中检测到针对所述第一应用对应的应用接口图标的设定手势时,生成选择第一应用的手势指令。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述第一应用不支持语音接收功能时,生成第一指令;
执行所述第一指令,关闭所述第一应用,并输出第一信息。
4.根据权利要求1所述的方法,其特征在于,启动所述第一应用的语音接收功能后,所述方法还包括:
在设定的第一阈值时段内未接收用户输入的针对所述第一应用的语音时,关闭所述第一应用。
5.根据权利要求2所述的方法,其特征在于,所述输入区域中仅包含一个所述第一显示区域中的图标,且覆盖区域超出所述第一显示区域。
6.根据权利要求2所述的方法,其特征在于,所述设定手势包括以下手势的至少一种:
双击手势、向上或向下的滑动手势、画圈手势、画叉手势。
7.一种电子设备,其特征在于,所述电子设备包括:获得单元、第一确定单元、启动单元、接收单元、识别单元和第一执行单元,其中:
获得单元,用于获得用户选择第一应用的手势指令;
第一确定单元,用于判断所述手势指令是否为激活该第一应用的语音服务手势指令,是时触发启动单元;
启动单元,用于根据输入的手势指令,启动所述第一应用的语音接收功能;
接收单元,用于接收用户输入的针对所述第一应用的语音;
识别单元,用于对所述语音进行识别,确定要执行的第一操作对象;
第一执行单元,用于针对所述第一操作对象,执行所述第一应用对应的第一功能。
8.根据权利要求7所述的电子设备,其特征在于,所述电子设备还具有显示单元,所述显示单元中具有第一显示区域和第二显示区域,所述第一显示区域的面积小于所述第二显示区域的面积;所述第一应用对应的应用接口图标位于所述第一显示区域中;为所述第一应用对应的应用接口图标设置手势指令的输入区域;
对应地,所述获得单元,还用于在所述输入区域中检测到针对所述第一应用对应的应用接口图标的设定手势时,生成选择第一应用的手势指令。
9.根据权利要求7所述的电子设备,其特征在于,所述电子设备还包括:第二确定单元、生成单元和第二执行单元,其中:
第二确定单元,用于确定所述第一应用是否支持语音接收功能,不支持语音接收功能时,触发生成单元;
生成单元,用于生成第一指令;
第二执行单元,用于执行所述第一指令,关闭所述第一应用,并输出第一信息。
10.根据权利要求7所述的电子设备,其特征在于,所述电子设备还包括:第三确定单元和关闭单元,其中:
第三确定单元,用于确定在设定的第一阈值时段内所述接收单元是否接收用户输入的针对所述第一应用的语音,未接收到时,触发关闭单元;
关闭单元,用于关闭所述第一应用。
11.根据权利要求8所述的电子设备,其特征在于,所述输入区域中仅包含一个所述第一显示区域中的图标,且覆盖区域超出所述第一显示区域;
所述设定手势包括以下手势的至少一种:
双击手势、向上或向下的滑动手势、画圈手势、画叉手势。
CN201410294979.8A 2014-06-26 2014-06-26 基于操作手势的语音指令输入方法及电子设备 Active CN104111728B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410294979.8A CN104111728B (zh) 2014-06-26 2014-06-26 基于操作手势的语音指令输入方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410294979.8A CN104111728B (zh) 2014-06-26 2014-06-26 基于操作手势的语音指令输入方法及电子设备

Publications (2)

Publication Number Publication Date
CN104111728A true CN104111728A (zh) 2014-10-22
CN104111728B CN104111728B (zh) 2017-09-29

Family

ID=51708550

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410294979.8A Active CN104111728B (zh) 2014-06-26 2014-06-26 基于操作手势的语音指令输入方法及电子设备

Country Status (1)

Country Link
CN (1) CN104111728B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105094640A (zh) * 2015-07-08 2015-11-25 广东欧珀移动通信有限公司 一种终端操作方法及用户终端
CN105929931A (zh) * 2015-02-27 2016-09-07 联想(新加坡)私人有限公司 针对关联的讲话人激活语音处理的方法、设备及产品
CN106339067A (zh) * 2015-07-06 2017-01-18 联想(北京)有限公司 一种控制方法及电子设备
CN106959746A (zh) * 2016-01-12 2017-07-18 百度在线网络技术(北京)有限公司 语音数据的处理方法及装置
CN107807765A (zh) * 2016-09-08 2018-03-16 北京京东尚科信息技术有限公司 一种实现页面交互的方法和装置
CN109949812A (zh) * 2019-04-26 2019-06-28 百度在线网络技术(北京)有限公司 一种语音交互方法、装置、设备及存储介质
CN109992095A (zh) * 2017-12-29 2019-07-09 青岛有屋科技有限公司 一种智能厨房的语音和手势结合的控制方法及控制装置
WO2020108385A1 (zh) * 2018-11-29 2020-06-04 华为技术有限公司 语音交互方法和用户设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102467336A (zh) * 2010-11-19 2012-05-23 联想(北京)有限公司 电子设备及其对象选择方法
US20140033045A1 (en) * 2012-07-24 2014-01-30 Global Quality Corp. Gestures coupled with voice as input method
CN103634442A (zh) * 2012-08-27 2014-03-12 百度在线网络技术(北京)有限公司 基于三维手势和语音的自动拨号方法及移动终端
US8744645B1 (en) * 2013-02-26 2014-06-03 Honda Motor Co., Ltd. System and method for incorporating gesture and voice recognition into a single system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102467336A (zh) * 2010-11-19 2012-05-23 联想(北京)有限公司 电子设备及其对象选择方法
US20140033045A1 (en) * 2012-07-24 2014-01-30 Global Quality Corp. Gestures coupled with voice as input method
CN103634442A (zh) * 2012-08-27 2014-03-12 百度在线网络技术(北京)有限公司 基于三维手势和语音的自动拨号方法及移动终端
US8744645B1 (en) * 2013-02-26 2014-06-03 Honda Motor Co., Ltd. System and method for incorporating gesture and voice recognition into a single system

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105929931A (zh) * 2015-02-27 2016-09-07 联想(新加坡)私人有限公司 针对关联的讲话人激活语音处理的方法、设备及产品
CN106339067A (zh) * 2015-07-06 2017-01-18 联想(北京)有限公司 一种控制方法及电子设备
CN105094640A (zh) * 2015-07-08 2015-11-25 广东欧珀移动通信有限公司 一种终端操作方法及用户终端
CN105094640B (zh) * 2015-07-08 2018-09-04 广东欧珀移动通信有限公司 一种终端操作方法及用户终端
CN106959746A (zh) * 2016-01-12 2017-07-18 百度在线网络技术(北京)有限公司 语音数据的处理方法及装置
CN107807765A (zh) * 2016-09-08 2018-03-16 北京京东尚科信息技术有限公司 一种实现页面交互的方法和装置
CN109992095A (zh) * 2017-12-29 2019-07-09 青岛有屋科技有限公司 一种智能厨房的语音和手势结合的控制方法及控制装置
WO2020108385A1 (zh) * 2018-11-29 2020-06-04 华为技术有限公司 语音交互方法和用户设备
CN111240561A (zh) * 2018-11-29 2020-06-05 华为技术有限公司 语音交互方法和用户设备
CN109949812A (zh) * 2019-04-26 2019-06-28 百度在线网络技术(北京)有限公司 一种语音交互方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN104111728B (zh) 2017-09-29

Similar Documents

Publication Publication Date Title
CN104111728A (zh) 基于操作手势的语音指令输入方法及电子设备
CN102999334B (zh) 一种基于Android平台的快捷方式实现方法、装置及终端
CN103456296A (zh) 提供语音识别功能的方法及其电子设备
CN103841268A (zh) 信息处理方法和信息处理装置
CN112286485B (zh) 通过语音控制应用的方法、装置、电子设备与存储介质
WO2013097650A1 (zh) 一种应用程序启动方法、系统及终端设备
CN102763159A (zh) 话音输入的处理
CN103915095A (zh) 语音识别的方法、交互设备、服务器和系统
CN104505108B (zh) 一种信息定位方法及终端
CN102857629A (zh) 一种手机桌面搜索框的呼出方法
CN105446489B (zh) 语音双模控制方法、装置及用户终端
CN111490927B (zh) 一种显示消息的方法、装置及设备
CN104765522A (zh) 聊天窗口的展示控制方法及系统
CN103648048A (zh) 智能电视视频资源搜索方法及系统
CN104765845A (zh) 一种终端的分屏显示方法及装置
CN106095248A (zh) 一种基于移动终端的应用程序查找启动方法及系统
CN103116483A (zh) 一种调用微博的方法、装置及终端
CN105335045A (zh) 变更桌面图标的方法及系统
CN113311968A (zh) 应用程序关联方法及装置
CN106959746A (zh) 语音数据的处理方法及装置
CN107220377B (zh) 搜索方法、电子设备及计算机存储介质
CN111814492A (zh) 一种翻译方法、终端及计算机存储介质
KR101160543B1 (ko) 키워드를 이용한 사용자 인터페이스 제공 방법 및 단말기
CN114489424A (zh) 桌面组件的控制方法及装置
CN107861706A (zh) 一种语音指令的响应方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant