CN108401066B - 在智能终端中进行语音控制的方法、装置和智能终端 - Google Patents
在智能终端中进行语音控制的方法、装置和智能终端 Download PDFInfo
- Publication number
- CN108401066B CN108401066B CN201710069832.2A CN201710069832A CN108401066B CN 108401066 B CN108401066 B CN 108401066B CN 201710069832 A CN201710069832 A CN 201710069832A CN 108401066 B CN108401066 B CN 108401066B
- Authority
- CN
- China
- Prior art keywords
- voice
- application
- voice data
- received
- callback
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72466—User interfaces specially adapted for cordless or mobile telephones with selection means, e.g. keys, having functions defined by the mode or the status of the device
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Abstract
本发明公开了在智能终端中进行语音控制的方法、装置和智能终端,其中方法包括:响应于智能终端的实体语音输入键的触发事件,调用智能终端的语音获取设备获取语音数据;判断是否存在需要回调所述语音数据的待接收应用;若不存在,删除所述语音数据;若存在,将所述语音数据发送给所述待接收应用,以使所述待接收应用根据所述语音数据实现相应的功能。该技术方案不同于现有技术中由应用主动调用麦克风等语音设备获取语音数据,而是由智能终端的操作系统对硬件事件做出反馈,将获取到的语音数据返回给需要的应用,这样就提供了一个便捷的语音输入入口,并且实现了操作系统对语音数据的统一处理。
Description
技术领域
本发明涉及智能硬件领域,具体涉及在智能终端中进行语音控制的方法、装置和智能终端。
背景技术
如今,智能终端中的语音识别模块已经有多家厂商深耕多年,对语音的文字识别准确率已经相当惊人。但目前应用仍旧是从操作系统获取麦克风输入音频,然后调用语音识别模块,缺少对语音输入更智能化的响应和调度。当今的移动端应用虽然很多已经具备语音识别功能,但是应用由于高度依赖触屏操作,还不能独立地语音人机交互。
例如当前智能手机中的自驾车导航软件,虽然可以利用语音输入填入目的地信息,仍旧是触屏输入的一个辅助项。当路线规划完毕持续导航中,一段时间没有触屏之后,屏幕会自动节能关闭,此时导航软件仍可以持续语音播报,但此时由于屏幕已经节能关闭,用户只能单方向接收语音播报,无法在不唤醒触屏的情况下和导航应用交互,这时即使有一句导航信息没有听清也无法操作,驾驶员依赖手机导航软件在看手机屏幕或者操作导航软件中出现行车事故的案例也已经屡见不鲜。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的在智能终端中进行语音控制的方法、装置和智能终端。
依据本发明的一个方面,提供了一种在智能终端中进行语音控制的方法,包括:
响应于智能终端的实体语音输入键的触发事件,调用智能终端的语音获取设备获取语音数据;
判断是否存在需要回调所述语音数据的待接收应用;
若不存在,删除所述语音数据;
若存在,将所述语音数据发送给所述待接收应用,以使所述待接收应用根据所述语音数据实现相应的功能。
可选地,该方法还包括:
判断待接收的应用是否需要对所述语音数据进行语音识别;
若不需要,则将所述语音数据直接发送给所述待接收应用;
若需要,则对所述语音数据进行语音识别,得到所述语音数据对应的文本数据,将所述语音数据对应的文本数据发送给所述待接收应用,或者,将所述语音数据对应的文本数据以及所述语音数据发送给所述待接收应用。
可选地,所述对所述语音数据进行语音识别包括:
调用所述智能终端中预设的语音识别库,对所述语音数据进行语音识别。
可选地,判断是否存在需要回调所述语音数据的待接收应用包括:
获取语音回调应用列表,判断所述语音回调应用列表中是否存在已注册语音回调的一个或多个应用。
可选地,当所述语音回调应用列表中存在已注册语音回调的多个应用时,将所述语音回调应用列表中注册时间最晚的应用作为待接收应用,或者,将所述列表中优先级最高的应用作为待接收应用。
可选地,所述判断待接收的应用是否需要对所述语音数据进行语音识别包括:
根据应用在所述语音回调应用列表中注册的语音回调接口类型,判断该应用是否需要对所述语音数据进行语音识别。
可选地,所述语音回调接口类型包括:
语音输入接口,和/或语音识别接口。
可选地,当所述语音回调应用列表中存在已注册语音回调的多个应用,且已确定的待接收应用仅注册了语音识别接口时,该方法还包括:
判断所述待接收应用是否成功响应于所述语音数据对应的文本数据实现了相应的功能;
若未成功,则从所述语音回调应用列表中确定另一待接收应用,根据该应用已注册的语音回调接口类型,将所述语音数据对应的文本数据和/或所述语音数据发送给该应用。
可选地,若所述语音回调应用列表中全部应用均仅注册了语音识别接口,且均未成功响应于所述语音数据对应的文本数据实现了相应的功能时,删除所述语音数据和所述语音数据对应的文本数据,并返回指定类型的提示信息。
可选地,该方法还包括:
接收智能终端上的应用在启动时发送的语音回调注册请求,根据所述语音回调注册请求将相应的应用在所述语音回调应用列表中进行注册。
依据本发明的另一方面,提供了一种在智能终端中进行语音控制的装置,可选地,包括:
语音数据获取单元,适于响应于智能终端的实体语音输入键的触发事件,调用智能终端的语音获取设备获取语音数据;
语音数据处理单元,适于判断是否存在需要回调所述语音数据的待接收应用,若不存在,删除所述语音数据;若存在,将所述语音数据发送给所述待接收应用,以使所述待接收应用根据所述语音数据实现相应的功能。
可选地,所述语音数据处理单元,还适于判断待接收的应用是否需要对所述语音数据进行语音识别,若不需要,则将所述语音数据直接发送给所述待接收应用;若需要,则对所述语音数据进行语音识别,得到所述语音数据对应的文本数据,将所述语音数据对应的文本数据发送给所述待接收应用,或者,将所述语音数据对应的文本数据以及所述语音数据发送给所述待接收应用。
可选地,所述语音数据处理单元,适于调用所述智能终端中预设的语音识别库,对所述语音数据进行语音识别。
可选地,所述语音数据处理单元,适于获取语音回调应用列表,判断所述语音回调应用列表中是否存在已注册语音回调的一个或多个应用。
可选地,所述语音数据处理单元,适于在所述语音回调应用列表中存在已注册语音回调的多个应用时,将所述语音回调应用列表中注册时间最晚的应用作为待接收应用,或者,将所述列表中优先级最高的应用作为待接收应用。
可选地,所述音数据处理单元,适于根据应用在所述语音回调应用列表中注册的语音回调接口类型,判断该应用是否需要对所述语音数据进行语音识别。
可选地,所述语音回调接口类型包括:
语音输入接口,和/或语音识别接口。
可选地,所述语音数据处理单元,适于在所述语音回调应用列表中存在已注册语音回调的多个应用,且已确定的待接收应用仅注册了语音识别接口时,判断所述待接收应用是否成功响应于所述语音数据对应的文本数据实现了相应的功能;若未成功,则从所述语音回调应用列表中确定另一待接收应用,根据该应用已注册的语音回调接口类型,将所述语音数据对应的文本数据和/或所述语音数据发送给该应用。
可选地,所述语音数据处理单元,适于在所述语音回调应用列表中全部应用均仅注册了语音识别接口,且均未成功响应于所述语音数据对应的文本数据实现了相应的功能时,删除所述语音数据和所述语音数据对应的文本数据,并返回指定类型的提示信息。
可选地,该装置还包括:
语音回调注册单元,适于接收智能终端上的应用在启动时发送的语音回调注册请求,根据所述语音回调注册请求将相应的应用在所述语音回调应用列表中进行注册。
依据本发明的又一方面,提供了一种智能终端,其中,该智能终端包括:实体语音输入键和如上述任一项所述的在智能终端中进行语音控制的装置。
由上述可知,本发明的技术方案,在用户触发了实体语音输入键后,智能终端的操作系统主动获取调用智能终端的语音获取设备获取语音数据,并判断是否有需要回调语音数据的待接收应用,如果没有,说明用户进行了误操作,删除获取到的语音数据;如果有,那么就将语音数据发送给待接收应用,以使待接收应用根据语音数据实现相应的功能。该技术方案不同于现有技术中由应用主动调用麦克风等语音设备获取语音数据,而是由操作系统对硬件事件做出反馈,将获取到的语音数据返回给需要的应用,这样就提供了一个便捷的语音输入入口,并且实现了操作系统对语音数据的统一处理。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种在智能终端中进行语音控制的方法的流程示意图;
图2示出了根据本发明一个实施例的一种在智能终端中进行语音控制的装置的结构示意图;
图3示出了根据本发明一个实施例的一种智能终端的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的一种在智能终端中进行语音控制的方法的流程示意图,如图1所示,该方法包括:
步骤S110,响应于智能终端的实体语音输入键的触发事件,调用智能终端的语音获取设备获取语音数据。
其中,实体语音输入键可以是智能终端上一个独立的物理按键,这样用户不需要点亮屏幕进行复杂的操作,该键可以是松开自动弹起的普通按键,也可以是触摸感应按键(防止携带中误碰),也可以复用指纹解锁键。用户按下键的间隙说话随后抬起按键即完成一次语音输入。硬件事件一般而言是系统底层事件,在该事件触发后,智能终端(如手机)的操作系统主动调取麦克风等智能终端内置或外置的语音获取设备来获取用户输入的语音数据。
步骤S120,判断是否存在需要回调语音数据的待接收应用。
步骤S130,若不存在,删除语音数据。例如用户在未开启任何应用时触发语音输入键,那么获取到的语音数据并没有任一个应用有需求使用,此时可以删除数据释放资源。
步骤S140,若存在,将语音数据发送给待接收应用,以使待接收应用根据语音数据实现相应的功能。
可见,图1所示的方法,在用户触发了实体语音输入键后,智能终端的操作系统主动获取调用智能终端的语音获取设备获取语音数据,并判断是否有需要回调语音数据的待接收应用,如果没有,说明用户进行了误操作,删除获取到的语音数据;如果有,那么就将语音数据发送给待接收应用,以使待接收应用根据语音数据实现相应的功能。该技术方案不同于现有技术中由应用主动调用麦克风等语音设备获取语音数据,而是由智能终端的操作系统对硬件事件做出反馈,将获取到的语音数据返回给需要的应用,这样就提供了一个便捷的语音输入入口,并且实现了操作系统对语音数据的统一处理。
例如,用户使用即时通信应用时,可以在打开和朋友的聊天界面后,关闭屏幕,通过语音输入键来发送语音消息。对运动、导航类软件,用户在不方便查看屏幕的情形下,可以按对讲按钮发语音指令实现人机交互。这样不仅节约了智能终端的电量(智能终端中屏幕耗电具有较大的占比),还极大地提高了用户体验。
在本发明的一个实施例中,图1所示的方法还包括:判断待接收的应用是否需要对语音数据进行语音识别;若不需要,则将语音数据直接发送给待接收应用;若需要,则对语音数据进行语音识别,得到语音数据对应的文本数据,将语音数据对应的文本数据发送给待接收应用,或者,将语音数据对应的文本数据以及语音数据发送给待接收应用。
举例而言,用户使用即时通信应用时可以直接将语音发送给朋友,而使用导航应用时,是希望导航应用可以根据语音转换成的文本来执行相应的指令。因此在本实施例中,需要判断待接收的应用是否需要对语音数据进行语音识别,如果需要,那么就对语音数据进行语音识别,将其转换为相应的文本数据,并根据应用的需求,选择将语音数据和文本数据一并发给应用,或者仅将得到的文本数据发给应用。例如即时通信应用可以将语音发送给对方,也可以将文本发送给对方,还可以一并发送给对方来确保不会出现误解。
在本发明的一个实施例中,上述方法中,对语音数据进行语音识别包括:调用智能终端中预设的语音识别库,对语音数据进行语音识别。
目前语音识别技术已日益完善,本实施例选择了在智能终端中预设一个语音识别库,这样所有语音识别操作都可以在智能终端的本地完成。当然在其他实施例中,也可以将语音数据发送至指定的服务器来进行语音识别。
在本发明的一个实施例中,上述方法中,判断是否存在需要回调语音数据的待接收应用包括:获取语音回调应用列表,判断语音回调应用列表中是否存在已注册语音回调的一个或多个应用。
也就是说,在语音回调应用列表中保存有当前希望获取语音的应用。现有技术中,是由应用主动调用麦克风等语音获取设备的,而在本实施例中应用不再有主动调用麦克风的权限,如果其在功能上有获取语音数据的需求,可以选择注册系统提供的语音回调接口。因此在本发明的一个实施例中,该方法还包括:接收智能终端上的应用在启动时发送的语音回调注册请求,根据语音回调注册请求将相应的应用在语音回调应用列表中进行注册。
需要说明的是,由于现有技术中应用时主动调用麦克风等语音获取设备,因而目前智能终端的系统中并不存在本实施例中的语音回调接口。
如果用户启动了A、B、C、D、E五个应用,这五个应用在功能上都有利用语音数据的需求,因此都在语音回调列表中进行了注册。而绝大多数情况下,用户输入语音数据都是为了实现某个特定应用的功能,那么如何判断用户希望语音控制的是哪个应用是需要解决的问题。因此在本发明的一个实施例中,上述方法中,当语音回调应用列表中存在已注册语音回调的多个应用时,将语音回调应用列表中注册时间最晚的应用作为待接收应用,或者,将列表中优先级最高的应用作为待接收应用。
语音回调应用列表中注册时间最晚的应用也就是列表中的应用中最后一个启动的应用。而用户最后启动的应用也往往是当前激活的应用,那么在用户输入语音时,该应用也是最有可能是用户希望进行语音控制的应用。在另一种情况下,可以对语音回调应用列表中的应用进行优先级排序,具体地可以根据应用的预设或用户的手动修改。
在本发明的一个实施例中,上述方法中,判断待接收的应用是否需要对语音数据进行语音识别包括:根据应用在语音回调应用列表中注册的语音回调接口类型,判断该应用是否需要对语音数据进行语音识别。其中,语音回调接口类型包括:语音输入接口,和/或语音识别接口。
例如,应用A仅注册了语音输入接口,那么该应用所需的仅是语音数据;应用B仅注册了语音识别接口,那么该应用所需的仅是语音数据对应的文本数据;应用C既注册了语音输入接口,也注册了语音识别接口,那么该应用既需要语音数据,也需要语音数据对应的文本数据;应用B未进行语音输入接口或语音识别接口的注册,那么它就不会存在于语音回调应用列表中。
在本发明的一个实施例中,上述方法中,当语音回调应用列表中存在已注册语音回调的多个应用,且已确定的待接收应用仅注册了语音识别接口时,该方法还包括:判断待接收应用是否成功响应于语音数据对应的文本数据实现了相应的功能;若未成功,则从语音回调应用列表中确定另一待接收应用,根据该应用已注册的语音回调接口类型,将语音数据对应的文本数据和/或语音数据发送给该应用。
前述实施例中确定待接收应用的方法可以应对大多数情况,但是也存在其他需求,例如,用户先启动了即时通信应用,和朋友小王聊了一会,之后启动了地图导航应用。那么根据前述实施例中提供的方法将待接收应用确定为地图导航应用。此时用户突然想和小王再说一句话,而输入的语音数据对应的文本数据已被发送给地图导航应用,语音数据就不再发送给即时通信应用。而地图导航应用并不能根据文本数据实现地图导航的功能。在本实施例中,由于相应的功能未实现成功,因此会从语音回调应用列表中确定另一待接收应用。假设语音回调应用列表中仅有即时通信应用和地图导航应用,那么即时通信应用就会接收到语音数据,从而发送给小王,实现了用户的需求。
在本发明的一个实施例中,上述方法中,若语音回调应用列表中全部应用均仅注册了语音识别接口,且均未成功响应于语音数据对应的文本数据实现了相应的功能时,删除语音数据和语音数据对应的文本数据,并返回指定类型的提示信息。
例如,用户由于口误说错了话,导致该语音数据对应的文本数据不能表达用户的原意,也就不能正确实现语音回调应用列表中全部应用的功能,那么就可以删除数据释放资源,并返回相应的提示,例如提示用户重新输入语音。
图2示出了根据本发明一个实施例的一种在智能终端中进行语音控制的装置的结构示意图,如图2所示,在智能终端中进行语音控制的装置200包括:
语音数据获取单元210,适于响应于智能终端的实体语音输入键的触发事件,调用智能终端的语音获取设备获取语音数据;
语音数据处理单元220,适于判断是否存在需要回调语音数据的待接收应用,若不存在,删除语音数据;若存在,将语音数据发送给待接收应用,以使待接收应用根据语音数据实现相应的功能。
可见,图2所示的装置,在用户触发了实体语音输入键后,智能终端的操作系统主动获取调用智能终端的语音获取设备获取语音数据,并判断是否有需要回调语音数据的待接收应用,如果没有,说明用户进行了误操作,删除获取到的语音数据;如果有,那么就将语音数据发送给待接收应用,以使待接收应用根据语音数据实现相应的功能。该技术方案不同于现有技术中由应用主动调用麦克风等语音设备获取语音数据,而是由智能终端的操作系统对硬件事件做出反馈,将获取到的语音数据返回给需要的应用,这样就提供了一个便捷的语音输入入口,并且实现了操作系统对语音数据的统一处理。
在本发明的一个实施例中,上述装置中,语音数据处理单元220,还适于判断待接收的应用是否需要对语音数据进行语音识别,若不需要,则将语音数据直接发送给待接收应用;若需要,则对语音数据进行语音识别,得到语音数据对应的文本数据,将语音数据对应的文本数据发送给待接收应用,或者,将语音数据对应的文本数据以及语音数据发送给待接收应用。
在本发明的一个实施例中,上述装置中,语音数据处理单元220,适于调用智能终端中预设的语音识别库,对语音数据进行语音识别。
在本发明的一个实施例中,上述装置中,语音数据处理单元220,适于获取语音回调应用列表,判断语音回调应用列表中是否存在已注册语音回调的一个或多个应用。
在本发明的一个实施例中,上述装置中,语音数据处理单元220,适于在语音回调应用列表中存在已注册语音回调的多个应用时,将语音回调应用列表中注册时间最晚的应用作为待接收应用,或者,将列表中优先级最高的应用作为待接收应用。
在本发明的一个实施例中,上述装置中,音数据处理单元220,适于根据应用在语音回调应用列表中注册的语音回调接口类型,判断该应用是否需要对语音数据进行语音识别。
在本发明的一个实施例中,上述装置中,语音回调接口类型包括:语音输入接口,和/或语音识别接口。
在本发明的一个实施例中,上述装置中,语音数据处理单元220,适于在语音回调应用列表中存在已注册语音回调的多个应用,且已确定的待接收应用仅注册了语音识别接口时,判断待接收应用是否成功响应于语音数据对应的文本数据实现了相应的功能;若未成功,则从语音回调应用列表中确定另一待接收应用,根据该应用已注册的语音回调接口类型,将语音数据对应的文本数据和/或语音数据发送给该应用。
在本发明的一个实施例中,上述装置中,语音数据处理单元220,适于在语音回调应用列表中全部应用均仅注册了语音识别接口,且均未成功响应于语音数据对应的文本数据实现了相应的功能时,删除语音数据和语音数据对应的文本数据,并返回指定类型的提示信息。
在本发明的一个实施例中,上述装置还包括:语音回调注册单元,适于接收智能终端上的应用在启动时发送的语音回调注册请求,根据语音回调注册请求将相应的应用在语音回调应用列表中进行注册。
需要说明的是,上述各装置实施例的具体实施方式与前述对应方法实施例的具体实施方式相同,在此不再赘述。
图3示出了根据本发明一个实施例的一种智能终端的结构示意图,如图3所示,智能终端300包括:
实体语音输入键310和如上述任一实施例所述的在智能终端中进行语音控制的装置200。
其中,实体语音输入键310可以是智能终端300上一个独立的物理按键,这样用户不需要点亮屏幕进行复杂的操作,该键可以是松开自动弹起的普通按键,也可以是触摸感应按键(防止携带中误碰),也可以复用指纹解锁键。用户按下键的间隙说话随后抬起按键即完成一次语音输入。
综上所述,本发明的技术方案,在用户触发了实体语音输入键后,智能终端的操作系统主动获取调用智能终端的语音获取设备获取语音数据,并判断是否有需要回调语音数据的待接收应用,如果没有,说明用户进行了误操作,删除获取到的语音数据;如果有,那么就将语音数据发送给待接收应用,以使待接收应用根据语音数据实现相应的功能。该技术方案不同于现有技术中由应用主动调用麦克风等语音设备获取语音数据,而是由智能终端的操作系统对硬件事件做出反馈,将获取到的语音数据返回给需要的应用,这样就提供了一个便捷的语音输入入口,并且实现了操作系统对语音数据的统一处理。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的在智能终端中进行语音控制的装置和智能终端中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明的实施例公开了A1、一种在智能终端中进行语音控制的方法,其中,该方法包括:
响应于智能终端的实体语音输入键的触发事件,调用智能终端的语音获取设备获取语音数据;
判断是否存在需要回调所述语音数据的待接收应用;
若不存在,删除所述语音数据;
若存在,将所述语音数据发送给所述待接收应用,以使所述待接收应用根据所述语音数据实现相应的功能。
A2、如A1所述的方法,其中,该方法还包括:
判断待接收的应用是否需要对所述语音数据进行语音识别;
若不需要,则将所述语音数据直接发送给所述待接收应用;
若需要,则对所述语音数据进行语音识别,得到所述语音数据对应的文本数据,将所述语音数据对应的文本数据发送给所述待接收应用,或者,将所述语音数据对应的文本数据以及所述语音数据发送给所述待接收应用。
A3、如A2所述的方法,其中,所述对所述语音数据进行语音识别包括:
调用所述智能终端中预设的语音识别库,对所述语音数据进行语音识别。
A4、如A2所述的方法,其中,判断是否存在需要回调所述语音数据的待接收应用包括:
获取语音回调应用列表,判断所述语音回调应用列表中是否存在已注册语音回调的一个或多个应用。
A5、如A4所述的方法,其中,当所述语音回调应用列表中存在已注册语音回调的多个应用时,将所述语音回调应用列表中注册时间最晚的应用作为待接收应用,或者,将所述列表中优先级最高的应用作为待接收应用。
A6、如A4所述的方法,其中,所述判断待接收的应用是否需要对所述语音数据进行语音识别包括:
根据应用在所述语音回调应用列表中注册的语音回调接口类型,判断该应用是否需要对所述语音数据进行语音识别。
A7、如A6所述的方法,其中,所述语音回调接口类型包括:
语音输入接口,和/或语音识别接口。
A8、如A7所述的方法,其中,当所述语音回调应用列表中存在已注册语音回调的多个应用,且已确定的待接收应用仅注册了语音识别接口时,该方法还包括:
判断所述待接收应用是否成功响应于所述语音数据对应的文本数据实现了相应的功能;
若未成功,则从所述语音回调应用列表中确定另一待接收应用,根据该应用已注册的语音回调接口类型,将所述语音数据对应的文本数据和/或所述语音数据发送给该应用。
A9、如A8所述的方法,其中,若所述语音回调应用列表中全部应用均仅注册了语音识别接口,且均未成功响应于所述语音数据对应的文本数据实现了相应的功能时,删除所述语音数据和所述语音数据对应的文本数据,并返回指定类型的提示信息。
A10、如A4-A9中任一项所述的方法,其中,该方法还包括:
接收智能终端上的应用在启动时发送的语音回调注册请求,根据所述语音回调注册请求将相应的应用在所述语音回调应用列表中进行注册。
本发明的实施例还公开了B11、一种在智能终端中进行语音控制的装置,其中,该装置包括:
语音数据获取单元,适于响应于智能终端的实体语音输入键的触发事件,调用智能终端的语音获取设备获取语音数据;
语音数据处理单元,适于判断是否存在需要回调所述语音数据的待接收应用,若不存在,删除所述语音数据;若存在,将所述语音数据发送给所述待接收应用,以使所述待接收应用根据所述语音数据实现相应的功能。
B12、如B11所述的装置,其中,
所述语音数据处理单元,还适于判断待接收的应用是否需要对所述语音数据进行语音识别,若不需要,则将所述语音数据直接发送给所述待接收应用;若需要,则对所述语音数据进行语音识别,得到所述语音数据对应的文本数据,将所述语音数据对应的文本数据发送给所述待接收应用,或者,将所述语音数据对应的文本数据以及所述语音数据发送给所述待接收应用。
B13、如B12所述的装置,其中,
所述语音数据处理单元,适于调用所述智能终端中预设的语音识别库,对所述语音数据进行语音识别。
B14、如B12所述的装置,其中,
所述语音数据处理单元,适于获取语音回调应用列表,判断所述语音回调应用列表中是否存在已注册语音回调的一个或多个应用。
B15、如B14所述的装置,其中,
所述语音数据处理单元,适于在所述语音回调应用列表中存在已注册语音回调的多个应用时,将所述语音回调应用列表中注册时间最晚的应用作为待接收应用,或者,将所述列表中优先级最高的应用作为待接收应用。
B16、如B14所述的装置,其中,
所述音数据处理单元,适于根据应用在所述语音回调应用列表中注册的语音回调接口类型,判断该应用是否需要对所述语音数据进行语音识别。
B17、如B16所述的装置,其中,所述语音回调接口类型包括:
语音输入接口,和/或语音识别接口。
B18、如B17所述的装置,其中,
所述语音数据处理单元,适于在所述语音回调应用列表中存在已注册语音回调的多个应用,且已确定的待接收应用仅注册了语音识别接口时,判断所述待接收应用是否成功响应于所述语音数据对应的文本数据实现了相应的功能;若未成功,则从所述语音回调应用列表中确定另一待接收应用,根据该应用已注册的语音回调接口类型,将所述语音数据对应的文本数据和/或所述语音数据发送给该应用。
B19、如B18所述的装置,
所述语音数据处理单元,适于在所述语音回调应用列表中全部应用均仅注册了语音识别接口,且均未成功响应于所述语音数据对应的文本数据实现了相应的功能时,删除所述语音数据和所述语音数据对应的文本数据,并返回指定类型的提示信息。
B20、如B14-B19中任一项所述的装置,其中,该装置还包括:
语音回调注册单元,适于接收智能终端上的应用在启动时发送的语音回调注册请求,根据所述语音回调注册请求将相应的应用在所述语音回调应用列表中进行注册。
本发明的实施例还公开了C21、一种智能终端,其中,该智能终端包括:
实体语音输入键和如B11-B20中任一项所述的在智能终端中进行语音控制的装置。
Claims (15)
1.一种在智能终端中进行语音控制的方法,其中,该方法包括:
响应于智能终端的实体语音输入键的触发事件,调用智能终端的语音获取设备获取语音数据;
判断是否存在需要回调所述语音数据的待接收应用;
若不存在,删除所述语音数据;
若存在,将所述语音数据发送给所述待接收应用,以使所述待接收应用根据所述语音数据实现相应的功能;
其中,该方法还包括:
判断待接收的应用是否需要对所述语音数据进行语音识别;
若不需要,则将所述语音数据直接发送给所述待接收应用;
若需要,则对所述语音数据进行语音识别,得到所述语音数据对应的文本数据,将所述语音数据对应的文本数据发送给所述待接收应用,或者,将所述语音数据对应的文本数据以及所述语音数据发送给所述待接收应用;
其中,判断是否存在需要回调所述语音数据的待接收应用包括:
获取语音回调应用列表,判断所述语音回调应用列表中是否存在已注册语音回调的一个或多个应用;
其中,当所述语音回调应用列表中存在已注册语音回调的多个应用时,将所述语音回调应用列表中注册时间最晚的应用作为待接收应用,或者,将所述列表中优先级最高的应用作为待接收应用。
2.如权利要求1所述的方法,其中,所述对所述语音数据进行语音识别包括:
调用所述智能终端中预设的语音识别库,对所述语音数据进行语音识别。
3.如权利要求1所述的方法,其中,所述判断待接收的应用是否需要对所述语音数据进行语音识别包括:
根据应用在所述语音回调应用列表中注册的语音回调接口类型,判断该应用是否需要对所述语音数据进行语音识别。
4.如权利要求3所述的方法,其中,所述语音回调接口类型包括:
语音输入接口,和/或语音识别接口。
5.如权利要求4所述的方法,其中,当所述语音回调应用列表中存在已注册语音回调的多个应用,且已确定的待接收应用仅注册了语音识别接口时,该方法还包括:
判断所述待接收应用是否成功响应于所述语音数据对应的文本数据实现了相应的功能;
若未成功,则从所述语音回调应用列表中确定另一待接收应用,根据该应用已注册的语音回调接口类型,将所述语音数据对应的文本数据和/或所述语音数据发送给该应用。
6.如权利要求5所述的方法,其中,若所述语音回调应用列表中全部应用均仅注册了语音识别接口,且均未成功响应于所述语音数据对应的文本数据实现了相应的功能时,删除所述语音数据和所述语音数据对应的文本数据,并返回指定类型的提示信息。
7.如权利要求1-6中任一项所述的方法,其中,该方法还包括:
接收智能终端上的应用在启动时发送的语音回调注册请求,根据所述语音回调注册请求将相应的应用在所述语音回调应用列表中进行注册。
8.一种在智能终端中进行语音控制的装置,其中,该装置包括:
语音数据获取单元,适于响应于智能终端的实体语音输入键的触发事件,调用智能终端的语音获取设备获取语音数据;
语音数据处理单元,适于判断是否存在需要回调所述语音数据的待接收应用,若不存在,删除所述语音数据;若存在,将所述语音数据发送给所述待接收应用,以使所述待接收应用根据所述语音数据实现相应的功能;
其中,
所述语音数据处理单元,还适于判断待接收的应用是否需要对所述语音数据进行语音识别,若不需要,则将所述语音数据直接发送给所述待接收应用;若需要,则对所述语音数据进行语音识别,得到所述语音数据对应的文本数据,将所述语音数据对应的文本数据发送给所述待接收应用,或者,将所述语音数据对应的文本数据以及所述语音数据发送给所述待接收应用;
其中,所述语音数据处理单元,适于获取语音回调应用列表,判断所述语音回调应用列表中是否存在已注册语音回调的一个或多个应用;
其中,所述语音数据处理单元,适于在所述语音回调应用列表中存在已注册语音回调的多个应用时,将所述语音回调应用列表中注册时间最晚的应用作为待接收应用,或者,将所述列表中优先级最高的应用作为待接收应用。
9.如权利要求8所述的装置,其中,
所述语音数据处理单元,适于调用所述智能终端中预设的语音识别库,对所述语音数据进行语音识别。
10.如权利要求8所述的装置,其中,
所述音数据处理单元,适于根据应用在所述语音回调应用列表中注册的语音回调接口类型,判断该应用是否需要对所述语音数据进行语音识别。
11.如权利要求10所述的装置,其中,所述语音回调接口类型包括:
语音输入接口,和/或语音识别接口。
12.如权利要求11所述的装置,其中,
所述语音数据处理单元,适于在所述语音回调应用列表中存在已注册语音回调的多个应用,且已确定的待接收应用仅注册了语音识别接口时,判断所述待接收应用是否成功响应于所述语音数据对应的文本数据实现了相应的功能;若未成功,则从所述语音回调应用列表中确定另一待接收应用,根据该应用已注册的语音回调接口类型,将所述语音数据对应的文本数据和/或所述语音数据发送给该应用。
13.如权利要求12所述的装置,
所述语音数据处理单元,适于在所述语音回调应用列表中全部应用均仅注册了语音识别接口,且均未成功响应于所述语音数据对应的文本数据实现了相应的功能时,删除所述语音数据和所述语音数据对应的文本数据,并返回指定类型的提示信息。
14.如权利要求8-13中任一项所述的装置,其中,该装置还包括:
语音回调注册单元,适于接收智能终端上的应用在启动时发送的语音回调注册请求,根据所述语音回调注册请求将相应的应用在所述语音回调应用列表中进行注册。
15.一种智能终端,其中,该智能终端包括:
实体语音输入键和如权利要求8-14中任一项所述的在智能终端中进行语音控制的装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710069832.2A CN108401066B (zh) | 2017-02-08 | 2017-02-08 | 在智能终端中进行语音控制的方法、装置和智能终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710069832.2A CN108401066B (zh) | 2017-02-08 | 2017-02-08 | 在智能终端中进行语音控制的方法、装置和智能终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108401066A CN108401066A (zh) | 2018-08-14 |
CN108401066B true CN108401066B (zh) | 2022-01-25 |
Family
ID=63094518
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710069832.2A Active CN108401066B (zh) | 2017-02-08 | 2017-02-08 | 在智能终端中进行语音控制的方法、装置和智能终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108401066B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111274005A (zh) * | 2018-12-04 | 2020-06-12 | 成都鼎桥通信技术有限公司 | 事件处理方法、装置及终端 |
CN109788132A (zh) * | 2018-12-29 | 2019-05-21 | 努比亚技术有限公司 | 一种消息处理方法、移动终端以及计算机可读存储介质 |
CN110223682B (zh) * | 2019-04-29 | 2022-01-11 | 阿波罗智联(北京)科技有限公司 | 一种语音指令仲裁方法和装置 |
CN112073777B (zh) * | 2019-06-10 | 2022-06-28 | 海信视像科技股份有限公司 | 一种语音交互方法及显示设备 |
CN112073776B (zh) * | 2019-06-10 | 2022-06-24 | 海信视像科技股份有限公司 | 语音控制方法及显示设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101489091A (zh) * | 2009-01-23 | 2009-07-22 | 深圳华为通信技术有限公司 | 一种语音信号传输处理方法及装置 |
CN101819614A (zh) * | 2010-01-21 | 2010-09-01 | 浙江维尔生物识别技术股份有限公司 | 利用语音核验USBKey增强网络交易安全性的系统和方法 |
CN104978165A (zh) * | 2015-06-23 | 2015-10-14 | 上海卓易科技股份有限公司 | 一种语音信息的处理方法、系统及电子设备 |
WO2016089029A1 (en) * | 2014-12-01 | 2016-06-09 | Lg Electronics Inc. | Mobile terminal and controlling method thereof |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102004624B (zh) * | 2010-11-11 | 2012-08-22 | 中国联合网络通信集团有限公司 | 语音识别控制系统和方法 |
US10276157B2 (en) * | 2012-10-01 | 2019-04-30 | Nuance Communications, Inc. | Systems and methods for providing a voice agent user interface |
KR101442027B1 (ko) * | 2013-04-29 | 2014-09-25 | (주)다하미 커뮤니케이션즈 | 음향패턴을 이용하여 휴대형 단말기용 이어폰 인식하는 음향처리 시스템, 음향패턴을 이용한 휴대형 단말기용 이어폰 인식방법 및 이를 이용한 입력음향 처리 방법. |
CN103760969A (zh) * | 2013-12-12 | 2014-04-30 | 宇龙计算机通信科技(深圳)有限公司 | 移动终端及语音控制应用程序的方法 |
CN104657105B (zh) * | 2015-01-30 | 2016-10-26 | 腾讯科技(深圳)有限公司 | 一种开启终端的语音输入功能的方法和装置 |
CN106157955A (zh) * | 2015-03-30 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 一种语音控制方法及装置 |
CN105551487A (zh) * | 2015-12-07 | 2016-05-04 | 北京云知声信息技术有限公司 | 一种语音控制方法及装置 |
-
2017
- 2017-02-08 CN CN201710069832.2A patent/CN108401066B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101489091A (zh) * | 2009-01-23 | 2009-07-22 | 深圳华为通信技术有限公司 | 一种语音信号传输处理方法及装置 |
CN101819614A (zh) * | 2010-01-21 | 2010-09-01 | 浙江维尔生物识别技术股份有限公司 | 利用语音核验USBKey增强网络交易安全性的系统和方法 |
WO2016089029A1 (en) * | 2014-12-01 | 2016-06-09 | Lg Electronics Inc. | Mobile terminal and controlling method thereof |
CN104978165A (zh) * | 2015-06-23 | 2015-10-14 | 上海卓易科技股份有限公司 | 一种语音信息的处理方法、系统及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN108401066A (zh) | 2018-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108401066B (zh) | 在智能终端中进行语音控制的方法、装置和智能终端 | |
KR102233343B1 (ko) | 선택적으로 조종 가능한 상태 머신을 갖는 개인 보조 모듈 제공 | |
KR101809808B1 (ko) | 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법 | |
CN107436748B (zh) | 处理第三方应用消息的方法、装置、终端设备及可读介质 | |
US9363300B2 (en) | Systems and methods for voice communication | |
US10242678B2 (en) | Friend addition using voiceprint analysis method, device and medium | |
EP3723352B1 (en) | Notification prompt method and apparatus, terminal and storage medium | |
CN113760145A (zh) | 一种互动方法、装置、电子设备及存储介质 | |
WO2020124453A1 (zh) | 信息自动回复的方法及相关装置 | |
CN112040442B (zh) | 交互方法、移动终端、车载终端及计算机可读存储介质 | |
CN103971683A (zh) | 语音控制方法、系统及手持设备 | |
AU2018432003B2 (en) | Video processing method and device, and terminal and storage medium | |
WO2014169635A1 (zh) | 自动发送短消息方法、装置与终端 | |
CN109274825B (zh) | 一种消息提醒方法及装置 | |
CN110650249A (zh) | 通话接听方法、装置、计算机设备及存储介质 | |
CN112861542B (zh) | 限定场景语音交互方法和装置 | |
CN110225470B (zh) | 一种通信方法、装置及电子设备 | |
CN114257971A (zh) | 消息处理的方法、智能终端及存储介质 | |
CN111277708A (zh) | 一种信息处理方法及电子设备 | |
CN106534520B (zh) | 一种基于语音识别的信息发送方法及系统 | |
CN111818213A (zh) | 呼叫应答方法、装置及电子设备 | |
CN111913590A (zh) | 一种输入方法、装置和设备 | |
CN111935348A (zh) | 提供通话处理服务的方法和装置 | |
CN111382237B (zh) | 一种数据处理方法、装置及任务对话系统 | |
CN109729209A (zh) | 智能通讯的方法、装置、终端设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |