CN109754799A - 通过自定义语音控制应用功能的系统及方法 - Google Patents

通过自定义语音控制应用功能的系统及方法 Download PDF

Info

Publication number
CN109754799A
CN109754799A CN201811609541.9A CN201811609541A CN109754799A CN 109754799 A CN109754799 A CN 109754799A CN 201811609541 A CN201811609541 A CN 201811609541A CN 109754799 A CN109754799 A CN 109754799A
Authority
CN
China
Prior art keywords
voice
control
control application
function
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811609541.9A
Other languages
English (en)
Inventor
杨保毅
郑富强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Shuguo Technology Co Ltd
Original Assignee
Shanghai Shuguo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Shuguo Technology Co Ltd filed Critical Shanghai Shuguo Technology Co Ltd
Priority to CN201811609541.9A priority Critical patent/CN109754799A/zh
Publication of CN109754799A publication Critical patent/CN109754799A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Telephone Function (AREA)

Abstract

本发明一种通过自定义语音控制应用功能的系统及方法,语音控制应用在启动后供用户选择需要控制的被控制应用,在选择出的被控制应用已语音设置则直接进入工作状态,在选择出的被控制应用未语音设置则自动查询被控制应用所支持的功能列表及对应指令并显示,供用户根据列表功能对每一项功能进行自定义语音录入并保存,之后进入工作状态;语音控制应用监听用户输入的语音并进行语音识别,在识别出该语音为机主的控制语音时则根据控制语音检索出对应的被控制应用和指令,将该语音转换为对应的指令发送给被控制应用;被控制应用接收该指令并执行对应功能,将执行结果返回给语音控制应用;语音控制应用根据返回的执行结果进行相应的提示给用户。

Description

通过自定义语音控制应用功能的系统及方法
技术领域
本发明涉及语音控制技术领域,特别是涉及一种通过自定义语音控制应用功能的系统及方法。
背景技术
在当前社会中,科技发展迅猛,移动设备及应用使用非常频繁,操作各种移动设备及应用基本都是通过手操作的,也有部分是通过语音来操作的,但是这在特殊情况下存在很多不足。
如用户需要发个微信语音、打个电话、手机亮灭屏、使用对讲机等都需要手操作,但是在一些特殊情况下,不方便直接用手操作但是又想使用这些功能,怎么办?
如部分语音控制设备只能识别固定的语音,如果用户平时习惯使用方言或者说话有口音等会造成难识别的情况怎么办?
如使用手机时通过语音控制其他设备,基本上同一时刻一个控制应用只能控制一个应用或者终端,用户想使用一个语音控制应用同时控制多个设备或多个类型的设备怎么办?
当下没有现有方案来解决这些存在的技术问题,因此,设计一种通过自定义语音控制应用功能的技术方案就显得尤为重要。
发明内容
本发明针对现有技术存在的问题和不足,提供一种通过自定义语音控制应用功能的系统及方法。
本发明是通过下述技术方案来解决上述技术问题的:
本发明提供一种通过自定义语音控制应用功能的系统,其特点在于,其包括语音控制应用,所述语音控制应用用于在启动后供用户选择需要控制的被控制应用,在选择出的被控制应用已语音设置则直接进入工作状态,在选择出的被控制应用未语音设置则自动查询被控制应用所支持的功能列表及对应指令并显示,供用户根据列表功能对每一项功能进行自定义语音录入并保存,之后进入工作状态;
所述语音控制应用还用于监听用户输入的语音,并进行语音识别,在识别出该语音为机主的控制语音时则根据控制语音检索出对应的被控制应用和指令,将该语音转换为对应的指令发送给被控制应用;
所述被控制应用用于接收该指令并执行对应功能,将执行结果返回给语音控制应用;
所述语音控制应用还用于根据返回的执行结果进行相应的提示给用户。
较佳地,所述语音控制应用与被控制应用通过公开接口相互通信。
较佳地,所述语音控制应用用于在选择出的被控制应用未语音设置时主动通过公开接口向被控制应用查询所支持的功能列表及对应指令,所述被控制应用用于通过公开接口返回功能列表及对应指令;
所述语音控制应用还用于显示功能列表,供用户根据显示的功能列表选择功能进行对应功能语音采样录入,将录入的控制语音、被控制应用、功能和指令进行一对一绑定并保存至本地和云端。
较佳地,所述语音控制应用包括语音监听模块、语音识别模块和提示模块;
所述语音监听模块用于对用户发出的语音进行录入,并发送给语音识别模块;所述语音识别模块用于识别录入语音是不是控制语音,对解析为控制语音的语音进行进一步识别,识别是不是机主的语音,若不是机主的语音则不处理,若是机主的语音则通过识别到的控制语音在之前保存的信息中检索对应应用及指令,把指令通过公开接口发送给对应的被控制应用;
所述被控制应用用于接收指令,执行对应指令的功能,并将执行结果通过公开接口返回给语音控制应用;提示模块用于根据返回结果给用户相应的提示。
本发明还提供一种通过自定义语音控制应用功能的方法,其特点在于,语音控制应用在启动后供用户选择需要控制的被控制应用,在选择出的被控制应用已语音设置则直接进入工作状态,在选择出的被控制应用未语音设置则自动查询被控制应用所支持的功能列表及对应指令并显示,供用户根据列表功能对每一项功能进行自定义语音录入并保存,之后进入工作状态;
所述语音控制应用监听用户输入的语音,并进行语音识别,在识别出该语音为机主的控制语音时则根据控制语音检索出对应的被控制应用和指令,将该语音转换为对应的指令发送给被控制应用;
所述被控制应用接收该指令并执行对应功能,将执行结果返回给语音控制应用;
所述语音控制应用根据返回的执行结果进行相应的提示给用户。
较佳地,所述语音控制应用与被控制应用通过公开接口相互通信。
较佳地,所述语音控制应用在选择出的被控制应用未语音设置时主动通过公开接口向被控制应用查询所支持的功能列表及对应指令,所述被控制应用通过公开接口返回功能列表及对应指令;
所述语音控制应用显示功能列表,供用户根据显示的功能列表选择功能进行对应功能语音采样录入,将录入的控制语音、被控制应用、功能和指令进行一对一绑定并保存至本地和云端。
较佳地,语音监听模块对用户发出的语音进行录入,并发送给语音识别模块;语音识别模块识别录入语音是不是控制语音,对解析为控制语音的语音进行进一步识别,识别是不是机主的语音,若不是机主的语音则不处理,若是机主的语音则通过识别到的控制语音在之前保存的信息中检索对应应用及指令,把指令通过公开接口发送给对应的被控制应用;
所述被控制应用接收指令,执行对应指令的功能,并将执行结果通过公开接口返回给语音控制应用;提示模块根据返回结果给用户相应的提示。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明的积极进步效果在于:
本发明解决在不方便用手操作设备或应用功能的情况下通过语音来完成特定功能。本发明动态选择同时语音控制哪些应用或设备,可以适配多种类型的应用或设备。
本发明支持同时监听多个被控制应用,用户可以同时选择多个应用和设备进行语音控制,且支持多种类型同时进行控制。
附图说明
图1为本发明较佳实施例的语音控制应用的流程示意图。
图2为本发明较佳实施例的公开接口的使用示范图。
图3为本发明较佳实施例的动态查询功能列表框图。
图4为本发明较佳实施例的自定义语音功能框图。
图5为本发明较佳实施例的语音控制检索框图。
图6为本发明较佳实施例的设置被控应用语音到设置完成框图。
图7为本发明较佳实施例的语音转指令并执行框图细分图。
图8为本发明较佳实施例的语音转指令并执行框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本实施例提供一种通过自定义语音控制应用功能的系统及方法,其包括语音控制应用。用户启动语音控制应用后,首先会让用户选择需要控制的应用(即被控制应用),如果选择已设置控制语音的被控制应用则直接进入工作状态,如果选择新的被控制应用,语音控制应用会自动查询被控制应用所支持功能的列表及对应指令并显示出来,用户根据列表功能对每一项功能进行自定义语音录入并保存,之后进入工作状态。用户语音被语音控制应用监听,并进行语音识别,如果是机主的控制语音则根据控制语音检索出对应的被控制应用和指令,将语音转换为对应的指令,通过公开接口发送给被控制应用,被控制应用接收指令并执行对应功能,然后执行结果通过公开接口返回给语音控制应用,语音控制应用根据返回结果进行相应的语音或灯光等方式提示给用户。
如图2所示,公开接口主要用于语音控制应用与被控制应用通信,是应用间通信的管道。语音控制应用与被控制应用只能通过公开接口相互通信。公开接口用于给其他应用适配,同时也是双方能正常通信和正确处理信息的保障。
如图3所示,在选择出的被控制应用未语音设置时,语音控制应用主动通过公开接口向被控制应用查询所支持的功能列表及对应指令,所述被控制应用用于通过公开接口返回功能列表及对应指令。
如图4所示,语音控制应用显示功能列表,供用户根据显示的功能列表选择功能进行对应功能语音采样录入,将录入的控制语音、被控制应用、功能和指令进行一对一绑定并保存至本地和云端。
如图5所示,语音控制应用记录着每个应用所支持的功能、对应的指令和控制语音,当识别到控制语音就可以根据语音检索出对应的被控制应用和指令,然后将指令发送给对应的应用执行。
如图6所示,如果被控制语音在云端有备份,那么可以直接选择从云端拉取,也可以选择新建语音。选择新建语音后则需要通过公开接口获取被控制应用所支持的功能列表。公开接口将信息传递给被控制应用。被控制应用将支持的功能描述及对应指令通过公开接口返回给语音控制应用。语音控制应用显示功能列表,机主选择功能并录入相应的自定义的语音,并将这条语音与应用、对应功能及对应指令进行绑定。机主对所支持的功能录入语音完毕后保存在设备中,同时在云端保存备份。设置完成,进入工作状态。
如图7和8所示,语音监听功能主要是对客户说的语音进行录入,并发送给语音识别模块,语音控制应用设置完成后将持续在后台运行。语音识别功能主要是识别录入语音是不是控制语音。对解析为控制语音的语音进行进一步识别,检查是不是机主的语音,如果不是机主的语音则不处理,这样保证是机主语音操作。通过识别到的控制语音在之前保存的信息中检索对应应用及指令。把指令通过公开接口发送给对应的被控制应用。被控制应用接收指令,并执行对应指令的功能。被控制应用执行后把执行结果通过公开接口返回给语音控制应用。语音控制应用根据返回结果给用户相应的提示。
在本实施例中,被控制应用需要集成公开接口,按照公开接口中的规范实现规定的功能,如返回支持的功能及对应指令,如接收公开接口发送来的功能指令,执行并返回执行结果等。被控制应用可根据自己的功能自定义哪些功能用户可语音控制及定义对应指令,并实现对应指令的功能。
本方案重点在于动态查询被控制应用支持的功能列表,自定义控制语音,同时支持监听多个被控制应用功能。动态查询被控制应用支持的功能列表,可随时查询被控制应用功能变更情况并及时做出语音调整。自定义控制语音方案,可对同一个应用功能,在不同的设备上使用时可录入不同的控制语音,且控制语音多样化,可以是任何声音,可随时更改,这条语音代表执行这个功能。支持同时监听多个被控制应用,用户可以同时选择多个应用和设备进行语音控制,且支持多种类型同时进行控制。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (8)

1.一种通过自定义语音控制应用功能的系统,其特征在于,其包括语音控制应用,所述语音控制应用用于在启动后供用户选择需要控制的被控制应用,在选择出的被控制应用已语音设置则直接进入工作状态,在选择出的被控制应用未语音设置则自动查询被控制应用所支持的功能列表及对应指令并显示,供用户根据列表功能对每一项功能进行自定义语音录入并保存,之后进入工作状态;
所述语音控制应用还用于监听用户输入的语音,并进行语音识别,在识别出该语音为机主的控制语音时则根据控制语音检索出对应的被控制应用和指令,将该语音转换为对应的指令发送给被控制应用;
所述被控制应用用于接收该指令并执行对应功能,将执行结果返回给语音控制应用;
所述语音控制应用还用于根据返回的执行结果进行相应的提示给用户。
2.如权利要求1所述的通过自定义语音控制应用功能的系统,其特征在于,所述语音控制应用与被控制应用通过公开接口相互通信。
3.如权利要求2所述的通过自定义语音控制应用功能的系统,其特征在于,所述语音控制应用用于在选择出的被控制应用未语音设置时主动通过公开接口向被控制应用查询所支持的功能列表及对应指令,所述被控制应用用于通过公开接口返回功能列表及对应指令;
所述语音控制应用还用于显示功能列表,供用户根据显示的功能列表选择功能进行对应功能语音采样录入,将录入的控制语音、被控制应用、功能和指令进行一对一绑定并保存至本地和云端。
4.如权利要求2所述的通过自定义语音控制应用功能的系统,其特征在于,所述语音控制应用包括语音监听模块、语音识别模块和提示模块;
所述语音监听模块用于对用户发出的语音进行录入,并发送给语音识别模块;所述语音识别模块用于识别录入语音是不是控制语音,对解析为控制语音的语音进行进一步识别,识别是不是机主的语音,若不是机主的语音则不处理,若是机主的语音则通过识别到的控制语音在之前保存的信息中检索对应应用及指令,把指令通过公开接口发送给对应的被控制应用;
所述被控制应用用于接收指令,执行对应指令的功能,并将执行结果通过公开接口返回给语音控制应用;提示模块用于根据返回结果给用户相应的提示。
5.一种通过自定义语音控制应用功能的方法,其特征在于,语音控制应用在启动后供用户选择需要控制的被控制应用,在选择出的被控制应用已语音设置则直接进入工作状态,在选择出的被控制应用未语音设置则自动查询被控制应用所支持的功能列表及对应指令并显示,供用户根据列表功能对每一项功能进行自定义语音录入并保存,之后进入工作状态;
所述语音控制应用监听用户输入的语音,并进行语音识别,在识别出该语音为机主的控制语音时则根据控制语音检索出对应的被控制应用和指令,将该语音转换为对应的指令发送给被控制应用;
所述被控制应用接收该指令并执行对应功能,将执行结果返回给语音控制应用;
所述语音控制应用根据返回的执行结果进行相应的提示给用户。
6.如权利要求5所述的通过自定义语音控制应用功能的方法,其特征在于,所述语音控制应用与被控制应用通过公开接口相互通信。
7.如权利要求6所述的通过自定义语音控制应用功能的方法,其特征在于,所述语音控制应用在选择出的被控制应用未语音设置时主动通过公开接口向被控制应用查询所支持的功能列表及对应指令,所述被控制应用通过公开接口返回功能列表及对应指令;
所述语音控制应用显示功能列表,供用户根据显示的功能列表选择功能进行对应功能语音采样录入,将录入的控制语音、被控制应用、功能和指令进行一对一绑定并保存至本地和云端。
8.如权利要求6所述的通过自定义语音控制应用功能的方法,其特征在于,语音监听模块对用户发出的语音进行录入,并发送给语音识别模块;语音识别模块识别录入语音是不是控制语音,对解析为控制语音的语音进行进一步识别,识别是不是机主的语音,若不是机主的语音则不处理,若是机主的语音则通过识别到的控制语音在之前保存的信息中检索对应应用及指令,把指令通过公开接口发送给对应的被控制应用;
所述被控制应用接收指令,执行对应指令的功能,并将执行结果通过公开接口返回给语音控制应用;提示模块根据返回结果给用户相应的提示。
CN201811609541.9A 2018-12-27 2018-12-27 通过自定义语音控制应用功能的系统及方法 Pending CN109754799A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811609541.9A CN109754799A (zh) 2018-12-27 2018-12-27 通过自定义语音控制应用功能的系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811609541.9A CN109754799A (zh) 2018-12-27 2018-12-27 通过自定义语音控制应用功能的系统及方法

Publications (1)

Publication Number Publication Date
CN109754799A true CN109754799A (zh) 2019-05-14

Family

ID=66404180

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811609541.9A Pending CN109754799A (zh) 2018-12-27 2018-12-27 通过自定义语音控制应用功能的系统及方法

Country Status (1)

Country Link
CN (1) CN109754799A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103456298A (zh) * 2012-06-04 2013-12-18 三星电子株式会社 提供语音识别服务的方法及其电子装置
CN103646646A (zh) * 2013-11-27 2014-03-19 联想(北京)有限公司 一种语音控制方法及电子设备
CN104916287A (zh) * 2015-06-10 2015-09-16 青岛海信移动通信技术股份有限公司 一种语音控制的方法、装置和移动设备
CN106653011A (zh) * 2016-09-12 2017-05-10 努比亚技术有限公司 一种语音控制方法、装置及终端
CN108074577A (zh) * 2016-11-09 2018-05-25 上海诺悦智能科技有限公司 身份认证方法及身份认证系统
CN108108158A (zh) * 2017-12-15 2018-06-01 复旦大学 一种面向安卓的用户个性化定制语音控制应用方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103456298A (zh) * 2012-06-04 2013-12-18 三星电子株式会社 提供语音识别服务的方法及其电子装置
CN103646646A (zh) * 2013-11-27 2014-03-19 联想(北京)有限公司 一种语音控制方法及电子设备
CN104916287A (zh) * 2015-06-10 2015-09-16 青岛海信移动通信技术股份有限公司 一种语音控制的方法、装置和移动设备
CN106653011A (zh) * 2016-09-12 2017-05-10 努比亚技术有限公司 一种语音控制方法、装置及终端
CN108074577A (zh) * 2016-11-09 2018-05-25 上海诺悦智能科技有限公司 身份认证方法及身份认证系统
CN108108158A (zh) * 2017-12-15 2018-06-01 复旦大学 一种面向安卓的用户个性化定制语音控制应用方法

Similar Documents

Publication Publication Date Title
NZ770836A (en) Headless task completion within digital personal assistants
US20150235642A1 (en) Speech dialogue control method
CN104916287A (zh) 一种语音控制的方法、装置和移动设备
CN102160043A (zh) 针对集成多语气多装置自然语言语音服务环境的系统和方法
US20220334795A1 (en) System and method for providing a response to a user query using a visual assistant
CN102625005A (zh) 具有服务质量实时监督功能的呼叫中心系统及其实现方法
CN103885350A (zh) 一种语音控制家庭电器的方法和装置
WO2017128775A1 (zh) 一种语音控制系统、语音处理方法及终端设备
US8160876B2 (en) Interactive speech recognition model
CN105654953A (zh) 语音控制方法以及系统
KR102414159B1 (ko) 보류 상태를 관리하기 위한 방법 및 장치
CN109144458B (zh) 用于执行与语音输入相对应的操作的电子设备
US10236016B1 (en) Peripheral-based selection of audio sources
CN109920416A (zh) 一种语音控制方法、装置、存储介质及控制系统
CN109509468A (zh) 一种设备执行语音播报任务的方法及装置
CN109243443A (zh) 语音控制方法、装置及电子设备
CN105611033A (zh) 一种语音控制的方法及装置
JP6689953B2 (ja) 通訳サービスシステム、通訳サービス方法及び通訳サービスプログラム
CN107808662B (zh) 更新语音识别用的语法规则库的方法及装置
CN114500757A (zh) 语音交互方法、装置、计算机设备及存储介质
HUP0400876A2 (en) Conversational prompting method for voice-controlled information and inquiry services involving computer telephony
CN106331392A (zh) 控制方法及控制装置
KR20170051994A (ko) 음성인식 디바이스 및 이의 동작 방법
CN111901488B (zh) 一种基于号码状态提升语音机器人外呼效率的方法
CN101123428A (zh) 可以进行动态设置的语音识别智能电子遥控开关

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190514