CN102004624B - 语音识别控制系统和方法 - Google Patents
语音识别控制系统和方法 Download PDFInfo
- Publication number
- CN102004624B CN102004624B CN201010542451XA CN201010542451A CN102004624B CN 102004624 B CN102004624 B CN 102004624B CN 201010542451X A CN201010542451X A CN 201010542451XA CN 201010542451 A CN201010542451 A CN 201010542451A CN 102004624 B CN102004624 B CN 102004624B
- Authority
- CN
- China
- Prior art keywords
- message
- speech
- voice
- applying unit
- speech message
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 94
- 230000003993 interaction Effects 0.000 claims description 43
- 230000002452 interceptive effect Effects 0.000 claims description 23
- 239000000284 extract Substances 0.000 claims description 16
- 230000005540 biological transmission Effects 0.000 claims description 9
- 230000008878 coupling Effects 0.000 claims description 7
- 238000010168 coupling process Methods 0.000 claims description 7
- 238000005859 coupling reaction Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 abstract description 23
- 238000005070 sampling Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 33
- 238000007689 inspection Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 230000011664 signaling Effects 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 241000287828 Gallus gallus Species 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种语音识别控制系统和方法。其中,该语音识别控制系统包括:语音输入设备,用于对接收到的语音信号进行采样,得到语音信号;将所述语音信号输入语音消息中间件;语音消息中间件,用于对所述语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所述语音信号对应的文本信息;将所述语音消息发送至需要所述语音消息的应用单元;应用单元,用于接收所述语音消息中间件发送的所述语音消息,根据所述语音消息中的文本信息控制所述应用单元的运行状态。本发明具有通用性,可以适用于各种功能的应用单元。
Description
技术领域
本发明实施例涉及语音控制技术,尤其涉及一种语音识别控制系统和方法。
背景技术
电视、电脑、手机等显示终端的业务操作,对普通家庭用户,特别是对于老人或者孩子来说,手动操作方法复杂。通过语音控制终端设备的业务操作可以简化操作方法,例如,用户可以在手机中通过语音查电话号码、写短信等。
当前,通过语音控制终端设备的应用单元,通常有两种方式。一种方式为:将语音识别模块与某一特定的应用单元绑定,将语音识别模块的语音识别能力作为特定的应用单元的能力,在这种情况下,语音识别能力不能被其他的应用单元使用,无法通用。另一种方式为:终端设备提供公用的语音识别模块,设备中的其它应用单元通过特定的应用编程接口(API)调用语音识别模块,以获取语音识别能力;在这种情况下,在终端中不能由多个设备同时使用语音识别模块,存在局限性。
综上所述现有技术中语音控制的适用范围小,且不能通用。
发明内容
本发明提供一种语音识别控制系统和方法,用以解决现有技术中语音控制的适用范围小,且不能通用的缺陷,实现具有通用性的语音控制,适用范围广。
本发明实施例提供一种语音识别控制系统,包括:
语音输入设备,用于对接收到的语音信号进行采样,得到语音信号;将所述语音信号输入语音消息中间件;
语音消息中间件,用于对所述语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所述语音信号对应的文本信息将所述语音消息发送至需要所述语音消息的应用单元;
应用单元,用于接收所述语音消息中间件发送的所述语音消息,根据所述语音消息中的文本信息控制所述应用单元的运行状态;
其中,所述语音消息中间件包括:
语音消息识别子系统,用于对所述语音输入设备输入的语音信号进行处理;提取所述语音信号的特征码,根据消息特征库中预先存储的特征码对所述语音信号的特征码进行匹配;若匹配成功,根据该语音信号的特征码对应的文本信息生成携带所述文本信息的语音消息,所述语音消息还包括消息类型,将所述语音消息发送至语音消息通知子系统;
语音消息通知子系统,用于提取所述语音消息的消息类型,查询是否存在需要该消息类型的语音消息的应用单元;若存在,则向所述需要该消息类型的语音消息的应用单元发送所述语音消息。
本发明实施例提供一种语音识别控制方法,包括:
对语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所述语音信号对应的文本信息;
将所述语音消息发送至需要所述语音消息的应用单元,以使所述应用单元根据所述语音消息中的文本信息控制应用单元的运行状态;
其中,所述对语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所述语音信号对应的文本信息,包括:
对所述语音输入设备输入的语音信号进行处理;
提取所述语音信号的特征码,根据消息特征库中预先存储的特征码对所述语音信号的特征码进行匹配;
若匹配成功,根据该语音信号的特征码对应的文本信息,生成携带所述文本信息的语音消息,所述语音消息还包括消息类型;
所述将所述语音消息发送至需要所述语音消息的应用单元,包括:
若存在需要发送的语音消息,则提取所述语音消息的消息类型,查询是否存在需要该消息类型的语音消息的应用单元;
若存在,则向所述需要该消息类型的语音消息的应用单元发送所述语音消息。
本发明提供的语音识别控制系统和方法,通过语音消息中间件对语音输入设备输入的语音信号进行识别得到携带消息类型和对应的文本信息的语音消息后,若存在需要该消息类型的应用单元,则可以将该语音消息发送至该应用单元,可以控制该应用单元的运行状态,该语音控制具有通用性,可以适用于各种功能的应用单元。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的语音识别控制系统的结构示意图;
图2为本发明实施例二提供的语音识别控制系统的结构示意图;
图3为本发明实施例三提供的语音识别控制方法的流程示意图;
图4a为本发明实施例四提供的语音识别控制方法的流程示意图;
图4b为本发明实施例四提供的语音识别控制方法的信令流程示意图;
图5a为本发明实施例五提供的语音识别控制方法的流程示意图;
图5b为本发明实施例五提供的语音识别控制方法中消息管理的信令流程示意图;
图5c为本发明实施例五提供的语音识别控制方法中消息通知的信令流程示意图;
图6a为本发明实施例六提供的语音识别控制方法中注册过程的流程示意图;
图6b为本发明实施例六提供的语音识别控制方法中注册过程的信令流程示意图;
图6c本发明实施例六提供的语音识别控制方法中注销过程的流程示意图;
图6d为本发明实施例六提供的语音识别控制方法中注销过程的信令流程示意图;
图6e为本发明实施例六提供的语音识别控制方法中状态控制的信令流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
图1为本发明实施例一提供的语音识别控制系统的结构示意图,如图1 所示,该语音识别控制系统包括:语音输入设备15、语音消息中间件13和应用单元11。
其中,语音输入设备15,用于对接收到的语音信号进行采样,得到语音信号;将所述语音信号输入语音消息中间件;
语音消息中间件13,用于对所述语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所述语音信号对应的文本信息;将所述语音消息发送至需要所述语音消息的应用单元;
应用单元11,用于接收所述语音消息中间件发送的所述语音消息,根据所述语音消息中的文本信息控制所述应用单元的运行状态。
具体地,语音消息中间件是一种可以运行在例如、电脑、手机、机顶盒等设备的操作系统之上的服务性应用。语音消息是以语音作为输入源,通过特定的语音处理与识别处理技术,将语音转换为可以识别和处理的信息。例如,用户以语音方式输入“关机”的语音指令,通过语音消息中间件处理后,可以变成“关机”的文本指令或者其它应用可以识别和处理的指令格式。其中,语音消息中至少包括识别出来的文本信息。文本信息也可以叫做语音消息的消息内容,可以是精确的消息描述,也可以是模糊的消息描述。例如,“关机”的语音输入的消息内容可以识别为“关机”的精确文本指令,也可以是“XX关机XX”等模糊文本指令。由于语音识别经常具备模糊性,所以,语音消息中包含的消息内容可以支持模糊性描述,各种应用单元可具备模糊性语音消息的处理能力。具体实现时,语音消息的内容可以使用XML格式描述,也可以使用其它文本或二进制方式描述,可以根据实际需要确定。因此,语音消息识别子系统识别语音信号时,根据消息特征库,可能将同一条语音信号识别出一条或多条文本信息。在应用单元中可以包括文本消息特征库,应用单元处理文本信息的方法具体可以包括以下情况:
情况一、如果语音消息中只包含单条文本信息,应用单元可以分离出语音消息中的文本信息,将文本信息转换成执行指令。应用单元的消息处理模 块检索和比对文本消息特征库,将文本信息转换成执行指令。如果转换成功,则执行获取的执行指令。处理完成语音消息后,删除语音消息。
例如,语音上网应用单元获取到包含文本信息“搜索开机”的语音消息时,上网应用分离出“搜索”执行指令,并将“开机”作为搜索的具体内容,此时,语音上网应用单元可以直接启动上网功能并搜索“开机”相关的信息。但是,如果是开关机应用单元接收到包含文本信息“搜索关机”的语音消息,则处理过程可以是:开关机应用单元识别出其中包含“关机”信息时,可以弹出对话框,提示用户是否确认“关机”,如果用户选择是,则开关机应用单元生成关机指令并执行。
再如,语音上网应用单元获取到仅包含文本信息“开机”的语音消息时,由于语音上网应用单元未找到其支持的可以转化成执行指令的文本信息例如:“搜索”等,则仅将“开机”作为搜索的内容,但不执行搜索过程,直至下次再接收到包含“搜索”的语音消息时,才执行搜索“开机”的过程;也可以将仅包含文本信息“开机”的语音消息丢弃或不处理。
情况二、语音消息中包含多条文本信息时
由于方言、环境不同,同一条语音信息可能被识别出多条文本信息。如果识别出多条文本信息,则生成的语音消息中可以包括多条文本信息,并且根据消息特征库中语音特征的相似度的大小,对识别出的多条文本信息排序,相似度越高的,排序越靠前。
例如,语音语音上网应用单元获取到包含文本信息“搜索开机”、“搜搜开鸡”的语音消息时,语音上网应用单元可以弹出对话框,提示用户选择是“搜索开机”还是“搜搜开鸡”,根据用户的选择和确定输入的内容进行处理,如果用户选择“搜索开机”,则处理过程与上述的情况一类似。由于在语音消息中,多条文本信息是有序的,所以,上网应用可以有序的显示文本信息。
此外,语音消息中还可以包括:消息类型、消息产生时间、消息有效期 等。其中,消息类型可以有多种划分方法,例如可以将消息类型划分为持续型消息、突发型消息,其中,持续型消息是持续的语音转换得到的消息,突发型消息则是间歇和/或突发的语音转换得到的消息。再如可以将消息类型划分为说话型、歌唱型等。消息类型也可以不进行设置或者只设置一种,所有注册的应用单元,都可以获取该消息类型的语音消息,消息类型的具体划分在本发明实施例中不做限制。
如果设备中的应用单元需要获取语音消息,可先向语音消息中间件注册所需的消息类型,当语音消息中间件在获取到相关类型的语音消息后,可以将相关类型的语音消息推送给对应的应用单元,从而使应用单元可以根据语音输入和识别的结果完成控制过程。语音消息中间件可向设备的应用层的所有应用单元提供语音消息的处理和传送服务。一个应用单元同时可以注册多个消息获取请求。以语音上网应用单元为例:将语音上网应用单元划分为服务发现模块、消息处理模块和第一应用注册模块。用户将语音上网应用单元启动后,该语音上网应用单元的服务发现模块在系统中查找语音消息中间件是否运行,如果未运行,则可运行该语音消息中间件。其中,语音消息中间件也可以默认为在系统启动后自动运行,但在没有应用单元需要语音消息时,不启动该语音消息中间件的语音获取与识别功能,即不启动语音获取模块、语音处理模块与语音识别模块等与语音获取与识别功能有关的模块。在语音上网应用单元启动并查找到语音消息中间件后,调用自身的消息第一应用注册模块向语音消息中间件注册所需的消息类型。语音消息中间件接收到相关请求后,启动语音消息获取与识别功能,并将获取到的该语音上网应用单元所需的语音消息递送给语音上网应用单元。语音上网应用单元获取语音消息后,分离出语音消息中的文本指令例如:“上网”,启动上网功能,查找匹配的网站和网络内容。
本实施例通过语音消息中间件对语音输入设备输入的语音信号进行识别得到携带消息类型和对应的文本信息的语音消息后,若存在需要该消息 类型的应用单元,则可以将该语音消息发送至该应用单元,可以控制该应用单元的运行状态,该语音控制具有通用性,可以适用于各种功能的应用单元。
实施例二
图2为本发明实施例二提供的语音识别控制系统的结构示意图,如图2所示,在实施例一的基础上该语音识别控制系统的语音消息中间件13可以包括:语音消息识别子系统21和语音消息通知子系统23。
其中,语音消息识别子系统21,用于对所述语音输入设备输入的语音信号进行处理;提取所述语音信号的特征码,根据消息特征库中预先存储的特征码对所述语音信号的特征码进行匹配;若匹配成功,根据该语音信号的特征码对应的文本信息生成携带所述文本信息的语音消息,所述语音消息还包括消息类型,将所述语音消息发送至语音消息通知子系统;
语音消息通知子系统23,用于提取所述语音消息的消息类型,查询是否存在需要该消息类型的语音消息的应用单元;若存在,则向所述需要该消息类型的语音消息的应用单元发送所述语音消息。
进一步地,语音消息识别子系统21可以包括:语音处理模块210、语音识别模块211、消息特征库212、第一消息通知模块213和第一服务控制模块214;
其中,语音处理模块210,用于对所述语音输入设备输入的语音信号进行处理;
语音识别模块211,用于提取所述语音信号的特征码,根据消息特征库212中预先存储的特征码对所述语音信号的特征码进行匹配;若匹配成功,根据该语音信号的特征码对应的文本信息,生成携带消息类型和所述文本信息的语音消息;
消息特征库212,用于保存匹配所用的特征码;
第一消息通知模块213,用于向所述语音消息通知子系统23发送所述语 音消息;
第一服务控制模块214,用于根据所述语音消息通知子系统23的指示控制所述语音消息识别子系统21的运行状态。
此外,语音消息识别子系统21还可以包括:语音获取模块215和第一服务交互接口216;
其中,语音获取模块215,用于接收所述语音输入设备输入的所述语音信号,将所述语音信号预处理后发送至所述语音处理模块210;
第一服务交互接口216,用于将所述第一消息通知模块发送的所述语音消息转发至所述语音消息通知子系统23的第二服务交互接口;
其中,所述第一服务控制模块214,还用于控制所述语音处理模块210、语音识别模块211、消息特征库212、第一消息通知模块213、语音获取模块215和第一服务交互接口216之间的交互。
具体地,设备的操作系统(硬件)层的语音输入设备向语音获取模块215提供语音信号。语音处理模块210启动后,通知语音获取模块215从语音输入设备中获取语音信息,相关语音信息通过语音处理模块210预处理后,送给语音识别模块。语音输入设备输入的语音信号可以是连续的,语音获取模块215可以同时接收多路语音输入设备,语音获取模块215可以从一个或多个语音输入设备获取语音信号,一边获取一边处理。语音获取模块215还可以设置语音输入设备的运行参数和运行状态。其中,运行参数主要包括语音采样率和输入格式,运行状态主要包括启动、停止、暂停等。语音处理模块210接收并处理语音获取模块215传送的每一路语音信号,如果存在多路语音信号,语音处理模块210还可以将多路语音信号按一定规则合成为单路语音信号。输入的各路语音信号存在一定的属性,主要包括语音的正负向属性,其中,正负向属性是指:如果语音信号是需要识别的关键信息,则约定为正向,否则,约定为负向。负向语音信号通常用于采集背景声音,背景声音通常不用于识别,而用于信号去噪。语音处理模块210将处理后的语音信号推 送给语音识别模块211。语音处理模块210连续分块地向语音识别模块211推送语音信号。语音识别模块211接收和处理来自语音处理模块210的语音信号,检查和匹配语音信号,将语音信号转换成语音消息。语音识别模块211将生成的语音消息推送给第一消息通知模块213。语音识别模块211提取语音信号的特征码,并通过消息特征库212模块检查和匹配预存储的特征码,如果找到相同的或相似的特征码,则可认为找到匹配的语音消息。可以根据需要选用的语音识别算法,以检查和匹配特征码,并生成语音消息。匹配时,可以使用模糊算法。消息特征库212可以保存一些可以识别的语音消息的特征码,从而向语音识别模块211提供语音消息特征码的检查和匹配服务。语音识别模块211生成的语音消息通过第一消息通知模块213和第一服务交互接口216传送给语音消息通知子系统。第一服务交互接口216提供接口,与语音消息通知子系统交互。第一服务控制模块214是语音消息识别子系统的控制中心。第一服务控制模块214可以启动、关闭、暂停语音获取模块等各个模块的运行状态。其它各个模块通过第一服务控制模块214相互交互。
再进一步地,语音消息通知子系统23包括:消息管理模块231、应用管理模块232、第二消息通知模块233和第二服务控制模块234。
其中,消息管理模块231,用于将各个语音消息保存为一个消息队列;定期检查所述消息队列中当前是否存在需要发送的语音消息,若存在需要发送的语音消息,则提取所述语音消息的消息类型,指示应用管理模块232查询是否存在需要该消息类型的语音消息的应用单元,若存在,则指示第二消息通知模块233向需要该消息类型的语音消息的应用单元发送所述语音消息;
应用管理模块232,用于查询是否存在需要该消息类型的语音消息的应用单元;若存在,则所述消息管理模块231返回所述需要该消息类型的语音消息的应用单元的信息;
第二消息通知模块233,用于根据所述消息管理模块231的指示,向需 要该消息类型的语音消息的应用单元发送所述语音消息;
第二服务控制模块234,用于指示所述语音消息识别子系统21需要控制的运行状态。
此外,语音消息通知子系统23还可以包括:应用交互接口235、第一应用注册模块236和第二服务交互接口237。
其中,应用交互接口235,用于将所述第二消息通知模块233的所述语音消息转发至需要该消息类型的语音消息的应用单元;将接收的所述应用单元发送的语音消息获取请求的注册或注销信息发送至第一应用注册模块236;
第一应用注册模块236,用于根据所述应用单元的语音消息获取请求的注册或注销信息,对所述应用单元的语音识别控制功能进行注册或注销;
第二服务交互接口237,用于接收所述语音消息识别子系统的第一服务交互接口216发送的所述语音消息;
其中,第二服务控制模块234,还用于控制所述应用管理模块232、消息管理模块231、第二消息通知模块233、应用交互接口235、第一应用注册模块236和第二服务交互接口237之间的交互。
再进一步地,语音消息通知子系统23还可以包括:服务注册模块和配置管理模块,其中,服务注册模块,用于在所述语音消息通知子系统启动时,根据设定规则注册所述语音消息通知子系统的运行状态;配置管理模块,用于对所述语音消息通知子系统的运行参数进行配置管理。第二服务控制模块234,还可以控制服务注册模块、配置管理模块与语音消息通知子系统的其他各个子模块之间的交互。
具体地,不同设备的应用层可以包括不同的应用单元,例如,桌面管理应用、浏览器应用、播放器应用等。语音消息通知子系统23的应用交互接口235为应用单元提供约定接口,应用层的应用单元通过应用交互接口235与语音消息通知子系统23交互。如图2所示,每个应用单元11可以包括:服务发现模块31、消息处理模块32和第二应用注册模块33,这三个模块可以 分别通过语音消息通知子系统23的应用交互接口235的服务发现接口、消息通知接口、应用注册接口与语音消息通知子系统23交互。通过应用注册接口,应用单元的第二应用注册模块33可以向语音消息通知子系统23发送语音消息获取请求的注册和/或注销信息;通过消息通知接口,应用单元的消息处理模块32可以接收到所需的语音消息;通过服务发现接口,应用单元的服务发现模块31可以查找到当前正在运行的语音消息通知子系统23。应用单元还可以包括其他与其应用功能相对应的模块,在此不做限制。
第一应用注册模块236通过应用交互接口235接收和处理应用单元的语音消息获取请求的注册和/或注销信息后,与应用管理模块232协同管理应用单元的语音消息获取请求注册和/或注销信息。当应用单元需要接收某类型的语音消息时,向语音消息中间件发送语音消息获取请求的注册信息,语音消息获取请求的注册信息内容可以主要包括:应用类型、应用标识、需要获取的消息类型及参数、消息获取接口等。其中,应用标识、消息类型、消息参数、消息获取接口合称为四元组信息,一个四元组信息唯一确定一个语音消息获取请求及其相关消息。其中,应用标识为唯一确定该应用单元的标识信息;消息类型可以参见实施例一中的描述,不同的应用单元可以对应不同或相同的消息类型;消息参数为指标识应用在运行状态下的唯一性标识值,例如,应用在进程中的进程标识值,可以作为指示应用单元自身的上下文指针,方便查找该应用单元;消息获取接口为应用单元用于接收或提取语音消息的函数指针,语音消息中间件调用该消息获取接口可以将语音消息推送给应用单元,在调用该消息获取接口时,可以将消息参数一并返回给应用单元。如果应用单元注册成功,则第一应用注册模块236向应用单元反馈与四元组信息唯一对应的消息接收标识码;否则,通知应用单元注册失败。此外,应用单元可以删除某个语音消息获取请求,在删除过程中,需要包括第一应用注册模块236反馈的消息接收标识码以及对应的四元组信息。当删除成功时,消息接收标识码失效。如果应用提供的消息接收标识码和对应的四元组信息 不正确,或者失效,则第一应用注册模块236可以拒绝相关请求。
应用管理模块232管理已经注册的应用单元及其语音消息获取请求的相关消息。当存在需要通知的语音消息时,消息管理模块231可以通过应用管理模块232查找需要通知的语音消息的应用单元的信息。应用管理模块232根据第一应用注册模块236的请求,创建、保存、修改或删除指定的应用单元的语音消息获取请求的相关信息(包括消息接收标识码和四元组信息),消息接收标识码可由应用管理模块232创建,也可由其它模块创建。
此外,消息管理模块231管理来自语音消息识别子系统的语音消息,消息管理模块231以消息队列的方式管理语音消息。消息管理模块231获取到语音消息后,提取语音消息的消息类型,通过应用管理模块232查找并匹配需要指定语音消息类型的应用,找到应用后,通过第二消息通知模块233向应用提供语音消息。第二消息通知模块233向所有需要约定消息类型的应用提供语音消息。语音消息处理完后,在约定条件下,第二消息通知模块233可以删除相关语音消息。第二消息通知模块233根据消息管理模块231的要求,通过应用交互接口235向应用推送指定语音消息,或者通知应用单元提取指定语音消息。第二消息通知模块233调用应用的消息获取请求四元组信息的消息获取接口,通知应用接收和/或提取语音消息。服务注册模块在语音消息通知子系统启动时,以某种规则注册语音消息通知子系统的运行状态。应用的服务发现模块可以根据该规则找到运行中的语音消息通知子系统。实施例可以自定义所述规则。常用的规则有,共享内存、共享信号量等。配置管理模块用于对所述语音消息通知子系统的运行参数进行配置管理。第二服务交互接口237提供接口,与语音消息识别子系统交互。第二服务控制模块234是语音消息通知子系统的控制中心。第二服务控制模块234可以启动、关闭、暂停语音消息识别子系统的运行状态。其它模块通过第二服务控制模块234相互交互。
本实施例通过语音消息中间件对语音输入设备输入的语音信号进行识别 得到携带消息类型和对应的文本信息的语音消息后,若存在需要该消息类型的应用单元,则可以将该语音消息发送至该应用单元,可以控制该应用单元的运行状态,该语音控制具有通用性,可以适用于各种功能的应用单元。
实施例三
图3为本发明实施例三提供的语音识别控制方法的流程示意图,如图3所示,该语音识别控制方法包括:
步骤101、对语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所述语音信号对应的文本信息;
步骤102、将所述语音消息发送至需要所述语音消息的应用单元,以使所述应用单元根据所述语音消息中的文本信息控制应用单元的运行状态。
具体地,本实施例的语音识别控制方法可以由上述实施例中的语音识别控制系统完成,语音识别控制系统中,语音消息中间件的语音消息识别子系统对语音输入设备输入的语音信号进行识别得到语音消息后,语音消息通知子系统检查需要所述语音消息的应用单元,若存在,则将语音消息发送至应用单元,以使应用单元根据语音消息控制应用单元的运行状态。其中,语音消息中除了可以包括文本信息外,还可以包括消息类型、消息产生时间、消息有效期等,具体可以参见实施例一中的相关描述。
本实施例通过语音消息中间件对语音输入设备输入的语音信号进行识别得到携带文本信息的语音消息后,若存在需要该语音消息的应用单元,则可以将该语音消息发送至该应用单元,可以控制该应用单元的运行状态,该语音控制具有通用性,可以适用于各种功能的应用单元。
实施例四
图4a为本发明实施例四提供的语音识别控制方法的流程示意图,如图4所示,在实施例三的基础上,该语音识别控制方法的步骤101可以包括:
步骤201、对所述语音输入设备输入的语音信号进行处理;
步骤202、提取所述语音信号的特征码,根据消息特征库中预先存储的 特征码对所述语音信号的特征码进行匹配;
步骤203、若匹配成功,根据该语音信号的特征码对应的文本信息,生成携带所述文本信息的语音消息,所述语音消息还包括消息类型。
其中,本实施例的语音识别控制方法可以由上述实施例中的语音识别控制系统完成,语音识别控制系统的具体结构可以参照上述实施例一和实施例二的相关描述,如图4b所示,为本发明实施例四提供的语音识别控制方法的信令流程示意图,其中,上述步骤101对语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所述语音信号对应的文本信息,具体方法可以包括:
步骤301、语音消息识别子系统的语音获取模块从语音输入设备的语音采集模块获取语音信号。如果语音获取模块启动接收语音信号,则语音输入设备可以不间断地向语音获取模块传送语音信号,直至语音获取模块中止相关接收过程。
步骤302、语音获取模块将获取的各路语音信号进行量化、去噪等预处理,将预处理的语音信号推送给语音处理模块。
上述的步骤301至步骤302是语音获取与预处理流程。步骤302中将预处理后的语音信号推送给语音处理模块的过程,可以是同步或异步操作过程,既可以实时推送,也可以每隔一段时间推送一定数据量的语音信号。语音获取模块还可以设置语音输入设备的运行参数和运行状态。其中,运行参数主要包括语音采样率和输入格式,运行状态包括启动、停止、暂停等。此外,语音获取模块还可以向对应的语音输入设备反馈语音信号的接收状态。
步骤303、语音处理模块对语音获取模块传送的各路语音信号优化处理,推送给语音识别模块。例如:如果存在多路语音信号,可以将多路语音信号按一定规则合成为单路语音信号。上述步骤302中预处理语音信号的过程也可以由语音处理模块完成,预处理的过程也可以归属于对语音信号进行优化处理的过程中。
步骤304、语音处理模块可以将优化处理后的语音信号连续分块地向语音识别模块推送语音信号。步骤304可以是同步或异步的过程。
上述的步骤303和步骤304为语音优化处理的过程。
步骤305、语音识别模块接收到来自语音处理模块的语音信号后,对语音信号进行识别,得到文本信息,具体方法是:语音识别模块提取语音信号的特征码,查找消息特征库中预先存储的特征码,如果在消息特征库中预先存储的特征码中查找到与语音信号的特征码相同或相似的特征码,则匹配成功,获取该语音信号的特征码对应的文本信息。
步骤306、语音识别模块将识别出的文本信息推送给第一消息通知模块。
上述的步骤305和步骤306为语音识别的过程,可以将语音信号识别成文本信息。
步骤307、第一消息通知模块将接收到的文本信息封装成应用单元可以识别的语音消息,封装后的语音消息中携带消息类型和文本信息。
步骤308、语音消息识别子系统的第一消息通知模块将携带消息类型和文本信息的语音消息发送给语音消息识别子系统的第一服务交互接口,然后该语音消息识别子系统第一的服务交互接口将该语音消息推送给语音消息通知子系统的第二服务交互接口。
上述的步骤307到步骤308是语音消息通知的过程,可以将携带消息类型和文本信息的语音消息推送给语音消息通知子系统。
本实施例通过语音消息中间件对语音输入设备输入的语音信号进行识别得到携带消息类型和对应的文本信息的语音消息后,若存在需要该消息类型的应用单元,则可以将该语音消息发送至该应用单元,可以控制该应用单元的运行状态,该语音控制具有通用性,可以适用于各种功能的应用单元。
实施例五
图5a为本发明实施例五提供的语音识别控制方法的流程示意图,如图5所示,在实施例三、四的基础上,该语音识别控制方法的步骤102可以包括:
步骤401、将各个语音消息保存为一个消息队列;
步骤402、定期检查所述消息队列中当前是否存在需要发送的语音消息。
步骤403、若存在需要发送的语音消息,则提取所述语音消息的消息类型,查询是否存在需要该消息类型的语音消息的应用单元;
步骤404、若存在,则向所述需要该消息类型的语音消息的应用单元发送所述语音消息。
其中,本实施例的语音识别控制方法可以由上述实施例中的语音识别控制系统完成,语音识别控制系统的具体结构可以参照上述实施例一和实施例二的相关描述,如图5b所示,为本发明实施例五提供的语音识别控制方法中消息管理的信令流程示意图,其中,语音消息中间件的语音消息通知子系统的各个模块获取并管理语音消息识别子系统发送的语音消息的主要处理流程可以包括:
步骤501、语音消息通知子系统的第二服务交互接口接收语音消息识别子系统的第一服务交互接口发送的携带消息类型和文本信息的语音消息。该步骤可以接着上一实施例中的步骤308。
步骤502、语音消息通知子系统的第二服务交互接口将携带消息类型和文本信息的语音消息推送给消息管理模块。
步骤503、消息管理模块提取语音消息的消息类型后,指示应用管理模块进行收方检查,即检查是否有应用单元需要该消息类型的语音消息。
步骤504、应用管理模块查询是否有应用需要指定消息类型的语音消息,如果存在有应用需要指定消息类型的语音消息,则向消息管理模块返回成功的检查结果,执行步骤507;否则,向消息管理模块返回失败的检查结果后执行步骤505。
步骤505、如果没有应用单元需要指定消息类型的语音消息,消息管理模块将无主语音消息的相关信息如:语音消息的消息类型、无应用单元需要的状态等,推送给第二服务控制模块,以获取的无主语音消息的处理方法。 其中,本实施例中的无主语音消息是指没有应用单元注册需要的指定消息类型的语音消息。
步骤506、第二服务控制模块返回无主语音消息的处理方法。例如:如果第二服务控制模块要求保留相关的无主语音消息,则转至步骤507,否则,消息管理模块抛弃相关的无主语音消息,并转至步骤508。
其中,上述步骤503-506的查询过程是可选步骤,也可以不执行步骤503-506,而执行步骤502之后,直接执行步骤507。
步骤507、消息管理模块存储相关语音消息。
步骤508、消息管理模块向第二服务交互接口反馈语音消息的处理结果,例如:正常处理,未处理等。
步骤509、语音消息通知子系统的第二服务交互接口将语音消息的处理结果反馈给语音消息识别子系统的第一服务交互接口。然后语音消息识别子系统的第一服务交互接口可以将语音消息的处理结果反馈给语音消息识别子系统的第一消息通知模块。
如图5c所示,为本发明实施例五提供的语音识别控制方法中消息通知的信令流程示意图,其中,若存在需要所述消息类型的应用单元,则语音消息通知子系统的各个模块将所述语音消息发送至所述应用单元的具体过程可以包括:
步骤601、消息管理模块定期检查消息队列中是否存在需要发送的语音消息。如果存在,则执行步骤602;如果不存在,则继续定期检查。
步骤602、消息管理模块通过应用管理模块查询是否存在需要接收某一消息类型(步骤601中查找到的需要发送的某一条语音消息的消息类型)的应用单元。
步骤603、应用管理模块将查询结果返回给消息管理模块。如果应用管理模块没有查到需要接收该消息类型的应用单元,则消息管理模块可以删除这一条语音消息,并转回步骤601,继续处理下一条语音消息。如果查到存 在需要该消息类型的应用单元,则执行步骤604。
步骤604、消息管理模块通过第二消息通知模块,向查找到需要该消息类型的应用单元推送该语音消息。
步骤605、第二消息通知模块将该语音消息推送给应用交互接口。
步骤606、应用交互接口向应用单元推送该语音消息。
步骤607、应用单元的消息处理模块接收到该语音消息后,向应用交互接口反馈处理结果。
步骤608、应用交互接口将应用单元的语音消息处理结果反馈给第二消息通知模块。
步骤609、第二消息通知模块将语音消息处理结果反馈给消息管理模块。
如果一条语音消息有多个接收应用单元,则可以重复执行步骤604至步骤609,依次或同时向每个应用单元推送某一消息类型的语音消息。
此外,消息管理模块在处理完某条语音消息后,可以删除该条语音消息相关的信息。
本实施例通过语音消息中间件对语音输入设备输入的语音信号进行识别得到携带消息类型和对应的文本信息的语音消息后,若存在需要该消息类型的应用单元,则可以将该语音消息发送至该应用单元,可以控制该应用单元的运行状态,该语音控制具有通用性,可以适用于各种功能的应用单元。
实施例六
在实施例三、四、五的基础上,本发明实施例六提供的语音识别控制方法,在进行语音识别之前或者过程中还可以包括注册过程和/或注销过程。
其中,如图6a所示,为本发明实施例六提供的语音识别控制方法中注册过程的流程示意图,注册过程为:根据所述应用单元的语音消息获取请求的注册信息,对所述应用单元的语音识别控制功能进行注册,具体可以包括:
步骤701、接收应用单元的语音消息获取请求的注册信息,所述注册信息中包括所述应用单元的注册所需的四元组信息,所述四元组信息包括应用 标识、消息类型、消息参数和消息获取接口;
步骤702、若所述注册信息有效,根据所述四元组信息,查询所述应用单元的语音识别控制功能是否已经注册;
步骤703、如果未注册,则存储所述应用单元的四元组信息,根据所述四元组信息生成对应的消息接收标识码,并向所述应用单元返回携带所述消息接收标识码的注册成功结果。由于消息接收标识码与该应用单元的四元组信息对应,通过该消息接收标识码可以快速查找到该应用单元的四元组信息,从而加快注册速度,并对在后续需要对应用单元进行注销时,加快注销速度。
其中,本实施例的语音识别控制方法可以由上述实施例中的语音识别控制系统完成,语音识别控制系统的具体结构可以参照上述实施例一和实施例二的相关描述,如图6b所示,为本发明实施例六提供的语音识别控制方法中注册过程的信令流程示意图,其中,语音消息中间件的语音消息通知子系统的各个模块根据应用单元的语音消息获取请求的注册信息,对应用单元的语音识别控制功能进行注册的具体过程如下:
步骤801、语音消息通知子系统的应用交互接口接收应用单元的语音消息获取请求的注册信息,其中,注册信息包括应用类型、应用标识、消息获取接口、消息类型、消息参数等,其中,应用标识、消息类型、消息参数和消息获取接口为该注册信息的四元组信息。
步骤802、语音消息通知子系统的应用交互接口对应用单元的语音消息获取请求的注册信息进行预处理,并将相关的注册信息转发给语音消息通知子系统的第一应用注册模块。
步骤803、第一应用注册模块将注册信息发送给应用管理模块,指示应用管理模块查询应用单元的语音识别控制功能是否已经注册。其中,第一应用注册模块还可以检查应用单元通过语音消息获取请求的注册信息提供的注册信息是否符合约定的规则,如果符合约定的规则,则有效,如果不符合约定的规则,则直接转至步骤806直接返回处理结果。
步骤804、应用管理模块检查该应用单元的注册信息是否已经存在,如果应用单元的注册信息已经存在,表明该应用单元的语音识别控制功能已经注册,则转到步骤805,反馈注册结果。如果未注册,则存储该应用单元的注册信息(包括四元组信息),并生成消息接收标识码,通过步骤805返回注册结果。此外,如果该应用单元的语音消息获取请求的注册信息是第一个有效请求,则应用管理模块可以通知语音消息通知子系统的第二服务控制模块,有应用单元要获取语音消息,语音消息通知子系统的第二服务控制模块可以检查并启动语音消息识别子系统。
步骤805、应用管理模块向语音消息通知子系统的第一应用注册模块反馈应用单元的注册信息的处理结果,例如:处理成功、失败或未处理。
步骤806、语音消息通知子系统的第一应用注册模块将处理结果反馈给语音消息通知子系统的应用交互接口。
步骤807、语音消息通知子系统的应用交互接口将处理结果反馈给应用单元的第二应用注册模块。
其中,语音消息通知子系统的第一应用注册模块通过应用交互接口向应用单元反馈的注册结果可以包括:注册的状态如成功或失败;语音消息获取请求的注册信息处理失败原因如:四元组信息不对;注册成功时返回消息接收标识码等。
应用单元根据语音消息通知子系统的第一应用注册模块的反馈结果做后继处理。如果注册成功,则应用单元需要保存反馈的消息接收标识码。注册成功后,应用单元通过注册的消息获取接口获取通知消息。
其中,如图6c所示,本发明实施例六提供的语音识别控制方法中注销过程的流程示意图,注销过程为:根据所述应用单元的语音消息获取请求的注销信息,对所述应用单元的语音识别控制功能进行注销,具体可以包括:
步骤901、接收应用单元的发送的语音消息获取请求的注销信息,所述注销信息包括已经注册的消息接收标识码和四元组信息;
步骤902、若所述消息接收标识码和所述四元组信息正确,则删除所述消息接收标识码和所述四元组信息,以使所述消息接收标识码失效。其中,如果仅存在该已注销的应用单元需要的某一消息类型的语音消息,则可以删除该消息类型的语音消息;如果存在多个应用单元需要相同的消息类型的语音消息,则可以逐个检查是否还有需要该消息类型的应用单元,如果没有,则可以删除该消息类型的语音消息。在消息队列为空时,则语音消息通知子系统可以通知语音消息识别子系统停止语音消息的获取与识别过程。
如图6d所示,为本发明实施例六提供的语音识别控制方法中注销过程的信令流程示意图,其中,对于已经向语音消息通知子系统成功注册过的应用单元,语音消息中间件的语音消息通知子系统的各个模块可以根据应用单元的语音消息获取请求的注销信息,对应用单元的语音识别控制功能进行注销,注销时,应用单元需要提供注册时生成的相应的消息接收标识码及与该消息接收标识码对应的四元组信息,具体过程如下:
步骤111、应用单元的第二应用注册模块向语音消息通知子系统的应用交互接口发送语音消息获取请求的注销信息。注销信息的内容主要包括,消息接收标识码、该消息接收标识码对应的四元组。
步骤112、语音消息通知子系统的应用交互接口将应用的语音消息获取请求的注销信息转发给语音消息通知子系统的第一应用注册模块。
步骤113、语音消息通知子系统的第一应用注册模块通过语音消息通知子系统的应用管理模块检查应用单元的注销信息中的请求类型等四元组信息是否完整,以及消息接收标识码是否存在和有效。如果四元组信息不完整,或者消息接收标识码不存在,则直接转至步骤115,通知语音消息获取请求的注销信息失败;否则,执行步骤114。
步骤114、如果应用单元提交的消息接收标识码及对应的四元组信息存在且有效,应用管理模块检查是否还有应用单元需要接收语音消息。如果没有应用单元需要接收语音消息,则应用管理模块通知第二服务控制模块无应 用需要获取语音消息,此时,语音消息通知子系统的第二服务控制模块可以通知语音消息识别子系统停止语音的获取与识别过程。
步骤115、语音消息通知子系统的应用管理模块将注销信息的处理结果反馈给语音消息通知子系统的第一应用注册模块。
步骤116、语音消息通知子系统的第一应用注册模块将处理结果反馈给语音消息通知子系统的应用交互接口。
步骤117、语音消息通知子系统的应用交互接口将语音消息获取请求的注销信息的处理结果反馈给应用单元的第二应用注册模块。语音消息通知子系统向应用单元反馈的处理结果可以包括:应用单元的语音消息获取请求的注销信息的处理状态如成功或失败;请求处理失败原因如四元组信息不对等。如果语音消息获取请求的注销信息处理成功,则其对应的消息接收标识码失效。
如图6e所示,为本发明实施例六提供的语音识别控制方法中状态控制的信令流程示意图,其中,语音服务中间件的语音消息通知子系统和语音消息识别子系统的状态控制过程可以包括:
步骤121、语音消息通知子系统的应用管理模块检查是否有应用单元需要获取语音消息。
步骤122、如果语音消息通知子系统的应用管理模块检查到有应用单元需要获取语音消息,则通知语音消息通知子系统的第二服务控制模块检查和控制语音消息识别子系统的运行状态。
例如:语音消息通知子系统的应用管理模块在处理应用单元的语音消息获取请求的注册或注销信息时,检查当前是否有应用单元需要获取语音消息,如果有,则通知语音消息通知子系统的第二服务控制模块启动语音消息识别子系统;如果没有,则通知语音消息通知子系统的第二服务控制模块可以关闭语音消息识别子系统。
步骤123、语音消息通知子系统的第二服务控制模块指示语音消息通知 子系统的第二服务交互接口,检查语音消息识别子系统的运行状态。其中,语音消息识别子系统的运行状态主要包括:语音消息识别子系统是否启动、语音获取模块、语音处理模块及语音识别模块等是否正常工作。
步骤124、语音消息通知子系统的第二服务交互接口检查语音消息识别子系统是否启动,如果启动,则执行步骤125;如果未启动,则执行步骤128。
步骤125、语音消息通知子系统的第二服务交互接口通过语音消息识别子系统的第一服务交互接口,向语音消息识别子系统的第一服务控制模块发送当前的状态获取请求。
步骤126、语音消息识别子系统的第一服务控制模块检查语音消息识别子系统的当前状态,并将该当前状态返回给语音消息识别子系统的第一服务交互接口。
步骤127、语音消息识别子系统的第一服务交互接口将获取到的语音消息识别子系统的当前状态反馈给语音消息通知子系统的第二服务交互接口。
步骤128、语音消息通知子系统的第二服务交互接口将获取到的语音消息识别子系统的当前状态转发给语音消息通知子系统的第二服务控制模块。其中,如果是未启动,则返回语音消息识别子系统未启动的运行状态,如果已经启动,则返回语音消息识别子系统各个子模块的当前状态。
上述的步骤123至步骤128是语音消息识别子系统的运行状态查询流程。通过步骤123到步骤128、语音消息通知子系统的第二服务控制模块可以实时或周期性的获知语音消息识别子系统的当前状态。
步骤129、如果语音消息通知子系统的第二服务控制模块检查到有应用需要获取语音消息,且语音消息识别子系统未启动,则语音消息通知子系统的第二服务控制模块启动语音消息识别子系统,然后,执行步骤123至步骤128检查语音消息识别子系统的当前状态。如果语音消息通知子系统的第二服务控制模块接收到的状态为语音消息识别子系统已经启动,且获取了语音消息识别子系统的当前状态,例如:启动或暂停语音消息获取、处理或识别 过程等,则执行步骤130。
此外,如果语音消息通知子系统的第二服务控制模块接收到的状态为语音消息识别子系统已经启动,但是无应用单元需要获取语音消息,则可以转至步骤138,关闭语音消息识别子系统。
步骤130、语音消息通知子系统的第二服务控制模块将语音消息识别子系统的当前状态发送给语音消息通知子系统的第二服务交互接口。
步骤131、语音消息通知子系统的第二服务交互接口将语音消息识别子系统的当前状态发送给语音消息识别子系统的第一服务交互接口。
步骤132、语音消息识别子系统的第一服务交互接口将语音消息识别子系统的当前状态发送给语音消息识别子系统的第一服务控制模块。
步骤133、语音消息识别子系统的第一服务控制模块根据接收到的当前状态,控制语音消息识别子系统的各个模块例如:语音获取模块的状态调整。
步骤134、语音消息识别子系统的语音获取模块根据接收到的当前状态调整自己的状态后,向语音消息识别子系统的第一服务控制模块反馈调整结果,将最新的运行状态反馈给语音消息识别子系统的第一服务控制模块。
语音消息识别子系统的第一服务控制模块可以按照与上述步骤133和步骤134类似的方法及相关的控制状态,控制其它模块例如,语音处理模块、语音识别模块等的运行状态。
步骤135、语音消息识别子系统的第一服务控制模块收集各个模块的当前状态,并将收集的各个模块的当前状态反馈给语音消息识别子系统的第一服务交互接口。
步骤136、语音消息识别子系统的第一服务交互接口将语音消息识别子系统各个模块的当前状态反馈给语音消息通知子系统的第二服务交互接口。
步骤137、语音消息通知子系统的第二服务交互接口将语音消息识别子系统各个模块的当前状态反馈给语音消息通知子系统的第二服务控制模块。
其中,步骤130至步骤137是语音消息识别子系统各个模块的运行状态 控制流程。通过步骤130至步骤137,语音消息通知子系统的第二服务控制模块可以控制语音消息识别子系统的运行状态。
步骤138、语音消息通知子系统的第二服务控制模块关闭语音消息识别子系统。然后,如果有检查到有应用单元需要获取语音消息,再通过步骤123至步骤128检查语音消息识别子系统的运行状态。
本实施例通过语音消息中间件对语音输入设备输入的语音信号进行识别得到携带消息类型和对应的文本信息的语音消息后,若存在需要该消息类型的应用单元,则可以将该语音消息发送至该应用单元,可以控制该应用单元的运行状态,该语音控制具有通用性,可以适用于各种功能的应用单元。
本发明上述实施例中通过语音服务中间件实现本发明语音识别控制方法的过程仅为示例,对语音服务中间件的结构的划分也可以采用其他实现方式,例如:将语音消息通知子系统与语音消息识别子系统作为一个系统划分功能模块,或者改变这两个子系统的功能模块名称及相互关系。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或光等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种语音识别控制系统,其特征在于,包括:
语音输入设备,用于对接收到的语音信号进行采样,得到语音信号;将所述语音信号输入语音消息中间件;
语音消息中间件,用于对所述语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所述语音信号对应的文本信息,将所述语音消息发送至需要所述语音消息的应用单元;
应用单元,用于接收所述语音消息中间件发送的所述语音消息,根据所述语音消息中的文本信息控制所述应用单元的运行状态;
其中,所述语音消息中间件包括:
语音消息识别子系统,用于对所述语音输入设备输入的语音信号进行处理;提取所述语音信号的特征码,根据消息特征库中预先存储的特征码对所述语音信号的特征码进行匹配;若匹配成功,根据该语音信号的特征码对应的文本信息生成携带所述文本信息的语音消息,所述语音消息还包括消息类型,将所述语音消息发送至语音消息通知子系统;
语音消息通知子系统,用于提取所述语音消息的消息类型,查询是否存在需要该消息类型的语音消息的应用单元;若存在,则向所述需要该消息类型的语音消息的应用单元发送所述语音消息。
2.根据权利要求1所述的语音识别控制系统,其特征在于,所述语音消息识别子系统包括:
语音处理模块,用于对所述语音输入设备输入的语音信号进行处理;
语音识别模块,用于提取所述语音信号的特征码,根据消息特征库中预先存储的特征码对所述语音信号的特征码进行匹配;若匹配成功,根据该语音信号的特征码对应的文本信息,生成携带消息类型和所述文本信息的语音消息;
消息特征库,用于保存匹配所用的特征码;
第一消息通知模块,用于向所述语音消息通知子系统发送所述语音消息;
第一服务控制模块,用于根据所述语音消息通知子系统的指示控制所述语音消息识别子系统的运行状态。
3.根据权利要求2所述的语音识别控制系统,其特征在于,所述语音消息识别子系统还包括:
语音获取模块,用于接收所述语音输入设备输入的所述语音信号,将所述语音信号预处理后发送至所述语音处理模块;
第一服务交互接口模块,用于将所述第一消息通知模块发送的所述语音消息转发至所述语音消息通知子系统的第二服务交互接口模块;
所述第一服务控制模块,还用于控制所述语音处理模块、语音识别模块、第一消息通知模块、语音获取模块和第一服务交互接口模块之间的交互。
4.根据权利要求1-3任一所述的语音识别控制系统,其特征在于,所述语音消息通知子系统包括:
消息管理模块,用于将各个语音消息保存为一个消息队列;定期检查所述消息队列中当前是否存在需要发送的语音消息,若存在需要发送的语音消息,则提取所述语音消息的消息类型,指示应用管理模块查询是否存在需要该消息类型的语音消息的应用单元,若存在,则指示第二消息通知模块向需要该消息类型的语音消息的应用单元发送所述语音消息;
应用管理模块,用于查询是否存在需要该消息类型的语音消息的应用单元;若存在,则所述消息管理模块返回所述需要该消息类型的语音消息的应用单元的信息;
第二消息通知模块,用于根据所述消息管理模块的指示,向需要该消息类型的语音消息的应用单元发送所述语音消息;
第二服务控制模块,用于指示所述语音消息识别子系统需要控制的运行状态。
5.根据权利要求4所述的语音识别控制系统,其特征在于,所述语音消息通知子系统还包括:
应用交互接口,用于将所述第二消息通知模块的所述语音消息转发至需要该消息类型的语音消息的应用单元;将接收的所述应用单元发送的语音消息获取请求的注册或注销信息发送至第一应用注册模块;
第一应用注册模块,用于根据所述应用单元的语音消息获取请求的注册或注销信息,对所述应用单元的语音识别控制功能进行注册或注销;
第二服务交互接口模块,用于接收所述语音消息识别子系统的第一服务交互接口模块发送的所述语音消息;
所述第二服务控制模块,还用于控制所述应用管理模块、消息管理模块、第二消息通知模块、应用交互接口、第一应用注册模块和第二服务交互接口模块之间的交互。
6.一种语音识别控制方法,其特征在于,包括:
对语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所述语音信号对应的文本信息;
将所述语音消息发送至需要所述语音消息的应用单元,以使所述应用单元根据所述语音消息中的文本信息控制应用单元的运行状态;
其中,所述对语音输入设备输入的语音信号进行识别得到语音消息,所述语音消息中携带所述语音信号对应的文本信息,包括:
对所述语音输入设备输入的语音信号进行处理;
提取所述语音信号的特征码,根据消息特征库中预先存储的特征码对所述语音信号的特征码进行匹配;
若匹配成功,根据该语音信号的特征码对应的文本信息,生成携带所述文本信息的语音消息,所述语音消息还包括消息类型;
所述将所述语音消息发送至需要所述语音消息的应用单元,包括:
若存在需要发送的语音消息,则提取所述语音消息的消息类型,查询是否存在需要该消息类型的语音消息的应用单元;
若存在,则向所述需要该消息类型的语音消息的应用单元发送所述语音消息。
7.根据权利要求6所述的语音识别控制方法,其特征在于,所述提取所述语音消息的消息类型之前,包括:
将各个语音消息保存为一个消息队列;
定期检查所述消息队列中当前是否存在需要发送的语音消息。
8.根据权利要求6或7所述的语音识别控制方法,其特征在于,还包括:
根据所述应用单元的语音消息获取请求的注册信息,对所述应用单元的语音识别控制功能进行注册;或
根据所述应用单元的语音消息获取请求的注销信息,对所述应用单元的语音识别控制功能进行注销。
9.根据权利要求8所述的语音识别控制方法,其特征在于,所述根据所述应用单元的语音消息获取请求的注册信息,对所述应用单元的语音识别控制功能进行注册,包括:
接收应用单元的语音消息获取请求的注册信息,所述注册信息中包括所述应用单元的注册所需的四元组信息,所述四元组信息包括应用标识、消息类型、消息参数和消息获取接口;
若所述注册信息有效,根据所述四元组信息,查询所述应用单元的语音识别控制功能是否已经注册;
如果未注册,则存储所述应用单元的四元组信息,根据所述四元组信息生成对应的消息接收标识码,并向所述应用单元返回携带所述消息接收标识码的注册成功结果。
10.根据权利要求8所述的语音识别控制方法,其特征在于,所述根据所述应用单元的语音消息获取请求的注销信息,对所述应用单元的语音识别控制功能进行注销,包括:
接收应用单元的发送的语音消息获取请求的注销信息,所述注销信息包括已经注册的消息接收标识码和四元组信息;
若所述消息接收标识码和所述四元组信息正确,则删除所述消息接收标识码和所述四元组信息,以使所述消息接收标识码失效。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010542451XA CN102004624B (zh) | 2010-11-11 | 2010-11-11 | 语音识别控制系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010542451XA CN102004624B (zh) | 2010-11-11 | 2010-11-11 | 语音识别控制系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102004624A CN102004624A (zh) | 2011-04-06 |
CN102004624B true CN102004624B (zh) | 2012-08-22 |
Family
ID=43812010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010542451XA Active CN102004624B (zh) | 2010-11-11 | 2010-11-11 | 语音识别控制系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102004624B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103369385A (zh) * | 2012-03-29 | 2013-10-23 | 东方有线网络有限公司 | 一种基于智能终端显示机顶盒节目信息并控制机顶盒的方法 |
CN103730117A (zh) | 2012-10-12 | 2014-04-16 | 中兴通讯股份有限公司 | 一种自适应智能语音装置及方法 |
CN103077234A (zh) * | 2013-01-07 | 2013-05-01 | 季雪峰 | 语音网址导航系统及方法 |
WO2014187418A1 (zh) * | 2013-09-29 | 2014-11-27 | 中兴通讯股份有限公司 | 在线交互处理方法、装置及服务器 |
CN104159138B (zh) * | 2014-09-02 | 2018-01-16 | 上海斐讯数据通信技术有限公司 | 一种语音遥控方法及系统 |
KR102245747B1 (ko) | 2014-11-20 | 2021-04-28 | 삼성전자주식회사 | 사용자 명령어 등록을 위한 디스플레이 장치 및 방법 |
CN105929700A (zh) * | 2016-04-26 | 2016-09-07 | 海信(山东)空调有限公司 | 智能控制方法和装置 |
KR20180060328A (ko) | 2016-11-28 | 2018-06-07 | 삼성전자주식회사 | 멀티 모달 입력을 처리하는 전자 장치, 멀티 모달 입력을 처리하는 방법 및 멀티 모달 입력을 처리하는 서버 |
CN108401066B (zh) * | 2017-02-08 | 2022-01-25 | 北京奇虎科技有限公司 | 在智能终端中进行语音控制的方法、装置和智能终端 |
CN107957908A (zh) * | 2017-11-20 | 2018-04-24 | 深圳创维数字技术有限公司 | 一种麦克风共享方法、装置、计算机设备及存储介质 |
CN109256117A (zh) * | 2018-11-20 | 2019-01-22 | 北京千丁互联科技有限公司 | 一种语音数据处理方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1893593A (zh) * | 2005-07-01 | 2007-01-10 | 汤京乐 | 语音识别与通信技术结合的选台及选节目的电视遥控器 |
CN201622839U (zh) * | 2009-12-16 | 2010-11-03 | 比亚迪股份有限公司 | 一种无线语音汽车远程控制系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60030702T2 (de) * | 2000-06-30 | 2007-01-11 | Alcatel | Steuerung der Kapazität eines verteilten Spracherkennungssystems |
-
2010
- 2010-11-11 CN CN201010542451XA patent/CN102004624B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1893593A (zh) * | 2005-07-01 | 2007-01-10 | 汤京乐 | 语音识别与通信技术结合的选台及选节目的电视遥控器 |
CN201622839U (zh) * | 2009-12-16 | 2010-11-03 | 比亚迪股份有限公司 | 一种无线语音汽车远程控制系统 |
Also Published As
Publication number | Publication date |
---|---|
CN102004624A (zh) | 2011-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102004624B (zh) | 语音识别控制系统和方法 | |
CN101246486B (zh) | 用于改进的表达式处理的方法和装置 | |
US11087090B2 (en) | System for focused conversation context management in a reasoning agent/behavior engine of an agent automation system | |
CN102708865A (zh) | 语音识别方法、装置及系统 | |
CN101730008A (zh) | 用于消息生成的方法、系统和装置 | |
CN101611403A (zh) | 用于移动通信设备中的语音搜索的方法和装置 | |
US11930051B2 (en) | Network service system, computer storage medium for communication, and network service method | |
CN103744836A (zh) | 一种人机对话方法及装置 | |
CN109840318A (zh) | 一种表单项的填写方法及系统 | |
EP2139214A1 (en) | System and method to provide services based on network | |
CN109670033A (zh) | 内容的检索方法、装置、设备及存储介质 | |
CN113051389B (zh) | 知识推送方法及装置 | |
CN109145092B (zh) | 一种数据库更新、智能问答管理方法、装置及其设备 | |
CN104392366B (zh) | 数据比对信息获取的方法、装置及系统 | |
CN101150715A (zh) | 电视节目搜索方法和装置以及数字电视终端 | |
US20020072916A1 (en) | Distributed speech recognition for internet access | |
CN109964473A (zh) | 语音业务应答的方法及装置 | |
EP3193559B1 (en) | Information processing method and device | |
CN112133306B (zh) | 一种基于快递用户的应答方法、装置和计算机设备 | |
US10529323B2 (en) | Semantic processing method of robot and semantic processing device | |
KR20050034680A (ko) | 문자메시지를 이용한 전화번호안내시스템 | |
CN113112711A (zh) | 语音接单器、基于智能语音技术的订单管理方法和系统 | |
CN111211967B (zh) | 一种群组成员通知方法及装置 | |
CN103745009B (zh) | 信息处理方法和信息处理设备 | |
CN111770236A (zh) | 一种对话处理方法、装置、系统、服务器和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |