CN101677329A - 一种综合语音资源平台代理服务器及其数据处理方法 - Google Patents

一种综合语音资源平台代理服务器及其数据处理方法 Download PDF

Info

Publication number
CN101677329A
CN101677329A CN200810222601A CN200810222601A CN101677329A CN 101677329 A CN101677329 A CN 101677329A CN 200810222601 A CN200810222601 A CN 200810222601A CN 200810222601 A CN200810222601 A CN 200810222601A CN 101677329 A CN101677329 A CN 101677329A
Authority
CN
China
Prior art keywords
server
speech business
client
channel
load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200810222601A
Other languages
English (en)
Other versions
CN101677329B (zh
Inventor
郑国荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN 200810222601 priority Critical patent/CN101677329B/zh
Publication of CN101677329A publication Critical patent/CN101677329A/zh
Application granted granted Critical
Publication of CN101677329B publication Critical patent/CN101677329B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种综合语音资源平台代理服务器及其数据处理方法,其中的方法包括:代理服务器建立与客户端之间的第一通道;在客户端请求语音业务时,代理服务器与鉴权服务器交互,实现对客户端的鉴权;代理服务器根据预先保存的至少两个语音业务服务器的负载情况,建立与第一语音业务服务器之间的第二通道;在第一通道和第二通道建立后,代理服务器利用第一通道和第二通道传输客户端和第一语音业务服务器在处理语音业务时交互的信息。本发明把广泛使用的网络代理服务器技术和TTS/ASR技术结合起来,根据请求类型的路由进行负载均衡,并在负载均衡的基础上,实现了TTS/ASR语音资源平台的快速接入,提高了综合语音平台的性能。

Description

一种综合语音资源平台代理服务器及其数据处理方法
技术领域
本发明涉及通讯领域中的语音增值业务技术,尤其涉及一种基于自动语音识别(Automatic Speech Recognition,ASR)/语音合成(Txt to Speech,TTS)应用的综合语音资源平台代理服务器及其数据处理方法。
背景技术
现有技术ASR为根据事先定义的语法规则,对用户说话的内容进行识别,并输出识别结果,免去按键的烦恼,即,使用语法信息的形式来识别用户的回答。系统可以根据识别的结果再结合ASR应用与用户进行交互完成比较复杂的业务,如语音电话本、语音通讯录、自动声讯台等。
现有技术的TTS是将文本文件,如帮助文件或者网页,转换成自然语音输出。这种应用使用范围越来越广泛,如号码百事通的电话号码报号、电子商务等都有TTS的应用案例。
随着TTS和ASR的技术日趋成熟和这两种技术的相互结合,使得基于TTS/ASR语音资源平台的语音增值业务象雨后春笋般不断涌现和迅猛发展,用户数激增。目前采用的单一客户端服务器(Customer Server,CS)对应单一的TTS/ASR服务器的方式,导致用户在接入时,由于不知道哪个TTS或ASR服务器有剩余资源,因此,可能会只使用某一个TTS或ASR服务器,出现排队现象。这种情况下,如何实现TTS/ASR平台快速接入、多服务器间的负载均衡、达到更高的识别效果和性能要求成为运营商亟待解决的问题。
发明内容
为了解决单一的TTS或ASR服务器导致的负载不均衡的问题,本发明提出了一种综合语音资源平台代理服务器,本发明的代理服务器是一种基于多TTS/ASR服务器的语音综合平台代理服务器,与客户端连接,包括:
消息分发模块,与所述客户端之间具有第一通道;
鉴权模块,用于在所述客户端请求语音业务时,与鉴权服务器交互,实现对所述客户端的鉴权;
保存模块,用于保存所述语音业务对应的至少两个语音业务服务器的负载信息;
处理模块,用于根据所述至少两个语音业务服务器的负载信息,建立所述消息分发模块与第一语音业务服务器之间的第二通道,所述第一语音业务服务器的负载低于所述至少两个语音业务服务器的负载的最大值;
所述第一通道和第二通道用于传输所述客户端和所述第一语音业务服务器在处理所述语音业务时交互的信息。
所述负载信息包括:通道总数、通道占用数以及空闲通道数。
所述至少两个语音业务服务器为媒体资源控制协议服务器和/或语音合成服务器。
当所述至少两个语音业务服务器为媒体资源控制协议服务器和语音合成服务器时,所述代理服务器还包括:
判断模块,用于判断所述语音业务的类型为自动语音识别请求或语音合成请求;
当所述语音业务的类型为自动语音识别请求时,
所述保存模块包括:
第一保存单元,用于保存与所述自动语音识别请求对应的至少两个媒体资源控制协议服务器的负载信息;
所述处理模块包括:
第一处理单元,用于根据所述至少两个媒体资源控制协议服务器的负载信息,建立所述消息分发模块与第一媒体资源控制协议服务器之间的第二通道,所述第一媒体资源控制协议服务器的负载为所述至少两个媒体资源控制协议服务器的负载的最小值;
当所述语音业务的类型为语音合成请求时,
所述保存模块包括:
第二保存单元,用于保存与所述语音合成请求对应的至少两个语音合成服务器的负载信息;
所述处理模块包括:
第二处理单元,用于根据所述至少两个语音合成服务器的负载信息,建立所述消息分发模块与第一语音合成服务器之间的第三通道,所述第一语音合成服务器的负载为所述至少两个语音合成服务器的负载的最小值。
所述综合语音资源平台代理服务器还包括:
计费模块,用于在所述客户端与所述第一语音业务服务器建立起连接后,与计费服务器交互,实现对所述客户端的计费。
本发明还提供了一种数据处理方法,包括以下步骤:
代理服务器建立与客户端之间的第一通道;
在所述客户端请求语音业务时,所述代理服务器与鉴权服务器交互,实现对所述客户端的鉴权;
所述代理服务器根据预先保存的至少两个语音业务服务器的负载情况,建立与第一语音业务服务器之间的第二通道,所述第一语音业务服务器的负载低于所述至少两个语音业务服务器的负载的最大值;
在所述第一通道和第二通道建立后,所述代理服务器利用所述第一通道和第二通道传输所述客户端和所述第一语音业务服务器在处理所述语音业务时交互的信息。
所述语音业务服务器为:媒体资源控制协议服务器和/或语音合成服务器。
所述负载情况包括:通道总数、通道占用数以及空闲通道数。
所述第一语音业务服务器的负载为所述至少两个语音业务服务器的负载的最小值。
当所述语音业务服务器为媒体资源控制协议服务器和语音合成服务器时,所述建立与客户端之间的第一通道的步骤之前还包括步骤:
判断所述客户端请求的语音业务的类型;
鉴权通过后,根据与所述客户端请求的语音业务对应的预先保存的至少两个语音业务服务器的负载情况,建立与第一语音业务服务器之间的第二通道。
当所述客户端请求类型为自动语音识别请求时,所述代理服务器根据所述至少两个媒体资源控制协议服务器的负载信息,建立与第一媒体资源控制协议服务器之间的第二通道;
在所述第一通道和第二通道建立后,所述代理服务器利用所述第一通道和第二通道传输所述客户端和所述第一媒体资源控制协议服务器在处理所述自动语音识别业务时交互的信息。
当所述客户端请求类型为语音合成请求时,所述代理服务器根据所述至少两个语音合成服务器的负载信息,建立与第一语音合成服务器之间的第三通道;
在所述第一通道和第三通道建立后,所述代理服务器利用所述第一通道和第三通道传输所述客户端和所述第一语音合成服务器在处理所述语音合成业务时交互的信息。
与现有技术相比,本发明具有以下有益效果:
本发明把目前广泛使用的网络代理服务器技术和TTS/ASR技术有机的结合起来,根据请求类型的路由进行负载均衡,并在负载均衡的基础上,实现了TTS/ASR语音资源平台的快速接入,并且利用鉴权/计费服务器有效解决了服务提供商(Service Provider,SP)使用语音资源平台鉴权和计费的问题,从而提高了综合语音平台的性能。
附图说明
图1为本发明的代理服务器的结构示意图;
图2为本发明的代理服务器在TTS/ASR综合语音平台中的实施示意图;
图3为本发明的代理服务器处理数据的流程图;
图4为本发明的代理服务器处理ASR的流程图;
图5为本发明的代理服务器处理TTS转换的流程图。
具体实施方式
本发明把当前的网络代理技术应用到TTS/ASR语音综合平台,提供了一种实现多服务器之间的负载均衡,快速接入TTS/ASR语音资源平台,能对SP进行鉴权和计费的语音资源代理服务器。
本发明的服务器用于同IVR(Interactive Voice Response,互动式语音应答)完成IVR平台的鉴权,并根据请求类型的路由进行负载均衡,然后,同TTS/MRCP(Media Resource Control Protocol,媒体资源控制协议)服务器交互完成TTS/ASR处理,同时与AAA(Authentication Authorization Accounting,认证/授权/统计)服务器交互完成SP接入鉴权,以及SP使用TTS/ASR资源计费的功能。
下面结合附图对本发明的具体实施方式作进一步详细说明。
参考图1,图1为本发明的代理服务器的结构示意图,包括:
消息分发模块,与客户端之间具有第一通道;
鉴权模块,用于在客户端请求语音业务时,与鉴权服务器交互,实现对客户端的鉴权;
保存模块,用于保存语音业务对应的至少两个语音业务服务器的负载信息;
处理模块,用于根据至少两个语音业务服务器的负载信息,建立消息分发模块与第一语音业务服务器之间的第二通道,第一语音业务服务器的负载低于至少两个语音业务服务器的负载的最大值;
第一通道和第二通道用于传输客户端和第一语音业务服务器在处理语音业务时交互的信息。
下面以本发明的代理服务器在TTS/ASR语音综合平台中的三种应用为例,对本发明的代理服务器进行详细说明。
<第一实施例>
本实施例中,代理服务器既可以处理客户端的ASR请求,又可以处理客户端的TTS请求。因此,代理服务器同时与至少两个MRCP服务器和至少两个TTS服务器连接。本例实施中将TTS和ASR服务器通称为语音服务器。
本实施例的代理服务器在TTS/ASR语音综合平台中的实施示意图参考图2所示。图2中显示了第一、第二、第三3个代理客户端,第一、第二两个TTS服务器和第一、第二两个MRCP服务器,实际上也可以有更多。
第一、第二、第三3个代理客户端分别位于第一、第二、第三3个IVR中,用于根据SP IVR的资源申请类型,给代理服务器Proxy Server发送TTS或ASR处理请求。Proxy Server在资源平台系统中处于核心地位。
当客户请求中既包括ASR请求,又包括TTS请求时,处理模块中包括:MRCP处理单元和TTS协议处理单元。
MRCP处理单元处理与SP IVR、MRCP服务器的MRCP协议交互过程,管理MRCP会话状态、保存各个MRCP服务器的负载状态、负责客户端ASR请求的路由、维护客户端与MRCP服务器连接关系、根据MRCP协议内容确定ASR计费时间点、异常会话状态的维护等。
TTS协议处理单元处理与TTS客户端的内部协议交互过程、管理TTS会话状态、保存各个TTS服务器的负载状态、负责客户端TTS请求的路由、维护客户端与TTS服务器的连接关系、根据语音数据流量确定计费时长、异常会话状态维护等。
本实施例中还包括计费模块,用于完成与计费服务器的交互,以完成对客户端的计费。
消息分发模块负责在上述各个单元或模块,以及多个TTS或MRCP服务器之间进行消息的透传。
下面以第一代理客户端通过代理服务器与第一TTS服务器或第一MRCP服务器之间的通信为例进行说明。
第一代理客户端接收来自SP IVR的识别请求后,判断SP IVR的请求类型,如果是ASR服务请求,则第一代理客户端通过消息分发模块向鉴权模块发送请求建立MRCP连接的消息,该消息包含该SP IVR的帐号和用户密码等信息。
Proxy Server的鉴权模块接收第一代理客户端的MRCP请求建立MRCP连接消息,并通过消息分发模块向鉴权服务器发送申请鉴权请求,鉴权服务器根据帐号和用户密码进行鉴权,如果合法则返回鉴权通过信号,由消息分发模块将鉴权通过信号发送给MRCP处理单元。
在第一代理客户端向MRCP服务器发送请求建立连接的同时,也可能第二、第三或更多的客户端也在向MRCP服务器发送请求建立连接,这时,MRCP处理单元会保存下每一个MRCP服务器的通道总数、通道占用数以及空闲通道数等通道信息。
鉴权通过后,MRCP处理单元根据保存的MRCP服务器通道的占用数以及空闲通道数,选择负载最小的第一MRCP服务器,并通过消息分发模块向第一MRCP服务器发送MRCP连接请求,第一MRCP服务器资源就绪则通过消息分发模块向MRCP处理单元、计费模块和鉴权模块返回连接成功消息200ok。
MRCP处理单元将连接成功消息200ok发送回第一代理客户端。
第一代理客户端获得连接成功消息后,建立起与第一MRCP服务器的连接。同时,计费模块向计费服务器发送计费开始信号。
第一代理客户端和第一MRCP服务器建立连接后,第一代理客户端通过消息分发模块向MRCP处理单元发送语法定义请求,MRCP处理单元再通过消息分发模块向第一MRCP服务器透传语法定义请求。
第一MRCP服务器语法定义完成后将语法定义完成信息通过消息分发模块返回给MRCP处理单元,MRCP处理单元通过消息分发模块向第一代理客户端返回语法定义完成信息。
然后,第一代理客户端根据语法定义完成消息通过消息分发模块向MRCP处理单元发送开始识别请求,MRCP处理单元通过消息分发模块向第一MRCP服务器透传开始识别请求。
第一MRCP服务器如果识别成功,则通过消息分发模块向MRCP处理单元返回200ok请求成功消息,MRCP处理单元再通过消息分发模块向第一代理客户端返回200ok。
第一代理客户端根据第一MRCP服务器返回的200ok成功信号,将识别请求返回SP IVR。
第一MRCP服务器在发送200ok消息的同时,还将本服务器的通道占用消息通过消息分发模块返回MRCP处理单元,MRCP处理单元再通过消息分发模块将该通道占用消息返回第一代理客户端。
SP IVR接收到识别请求后,SP IVR的用户开始说话,第一代理客户端把SP IVR用户说话录音,并根据上文中的通道信息,利用本次与第一MRCP服务器通信过程中占用的通道向第一MRCP服务器发送语音数据。
第一MRCP服务器根据收到的语音数据,通过消息分发模块返回开始放音信号给MRCP处理单元,MRCP处理单元再通过消息分发模块将开始放音信号返回第一代理客户端。
开始放音消息标志着第一MRCP服务器完成了用户的识别请求,第一MRCP服务器通过消息分发模块将识别完成消息返回给MRCP处理单元,MRCP处理单元再通过消息分发模块将识别完成消息返回给第一代理客户端。
第一代理客户端根据识别完成消息,通过消息分发模块向MRCP处理单元和计费模块发送断开MRCP资源连接的请求消息,MRCP处理单元通过消息分发模块向第一MRCP服务器发送断开资源连接的请求。同时计费通过消息分发模块向计费服务器发送停止计费的消息。
在上文中,每当MRCP处理单元接收到第一MRCP服务器发送过来的语法定义完成、通道占用、开始放音、识别完成消息,以及向第一MRCP服务器发送的开始识别、断开MRCP资源连接(即释放链路)等消息时,都要对第一MRCP服务器的上述状态进行保存。本实施例是以第一MRCP服务器为例进行的说明,对于其他正在进行通信的MRCP服务器的当前状态也相应的要进行保存。
本实施例中选择的是负载最小的MRCP服务器与第一代理客户端通信,是最佳实施例,在平衡负载时可以达到最好的效果。当然,所选的MRCP服务器的负载只要小于MRCP服务器的负载的最大值,就可以达到平衡MRCP服务器的负载的目的。
当第一代理客户端判断SP IVR发出的请求类型为TTS请求时,第一代理客户端通过消息分发模块向ProxyServer发送TTS转换请求,该请求中包含SPIVR的帐号和用户密码等鉴权信息。
上文描述了代理服务器处理SP IVR发出的ASR请求,如果第一代理客户端判断SP IVR发出的请求类型不是ASR服务请求,则为TTS处理请求,处理TTS请求的过程将在下文中详细说明。
第一代理客户端接收来自SP IVR的识别请求后,判断SP IVR的请求类型为TTS转换请求,则第一代理客户端向鉴权模块发送TTS转换请求的消息,该消息包含该SP IVR的帐号和用户密码等信息。
Proxy Server的鉴权模块接收TTS转换请求,并根据该TTS转换请求通过消息分发模块向鉴权服务器发送申请鉴权请求。鉴权服务器根据帐号和密码进行鉴权,如果鉴权成功,由消息分发模块将鉴权通过消息200ok发送给第一代理客户端,否则通过消息分发模块将鉴权失败信号返回第一代理客户端,第一代理客户端根据该失败信号丢弃TTS请求。
在第一代理客户端向TTS服务器发送TTS转换请求的同时,也可能第二、第三或更多的客户端也在向TTS服务器发送TTS转换请求,这时,TTS协议处理单元会保存下每一个TTS服务器的通道总数、通道占用数以及空闲通道数等通道信息。
第一代理客户端接收到鉴权通过消息200ok后,向TTS协议处理单元发送TTS处理请求,协议处理单元根据预先保存的TTS服务器通道的占用数以及空闲通道数,通过消息分发模块向负载最小的第一TTS服务器和计费模块发送TTS处理请求。计费模块根据TTS处理请求,通过消息分发模块向计费服务发送计费开始信号。
第一TTS服务器根据TTS处理请求完成TTS处理后,通过消息分发模块返回TTS处理完成消息给TTS协议处理单元,TTS协议处理单元再通过消息分发模块把处理完成消息转发给第一代理客户端。
第一TTS服务器根据TTS处理请求完成TTS处理后,同时向第一代理客户端发送TTS转换后的语音数据。
发送完成后,第一TTS服务器通过消息分发模块将数据完成消息发送给TTS协议处理单元,TTS协议处理单元再将发送数据完成消息通过消息分发模块发送给第一代理客户端和计费单元。
计费单元通过消息分发模块向计费服务起发送计费结束消息。同时,第一代理客户端再根据发送数据完成消息向用户返回TTS请求的结果。
本实施例中选择的是负载最小的TTS服务器与第一代理客户端通信,是最佳实施例,在平衡负载时可以达到最好的效果。当然,所选的TTS服务器的负载只要小于TTS服务器的负载的最大值,就可以达到平衡TTS服务器的负载的目的。
<第二实施例>
本实施例中,代理服务器的处理模块仅包括MRCP处理单元,只处理客户端的ASR请求。MRCP处理单元建立客户端与MRCP服务器之间的连接的过程在第一实施例中的关于处理ASR服务请求的部分已进行了描述,在此不再赘述。
<第三实施例>
本实施例中,代理服务器的处理模块仅包括TTS协议处理单元,只处理客户端的TTS请求。TTS协议处理单元建立客户端与TTS服务器之间的连接的过程在第一实施例中的关于处理TTS请求的部分已进行了描述,在此不再赘述。
本发明还提出了基于多TTS/ASR服务器的应用代理服务器进行数据处理方法,本例实施中将TTS和ASR服务器通称为语音服务器。
本发明的代理服务器处理数据的方法参考图3所示,包括步骤:
建立与客户端之间的第一通道;
在客户端请求语音业务时,与鉴权服务器交互,实现对客户端的鉴权;
根据预先保存的至少两个语音业务服务器的负载情况,建立与第一语音业务服务器之间的第二通道,第一语音业务服务器的负载低于至少两个语音业务服务器的负载的最大值;
在所述第一通道和第二通道建立后,所述代理服务器利用所述第一通道和第二通道传输所述客户端和所述第一语音业务服务器在处理所述语音业务时交互的信息。
上述步骤中的每个步骤在处理ASR请求或TTS请求时,所包括的具体步骤请参考图3和图4。
本发明的代理服务器处理ASR的流程图参考图4所示,包括步骤:
第一代理客户端接收来自SP IVR的识别请求后,判断SP IVR的请求类型,如果是ASR服务请求,则第一代理客户端通过消息分发模块向鉴权模块发送请求建立MRCP连接的消息,该消息包含该SP IVR的帐号和用户密码等信息。
代理服务器的鉴权模块接收第一代理客户端的MRCP请求建立MRCP连接消息,并通过消息分发模块向鉴权服务器发送申请鉴权请求,鉴权服务器根据帐号和用户密码进行鉴权,如果合法则返回鉴权通过信号,由消息分发模块将鉴权通过信号发送给MRCP处理单元。
在第一代理客户端向MRCP服务器发送请求建立连接的同时,也可能第二、第三或更多的客户端也在向MRCP服务器发送请求建立连接,这时,MRCP处理单元会保存下每一个MRCP服务器的通道总数、通道占用数以及空闲通道数等通道信息。
鉴权通过后,MRCP处理单元根据保存的MRCP服务器通道的占用数以及空闲通道数,选择负载最小的第一MRCP服务器,并通过消息分发模块向第一MRCP服务器发送MRCP连接请求,第一MRCP服务器资源就绪则通过消息分发模块向MRCP处理单元、计费模块和鉴权模块返回连接成功消息200ok。
MRCP处理单元将连接成功消息200ok发送回第一代理客户端。
第一代理客户端获得连接成功消息后,建立起与第一MRCP服务器的连接。同时,计费模块向计费服务器发送计费开始信号。
第一代理客户端和第一MRCP服务器建立连接后,第一代理客户端通过消息分发模块向MRCP处理单元发送语法定义请求,MRCP处理单元再通过消息分发模块向第一MRCP服务器透传语法定义请求。
第一MRCP服务器语法定义完成后将语法定义完成信息通过消息分发模块返回给MRCP处理单元,MRCP处理单元通过消息分发模块向第一代理客户端返回语法定义完成信息。
然后,第一代理客户端根据语法定义完成消息通过消息分发模块向MRCP处理单元发送开始识别请求,MRCP处理单元通过消息分发模块向第一MRCP服务器透传开始识别请求。
第一MRCP服务器如果识别成功,则通过消息分发模块向MRCP处理单元返回200ok请求成功消息,MRCP处理单元再通过消息分发模块向第一代理客户端返回200ok。
第一代理客户端根据第一MRCP服务器返回的200ok成功信号,将识别请求返回SP IVR。
第一MRCP服务器在发送200ok消息的同时,还将本服务器的通道占用消息通过消息分发模块返回MRCP处理单元,MRCP处理单元再通过消息分发模块将该通道占用消息返回第一代理客户端。
SP IVR接收到识别请求后,SP IVR的用户开始说话,第一代理客户端把SP IVR用户说话录音,并根据上文中的通道信息,利用本次与第一MRCP服务器通信过程中占用的通道向第一MRCP服务器发送语音数据。
第一MRCP服务器根据收到的语音数据,通过消息分发模块返回开始放音信号给MRCP处理单元,MRCP处理单元再通过消息分发模块将开始放音信号返回第一代理客户端。
开始放音消息标志着第一MRCP服务器完成了用户的识别请求,第一MRCP服务器通过消息分发模块将识别完成消息返回给MRCP处理单元,MRCP处理单元再通过消息分发模块将识别完成消息返回给第一代理客户端。
第一代理客户端根据识别完成消息,通过消息分发模块向MRCP处理单元和计费模块发送断开MRCP资源连接的请求消息,MRCP处理单元通过消息分发模块向第一MRCP服务器发送断开资源连接的请求。同时计费通过消息分发模块向计费服务器发送停止计费的消息。
在上文中,每当MRCP处理单元接收到第一MRCP服务器发送过来的语法定义完成、通道占用、开始放音、识别完成消息,以及向第一MRCP服务器发送的开始识别、断开MRCP资源连接(即释放链路)等消息时,都要对第一MRCP服务器的上述状态进行保存。本实施例是以第一MRCP服务器为例进行的说明,对于其他正在进行通信的MRCP服务器的当前状态也相应的要进行保存。
本实施例中选择的是负载最小的MRCP服务器与第一代理客户端通信,所选的MRCP服务器的负载只要小于MRCP服务器的负载的最大值即可。
本发明的代理服务器处理TTS转换的流程图参考图5所示,包括:
第一代理客户端接收来自SP IVR的识别请求后,判断SP IVR的请求类型为TTS转换请求,则第一代理客户端向鉴权模块发送TTS转换请求的消息,该消息包含该SP IVR的帐号和用户密码等信息。
Proxy Server的鉴权模块接收TTS转换请求,并根据该TTS转换请求通过消息分发模块向鉴权服务器发送申请鉴权请求。鉴权服务器根据帐号和密码进行鉴权,如果鉴权成功,由消息分发模块将鉴权通过消息200ok发送给第一代理客户端,否则通过消息分发模块将鉴权失败信号返回第一代理客户端,第一代理客户端根据该失败信号丢弃TTS请求。
在第一代理客户端向TTS服务器发送TTS转换请求的同时,也可能第二、第三或更多的客户端也在向TTS服务器发送TTS转换请求,这时,TTS协议处理单元会保存下每一个TTS服务器的通道总数、通道占用数以及空闲通道数等通道信息。
第一代理客户端接收到鉴权通过消息200ok后,向TTS协议处理单元发送TTS处理请求,协议处理单元根据预先保存的TTS服务器通道的占用数以及空闲通道数,通过消息分发模块向负载最小的第一TTS服务器和计费模块发送TTS处理请求。计费模块根据TTS处理请求,通过消息分发模块向计费服务发送计费开始信号。
第一TTS服务器根据TTS处理请求完成TTS处理后,通过消息分发模块返回TTS处理完成消息给TTS协议处理单元,TTS协议处理单元再通过消息分发模块把处理完成消息转发给第一代理客户端。
第一TTS服务器根据TTS处理请求完成TTS处理后,同时向第一代理客户端发送TTS转换后的语音数据。
发送完成后,第一TTS服务器通过消息分发模块将数据完成消息发送给TTS协议处理单元,TTS协议处理单元再将发送数据完成消息通过消息分发模块发送给第一代理客户端和计费单元。
计费单元通过消息分发模块向计费服务起发送计费结束消息。同时,第一代理客户端再根据发送数据完成消息向用户返回TTS请求的结果。
本实施例中选择的是负载最小的TTS服务器与第一代理客户端通信,所选的TTS服务器的负载只要小于TTS服务器的负载的最大值即可。
综上所述,本发明结合当前日益成熟的TTS/ASR技术,提出了一种快速接入TTS/ASR语音资源平台、有效解决多服务器之间达到负载均衡,以及SP使用语音资源平台如何鉴权和计费的问题,从而提高综合语音平台的性能的代理服务器,克服了单一服务器无法满足需求的难题。本发明的方法还可以用于处理其他语音服务器与客户端进行交互时的语音业务,具有非常广阔的市场前景。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (12)

1.一种综合语音资源平台代理服务器,与客户端连接,其特征在于,包括:
消息分发模块,与所述客户端之间具有第一通道;
鉴权模块,用于在所述客户端请求语音业务时,与鉴权服务器交互,实现对所述客户端的鉴权;
保存模块,用于保存所述语音业务对应的至少两个语音业务服务器的负载信息;
处理模块,用于根据所述至少两个语音业务服务器的负载信息,建立所述消息分发模块与第一语音业务服务器之间的第二通道,所述第一语音业务服务器的负载低于所述至少两个语音业务服务器的负载的最大值;
所述第一通道和第二通道用于传输所述客户端和所述第一语音业务服务器在处理所述语音业务时交互的信息。
2.如权利要求1所述的综合语音资源平台代理服务器,其特征在于,所述负载信息包括:通道总数、通道占用数以及空闲通道数。
3.如权利要求1所述的综合语音资源平台代理服务器,其特征在于,所述至少两个语音业务服务器为媒体资源控制协议服务器和/或语音合成服务器。
4.如权利要求3所述的综合语音资源平台代理服务器,其特征在于,当所述至少两个语音业务服务器为媒体资源控制协议服务器和语音合成服务器时,所述代理服务器还包括:
判断模块,用于判断所述语音业务的类型为自动语音识别请求或语音合成请求;
当所述语音业务的类型为自动语音识别请求时,
所述保存模块包括:
第一保存单元,用于保存与所述自动语音识别请求对应的至少两个媒体资源控制协议服务器的负载信息;
所述处理模块包括:
第一处理单元,用于根据所述至少两个媒体资源控制协议服务器的负载信息,建立所述消息分发模块与第一媒体资源控制协议服务器之间的第二通道,所述第一媒体资源控制协议服务器的负载为所述至少两个媒体资源控制协议服务器的负载的最小值;
当所述语音业务的类型为语音合成请求时,
所述保存模块包括:
第二保存单元,用于保存与所述语音合成请求对应的至少两个语音合成服务器的负载信息;
所述处理模块包括:
第二处理单元,用于根据所述至少两个语音合成服务器的负载信息,建立所述消息分发模块与第一语音合成服务器之间的第三通道,所述第一语音合成服务器的负载为所述至少两个语音合成服务器的负载的最小值。
5.如权利要求1所述的综合语音资源平台代理服务器,其特征在于,还包括:
计费模块,用于在所述客户端与所述第一语音业务服务器建立起连接后,与计费服务器交互,实现对所述客户端的计费。
6.一种数据处理方法,其特征在于,包括以下步骤:
代理服务器建立与客户端之间的第一通道;
在所述客户端请求语音业务时,所述代理服务器与鉴权服务器交互,实现对所述客户端的鉴权;
所述代理服务器根据预先保存的至少两个语音业务服务器的负载情况,建立与第一语音业务服务器之间的第二通道,所述第一语音业务服务器的负载低于所述至少两个语音业务服务器的负载的最大值;
在所述第一通道和第二通道建立后,所述代理服务器利用所述第一通道和第二通道传输所述客户端和所述第一语音业务服务器在处理所述语音业务时交互的信息。
7.如权利要求6所述的数据处理方法,其特征在于,所述语音业务服务器为:媒体资源控制协议服务器和/或语音合成服务器。
8.如权利要求6所述的数据处理方法,其特征在于,所述负载情况包括:通道总数、通道占用数以及空闲通道数。
9.如权利要求6所述的数据处理方法,其特征在于,所述第一语音业务服务器的负载为所述至少两个语音业务服务器的负载的最小值。
10.如权利要求7所述的数据处理方法,其特征在于,当所述语音业务服务器为媒体资源控制协议服务器和语音合成服务器时,所述建立与客户端之间的第一通道的步骤之前还包括步骤:
判断所述客户端请求的语音业务的类型;
鉴权通过后,根据与所述客户端请求的语音业务对应的预先保存的至少两个语音业务服务器的负载情况,建立与第一语音业务服务器之间的第二通道。
11.如权利要求7所述的数据处理方法,其特征在于,当所述客户端请求类型为自动语音识别请求时,所述代理服务器根据所述至少两个媒体资源控制协议服务器的负载信息,建立与第一媒体资源控制协议服务器之间的第二通道;
在所述第一通道和第二通道建立后,所述代理服务器利用所述第一通道和第二通道传输所述客户端和所述第一媒体资源控制协议服务器在处理所述自动语音识别业务时交互的信息。
12.如权利要求7所述的数据处理方法,其特征在于,当所述客户端请求类型为语音合成请求时,所述代理服务器根据所述至少两个语音合成服务器的负载信息,建立与第一语音合成服务器之间的第三通道;
在所述第一通道和第三通道建立后,所述代理服务器利用所述第一通道和第三通道传输所述客户端和所述第一语音合成服务器在处理所述语音合成业务时交互的信息。
CN 200810222601 2008-09-18 2008-09-18 一种综合语音资源平台代理服务器及其数据处理方法 Expired - Fee Related CN101677329B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200810222601 CN101677329B (zh) 2008-09-18 2008-09-18 一种综合语音资源平台代理服务器及其数据处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200810222601 CN101677329B (zh) 2008-09-18 2008-09-18 一种综合语音资源平台代理服务器及其数据处理方法

Publications (2)

Publication Number Publication Date
CN101677329A true CN101677329A (zh) 2010-03-24
CN101677329B CN101677329B (zh) 2013-01-16

Family

ID=42029745

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200810222601 Expired - Fee Related CN101677329B (zh) 2008-09-18 2008-09-18 一种综合语音资源平台代理服务器及其数据处理方法

Country Status (1)

Country Link
CN (1) CN101677329B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8850554B2 (en) 2010-02-17 2014-09-30 Nokia Corporation Method and apparatus for providing an authentication context-based session
CN107749931A (zh) * 2017-09-29 2018-03-02 携程旅游信息技术(上海)有限公司 互动式语音应答的方法、系统、设备及存储介质
CN108184030A (zh) * 2012-09-07 2018-06-19 格林伊登美国控股有限责任公司 联络中心媒介流量的动态管理和重新分配
CN108833590A (zh) * 2018-07-11 2018-11-16 北京百度网讯科技有限公司 一种语音识别服务代理服务器及代理方法
CN108881184A (zh) * 2018-05-30 2018-11-23 努比亚技术有限公司 访问请求处理方法、终端、服务器及计算机可读存储介质
CN109036431A (zh) * 2018-07-11 2018-12-18 北京智能管家科技有限公司 一种语音识别系统和方法
CN110417824A (zh) * 2018-04-26 2019-11-05 石悌君 一种实现网络服务的方法
CN111107134A (zh) * 2019-11-29 2020-05-05 北京三快在线科技有限公司 连接控制方法、装置、电子设备及可读存储介质
CN114678026A (zh) * 2022-05-27 2022-06-28 广州小鹏汽车科技有限公司 语音交互方法、车机终端、车辆及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1728598A (zh) * 2004-07-31 2006-02-01 西门子(中国)有限公司 一种语音移动通信过程中调整编码速率的方法
CN101155229A (zh) * 2006-09-28 2008-04-02 郑大勇 一种分布式防伪和产品信息追踪的方法和系统

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8850554B2 (en) 2010-02-17 2014-09-30 Nokia Corporation Method and apparatus for providing an authentication context-based session
US9467440B2 (en) 2010-02-17 2016-10-11 Nokia Technologies Oy Method and apparatus for providing an authentication context-based session
CN108184030B (zh) * 2012-09-07 2021-02-02 格林伊登美国控股有限责任公司 联络中心媒介流量的动态管理和重新分配
CN108184030A (zh) * 2012-09-07 2018-06-19 格林伊登美国控股有限责任公司 联络中心媒介流量的动态管理和重新分配
CN107749931A (zh) * 2017-09-29 2018-03-02 携程旅游信息技术(上海)有限公司 互动式语音应答的方法、系统、设备及存储介质
CN110417824A (zh) * 2018-04-26 2019-11-05 石悌君 一种实现网络服务的方法
CN108881184A (zh) * 2018-05-30 2018-11-23 努比亚技术有限公司 访问请求处理方法、终端、服务器及计算机可读存储介质
CN108833590A (zh) * 2018-07-11 2018-11-16 北京百度网讯科技有限公司 一种语音识别服务代理服务器及代理方法
CN109036431A (zh) * 2018-07-11 2018-12-18 北京智能管家科技有限公司 一种语音识别系统和方法
CN108833590B (zh) * 2018-07-11 2021-10-26 北京百度网讯科技有限公司 一种语音识别服务代理服务器及代理方法
CN111107134A (zh) * 2019-11-29 2020-05-05 北京三快在线科技有限公司 连接控制方法、装置、电子设备及可读存储介质
CN111107134B (zh) * 2019-11-29 2022-04-26 北京三快在线科技有限公司 连接控制方法、装置、电子设备及可读存储介质
CN114678026A (zh) * 2022-05-27 2022-06-28 广州小鹏汽车科技有限公司 语音交互方法、车机终端、车辆及存储介质
CN114678026B (zh) * 2022-05-27 2022-10-14 广州小鹏汽车科技有限公司 语音交互方法、车机终端、车辆及存储介质
WO2023227129A1 (zh) * 2022-05-27 2023-11-30 广州小鹏汽车科技有限公司 语音交互方法、车机终端、车辆及存储介质

Also Published As

Publication number Publication date
CN101677329B (zh) 2013-01-16

Similar Documents

Publication Publication Date Title
CN101677329B (zh) 一种综合语音资源平台代理服务器及其数据处理方法
US9894111B2 (en) System and method for data transfer between terminals in voice communication under voice over internet protocol (VoIP)
US7406306B2 (en) Method for billing in a telecommunications network
CN101437202B (zh) 一种多终端时业务消息处理方法、系统和装置
US8559945B2 (en) Routing function multimedia message service gateway
WO2008138241A1 (fr) Serveur de service à la clientèle, procédé et système fondés sur la messagerie instantanée
US8775188B2 (en) Method, device, and system for voice approval
CN102281364A (zh) 呼叫中心系统及其接入方法
CN101227490B (zh) 网络存储方法及系统
CN106533932A (zh) 一种用于推送即时消息的方法和装置
CN101478612A (zh) 基于支持即时通信呼叫中心的商品预定方法和系统
CN113014847A (zh) 一种基于混合云架构实现音视频通信的方法及系统
US20200220837A1 (en) System and method to use a mobile number in conjunction with a non-telephony internet connected device
US7941134B2 (en) Push-to-talk communication system and push-to-talk communication method
CN100584068C (zh) 实现无线一键通业务的方法及无线一键通网关
US20060069783A1 (en) Program, method and device for managing information shared among components, recording medium and communication apparatus
US20090073960A1 (en) Bridging phone networks using voip to preserve in-network calling advantages
CN107046499A (zh) 一种支持不同运营商用户的企业融合通信系统和方法
US8804936B2 (en) Shared media access for real time first and third party media control
CN113905023A (zh) 基于网页即时通信技术的外呼系统及方法
WO2010022592A1 (zh) 一种文字交谈路由的方法、装置和呼叫中心系统
CN100376101C (zh) 一种即时语音通讯方法及其系统
RU2494564C1 (ru) Комплексное компьютерно-телекоммуникационное устройство обмена данными, система и способ передачи ассоциированных с каналом связи данных между агентом и автоматическим сервисом
KR20050115686A (ko) PoC 서비스 시스템 및 방법
CN114285658B (zh) 基于微信授权登陆的系统互跳免登陆方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130116

Termination date: 20160918

CF01 Termination of patent right due to non-payment of annual fee