CN108011961A - 基于混合云服务的语音交互系统 - Google Patents

基于混合云服务的语音交互系统 Download PDF

Info

Publication number
CN108011961A
CN108011961A CN201711287398.1A CN201711287398A CN108011961A CN 108011961 A CN108011961 A CN 108011961A CN 201711287398 A CN201711287398 A CN 201711287398A CN 108011961 A CN108011961 A CN 108011961A
Authority
CN
China
Prior art keywords
voice
service
platform
cloud
mrcp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711287398.1A
Other languages
English (en)
Inventor
赵桦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ctrip Travel Information Technology Shanghai Co Ltd
Original Assignee
Ctrip Travel Information Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ctrip Travel Information Technology Shanghai Co Ltd filed Critical Ctrip Travel Information Technology Shanghai Co Ltd
Priority to CN201711287398.1A priority Critical patent/CN108011961A/zh
Publication of CN108011961A publication Critical patent/CN108011961A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/34Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/20Network architectures or network communication protocols for network security for managing network security; network security policies in general
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/08Protocols for interworking; Protocol conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computing Systems (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Sub-Exchange Stations And Push- Button Telephones (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种基于混合云服务的语音交互系统,包括公有云语音平台、私有云语音平台以及协议适配接口;所述公有云语音平台用于提供基于HTTP协议的TTS/ASR公有云服务能力;所述私有云语音平台用于提供基于MRCP协议的TTS/ASR私有云服务能力;所述协议适配接口用于提供HTTP至MRCP或MRCP至HTTP之间的协议转换,并根据云平台间的通讯检测选择能够提供服务的云平台进行调用。本发明能够同时满足呼叫中心与普通应用的语音交互功能需求,并且可以根据上联云平台的服务可靠性、响应时间来选择最优的服务提供方,同时也能够根据安全需要将保密信息送至私有云平台处理,防止涉密信息泄露至外网。

Description

基于混合云服务的语音交互系统
技术领域
本发明涉及一种基于混合云服务的语音交互系统。
背景技术
目前主流的TTS(Text To Speech,从文本到语音)/ASR(Automatic SpeechRecognition,自动语音识别技术)平台根据提供的服务能力不同,分为两类,一类为传统呼叫中心提供私有云服务,提供MRCP(Media Resource Control Protocol,媒体资源控制协议)接口,具有稳定、响应速度快等特点,但是只能用于呼叫中心接入使用;一类为互联网提供公有云服务,提供HTTP(HyperText Transfer Protocol,超文本传输协议)接口,特点是接入方式多样化,能够满足移动端(Android、IOS等)、web应用的接入需求,但是无法供呼叫中心使用
发明内容
本发明要解决的技术问题是为了克服现有技术中主流的TTS/ASR平台提供的服务各自都有缺点的缺陷,提供一种基于混合云服务的语音交互系统。
本发明是通过下述技术方案来解决上述技术问题的:
本发明提供了一种基于混合云服务的语音交互系统,包括公有云语音平台、私有云语音平台以及协议适配接口;
所述公有云语音平台用于提供基于HTTP协议的TTS/ASR公有云服务能力;
所述私有云语音平台用于提供基于MRCP协议的TTS/ASR私有云服务能力;
所述协议适配接口用于提供HTTP至MRCP或MRCP至HTTP之间的协议转换,并根据云平台间的通讯检测选择能够提供服务的云平台进行调用。
较佳地,所述协议适配接口包括:
接收单元,用于接收客户端发起的语音服务请求;
开放单元,用于向客户端开放HTTP协议接口与MRCP协议接口;
第一判断单元,用于判断客户端的语音服务请求类型为TTS还是ASR,并根据所需服务类型检查各个云平台的TTS/ASR服务是否可用;
第二判断单元,用于判断当前调用是否包含敏感信息;
协议转换单元,用于根据所述第一判断单元和所述第二判断单元的判断选择由公有云语音平台或者由私有云语音平台提供服务,并根据客户端与服务端之间的协议差异进行协议转换,重新封装语音服务请求;
发送单元,用于将封装完成的语音服务请求发送至选择的公有云语音平台或私有云语音平台。
较佳地,所述接收单元接收的所述语音服务请求为HTTP请求或MRCP请求。
较佳地,所述接收单元接收的所述语音服务请求为请求TTS服务或请求ASR服务。
较佳地,所述第二判断单元还用于对于包含敏感信息的服务请求,根据调度管理的策略判断是否仅有私有云语音平台提供服务。
本发明的积极进步效果在于:与现有私有云语音平台、公有云语音平台各自独立提供服务的方式相比,本发明基于混合云服务的语音交互系统能够同时满足呼叫中心与普通应用的语音交互功能需求,并且可以根据上联云平台的服务可靠性、响应时间来选择最优的服务提供方,同时也能够根据安全需要将保密信息送至私有云平台处理,防止涉密信息泄露至外网。
附图说明
图1为本发明的较佳实施例的基于混合云服务的语音交互系统模块示意图。
图2为本发明的较佳实施例的基于混合云服务的语音交互系统中协议适配接口的模块示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
如图1所示,本发明的基于混合云服务的语音交互系统包括公有云语音平台1、私有云语音平台2以及协议适配接口3;
其中,所述公有云语音平台1(Cloud)用于提供基于HTTP协议的TTS/ASR公有云服务能力;
所述私有云语音平台2(PCloud)用于提供基于MRCP协议的TTS/ASR私有云服务能力;
所述协议适配接口3(PAI)用于提供HTTP至MRCP或MRCP至HTTP之间的协议转换,并根据云平台间的通讯检测选择能够提供服务的云平台进行调用。
如图2所示,所述协议适配接口3包括:
接收单元31,用于接收客户端发起的语音服务请求;其中,所述语音服务请求为HTTP请求或MRCP请求,所述语音服务请求为请求TTS服务或请求ASR服务;
开放单元32,用于向客户端开放HTTP协议接口与MRCP协议接口;
第一判断单元33,用于判断客户端的语音服务请求类型为TTS还是ASR,并根据所需服务类型检查各个云平台的TTS/ASR服务是否可用;
第二判断单元34,用于判断当前调用是否包含敏感信息;对于包含敏感信息的服务请求,根据调度管理的策略判断是否仅有私有云语音平台提供服务;
协议转换单元35,用于根据所述第一判断单元和所述第二判断单元的判断选择由公有云语音平台或者由私有云语音平台提供服务,并根据客户端与服务端之间的协议差异进行协议转换,重新封装语音服务请求;
发送单元36,用于将封装完成的语音服务请求发送至选择的公有云语音平台或私有云语音平台。
本发明具体实现公有云语音平台和私有云语音平台集中调度的主要流程逻辑描述如下:
1)客户端(HTTP请求或MRCP请求)向协议适配接口(PAI)发起语音服务请求(TTS或ASR);
2)协议适配接口(PAI)作为服务端向客户端开放HTTP协议接口与MRCP协议接口;
3)协议适配接口(PAI)收到客户端服务请求后,协议适配接口首先判断客户端的服务请求类型为TTS或ASR,并根据所需服务类型检查上联服务端各平台的TTS/ASR服务是否可用;
4)协议适配接口(PAI)判断当前调用是否包含敏感信息,对于包含敏感信息的服务请求,可以根据调度管理的策略判断是否仅由私有云语音平台提供服务;
5)协议适配接口(PAI)根据上述判断选择由私有云平台提供服务或公有云平台提供服务后,根据客户端与服务端之间的协议差异进行协议转换,重新封装语音服务请求并进行转发。
6)协议适配接口(PAI)作为客户端将封装完成的请求发送至公有云语音平台(使用HTTP协议)或私有云语音平台(使用MRCP协议);
本发明提供的基于混合云服务的语音交互系统,实现不同云平台间的资源调配与切换,支持多用协议类型接入,可以更好地保障业务服务连续性,保证系统在灾难场景下的可用性。
本发明基于TTS/ASR公有云与私有云平台,通过建立各系统间的消息交互体系,提供多种网络协议接入方式,并能根据不同平台的服务状态选择最优服务端。虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (5)

1.一种基于混合云服务的语音交互系统,其特征在于,包括公有云语音平台、私有云语音平台以及协议适配接口;
所述公有云语音平台用于提供基于HTTP协议的TTS/ASR公有云服务能力;
所述私有云语音平台用于提供基于MRCP协议的TTS/ASR私有云服务能力;
所述协议适配接口用于提供HTTP至MRCP或MRCP至HTTP之间的协议转换,并根据云平台间的通讯检测选择能够提供服务的云平台进行调用。
2.如权利要求1所述的基于混合云服务的语音交互系统,其特征在于,所述协议适配接口包括:
接收单元,用于接收客户端发起的语音服务请求;
开放单元,用于向客户端开放HTTP协议接口与MRCP协议接口;
第一判断单元,用于判断客户端的语音服务请求类型为TTS还是ASR,并根据所需服务类型检查各个云平台的TTS/ASR服务是否可用;
第二判断单元,用于判断当前调用是否包含敏感信息;
协议转换单元,用于根据所述第一判断单元和所述第二判断单元的判断选择由公有云语音平台或者由私有云语音平台提供服务,并根据客户端与服务端之间的协议差异进行协议转换,重新封装语音服务请求;
发送单元,用于将封装完成的语音服务请求发送至选择的公有云语音平台或私有云语音平台。
3.如权利要求2所述的基于混合云服务的语音交互系统,其特征在于,所述接收单元接收的所述语音服务请求为HTTP请求或MRCP请求。
4.如权利要求2所述的基于混合云服务的语音交互系统,其特征在于,所述接收单元接收的所述语音服务请求为请求TTS服务或请求ASR服务。
5.如权利要求2所述的基于混合云服务的语音交互系统,其特征在于,所述第二判断单元还用于对于包含敏感信息的服务请求,根据调度管理的策略判断是否仅有私有云语音平台提供服务。
CN201711287398.1A 2017-12-07 2017-12-07 基于混合云服务的语音交互系统 Pending CN108011961A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711287398.1A CN108011961A (zh) 2017-12-07 2017-12-07 基于混合云服务的语音交互系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711287398.1A CN108011961A (zh) 2017-12-07 2017-12-07 基于混合云服务的语音交互系统

Publications (1)

Publication Number Publication Date
CN108011961A true CN108011961A (zh) 2018-05-08

Family

ID=62057299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711287398.1A Pending CN108011961A (zh) 2017-12-07 2017-12-07 基于混合云服务的语音交互系统

Country Status (1)

Country Link
CN (1) CN108011961A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108768971A (zh) * 2018-05-15 2018-11-06 平安科技(深圳)有限公司 信息交互方法、装置、设备及可读存储介质
CN111128198A (zh) * 2019-12-25 2020-05-08 厦门快商通科技股份有限公司 一种声纹识别方法、装置、存储介质、服务器及系统
CN111147530A (zh) * 2018-10-16 2020-05-12 深圳市冠旭电子股份有限公司 系统架构、多语音平台的切换方法、智能终端及存储介质
CN112802478A (zh) * 2020-12-31 2021-05-14 苏州思必驰信息科技有限公司 混合云融合调度方法和装置
CN112822183A (zh) * 2020-12-30 2021-05-18 北京捷通华声科技股份有限公司 语音处理的方法、装置、计算机可读存储介质和处理器
CN113114482A (zh) * 2021-03-08 2021-07-13 中国—东盟信息港股份有限公司 一种基于容器的混合云管理系统及方法
CN113810651A (zh) * 2021-08-24 2021-12-17 中国人寿保险股份有限公司上海数据中心 一种基于多云混合部署的视频通讯系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1984201A (zh) * 2005-12-13 2007-06-20 国际商业机器公司 语音服务系统和方法
CN102915331A (zh) * 2011-09-12 2013-02-06 微软公司 用于云选择的协调引擎
CN103747071A (zh) * 2013-12-31 2014-04-23 合肥有线电视宽带网络有限公司 一种广电网络私有云端语音数据处理均衡系统及方法
US20150156327A1 (en) * 2010-01-27 2015-06-04 Terry Lynn Van Buren Web-based, self-service outbound contact center utilizing speaker-independent interactive voice response and including enhanced IP telephony
CN107222487A (zh) * 2017-06-13 2017-09-29 杭州亿方云网络科技有限公司 一种混合云环境的账号对接系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1984201A (zh) * 2005-12-13 2007-06-20 国际商业机器公司 语音服务系统和方法
US20150156327A1 (en) * 2010-01-27 2015-06-04 Terry Lynn Van Buren Web-based, self-service outbound contact center utilizing speaker-independent interactive voice response and including enhanced IP telephony
CN102915331A (zh) * 2011-09-12 2013-02-06 微软公司 用于云选择的协调引擎
CN103747071A (zh) * 2013-12-31 2014-04-23 合肥有线电视宽带网络有限公司 一种广电网络私有云端语音数据处理均衡系统及方法
CN107222487A (zh) * 2017-06-13 2017-09-29 杭州亿方云网络科技有限公司 一种混合云环境的账号对接系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108768971A (zh) * 2018-05-15 2018-11-06 平安科技(深圳)有限公司 信息交互方法、装置、设备及可读存储介质
WO2019218440A1 (zh) * 2018-05-15 2019-11-21 平安科技(深圳)有限公司 信息交互方法、装置、设备及可读存储介质
CN111147530A (zh) * 2018-10-16 2020-05-12 深圳市冠旭电子股份有限公司 系统架构、多语音平台的切换方法、智能终端及存储介质
CN111128198A (zh) * 2019-12-25 2020-05-08 厦门快商通科技股份有限公司 一种声纹识别方法、装置、存储介质、服务器及系统
CN112822183A (zh) * 2020-12-30 2021-05-18 北京捷通华声科技股份有限公司 语音处理的方法、装置、计算机可读存储介质和处理器
CN112822183B (zh) * 2020-12-30 2023-08-22 北京捷通华声科技股份有限公司 语音处理的方法、装置、计算机可读存储介质和处理器
CN112802478A (zh) * 2020-12-31 2021-05-14 苏州思必驰信息科技有限公司 混合云融合调度方法和装置
CN112802478B (zh) * 2020-12-31 2022-07-08 思必驰科技股份有限公司 混合云融合调度方法和装置
CN113114482A (zh) * 2021-03-08 2021-07-13 中国—东盟信息港股份有限公司 一种基于容器的混合云管理系统及方法
CN113114482B (zh) * 2021-03-08 2022-06-14 中国—东盟信息港股份有限公司 一种基于容器的混合云管理系统及方法
CN113810651A (zh) * 2021-08-24 2021-12-17 中国人寿保险股份有限公司上海数据中心 一种基于多云混合部署的视频通讯系统及方法

Similar Documents

Publication Publication Date Title
CN108011961A (zh) 基于混合云服务的语音交互系统
US20210218819A1 (en) System and method for providing a micro-services communication platform
CN110366132A (zh) 通信方法及装置
EP2888868B1 (en) Calling an unready terminal
US20100166153A1 (en) Method and apparatus for emergency call processing
US7933205B1 (en) Generalized interconnection apparatus for delivering services based on real time performance requirements
US20060029048A1 (en) Method to optimally select bandwidth and priority for voice message packets in a voice over IP network
CN104380661B (zh) 一种路由设备的操作方法、路由设备和终端设备
CN108366023A (zh) 用于时延敏感网络的防碰撞流预留带宽系统及其方法
US20100198946A1 (en) SYSTEM AND METHOD FOR QUALITY OF SERVICE (QoS) PARAMETER CHANGE
CN102916930B (zh) 融合业务网络及其节点、资源请求的路由信息的获取方法
CN106330683A (zh) 一种多媒体座席系统
CN103987091B (zh) 一种业务带宽变更方法、控制器及系统
CN104735807A (zh) Wifi热点服务的提供方法、系统和wifi接入点
KR20170073417A (ko) 지능형 자동 문자 응대 시스템
CN101047706B (zh) 一种接入网会话控制系统及方法
WO2017012547A1 (zh) 一种建立通信连接的方法和电子设备
CN103906167B (zh) 一种用户设备的接入控制方法和装置
US7627100B2 (en) Method for providing virtual private network services
CN115883309B (zh) 基于saas模式的多业务上下游多协议接入平台及方法
CN106301812A (zh) 多媒体会议实现方法、装置及系统
CN110392019B (zh) 一种集群音视频业务专用承载建立方法和系统
US20110199942A1 (en) Method and system for realizing emergency calling service in high rate packet data network
CN110445639A (zh) 一种服务器的热备方法及装置
CN112040170B (zh) 基于5g的远程异地评标系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180508