CN108011961A - 基于混合云服务的语音交互系统 - Google Patents
基于混合云服务的语音交互系统 Download PDFInfo
- Publication number
- CN108011961A CN108011961A CN201711287398.1A CN201711287398A CN108011961A CN 108011961 A CN108011961 A CN 108011961A CN 201711287398 A CN201711287398 A CN 201711287398A CN 108011961 A CN108011961 A CN 108011961A
- Authority
- CN
- China
- Prior art keywords
- voice
- service
- platform
- cloud
- mrcp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 18
- 230000006978 adaptation Effects 0.000 claims abstract description 19
- 238000006243 chemical reaction Methods 0.000 claims abstract description 11
- 238000004891 communication Methods 0.000 claims abstract description 4
- 238000001514 detection method Methods 0.000 claims abstract description 4
- 230000000977 initiatory effect Effects 0.000 claims description 3
- 238000000034 method Methods 0.000 abstract description 2
- 238000007726 management method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/60—Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/20—Network architectures or network communication protocols for network security for managing network security; network security policies in general
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/08—Protocols for interworking; Protocol conversion
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Sub-Exchange Stations And Push- Button Telephones (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于混合云服务的语音交互系统,包括公有云语音平台、私有云语音平台以及协议适配接口;所述公有云语音平台用于提供基于HTTP协议的TTS/ASR公有云服务能力;所述私有云语音平台用于提供基于MRCP协议的TTS/ASR私有云服务能力;所述协议适配接口用于提供HTTP至MRCP或MRCP至HTTP之间的协议转换,并根据云平台间的通讯检测选择能够提供服务的云平台进行调用。本发明能够同时满足呼叫中心与普通应用的语音交互功能需求,并且可以根据上联云平台的服务可靠性、响应时间来选择最优的服务提供方,同时也能够根据安全需要将保密信息送至私有云平台处理,防止涉密信息泄露至外网。
Description
技术领域
本发明涉及一种基于混合云服务的语音交互系统。
背景技术
目前主流的TTS(Text To Speech,从文本到语音)/ASR(Automatic SpeechRecognition,自动语音识别技术)平台根据提供的服务能力不同,分为两类,一类为传统呼叫中心提供私有云服务,提供MRCP(Media Resource Control Protocol,媒体资源控制协议)接口,具有稳定、响应速度快等特点,但是只能用于呼叫中心接入使用;一类为互联网提供公有云服务,提供HTTP(HyperText Transfer Protocol,超文本传输协议)接口,特点是接入方式多样化,能够满足移动端(Android、IOS等)、web应用的接入需求,但是无法供呼叫中心使用
发明内容
本发明要解决的技术问题是为了克服现有技术中主流的TTS/ASR平台提供的服务各自都有缺点的缺陷,提供一种基于混合云服务的语音交互系统。
本发明是通过下述技术方案来解决上述技术问题的:
本发明提供了一种基于混合云服务的语音交互系统,包括公有云语音平台、私有云语音平台以及协议适配接口;
所述公有云语音平台用于提供基于HTTP协议的TTS/ASR公有云服务能力;
所述私有云语音平台用于提供基于MRCP协议的TTS/ASR私有云服务能力;
所述协议适配接口用于提供HTTP至MRCP或MRCP至HTTP之间的协议转换,并根据云平台间的通讯检测选择能够提供服务的云平台进行调用。
较佳地,所述协议适配接口包括:
接收单元,用于接收客户端发起的语音服务请求;
开放单元,用于向客户端开放HTTP协议接口与MRCP协议接口;
第一判断单元,用于判断客户端的语音服务请求类型为TTS还是ASR,并根据所需服务类型检查各个云平台的TTS/ASR服务是否可用;
第二判断单元,用于判断当前调用是否包含敏感信息;
协议转换单元,用于根据所述第一判断单元和所述第二判断单元的判断选择由公有云语音平台或者由私有云语音平台提供服务,并根据客户端与服务端之间的协议差异进行协议转换,重新封装语音服务请求;
发送单元,用于将封装完成的语音服务请求发送至选择的公有云语音平台或私有云语音平台。
较佳地,所述接收单元接收的所述语音服务请求为HTTP请求或MRCP请求。
较佳地,所述接收单元接收的所述语音服务请求为请求TTS服务或请求ASR服务。
较佳地,所述第二判断单元还用于对于包含敏感信息的服务请求,根据调度管理的策略判断是否仅有私有云语音平台提供服务。
本发明的积极进步效果在于:与现有私有云语音平台、公有云语音平台各自独立提供服务的方式相比,本发明基于混合云服务的语音交互系统能够同时满足呼叫中心与普通应用的语音交互功能需求,并且可以根据上联云平台的服务可靠性、响应时间来选择最优的服务提供方,同时也能够根据安全需要将保密信息送至私有云平台处理,防止涉密信息泄露至外网。
附图说明
图1为本发明的较佳实施例的基于混合云服务的语音交互系统模块示意图。
图2为本发明的较佳实施例的基于混合云服务的语音交互系统中协议适配接口的模块示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
如图1所示,本发明的基于混合云服务的语音交互系统包括公有云语音平台1、私有云语音平台2以及协议适配接口3;
其中,所述公有云语音平台1(Cloud)用于提供基于HTTP协议的TTS/ASR公有云服务能力;
所述私有云语音平台2(PCloud)用于提供基于MRCP协议的TTS/ASR私有云服务能力;
所述协议适配接口3(PAI)用于提供HTTP至MRCP或MRCP至HTTP之间的协议转换,并根据云平台间的通讯检测选择能够提供服务的云平台进行调用。
如图2所示,所述协议适配接口3包括:
接收单元31,用于接收客户端发起的语音服务请求;其中,所述语音服务请求为HTTP请求或MRCP请求,所述语音服务请求为请求TTS服务或请求ASR服务;
开放单元32,用于向客户端开放HTTP协议接口与MRCP协议接口;
第一判断单元33,用于判断客户端的语音服务请求类型为TTS还是ASR,并根据所需服务类型检查各个云平台的TTS/ASR服务是否可用;
第二判断单元34,用于判断当前调用是否包含敏感信息;对于包含敏感信息的服务请求,根据调度管理的策略判断是否仅有私有云语音平台提供服务;
协议转换单元35,用于根据所述第一判断单元和所述第二判断单元的判断选择由公有云语音平台或者由私有云语音平台提供服务,并根据客户端与服务端之间的协议差异进行协议转换,重新封装语音服务请求;
发送单元36,用于将封装完成的语音服务请求发送至选择的公有云语音平台或私有云语音平台。
本发明具体实现公有云语音平台和私有云语音平台集中调度的主要流程逻辑描述如下:
1)客户端(HTTP请求或MRCP请求)向协议适配接口(PAI)发起语音服务请求(TTS或ASR);
2)协议适配接口(PAI)作为服务端向客户端开放HTTP协议接口与MRCP协议接口;
3)协议适配接口(PAI)收到客户端服务请求后,协议适配接口首先判断客户端的服务请求类型为TTS或ASR,并根据所需服务类型检查上联服务端各平台的TTS/ASR服务是否可用;
4)协议适配接口(PAI)判断当前调用是否包含敏感信息,对于包含敏感信息的服务请求,可以根据调度管理的策略判断是否仅由私有云语音平台提供服务;
5)协议适配接口(PAI)根据上述判断选择由私有云平台提供服务或公有云平台提供服务后,根据客户端与服务端之间的协议差异进行协议转换,重新封装语音服务请求并进行转发。
6)协议适配接口(PAI)作为客户端将封装完成的请求发送至公有云语音平台(使用HTTP协议)或私有云语音平台(使用MRCP协议);
本发明提供的基于混合云服务的语音交互系统,实现不同云平台间的资源调配与切换,支持多用协议类型接入,可以更好地保障业务服务连续性,保证系统在灾难场景下的可用性。
本发明基于TTS/ASR公有云与私有云平台,通过建立各系统间的消息交互体系,提供多种网络协议接入方式,并能根据不同平台的服务状态选择最优服务端。虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。
Claims (5)
1.一种基于混合云服务的语音交互系统,其特征在于,包括公有云语音平台、私有云语音平台以及协议适配接口;
所述公有云语音平台用于提供基于HTTP协议的TTS/ASR公有云服务能力;
所述私有云语音平台用于提供基于MRCP协议的TTS/ASR私有云服务能力;
所述协议适配接口用于提供HTTP至MRCP或MRCP至HTTP之间的协议转换,并根据云平台间的通讯检测选择能够提供服务的云平台进行调用。
2.如权利要求1所述的基于混合云服务的语音交互系统,其特征在于,所述协议适配接口包括:
接收单元,用于接收客户端发起的语音服务请求;
开放单元,用于向客户端开放HTTP协议接口与MRCP协议接口;
第一判断单元,用于判断客户端的语音服务请求类型为TTS还是ASR,并根据所需服务类型检查各个云平台的TTS/ASR服务是否可用;
第二判断单元,用于判断当前调用是否包含敏感信息;
协议转换单元,用于根据所述第一判断单元和所述第二判断单元的判断选择由公有云语音平台或者由私有云语音平台提供服务,并根据客户端与服务端之间的协议差异进行协议转换,重新封装语音服务请求;
发送单元,用于将封装完成的语音服务请求发送至选择的公有云语音平台或私有云语音平台。
3.如权利要求2所述的基于混合云服务的语音交互系统,其特征在于,所述接收单元接收的所述语音服务请求为HTTP请求或MRCP请求。
4.如权利要求2所述的基于混合云服务的语音交互系统,其特征在于,所述接收单元接收的所述语音服务请求为请求TTS服务或请求ASR服务。
5.如权利要求2所述的基于混合云服务的语音交互系统,其特征在于,所述第二判断单元还用于对于包含敏感信息的服务请求,根据调度管理的策略判断是否仅有私有云语音平台提供服务。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711287398.1A CN108011961A (zh) | 2017-12-07 | 2017-12-07 | 基于混合云服务的语音交互系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711287398.1A CN108011961A (zh) | 2017-12-07 | 2017-12-07 | 基于混合云服务的语音交互系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108011961A true CN108011961A (zh) | 2018-05-08 |
Family
ID=62057299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711287398.1A Pending CN108011961A (zh) | 2017-12-07 | 2017-12-07 | 基于混合云服务的语音交互系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108011961A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108768971A (zh) * | 2018-05-15 | 2018-11-06 | 平安科技(深圳)有限公司 | 信息交互方法、装置、设备及可读存储介质 |
CN111128198A (zh) * | 2019-12-25 | 2020-05-08 | 厦门快商通科技股份有限公司 | 一种声纹识别方法、装置、存储介质、服务器及系统 |
CN111147530A (zh) * | 2018-10-16 | 2020-05-12 | 深圳市冠旭电子股份有限公司 | 系统架构、多语音平台的切换方法、智能终端及存储介质 |
CN112802478A (zh) * | 2020-12-31 | 2021-05-14 | 苏州思必驰信息科技有限公司 | 混合云融合调度方法和装置 |
CN112822183A (zh) * | 2020-12-30 | 2021-05-18 | 北京捷通华声科技股份有限公司 | 语音处理的方法、装置、计算机可读存储介质和处理器 |
CN113114482A (zh) * | 2021-03-08 | 2021-07-13 | 中国—东盟信息港股份有限公司 | 一种基于容器的混合云管理系统及方法 |
CN113810651A (zh) * | 2021-08-24 | 2021-12-17 | 中国人寿保险股份有限公司上海数据中心 | 一种基于多云混合部署的视频通讯系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1984201A (zh) * | 2005-12-13 | 2007-06-20 | 国际商业机器公司 | 语音服务系统和方法 |
CN102915331A (zh) * | 2011-09-12 | 2013-02-06 | 微软公司 | 用于云选择的协调引擎 |
CN103747071A (zh) * | 2013-12-31 | 2014-04-23 | 合肥有线电视宽带网络有限公司 | 一种广电网络私有云端语音数据处理均衡系统及方法 |
US20150156327A1 (en) * | 2010-01-27 | 2015-06-04 | Terry Lynn Van Buren | Web-based, self-service outbound contact center utilizing speaker-independent interactive voice response and including enhanced IP telephony |
CN107222487A (zh) * | 2017-06-13 | 2017-09-29 | 杭州亿方云网络科技有限公司 | 一种混合云环境的账号对接系统 |
-
2017
- 2017-12-07 CN CN201711287398.1A patent/CN108011961A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1984201A (zh) * | 2005-12-13 | 2007-06-20 | 国际商业机器公司 | 语音服务系统和方法 |
US20150156327A1 (en) * | 2010-01-27 | 2015-06-04 | Terry Lynn Van Buren | Web-based, self-service outbound contact center utilizing speaker-independent interactive voice response and including enhanced IP telephony |
CN102915331A (zh) * | 2011-09-12 | 2013-02-06 | 微软公司 | 用于云选择的协调引擎 |
CN103747071A (zh) * | 2013-12-31 | 2014-04-23 | 合肥有线电视宽带网络有限公司 | 一种广电网络私有云端语音数据处理均衡系统及方法 |
CN107222487A (zh) * | 2017-06-13 | 2017-09-29 | 杭州亿方云网络科技有限公司 | 一种混合云环境的账号对接系统 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108768971A (zh) * | 2018-05-15 | 2018-11-06 | 平安科技(深圳)有限公司 | 信息交互方法、装置、设备及可读存储介质 |
WO2019218440A1 (zh) * | 2018-05-15 | 2019-11-21 | 平安科技(深圳)有限公司 | 信息交互方法、装置、设备及可读存储介质 |
CN111147530A (zh) * | 2018-10-16 | 2020-05-12 | 深圳市冠旭电子股份有限公司 | 系统架构、多语音平台的切换方法、智能终端及存储介质 |
CN111128198A (zh) * | 2019-12-25 | 2020-05-08 | 厦门快商通科技股份有限公司 | 一种声纹识别方法、装置、存储介质、服务器及系统 |
CN112822183A (zh) * | 2020-12-30 | 2021-05-18 | 北京捷通华声科技股份有限公司 | 语音处理的方法、装置、计算机可读存储介质和处理器 |
CN112822183B (zh) * | 2020-12-30 | 2023-08-22 | 北京捷通华声科技股份有限公司 | 语音处理的方法、装置、计算机可读存储介质和处理器 |
CN112802478A (zh) * | 2020-12-31 | 2021-05-14 | 苏州思必驰信息科技有限公司 | 混合云融合调度方法和装置 |
CN112802478B (zh) * | 2020-12-31 | 2022-07-08 | 思必驰科技股份有限公司 | 混合云融合调度方法和装置 |
CN113114482A (zh) * | 2021-03-08 | 2021-07-13 | 中国—东盟信息港股份有限公司 | 一种基于容器的混合云管理系统及方法 |
CN113114482B (zh) * | 2021-03-08 | 2022-06-14 | 中国—东盟信息港股份有限公司 | 一种基于容器的混合云管理系统及方法 |
CN113810651A (zh) * | 2021-08-24 | 2021-12-17 | 中国人寿保险股份有限公司上海数据中心 | 一种基于多云混合部署的视频通讯系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108011961A (zh) | 基于混合云服务的语音交互系统 | |
US20210218819A1 (en) | System and method for providing a micro-services communication platform | |
CN110366132A (zh) | 通信方法及装置 | |
EP2888868B1 (en) | Calling an unready terminal | |
US20100166153A1 (en) | Method and apparatus for emergency call processing | |
US7933205B1 (en) | Generalized interconnection apparatus for delivering services based on real time performance requirements | |
US20060029048A1 (en) | Method to optimally select bandwidth and priority for voice message packets in a voice over IP network | |
CN104380661B (zh) | 一种路由设备的操作方法、路由设备和终端设备 | |
CN108366023A (zh) | 用于时延敏感网络的防碰撞流预留带宽系统及其方法 | |
US20100198946A1 (en) | SYSTEM AND METHOD FOR QUALITY OF SERVICE (QoS) PARAMETER CHANGE | |
CN102916930B (zh) | 融合业务网络及其节点、资源请求的路由信息的获取方法 | |
CN106330683A (zh) | 一种多媒体座席系统 | |
CN103987091B (zh) | 一种业务带宽变更方法、控制器及系统 | |
CN104735807A (zh) | Wifi热点服务的提供方法、系统和wifi接入点 | |
KR20170073417A (ko) | 지능형 자동 문자 응대 시스템 | |
CN101047706B (zh) | 一种接入网会话控制系统及方法 | |
WO2017012547A1 (zh) | 一种建立通信连接的方法和电子设备 | |
CN103906167B (zh) | 一种用户设备的接入控制方法和装置 | |
US7627100B2 (en) | Method for providing virtual private network services | |
CN115883309B (zh) | 基于saas模式的多业务上下游多协议接入平台及方法 | |
CN106301812A (zh) | 多媒体会议实现方法、装置及系统 | |
CN110392019B (zh) | 一种集群音视频业务专用承载建立方法和系统 | |
US20110199942A1 (en) | Method and system for realizing emergency calling service in high rate packet data network | |
CN110445639A (zh) | 一种服务器的热备方法及装置 | |
CN112040170B (zh) | 基于5g的远程异地评标系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180508 |