CN102917000A - 智能云语音应用服务技术平台 - Google Patents
智能云语音应用服务技术平台 Download PDFInfo
- Publication number
- CN102917000A CN102917000A CN 201210246396 CN201210246396A CN102917000A CN 102917000 A CN102917000 A CN 102917000A CN 201210246396 CN201210246396 CN 201210246396 CN 201210246396 A CN201210246396 A CN 201210246396A CN 102917000 A CN102917000 A CN 102917000A
- Authority
- CN
- China
- Prior art keywords
- platform
- scvp
- voice
- application
- cloud computing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
本发明“新一代智能云语音应用服务技术平台”(简称:SCVP平台)是以自主研发的语音识别技术为核心,融合了NGN(下一代网络)、语音互联(VoiceXML)、Ctag(云标记语言)等技术,而研发的面向智能语音技术应用的系统平台。SCVP平台拥有多项技术创新,并拥有新一代、智能、以及有创新的云计算等特性,而各关键技术都处于一定程度的领先,其系统架构以及技术融合更是具有创新性。SCVP平台经中科院上海查新中心查新给出的结论,本项目具有新颖性,总体水平达到国内先进、国际领先。
Description
技术领域
本发明是基于云计算架构,以语音识别技术为核心,融合了NGN(下一代网络)、语音互联(Voice XML)、Ctag(云标记语言)、数据库等技术,面向智能语音技术应用的系统平台软件,属于电子信息系统应用软件技术领域。
背景技术
电话产生虽然已经有一百多年的历史了,但电话与计算机集成(CTI)的语音技术的开始应用,也仅为近二三十年的事情,如IVR交互式语音应答、呼叫中心等。随着通信和互联网技术的发展,而基于按键的IVR语音已经不能完全满足社会日益发展的需求。语音(讲话)是最为方便、快捷、自然的人际交流手段,采用自然语音作为人与计算机交互的手段,使计算机能像人一样,具有听、说和理解的能力,是智能语音技术应用发展的基础。在其中所需的各种技术中,以语音识别技术最具挑战性,因而被国外众多媒体和专家评为21世纪前十年将对人类生活方式产生重大影响的十大科技进展之一。比尔·盖茨预测:“未来十年语音技术将成为主流。”
语音识别技术在国外研究得比较早,美国早在50年代就已经开始研究语音识别技术,最早以国防部军方以国防应用为研究目的,后来发展主要以MIT、IBM、NUANCE等研究机构与企业为代表,拥有专业的研发团队和自主知识产权。语音识别技术相当复杂,包括了声学、语言学、数字信号处理、统计模式、概率论和信息论、发声机理和听觉机理、人工智能等多学科技术的一项综合性技术,研究所投入的人力、物力等非常大,所需时间相对也比较长。直到进入90年代,语音识别技术逐渐开始了商业应用,起初主要应用于电信、金融等行业,如美国电信运营商Sprint公司的语音助理、美洲银行的语音银行等,随着智能手机等移动终端和通信网络的发展,应用也开始越来越普遍。经过近二十年的发展,已经形成了一定规模的应用市场。
本发明“智能云语音应用服务技术平台”(简称:SCVP平台)是以自主研发的语音识别技术为核心,融合了NGN(下一代网络)、语音互联(Voice XML)、Ctag(云标记语言)等技术,而研发的面向智能语音技术应用的系统平台。SCVP平台拥有多项技术创新,并拥有新一代、智能、以及有创新的云计算等特性,而各关键技术都处于一定程度的领先,其系统架构以及技术融合更是具有创新性。SCVP平台经中科院上海查新中心查新给出的结论,本项目具有新颖性,总体水平达到国内先进、国际领先。
发明内容
附图说明:图1是SCVP平台软件结构;图2 SCVP平台系统架构;图3是SCVP平台应用架构;图4是Ctag技术实现原理。
SCVP平台的发明内容,主要包括以下几个方面:
一、平台软件结构
SCVP平台软件结构创新,其设计原则如下:
1.SCVP平台在设计时,充分考虑了通信网络的发展趋势,除了具有智能网的设计思想外,更多的融合了NGN下一代通信网络的技术特点,完全符合通信发展的趋势,能够充分利用运营商的各种通信资源,方便快速灵活地开展各项语音增值业务;
2.SCVP平台作为先进的智能语音应用服务平台,平台融合了计算机技术、NGN软交换技术、语音识别与合成技术、网络通讯技术、数据库技术等,并采用了国际标准的VoiceXML作为业务逻辑控制,可实现包括NGN业务以及各种基于语音和通讯在内的各种增值业务的应用;
3.SCVP平台实现业务逻辑与呼叫控制相分离的系统架构设计,不仅有利于平台可集成多种业务,纯软件架构设计,同时也节省系统的投入和开发资源;
4.SCVP平台拥有良好的开放性与兼容性,支持H.323和SIP协议,可以直接与运营商的NGN软交换平台对接,也可以通过TGW与运营商的交换机E1线路联接;
5.SCVP采用国际标准的Voice XML语音标记扩展语言,作为业务控制流程,使建立各种业务,就像写网页一样方便快捷。另外,只要符合Voice XML标准的业务,均可以运行在SCVP上;
6.SCVP平台采用了云计算技术、自创了Ctag(Cloud Tag)标记语言,能让用户建立自己的应用服务端,开发各种应用,而能够避免云计算所带来的用户信息隐私及安全问题;
7.SCVP平台符合电信设计的技术规范要求,只要硬件稳定,就能够保证系统每天24小时不间断运行,而且不管业务的新增或修改,都不需要重启系统。
SCVP平台软件结构见图1所示。SCVP平台采用分层结构,从下至上分别为接入层、呼叫控制层、会话层、流程解析层和业务流程控制层,另外通过TCP/IP方式与各种外部服务或第三方产品保持通信。现分别介绍如下:
1.接入层
接入层包括平台对接模块与终端用户接入模块,平台接入模块支持H.323协议和SIP协议;终端用户接入模块支持SIP类型的终端注册到SCVP平台上;
2.呼叫控制层
呼叫控制层实现呼入呼出、呼叫状态分析、电话转接、录放音、接收DTMF、转接坐席等各种与呼叫相关的功能,以及和计费服务器的通信和计费服务;
3.会话层
会话层主要实现用户与系统的对话过程,包括媒体处理、语音识别声音采样、文本合成媒体输出等功能,以及与语音识别服务、文本合成服务的接口和交互处理;
4.流程解析层
流程解析层主要实现Voice XML的流程脚本解析功能,根据来自业务流程控制层的业务请求,控制着用户的业务流程;
5.业务流程控制层
业务流程控制层接收来自应用服务器的业务请求,经过判断分析,将该业务请求交付给流程解析层处理;
6.外部接口模块
外部接口模块主要包括应用服务器(包括数据库服务器和Web服务器)、计费服务器、语音识别服务器、文本合成服务器、内容服务器、人工坐席、IP终端、管理和维护终端等。
二、SCVP平台系统架构
SCVP平台各服务之间采用一种分布式的架构,如图2所示:
1.软交换服务器
实现与运营商软交换或TGW通信互联;
2.呼叫管理服务器
主要实现呼叫管理及控制;
3.SCVP处理服务器
主要实现媒体处理、流程解析以及识别与合成客户端;
4.语音识别服务器
处理来自语音识别客户端的语音识别请求,并将识别结果返还给语音识别客户端;
5.文本合成服务器
处理来自文本合成客户端的文本合成请求,并将合成结果回复给文本合成客户端;
6.应用服务器
各种应用业务应用流程,可以与数据库等信息交互。
该系统架构主要创新点如下:
1.云计算(分布式)结构
SCVP资源管理器在各服务器间进行载入均衡,从而保证硬件的利用效率。对CPU强度大的识别可以由非运行应用程序和音频接口的远程机器来执行;
2.高密度接口
SCVP客户端的少量处理从CPU密集型的服务器处理隔离,允许SCVP客户端有高密度的接口又能提高服务器端CPU的使用效率;
3.容错和可靠性
即使个别服务器失效,也不会使系统崩溃,甚至不会错过一个服务请求。当某一个服务器失效时,SCVP资源管理器自动停止向其发送请求,当服务器恢复时,自动开始向它发送请求;
4.维护方便
可以关闭一个SCVP服务器进行维修,而对整个系统的性能没有影响,或者影响很小。一些类型的维护甚至可以不关闭SCVP服务器进行;
5.可伸缩性
随着SCVP客户端请求的增加,可增加SCVP服务器和应用的实例,无须停止任何运行着的应用程序或关闭系统;
6.多渠道请求
系统支持来自互联网(TCP/IP和SIP协议)和电话网(固话和移动)等不同网络的识别服务请求。
三、SCVP平台应用架构
SCVP平台的应用架构如图3所示:
上层:在SCVP平台上可开发的各种应用程序
中层:SCVP智能语音技术平台
下层:硬件设备、线路、网络等
终端用户:用户可通过普通电话、手机、智能移动终端、便携式电脑、个人电脑等终端设备,通过电话网或互联网接入SCVP平台来使用各种应用服务,可按需和自动服务,即付即用;用户也可以在企业内部或互联网上建立私有云,包括应用程序和数据库,可保障用户数据安全和私密性,同时亦给用户提供了更灵活的业务部署选择。
四、“Ctag”云标记语言
“Ctag”(Cloud Tag Languages)云标记语言,是SCVP平台面向应用的开发语言之一, “Ctag”符合可扩展标记语言规范,是本发明首次创新性的推出,希望能够成为云计算应用开发的行业标准之一。主要具有以下特点:
1.“Ctag”与“Voice XML”一起作为SCVP平台应用开发语言,能够让应用开发易于入手和更少的开发周期;
2.“Ctag”应用程序和数据也可以放置在互联网的任意节点上或云端(用户可创建轻量级私有云),能够为用户的应用部署提供多种选择,可解决目前云计算所面临的信息安全与用户资料保密等问题;
“Ctag”实现原理结构如图4所示。Ctag浏览器(Ctag Browser) 是整个平台的枢纽部分,负责流程文件的取得和解析,以及与其它服务的交互部分。Web Server Interface负责与Web Server 或应用服务器交互,根据配置参数和流程需要,取得相应流程文件(Ctag)。
关键技术
关键技术
SCVP平台的关键技术主要包括:
1.语音识别技术
我们所提供的产品和服务,基本上都应用到了语音识别技术,该技术是SCVP平台的核心基础,而语音识别技术的逐渐成熟,也使SCVP在智能语音技术领域,推出越来越多的应用与服务;
2.平台融合技术
再好的技术也要变成产品才能够提供给用户,一个产品往往涉及到多项技术,SCVP平台正是融合了包括语音识别技术在内的多项技术,打造出基于云计算的新一代智能应用服务平台,平台设计思想、整体架构、性能与稳定性、开放性、经济性等等方面,也都需要突破和提升的。
技术路线
技术总是不断在发展的,SCVP平台的技术路线,主要包括以下几个方面和发展阶段:
1.语音识别技术
单纯识别-〉连续语音识别->模糊识别->自然语言理解->语意理解
2.应用平台
单业务->多业务-〉分布式->云计算-〉超云计算
3.应用网络
传统电话网-〉移动网-〉IP网络(互联网、移动互联网)-〉三网融合
4.用户终端
普通话机-〉移动电话-〉IP电话-〉智能移动终端-〉电子终端 。
SCVP平台应用产品参考
在SCVP平台可快速开发出各种基于智能语音的产品,并以服务的方式提供给用户。下面是列出部分产品,供参考:
1.语音搜索(简称:SVS)
SVS让用户通过各种终端(PC、电话、手机、IPAD等)以语音(讲话)的方式,查询所需的信息,而这些查询结果,或者以文字形式、或者文本信息合成为语音后播报给用户。SVS最大的特点是随时、随地,自然语音对话,可不依赖IP网络,方便、快捷。比如,用户在开车时,就可以说一句,“查询一下淮海路的粤菜馆”,系统就会检索信息并将查询结果语音播报给用户,甚至自动为用户电话转接至目标餐馆定位。相比目前的互联网搜索,SVS基本上可实现全部搜索功能。而且,SVS将重点定位于垂直搜索领域,可提供餐饮、道路、交通、定位、旅游等方面的精准搜索服务与扩展服务;
2.语音短信(简称:SVM)
SVM是用户在发送短信时,只需说出想要发送的内容,系统会自动识别用户的输入,并把用户的语音表达转换成相应的文字发送给对方。与传统文字短信相比,SVM更加方便、快捷,尤其在某种行动或视觉不便的环境下,如驾驶汽车,盲人等;
3.e时通(简称:SET)
SET主要实现电脑和电话的即时信息互动,可重点应用于电子商务服务等领域。例如,淘宝买家通过淘宝旺旺跟卖家沟通,可此时卖家并不在线。那怎么能够保持双方即时互动呢,SET就可以解决了,而且非常的方便。此时,卖家可通过电话,以语音方式和该买家即时聊天了,卖家的语音,经系统识别后转换成文字,发送给买方,而买方输入的文字,系统合成语音后播放给卖家,双方实现无缝即时聊天了。SET可为电子商务提高了服务保障和带来更多的商业机会,在其他通信、联络等方面都将有广泛的应用;
4语音支付(简称:SVP)
SVP能够让用户,通过语音验证的方式,实现实时在线支付等,具有非常高的安全性和便捷性。与指纹、瞳孔等生物特征的唯一性一样,人的声纹也是具有唯一性。我们在语音识别技术基础上,开发出了声纹验证技术,并结合支付技术等,推出的语音支付产品。用户只需讲几句话,就轻松实现了支付功能,方便、快捷,并安全性极高。SVP将是继移动支付后,又一个在支付领域的重大技术创新。
总之,SCVP平台各项技术创新已经在市场应用中得到了良好的反馈,技术创新推动应用创新,而市场需求又推动着技术的不断发展,本发明今后还会陆续推出更多的创新,满足社会日益发展革新所带来的各种需求。
Claims (6)
1.一种基于云计算的智能语音应用服务技术平台的软件结构,其特征是高效灵活的柔性处理机制。
2.一种基于云计算的智能语音应用服务技术平台的系统架构,其特征是在不影响平台运行时可任意进行系统维护、扩容、异常处理。
3.一种基于云计算的智能语音应用服务技术平台的应用架构,其特征是平台上各种应用端部署可以放置到互联网上的任意节点。
4.一种基于云计算的智能语音应用服务技术平台的“Ctag”云标记语言,其特征是开发应用程序如同写网页一样简单快捷,并具有高度安全性。
5.一种基于云计算的智能语音应用服务技术平台的容错与可靠性,其特征是即使个别服务器失效,也不会使系统崩溃,甚至不会错过一个服务请求。
6.一种基于云计算的智能语音应用服务技术平台的可伸缩性,其特征是随着SCVP客户端请求的增加,可增加SCVP服务器和应用的实例,无须停止任何运行着的应用程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201210246396 CN102917000A (zh) | 2012-07-17 | 2012-07-17 | 智能云语音应用服务技术平台 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201210246396 CN102917000A (zh) | 2012-07-17 | 2012-07-17 | 智能云语音应用服务技术平台 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102917000A true CN102917000A (zh) | 2013-02-06 |
Family
ID=47615232
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201210246396 Pending CN102917000A (zh) | 2012-07-17 | 2012-07-17 | 智能云语音应用服务技术平台 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102917000A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103986703A (zh) * | 2014-05-12 | 2014-08-13 | 浪潮电子信息产业股份有限公司 | 一种新型云应用解决方法 |
CN104392353A (zh) * | 2014-10-08 | 2015-03-04 | 无锡指网生物识别科技有限公司 | 语音识别终端的支付方法及系统 |
CN104538031A (zh) * | 2014-12-15 | 2015-04-22 | 北京云知声信息技术有限公司 | 智能语音服务开发云平台及方法 |
CN105376429A (zh) * | 2015-11-23 | 2016-03-02 | 苏州工业园区云视信息技术有限公司 | 基于云计算的语音能力服务开放系统 |
CN106034063A (zh) * | 2015-03-13 | 2016-10-19 | 阿里巴巴集团控股有限公司 | 一种在通信软件中通过语音启动业务的方法及相应装置 |
CN107731231A (zh) * | 2017-09-15 | 2018-02-23 | 福州瑞芯微电子股份有限公司 | 一种支持多云端语音服务的方法及一种存储设备 |
CN107767856A (zh) * | 2017-11-07 | 2018-03-06 | 中国银行股份有限公司 | 一种语音处理方法、装置及服务器 |
CN109819124A (zh) * | 2019-01-23 | 2019-05-28 | 广州市聚星源科技有限公司 | 一种ivr智能服务及其实现方法 |
-
2012
- 2012-07-17 CN CN 201210246396 patent/CN102917000A/zh active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103986703A (zh) * | 2014-05-12 | 2014-08-13 | 浪潮电子信息产业股份有限公司 | 一种新型云应用解决方法 |
CN104392353A (zh) * | 2014-10-08 | 2015-03-04 | 无锡指网生物识别科技有限公司 | 语音识别终端的支付方法及系统 |
CN104538031A (zh) * | 2014-12-15 | 2015-04-22 | 北京云知声信息技术有限公司 | 智能语音服务开发云平台及方法 |
CN106034063A (zh) * | 2015-03-13 | 2016-10-19 | 阿里巴巴集团控股有限公司 | 一种在通信软件中通过语音启动业务的方法及相应装置 |
US10353666B2 (en) | 2015-03-13 | 2019-07-16 | Alibaba Group Holding Limited | Starting network-based services using a vocal interface with communication software on a mobile computing device |
CN105376429A (zh) * | 2015-11-23 | 2016-03-02 | 苏州工业园区云视信息技术有限公司 | 基于云计算的语音能力服务开放系统 |
CN105376429B (zh) * | 2015-11-23 | 2018-08-31 | 苏州工业园区云视信息技术有限公司 | 基于云计算的语音能力服务开放系统 |
CN107731231A (zh) * | 2017-09-15 | 2018-02-23 | 福州瑞芯微电子股份有限公司 | 一种支持多云端语音服务的方法及一种存储设备 |
CN107731231B (zh) * | 2017-09-15 | 2020-08-14 | 瑞芯微电子股份有限公司 | 一种支持多云端语音服务的方法及一种存储设备 |
CN107767856A (zh) * | 2017-11-07 | 2018-03-06 | 中国银行股份有限公司 | 一种语音处理方法、装置及服务器 |
CN107767856B (zh) * | 2017-11-07 | 2021-11-19 | 中国银行股份有限公司 | 一种语音处理方法、装置及服务器 |
CN109819124A (zh) * | 2019-01-23 | 2019-05-28 | 广州市聚星源科技有限公司 | 一种ivr智能服务及其实现方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102917000A (zh) | 智能云语音应用服务技术平台 | |
US20240256788A1 (en) | Systems and methods for dialog management | |
CN101207656B (zh) | 用于动态切换模态的方法和用于提供文本交换服务的系统 | |
JP2023504777A (ja) | コンタクトセンターシステムとそのユーザとの間の対話を管理するためのシステム及び方法 | |
CN108028763A (zh) | 云计算的电信平台 | |
CN109189898A (zh) | 一种智能应答方法和系统 | |
CN111488433A (zh) | 一种适用于银行的提升现场体验感的人工智能交互系统 | |
CN106791233B (zh) | 一种用于提供ivr服务流程的方法及ivr系统 | |
CN103078995A (zh) | 一种在移动终端使用的可定制的个性化应答方法和系统 | |
CN101207655A (zh) | 通信会话中在话音和文本交换形态之间切换的方法和系统 | |
CN102017513A (zh) | 基于开放体系结构的依赖于域的实时多语种通信服务 | |
CN101237333A (zh) | 一种基于多网络融合的支持多种业务的通用业务平台 | |
CA2716346A1 (en) | Personal data portal on a pstn and online home with virtual rooms and objects | |
CN116324792A (zh) | 与通过从自然语言会话挖掘意图来进行机器人创作相关的系统和方法 | |
CN102665016B (zh) | 基于云计算的自定义交互式语音问答实现方法 | |
US11049497B1 (en) | Contemporaneous machine-learning analysis of audio streams | |
US20140067401A1 (en) | Provide services using unified communication content | |
CN103685788A (zh) | 一种基于ip网络的自动电话外呼及语音交互系统 | |
CN103825961A (zh) | 语音电子商务系统及其实现方法 | |
US20210006661A1 (en) | Carrier connect platform within a cloud-based contact center | |
Hoang et al. | Design and implementation of a VoIP PBX integrated Vietnamese virtual assistant: a case study | |
Jahanshahi et al. | From Mobile To Mobile Commerce: An Overview In The Indian Perspective | |
CN109981490B (zh) | 具备行动加值服务的智能网络交换机系统 | |
Singh et al. | Economical Global Access to a VoiceXML Gateway Using Open Source Technologies | |
Suciu et al. | Cloud Computing Customer Communication Center |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130206 |