CN100479410C - 一种语音浏览系统 - Google Patents

一种语音浏览系统 Download PDF

Info

Publication number
CN100479410C
CN100479410C CNB2006101032289A CN200610103228A CN100479410C CN 100479410 C CN100479410 C CN 100479410C CN B2006101032289 A CNB2006101032289 A CN B2006101032289A CN 200610103228 A CN200610103228 A CN 200610103228A CN 100479410 C CN100479410 C CN 100479410C
Authority
CN
China
Prior art keywords
service
unit
voice
module
authentication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB2006101032289A
Other languages
English (en)
Other versions
CN101106509A (zh
Inventor
李满海
夏险峰
游波
刘斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CNB2006101032289A priority Critical patent/CN100479410C/zh
Publication of CN101106509A publication Critical patent/CN101106509A/zh
Application granted granted Critical
Publication of CN100479410C publication Critical patent/CN100479410C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种语音浏览系统,其包括:业务控制模块、业务数据库模块和解析处理模块;其中,所述业务控制模块用于多种业务类型的接入控制,并实现业务的鉴权和计费;所述业务数据库模块用于保存注册业务的信息数据;所述解析处理模块用于访问并解析互联网上的语音可扩展标记语言(VXML)和呼叫控制可扩展标记语言(CCXML)文档,实现与用户进行语音交互。本发明系统实现了多种业务类型不同接入方式的灵活控制,并通过将互联网资源与语音交互技术的有机融合,可以向公众快速有效地提供丰富、高质量和个性化的跨网业务。

Description

一种语音浏览系统
技术领域
本发明涉及一种语音浏览系统,具体涉及的是一种基于语音可扩展标记语言(VXML)和呼叫控制可扩展标记语言(CCXML)的语音浏览系统。
背景技术
语音浏览技术改变了以往建立于简单的、封闭的交互机制的语音应用,可将数据和交互建立于互联网浏览结构之上,从而使终端设备便捷地畅游互联网。
现有语音浏览系统,如图1所示,基本原理如下:语音浏览系统由语音交互控制模块和数据采集模块两大部分组成。终端设备通过用户接入设备向系统请求服务,语音交互控制模块进行业务流程控制,信息采集模块实现信息查询以及对互联网上信息进行采集分析,并以语音方式向用户提供业务服务。比如中国专利号为CN200410066474的“一种语音浏览系统”等。
从上述的实现原理来看,现有的语音浏览技术存在以下不足:需要信息采集模块,间接获取互联网上的资源数据;语音应用的开发有难度,需要了解系统的API及相关的底层编码。
因此,现有技术还有待于进步和发展。
发明内容
本发明的目的在于提出一种语音浏览系统,利用语音可扩展标记语言(VXML)和呼叫控制可扩展标记语言(CCXML)的技术优势,实现动态、实时访问互联网资源。
本发明的技术方案包括:
一种语音浏览系统,其中,其包括:业务控制模块、业务数据库模块和解析处理模块;其中,
所述业务控制模块用于多种业务类型的接入控制,并实现业务的鉴权和计费;
所述业务数据库模块用于保存注册业务的信息数据;
所述解析处理模块用于访问并解析互联网上的语音可扩展标记语言(VXML)和呼叫控制可扩展标记语言(CCXML)文档,实现与用户进行语音交互。
其中,所述业务控制模块作为整个系统的引导门户模块,包括业务接入单元、数据维护单元;所述业务接入单元用于接收用户的操作请求并向用户报告操作结果;所述数据维护单元连接所述业务数据库模块,所述业务接入单元通过与所述数据维护单元的交互,根据进入业务的主叫号码和被叫号码,获取业务的相应信息。
所述的系统,其中,所述业务控制模块还包括业务鉴权单元,用于接收所述业务接入单元的鉴权请求,所述业务接入单元接收鉴权返回结果后,判断是否将后续的业务控制权转交给所述解析处理模块。
所述的系统,其中,所述业务控制模块还包括一业务计费单元,用于在用户使用完业务后,通过与所述业务接入单元的交互,以及通过与数据维护单元的交互访问数据库,根据一定的计费方案计收费用。
所述的系统,其中,所述业务鉴权单元通过与数据维护单元的交互访问业务数据库,根据一定的鉴权逻辑,分析用户接入到某个业务的权限特征,并将鉴权的结果返回给所述业务接入单元。
所述的系统,其中,所述解析处理模块包括业务处理单元、脚本分析单元和HTTP接入单元,其中所述业务处理单元用于接过业务控制模块转交过来的业务控制权,根据脚本解析单元解析出的业务逻辑,通过与平台资源的通讯,实现通过语音与用户进行交互;当语音交互完成后,将业务控制权转交给所述业务控制模块。
所述的系统,其中,所述平台资源包括语音识别资源、文本转语音资源或交换机。
本发明所提供的一种语音浏览系统,与现有语音交互技术相比,实现了多种业务类型不同接入方式的灵活控制,并通过将互联网资源与语音交互技术的有机融合,可以向公众快速有效地提供丰富、高质量和个性化的跨网业务。
附图说明
图1为现有技术的语音浏览系统的结构图;
图2为本发明的语音浏览系统的结构图;
图3为本发明语音浏览系统的一个实例的示意图。
具体实施方式
下面结合附图,将对本发明技术方案的实施作进一步的详细描述:
本发明语音浏览系统的核心思想是由业务控制模块专门负责管理多种业务类型的接入,实现灵活多样的业务接入方式;利用语音可扩展标记语言(VXML)和呼叫控制可扩展标记语言(CCXML)可以和互联网进行无缝结合的技术优势,使互联网上的广大应用通过语音得到更广泛的延伸。
本发明所述的系统主要由三个模块组成:业务控制模块、业务数据库模块和解析处理模块,如图2所示。所述业务控制模块主要负责多种业务类型的接入控制,并实现业务的鉴权和计费等功能。所述业务数据库模块主要负责保存注册业务的信息数据。所述解析处理模块主要负责访问并解析互联网上的语音可扩展标记语言(VXML)和呼叫控制可扩展标记语言(CCXML)文档,实现与用户进行语音交互。
本发明所述语音浏览系统中,所述业务控制模块作为整个系统的引导门户模块,主要负责多种业务类型的接入控制。其中业务接入单元负责接收用户的操作请求并向用户报告操作结果;通过与数据维护单元的交互,根据进入业务的主叫号码和被叫号码,获取业务的相应信息;向业务鉴权单元发送鉴权请求,接收鉴权返回结果后,判断是否将后续的业务控制权转交给解析处理模块;用户使用完业务后,通过与业务计费单元的交互完成计费。
所述业务鉴权单元负责接收业务接入单元的鉴权请求,通过与数据维护单元的交互访问业务数据库,根据一定的鉴权逻辑,分析用户接入到某个业务的权限特征,然后将鉴权的结果返回给业务接入单元。
所述业务计费单元负责接收业务接入单元的计费请求,通过与数据维护单元的交互访问数据库,根据一定的计费方案收取费用。
所述数据维护单元负责接收数据库的访问操作指令,并将数据库操作的执行结果返回。从以上过程来看,业务控制模块的工作性质单一,主要负责向用户提供多种业务类型的接入,通过对不同的业务的鉴权和计费,满足个性化的业务接入。
所述解析处理模块作为该系统的核心模块,主要负责获取并解析语音可扩展标记语言(VXML)和呼叫可控制扩展标记语言(CCXML)的业务资源,并控制资源与用户进行语音交互。
其中业务处理单元负责接过业务控制模块转交过来的业务控制权,根据脚本解析单元解析出的业务逻辑,通过与平台资源(比如语音识别资源、文本转语音资源、交换机等)的通讯,实现通过语音与用户进行交互;当语音交互完成后,将业务控制权转交给业务控制模块。
所述脚本解析单元负责解析HTTP接入单元获取的语音可扩展标记语言(VXML)和呼叫可控制扩展标记语言(CCXML)编写的文档,并根据解析出的业务逻辑与HTTP接入单元进行交互,获取其他文档。HTTP接入单元专门负责与外界的Web服务器进行通讯,通过HTTP协议获取业务文档,并将这些文档发给脚本解析单元。
所述业务数据库主要负责保存所有注册业务的信息。并保证数据安全。数据库由专门的企业级的数据库管理系统来维护,比如Oracle、SQL Server等。本发明的数据库模块可作为独立模块放在单独的服务器上运行,也可以节约系统成本与解析处理模块放在同一台服务器上运行。
下面结合图3,对本发明语音浏览系统的具体实现进行举例说明:
第1步:SP维护人员遵循语音可扩展标记语言(VXML)和呼叫可控制扩展标记语言(CCXML)的国际标准,开发出的语音应用(暂时称为VXML业务),放在Web服务器上,该服务器可以在运营端,也可以在网络的其他地方。
第2步:SP维护人员向运营商的语音浏览系统登记业务信息,并申请一个VXML业务接入码,比如10159111。使得用户只要拨打该号码就可以访问VXML业务。
第3步:用户通过终端设备(比如固定电话、小灵通或手机等)拨打VXML业务的接入码10159111。移动或电信运营商的用户接入装置(由交换机、路由器等设备组成)收到用户的10159111拨号号码后,触发智能网平台的语音浏览系统。
第4步:语音浏览系统的业务控制模块将进入系统的主叫号码和被叫号码进行鉴权,分析10159111业务信息数据,比如该VXML业务的当前在线流量是否超过最大值等信息。如果鉴权通过,则继续下面步骤,否则释放呼叫。
第5步:语音浏览系统的解析处理模块获取与用户交互的控制权,根据登记的VXML业务的注册信息,比如该VXML业务的首页地址,通过HTTP协议访问web服务器,获取相应的VXML文档。
第6步:语音浏览系统的解析处理模块解析出VXML文档中的业务逻辑,通过与运营商平台资源的通讯,实现与用户的语音交互。比如需要与用户进行语音识别交互时,解析处理模块要跟语音识别服务器进行通讯;若需要将某些文字信息播放给用户时,解析处理模块要跟文本转语音服务器进行通讯。
第7步:系统与用户的语音交互结束后,语音浏览系统的业务控制模块重新获取系统控制权,根据VXML业务的计费方案信息实现业务计费。计费完成后,释放结束整个呼叫流程。
本发明系统由于采用语音可扩展标记语言(VXML)和呼叫可控制扩展标记语言(CCXML)在互联网上获取和交流数据,具有天然的技术优势,使得互联网上的信息和数据可便捷、实时地流入公用电话网。
同时业务逻辑通过语音可扩展标记语言(VXML)和呼叫可控制扩展标记语言(CCXML)来表达,开发语音应用像撰写web网页一样简单。语音应用内容通过互联网访问,语音应用内容服务器可以在世界上任何地理位置。
而语音应用开发商只要遵循语音可扩展标记语言(VXML)和呼叫可控制扩展标记语言(CCXML)的国际标准,开发出的语音应用均可以在系统上运行,实现多种业务类型的灵活多样的接入。
综上,本发明所述的语音浏览系统,与现有语音交互技术相比,实现了多种业务类型不同接入方式的灵活控制,并通过将互联网资源与语音交互技术的有机融合,可以向公众快速有效地提供丰富、高质量和个性化的跨网业务。
应当理解的是,上述针对具体实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本发明的专利保护范围应以所附权利要求为准。

Claims (6)

1、一种语音浏览系统,其特征在于,其包括:业务控制模块、业务数据库模块和解析处理模块;其中,
所述业务控制模块用于多种业务类型的接入控制,并实现业务的鉴权和计费;所述业务控制模块作为整个系统的引导门户模块,包括业务接入单元、数据维护单元;所述业务接入单元用于接收用户的操作请求并向用户报告操作结果;所述数据维护单元连接所述业务数据库模块,所述业务接入单元通过与所述数据维护单元的交互,根据进入业务的主叫号码和被叫号码,获取业务的相应信息;
所述业务数据库模块用于保存注册业务的信息数据;
所述解析处理模块用于访问并解析互联网上的语音可扩展标记语言VXML和呼叫控制可扩展标记语言CCXML文档,实现与用户进行语音交互。
2、根据权利要求1所述的系统,其特征在于,所述业务控制模块还包括业务鉴权单元,用于接收所述业务接入单元的鉴权请求,所述业务接入单元接收鉴权返回结果后,判断是否将后续的业务控制权转交给所述解析处理模块。
3、根据权利要求2所述的系统,其特征在于,所述业务控制模块还包括一业务计费单元,用于在用户使用完业务后,通过与所述业务接入单元的交互,以及通过与数据维护单元的交互访问数据库,根据一定的计费方案计收费用。
4、根据权利要求2所述的系统,其特征在于,所述业务鉴权单元通过与数据维护单元的交互访问业务数据库,根据一定的鉴权逻辑,分析用户接入到某个业务的权限特征,并将鉴权的结果返回给所述业务接入单元。
5、根据权利要求1所述的系统,其特征在于,所述解析处理模块包括业务处理单元、脚本分析单元和HTTP接入单元,其中所述业务处理单元用于接过业务控制模块转交过来的业务控制权,根据脚本解析单元解析出的业务逻辑,通过与平台资源的通讯,实现通过语音与用户进行交互;当语音交互完成后,将业务控制权转交给所述业务控制模块。
6、根据权利要求5所述的系统,其特征在于,所述平台资源包括语音识别资源、文本转语音资源或交换机。
CNB2006101032289A 2006-07-14 2006-07-14 一种语音浏览系统 Active CN100479410C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006101032289A CN100479410C (zh) 2006-07-14 2006-07-14 一种语音浏览系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006101032289A CN100479410C (zh) 2006-07-14 2006-07-14 一种语音浏览系统

Publications (2)

Publication Number Publication Date
CN101106509A CN101106509A (zh) 2008-01-16
CN100479410C true CN100479410C (zh) 2009-04-15

Family

ID=39000197

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006101032289A Active CN100479410C (zh) 2006-07-14 2006-07-14 一种语音浏览系统

Country Status (1)

Country Link
CN (1) CN100479410C (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101621773B (zh) * 2008-07-02 2012-07-11 中兴通讯股份有限公司 一种实现增强ip业务的组网系统及方法
CN101404697B (zh) * 2008-11-18 2011-04-13 中国电信股份有限公司 提供综合信息服务的呼叫中心系统及呼叫方法
CN101527755B (zh) * 2009-03-30 2011-07-13 中兴通讯股份有限公司 基于VoiceXML移动终端语音交互方法及移动终端
CN106815099B (zh) * 2017-01-19 2020-09-18 腾讯科技(深圳)有限公司 鉴权系统和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
智能网教程. 王柏,全文,北京邮电大学出版社. 2000
智能网教程. 王柏,全文,北京邮电大学出版社. 2000 *

Also Published As

Publication number Publication date
CN101106509A (zh) 2008-01-16

Similar Documents

Publication Publication Date Title
US8601096B2 (en) Method and system for multi-modal communication
RU2003119198A (ru) Система и способ для пользователей мобильных вычислительных устройств для распечатки документов
US20030088421A1 (en) Universal IP-based and scalable architectures across conversational applications using web services for speech and audio processing resources
CN1742475A (zh) 在通信路径中的中间装置的应用服务过滤
CN1666199A (zh) 一种与访问互联网内容有关的装置及方法
CA2379742A1 (en) Location-based address provision
US20060100881A1 (en) Multi-modal web interaction over wireless network
US7295984B2 (en) Systems and methods for providing voice and data interfaces to web services-based applications
CN100479410C (zh) 一种语音浏览系统
US8448059B1 (en) Apparatus and method for providing browser audio control for voice enabled web applications
JP2003091376A (ja) ポータブルワイヤレスデバイスおよび印刷装置のリファレンスによる印刷プロトコル
CN103533038A (zh) 一种基于html5的远程控制系统及其远程控制方法
CN101668050A (zh) 域名解析方法及系统
US20030233238A1 (en) Distributed voice browser
CN101686247B (zh) 信息处理方法和系统
CN101448216B (zh) 一种信息搜索的方法及搜索服务装置
CN101902518A (zh) 简化手机注册网站帐户的方法和系统
KR20090069589A (ko) 모바일용 웹페이지 변환 시스템 및 방법
CN102148869B (zh) Java应用程序向本地传递信息的方法及设备
JP2005535166A (ja) 音声xmlを用いて電話サービス機能を実施する方法およびシステム
CN103229494A (zh) 业务服务器装置、业务提供方法、业务提供程序
US20090012888A1 (en) Text-to-speech streaming via a network
CN102567321A (zh) 一种基于语音识别的域名访问和搜索方法
US20050015500A1 (en) Method and system for response buffering in a portal server for client devices
CN201146520Y (zh) 远程控制嵌入式设备的装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant