CN100463472C - 用于语音增值业务系统的预取语音资源的实现方法 - Google Patents

用于语音增值业务系统的预取语音资源的实现方法 Download PDF

Info

Publication number
CN100463472C
CN100463472C CNB2006100904092A CN200610090409A CN100463472C CN 100463472 C CN100463472 C CN 100463472C CN B2006100904092 A CNB2006100904092 A CN B2006100904092A CN 200610090409 A CN200610090409 A CN 200610090409A CN 100463472 C CN100463472 C CN 100463472C
Authority
CN
China
Prior art keywords
dialogue
voice
probability
user
looking ahead
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2006100904092A
Other languages
English (en)
Other versions
CN1874375A (zh
Inventor
廖建新
王晶
王纯
李炜
王文林
朱晓民
武家春
张磊
樊利民
程莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CNB2006100904092A priority Critical patent/CN100463472C/zh
Publication of CN1874375A publication Critical patent/CN1874375A/zh
Application granted granted Critical
Publication of CN100463472C publication Critical patent/CN100463472C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

一种用于语音增值业务系统的预取语音资源的实现方法,步骤如下:(1)系统调查用户的业务行为习惯,即统计和计算用户从某一对话di转移到另一对话dj的概率Pij和系统状态发生改变的平均时间u;(2)当系统的状态发生改变或到达某个预设的时间周期时,系统计算各个对话dj的预取概率Pj;(3)系统按照每个对话的预取概率大小和系统的存储容量,采用抢占式的优先级方式对预取概率数值较高的对话进行预取。该方法通过对系统中所有用户的语音增值业务的使用状态信息来统计各个对话的预取概率,准确率高;还根据系统业务的变化或设定的变化时间,重新调查和统计用户的业务行为习惯,使得预取的语音资源更准确,以降低系统的业务响应时间,实现性能优化。

Description

用于语音增值业务系统的预取语音资源的实现方法
技术领域
本发明涉及一种用于对语音增值业务系统进行性能优化的方法,确切地说,涉及一种用于语音增值业务系统的预取语音资源的实现方法,属于计算机通信的技术领域。
背景技术
语音增值业务是在传统声讯业务的基础上,通过话音、短信、彩信、WAP等多种接入方式,为终端用户提供的一种以话音为主、融合多种不同类型的话音和数据业务为一体的获取信息和信息互动的增值业务。语音增值业务系统是采用语音扩展标记语言VoiceXML来实现网络功能,并向业务提供商开放的。这样,业务提供商就可方便地用VoiceXML语言将业务的具体内容写成VoiceXML页面文件的形式,在运营商的语音增值业务系统上解释执行,并通过话音通道展示给用户,以便用户访问各种各样的网络资源。
参见图1,介绍目前使用的语音增值业务系统的组成架构:包括VoiceXML解释器和执行平台两部分。用户使用语音增值业务的系统实现过程主要包括以下三个步骤:
(1)Web文件服务器处理语音增值业务系统发来的用户的业务请求,把用户请求的VoiceXML文件及相关语音资源返回给VoiceXML解释器;
(2)VoiceXML解释器对VoiceXML文件进行解析;
(3)VoiceXML解释器执行VoiceXML文件,控制底层的执行平台向用户放音、收号、完成语音识别,以及执行呼叫前转等功能。
由于语音业务对实时性要求很高,如何减少系统的响应时间,也就是减少语音增值业务系统在执行上述各个步骤上所耗费的时间,是该系统在改进或优化性能过程中至关重要的问题。
经过调查发现:在上述三个步骤中,步骤(1)所花费的时间最长,也是不可控制的。如何对这一步骤进行优化是改进性能的关键。
目前一般采用预取技术,即在需要某个资源之前,系统预先将该资源从服务器上取过来等待使用。现在,人们已经研制了一些预取资源的方法,例如:基于热点的预取、基于链接的预取、基于访问序列的预取、基于访问概率的预取、基于兴趣的预取等等。但是,现有的这些预取资源的方法大都是针对基于HTML语言的普通Web业务,并不适合基于VoiceXML语言的语音增值业务。因此,如何对基于VoiceXML语言的语音增值业务实现资源预取的方法就成为业内技术人员关注的新课题。
发明内容
有鉴于此,本发明的目的是提供一种用于语音增值业务系统的预取语音资源的实现方法,以便能够降低系统的业务响应时间,实现语音增值业务系统的性能优化。
为了达到上述目的,本发明提供了一种用于语音增值业务系统的预取语音资源的实现方法,其特征在于:包括下列操作步骤:
(1)系统调查用户的业务行为习惯,即统计和计算用户从某一对话di转移到另一对话dj的概率Pij:Pij=Cij/Ci,式中Ci是在系统设定的足够长的测试时间T内,该用户访问对话di的次数;Cij是在设定的测试时间T内,该用户从对话di跳转到对话dj的转移次数;自然数i、j为对话的序号;同时,系统计算系统状态发生改变的平均时间u,: u = T Σ j = 1 N Σ i = 1 N C ij , 式中N是系统中的对话总数;
(2)当系统的状态发生改变或到达某个预先设定的时间周期时,系统按照下述公式计算各个对话dj的预取概率Pj P j = 1 - Π i = 1 N ( 1 - p ij ) ki , 式中ki是正在访问对话di的用户数,N是系统中的对话总数;
(3)系统按照每个对话的预取概率大小,并根据系统的存储容量,采用抢占式的优先级方式对预取概率数值较高的对话进行预取。
所述步骤(1)中,系统设定的足够长的测试时间T至少大于一天、一周、或一月。
所述步骤(1)或(2)中,系统的状态发生改变是指系统中的任一用户发生了对话的跳转。
所述步骤(2)中,预先设定的时间周期是指系统状态发生改变的平均时间u,该数值是系统设定的测试时间T除以在该测试时间T内系统状态发生改变的总的次数的商。
所述步骤(3)中,如果要被预取的某个或多个对话已在系统中运行,则省略该步骤操作,即不需要重新预取。
所述步骤(3)中,抢占式的优先级方式对预取概率数值较高的对话进行预取是系统立即停止所有正在进行的对话的预取,并且,系统不管各对话的原先优先级,统一按照各对话的新的预取概率的数值大小进行优先级排队,再按照该新的优先级的高低、即各对话的新的预取概率的数值大小对对话进行预取。
当系统提供的语音增值业务发生变化时,系统要重新调查和统计用户的业务行为习惯,即对步骤(1)各项参数要重新计算。
当系统运行了一段时间后,可根据实际使用情况,重新调查和统计用户的业务行为习惯,即步骤(1)中的各项参数要定期更新,以贴近实际使用效果。
本发明是一种用于语音增值业务系统的预取语音资源的实现方法,其优点是该方法通过对系统中所有用户的语音增值业务的使用状态信息来统计各个对话的预取概率,因此预取的准确率较高。而且,还能够根据系统业务的变化或设定的变化时间,重新调查和统计用户的业务行为习惯,使得预取的语音资源更加准确;即本发明方法具有自适应性能。总之,本发明的推广应用能够降低系统的业务响应时间,实现语音增值业务系统的性能优化。
附图说明
图1是目前使用的语音增值业务系统的组成架构示意图。
图2是本发明用于语音增值业务系统的预取语音资源的实现方法操作步骤流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
众所周知,在一个VoiceXML文件的页面中,往往存在多个对话Dialog,对话则由窗体元素<form>和菜单元素<menu>所构成,其中每一个对话都会引用一个或多个语音资源。作为VoiceXML文件中系统执行跳转的最小单位,对话是与用户交互的主体。而且,用户在对话之间的跳转通常具有马尔可夫性,即这种跳转在时刻t0所处的状态为已知的条件下,在时刻t>t0所处状态的条件分布与在时刻t0之前所处的状态无关。为说明方便,本发明把一个对话中所包括的所有语音资源设置为一个最小预取单位,并把对最小预取单位的预取简称为对话的预取。
参见图2,本发明是用于语音增值业务系统的预取语音资源的实现方法,包括下列操作步骤:
(1)系统调查用户的业务行为习惯,即统计和计算用户从某一对话di转移到另一对话dj的概率Pij:Pij=Cij/Ci,式中Ci是在设定的足够长时间(例如:一天、一周、或一月)内,该用户访问对话di的次数;Cij是在设定的同样时间内,该用户从对话di跳转到对话dj的转移次数;自然数i、j为对话的序号;同时,系统计算系统状态发生改变的平均时间u: u = T &Sigma; j = 1 N &Sigma; i = 1 N C ij , 式中N是系统中的对话总数;
(2)当系统的状态发生改变(即系统中任何一个用户发生了对话的跳转)或到达某个预先设定的时间周期(即系统状态发生改变的平均时间)时,系统按照下述公式计算各个对话dj的预取概率Pj P j = 1 - &Pi; i = 1 N ( 1 - p ij ) ki , 式中ki是正在访问对话di的用户数,N是系统中的对话总数;
(3)系统按照每个对话的预取概率大小,并根据系统的存储容量,采用抢占式的优先级方式对预取概率数值较高的对话进行预取;如果要被预取的某个或多个对话已在系统中运行,则省略该步骤操作,即不需要重新预取。
需要注意的是:当系统提供的语音增值业务发生变化时,系统要重新调查和统计用户的业务行为习惯,即对步骤(1)各项参数要重新计算。而当系统运行了一段时间后,可以根据实际使用情况,重新调查和统计用户的业务行为习惯,即步骤(1)中的各项参数要定期更新,以贴近实际使用效果。
参见下表所示的VoiceXML文件的一个页面,作为本发明的一个试验实施例,具体介绍本发明的具体实现方法:
Figure C200610090409D00082
Figure C200610090409D00091
该表所示为某个网上书店的VoiceXML业务的一小部分,它包含了两个对话:一个是由form元素构成的对话welcome,另一个是由menu元素构成的对话mainmenu。对话mainmenu还指向了后面的5个VoiceXML文件,分别是:selectbook.vxml、shoppingcar.vxml、billing.vxml、query.vxml和help.vxml。可以分别假设这5个VoiceXML文件中的每个文件都包含了1个对话,这样该业务系统总共有7个对话,将其依次分别编号为d1、d2、d3、d4、d5、d6、d7。则在一个较长的时间段内,系统测得各个对话被访问的次数如下面表1所示:
 
对话编号 d1 d2 d3 d4 d5 d6 d7
被访问次数Ci 200 350 180 175 105 40 15
同时系统测得用户在各对话之间的跳转次数如下面表2所示:
 
Cij 到d1 到d2 到d3 到d4 到d5 到d6 到d7
从d1 0 200 0 0 0 0 0
从d2 0 0 180 20 65 40 5
从d3 0 20 0 140 10 0 0
从d4 0 70 0 0 30 0 10
从d5 0 40 0 15 0 0 0
从d6 0 5 0 0 0 0 0
从d7 0 15 0 0 0 0 0
根据上述表1、表2,根据公式可以计算出各对话间跳转的概率如下面表3所示:
 
Pij 到d1 到d2 到d3 到d4 到d5 到d6 到d7
从d1 0 1.0000 0 0 0 0 0
从d2 0 0 0.5143 0.0571 0.1857 0.1143 0.0143
 
从d3 0 0.1111 0 0.7778 0.0556 0 0
从d4 0 0.4000 0 0 0.1714 0 0.0571
从d5 0 0.3810 0 0.1429 0 0 0
从d6 0 0.1250 0 0 0 0 0
从d7 0 1.0000 0 0 0 0 0
假设系统的状态发生改变或到达某个预先设定的时间周期时,有3个人正在访问对话2,有5个人正在访问对话4,其他资源都没有人访问,则此时可以分别计算出系统所有对话的预取概率为:
对话d1:P1=1-1×1×1×1×1×1×1=0;
对话d2:P2=1-(1-1.0000)0×(1-0)3×(1-0.1111)0×(1-0.4000)5×(1-0.3810)0×(1-0.1250)0×(1-1.000)0
         =1-(0.6000)5=0.9222;
对话d3:P3=1-(1-0)0×(1-0.5143)3×(1-0)0×(1-0)5×(1-0)0×(1-0)0×(1-0)0=1-(1-0.5143)3
         =0.8854;
对话d4:P4=1-(1-0)0×(1-0.0571)3×(1-0.7778)0×(1-0)5×(1-0.1429)0×(1-0)0×(1-0)0
         =1-(1-0.0571)3=0.1617;
对话d5:P5=1-(1-0)0×(1-0.1857)3×(1-0.0556)0×(1-0.1714)5×(1-0)0×(1-0)0×(1-0)0
         =1-(1-0.1857)3×(1-0.1714)5=0.7891;
对话d6:P6=1-(1-0)0×(1-0.1143)3×(1-0)0×(1-0)5×(1-0)0×(1-0)0×(1-0)0=1-(1-0.1143)3
         =0.3052;
对话d7:P7=1-(1-0)0×(1-0.0143)3×(1-0)0×(1-0.0571)5×(1-0)0×(1-0)0×(1-0)0
         =1-(1-0.0143)3×(1-0.0571)5=0.2862;
如果根据系统容量,只能预先存储3个对话资源,则选取其中预取概率最高的三个对话:d2、d3和d5。
本发明已经在网上书店的VoiceXML业务中进行了试验实施,其中预取概率最高的几个对话降低了系统的业务响应时间,能够实现语音增值业务系统的性能优化;因此,试验的结果是成功的,实现了发明目的。

Claims (8)

1.一种用于语音增值业务系统的预取语音资源的实现方法,其特征在于:包括下列操作步骤:
(1)系统调查用户的业务行为习惯,即统计和计算用户从某一对话di转移到另一对话dj的概率Pij:Pij=Cij/Ci,式中Ci是在系统设定的足够长的测试时间T内,该用户访问对话di的次数;Cij是在设定的测试时间T内,该用户从对话di跳转到对话dj的转移次数;自然数i、j为对话的序号;
同时,系统计算系统状态发生改变的平均时间u: u = T &Sigma; j = 1 N &Sigma; i = 1 N C ij , 式中N是系统中的对话总数;
(2)当系统的状态发生改变或到达某个预先设定的时间周期时,系统按照下述公式计算各个对话dj的预取概率Pj P j = 1 - &Pi; i = 1 N ( 1 - p ij ) ki , 式中ki是正在访问对话di的用户数,N是系统中的对话总数;
(3)系统按照每个对话的预取概率大小,并根据系统的存储容量,采用抢占式的优先级方式对预取概率数值较高的对话进行预取。
2.根据权利要求1所述的预取语音资源的实现方法,其特征在于:所述步骤(1)中,系统设定的足够长的测试时间T至少大于一天、一周、或一月。
3.根据权利要求1所述的预取语音资源的实现方法,其特征在于:所述步骤(1)或(2)中,系统的状态发生改变是指系统中的任一用户发生了对话的跳转。
4.根据权利要求1所述的预取语音资源的实现方法,其特征在于:所述步骤(2)中,预先设定的时间周期是指系统状态发生改变的平均时间u,该数值是系统设定的测试时间T除以在该测试时间T内系统状态发生改变的总的次数的商。
5.根据权利要求1所述的预取语音资源的实现方法,其特征在于:所述步骤(3)中,如果要被预取的某个或多个对话已在系统中运行,则省略该步骤操作,即不需要重新预取。
6.根据权利要求1所述的预取语音资源的实现方法,其特征在于:所述步骤(3)中,抢占式的优先级方式对预取概率数值较高的对话进行预取是系统立即停止所有正在进行的对话的预取,并且,系统不管各对话的原先优先级,统一按照各对话的新的预取概率的数值大小进行优先级排队,再按照该新的优先级的高低、即各对话的新的预取概率的数值大小对对话进行预取。
7.根据权利要求1所述的预取语音资源的实现方法,其特征在于:当系统提供的语音增值业务发生变化时,系统要重新调查和统计用户的业务行为习惯,即对步骤(1)各项参数要重新计算。
8.根据权利要求1所述的预取语音资源的实现方法,其特征在于:当系统运行了一段时间后,可根据实际使用情况,重新调查和统计用户的业务行为习惯,即步骤(1)中的各项参数要定期更新,以贴近实际使用效果。
CNB2006100904092A 2006-06-23 2006-06-23 用于语音增值业务系统的预取语音资源的实现方法 Expired - Fee Related CN100463472C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006100904092A CN100463472C (zh) 2006-06-23 2006-06-23 用于语音增值业务系统的预取语音资源的实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006100904092A CN100463472C (zh) 2006-06-23 2006-06-23 用于语音增值业务系统的预取语音资源的实现方法

Publications (2)

Publication Number Publication Date
CN1874375A CN1874375A (zh) 2006-12-06
CN100463472C true CN100463472C (zh) 2009-02-18

Family

ID=37484628

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006100904092A Expired - Fee Related CN100463472C (zh) 2006-06-23 2006-06-23 用于语音增值业务系统的预取语音资源的实现方法

Country Status (1)

Country Link
CN (1) CN100463472C (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100461679C (zh) * 2007-06-04 2009-02-11 中国移动通信集团公司 提高业务判别效率的方法
CN102354383A (zh) * 2011-06-30 2012-02-15 珠海艾派克微电子有限公司 一种权限分配方法及系统
US20150370787A1 (en) * 2014-06-18 2015-12-24 Microsoft Corporation Session Context Modeling For Conversational Understanding Systems

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002091364A1 (en) * 2001-05-04 2002-11-14 Unisys Corporation Dynamic generation of voice application information from a web server
CN1604036A (zh) * 2004-10-29 2005-04-06 北京邮电大学 一种用于语音增值业务系统的优化性能的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002091364A1 (en) * 2001-05-04 2002-11-14 Unisys Corporation Dynamic generation of voice application information from a web server
CN1604036A (zh) * 2004-10-29 2005-04-06 北京邮电大学 一种用于语音增值业务系统的优化性能的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
The VoiceXML Dialog System forthe E-Commerce Ordering Service. Min-Jen Tsai.computer supported cooperative work in design,2005,proceedings of the 9th international conference,Vol.1 . 2005
The VoiceXML Dialog System forthe E-Commerce Ordering Service. Min-Jen Tsai.computer supported cooperative work in design,2005,proceedings of the 9th international conference,Vol.1 . 2005 *
VoiceXML在语音自动转接中的应用. 胡小勇,汪林林.计算机科学,第32卷第6期. 2005
VoiceXML在语音自动转接中的应用. 胡小勇,汪林林.计算机科学,第32卷第6期. 2005 *

Also Published As

Publication number Publication date
CN1874375A (zh) 2006-12-06

Similar Documents

Publication Publication Date Title
US7801891B2 (en) System and method for collecting user interest data
CN108804707A (zh) 一种页面处理方法、装置以及相关设备
CN103810176B (zh) 一种网页信息的预取访问方法和装置
US9817799B2 (en) Method and apparatus for providing web pages
CN108805694B (zh) 信贷咨询服务方法、装置、设备及计算机可读存储介质
CA2803616C (en) Systems, methods and machine readable mediums to select a title for content production
CN103916474B (zh) 缓存时间的确定方法、装置及系统
JP2013508805A (ja) 事前設定条件に基づくウェブサイトユーザのためのデータ更新
CN106503111B (zh) 网页转码方法、装置及客户终端
US8438056B2 (en) Methods and apparatus to provide incentives to deflect callers to websites
CN103200231B (zh) 策略控制方法及系统
CN102750291A (zh) 用户定制分析装置、通讯终端及其访问互联网方法和系统
CN104933069A (zh) 一种桌面终端上网浏览统计的分析方法和系统
CN100463472C (zh) 用于语音增值业务系统的预取语音资源的实现方法
US20050198300A1 (en) Data logging framework
CN108446370B (zh) 语音数据统计方法和系统
CN107026895A (zh) 应用程序列表数据的推送方法、装置和服务器
CN104573040B (zh) 抓取网页数据的方法及系统
US8433606B2 (en) Methods and apparatus to determine when to deflect callers to websites
Rukzio et al. Automatic form filling on mobile devices
US20140006916A1 (en) Pre-reading method and apparatus
US20080183570A1 (en) Methods and apparatus to deflect callers to websites
KR20220019734A (ko) 가상 비서를 위한 도메인 구성 플랫폼
CN107526748A (zh) 一种识别用户点击行为的方法和设备
Kinnunen Evaluating and improving Web performance using free-to-use tools

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090218

Termination date: 20150623

EXPY Termination of patent right or utility model