CN1333624A

CN1333624A - 改变语音向用户提供可选方言的方法

Info

Publication number: CN1333624A
Application number: CN01123162.9A
Authority: CN
Inventors: 克雷格·R·香博; 安东尼·德宗诺; 马克·J·鲍尔; 肯尼思·韦尔; 贾里德·布卢斯泰因; 吉姆·F·马丁; 达里尔·海麦尔; 莱尔德·C·威廉斯
Original assignee: Rockwell Electronic Commerce Corp
Current assignee: Rockwell Firstpoint Contact Corp
Priority date: 2000-07-13
Filing date: 2001-07-13
Publication date: 2002-01-30
Also published as: US6598021B1; CA2352981A1; EP1172995A2; EP1172995A3

Abstract

本发明提供了一种通过一个通信网络将机构代理的口头表达方言调整为机构目标人员的口头表达方言的方法。该方法包括确定由代理使用的、用于与目标联系的一种方言;在所确定的方言的基础上,修改代理用于与目标联系的口头表达方言;以及向目标展示修改后的口头表达方言。

Description

改变语音向用户提供可选方言的方法

(一)技术领域

本发明的领域涉及通信系统，尤其是涉及电话购物设备。

(二)背景技术

用于电话购物的电话设备一般是公知的，这种设备可以处理打进和打出呼叫操作。在最简单的情况下，一个控制电话购物处理的机构可以提供一个电话银行和一组相应的代理以操纵该电话银行。当打进呼叫时，一个代理可以应答该呼叫，并对呼叫者关心的问题做出答复。当一个代理空闲时，该机构可以提供一个有联系的客户的呼出列表，在该代理不忙碌时可以呼叫该客户。

在更完善的机构中，可以提供一个自动呼叫分配器(ACD)向空闲代理传递呼叫。可以通过一根或多根中继线将ACD连接到公用交换电话网(PSTN)上。通常向公众公布一个电话号码以便与该机构进行联系。PSTN在检测所公布的电话号码的同时，通过一条或多条中继线向ACD传递呼叫。

随着一个呼叫的传递，PSTN还可以与呼叫一起传递有关一个打进呼叫的信息。例如，一个拨号标识服务(DNIS)实用程序随所传递的呼叫一起提供一个呼叫者的拨号号码。当机构内部有许多部门并且每个部门负责处理不同的与打进呼叫相关的事务时，这种实用程序是重要的。

另一个由PSTN内部进行的实用程序操作是自动号码标识(ANI)。ANI将一个呼叫者的电话号码随同该呼叫一起传送。一个ACD可以使用ANI在呼叫到达的瞬间、而不是在一个代理对呼叫做出应答之后识别用户。

依靠如DNIS和ANI这样的信息，ACD的一个控制器可以根据一个拨号号码或呼叫者的身份，选择一个最适于应答该呼叫的代理。此外，通过使用ANI，在呼叫到达的同时，为了一个选定代理的利益能够搜索并显示用户记录。

虽然使用ACD的电话购物机构是相对高效率的，但是有一个渐增的使这样的机构内部资源最大化的倾向。经常用ACD接收和安置广大区域上的呼叫，会引起工作量、以及具有不同文化和方言的代理和用户间交互作用的增加。

由于业务当中竞争的增加，一个商业者越来越需要使它的代理和用户之间的文化差异最小化。因此，就需要一种用于在代理语音内部控制区域来源指示符的装置。

(三)发明内容

本发明提供了一种通过通信网络向一个机构的目标人员调整由该机构代理所提供的口头表达方言的方法和装置。该方法包含以下步骤：确定一种代理使用的、用于和目标进行通讯的方言；根据所确定的方言，改变该代理的、用于和目标通讯的口头表达方言；以及向目标展示所改变的口头表达。

(四)附图说明

图1是依据本发明的一个说明性实施例使用的、一种用于改变一个口头表达的方言的系统的框图；

图2是图1的系统所使用的处理器和存储器的框图；以及

图3是在一个替换实施例中，图1系统的使用框图。

(五)具体实施方式

图1是依据本发明的一个说明性实施例的，一个用于改变一个代理(例如一个电话购物商)的口头表达内容(即方言)的装置10的框图。在它的最简单形式中，将对代理口头表达的修改描述为一个过滤器，用来控制和改变一个代理声音中的区域来源内容。该过滤器可以由多个因素中的任何一个触发。例如，源信息(例如，来自PSTN的ANI或DNIS信息)可以被用作区域指示符。可替换地，语音识别可以用来分析和检测一种方言。

系统10可以通过一种恰当的连接(例如，单根电话线、或是一根或多根中继线)28和一个通信系统(COMM)16相连接。接下来，COMM16可以和该机构的一个或多个目标人员(例如，用户、客户、支持者等等)相连接。在下文中有时将目标电话和该目标电话的用户简单地统称为“TGT12、14”。

在系统10内部包含一个可以由该机构的一个代理所使用的一个电话26(在下文中有时简单地将代理和他的电话统称为“代理26”)。虽然显示的系统10包含单个代理26，但是应当理解：系统10可以包含许多代理26。

还应当理解：系统10可以以多种不同的形式实现。例如，系统10可以包含一个支持多个所连接的代理26的事务处理器18(例如一个ACD)。此外，COMM16和ACD18可以作为一个较大系统的一部分来实现，如图3所示。为了清楚地反映图3所示的实施例的商业特性，将图1的TGT12、14称为用户(CUST)100-105。而且，现在代理26可以通过相应的代理站124、126和用户100-105联系。在一个代理站124、126的一个代理26可以通过一个电话控制台116、118或者是通过使用IP语音(VOIP)的终端120、122和一个用户100-105联系。

图3的系统可以用来传递来自多个来源(例如，通过PSTN、Internet国际互连网、蜂窝式电话系统、有线电视TV系统、无线电、卫星等)中的任意一个呼叫。在此用到的一个呼叫可以基于一个交换电路连接(即、通过PSTN)或者基于一个包连接(例如，通过国际互连网Internet)。一个交换电路连接(有时在电话通信领域中还简单地称为“电话连接”)是指两个用户之间存在的一个专用信道。在此用到的一个包连接不是表示一个物理连接，而是由两个用户简单地占有和同时使用另一个用户的IP地址进行语音信息的交换。

在该说明性实施例中，通过事务处理系统18，可以接收来自用户100-105的呼叫，并将其传递到选定的事务处理实体(例如，代理站124、126或者交互式话音响应单元(IVR)128、130)。

通过ACD134放置的用户100-105的交换线路呼叫，可以通过ACD134的矩阵开关136传递给代理26的控制台116、118，或者传递给一个恰当的IVR128、130。通过国际互连网106的呼叫可以作为IP语音存在。当接收到该呼叫时，主机132可以将该VOIP呼叫传递给一个代理26的终端120、122。

通过该事务处理系统，一个用户100-105可以利用一个传统的电话或者蜂窝电话及/或计算机来放置/接收一个呼叫。可替换地，用户100-105可以使用一个公用天线电视(CATV)系统112的一个交互频道、地面移动无线电140或者卫星116的一个传输信道142、144来放置/接收一个呼叫。当用户100-105使用一个公用天线电视(CATV)系统112的一个交互频道、地面移动无线电140或者一个卫星116的一个传输信道142、144来放置一个呼叫时，可以假定这样的呼叫由一个目标标识符(例如ACD134的一个电话号码)使用一个传统按键式面板的输入来启动。

虽然在这里有时术语“呼叫者”指的是用户100-105，但是应当理解：呼叫也可以由事务处理系统134启动。例如，可以在主机132的一个数据库中保持用户列表。由CPU 138通过PSTN 108、无线电频率(rf)收发器114或者由主机132经由国际互连网106，启动从系统10到用户100-105的打出呼叫。

与每个用户100-105有关的是一个标识符以及呼叫路由选择信息。该标识符可以是一个用于在一个特定的通信系统(例如，在PSTN108内的一个电话号码、在国际互连网106内的一个IP地址、在CATV系统112内的一个用户帐号、在地面移动无线电140或者卫星系统116内的一个电子序号(ESN)等)内标识用户100-105的标识符。

路由选择信息可以用来识别在哪个特定系统(例如，PSTN108、国际互连网106、CATV112、地面移动无线电140、卫星116等)中使用了该标识符。在事务处理系统134的情况中，路由选择信息可以简单地识别经由哪个端口处理该呼叫。例如，用于一个国际互连网呼叫的一个端口可以是一个和主机132的国际互连网连接。一个电话呼叫可以通过使用ACD134的一个交换机136的一个相应端口的第一组中继线28来进行处理。和一个有线用户103、地面移动用户104或者卫星用户105的一个呼叫可以通过使用ACD134的交换机136的一个相应端口的第二组中继线146来进行处理。在此可以把标识符和呼叫路由选择信息一同称为呼叫相关信息。

不论一个呼叫是打入还是打出，该呼叫的分发实质上可以是一样的。当呼叫是打出时，事务处理系统18自然已知该呼叫目标的身份。当该呼叫是打入时，事务处理系统18可以根据其他的呼叫相关信息(例如，在PSTN或者国际互连网情况下的一个端口号、以及ANI或者IP地址信息)确定呼叫者的身份。通过知晓一个用户100-105的身份，事务处理系统18可以根据用户100-105的历史需求或者其它公知标准来传递该呼叫。

到一个事务处理实体26的呼叫传递可以在几种格式下完成。呼叫是一个交换电路呼叫时，CPU138选择一个代理，然后将该呼叫传递到所选代理的控制台116、118或者是传递到选定的IVR128、130。CPU138可以向主机132发送一个包含呼叫相关信息的呼叫传递信息。当主机132能够识别用户记录时，主机132可以在呼叫传递的同时向所选代理26展示那些记录(例如，在所选代理的一个终端120、122上弹出一个屏幕)。

当一个呼叫是通过国际互连网时，展示方式是完全地通过所选代理的终端120、122。当该呼叫是一个网络电话呼叫形式时，主机132可以向所选代理转发请求者的IP地址。当主机132能够识别用户记录时，可以和网络电话请求一起，把那些记录展示给该代理。

作为图3的系统的替换，事务处理器18可以作为一个带有单个连接代理26的呼叫处理器18在一台个人计算机(PC)上实现(如图1所示)。当呼叫处理器18作为一个带有多个连接代理26的ACD实现时，应当理解每个代理可以为不同的机构服务。此外，甚至在涉及单个代理26的情况下，该机构目的也可以随呼叫目标12、14的不同而不同。

系统10可以用来为多个机构目的中的任何一个服务。在此用到的一个机构目的是指用以实现该机构的目标的任何功能活动。此外，应该理解，可以通过在机构的代理和该机构的目标之间进行联系而实现这些功能活动。一般地，该对外联系包含：该机构的一个代理26的口头表达或者在代理26和一人员机构的TGT12，14之间的口头交换意见，所述人员机构只与该机构的一种产品有关而与开始进行该联系的人员无关。

例如，如果使用系统10的机构是一个批发商，则该机构的目的将是销售，而且将在一个推销员或者直销员26和公众(即TGT12、14)的成员之间进行联系。或者，如果该机构是一个慈善机构，则该机构的目的可以是募捐，而且联系将再次通过一个掮客进行。

如果该机构是一个政党，则该机构的目的将是赢得一次选举或者影响一次表决。如果该机构是一个环保团体，则该机构的目的可以只是普及环保知识。

通过调整一个内容以消除在代理26和TGT12、14之间的联系上所感知的文化差异，可以进一步推进机构的目的。在这点上应当理解：对一个口头表达内容的调整仅限于该机构代理26的语言，而不是该机构的目标。还应当理解：在此用到的“表达”试图包含一个代理在一个双向交谈中的参与，而不具体地限于(但是能够包含)该机构的代理单方面向TGT 12、14进行推销。

在该说明性实施例中，当检测到呼叫时，呼叫处理器18可以根据呼叫相关信息选择不同的方言。当呼叫是一个打入电话呼叫时，呼叫相关信息可以是DNIS或者ANI信息。当呼叫是一个打出电话呼叫时，呼叫相关信息可以是呼叫的电话号码。

当呼叫相关信息是基于DNIS信息时，处理器22可以根据来自于PSTN16的DNIS信息选择一种方言，例如，一个特定的机构可以在不同的销售地点散布不同的电话号码。可以根据与该呼叫有关的销售地点选择一种方言。

相似地，当呼叫相关信息是ANI或者一个拨出号码时，可以根据该号码的区域标识符(例如，电话区号)或者根据和TGT12、14交流的经验来选择方言。利用呼叫相关信息，可以进行方言的初始确定。在方言初始确定之后，可以根据呼叫相关信息，检索一个定义了用于该呼叫的方言的方言文件38、40(图2)。该文件38、40可以包含一组用于该呼叫的方言参数值。该参数值可以定义方言，预先确定呼叫相关信息的每一种类型，并被储存在存储器24内。

可以用多个语言属性中的任意一个对定义了一种方言的呼叫内容参数值进行描绘。字速率是一个用于定义一种方言的属性。字选择和变音可以是其他的属性。用于定义方言参数值(或利用所定义的参数值重新创建一种方言)的软件可从多个资源中的任一处获得。(例如，http：∥faculty.washington.edu/dillon/PhonResources/PhonResources.html，http：∥www.linguasphere.org/等)

一旦检索到定义该方言的参数值，呼叫处理器18就可以把该呼叫连接到代理26，然后开始检测该呼叫的字内容。对于正在检测的呼叫内容，一个数字信号处理器(DSP)20(起一个采样处理器的作用)可以开始对来自代理26的一个语音信号和来自TGT12、14的一个语音信号进行取样。然后在一个傅里叶处理器32内利用一个快速傅里叶变换(FFT)，将来自代理26和TGT12、14的取样信号中的每一个转换成一个语音轮廓(profile)。

通过使用TGT12、14的语音轮廓，可以用一个字识别(例如一个语音识别)处理器42来确定字内容和正被TGT12、14使用的一种方言。当TGT12、14检测到的方言不同于初始确定的方言时，可以重新得到一个新的方言文件38、40。检测到的字内容和方言可以保存在存储器24中，用于以后的使用，如以下讨论的那样。

接下来，还可以将代理26的语音轮廓应用到字识别处理器42以检测该代理的口头表达内容。该内容可以包含一个字内容，一个字速率和一个主频率。

在一个说明性实施例中，代理26和TGT12、14的方言中的每一种都可确定下来。通过检测并向代理的字选择告知附加的意义，确定代理的初始方言可被用于提高系统性能。可替换地，只需要确定TGT12、14的方言。一旦确定下来，就可以调整代理26的每个字以和已确定的TGT12、14方言相一致。

代理26和TGT12、14的方言都已经确定时，可以在一个内容处理器44中将代理26的话音轮廊和选定的某一方言文件38、40的内容相比较，以确定任何修改或调整是否已经就绪。根据选定的方言文件38、40的内容，可以在逐字的基础上，或是依据来自该代理的一个完整字流，对该代理的陈述内容进行修改。

通过使用模板34、36和/或用于生成一种特定方言的软件(如上所述)，代理26的方言可以与TGT12、14相配。当方言文件38、40要求、或是识别出的TGT12、14方言建议了一个特定的方言时，处理器22可以修改该代理的表达以与该方言相匹配。通过首先识别来自代理26的每一个词，然后选择一个用于所要求的特定方言中的相应词的模板，来完成这种匹配。然后该模板可被用作一种用于将代理26所说的识别字替换为特有方言中一个经过综合处理的字的装置。

模板可以以多种不同方法中的任意一种实现。例如，一个字模板可以基于以不同方言所说的词的记录。如上所述，可以对不同方言的字进行采样，并且利用FFT转换成为字轮廊。该轮廓的主频可以调高或者调低，以匹配代理的正常语调，并且利用一个反FFT转换回一个音频表达。

当方言文件38、40要求时，可以添加或者替换地区性的特殊字。例如，某些字(例如牌照和标记)在不同的地方有不同的含义。当在一个TGT12、14和代理26的说话中检测到地区性的特殊字时，这些地区性的特殊字还可以用作方言标记。地区性特殊字还可以被插入到代理26的说话中以实现预定的方言。

在该说明性实施例中，在代理26和TGT12、14进行交流期间，根据来自TGT12、14的语音轮廓，可以改变初始确定的方言。当以后确定的方言不同于开始确定的方言，可以重新得到一个不同的方言文件38、40，并且在需要时进行替换以调整代理26的方言。

为了说明本发明构造和使用的方式，这里已经描述了一个依据本发明调整一个口头表达的方言的一种方法和装置的具体实施例。应当理解：本发明的实现有其它的变化和修改，它的各个方面对本领域技术人员来说是显而易见的，而且本发明不局限于所描述的特定实施例。因此，期望在这此的权利要求书中包含在本发明基本原理的真正精神和范围之内的任何修改、变化、或等效物。

Claims

1.一种通过一个通信网络将机构代理的口头表达方言调整为机构目标人员的口头表达方言的方法，该方法包含以下步骤：

确定由代理使用的、用于与目标联系的一种方言；

在所确定的方言的基础上，修改代理用于与目标联系的口头表达方言；以及

向目标展示修改后的口头表达方言。

2.如权利要求1所述的选择一种方言的方法，其中确定方言的步骤进一步包含检索与该目标相关的呼叫相关信息。

3.如权利要求1所述的选择一种方言的方法，其中修改口头表达内容的步骤进一步包含识别所说的字的内容。

4.如权利要求3所述的选择一种方言的方法，其中检测口头表达中所说的字的内容的步骤进一步包含将识别出的所说字内容和一组语言模板进行比较。

5.如权利要求4所述的选择一种方言的方法，其中将识别出的所说字内容和一组语言模板进行比较的步骤进一步包含从该组模板中选择一个最匹配的模板。

6.如权利要求4所述的选择一种方言的方法，其中将识别出的所说字内容和一组语言模板进行比较的步骤进一步包含用所确定的方言代替一个等效字。

7.一种通过一个通信网络将机构代理的口头表达方言选定为机构目标人员的口头表达方言的装置，该装置包含：

用于确定由代理使用的、用于与目标联系的装置；

用于在所确定的方言的基础上，修改代理的口头表达方言的装置；

用于向目标展示修改过的口头表达的装置。

8.如权利要求7所述的用于选择一种方言的装置，其中用于确定方言的装置进一步包含用于检索与该目标相关的呼叫相关信息的装置。

9.如权利要求7所述的用于选择一种方言的装置，其中用于修改口头表达方言的装置进一步包含用于识别所说字内容的装置。

10.如权利要求9所述的用于选择一种方言的装置，其中用于检测口头表达的所说字内容的装置进一步包含用于把识别出的所说字内容和一组语言模板进行比较的装置。

11.如权利要求10所述的用于选择一种方言的装置，其中用于把识别出的所说字内容和一组语言模板进行比较的装置进一步包含用于从该组模板中选择一个最匹配模板的装置。

12.如权利要求9所述的用于选择一种方言的装置，其中用于识别所说字内容的装置进一步包含用于以确定的方言代替一个等效字的装置。

13.一种通过一个通信网络将机构代理的口头表达方言选定为机构目标人员的口头表达方言的装置，该装置包含：

一个呼叫分析器，用于确定代理与目标进行联系时所使用的一种方言；

一个话音处理器，用于在所确定的方言的基础上，修改该代理的口头表达方言；以及

一个话音合成器，用于向目标展示修改后的口头表达。

14.如权利要求13所述的用于选择一种方言的装置，其中呼叫分析器进一步包含一个用于接收与用户相关的呼叫相关信息的电话系统接口。

15.如权利要求14所述的用于选择一种方言的装置，其中话音处理器进一步包含一个用于识别口头表达的所说字内容的字识别模块。

16.如权利要求15所述的用于选择一种方言的装置，其中语音识别器进一步包含多个语言模板。

17.如权利要求15所述的用于选择一种方言的装置，其中该语音识别器进一步包含一个用于将识别出的所说字内容与多个语言模板进行比较的比较处理器。