CN101682673A

CN101682673A - 自动话务员语法调整

Info

Publication number: CN101682673A
Application number: CN200880014355A
Authority: CN
Inventors: C·N·迪德库克; M·G·A·威尔逊
Original assignee: Microsoft Corp
Current assignee: Microsoft Corp
Priority date: 2007-05-03
Filing date: 2008-04-23
Publication date: 2010-03-24
Also published as: EP2153638A4; JP2010526349A; US20080273672A1; EP2153638A1; KR20100016138A; WO2008137327A1

Abstract

一种系统提供了自动话务员呼叫处理。数据库包括预期将在语音输入中接收到的单词。与这些单词相关地存储的是将在接收到包括特定单词的呼叫后采取的动作。服务器接收呼叫，并且在播放提示后接收语音输入。该服务器标识语音输入中的单词是否对应于数据库中的单词。如果是，则该服务器采取与该语音输入中的单词相关地存储在数据库中的动作。如果语音输入中的单词不对应于数据库中的单词，则服务器将该语音输入排队以供分析。响应于输入，服务器将来自语音输入的单词添加到数据库。

Description

自动话务员语法调整

背景

自动话务员系统经常结合呼叫中心和求助台服务来使用。通常，自动话务员系统提供自动语音提示界面，该界面允许呼叫者标识该用户希望连接到的特定实体，例如，人、部门、服务等。例如，自动话务员系统可提供诸如以下的语音提示：“销售按1”、“服务呼叫按2”或“关于现有服务呼叫的信息按3”。响应于来自用户的输入，自动话务员可将呼叫者连接到该用户所标识的特定人或部门。

某些自动话务员系统采用语音识别技术。在使用语音识别的系统中，用户输入可作为语音输入而不是通过使用电话键区来创建的双音多频(“DTMF”)信号来接收。例如，自动话务员系统可如下提示用户：“连接到销售代表说‘销售’”；“请求服务呼叫说‘服务’”；或者“检查现有服务请求的状态说‘状态’”。自动话务员系统可接收响应于提示而作出的用户的语音输入并将该用户连接到所标识的人或组织。

概述

在此处所描述的主题中，一种系统提供了自动话务员呼叫处理。

一种说明性系统可包括预期在语音输入中的单词和/或短语的数据库。该数据库还可包括对应于存储在该数据库中的单词和/或短语的、响应于语音输入而采取的动作。例如，该数据库可定义对于语音输入中的特定单词和/或短语，电话呼叫将被传递给具有特定电话号码的特定人或部门。

该说明性系统还可包括适用于接收呼叫并发出语音提示的服务器。该服务器还适用于接收并记录呼叫者的语音输入并确定该语音输入是否对应于预期在语音输入中的单词的数据库中的单词和/或短语。如果该服务器确定该语音输入对应于数据库中的单词和/或短语，则该服务器采取在数据库中被指定为对应于语音输入中的特定单词的动作。例如，如果数据库中的信息标识呼叫应被传递给特定人或组织部门，则该服务器将该呼叫传递给适当的电话号码。

如果该服务器确定语音输入不对应于数据库中的单词，则该服务器将该语音输入排队以供分析。服务器最终接收到标识响应于特定语音输入而采取什么动作的输入并将该动作与该语音输入相关地存储。例如，服务器可接收标识呼叫最终被传递给特定组织部门的输入。

该服务器可将该语音输入与类似地被发现为不对应于数据库中的单词并且同样最终被确定为请求同一动作的先前接收到的语音输入进行比较。服务器可将在该语音输入和先前接收到的语音输入两者中都出现的单词标识为供添加到预期在语音输入中的单词的数据库的候选单词。在接收到指示语音输入中所标识的单词应被添加到数据库的指示后，服务器将这些单词添加到数据库。

提供本概述以便以简化的形式介绍将在以下说明性实施例的详细描述中进一步描述的一些概念。本概述并不旨在标识出所要求保护的主题的关键特征或必要特征，也不旨在用于限定所要求保护的主题的范围。以下也描述了其它特征。

附图简述

以上概述以及以下说明性实施例的附加描述在结合附图阅读时能够被更好地理解。可以理解，所公开的系统和方法的可能的实施例不限于所描绘的这些。

图1是其中可以实现此处所描述的主题的各方面的说明性计算布置的网络图。

图2是说明性自动话务员系统中所包括的功能组件的框图。

图3是用于接收将向其提供自动话务员服务的呼叫的说明性过程的流程图。

图4是用于分析由说明性自动话务员系统接收到的语音输入的说明性过程的流程图。

图5是用于分析由说明性自动话务员系统接收到的语音输入的说明性过程的流程图。

图6是可用其部署此处所描述的主题的各方面的说明性计算环境的框图。

说明性实施例的详细描述

概览

此处所公开的本发明的主题涉及用于提供自动话务员功能的系统和方法。说明性系统可包括可被称为语法的数据库，该数据库包括预期将响应于语音提示而接收到的单词和/或短语。该数据库还与预期将接收到的每一个单词或每一组单词相关地存储了将在接收到标识特定单词或一组特定单词后采取的动作。所标识的动作可以是例如，将呼叫传递给特定电话号码。说明性系统还可包括自动话务员服务器，该服务器适用于提示用户输入，接收并处理来自用户的语音输入，并且方便更新单词和/或短语的数据库以解释在用户语音输入中接收到的非预期单词和/或短语。

在所公开的一实施例中，针对预期用户语音输入来调整单词和短语的数据库。换言之，更新单词和短语的数据库以包含用户已示出使用倾向的新单词和短语。对语法数据库的调整有助于提供即使在提供相对较短且自由回答(open-ended)的提示时也能够理解用户的自然语音输入的服务。

所公开的系统和方法可以用商用软件和标准硬件来实现。例如，在所公开的系统和方法的一实施例中，自动话务员可以用统一消息收发服务器来实现。此外，统一消息收发服务器可以在标准计算硬件上实现，并可以使用已制定的连网技术和协议来通信。

示例计算布置

图1示出了适用于提供自动话务员服务的示例性计算布置100。如图所示，计算布置100在通信上与网络108耦合。网络108适用于传递语音呼叫，并且可以是适用于语音信号和/或数据的移动的任何类型的网络。例如，网络108可以是公共交换电话网、因特网、或适用于传递语音信息的任何其它网络，或可包括其全部或部分。网络108可包括可以使用不同技术的离散网络的组合。例如，网络108可包括局域网(LAN)、广域网(WAN)、或其组合。网络108可包括无线、有线线路、或其组合。

网络108经由通信链路106与交换机110进行接口，以向计算布置100传递语音呼叫。交换机110可以是可用于从网络108向计算布置100交换呼叫的任何类型的设备。在一示例性实施例中，交换机110可以是例如公共分支交换(PBX)交换机。交换机110经由通信链路130来与网关120传递信息，通信链路130可以使用例如适用于传递呼叫信息的任何合适的网络拓扑结构。

计算布置100包括网关120和服务器140、142和144。网关120适用于提供到包括计算布置100中的服务器140、142和144在内的各机器的接入点。网关120可包括适用于向服务器140、142和144路由呼叫信息的任何计算设备。在一示例实施例中，网关120适用于从交换机110以第一协议接收呼叫信息，并以另一协议将其传递给服务器140、142和/或144。例如，网关120可以是适用于以诸如例如时分多路复用(TDM)协议等电路交换协议从交换机110接收语音呼叫，并使用诸如例如网际协议等分组交换协议将呼叫传递给服务器140、142和/或144的网际协议语音(VoIP)网关。在一示例实施例中，网关120和交换机110的功能可以组合在同一设备中。

网络150在网关和服务器140、142和144之间提供通信链路。网络150可以是适于在网关120和服务器140、142和/或144之间提供通信的任何通信链路。网络150可包括例如适用于以网际协议格式传递数据的光纤网络。此外，网络150可包括诸如例如WAN、LAN、和/或因特网等网络的组件。

服务器140、142和144是特别适用于提供自动话务员呼叫处理的计算设备。服务器140、142和144中的每一个都可以是用计算机可读指令编程来如此处所描述地操作以提供自动话务员呼叫处理的任何合适的计算设备。在一示例实施例中，服务器140、142和144可被编程为用作适用于将不同的消息流集成到单个收件箱中的统一消息收发(UM)服务器。注意，尽管在图1中描绘了三个服务器140、142和144，但布置100中可包括任何数量的多个服务器。

在一示例性实施例中，当在网关120处接收到呼叫后，标识服务器140、142和/或144中的至少一个来服务该请求。该呼叫被转发到被标识为负责服务该呼叫的一个或多个服务器。该一个或多个服务器140、142、144提供用于标识将响应于呼叫而采取的动作的自动话务员界面系统，即，语音提示界面。呼叫者可指定他或她希望采取的动作，该动作通常涉及标识该呼叫者希望与其谈话的人或部门。

图2是服务器140、142和144中所包括的自动话务员系统208的功能组件的框图。自动话务员系统208可例如被包括在由同一消息收发服务器提供的功能中。

自动话务员系统208可包括例如，语音识别/生成组件210、字典212、呼叫处理语法214、呼叫分析语法216、语音输入队列218以及自动话务员服务器220。语音识别/生成组件210用于将语音输入解释为可由自动话务员208进一步处理的格式。同样，语音识别/生成组件210用于生成将向呼叫者播放的语音信号。语音识别/生成组件210可包括可用于解释接收到的语音输入的任何合适的软件和/或硬件。

字典212是已知存在并且自动话务员208可向其转发呼叫的人、组织和/或位置的数据库。字典212可包括例如，特定组织中的雇员和/或部门。对于存储在字典212中的每一个实体，例如，人或部门，字典212可包括标识应向其转发被定向到特定实体的呼叫的电话号码的至少一个电话号码。字典212可被存储在诸如例如，关系型或对象数据库等适用于存储和组织信息的任何数据存储构造中。

呼叫处理语法214包括预期将在语音输入中接收到的单词或单词组，即短语。同样，呼叫处理语法214可指定将在接收到包括特定单词或短语的语音输入后采取的动作。例如，呼叫处理语法214可包括单词“接待员”并且可指定或包括到应向其传递被定向到接待员的呼叫的电话号码的链接。在接收到标识单词“接待员”的语音输入后，系统208可通过参考语法214来将该语音输入标识为有效输入并将该呼叫转移至对应于接待员的电话号码。该电话号码可被存储在呼叫处理语法214中和/或可被存储在字典212中。

呼叫处理语法214还可包括表示用户希望采取的动作的短语。例如，呼叫处理语法214可包括短语“服务呼叫”。在接收到标识短语“服务呼叫”的语音输入后，系统208可将该呼叫转移至对应于被指定为处理服务请求的部门的电话号码。在某些情况下，被标识为在接收到特定语音输入时采取的动作是播放进一步提示以获取附加信息。例如，如果语音输入标识“折扣请求”，则呼叫处理语法214可指定应向用户播放请求产品信息的进一步提示。

呼叫处理语法214可被配置成标识同义词。例如，呼叫处理语法214不仅可包括单词“接待员”，而且还可包括诸如“操作员”和“前台”等单词和短语。所有这些单词和短语在呼叫处理语法214中都被指定为指向同一动作，该动作可以是将呼叫传递至特定电话号码。类似地，除了涉及短语“服务呼叫”之外，呼叫处理语法214还可包括短语“需要帮助”和“设备损坏帮助”。这些短语中的每一个都可在呼叫处理语法214中被指定为对应于呼叫同一电话号码的动作。因此，如果语音输入标识这些短语中的任一个，则将采取同一个动作。

在一说明性实施例中，呼叫处理语法214可维护相对较少数量的单词和短语。换言之，语法214可以是相对“扁平”的。限制单词或短语的数量允许快速标识在语法214中是否存在语音输入中的单词。“扁平”语法导致更自然的用户体验。

呼叫分析语法216包括各单词和短语，包括可能未被预期包括在接收到的语音输入中的单词和短语。呼叫分析语法216可例如在语音输入包括未被包括在呼叫处理语法214中的单词和/或短语时采用。在这种情况下，语音输入中的单词和短语可使用呼叫分析语法216来标识。将呼叫分析语法216用作与呼叫处理语法214分开的组件允许呼叫处理语法214包括相对较少数量的预期将在语音输入中接收到的单词和/或短语，同时还允许处理包含语法214之外的单词的用户输入。此外，在呼叫处理语法214中维护少量的单词可导致消耗较少的计算资源并提供提高的准确度。

呼叫处理语法214和呼叫分析语法216可被存储在诸如例如，关系型或对象数据库等适用于存储和组织信息的任何数据存储构造中。

队列218包含已接收到但对于其无法在呼叫处理语法214中定位匹配的单词或短语的语音输入的记录。在接收到一语音输入并且确定该语音输入不对应于语法214中的单词或短语后，将该语音输入放置在队列218中以供进一步分析。队列还可包括最终响应于特定呼叫中的每一个而采取的动作的指示。

自动话务员服务器220与语音识别组件210、字典212、呼叫处理语法214、呼叫分析语法216和队列218接口以接收用户语音输入并如此处所描述地处理这些输入。自动话务员服务器220提示用户输入，从用户接收语音输入，响应于采用呼叫处理语法214中所包括的单词和短语的语音输入来发起动作，并且方便更新呼叫处理语法214以解释在用户语音输入中接收到的非预期单词和/或短语。自动话务员服务器220可方便例如通过将包含非预期单词和/或短语的语音输入在队列218中排队以供分析并随后将单词和/或短语添加到呼叫处理语法214来更新呼叫处理语法214。自动话务员服务器220可将对于最终被定向到特定电话号码的呼叫的非预期单词和/或短语与最终被定向到同一电话号码的先前接收到的语音输入中的非预期单词和/或短语进行比较。作为该比较的结果，自动话务员服务器220可标识这些单词和/或短语以便添加到呼叫处理语法214。

自动话务员语法调整方法

图3是用于接收将向其提供自动话务员服务的呼叫的说明性过程的流程图。在步骤310，在可在服务器140、142和144中的一个或多个上操作的自动话务员系统208处接收呼叫。该呼叫可通过网关120路由，并且可始发自例如网络108。

在步骤312，自动话务员服务器220与语音识别和生成组件210接口以使得向呼叫者播放通告。该通告可提示用户作出标识他或她希望采取的动作的输入。例如，该通告可提示用户标识他或她希望与其谈话的人，例如，“请说出您希望与其谈话的人的姓名”。该通告可提示用户标识他或她希望与其谈话的特定部门或位置，例如，“请说出您的呼叫应被定向到的部门的名称”。该通告可更一般地请求用户标识他或她的呼叫的原因，例如，“我们能够如何帮助您？”。

在步骤314，自动话务员服务器220记录呼叫者的语音输入。该语音输入可被存储在例如随机存取存储器和/或数据库中。

在步骤316，自动话务员服务器220处理语音输入以标识该语音输入是否对应于呼叫处理语法214中的预期单词和/或短语。自动话务员服务器220确定语音输入中所使用的单词是否表示如呼叫处理语法214中所指定的要采取的动作。例如，语音输入可指定呼叫者希望与一特定人谈话。自动话务员服务器220确定呼叫处理语法214中是否标识所指定的人。在另一示例中，语音输入可指定呼叫者希望与一特定部门谈话。自动话务员服务器220确定呼叫处理语法214中是否包括该输入中所使用的指定该部门的单词。在又一示例中，语音输入可指定呼叫请求对于特定问题的帮助。自动话务员服务器220确定呼叫处理语法214中是否包括该语音输入中所使用的标识该特定问题的单词。

如果语音输入中的单词和/或短语不对应于呼叫处理语法214中的预期单词和/或短语，则在步骤318，自动助理将该语音输入排队以供进一步考虑。例如，语音输入可被存储在队列218中。对语音输入的后续考虑可涉及标识是否应更新呼叫处理语法214以包括特定语音输入中所包括的单词和/或短语，如图4和5所示。

在将语音输入排队以供进一步考虑之后，并且因为识别语音输入的初始尝试不成功，所以在步骤320，自动话务员220提示用户进一步输入以标识该呼叫的目的。例如，自动话务员220可通告呼叫者初始请求未被识别并要求该用户重新陈述该请求。或者，自动话务员220可将呼叫转移给实况操作员以提示该输入。最终，在步骤322，标识呼叫者所请求的所需动作并且将所请求的动作与初始语音输入一起存储在队列218中以供进一步处理。在步骤328，自动话务员220采取所请求的动作，该动作可以是例如，将呼叫传递至特定人或组织的电话分机。

如果在步骤316处自动话务员220将语音输入中的单词和/或短语标识为对应于呼叫处理语法214中的条目，则在步骤324，自动话务员220通告对自动话务员已理解呼叫者所请求的动作的确认。例如，自动话务员220可请求呼叫者确认他或她希望与特定人或特定部门谈话，例如，“您想要与John Smith先生谈话吗？”。

在步骤326，自动话务员220确定呼叫者是否已确认自动话务员220所理解的所需动作。如果未接收到确认，则自动话务员继续至步骤318并将语音输入添加到队列218以供进一步考虑。之后，自动话务员220如上所述地在步骤320和322处继续。

如果在步骤326处接收到对所请求的动作的确认，则在步骤328，自动话务员220采取所请求的动作，该动作可以是例如，将呼叫传递至特定人或组织的电话分机。

图4是用于分析由说明性自动话务员系统208接收到的语音输入的说明性过程的流程图。在步骤410，自动话务员220维护语音输入队列218，该队列中的语音输入已被接收到，但对于这些语音输入未标识呼叫处理语法214中的对应单词和/或短语。

在步骤412，自动话务员220可从队列218中取得特定语音输入。在步骤414，自动话务员220标识对于该特定语音输入最终采取的动作。例如，最终采取的动作可以是将呼叫传递给特定号码或播放特定提示。所采取的动作可从队列218中取得。

在步骤416，自动话务员220将该特定语音输入与先前接收到的、被发现为不对应于呼叫处理语法214中的单词和/或短语并且最终被确定为请求了与该特定语音输入相同的动作的语音输入进行比较。例如，如果呼叫者的语音输入“服务请求”被发现为不对应于呼叫处理语法214中的条目并且对于该呼叫最终采取的动作是将该呼叫传递给顾客服务部门，则在步骤416，自动话务员220将该语音输入“服务请求”与同样被发现为不具有处理语法214中的对应条目并且最终也被传递给顾客服务部门的先前接收到的语音输入进行比较。

在步骤418，自动话务员220标识语音输入是否包括作为将添加或提升到呼叫处理语法214的候选的单词和/或短语。例如，如果确定该语音输入包含与最终导致同一动作的一个或多个先前语音呼叫中的单词或短语相同的单词或短语，则在步骤418，自动话务员220可标识该特定单词或短语以便添加到呼叫处理语法214。作为一个具体示例，如果呼叫者的语音输入是“服务请求”并且该呼叫最终被路由到顾客服务部门，并且先前语音输入类似地包括该短语“服务请求”并且同样被路由到顾客服务部门，在步骤418，自动话务员220可标识短语“服务请求”以便添加到呼叫处理语法214。

在步骤420，自动话务员220可接收指定所标识的单词或短语应被添加到呼叫处理语法214中预期将接收到的单词和短语的输入。例如，可从自动话务员系统的管理员或甚至可能用户接收关于所标识的单词或短语应被添加到呼叫处理语法214的输入。一旦特定单词或短语被添加到语法214，包括该特定单词或短语的后续语音输入就可由自动话务员220自动处理。

图5是用于分析由说明性自动话务员服务接收到的语音输入的说明性过程的流程图。在步骤510，自动话务员220维护语音输入队列218，该队列中的语音输入已被接收到，但对于这些语音输入未标识呼叫处理语法214中的对应单词和/或短语。自动话务员220可向用户呈现队列218中的项目以使得他或她可选择特定语音输入以供分析。

在步骤512，自动话务员220可响应于用户请求来从队列218中取得并呈现语音输入。作为一个具体示例，自动话务员220可响应于用户请求来取得并呈现指定“服务请求”的语音输入。

在步骤514，自动话务员220标识对于该特定语音输入最终采取的动作并将该动作呈现给用户。例如，自动话务员220从与该特定语音输入一起存储在队列218中的信息中标识相关联的呼叫是否最终被路由到特定人或组织或者是否响应于该语音输入提供过特定服务。作为一个具体示例，自动话务员220可标识并向用户呈现特定语音输入“服务请求”最终导致该呼叫被传递给顾客服务部门。

在步骤516，自动话务员220确定是否接收到指示特定单词或短语应被添加到呼叫处理语法214的用户输入。用户可在例如特定语音输入中所使用的单词或短语是已经存在于语法214中的单词的同义词的情况下确定特定单词或短语应被添加到呼叫处理语法214。或者，用户可确定特定单词或短语是明智的用户输入并且很可能被其他呼叫者使用。

如果在步骤516，未接收到指示特定单词或短语应被添加到呼叫处理语法214的输入，则处理在步骤512处继续。

如果在步骤516，接收到指示特定单词或短语应被添加到呼叫处理语法214的用户输入，则在步骤518，将该特定单词或短语添加到呼叫处理语法214。一旦特定单词或短语被添加到语法214，包括该特定单词或短语的后续语音输入就可由自动话务员220自动处理。

示例计算环境

图6描绘可在示例性计算布置100中使用的示例计算环境720。可以按多种方式来使用示例计算环境720以实现所公开的用于此处所描述的自动话务员服务的方法。例如，计算环境720可用作提供自动话务员服务的计算机服务器140、142、144。在一示例实施例中，计算环境720可用作网关120。

计算环境720只是合适的计算环境的一个示例，并且不旨在对此处所公开的主题的使用范围或功能提出任何限制。也不应该将计算环境720解释为对示例操作环境720中示出的任一组件或其组合有任何依赖性或要求。

此处所描述的主题的各方面可与众多其它通用或专用计算系统环境或配置一起操作。适用于此处所描述的主题的公知的计算系统、环境和/或配置的示例包括，但不限于，个人计算机、服务器计算机、手持式或膝上型设备、便携式媒体设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电子产品、网络PC、小型计算机、大型计算机、包括上述系统或设备中的任一个的分布式计算环境等。

用于实现此处所描述的主题的各方面的示例系统包括计算机741形式的通用计算设备。计算机741的组件可以包括，但不限于，处理单元759、系统存储器722和将包括系统存储器在内的各种系统组件耦合至处理单元759的系统总线721。系统总线721可以是几种类型的总线结构中的任何一种，包括存储器总线或存储控制器、外围总线、以及使用各种总线体系结构中的任一种的局部总线。作为示例而非局限，这样的体系结构包括工业标准体系结构(ISA)总线、微通道体系结构(MCA)总线、增强型ISA(EISA)总线、视频电子技术标准协会(VESA)局部总线和外围部件互连(PCI)总线(也称为夹层(Mezzanine)总线)。

计算机741通常包括各种计算机可读介质。计算机可读介质可以是能由计算机741访问的任何可用介质，而且包含易失性和非易失性介质、可移动和不可移动介质。作为示例而非限制，计算机可读介质可包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括，但不限于，RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储、磁带盒、磁带、磁盘存储或其它磁性存储设备、或能用于存储所需信息且可以由计算机741访问的任何其它介质。通信介质通常以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据，并包括任意信息传送介质。术语“已调制数据信号”包括其一个或多个特征以在信号中编码信息的方式被设定或更改的信号。作为示例而非限制，通信介质包括有线介质，诸如有线网络或直接线连接，以及无线介质，诸如声学、RF、红外线和其它无线介质。上述中任一组合也应包括在计算机可读介质的范围之内。

系统存储器722包括易失性和/或非易失性存储器形式的计算机存储介质，如只读存储器(ROM)723和随机存取存储器(RAM)760。基本输入/输出系统724(BIOS)包括如在启动时帮助在计算机741内的元件之间传输信息的基本例程，它通常储存在ROM 723中。RAM 760通常包含处理单元759可以立即访问和/或目前正在其上操作的数据和/或程序模块。作为示例而非限制，图6示出了操作系统725、应用程序726、其它程序模块727和程序数据728。

计算机741还可以包括其它可移动/不可移动、易失性/非易失性计算机存储介质。仅作为示例，图6示出了从不可移动、非易失性磁介质中读取或向其写入的硬盘驱动器738，从可移动、非易失性磁盘754中读取或向其写入的磁盘驱动器739，以及从诸如CD ROM或其它光学介质等可移动、非易失性光盘753中读取或向其写入的光盘驱动器740。可以在该示例操作环境中使用的其它可移动/不可移动、易失性/非易失性计算机存储介质包括但不限于，磁带盒、闪存卡、数字多功能盘、数字录像带、固态RAM、固态ROM等等。硬盘驱动器738通常由不可移动存储器接口，诸如接口734连接至系统总线721，磁盘驱动器739和光盘驱动器740通常由可移动存储器接口，诸如接口735连接至系统总线721。

以上讨论并在图6中示出的驱动器及其相关联的计算机存储介质为计算机741提供了对计算机可读指令、数据结构、程序模块和其它数据的存储。在图6中，例如，硬盘驱动器738被示为存储操作系统758、应用程序757、其它程序模块756和程序数据755。注意，这些组件可以与操作系统725、应用程序726、其它程序模块727和程序数据728相同，也可以与它们不同。操作系统758、应用程序757、其它程序模块756和程序数据755在这里被标注了不同的标号是为了说明至少它们是不同的副本。用户可以通过输入设备，诸如键盘751和定点设备752(通常指的是鼠标、跟踪球或触摸垫)向计算机741输入命令和信息。其它输入设备(未示出)可以包括话筒、操纵杆、游戏手柄、圆盘式卫星天线、扫描仪等。这些和其它输入设备通常由耦合至系统总线的用户输入接口736连接至处理单元759，但也可以由其它接口和总线结构，诸如并行端口、游戏端口或通用串行总线(USB)连接。监视器742或其它类型的显示设备也经由接口，诸如视频接口732连接至系统总线721。除监视器以外，计算机还可以包括其它外围输出设备，诸如扬声器744和打印机743，它们可以通过输出外围接口733连接。

因此，已经公开了用于提供自动话务员服务的系统。该系统提供用于向分析用户输入所对照的单词和短语集添加单词和短语的反馈循环。

应该理解，此处描述的各种技术可以结合硬件或软件，或在适当时以两者的组合来实现。因此，此处所描述的主题的方法和装置或其特定方面或部分可采取包含在诸如软盘、CD-ROM、硬盘驱动器或任何其它机器可读存储介质等有形介质中的程序代码(即，指令)的形式，其中当程序代码被加载到诸如计算机等机器内并由其执行时，该机器成为用于实现此处所描述的主题的装置。在程序代码存储在介质上的情况下，情况可以是所述程序代码存储在共同执行所述动作的一个或多个介质上，即该一个或多个介质一起包含执行该动作的代码，但是(在超过一个介质的情况下)不要求在任何特定介质上存储代码的任何特定部分。在程序代码在可编程计算机上执行的情况下，计算设备通常包括处理器、该处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件)、至少一个输入设备、以及至少一个输出设备。一个或多个程序可以例如，通过使用API、可重用控件等来实现或利用结合此处所描述的主题来描述的过程。这样的程序优选地用高级过程语言或面向对象编程语言来实现，以与计算机系统通信。然而，如果需要，该程序可以用汇编语言或机器语言来实现。在任何情形中，语言可以是编译语言或解释语言，且与硬件实现相结合。

尽管示例实施例可涉及在一个或多个独立计算机系统的上下文中利用此处所描述的主题的各方面，但此处所描述的主题不受此限制，而是可以结合任何计算环境，诸如网络或分布式计算环境来实现。此外，此处所描述的主题的各方面可在多个处理芯片或设备中或跨多个处理芯片或设备实现，且存储可类似地跨多个设备来实现。这样的设备可以包括，个人计算机、网络服务器、手持式设备、超级计算机、或集成在诸如汽车和飞机等其它系统中的计算机。

尽管用对结构特征和/或方法动作专用的语言描述了本主题，但可以理解，所附权利要求书中定义的主题不必限于上述具体特征或动作。相反，上述具体特征和动作是作为实现权利要求的示例形式公开的。

Claims

1.一种处理语音呼叫的方法，包括：

接收呼叫；

响应于所述呼叫来传递通告；

记录语音输入；

确定所述语音输入是否对应于预期语音输入的数据库(214)中的单词；

如果所述语音输入对应于预期语音输入的数据库(214)中的单词，则标识将作为响应而采取的动作；以及

如果所述语音输入不对应于预期输入的数据库(214)中的单词，则将所记录的语音输入添加到输入队列(218)以供分析。

2.如权利要求1所述的方法，其特征在于，标识将作为响应而采取的动作包括标识将向其传递所述呼叫的电话号码。

3.如权利要求1所述的方法，其特征在于，还包括：

如果所述语音输入不对应于预期输入的数据库中的单词，则传递附加输入提示。

4.如权利要求1所述的方法，其特征在于，还包括：

如果所述语音输入不对应于预期输入的数据库(214)中的单词，则将来自所述语音输入的单词添加到所述数据库(214)。

5.如权利要求1所述的方法，其特征在于，还包括：

如果所述语音输入不对应于预期输入的数据库(214)中的单词，则

对于所述语音输入标识所述呼叫最终被定向到的实体，

标识被定向到所述实体的先前接收到的语音输入，

标识在所述语音输入和所述先前接收到的语音输入两者中都出现的单词，并且

标识在所述语音输入和所述先前接收到的语音输入两者中都出现的单词以便添加到所述数据库(214)。

6.如权利要求5所述的方法，其特征在于，标识在所述语音输入和所述先前接收到的语音输入两者中都出现的单词以便添加到所述数据库(214)包括标识单词以及要与这些单词相关地存储的电话号码、人和组织中的至少一个。

7.如权利要求5所述的方法，其特征在于，还包括接收提供将在所述语音输入和所述先前接收到的语音输入两者中都出现的单词添加到所述数据库(214)的指示的输入。

8.如权利要求1所述的方法，其特征在于，还包括：

对于所述语音输入标识所述呼叫最终被定向到的分机，

提供所述语音输入，并且

接收标识出现在所述语音输入中的单词以便添加到所述数据库(214)的输入。

9.如权利要求8所述的方法，其特征在于，标识出现在所述语音输入中的单词以便添加到所述数据库(214)包括标识单词以及要与这些单词相关地存储的电话号码、人和组织中的至少一个以便添加到所述数据库(214)。

10.如权利要求8所述的方法，其特征在于，记录语音输入包括记录包括短语的语音输入，

其中确定所述语音输入是否对应于预期语音输入的数据库(214)中的单词包括确定所述语音输入是否对应于预期语音输入的数据库中的短语，并且

其中接收标识出现在所述语音输入中的单词以便添加到所述数据库(214)的输入包括接收标识出现在所述语音输入中的短语以便添加到所述数据库的输入。

11.一种处理语音呼叫的方法，包括：

维护预期在语音输入中的单词的数据库(214)，所述数据库(214)包括对于特定单词用于响应于包括该特定单词的语音输入来传递呼叫的电话号码；

接收呼叫；

结合所述呼叫接收包括单词的语音输入；

标识预期在语音输入中的单词的数据库中没有所接收到的单词；以及

将所接收到的单词添加到所述数据库(214)。

12.如权利要求11所述的方法，其特征在于，还包括标识向其传递所述呼叫的电话号码，

其中将所接收到的单词添加到所述数据库(214)包括将所述电话号码添加到所述数据库且与所接收到的单词相关地存储。

13.如权利要求11所述的方法，其特征在于，维护预期在语音输入中的单词的数据库(214)包括维护预期在语音输入中的短语的数据库(214)。

其中结合所述呼叫接收包括单词的语音输入包括接收包括短语的输入，

其中标识预期在语音输入中的单词的数据库(214)中没有所接收到的单词包括标识所述数据库(214)中没有所接收到的短语，并且

其中将所接收到的单词添加到所述数据库(214)包括将所接收到的短语添加到所述数据库(214)。

14.如权利要求11所述的方法，其特征在于，还包括：

标识被定向到所述电话号码的先前接收到的语音输入包括所接收到的单词；以及

在标识被定向到所述电话号码的先前接收到的语音输入包括所接收到的单词后标识所接收到的单词以便添加到所述数据库(214)。

15.如权利要求11所述的方法，其特征在于，还包括：

接收指示所接收到的单词将被添加到所述数据库(214)的输入。

16.一种语音自动话务员系统(208)，包括：

预期将在语音输入中接收到的单词的数据库(214)；以及

包括计算机可读指令的服务器(220)，所述指令用于接收呼叫，接收语音输入，确定所述语音输入是否对应于所述数据库中的预期将在语音输入中接收到的单词，以及更新预期将在语音输入中接收到的单词的数据库。

17.如权利要求16所述的语音自动话务员系统(208)，其特征在于，还包括用于对所述语音输入执行语音识别的计算机可读指令。

18.如权利要求16所述的语音自动话务员系统(208)，其特征在于，所述数据库(214)包括对应于所述数据库中的条目的、将响应于接收到包括具有所述数据库(214)中的条目的单词的语音输入而采取的动作。

19.如权利要求16所述的语音自动话务员系统(208)，其特征在于，所述服务器还包括用于标识向其转发所述呼叫的电话分机，标识对应于所述电话分机的先前接收到的语音输入，以及标识所述语音输入中对应于所述先前接收到的语音输入中的单词的单词的指令。

20.如权利要求16所述的语音自动话务员系统(208)，其特征在于，所述用于更新预期将在语音输入中接收到的单词的数据库(214)的计算机可读指令包括用于用单词和对应的电话分机来更新单词的数据库(214)的指令。