CN104012068A

CN104012068A - 用于音频数据处理的装置和方法

Info

Publication number: CN104012068A
Application number: CN201280065399.0A
Authority: CN
Inventors: B.卡里米-切尔坎迪; V.兰加纳森; S.W.阿利
Original assignee: Unification Ltd Liability LP
Current assignee: Incant
Priority date: 2012-09-13
Filing date: 2012-09-13
Publication date: 2014-08-27
Anticipated expiration: 2032-09-13
Also published as: CN104012068B; US20140307859A1; US9137345B2; US20140348307A1; EP2896191A1; WO2014042640A1; US9112969B2; EP2896191B1

Abstract

一种通信终端、系统以及方法利用了激活语音到文本应用以便使得将从呼叫者接收到的后续音频转换成文本的通信设备。呼叫者然后可以响应于问题来提供音频。呼叫者可以通过例如按压通信设备上的按钮来发送输入，以激活所述语音到文本应用，说出回答，并且然后按压按钮来指示对问题的回答完成。所说出的回答可以被转换成文本并且然后可以被存储、解析，以及然后被分配给表示发布给呼叫者的问题的对象。分配给表示所述问题的所述对象的所存储的文本然后可以被用来填充不同的表格或数据库以供后续使用，或者用于经由那个人的计算机设备的显示设备来显示给用户。

Description

用于音频数据处理的装置和方法

技术领域

本发明涉及被配置成准许通信设备交换数据的方法和通信系统，诸如通信网络。本发明还涉及诸如服务器、工作站、计算机之类的通信设备以及诸如移动电话、蜂窝电话、平板、膝上型计算机、移动互联网设备、个人数字助理之类的终端设备和可以被用在此类系统或方法中的其它移动通信设备。更特别地，本发明涉及一种方法、系统、设备或产品，通过其音频输入可以被翻译成文本数据并且随后用于传送对原始以音频形式提供的问题的回答。

背景技术

呼叫中心常常从客户或预期客户接收呼叫并且使用向呼叫者（caller）询问特定于特定呼叫者的信息的自动化提问。此类个人信息然后常常被用来路由呼叫或者验证呼叫者是该呼叫者将他自己或她自己表示为的人。呼叫可以被路由到随后询问与呼叫者先前可能已被询问的类似的或确切地相同的问题的多个不同的设备。此类重复提问常常挫败试图与呼叫代理讨论特定问题以解决问题或者购买产品或服务的呼叫者。此类挫败可以导致呼叫者在对某人说话之前终止呼叫或者感觉他或她体验了差的客户服务。

我们已经确定了存在对于被配置成准许呼叫者仅必须回答问题一次以便提供有关呼叫者的特定内容的通信系统的需要。我们已经确定了对于此类内容被存储以供在呼叫者的呼叫的后续处理中使用以及用于维护与此类呼叫相关联的记录将是更可取的。在一些情形下还可能是可取的是，对于呼叫者能够存储他的回答以供在涉及其它方的后续呼叫中使用。

发明内容

提供了通信系统，其包括第一通信终端以及第二通信终端和第一通信设备中的至少一个。第二通信终端和第一通信设备中的至少一个可通信地连接到第一通信终端以用于建立通信会话，在所述通信会话中音频数据在第一通信终端与第一通信设备和第二通信终端中的至少一个之间被传送。第一通信终端、第二通信终端以及第一通信设备中的至少一个激活语音到文本翻译机制，所述语音到文本翻译机制将音频数据翻译成文本数据并且保存已翻译文本数据。

在一些实施例中，音频数据可以包括第一通信终端或第二通信终端的用户的个人信息。音频数据还可以包括在通信会话期间由第一或第二通信终端的用户所说出的问题。在一个实施例中，音频数据可以包括音频问题和音频回答。音频问题可以由第一通信终端或第二通信终端来传送，并且其它终端可以传送对那些问题的音频回答。将音频数据翻译成文本数据并且保存文本数据可以包括以下步骤：将音频问题翻译成文本并且保存音频问题的文本；将对音频问题的音频回答翻译成文本并且保存对该音频问题的音频回答的文本，以便使得该音频回答的已翻译文本与对其给出该音频回答的音频问题相关联。

在其它实施例中，音频数据可以包括由第一通信设备所传送的音频问题，所述第一通信设备可以是例如服务器或交换机设备。音频数据还可以包括由第一通信终端所传送的音频回答。将音频数据翻译成文本数据并且保存文本数据可以包括以下步骤：将对音频问题的音频回答翻译成文本并且保存音频回答的文本，以便使得该音频回答的已翻译文本与表示对其给出该音频回答的音频问题的对象相关联。所保存的文本数据可以被用来填充表格文档（form document），或者可以被第二通信终端或第一通信设备送入到诸如文字处理文档或电子表格文档之类的基于文本的文档中并且被该终端或设备保存。

应该理解的是，第一通信终端和第二通信终端可以每个都通过一种类型的通信终端，诸如与企业的雇员相关联的终端、与呼叫者相关联的终端、与代理相关联的终端、蜂窝电话、平板计算机设备、膝上型计算机、具有电话功能的台式计算机、数字电话设备、个人数字助理、互联网装置或具有电话功能的计算机设备。

在该系统的一些实施例中，第一通信设备可以提供个人呼叫代理服务并且第一通信设备可以激活语音到文本翻译机制。语音到翻译机制可以包括由第一通信设备所执行的存储在第一通信设备的存储器中的应用。第一通信设备然后可以将音频数据翻译成文本数据并且保存已翻译文本数据。通信会话可以通过第一通信终端形成与第一通信设备的连接以及第一通信设备接收识别地址的输入并基于所识别的地址来发起建立通信会话来建立。可以与第二通信终端建立通信会话以便使得第一通信设备以及第一通信终端和第二通信终端全部参与通信会话，以便使得第一通信设备接收在通信会话期间在第一和第二通信终端之间传送的音频数据。第一通信设备将音频数据翻译成文本数据并且保存已翻译文本数据可以包括：第一通信设备将第一音频问题翻译成第一文本数据并且保存第一问题的已翻译第一文本数据；第一通信设备将对第一音频问题的第一音频回答翻译成第二文本数据并且保存第二文本数据以便使得第二文本数据与第一音频问题相关联；第一通信设备将第二音频问题翻译成第三文本数据并且保存第二音频问题的第三文本数据；以及第一通信设备将对第二音频问题的第二音频回答翻译成第四文本数据并且保存第四文本数据以便使得第四文本数据与第二音频问题相关联。可以由第一通信设备基于所保存的第一、第二、第三以及第四文本数据来填充表格文档。在一个实施例中，第一通信设备可以从第二通信终端接收第三音频问题并且通过询问相同的确切问题或在内容上与第二音频问题基本上类似的问题来确定它是与第二音频问题相同的。响应于此类确定，第一通信设备可以向第一通信终端建议以音频格式和文本格式中的至少一个的对第三问题的第三回答。以音频格式的第三回答可以包括第二音频回答并且以文本格式的第三回答可以包括第四文本数据。第一通信设备可以在从第一通信设备接收到这样做的授权时发送第三回答。可以以文本格式和音频格式中的至少一个来发送第三回答。

在其它实施例中，第一通信终端可以向该终端的用户直接提供个人呼叫代理服务并且可以激活语音到文本翻译机制。语音到文本翻译机制可以包括由第一通信终端所执行的存储在第一通信终端中的应用。第一通信终端可以将音频数据翻译成文本数据并且保存已翻译文本数据。第一通信终端可以形成与第一通信设备或第二通信终端的连接，并且其将音频数据翻译成文本数据可以包括以下步骤：第一终端将第一音频问题翻译成第一文本数据并且保存第一问题的已翻译第一文本数据；第一通信终端将对第一音频问题的第一音频回答翻译成第二文本数据并且保存第二文本数据以便使得第二文本数据与第一音频问题相关联；第一通信终端将第二音频问题翻译成第三文本数据并且保存第二音频问题的第三文本数据；以及第一通信终端将对第二音频问题的第二音频回答翻译成第四文本数据并且保存第四文本数据以便使得第四文本数据与第二音频问题相关联。可以由第一通信终端基于所保存的第一、第二、第三以及第四文本数据来填充表格文档。在一个实施例中，第一通信终端可以从第二通信终端或第一通信设备接收第三音频问题，并且通过询问相同的确切问题或在内容上与第二音频问题基本上类似的问题来确定它是与第二音频问题相同的。响应于此类确定，第一通信终端可以向第一通信终端的用户建议以音频格式和文本格式中的至少一个的对第三问题的第三回答。例如，所建议的第三回答可以经由终端的发言者（speaker）以音频格式发出并且还被作为文本显示在终端的显示器中。以音频格式的第三回答可以包括第二音频回答并且以文本格式的第三回答可以包括第四文本数据。第一通信终端可以在从第一通信终端的用户接收到这样做的授权时发送第三回答。可以以文本格式和音频格式中的至少一个来发送第三回答。

在该系统的又其它的实施例中，第二通信终端激活语音到文本翻译机制，其可以包括由第二通信终端所执行的存储在第二通信终端的存储器中的应用。第二通信终端然后可以执行将音频数据翻译成文本数据并且保存已翻译文本数据。通信会话可以通过第一通信终端形成与第二通信终端的会话来建立。第二通信终端可以通过以下各项来执行将音频数据翻译成文本数据并且保存已翻译文本数据：第二通信终端将第一音频问题翻译成第一文本数据并且保存第一问题的已翻译第一文本数据；第二通信终端将对第一音频问题的第一音频回答翻译成第二文本数据并且保存第二文本数据以便使得第二文本数据与第一音频问题相关联；第二通信终端将第二音频问题翻译成第三文本数据并且保存第二音频问题的第三文本数据；以及第二通信终端将对第二音频问题的第二音频回答翻译成第四文本数据并且保存第四文本数据以便使得第四文本数据与第二音频问题相关联。可以由第二通信终端基于所保存的第一、第二、第三以及第四文本数据来填充表格文档。该系统的一些实施例还可以包括第二通信设备，并且可以由第二通信终端将表格文档发送到第一和第二通信设备中的至少一个。

在该系统的一个实施例中，可以向由第一通信设备所托管（host）的服务注册第一通信终端，以便使得通过第二通信终端到第一通信终端以建立通话会话的呼叫导致该呼叫被转发到第一通信设备。第一通信设备可以建立通信会话并且将第一通信终端连接到所建立的通信会话。第一通信设备可以激活语音到文本翻译机制。语音到文本翻译机制可以包括由第一通信终端所执行的存储在第一通信设备中的应用。第一通信设备能够将音频数据翻译成文本数据并且保存已翻译文本数据。第一通信设备将音频数据翻译成文本数据并且保存已翻译文本数据可以包括以下步骤：第一通信设备将第一音频问题翻译成第一文本数据并且保存第一音频问题的第一文本数据；第一通信设备将对第一音频问题的第一音频回答翻译成第二文本数据并且保存第二文本数据以便使得第二文本数据与第一音频问题相关联；第一通信设备将第二音频问题翻译成第三文本数据并且保存第二音频问题的第三文本数据；以及第一通信设备将对第二音频问题的第二音频回答翻译成第四文本数据并且保存第四文本数据以便使得第四文本数据与第二音频问题相关联。

还提供了处理音频数据的方法。所述方法包括以下步骤：建立在第一通信终端与第二通信终端之间的通信会话，其中音频数据在第一和第二通信终端之间被传送；以及在接收到用来激活语音到文本翻译机制的输入之后将音频数据翻译成文本数据。

在该方法的一些实施例中，在接收到用来激活语音到文本翻译机制的输入之后将音频数据翻译成文本数据可以包括将第一音频问题翻译成第一文本数据并且保存第一文本数据以及将对音频问题的音频回答翻译成第二文本数据并且保存第二文本数据以便使得第一文本数据与第二文本数据相关联。在接收到用来激活语音到文本翻译机制的输入之后将音频数据翻译成文本数据还可以包括接收指示将响应于第一音频问题而给出第一音频回答的输入以及接收指示完成第一音频回答的输入。

在该方法的一个实施例中，语音到文本翻译机制是在接收到用来激活语音到文本翻译机制的输入之后在第一通信终端或第二通信终端上运行的存储在第一通信终端或第二通信终端中的应用。在该方法的其它实施例中，语音到文本翻译机制可以是在接收到用来激活语音到文本翻译机制的输入之后在第一通信设备上运行的存储在该设备的存储器上的应用。

在该方法的一些实施例中，通信会话可以由第一通信设备来建立。第一通信设备可以在接收到用来激活语音到文本翻译机制的输入之后执行将音频数据翻译成文本数据。第一通信设备还可以接收第二音频问题并且确定第二音频问题与第一音频问题相同。响应于第一通信设备确定第二音频问题与第一音频问题相同，第一通信设备可以通过建议第一音频回答来向第一通信终端建议对第二音频问题的第二回答；如果第一音频问题是确切地相同的问题或者询问在第一回答中先前提供的确切相同的信息，则第一音频问题可以与第二音频问题相同。响应于接收到授权第一通信设备从第一通信终端传送所建议的第二回答的输入，第一通信设备以音频格式和文本格式中的至少一个将对第二音频问题的第二回答传送到第二通信终端。

该方法的一些实施例还可以包括与基于第一文本数据和第二文本数据来创建文档相关联的步骤。例如，所创建的文档可以是经填充的表格（form）或者可以是转录呼叫的内容的文字处理文档。所创建的文档可以被发送到另一个设备。

在该方法的一个实施例中，第一通信终端接收第二音频问题并且确定第二音频问题与第一音频问题相同。响应于第一通信终端确定第二音频问题与第一音频问题相同，第一通信终端通过建议第一音频回答来向第一通信终端的用户建议对第二音频问题的第二回答，其以音频格式和文本格式中的至少一个。响应于接收到授权第一通信终端传送所建议的第二回答的输入，第一通信终端以音频格式和文本格式中的至少一个将对第二音频问题的第二回答传送到第二通信终端。

还提供了其上存储有被计算机设备可执行的应用的非临时计算机可读介质。例如，计算机设备可以是通信终端或通信设备。应用能够定义音频数据处理的方法，其包括以下步骤：在接收到用来激活语音到文本翻译机制的输入之后将在已建立的通信会话期间在第一通信终端与第二通信终端之间传送的音频数据翻译成文本数据。在接收到用来激活语音到文本翻译机制的输入之后将音频数据翻译成文本数据可以包括将第一音频问题转换成第一文本数据并且保存第一文本数据，以及将对第一音频问题的第一音频回答转换成第二文本数据并且保存第二文本数据以便使得第一文本数据与第二文本数据相关联。应该了解的是，在计算机可读介质的一些实施例中，执行应用的计算机设备可以是第一通信终端、第二通信终端或第一通信设备。在一个实施例中，由该应用所定义的方法还能够包括基于所保存的第一文本数据和所保存的第二文本数据来生成表格文档。

应该理解的是，还提供了通信终端。所述通信终端能够包括处理器单元，所述处理器单元被耦合到计算机可读介质的实施例以便使得应用被处理器单元可执行以便使得通信终端执行由应用所定义的方法。还提供了能够包括处理器单元的通信设备，所述处理器单元被耦合到计算机可读介质的实施例以便使得应用被通信设备的处理器单元可执行，以便使得通信设备执行由应用所定义的方法。

本发明的其它细节、目标以及优点随着其某些目前优选的实施例和实践其某些目前优选的实施例的某些目前优选的方法的以下描述进行而将变得显而易见。

附图说明

在附图中示出了用于在多个通信设备之间提供通信的目前优选的设备、系统以及装置，并且在本文中还图示了实践目前优选的设备、系统以及装置的某些目前优选的方法。应该理解的是，附图中所用的同样的附图标记可以识别同样的组件。

图1是通信系统的示例性实施例的框图。

图2是可以被用在通信系统的实施例中的通信终端的示例性实施例的框图。应该理解的是，图1中所图示的呼叫者通信终端1和代理通信终端2可以均使用图2中所图示的通信终端的实施例。

图3A是可以在通信系统的实施例中被利用的通信设备的示例性实施例的框图。

图3B是可以在通信系统的实施例中被利用的服务器的示例性实施例的框图。

图4是处理音频数据的方法的示例性实施例的流程图。

图5是处理音频数据的方法的另一个示例性实施例的流程图。

具体实施方式

参考图1-4，呼叫者通信终端1可以与作为诸如企业网络、局域网、广域网或其它网络之类的网络的部分的第一通信设备5进行通信。第一通信设备5可以是交换机、软交换机、专用交换分机，或可以将呼叫路由到可以被分配给代理通信终端2的指定代理的其它通信设备。网络也可以包括其它节点。例如，网络3也能够包括接入点（未示出）、网关（未示出）、边界控制元件（未示出）或其它网络元件。

网络可以被配置成提供无线通信并且包括提供对网络3的无线接入的一个或多个接入点。在一个实施例中，网络的此类元件可以促进Wi-Fi依从通信。应该了解的是，“Wi-Fi”是作为Wi-Fi联盟的商标并且作为与如由电气和电子工程师协会（“IEEE”） 802.11标准之一所设计的那样操作的无线局域网相关联的品牌名称的术语。

呼叫者通信终端1的用户可以试图发起呼叫以通过将输入提供给呼叫者通信终端1来从提供服务的实体获得某种类型的服务，所述呼叫者通信终端1提供诸如电话号码之类的地址以用于发起呼叫。呼叫者通信终端1然后可以利用输入以用于发信号通知发起呼叫。第一通信设备5可以接收用于建立此类呼叫的信令并且形成与呼叫者通信终端1的连接。

第一通信设备5可以形成与呼叫者通信终端1的连接以将问题传送到呼叫者通信终端1而从呼叫者终端1的用户获得附加的信息以供在将呼叫路由到适当的代理中使用或者以供在授权呼叫者通信终端1的用户来验证该用户是呼叫者中使用。此类问题可以包括与呼叫者通信终端1的用户的个人信息有关的问题。此类个人信息可以包括社保号、生日、用户被分配的账号、电话号码或用户可以经由通信终端到达所在的其它地址、用户的名字，或呼叫者通信终端1的用户的其它个人信息。

响应于此类问题，呼叫者通信终端1的用户可以通过按下诸如示出通信终端的显示的图标之类的按钮、或通信终端的其它按钮来提供输入，或者可以利用某个其它输入设备用于提供用来激活语音到文本翻译应用的输入，所述语音到文本翻译应用在通信终端上运行以便使得被通信终端的麦克风所接收到的由呼叫者通信终端1的用户所说出的音频被翻译成文本格式并且存储以供后续使用或传输。所存储的从音频数据转换的文本数据还可以与从第一通信设备5接收到的问题相关联。

在可替换的实施例中，第一通信设备5可以激活语音到文本应用以用于响应于发送到呼叫者通信终端的音频问题而翻译或者转换从呼叫者通信终端接收到的音频。第一通信设备可以存储经由被激活的语音到文本应用而被从所接收到的音频转换的所保存的文本数据，并且使该所保存的文本数据与发送到呼叫者通信终端1的问题相关联。所存储的文本数据可以被随后用来填充一个或多个表格或者可以被用于其它目的。在一个实施例中，文本数据可以被传送到第二通信设备8并且保存在第二通信设备8的存储器中。例如，此类数据可以被保存于在第二通信设备8中所存储和维护的数据库中。第二通信设备8可以随后由计算机设备7在计算机设备7与第二通信设备8之间的单独通信会话中查询，以用于通过响应于接收到的查询来搜索数据库而将信息提供给其它设备。

在又另一个实施例中，第一通信设备可以是被配置成提供个人呼叫代理服务的服务器或其它计算机设备。呼叫者通信终端1可以首先建立与充当个人呼叫代理的第一通信设备5的通信连接。第一通信设备5然后可以提示呼叫者通信终端1输入识别呼叫或其它通信会话的目的地的地址。第一通信设备然后可以与关联于目的地地址的设备（诸如第二通信设备8或代理通信终端2）建立诸如呼叫之类的此类会话。第一通信设备5然后可以保持被包括在此类通信会话中并且接收在呼叫者通信终端1与代理通信终端2或第二通信设备8之间传送的数据。第一通信设备5可以应用在会话期间所接收到的所有音频的语音到文本翻译，并且构建作为基于文本的文档的存储在第一通信设备的存储器中的表格或其它文字处理文档或电子表格文档。表格的文本可以使由呼叫者通信终端1的用户以音频形式所提供的回答与以音频形式从第二通信设备8或代理通信终端2所发送的问题相关联。在重复问题在通信会话中被第二通信设备8或代理通信终端2传送到呼叫者通信终端1的情况下，第一通信设备5可以发送针对呼叫者通信终端的回答或者可以传送建议的回答到呼叫者通信终端1，呼叫者通信终端1的用户可以接受所建议的回答以用于经由为了接受此类回答所提供的输入而转发到代理通信终端2或第二通信设备8。如果回答是不可接受的，则还可以提供输入以防止将回答转发到第二通信设备8或代理通信终端2。输入可以通过呼叫者通信终端1的用户点击（hit）表示触摸屏显示器上的按钮的图标或者点击专用按钮或者移动或者以其它方式激励呼叫者通信终端的某个其它输入设备来提供。由第一通信设备5所发送的回答如果被呼叫者通信终端1的用户认可，则可以被以音频格式、文本格式或者以两种格式发送到代理通信终端2或第二通信设备8。如果发送了回答的音频，则可以以标准音频格式发送所供应的音频，所述标准音频格式缺乏呼叫者通信终端的用户的地方口音以帮助更好地促进回答的传递。

呼叫者通信终端1和代理通信终端2的通信终端可以均是许多不同类型的终端中的任一个，诸如蜂窝电话、个人数字助理、台式个人计算机、互联网话音（voice over internet）电话设备、电话设备、膝上型计算机、平板计算机设备、互联网装置或其它通信端点。应该理解的是，通信终端1可以是与代理通信终端2不同类型的终端设备。例如，呼叫者通信终端1在一个实施例中可以是蜂窝电话，然而代理通信终端是台式计算机，所述台式计算机被耦合到耳机和电话并且被配置成提供互联网话音通信。

在图2中示出可以充当呼叫者通信终端1或代理通信终端2的通信终端的示例。通信终端可以包括处理器单元11，所述处理器单元11被通信地连接到非临时存储器12、收发器单元14、显示单元15、扬声器16、输入设备17以及麦克风18。输入设备可以是一个或多个按钮、鼠标、键盘、或双麦克风、摄像机传感器或其它输入设备。处理器单元11可以是诸如微处理器之类的中央处理单元或其它处理器单元。存储器12可以是诸如硬盘驱动器或闪速驱动器之类的非临时存储器。诸如语音到文本应用之类的应用13可以被存储在存储器12上并且定义在处理器单元11执行应用13时被终端所执行的方法。收发器单元14可以包括接收器和发射器，并且被配置成经由一个或多个传输协议来发送数据以及从其它网络元件或其它设备接收数据。显示单元15可以是液晶显示器或其它显示器。在一些实施例中，显示单元15将是准许用户通过触摸显示器的不同区域来提供输入的触摸屏显示器。扬声器16可以发射音频，以及麦克风18可以记录从向着麦克风或在麦克风18的相应范围内说话的用户所接收到的音频。

在图3A中示出第一通信设备5的示例。第一通信设备5可以是诸如计算机、工作站、服务器、交换机、软交换机、专用交换分机或其它类型的计算机设备之类的网络节点。第一通信设备5可以包括被通信地连接到收发器单元23和存储器25的处理器单元21。收发器单元可以被配置成与一个或多个通信终端和其它网络节点交换数据或消息，并且还可以被配置用于路由呼叫或通信会话。存储器25可以是诸如硬盘驱动器、闪速驱动器或其它存储器设备之类的非临时存储器。应用27可以被存储在存储器25中。基于文本的表格28或数据库29还可以被存储在存储器25中。

在图3B中示出第二通信设备8的示例。第二通信设备8可以是诸如计算机、工作站、服务器、交换机、软交换机、专用交换分机或其它类型的计算机设备之类的网络节点。第二通信设备8可以包括被通信地连接到收发器单元33和存储器35的处理器单元31。收发器单元33可以被配置成与一个或多个通信终端和其它网络节点交换数据或消息，并且还可以被配置用于路由呼叫或通信会话。存储器35可以是诸如硬盘驱动器、闪速驱动器或其它存储器设备之类的非临时存储器。应用37可以被存储在存储器35中。数据库39也可以被存储在存储器25中。

图1的通信系统的示例性实施例可以被用在用于音频形式处理的方法的不同实施例中，如可以由图4-5所了解的那样。该方法的实施例还可以利用网络3、呼叫者通信终端1、代理通信终端2、第一通信设备5和第二通信设备8以及计算机设备7的不同实施例。

在用于音频形式处理的方法的一个实施例中，呼叫者可以使用呼叫者通信终端1通过拨打电话号码来发起呼叫。此类呼叫可以通过呼叫者将地址作为输入而送入到呼叫者通信终端1中并且按压输入设备以发起呼叫来激励。在一个实施例中，呼叫可以是去往代理通信终端2的。在另一个实施例中，呼叫可以是去往可以提供个人呼叫代理服务的第一通信设备5的。

如果经由代理通信终端2与代理建立了呼叫，则呼叫者和代理也许能经由所形成的通信会话而相互通话（talk）。会话可以是仅音频通信或者可以包括视频和音频通信会话。代理可以通知呼叫者他或她具有需要被回答的许多问题。代理或呼叫者可以询问是否可以使用音频形式处理机制以便使得出于存储回答并且生成具有此类信息的一个或多个表格或其它文档的目的而将所述回答自动地翻译成文本。可替换地，呼叫者通信终端1和代理通信终端2可以查询关于在被交换以建立通信会话的信令期间为可用的此类功能。

如果呼叫者终端或代理通信终端使得语音到文本应用或个人呼叫代理应用可用于帮助回答的保存、问题的保存、回答和问题的保存、或在呼叫期间以文本格式所交换的所有音频的保存，则呼叫者或代理可以通过将输入提供给与该呼叫者或代理相关联的通信终端来激励此类应用。然后，代理可以以音频方式询问第一问题并且然后按下按键或者提供其它输入来指示问题完成。其后，呼叫者可以以音频方式提供回答并且按下按键或按钮或者以其它方式提供输入来指示回答完成。问题可以被翻译成文本并且存储，并且后续回答可以被翻译成文本、存储，以及然后与所存储的问题相关联。此类翻译和存储可以在代理或呼叫者正在说话的时候发生，以便使得此类动作实时地或者相对接近于实时地发生。

可以连续地询问许多问题。此类问题可以涉及呼叫者的名字、生日、社保号、账号、地址、电话号码、电子邮件地址，或其它个人信息或其它信息。可以响应于问题给出每个回答，并且每个回答的音频内容可以被翻译成文本、保存以及与对其给出该回答的问题相关联。每个问题也可以被翻译成文本并且保存。

针对回答和问题的所保存的文本然后可以被从呼叫者通信终端1或代理通信终端2发送到另一个设备以供存储和后续使用。例如，所保存的数据可以被发送到第一通信设备5或第二通信设备8或计算机设备7。该数据然后可以被存储在数据库中。数据还能够被用来生成表格，以及然后所生成的表格可以被保存在该设备的存储器中。所生成的表格然后能够被用在将来的处理中。所生成的表格还可以在呼叫者再次呼叫以从实体获得服务时被转发到其它代理通信终端，以便使得呼叫者的信息可以经由代理通信终端的显示器被显示给代理。

可替换地，来自呼叫者的呼叫可以最初被第一通信设备5回答，所述第一通信设备5可以充当交换设备或服务器，其可以出于将呼叫路由到与代理通信终端相关联的适当的代理的目的而最初与呼叫者交互。第一通信设备5可以询问由第一通信设备5的应用27所预定义的一系列问题。呼叫者通信终端的呼叫者然后可以说出对这些问题的回答。第一通信设备5可以记录回答的音频并且使应用27的激活的语音到文本功能将此类音频回答翻译成文本。每个回答的文本可以被分配给表示对其给出该回答的问题的对象，并且基于文本的表格28可以由回答和问题生成并且被保存。例如，基于文本的表格可以被保存为文字处理文档或电子表格文档。所生成的表格然后可以被发送到代理通信终端2，第一通信设备5在评定由呼叫者所提供的回答以确定代理通信终端2的代理是呼叫应该被路由到的适当的代理之后可以将该呼叫路由到所述代理通信终端2。

在又另一个实施例中，呼叫者可以在后续通信会话中在联系服务提供商的代理之前呼叫第一通信设备5。呼叫者可以形成与第一通信设备5的通信会话以获得个人呼叫代理服务。对于此类实施例，第一通信设备5可以是托管此类服务的服务器或其它计算机设备。在建立与第一通信设备5的通信会话之后，呼叫者可以送入与服务提供商相关联的地址，以便使得第一通信设备5建立与第二通信设备8的连接，所述第二通信设备8可以充当用来将呼叫路由到适当的代理的交换设备、交换机设备或其它通信设备。第一通信设备5可能已经激励语音到文本应用以用于记录在与第二通信设备8的会话期间发生的音频回答和问题、将此类音频内容翻译或者转换成文本、以及使所述回答与对其给出该回答的问题相关联。第一通信设备5还可以在接收到重复问题之后在通信会话期间使第二通信设备8静默（mute）来建议对已重复问题的回答。呼叫者然后可以经由呼叫者通信终端1来送入输入以接受所建议的回答或者拒绝它。如果回答被呼叫者接受，则第一通信设备5可以使第二通信设备8不静默并且然后传送提供所建议的回答的音频。包含回答的音频的文本的消息的传输还可以被从第一通信设备5传送到第二通信设备8。

所建议的回答可以以标准话音的形式，所述标准话音不具有呼叫者可能必须提高由第一通信设备5所传送的给定重复回答的可理解性的任何口音。第一通信设备5还可以基于所存储的回答和那些回答与其相关联的问题来生成文字处理文档或其它文档，并且当呼叫者的呼叫被进一步路由到代理时将该表格传送到第二通信设备8以供该设备存储或者随后转发或者以其它方式使用。在所建议的回答被呼叫者拒绝的情况下，第一通信设备5可以使与第二通信设备7的连接不静默，并且记录以及翻译由呼叫者以音频形式所提供的回答。

在又另一个实施例中，充当个人呼叫代理的第一通信设备5可以建立与代理通信终端2的通信会话。第一通信设备5可能已激励语音到文本应用以用于记录音频回答和问题、将此类音频内容翻译成文本、以及使给出的回答与对其给出所述回答的问题相关联。第一通信设备5然后可以使代理通信终端2静默来建议对重复的任何问题的回答。呼叫者然后可以经由呼叫者通信终端1来送入输入以接收所建议的回答或者拒绝它。如果回答被呼叫者接受，则第一通信设备5可以使代理通信终端2不静默并且然后传送提供所建议的回答的音频。被作为音频数据传送到代理通信终端2的所建议的回答可以以标准话音的形式，所述标准话音不具有呼叫者可能必须提高由第一通信设备5所传送的给定重复回答的可理解性的任何口音。第一通信设备5还可以将文本数据传送到提供对问题的回答的文本的代理通信终端。在所建议的回答被呼叫者拒绝的情况下，第一通信设备5可以使与代理通信终端2的连接不静默，并且记录以及翻译由呼叫者以音频形式所提供的回答。在接收到指示不再需要语言到文本翻译服务的输入时，第一通信设备5还可以基于所存储的回答和那些回答与其关联的问题来生成文字处理文档或其它文档，并且将该表格传送到代理通信终端以供该设备存储或者随后转发或者以其它方式使用。

应该理解的是，由第一通信设备5在该设备充当个人呼叫代理时所生成的文档还可以被发送到呼叫者通信终端1以供存储在呼叫者通信终端的存储器中。当呼叫的此类记录是呼叫者或代理所期望的时，此类表格生成可以帮助文档或者转录呼叫。

在又另一个实施例中，可以激励呼叫者通信终端1的应用13以便使得个人呼叫代理服务在呼叫者通信终端1上运行。存储在现有呼叫中的问题和回答可以被存储在呼叫者通信终端1的存储器12中，并且可以被利用以便使得当与先前询问的问题类似或相同的问题在新的通信会话中被接收到时，通信终端能够将呼叫者可以接受或者拒绝的建议回答提供给呼叫者。来自过去呼叫的所保存的回答和问题可以被存储在通信终端的存储器的数据库中，以便使得来自现有呼叫的回答和问题与用于该呼叫的通信地址相关联。如果相同的问题在现有通信中先前被询问了，则然后建议回答可以仅被提供有相同的通信地址。所保存的数据还可以以文本文档被存储，所述文本文档诸如在呼叫者终端1的存储器12中的数据库或表格，并且所保存的数据可以经由用于识别响应于送入文本搜索查询的有关数据的文本搜索来搜索。对于此类实施例，个人呼叫代理可以是由呼叫者通信终端1而不是通信系统的单独设备所提供的特征或功能，所述通信系统提供呼叫者通信终端1为了获得服务或者与代理进行通信所连接到的企业网络的服务或组件。由呼叫者通信终端1的处理器来执行或者运行的存储在呼叫者通信终端1上的应用可以定义呼叫者通信终端1的特征或功能。

在其中通信终端的应用13能够提供个人呼叫代理服务的又另一个实施例中，通信终端的用户可以从代理通信终端2或诸如商业伙伴的朋友的终端之类的其它通信终端接收呼叫。接收到呼叫的通信终端的用户可以在该呼叫被他的或她的通信终端回答时激活应用13或者可以在该呼叫一直在进行中之后的稍后的时间激活应用13，并且显然，与用户在另一个呼叫中先前提供了的信息类似的某些信息需要经由该呼叫来传送。然后可以执行应用13以便使得在呼叫期间在终端之间交换的音频被翻译成文本并且存储。可以像上面所讨论的那样创建为基于所交换的音频的表格或其它文档。例如，音频可以被保存为转录呼叫的文字处理文档或者可以被用来生成用于传达在呼叫期间所交换的某些信息的形式。附加地，接收到呼叫的用户的通信终端可以建议对从呼叫者接收到的某些问题的回答，并且在从与上面所讨论的其它实施例类似地，可以授权建议回答的传输的通信终端的用户接收到输入时以标准音频话音格式传送此类回答。

在又另一个实施例中，代理通信终端2可以被配置成与第二通信设备8进行通信，所述第二通信设备8可以是托管用于与代理通信终端2相关联的代理的个人呼叫代理服务的服务器。发送到代理通信终端2的任何呼叫可以基于与这种服务相关联的设定被自动地转发到第二通信设备8，以便使得导向代理通信终端2的每个呼叫被导向或者转发到第二通信设备8。在接收到呼叫时，第二通信设备8然后可以将代理通信终端2加入到通信会话并且被配置成保存在该代理通信终端与发起了与代理通信终端2的呼叫的设备之间传送的所有音频数据。第二通信设备8然后可以基于在通信会话期间交换的音频数据的已保存文本来生成表格或其它文档，其能够被发送到代理通信终端或其它设备。从通信会话的音频翻译的文本数据还能够通过第二通信设备8被发送到另一个设备以供存储或其它使用。应该理解的是，呼叫者通信终端1还能够被配置以便使得导向该终端的呼叫被导向或者转发到呼叫者终端的用户所被注册到的通信设备以用于也提供此类个人呼叫代理服务。

应该理解的是，可以做出通信系统、终端、通信设备以及存储在此类设备的非临时存储器中的应用的许多其它可替换的实施例。例如，第一通信设备5可以是经由不作为企业网络的一部分的互联网连接可访问的服务器，其充当在呼叫者经由网络连接（例如，互联网连接、企业网络内部网连接等）联系代理通信终端时提供服务的个人呼叫代理。作为另一个示例，该系统的一些实施例可以仅被配置用于发生在呼叫者正在经由代理通信终端与代理进行通信时的基于所接收到的音频的表格生成。由从此类呼叫所交换的音频创建的所生成的表格或其它类型的文字处理文档或数据库文档然后可以被传送到服务器或其它通信设备以供存储在主数据库或其它存储机制中。计算机设备7然后可以与主数据库进行通信以在稍后的时间向数据库查询可能涉及从此类呼叫所获得的信息的信息。

在该系统的又另一个实施例中，应该理解的是，呼叫者通信终端1和代理通信终端2可以是相同企业网络的电话或有支持电话的设备。例如，呼叫者通信终端1可以是与管理者相关联的设备，以及代理通信终端2可以是与另一个管理者或在管理者的引导下工作的雇员或将指令提供给管理者的雇员相关联的设备。在又其它的实施例中，代理通信终端2可以是与呼叫者通信终端1的用户的朋友或伙伴相关联的终端。

还应该理解的是，在通信系统的不同实施例中呼叫者通信终端1和代理通信终端2可以是第一或第二通信终端。第一通信终端可以具有在其上提供个人呼叫代理服务或者订阅由诸如服务器之类的另一个设备所托管的服务的应用。由终端所提供的个人呼叫代理服务或终端所被注册到的服务可以在由第一通信终端所接收或者发起的任何呼叫期间提供此类服务。同样地，第二通信终端可以具有在其上提供个人呼叫代理服务或者订阅由另一个设备所托管的服务的应用，并且可以在由第二通信终端所接收或者发起的任何呼叫期间提供此类服务。

虽然上面已经示出并且描述了通信终端、通信设备、通信系统以及做出和使用该通信终端、通信设备、通信系统的方法的某些目前优选的实施例，但是应当显然理解，本发明不限于此，而是可以在以下权利要求的范围内被以其它方式不同地具体化并且实践。

Claims

1.一种通信系统，其包括：

第一通信终端；以及

通信地可连接到所述第一通信终端以用于建立通信会话的第一通信设备和第二通信终端中的至少一个，在所述通信会话中音频数据在所述第一通信终端与所述第一通信设备和所述第二通信终端中的至少一个之间被传送；并且

所述第一通信终端、所述第一通信设备以及所述第二通信终端中的至少一个激活语音到文本翻译机制，所述语音到文本翻译机制将所述音频数据翻译成文本数据并且保存已翻译文本数据。

2.根据权利要求1所述的系统，其中所述音频数据包括由所述第一通信设备和所述第二通信终端中的一个所传送的音频问题，并且所述音频数据还包括由所述第一通信终端和所述第二通信终端中的另一个所传送的音频回答；以及

其中将所述音频数据翻译成文本数据并且保存已翻译文本数据包括：

将音频问题翻译成文本并且保存所述音频问题的文本；

将对所述音频问题的所述音频回答翻译成文本并且保存对该音频问题的所述音频回答的文本，以便使得该音频回答的已翻译文本与对其给出该音频回答的所述音频问题相关联。

3.根据权利要求1所述的系统，其中所述音频数据包括由所述第一通信设备或所述第二通信终端所传送的音频问题，并且所述音频数据还包括由所述第一通信终端所传送的音频回答；以及

将对音频问题的音频回答翻译成文本数据并且保存对该音频问题的所述音频回答的文本数据，以便使得该音频回答的文本数据与对其给出该音频回答的所述音频问题或表示对其给出该音频回答的该音频问题的对象相关联。

4.根据权利要求3所述的系统，其中所述音频回答的所保存的文本数据通过所述第二通信终端或所述第一通信设备被送入到表格文档中，并且所述表格文档被保存。

5.根据权利要求3所述的系统，其中所述第一通信设备是交换机设备或服务器，所述第一通信终端是呼叫者通信终端和代理通信终端中的一个，以及所述第二通信终端是所述呼叫者通信终端和所述代理通信终端中的另一个。

6.根据权利要求1所述的系统，其中所述第一通信设备提供个人呼叫代理服务并且其中所述第一通信设备激活所述语音到文本翻译机制，所述语音到文本翻译机制包括由所述第一通信设备所执行的存储在所述第一通信设备中的应用，所述第一通信设备将所述音频数据翻译成文本数据并且保存已翻译文本数据；

其中所述通信会话通过以下各项来建立：

所述第一通信终端形成与所述第一通信设备的连接，以及

所述第一通信设备接收识别地址的输入并且基于所识别的地址来发起所述通信会话的建立，所述通信会话被与所述第二通信终端建立以便使得所述第二通信终端、第一通信设备以及第一通信终端参与所述通信会话，以便使得所述第一通信设备接收在所述通信会话期间在所述第一通信终端与所述第二通信终端之间传送的音频数据；并且

其中所述第一通信设备将所述音频数据翻译成文本数据并且保存已翻译文本数据包括：

所述第一通信设备将第一音频问题翻译成第一文本数据并且保存所述第一音频问题的第一文本数据，

所述第一通信设备将对所述第一音频问题的第一音频回答翻译成第二文本数据并且保存所述第二文本数据以便使得所述第二文本数据与所述第一音频问题相关联，

所述第一通信设备将第二音频问题翻译成第三文本数据并且保存所述第二音频问题的第三文本数据，以及

所述第一通信设备将对所述第二音频问题的第二音频回答翻译成第四文本数据并且保存所述第四文本数据以便使得所述第四文本数据与所述第二音频问题相关联。

7.根据权利要求1所述的通信系统，其中所述第一通信终端提供个人呼叫代理服务并且其中所述第一通信终端激活所述语音到文本翻译机制，所述语音到文本翻译机制包括由所述第一通信终端所执行的存储在所述第一通信终端中的应用，所述第一通信终端将所述音频数据翻译成文本数据并且保存已翻译文本数据；

其中所述通信会话通过所述第一通信终端形成与所述第一通信设备或所述第二通信终端的连接来建立，并且

其中所述第一通信终端将所述音频数据翻译成文本数据并且保存已翻译文本数据包括：

所述第一通信终端将第一音频问题翻译成第一文本数据并且保存所述第一音频问题的第一文本数据，

所述第一通信终端将对所述第一音频问题的第一音频回答翻译成第二文本数据并且保存所述第二文本数据以便使得所述第二文本数据与所述第一音频问题相关联，

所述第一通信终端将第二音频问题翻译成第三文本数据并且保存所述第二音频问题的第三文本数据，以及

所述第一通信终端将对所述第二音频问题的第二音频回答翻译成第四文本数据并且保存所述第四文本数据以便使得所述第四文本数据与所述第二音频问题相关联。

8.根据权利要求1所述的系统，其中所述第二通信终端激活所述语音到文本翻译机制，所述语音到文本翻译机制是由所述第二通信终端所执行的存储在所述第二通信终端中的应用，所述第二通信终端将所述音频数据翻译成文本数据并且保存已翻译文本数据；

其中所述通信会话通过所述第一通信终端形成与所述第二通信终端的连接来建立，并且

其中所述第二通信终端将所述音频数据翻译成文本数据并且保存已翻译文本数据包括：

所述第二通信终端将第一音频问题翻译成第一文本数据并且保存所述第一音频问题的第一文本数据，

所述第二通信终端将对所述第一音频问题的第一音频回答翻译成第二文本数据并且保存所述第二文本数据以便使得所述第二文本数据与所述第一音频问题相关联，

所述第二通信终端将第二音频问题翻译成第三文本数据并且保存所述第二音频问题的第三文本数据，以及

所述第二通信终端将对所述第二音频问题的第二音频回答翻译成第四文本数据并且保存所述第四文本数据以便使得所述第四文本数据与所述第二音频问题相关联。

9.根据权利要求8所述的系统，其中表格文档由所述第二通信终端基于所保存的第一文本数据、第二文本数据、第三文本数据以及第四文本数据来填充。

10.根据权利要求9所述的系统，其进一步包括第二通信设备，并且其中所述第二通信终端将所述表格文档发送到所述第二通信设备和所述第一通信设备中的至少一个。

11.根据权利要求7所述的系统，其中表格文档由所述第一通信设备基于所保存的第一文本数据、第二文本数据、第三文本数据以及第四文本数据来填充。

12.根据权利要求6所述的系统，其中表格文档由所述第一通信终端基于所保存的第一文本数据、第二文本数据、第三文本数据以及第四文本数据来创建。

13.根据权利要求6所述的系统，其中所述第一通信设备从所述第二通信终端接收被发送到所述第一通信终端的第三音频问题，并且确定所述第三音频问题是与所述第二音频问题相同的问题；

响应于所述第三音频问题是与所述第二音频问题相同的问题的确定，所述第一通信设备向所述第一通信终端建议第三回答，所述第三回答以音频格式和文本格式中的至少一个，以音频格式的所述第三回答包括所述第二音频回答并且以文本格式的所述第三回答包括所述第四文本数据的文本。

14.根据权利要求13所述的系统，其中所述第一通信设备在接收到对从所述第一通信终端发送所建议的第三回答的授权时，以音频格式和文本格式中的至少一个将所建议的第三回答发送到所述第二通信终端。

15.根据权利要求7所述的系统，其中所述第一通信终端从所述第二通信终端接收被发送到所述第一通信终端的第三音频问题，并且确定所述第三音频问题是与所述第二音频问题相同的问题；

响应于所述第三音频问题是与所述第二音频问题相同的问题的确定，所述第一通信终端向所述第一通信终端的用户建议第三回答，所述第三回答以音频格式和文本格式中的至少一个，以音频格式的所述第三回答包括所述第二音频回答并且以文本格式的所述第三回答包括所述第四文本数据的文本；并且

所述第一通信终端在从所述用户接收到授权发送所建议的第三回答的输入时，以音频格式和文本格式中的至少一个将所建议的第三回答发送到所述第二通信终端。

16.根据权利要求1所述的通信系统，其中所述第一通信终端被向由所述第一通信设备所托管的服务注册，以便使得通过所述第二通信终端到所述第一通信终端以建立通信会话的呼叫导致所述呼叫被转发到所述第一通信设备，所述第一通信设备建立所述通信会话并且将所述第一通信终端连接到所建立的通信会话；以及

其中所述第一通信设备激活所述语音到文本翻译机制，所述语音到文本翻译机制包括由所述第一通信设备所执行的存储在所述第一通信设备中的应用，所述第一通信设备将所述音频数据翻译成文本数据并且保存已翻译文本数据；并且

17.一种处理音频数据的方法，其包括：

建立在第一通信终端与第二通信终端之间的通信会话，其中音频数据在所述第一和第二通信终端之间被传送；

在接收到用来激活语音到文本翻译机制的输入之后将所述音频数据翻译成文本数据。

18.根据权利要求17所述的方法，其中在接收到用来激活语音到文本翻译机制的输入之后将所述音频数据翻译成文本数据包括：

将第一音频问题翻译成第一文本数据并且保存所述第一文本数据；

将对所述音频问题的音频回答翻译成第二文本数据并且保存所述第二文本数据，以便使得所述第一文本数据与所述第二文本数据相关联。

19.根据权利要求18所述的方法，其中在接收到用来激活语音到文本翻译机制的输入之后将所述音频数据翻译成文本数据还包括：

接收指示所述第一音频回答将响应于所述第一音频问题而被给出的输入；以及

接收指示所述第一音频回答完成的输入。

20.根据权利要求19所述的方法，其中所述语音到文本翻译机制是在接收到用来激活所述语音到文本翻译机制的所述输入之后在所述第一通信终端或所述第二通信终端上运行的存储在所述第一通信终端或所述第二通信终端中的应用。

21.根据权利要求18所述的方法，其中所述通信会话由第一通信设备来建立，并且其中所述第一通信设备在接收到用来激活所述语音到文本翻译机制的输入之后执行将所述音频数据翻译成文本数据。

22.根据权利要求21所述的方法，其中所述第一通信设备接收第二音频问题并且确定所述第二音频问题与所述第一音频问题相同；

响应于所述第一通信设备确定所述第二音频问题与所述第一音频问题相同，所述第一通信设备通过建议所述第一音频回答向所述第一通信终端建议对所述第二音频问题的第二回答；以及

响应于接收到授权所述第一通信设备从所述第一通信终端传送所建议的第二回答的输入，所述第一通信设备将对所述第二音频问题的所述第二回答传送到所述第二通信终端，所述第二回答以音频格式和文本格式中的至少一个。

23.根据权利要求18所述的方法，其进一步包括基于所述第一文本数据和所述第二文本数据来创建文档。

24.根据权利要求18所述的方法，其中所述第一通信终端接收第二音频问题并且确定所述第二音频问题与所述第一音频问题相同；

响应于所述第一通信终端确定所述第二音频问题与所述第一音频问题相同，所述第一通信终端通过建议所述第一音频回答来以音频格式和文本格式中的至少一个向所述第一通信终端的用户建议对所述第二音频问题的第二回答；以及

响应于接收到授权所述第一通信终端传送所建议的第二回答的输入，所述第一通信终端将对所述第二音频问题的所述第二回答传送到所述第二通信终端，所述第二回答以音频格式和文本格式中的至少一个。

25.一种其上存储有被计算机设备可执行的应用的非临时计算机可读介质，所述应用定义音频数据处理的方法，其包括：

在接收到用来激活语音到文本翻译机制的输入之后将在已建立的通信会话期间在第一通信终端与第二通信终端之间传送的音频数据翻译成文本数据，

在接收到用来激活所述语音到文本翻译机制的输入之后将所述音频数据翻译成文本数据包括：

将第一音频问题转换成第一文本数据并且保存所述第一文本数据，以及

将对所述第一音频问题的第一音频回答转换成第二文本数据并且保存所述第二文本数据以便使得所述第一文本数据与所述第二文本数据相关联。

26.根据权利要求25所述的非临时计算机可读介质，其中所述计算机设备是通信终端或通信设备，并且所述方法进一步包括基于所保存的第一文本数据和所保存的第二文本数据来生成表格文档。