CN1333624A - 改变语音向用户提供可选方言的方法 - Google Patents

改变语音向用户提供可选方言的方法 Download PDF

Info

Publication number
CN1333624A
CN1333624A CN01123162.9A CN01123162A CN1333624A CN 1333624 A CN1333624 A CN 1333624A CN 01123162 A CN01123162 A CN 01123162A CN 1333624 A CN1333624 A CN 1333624A
Authority
CN
China
Prior art keywords
dialect
word
agency
target
oral expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN01123162.9A
Other languages
English (en)
Inventor
克雷格·R·香博
安东尼·德宗诺
马克·J·鲍尔
肯尼思·韦尔
贾里德·布卢斯泰因
吉姆·F·马丁
达里尔·海麦尔
莱尔德·C·威廉斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rockwell Firstpoint Contact Corp
Original Assignee
Rockwell Electronic Commerce Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rockwell Electronic Commerce Corp filed Critical Rockwell Electronic Commerce Corp
Publication of CN1333624A publication Critical patent/CN1333624A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/013Adapting to target pitch
    • G10L2021/0135Voice conversion or morphing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/20Aspects of automatic or semi-automatic exchanges related to features of supplementary services
    • H04M2203/2061Language aspects

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供了一种通过一个通信网络将机构代理的口头表达方言调整为机构目标人员的口头表达方言的方法。该方法包括确定由代理使用的、用于与目标联系的一种方言;在所确定的方言的基础上,修改代理用于与目标联系的口头表达方言;以及向目标展示修改后的口头表达方言。

Description

改变语音向用户提供可选方言的方法
(一)技术领域
本发明的领域涉及通信系统,尤其是涉及电话购物设备。
(二)背景技术
用于电话购物的电话设备一般是公知的,这种设备可以处理打进和打出呼叫操作。在最简单的情况下,一个控制电话购物处理的机构可以提供一个电话银行和一组相应的代理以操纵该电话银行。当打进呼叫时,一个代理可以应答该呼叫,并对呼叫者关心的问题做出答复。当一个代理空闲时,该机构可以提供一个有联系的客户的呼出列表,在该代理不忙碌时可以呼叫该客户。
在更完善的机构中,可以提供一个自动呼叫分配器(ACD)向空闲代理传递呼叫。可以通过一根或多根中继线将ACD连接到公用交换电话网(PSTN)上。通常向公众公布一个电话号码以便与该机构进行联系。PSTN在检测所公布的电话号码的同时,通过一条或多条中继线向ACD传递呼叫。
随着一个呼叫的传递,PSTN还可以与呼叫一起传递有关一个打进呼叫的信息。例如,一个拨号标识服务(DNIS)实用程序随所传递的呼叫一起提供一个呼叫者的拨号号码。当机构内部有许多部门并且每个部门负责处理不同的与打进呼叫相关的事务时,这种实用程序是重要的。
另一个由PSTN内部进行的实用程序操作是自动号码标识(ANI)。ANI将一个呼叫者的电话号码随同该呼叫一起传送。一个ACD可以使用ANI在呼叫到达的瞬间、而不是在一个代理对呼叫做出应答之后识别用户。
依靠如DNIS和ANI这样的信息,ACD的一个控制器可以根据一个拨号号码或呼叫者的身份,选择一个最适于应答该呼叫的代理。此外,通过使用ANI,在呼叫到达的同时,为了一个选定代理的利益能够搜索并显示用户记录。
虽然使用ACD的电话购物机构是相对高效率的,但是有一个渐增的使这样的机构内部资源最大化的倾向。经常用ACD接收和安置广大区域上的呼叫,会引起工作量、以及具有不同文化和方言的代理和用户间交互作用的增加。
由于业务当中竞争的增加,一个商业者越来越需要使它的代理和用户之间的文化差异最小化。因此,就需要一种用于在代理语音内部控制区域来源指示符的装置。
(三)发明内容
本发明提供了一种通过通信网络向一个机构的目标人员调整由该机构代理所提供的口头表达方言的方法和装置。该方法包含以下步骤:确定一种代理使用的、用于和目标进行通讯的方言;根据所确定的方言,改变该代理的、用于和目标通讯的口头表达方言;以及向目标展示所改变的口头表达。
(四)附图说明
图1是依据本发明的一个说明性实施例使用的、一种用于改变一个口头表达的方言的系统的框图;
图2是图1的系统所使用的处理器和存储器的框图;以及
图3是在一个替换实施例中,图1系统的使用框图。
(五)具体实施方式
图1是依据本发明的一个说明性实施例的,一个用于改变一个代理(例如一个电话购物商)的口头表达内容(即方言)的装置10的框图。在它的最简单形式中,将对代理口头表达的修改描述为一个过滤器,用来控制和改变一个代理声音中的区域来源内容。该过滤器可以由多个因素中的任何一个触发。例如,源信息(例如,来自PSTN的ANI或DNIS信息)可以被用作区域指示符。可替换地,语音识别可以用来分析和检测一种方言。
系统10可以通过一种恰当的连接(例如,单根电话线、或是一根或多根中继线)28和一个通信系统(COMM)16相连接。接下来,COMM16可以和该机构的一个或多个目标人员(例如,用户、客户、支持者等等)相连接。在下文中有时将目标电话和该目标电话的用户简单地统称为“TGT12、14”。
在系统10内部包含一个可以由该机构的一个代理所使用的一个电话26(在下文中有时简单地将代理和他的电话统称为“代理26”)。虽然显示的系统10包含单个代理26,但是应当理解:系统10可以包含许多代理26。
还应当理解:系统10可以以多种不同的形式实现。例如,系统10可以包含一个支持多个所连接的代理26的事务处理器18(例如一个ACD)。此外,COMM16和ACD18可以作为一个较大系统的一部分来实现,如图3所示。为了清楚地反映图3所示的实施例的商业特性,将图1的TGT12、14称为用户(CUST)100-105。而且,现在代理26可以通过相应的代理站124、126和用户100-105联系。在一个代理站124、126的一个代理26可以通过一个电话控制台116、118或者是通过使用IP语音(VOIP)的终端120、122和一个用户100-105联系。
图3的系统可以用来传递来自多个来源(例如,通过PSTN、Internet国际互连网、蜂窝式电话系统、有线电视TV系统、无线电、卫星等)中的任意一个呼叫。在此用到的一个呼叫可以基于一个交换电路连接(即、通过PSTN)或者基于一个包连接(例如,通过国际互连网Internet)。一个交换电路连接(有时在电话通信领域中还简单地称为“电话连接”)是指两个用户之间存在的一个专用信道。在此用到的一个包连接不是表示一个物理连接,而是由两个用户简单地占有和同时使用另一个用户的IP地址进行语音信息的交换。
在该说明性实施例中,通过事务处理系统18,可以接收来自用户100-105的呼叫,并将其传递到选定的事务处理实体(例如,代理站124、126或者交互式话音响应单元(IVR)128、130)。
通过ACD134放置的用户100-105的交换线路呼叫,可以通过ACD134的矩阵开关136传递给代理26的控制台116、118,或者传递给一个恰当的IVR128、130。通过国际互连网106的呼叫可以作为IP语音存在。当接收到该呼叫时,主机132可以将该VOIP呼叫传递给一个代理26的终端120、122。
通过该事务处理系统,一个用户100-105可以利用一个传统的电话或者蜂窝电话及/或计算机来放置/接收一个呼叫。可替换地,用户100-105可以使用一个公用天线电视(CATV)系统112的一个交互频道、地面移动无线电140或者卫星116的一个传输信道142、144来放置/接收一个呼叫。当用户100-105使用一个公用天线电视(CATV)系统112的一个交互频道、地面移动无线电140或者一个卫星116的一个传输信道142、144来放置一个呼叫时,可以假定这样的呼叫由一个目标标识符(例如ACD134的一个电话号码)使用一个传统按键式面板的输入来启动。
虽然在这里有时术语“呼叫者”指的是用户100-105,但是应当理解:呼叫也可以由事务处理系统134启动。例如,可以在主机132的一个数据库中保持用户列表。由CPU 138通过PSTN 108、无线电频率(rf)收发器114或者由主机132经由国际互连网106,启动从系统10到用户100-105的打出呼叫。
与每个用户100-105有关的是一个标识符以及呼叫路由选择信息。该标识符可以是一个用于在一个特定的通信系统(例如,在PSTN108内的一个电话号码、在国际互连网106内的一个IP地址、在CATV系统112内的一个用户帐号、在地面移动无线电140或者卫星系统116内的一个电子序号(ESN)等)内标识用户100-105的标识符。
路由选择信息可以用来识别在哪个特定系统(例如,PSTN108、国际互连网106、CATV112、地面移动无线电140、卫星116等)中使用了该标识符。在事务处理系统134的情况中,路由选择信息可以简单地识别经由哪个端口处理该呼叫。例如,用于一个国际互连网呼叫的一个端口可以是一个和主机132的国际互连网连接。一个电话呼叫可以通过使用ACD134的一个交换机136的一个相应端口的第一组中继线28来进行处理。和一个有线用户103、地面移动用户104或者卫星用户105的一个呼叫可以通过使用ACD134的交换机136的一个相应端口的第二组中继线146来进行处理。在此可以把标识符和呼叫路由选择信息一同称为呼叫相关信息。
不论一个呼叫是打入还是打出,该呼叫的分发实质上可以是一样的。当呼叫是打出时,事务处理系统18自然已知该呼叫目标的身份。当该呼叫是打入时,事务处理系统18可以根据其他的呼叫相关信息(例如,在PSTN或者国际互连网情况下的一个端口号、以及ANI或者IP地址信息)确定呼叫者的身份。通过知晓一个用户100-105的身份,事务处理系统18可以根据用户100-105的历史需求或者其它公知标准来传递该呼叫。
到一个事务处理实体26的呼叫传递可以在几种格式下完成。呼叫是一个交换电路呼叫时,CPU138选择一个代理,然后将该呼叫传递到所选代理的控制台116、118或者是传递到选定的IVR128、130。CPU138可以向主机132发送一个包含呼叫相关信息的呼叫传递信息。当主机132能够识别用户记录时,主机132可以在呼叫传递的同时向所选代理26展示那些记录(例如,在所选代理的一个终端120、122上弹出一个屏幕)。
当一个呼叫是通过国际互连网时,展示方式是完全地通过所选代理的终端120、122。当该呼叫是一个网络电话呼叫形式时,主机132可以向所选代理转发请求者的IP地址。当主机132能够识别用户记录时,可以和网络电话请求一起,把那些记录展示给该代理。
作为图3的系统的替换,事务处理器18可以作为一个带有单个连接代理26的呼叫处理器18在一台个人计算机(PC)上实现(如图1所示)。当呼叫处理器18作为一个带有多个连接代理26的ACD实现时,应当理解每个代理可以为不同的机构服务。此外,甚至在涉及单个代理26的情况下,该机构目的也可以随呼叫目标12、14的不同而不同。
系统10可以用来为多个机构目的中的任何一个服务。在此用到的一个机构目的是指用以实现该机构的目标的任何功能活动。此外,应该理解,可以通过在机构的代理和该机构的目标之间进行联系而实现这些功能活动。一般地,该对外联系包含:该机构的一个代理26的口头表达或者在代理26和一人员机构的TGT12,14之间的口头交换意见,所述人员机构只与该机构的一种产品有关而与开始进行该联系的人员无关。
例如,如果使用系统10的机构是一个批发商,则该机构的目的将是销售,而且将在一个推销员或者直销员26和公众(即TGT12、14)的成员之间进行联系。或者,如果该机构是一个慈善机构,则该机构的目的可以是募捐,而且联系将再次通过一个掮客进行。
如果该机构是一个政党,则该机构的目的将是赢得一次选举或者影响一次表决。如果该机构是一个环保团体,则该机构的目的可以只是普及环保知识。
通过调整一个内容以消除在代理26和TGT12、14之间的联系上所感知的文化差异,可以进一步推进机构的目的。在这点上应当理解:对一个口头表达内容的调整仅限于该机构代理26的语言,而不是该机构的目标。还应当理解:在此用到的“表达”试图包含一个代理在一个双向交谈中的参与,而不具体地限于(但是能够包含)该机构的代理单方面向TGT 12、14进行推销。
在该说明性实施例中,当检测到呼叫时,呼叫处理器18可以根据呼叫相关信息选择不同的方言。当呼叫是一个打入电话呼叫时,呼叫相关信息可以是DNIS或者ANI信息。当呼叫是一个打出电话呼叫时,呼叫相关信息可以是呼叫的电话号码。
当呼叫相关信息是基于DNIS信息时,处理器22可以根据来自于PSTN16的DNIS信息选择一种方言,例如,一个特定的机构可以在不同的销售地点散布不同的电话号码。可以根据与该呼叫有关的销售地点选择一种方言。
相似地,当呼叫相关信息是ANI或者一个拨出号码时,可以根据该号码的区域标识符(例如,电话区号)或者根据和TGT12、14交流的经验来选择方言。利用呼叫相关信息,可以进行方言的初始确定。在方言初始确定之后,可以根据呼叫相关信息,检索一个定义了用于该呼叫的方言的方言文件38、40(图2)。该文件38、40可以包含一组用于该呼叫的方言参数值。该参数值可以定义方言,预先确定呼叫相关信息的每一种类型,并被储存在存储器24内。
可以用多个语言属性中的任意一个对定义了一种方言的呼叫内容参数值进行描绘。字速率是一个用于定义一种方言的属性。字选择和变音可以是其他的属性。用于定义方言参数值(或利用所定义的参数值重新创建一种方言)的软件可从多个资源中的任一处获得。(例如,http:∥faculty.washington.edu/dillon/PhonResources/PhonResources.html,http:∥www.linguasphere.org/等)
一旦检索到定义该方言的参数值,呼叫处理器18就可以把该呼叫连接到代理26,然后开始检测该呼叫的字内容。对于正在检测的呼叫内容,一个数字信号处理器(DSP)20(起一个采样处理器的作用)可以开始对来自代理26的一个语音信号和来自TGT12、14的一个语音信号进行取样。然后在一个傅里叶处理器32内利用一个快速傅里叶变换(FFT),将来自代理26和TGT12、14的取样信号中的每一个转换成一个语音轮廓(profile)。
通过使用TGT12、14的语音轮廓,可以用一个字识别(例如一个语音识别)处理器42来确定字内容和正被TGT12、14使用的一种方言。当TGT12、14检测到的方言不同于初始确定的方言时,可以重新得到一个新的方言文件38、40。检测到的字内容和方言可以保存在存储器24中,用于以后的使用,如以下讨论的那样。
接下来,还可以将代理26的语音轮廓应用到字识别处理器42以检测该代理的口头表达内容。该内容可以包含一个字内容,一个字速率和一个主频率。
在一个说明性实施例中,代理26和TGT12、14的方言中的每一种都可确定下来。通过检测并向代理的字选择告知附加的意义,确定代理的初始方言可被用于提高系统性能。可替换地,只需要确定TGT12、14的方言。一旦确定下来,就可以调整代理26的每个字以和已确定的TGT12、14方言相一致。
代理26和TGT12、14的方言都已经确定时,可以在一个内容处理器44中将代理26的话音轮廊和选定的某一方言文件38、40的内容相比较,以确定任何修改或调整是否已经就绪。根据选定的方言文件38、40的内容,可以在逐字的基础上,或是依据来自该代理的一个完整字流,对该代理的陈述内容进行修改。
通过使用模板34、36和/或用于生成一种特定方言的软件(如上所述),代理26的方言可以与TGT12、14相配。当方言文件38、40要求、或是识别出的TGT12、14方言建议了一个特定的方言时,处理器22可以修改该代理的表达以与该方言相匹配。通过首先识别来自代理26的每一个词,然后选择一个用于所要求的特定方言中的相应词的模板,来完成这种匹配。然后该模板可被用作一种用于将代理26所说的识别字替换为特有方言中一个经过综合处理的字的装置。
模板可以以多种不同方法中的任意一种实现。例如,一个字模板可以基于以不同方言所说的词的记录。如上所述,可以对不同方言的字进行采样,并且利用FFT转换成为字轮廊。该轮廓的主频可以调高或者调低,以匹配代理的正常语调,并且利用一个反FFT转换回一个音频表达。
当方言文件38、40要求时,可以添加或者替换地区性的特殊字。例如,某些字(例如牌照和标记)在不同的地方有不同的含义。当在一个TGT12、14和代理26的说话中检测到地区性的特殊字时,这些地区性的特殊字还可以用作方言标记。地区性特殊字还可以被插入到代理26的说话中以实现预定的方言。
在该说明性实施例中,在代理26和TGT12、14进行交流期间,根据来自TGT12、14的语音轮廓,可以改变初始确定的方言。当以后确定的方言不同于开始确定的方言,可以重新得到一个不同的方言文件38、40,并且在需要时进行替换以调整代理26的方言。
为了说明本发明构造和使用的方式,这里已经描述了一个依据本发明调整一个口头表达的方言的一种方法和装置的具体实施例。应当理解:本发明的实现有其它的变化和修改,它的各个方面对本领域技术人员来说是显而易见的,而且本发明不局限于所描述的特定实施例。因此,期望在这此的权利要求书中包含在本发明基本原理的真正精神和范围之内的任何修改、变化、或等效物。

Claims (17)

1.一种通过一个通信网络将机构代理的口头表达方言调整为机构目标人员的口头表达方言的方法,该方法包含以下步骤:
确定由代理使用的、用于与目标联系的一种方言;
在所确定的方言的基础上,修改代理用于与目标联系的口头表达方言;以及
向目标展示修改后的口头表达方言。
2.如权利要求1所述的选择一种方言的方法,其中确定方言的步骤进一步包含检索与该目标相关的呼叫相关信息。
3.如权利要求1所述的选择一种方言的方法,其中修改口头表达内容的步骤进一步包含识别所说的字的内容。
4.如权利要求3所述的选择一种方言的方法,其中检测口头表达中所说的字的内容的步骤进一步包含将识别出的所说字内容和一组语言模板进行比较。
5.如权利要求4所述的选择一种方言的方法,其中将识别出的所说字内容和一组语言模板进行比较的步骤进一步包含从该组模板中选择一个最匹配的模板。
6.如权利要求4所述的选择一种方言的方法,其中将识别出的所说字内容和一组语言模板进行比较的步骤进一步包含用所确定的方言代替一个等效字。
7.一种通过一个通信网络将机构代理的口头表达方言选定为机构目标人员的口头表达方言的装置,该装置包含:
用于确定由代理使用的、用于与目标联系的装置;
用于在所确定的方言的基础上,修改代理的口头表达方言的装置;
用于向目标展示修改过的口头表达的装置。
8.如权利要求7所述的用于选择一种方言的装置,其中用于确定方言的装置进一步包含用于检索与该目标相关的呼叫相关信息的装置。
9.如权利要求7所述的用于选择一种方言的装置,其中用于修改口头表达方言的装置进一步包含用于识别所说字内容的装置。
10.如权利要求9所述的用于选择一种方言的装置,其中用于检测口头表达的所说字内容的装置进一步包含用于把识别出的所说字内容和一组语言模板进行比较的装置。
11.如权利要求10所述的用于选择一种方言的装置,其中用于把识别出的所说字内容和一组语言模板进行比较的装置进一步包含用于从该组模板中选择一个最匹配模板的装置。
12.如权利要求9所述的用于选择一种方言的装置,其中用于识别所说字内容的装置进一步包含用于以确定的方言代替一个等效字的装置。
13.一种通过一个通信网络将机构代理的口头表达方言选定为机构目标人员的口头表达方言的装置,该装置包含:
一个呼叫分析器,用于确定代理与目标进行联系时所使用的一种方言;
一个话音处理器,用于在所确定的方言的基础上,修改该代理的口头表达方言;以及
一个话音合成器,用于向目标展示修改后的口头表达。
14.如权利要求13所述的用于选择一种方言的装置,其中呼叫分析器进一步包含一个用于接收与用户相关的呼叫相关信息的电话系统接口。
15.如权利要求14所述的用于选择一种方言的装置,其中话音处理器进一步包含一个用于识别口头表达的所说字内容的字识别模块。
16.如权利要求15所述的用于选择一种方言的装置,其中语音识别器进一步包含多个语言模板。
17.如权利要求15所述的用于选择一种方言的装置,其中该语音识别器进一步包含一个用于将识别出的所说字内容与多个语言模板进行比较的比较处理器。
CN01123162.9A 2000-07-13 2001-07-13 改变语音向用户提供可选方言的方法 Pending CN1333624A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/615,392 2000-07-13
US09/615,392 US6598021B1 (en) 2000-07-13 2000-07-13 Method of modifying speech to provide a user selectable dialect

Publications (1)

Publication Number Publication Date
CN1333624A true CN1333624A (zh) 2002-01-30

Family

ID=24465157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN01123162.9A Pending CN1333624A (zh) 2000-07-13 2001-07-13 改变语音向用户提供可选方言的方法

Country Status (4)

Country Link
US (1) US6598021B1 (zh)
EP (1) EP1172995A3 (zh)
CN (1) CN1333624A (zh)
CA (1) CA2352981A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103811012A (zh) * 2012-11-07 2014-05-21 联想(北京)有限公司 一种语音处理方法以及一种电子设备
CN104756184A (zh) * 2012-08-30 2015-07-01 谷歌公司 选择用于自动话音识别的语言的技术

Families Citing this family (144)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7315982B2 (en) 2003-02-26 2008-01-01 Xerox Corporation User-tailorable romanized Chinese text input systems and methods
US7460652B2 (en) * 2003-09-26 2008-12-02 At&T Intellectual Property I, L.P. VoiceXML and rule engine based switchboard for interactive voice response (IVR) services
EP1528450A1 (de) * 2003-10-27 2005-05-04 Siemens Aktiengesellschaft Verfahren zum Identifizieren, Authentifizieren und Autorisieren eines Benutzers von geschützen Daten
US8447027B2 (en) 2004-01-30 2013-05-21 Hewlett-Packard Development Company, L.P. System and method for language variation guided operator selection
US7936861B2 (en) 2004-07-23 2011-05-03 At&T Intellectual Property I, L.P. Announcement system and method of use
US7580837B2 (en) 2004-08-12 2009-08-25 At&T Intellectual Property I, L.P. System and method for targeted tuning module of a speech recognition system
US20060050865A1 (en) * 2004-09-07 2006-03-09 Sbc Knowledge Ventures, Lp System and method for adapting the level of instructional detail provided through a user interface
US7657005B2 (en) 2004-11-02 2010-02-02 At&T Intellectual Property I, L.P. System and method for identifying telephone callers
US7242751B2 (en) 2004-12-06 2007-07-10 Sbc Knowledge Ventures, L.P. System and method for speech recognition-enabled automatic call routing
US7864942B2 (en) 2004-12-06 2011-01-04 At&T Intellectual Property I, L.P. System and method for routing calls
US7751551B2 (en) 2005-01-10 2010-07-06 At&T Intellectual Property I, L.P. System and method for speech-enabled call routing
US7627096B2 (en) 2005-01-14 2009-12-01 At&T Intellectual Property I, L.P. System and method for independently recognizing and selecting actions and objects in a speech recognition system
US7450698B2 (en) 2005-01-14 2008-11-11 At&T Intellectual Property 1, L.P. System and method of utilizing a hybrid semantic model for speech recognition
US7627109B2 (en) 2005-02-04 2009-12-01 At&T Intellectual Property I, Lp Call center system for multiple transaction selections
US7657020B2 (en) 2005-06-03 2010-02-02 At&T Intellectual Property I, Lp Call routing system and method of using the same
US20060293890A1 (en) * 2005-06-28 2006-12-28 Avaya Technology Corp. Speech recognition assisted autocompletion of composite characters
US8249873B2 (en) * 2005-08-12 2012-08-21 Avaya Inc. Tonal correction of speech
US20070050188A1 (en) * 2005-08-26 2007-03-01 Avaya Technology Corp. Tone contour transformation of speech
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7496693B2 (en) * 2006-03-17 2009-02-24 Microsoft Corporation Wireless enabled speech recognition (SR) portable device including a programmable user trained SR profile for transmission to external SR enabled PC
US8725518B2 (en) * 2006-04-25 2014-05-13 Nice Systems Ltd. Automatic speech analysis
US8577916B1 (en) 2006-09-01 2013-11-05 Avaya Inc. Search-based contact initiation method and apparatus
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
JP5100445B2 (ja) * 2008-02-28 2012-12-19 株式会社東芝 機械翻訳する装置および方法
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US9323854B2 (en) * 2008-12-19 2016-04-26 Intel Corporation Method, apparatus and system for location assisted translation
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
DE202011111062U1 (de) 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US20120265533A1 (en) * 2011-04-18 2012-10-18 Apple Inc. Voice assignment for text-to-speech output
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US20130110511A1 (en) * 2011-10-31 2013-05-02 Telcordia Technologies, Inc. System, Method and Program for Customized Voice Communication
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9824695B2 (en) * 2012-06-18 2017-11-21 International Business Machines Corporation Enhancing comprehension in voice communications
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
DE112014000709B4 (de) 2013-02-07 2021-12-30 Apple Inc. Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
US9922642B2 (en) 2013-03-15 2018-03-20 Apple Inc. Training an at least partial voice command system
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
EP3008641A1 (en) 2013-06-09 2016-04-20 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
WO2014200731A1 (en) 2013-06-13 2014-12-18 Apple Inc. System and method for emergency calls initiated by voice command
KR101749009B1 (ko) 2013-08-06 2017-06-19 애플 인크. 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
AU2015266863B2 (en) 2014-05-30 2018-03-15 Apple Inc. Multi-command single utterance input method
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9330681B2 (en) 2014-07-16 2016-05-03 International Business Machines Corporation Voice signal modulation service for geographic areas
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
JP7072482B2 (ja) * 2018-10-05 2022-05-20 京セラ株式会社 電子機器、制御方法および制御プログラム
US11450311B2 (en) * 2018-12-13 2022-09-20 i2x GmbH System and methods for accent and dialect modification
CN112652309A (zh) * 2020-12-21 2021-04-13 科大讯飞股份有限公司 一种方言语音转换方法、装置、设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4882681A (en) * 1987-09-02 1989-11-21 Brotz Gregory R Remote language translating device
US5561736A (en) * 1993-06-04 1996-10-01 International Business Machines Corporation Three dimensional speech synthesis
US5721938A (en) * 1995-06-07 1998-02-24 Stuckey; Barbara K. Method and device for parsing and analyzing natural language sentences and text
US6240170B1 (en) * 1997-06-20 2001-05-29 Siemens Information And Communication Networks, Inc. Method and apparatus for automatic language mode selection
DE19813061A1 (de) * 1998-03-25 1999-09-30 Keck Klaus Vorrichtung zur Veränderung der in elektrischen Sprachsignalen enthaltenden Mikromodulationen
US6185535B1 (en) * 1998-10-16 2001-02-06 Telefonaktiebolaget Lm Ericsson (Publ) Voice control of a user interface to service applications
US6374224B1 (en) * 1999-03-10 2002-04-16 Sony Corporation Method and apparatus for style control in natural language generation

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104756184A (zh) * 2012-08-30 2015-07-01 谷歌公司 选择用于自动话音识别的语言的技术
CN104756184B (zh) * 2012-08-30 2018-12-18 谷歌有限责任公司 选择用于自动话音识别的语言的技术
CN103811012A (zh) * 2012-11-07 2014-05-21 联想(北京)有限公司 一种语音处理方法以及一种电子设备
CN103811012B (zh) * 2012-11-07 2017-11-24 联想(北京)有限公司 一种语音处理方法以及一种电子设备

Also Published As

Publication number Publication date
US6598021B1 (en) 2003-07-22
CA2352981A1 (en) 2002-01-13
EP1172995A2 (en) 2002-01-16
EP1172995A3 (en) 2004-12-29

Similar Documents

Publication Publication Date Title
CN1333624A (zh) 改变语音向用户提供可选方言的方法
US7184540B2 (en) Personality based matching of callers to agents in a communication system
US5832433A (en) Speech synthesis method for operator assistance telecommunications calls comprising a plurality of text-to-speech (TTS) devices
JP2520537B2 (ja) 電話呼び出しを処理する方法
US7609823B2 (en) High capacity advanced 8YY mass calling event network architecture
CN101689365B (zh) 控制视频会议的方法
USRE43205E1 (en) Skill based chat function in a communication system
CN1282484A (zh) 用于路由选择的带内信令
WO2005094051A1 (en) Active speaker information in conferencing systems
CN1293859A (zh) 通过与呼叫中心的代理人进行基于图形界面的交互从而向ip用户提供服务的方法
WO2002061730A1 (en) Syntax-driven, operator assisted voice recognition system and methods
CN1339899A (zh) 具有仿真客户机的交换器
US8005197B2 (en) Methods and apparatus for defending against telephone-based robotic attacks using contextual-based degradation
AU2003200674A1 (en) Intelligent interactive voice response unit
US8364490B2 (en) Voice browser with integrated TCAP and ISUP interfaces
JP2003510663A (ja) 音声検査システム
CN1213578C (zh) 电话通信系统
CN1799250A (zh) 在连接请求者和通信中心之间建立连接的系统和方法
CN1700714A (zh) 自动实现电话语音服务的系统及方法
US7336774B2 (en) Vote processing in a public switched telephone network
CN1627780A (zh) 呼叫中心的虚拟实现方法
CN100499711C (zh) 用于自动接收和交换入局通信连接的通信装置
EP1001386A1 (en) Electronic ballotting
CN1795662A (zh) 不挂机期间激活选择的方法和设备
KR100420773B1 (ko) 음성 인식을 이용한 실시간 통화 중 음성 정보 서비스제공 시스템 및 그 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20020130