CN102209143B - 电话服务交互管理 - Google Patents
电话服务交互管理 Download PDFInfo
- Publication number
- CN102209143B CN102209143B CN201110084918.5A CN201110084918A CN102209143B CN 102209143 B CN102209143 B CN 102209143B CN 201110084918 A CN201110084918 A CN 201110084918A CN 102209143 B CN102209143 B CN 102209143B
- Authority
- CN
- China
- Prior art keywords
- dtmf
- called party
- communication parter
- input
- dtmf tone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/26—Devices for calling a subscriber
- H04M1/30—Devices which can set up and transmit only one digit at a time
- H04M1/50—Devices which can set up and transmit only one digit at a time by generating or selecting currents of predetermined frequencies or combinations of frequencies
- H04M1/505—Devices which can set up and transmit only one digit at a time by generating or selecting currents of predetermined frequencies or combinations of frequencies signals generated in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/487—Arrangements for providing information services, e.g. recorded voice services or time announcements
- H04M3/493—Interactive information services, e.g. directory enquiries ; Arrangements therefor, e.g. interactive voice response [IVR] systems or voice portals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Abstract
本发明描述了一种电话服务交互管理。提供了一种用于管理呼叫方与通信伙伴的交互的方法。该方法包括自动地确定通信伙伴是否期待DTMF输入。该方法还包括将语音输入转换成一个或多个DTMF音调,并且如果通信伙伴期待DTMF输入则将该一个或多个DTMF音调传递给通信伙伴。
Description
技术领域
本发明涉及通信技术,尤其涉及电话交互技术。
背景技术
可以自动化诸如语音邮件应用程序、呼叫中心和电话市场营销服务之类的电话服务。例如,某些自动化电话服务支持语音识别,其中呼叫方使用语音命令来与自动化服务交互。某些自动化电话服务支持双音多频(DTMF)输入,其中呼叫方通过按压键区上的键来向自动化服务发送DTMF音调的方式来与自动化服务交互。在某些示例中,自动化电话服务可能无法识别呼叫方发出的语音输入中的语音,而是依赖于呼叫者通过按压电话键区上的键来向服务发送音调。呼叫方使用她的手和眼睛来按压按钮并在自动化服务中导航。与电话键区的这种类型的交互可能对使用他们的手和/或眼睛用于其他任务的车辆驾驶员和/或其他呼叫者造成障碍。
发明内容
提供本发明内容以便以简化形式介绍将在以下的具体实施方式中进一步描述的一些概念。本发明内容并不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于限定所要求保护的主题的范围。此外,所要求保护的主题不限于解决在本发明的任一部分中提及的任何或所有缺点的实现。
在一个示例实施例中,提供了一种用于管理呼叫方与通信伙伴的交互的方法。该方法包括自动地确定通信伙伴是否期待DTMF输入。该方法还包括将语音输入转换成一个或多个DTMF音调并将该一个或多个DTMF音调传递给通信伙伴。
附图说明
图1示意性地示出呼叫方与期待DTMF输入的被呼叫方的示例交互。
图2A示意性地示出呼叫方与期待DTMF输入的被呼叫方的另一示例交互。
图2B示意性地示出呼叫方与期待DTMF输入的被呼叫方的另一示例交互。
图3示出用于管理呼叫方通过电信网络与通信伙伴的交互的示例方法。
图4示出用于管理呼叫方通过电信网络与通信伙伴的交互的另一示例方法。
图5示出用于管理使用宏语音命令的、通过电信网络的交互的示例方法。
图6示意性地示出包括被配置为管理通过电信网络的交互的数据保存子系统的呼叫管理器的示例实施例。
具体实施方式
本发明涉及用于管理呼叫方通过诸如电话网络之类的电信网络与被呼叫方(通信伙伴)之间的交互的系统和方法。在某些示例中,被呼叫方可以提供自动化电话服务。自动化电话服务可以支持允许呼叫方使用语音输入来与自动化服务进行交互的语音识别(SR)。例如,语音识别可以由呼叫方提供,以在自动化菜单中导航或将信息发送给自动化电话服务。
然而某些自动化电话服务可能不支持语音识别并且可能期望双音多频(DTMF)输入。呼叫方一般使用手和眼睛来在期待DTMF输入的自动化电话服务中导航并与之交互。例如,呼叫方可以使用他的手和眼睛来按压按钮并在自动化服务中导航,将数据发送给自动化服务或联系上在场(live)代理。与电话键区的这种类型的交互可能对使用他们的手和/或眼睛用于其他任务的车辆驾驶员和/或其他呼叫者造成障碍。
图1示出呼叫方10与自动化被呼叫方12的示例交互。在该示例中,呼叫方可以使用电话设备13,例如蜂窝电话来发起到被呼叫方的呼叫。响应于被呼叫方提供的一个或多个音频提示,呼叫方可以通过使用物理输入16,例如手或手指来按压键区14上的一个或多个键的方式来与被呼叫方交互。通过将触摸输入输入到电话设备中,例如按压键区上的一个或多个键,呼叫方可以向被呼叫方发送DTMF音调流18。
自动化电话服务提供呼叫方可以在其中导航,例如连接到在场代理的自动化菜单。在被呼叫方期待DTMF输入的场景中,呼叫方可以通过将触摸输入输入到电话设备,例如按压键区或电话设备提供的相似界面上的一个或多个按钮来在自动化菜单中导航,从而将DTMF音调发送给被呼叫方来在菜单中导航。
例如,车辆驾驶员可以使用车辆内信息娱乐系统或蜂窝电话来发起到自动化被呼叫方的呼叫,例如来查看语音邮件、银行帐户信息、股票等等。当被呼叫方期待DTMF输入时,车辆驾驶员可以看着信息娱乐系统或蜂窝电话上包括的界面,例如键区,来按压正确的数字从而使得信息娱乐系统或蜂窝电话可以将相应的DTMF音调发送给被呼叫方。
以上参考图1所述的示例交互在呼叫方的注意力在其他任务上或者应该聚焦于其他任务的情形中可能造成障碍。例如,如果呼叫方正在驾驶车辆,则呼叫方的手和眼睛可能聚焦于驾驶车辆。在这种场景中,与呼叫方的交互可能是危险的。另外,可能通过禁止车辆驾驶员在驾驶车辆的同时物理地与这种系统进行交互的法律。
除了安全问题,诸如图1所示的经由电信网络与呼叫方的交互,可能对其注意力聚焦于其他任务的呼叫方造成不便。例如,呼叫方可能想要在执行另一任务,诸如驾驶车辆的同时导航自动化菜单。在这些场景中,收听被呼叫方提供的语音提示和/或响应于这些提示来按压键区上的键,例如来导航自动化菜单从而与在场代理通话,可能给呼叫者带来烦恼和不适。
为了解决上述问题,可以提供包括语音到DTMF转换器的呼叫管理器来拦截和管理呼叫方通过电信网络与通信伙伴的交互。例如,语音到DTMF转换器可以将语音命令转换成相应的DTMF音调来代表呼叫方将其发送给被呼叫方。
呼叫管理器可以通过各种不同的配置来管理呼叫方与被呼叫方的交互。在某些实施例中,呼叫管理器可以在客户机侧被实现为诸如电话设备的组件,例如蜂窝电话的组件,或者被实现为机载车辆信息娱乐系统的组件,或者被实现为与电话协作的相似设备。
例如,图2A示出呼叫方20与被呼叫方22的示例交互,该示例交互由在客户机侧实现的包括语音到DTMF转换器25的呼叫管理器24管理。如27所指示的,呼叫管理器可以是电话设备23的组件,例如蜂窝电话的组件。在其他示例中,呼叫管理器可以是被配置为与电话设备23协作的机载车辆信息娱乐系统或类似设备的组件。例如,呼叫管理器24可以包括语音用户界面(VUI)应用程序,例如,可以由电话设备23、机载车辆信息娱乐系统、和/或另一合适的设备执行的语音邮件检索应用程序。
在某些示例中,呼叫方20可以伴随着将语音输入26提供给呼叫管理器24来发起到被呼叫方22的呼叫。该语音输入可以包括例如呼叫管理器中包括的语音识别(SR)系统所识别的关键词或短语。呼叫管理器可以代表呼叫方将DTMF音调、合成语音响应等发送给被呼叫方22来管理交互。
例如,呼叫管理器的语音到DTMF转换器25可以使用SR引擎来识别语音流中的语音模式并将所识别的语音模式转换成多个DTMF音调。语音到DTMF转换器可以包括,例如,存储在语音到DTMF转换器的数据保存子系统上的语音模式到相关联的DTMF音调的映射。这种映射可以包括与相应的DTMF音调相关联的预设关键词或关键短语。
呼叫管理器可以被配置为确认由电话设备的用户定义的宏语音命令。宏语音命令可以包括由电话设备的用户分配到多个DTMF音调的关键词或短语。例如,电话设备的用户可以将语音模式“我的PIN”与对应于多位PIN码的DTMF音调序列相关联。
例如,呼叫方可以说“按3”,语音到DTMF转换器将其转换成DTMF音调3并输出给被呼叫方。作为另一示例,呼叫方可以说“我的PIN”,它被转换成多个DTMF音调并输出给被呼叫方。以此方式,呼叫方可以使用一个或多个语音命令来与自动化服务交互,进而释放呼叫方的手、眼睛和注意力并降低了语音识别差错。
在某些实施例中,呼叫管理器可以在服务器侧被实现为例如电信网络中的节点。在这些实施例中,呼叫方可以使用电话设备,例如蜂窝电话来联系呼叫管理器。呼叫管理器随后可以代表呼叫方发起到被呼叫方的呼叫并管理交互。例如,图2B示出呼叫方30与被呼叫方32的示例交互,该示例交互由在服务器侧位于电信网络上的(例如,远程DTMF转换服务)、包括语音到DTMF转换器35的呼叫管理器34管理。例如,电信网络可以包括多个不同的节点,其中多个不同的节点包括呼叫方、呼叫管理器和被呼叫方。
在该示例中,呼叫方30发起到呼叫管理器34的呼叫。呼叫管理器34随后可以代表呼叫方发起到被呼叫方32的呼叫并管理交互。例如,呼叫方可以经由语音输入36来将语音命令输入到电话设备33中。电话设备33可以通过电信网络经由语音流37将语音输入36发送给呼叫管理器34。呼叫管理器中的语音到DTMF转换器35可以使用SR引擎来识别语音流中的语音模式,并将所识别的语音模式转换成相应的DTMF音调并将其发送给被呼叫方。
在某些示例中,呼叫管理器可以协助呼叫方在自动化菜单中导航,例如,来与在场代理通话。例如,响应于呼叫方的语音命令,呼叫管理器可以对由被呼叫方提供给呼叫方的音频信号静音,同时监视被呼叫方所提供的音频信号来标识输入提示。响应于所标识的提示,呼叫管理器可以在无需来自呼叫方的进一步输入的情况下自动地发送合适的合成响应或DTMF音调,以自动地通过菜单继续前进以联系上在场代理或实现另一所需结果。另外,在已经联系上在场代理或已经实现另一所需结果的情况下,呼叫管理器可以通知呼叫方。以此方式,呼叫者可以在不经常监视电话呼叫、不手动按压按钮或甚至不持续给出语音命令的情况下通过自动化菜单来联系上在场代理。
图3-5示出用于管理呼叫方通过电信网络与被呼叫方的交互的各种示例方法。
在图3的302,方法300包括自动地确定通信伙伴是否期待DTMF输入。自动地确定通信伙伴是否期待DTMF输入可以包括确定通信伙伴是否是自动化服务,并且如果是,则确定该自动化服务是否期待DTMF输入。自动地确定通信伙伴是否期待DTMF输入还可以包括确定通信伙伴是否是在场代理。
在某些示例中,自动地确定通信伙伴是否期待DTMF输入可以基于呼叫方的语音输入。例如,呼叫方提供的语音中的延时可以指示呼叫方被设为输入数据来发送给被呼叫方。在其他示例中,呼叫方可以使用一个或多个语音命令或用户界面来指示通信伙伴期待DTMF输入。
在其他示例中,自动地确定通信伙伴是否期待DTMF输入或是否是在场代理可以包括使用语音识别系统来监视来自通信伙伴的可听提示来识别一个或多个关键短语。例如,可以使用SR引擎来监视来自通信伙伴的可听信号。可以将所识别的语音发送给语音分类器来确定通信伙伴是否期待DTMF输入。语音分类器可以提供例如由SR引擎所标识的短语的内容的统计分析。例如,可以使用诸如“当你完成时按#”的短语来标识通信伙伴是否期待DTMF输入。在某些示例中,SR引擎可以是可被包括在车辆机载的信息娱乐系统内或蜂窝电话中的语音到DTMF转换器的子系统。在其他示例中,SR引擎可以是电信网络中的语音到DTMF转换器节点的子系统。
在某些示例中,自动地确定通信伙伴是否是在场代理可以基于来自通信伙伴的可听信号的音频水平的变化。例如,自动化服务的音频水平可以与在场代理的音频水平不同。作为另一示例,当通信伙伴期待DTMF输入时,音频水平可以降低。
在另一些示例中,自动地确定通信伙伴是否是在场代理可以包括将一个或多个查询发送给通信伙伴。例如,可以合成诸如“喂?”等的人工查询并将其发送给通信伙伴并监视响应来标识在场代理是否在场。在某些示例中,监视对人工查询的响应可以包括标识来自通信伙伴的可听信号的音频水平的变化。例如,当在场代理在线时,音量和/或噪声水平可能提高。在其他示例中,监视对人工查询的响应可以包括将通信伙伴提供的音频信号发送给SR引擎来确定通信伙伴是否提供了对人工查询的一个或多个合适的响应。例如,诸如“你在吗?”等的人工查询可能具有“是。”的合适响应。
另外,自动地确定通信伙伴是否期待DTMF输入可以基于被呼叫方的位置处的电话号码和/或一天中的时间。例如,可能已知某些号码在一天中的某些时段提供自动化服务。可以将被呼叫方号码的数据库连同关于被呼叫方是否期待DTMF输入的信息一起存储在呼叫管理器的数据保存子系统中。该数据库可以是预设的或者逐呼叫地创建。例如,如果呼叫方呼叫被标识为期待DTMF输入的被呼叫方,则可以将被呼叫方的电话号码存储在数据库中以便将来呼叫。该数据库可以是为特定呼叫方而维护的用户专用数据库,或者是由多个不同的呼叫方使用的共享数据库。在其他示例中,用户可以在地址薄中指定哪些号码是自动化的,所述地址簿被存储在呼叫管理器的数据保存子系统上或用来进行呼叫的电话设备上。
在304,如果通信伙伴不期待DTMF输入,则方法300行进至306。在306,方法300包括避免将语音输入转换成一个或多个DTMF音调。避免将语音输入转换成一个或多个DTMF音调可以包括避免将例如宏语音命令的预设语音命令转换成DTMF音调;例如,在在场通信伙伴应答电话或者当被呼叫方接受语音输入时。
然而,在304,如果通信伙伴期待DTMF输入,则方法300行进至308。在308,方法300包括将语音输入转换成一个或多个DTMF音调。如上所述,将语音输入转换成一个或多个DTMF音调可以包括用SR引擎来监视来自呼叫方的语音流,识别语音流中的关键词或短语,并通过查询映射来将所识别的关键词或短语转换成相应的DTMF音调,所述映射诸如存储在语音到DTMF转换器的数据保存子系统中的映射。
在310,方法300包括将一个或多个DTMF音调传递给通信伙伴。例如,语音到DTMF转换器可以代表呼叫方通过电信网络将音调发送给被呼叫方。
图4示出用于管理呼叫方通过电信网络与通信伙伴的交互的另一示例方法400。
在402,方法400包括自动地确定通信伙伴是否期待DTMF输入。如上参考图3所述,自动地确定通信伙伴是否期待DTMF输入可以基于通过电信网络发送的信息,包括呼叫方的语音输入、音频流中的关键词或短语的识别、音频流中的音频水平的变化、对被呼叫方所发送的查询的响应,等等。
在404,如果通信伙伴不期待DTMF输入,则方法400结束。否则,在404,如果通信伙伴期待DTMF输入,则方法400行进至406。
在406,方法400包括自动地通过菜单继续前进。在某些示例中,自动地通过菜单继续前进可以包括自动地通过菜单继续前进来联系上在场代理。自动地通过菜单继续前进来联系上在场代理可以包括使用SR引擎来识别由被呼叫方说出的关键词或短语。在标识了关键词和短语的情况下,呼叫管理器可以向被呼叫方提供合适的响应来联系上在场代理。要联系上在场代理而对被呼叫方作出的响应可以包括DTMF音调,例如,要与在场代理通话的DTMF音调0、合成语音响应等等。
在其他示例中,自动地通过菜单继续前进来联系上在场代理可以包括向被呼叫方发送查询并且监视来自被呼叫方的音频信号来标识何时联系上在场代理。如上所述,监视对人工查询的响应可以包括,标识来自通信伙伴的可听信号中的音频水平的变化,或者将通信伙伴提供的音频信号发送给SR引擎来确定通信伙伴是否提供了对人工查询的一个或多个合适的响应。
在另外一些示例中,自动地通过菜单继续前进可以包括代表呼叫方自动地在菜单中导航来到达目的地。例如,呼叫方可能希望通过呼叫自动化服务,例如银行提供的自动化服务来检索或提供信息,例如检查帐户信息。在该示例中,可以自动地遍历通信伙伴提供的自动化菜单来检索或提供信息。
代表呼叫方自动地在菜单中导航来到达目的地可以包括使用SR引擎来识别由被呼叫方说出的关键词或短语。在标识了关键词和短语的情况下,呼叫管理器可以向被呼叫方提供合适的响应来导航菜单以到达目的地。用于导航菜单来到达目的地的对被呼叫方的响应可以包括DTMF音调、合成语音响应等等。
在408,方法400包括对由被呼叫方提供给呼叫方的音频信号静音,同时通过菜单继续前进。例如,呼叫管理器可以在对提供给呼叫方的音频信号静音的同时,继续监视被呼叫方提供的提示并对其作出响应。以此方式,可以减少对呼叫方的分心,同时遍历自动化菜单,例如直到联系上在场代理。
在410,方法400包括在遍历了自动化菜单时,例如在联系上在场代理或目的地时,通知呼叫方。例如,在遍历了自动化菜单时通知呼叫方可以包括:解除对由被呼叫方提供给呼叫方的音频信号的静音和/或向呼叫方提供通知声来警告呼叫方已经联系上在场代理,所述通知声例如,响铃、蜂鸣、和/或合成语音警告。
在某些示例中,自动地在菜单中导航以到达目的地可以响应于被呼叫方提供的一个或多个语音命令来执行。例如,呼叫方可以提供语音命令“检查帐户信息”。呼叫管理器可以例如通过使用SR引擎来识别语音命令。响应于识别该语音命令,呼叫管理器可以对提供给呼叫方的音频静音并发起到被呼叫方,例如银行的呼叫。呼叫管理器随后可以识别被呼叫方提供的菜单提示并提供对所识别的菜单提示的合适响应。例如,呼叫管理器可以向被呼叫方提供DTMF音调、合成语音响应等等来导航自动化菜单以到达菜单目的地。在到达菜单目的地时,呼叫管理器可以解除对提供给呼叫方的音频的静音,例如来将检查帐户信息提供给呼叫方。
在某些示例中,自动地在菜单中导航以到达目的地可以基于从先前到自动化服务的呼叫中获得的训练数据。例如,当呼叫方向呼叫管理器提供语音命令,例如“检查帐户信息”时,呼叫管理器可以基于先前的呼叫,例如先前的用于获得银行帐户信息的呼叫来导航自动化服务。例如,提供检查帐户信息的自动化服务可以包括包含诸如“英语或西班牙语”、“输入PIN码”和“帐户信息”等提示的菜单。呼叫管理器可以采用SR引擎,基于来自先前到自动化服务的训练集来识别一组关键词。
在某些示例中,呼叫管理器可以采用模糊搜索算法,在遍历菜单来到达菜单目的地的同时来确定要选择哪些菜单选项。在每一所标识的菜单提示处,呼叫管理器可以输出一个或多个DTMF音调来遍历菜单。在某些示例中,呼叫管理器可以探索整个自动化菜单来找到所需菜单选项。在该示例中,如果在自动化菜单中未找到所需菜单选项,则呼叫管理器可以遍历菜单来联系上在场代理并通知呼叫方。一旦联系上在场代理,呼叫管理器可以解除对提供给呼叫方的音频的静音,并通知呼叫方已经联系上在场代理。
图5示出用于管理使用宏语音命令的、通过电信网络的交互的方法500的示例实施例。
在502,方法500包括将宏语音命令映射到多个DTMF音调。如上所述,宏语音命令可以包括由呼叫方所使用的电话设备的用户分配到多个DTMF音调的关键词或短语,例如,作为存储在电话服务器的数据保存子系统上的映射。以此方式,可以出于安全起见对宏语音命令编码并可以降低SR引擎的识别差错。
在某些示例中,将宏语音命令映射到多个DTMF音调可以响应于用户的提示而发生。例如,用户的提示可以包括用户与用户界面的交互,所述用户界面由呼叫管理器提供或与呼叫管理器通信。用户界面可以接受语音和/或触摸输入,例如,用户界面可以是VUI或图形用户界面(GUI)。在某些示例中,用户可以通过经由语音或触摸来输入原始关键词或短语以及相应的DTMF音调序列,来将宏语音命令映射到多个DTMF音调。在其他示例中,用户可以从由界面呈现的预设列表中选择关键词或短语,随后经由语音或触摸来输入相应的DTMF序列。应该理解,可以向宏语音命令分配任意数量的音调。另外,宏语音命令可以包括设定的持续时间的暂停或可由SR引擎识别的其他音频信息。
在504,方法500包括标识呼叫方的语音流中的宏语音命令。标识呼叫方的语音流中的宏语音命令可以包括使用SR引擎来监视呼叫方的语音流并识别语音流中的宏语音命令。
在506,方法500包括输出多个DTMF音调。例如,该多个DTMF音调可以通过电信网络由呼叫管理器中的语音到DTMF转换器来输出给被呼叫方。在506输出多个DTMF音调还可以包括如上所述地导航自动化菜单来到达菜单目的地。例如,除了DTMF音调之外,呼叫管理器可以输出合成语音响应、静音、和/或人工查询来导航自动化菜单以到达目的地。
在一些实施例中,可将上述方法和过程绑定到计算系统。作为示例,图6示意性地示出可执行上述方法和过程中的一个或多个的呼叫管理器600。呼叫管理器600包括逻辑子系统602和数据保存子系统604。呼叫管理器600可任选地包括显示子系统和/或图6中未示出的其他组件。
如上所述,呼叫管理器600可以通过各种不同的配置来管理呼叫方与被呼叫方的交互。例如,呼叫管理器转换器可以被包括在车辆机载的信息娱乐系统内或蜂窝电话中,例如,作为语音用户界面(VUI)应用程序。在其他示例中,呼叫管理器可以是电信网络中的节点,例如,用作各种不同类型的通信设备可以利用的远程服务。
逻辑子系统602可包括被配置成执行一个或多个指令的一个或多个物理设备。例如,逻辑子系统可被配置成执行一个或多个指令,该一个或多个指令是一个或多个程序、例程、对象、组件、数据结构或其它逻辑构造的一部分。可实现此类指令以执行任务、实现数据类型、变换一个或多个设备的状态、或以其它方式得到所需结果。逻辑子系统可包括被配置成执行软件指令的一个或多个处理器。另外或另选的,逻辑子系统可包括被配置成执行硬件或固件指令的一个或多个硬件或固件逻辑机器。逻辑子系统可任选地包括分布在两个或多个设备上的独立组件,这些独立组件在某些实施例中可远程放置。
数据保存子系统604可包括一个或多个物理的、非临时性的设备,该一个或多个设备被配置成保持可由逻辑子系统执行以实现此处所述的方法和过程的数据和/或指令。在实现了此类方法和过程时,可变换数据保持子系统604的状态(例如,以保存不同数据)。数据保存子系统604可包括可移动介质和/或内建设备。数据保存子系统604可包括光学存储器设备、半导体存储器设备、和/或磁存储器设备等。数据保存子系统604可包括具有以下特性中的一个或多个的设备:易失性、非易失性、动态、静态、读/写、只读、随机存取、顺序存取、位置可寻址、文件可寻址、以及内容可寻址。在某些实施例中,可将逻辑子系统602和数据保存子系统604集成到一个或多个常见设备中,如专用集成电路或片上系统。
图6还示出使用计算机可读可移动介质616形式的数据保存子系统的一方面,该方面可用于存储和/或传送可执行以实现此处所述的方法和过程的数据和/或指令。
术语“模块”和“引擎”可用于描述被实现以执行一个或多个特定功能的呼叫管理器600的一个方面。在某些情况下,可经由逻辑子系统602通过执行由数据保存子系统604保存的指令来实例化此类模块或引擎。应该理解,可从相同应用程序、代码块、对象、例程、和/或功能实例化不同模块和/或引擎。同样,在某些情况下,可通过不同应用程序、代码块、对象、例程、和/或功能来实例化相同模块和/或引擎。
呼叫管理器600包括语音到DTMF转换器605。语音到DTMF转换器包括被配置为监视音频流并识别音频流中的语音模式的语音识别子系统608。语音识别子系统608可以包括被配置为标识语音和分类所标识的语音的各种模块。例如,语音识别子系统608可以包括提供所识别的语音模式的统计分析的语音分类器模块。语音识别子系统608还可以解析所识别的语音模式来标识已经在存储在数据保存子系统604中的映射中被分配到DTMF音调的关键词或短语。例如,宏语音命令可由用户经由用户界面来分配,并且被存储在数据保存子系统上的映射中。DTMF音调可以由DTMF生成设备610生成,该DTMF生成设备610可以将DTMF音调发送给被呼叫方。
应该理解,此处所述的配置和/或方法在本质上示例性的,且这些具体实施例或示例不是局限性的,因为多个变体是可能。此处所述的具体例程或方法可表示任何数量的处理策略中的一个或多个。由此,所示出的各个动作可以按所示顺序执行、按其他顺序执行、并行地执行、或者在某些情况下省略。同样,可以改变上述过程的次序。
本发明的主题包括各种过程、系统和配置的所有新颖和非显而易见的组合和子组合、和此处所公开的其它特征、功能、动作、和/或特性、以及其任何和全部等效物。
Claims (14)
1.一种用于管理呼叫方通过电信网络与通信伙伴的交互的方法,包括:
分析呼叫方到通信伙伴的交互的音频信号,所述交互由所述呼叫方发起并且定向到所述通信伙伴;
基于所述音频信号自动地确定所述通信伙伴是否期待DTMF输入;
如果所述通信伙伴期待DTMF输入,监视由通信伙伴提供的音频信号以标识输入提示,针对每一个所标识的输入提示,响应于所标识的输入提示将一个或多个DTMF音调传递给所述通信伙伴,为每一所标识的输入提示选择所述一个或多个DTMF音调
以通过由所述通信伙伴提供的自动菜单自动继续前进来联系上所述通信伙伴的在场代理而无需来自所述呼叫方的进一步输入。
2.如权利要求1所述的方法,其特征在于,自动地确定通信伙伴是否期待DTMF输入是基于所述呼叫方的语音输入。
3.如权利要求1所述的方法,其特征在于,自动地确定通信伙伴是否期待DTMF输入包括:使用语音识别系统来监视来自所述通信伙伴的可听信号以识别一个或多个关键短语。
4.如权利要求1所述的方法,其特征在于,自动地确定通信伙伴是否期待DTMF输入是基于来自所述通信伙伴的可听信号中的音频水平的变化。
5.如权利要求1所述的方法,其特征在于,自动地确定通信伙伴是否期待DTMF输入包括向所述通信伙伴发送查询。
6.如权利要求1所述的方法,其特征在于,还包括,如果所述通信伙伴不期待DTMF输入,则避免将语音输入转换成一个或多个DTMF音调。
7.如权利要求1所述的方法,其特征在于,还包括,对到所述呼叫方的音频信号静音,同时通过菜单继续前进来联系上在场代理。
8.如权利要求1所述的方法,其特征在于,还包括,在联系上在场代理时通知所述呼叫方。
9.一种呼叫管理方法,包括:
接收经由电信网络从远程呼叫方定向到远程被呼叫方的语音流;
识别来自所述语音流的语音输入;
将所识别的语音输入转换成一个或多个DTMF音调;
经由电信网络将所述一个或多个DTMF音调发送给所述远程被呼叫方;
监视由所述远程被呼叫方提供的音频信号以标识输入提示,以及
针对每一个所标识的输入提示,响应于所标识的输入提示将一个或多个所选择的DTMF音调传递给所述远程被呼叫方,为每一所标识的输入提示选择所述一个或多个DTMF音调以通过由所述远程被呼叫方提供的自动菜单自动继续前进来联系上所述远程被呼叫方的在场代理而无需来自所述远程呼叫方的进一步输入。
10.如权利要求9所述的方法,其特征在于,还包括确定所述被呼叫方是否期待DTMF输入。
11.如权利要求10所述的方法,其特征在于,还包括在所述被呼叫方不期待DTMF输入的情况下避免将语音输入转换成一个或多个DTMF音调。
12.如权利要求10所述的方法,其特征在于,还包括在所述被呼叫方期待DTMF输入的情况下通过菜单继续前进来联系上在场代理。
13.如权利要求12所述的方法,其特征在于,还包括对到所述呼叫方的音频信号静音的同时通过菜单继续前进来联系上在场代理。
14.一种呼叫管理系统,包括:
用于接收经由电信网络从远程呼叫方定向到远程被呼叫方的语音流的装置;
用于识别来自所述语音流的语音输入的装置;
用于将所识别的语音输入转换成一个或多个DTMF音调的装置;
用于经由电信网络将所述一个或多个DTMF音调发送给所述远程被呼叫方的装置;
用于监视由所述远程被呼叫方提供的音频信号以标识输入提示的装置,以及
用于针对每一个所标识的输入提示,响应于所标识的输入提示将一个或多个所选择的DTMF音调传递给所述远程被呼叫方,为每一所标识的输入提示选择所述一个或多个DTMF音调以通过由所述远程被呼叫方提供的自动菜单自动继续前进来联系上所述远程被呼叫方的在场代理而无需来自所述远程呼叫方的进一步输入的装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/749,333 US8990071B2 (en) | 2010-03-29 | 2010-03-29 | Telephony service interaction management |
US12/749,333 | 2010-03-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102209143A CN102209143A (zh) | 2011-10-05 |
CN102209143B true CN102209143B (zh) | 2015-08-05 |
Family
ID=44657383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110084918.5A Active CN102209143B (zh) | 2010-03-29 | 2011-03-28 | 电话服务交互管理 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8990071B2 (zh) |
CN (1) | CN102209143B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9002717B2 (en) | 2010-12-03 | 2015-04-07 | At&T Intellectual Property I, L.P. | Method and apparatus for audio communication of information |
US9953643B2 (en) * | 2010-12-23 | 2018-04-24 | Lenovo (Singapore) Pte. Ltd. | Selective transmission of voice data |
US9361878B2 (en) * | 2012-03-30 | 2016-06-07 | Michael Boukadakis | Computer-readable medium, system and method of providing domain-specific information |
US10255914B2 (en) | 2012-03-30 | 2019-04-09 | Michael Boukadakis | Digital concierge and method |
CN104065791A (zh) * | 2013-03-18 | 2014-09-24 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
US10051115B2 (en) * | 2013-05-01 | 2018-08-14 | Thomson Licensing | Call initiation by voice command |
CN103401976A (zh) * | 2013-06-17 | 2013-11-20 | 广东欧珀移动通信有限公司 | 一种基于语音助手的人工服务热线用语音输入方法 |
US9596437B2 (en) | 2013-08-21 | 2017-03-14 | Microsoft Technology Licensing, Llc | Audio focusing via multiple microphones |
US20150264175A1 (en) * | 2014-03-14 | 2015-09-17 | Lenovo (Singapore) Pte, Ltd. | Interactive voice response system speech recognition proxy |
CN105334997A (zh) * | 2014-08-12 | 2016-02-17 | 扬智科技股份有限公司 | 智能输入装置及其设定方法与控制方法 |
CN104301522A (zh) * | 2014-09-19 | 2015-01-21 | 联想(北京)有限公司 | 通讯中的信息输入方法及通讯终端 |
CN105592211A (zh) * | 2014-10-24 | 2016-05-18 | 中兴通讯股份有限公司 | 双音多频dtmf的拨号方法及装置 |
EP3454535B1 (en) | 2016-05-20 | 2021-10-20 | Huawei Technologies Co., Ltd. | Method and device for interaction in call |
KR102110015B1 (ko) * | 2017-10-26 | 2020-05-13 | 박상래 | 디지털 무전기 기능을 갖는 스마트워치 |
US10958775B2 (en) * | 2018-12-10 | 2021-03-23 | Mitel Networks Corporation | Speech to dual-tone multifrequency system and method |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6628772B1 (en) * | 1994-04-28 | 2003-09-30 | Metro One Telecommunications, Inc. | Method for providing enhanced directory assistance upon command using out-of-band signaling |
US5867562A (en) * | 1996-04-17 | 1999-02-02 | Scherer; Gordon F. | Call processing system with call screening |
US7483670B2 (en) * | 1996-05-09 | 2009-01-27 | Walker Digital, Llc | Method and apparatus for educational testing |
US6604075B1 (en) * | 1999-05-20 | 2003-08-05 | Lucent Technologies Inc. | Web-based voice dialog interface |
GB2352933A (en) * | 1999-07-31 | 2001-02-07 | Ibm | Speech encoding in a client server system |
US6370506B1 (en) | 1999-10-04 | 2002-04-09 | Ericsson Inc. | Communication devices, methods, and computer program products for transmitting information using voice activated signaling to perform in-call functions |
US6493670B1 (en) | 1999-10-14 | 2002-12-10 | Ericsson Inc. | Method and apparatus for transmitting DTMF signals employing local speech recognition |
US6778653B1 (en) * | 1999-11-09 | 2004-08-17 | Nortel Networks Limited | Storing information about a telephony session |
US6868142B2 (en) * | 2001-01-10 | 2005-03-15 | At&T Corp. | Voice-operated interface for DTMF-controlled systems |
US7177402B2 (en) * | 2001-03-01 | 2007-02-13 | Applied Voice & Speech Technologies, Inc. | Voice-activated interactive multimedia information processing system |
US7027990B2 (en) * | 2001-10-12 | 2006-04-11 | Lester Sussman | System and method for integrating the visual display of text menus for interactive voice response systems |
US7292680B1 (en) * | 2002-03-21 | 2007-11-06 | At&T Bls Intellectual Property, Inc. | Automated passcode recovery in an interactive voice response system |
US7920546B2 (en) * | 2002-10-01 | 2011-04-05 | Nortel Networks Limited | Automated attendant multimedia session |
US7184523B2 (en) * | 2002-10-31 | 2007-02-27 | Comverse, Inc. | Voice message based applets |
US20040230637A1 (en) * | 2003-04-29 | 2004-11-18 | Microsoft Corporation | Application controls for speech enabled recognition |
US8140980B2 (en) * | 2003-08-05 | 2012-03-20 | Verizon Business Global Llc | Method and system for providing conferencing services |
US7317789B2 (en) * | 2004-01-07 | 2008-01-08 | International Business Machines Corporation | Method and apparatus for automatic telephone menu navigation |
US20050154621A1 (en) * | 2004-01-09 | 2005-07-14 | Birkhead Mark W. | Voice enabled interactive travel information conversion system |
US7366535B2 (en) * | 2004-04-21 | 2008-04-29 | Nokia Corporation | Push-to-talk mobile communication terminals |
US7471776B2 (en) * | 2004-05-26 | 2008-12-30 | Symbol Technologies, Inc. | System and method for communication with an interactive voice response system |
KR20060057425A (ko) | 2004-11-23 | 2006-05-26 | 엘지전자 주식회사 | 음성신호를 이용한 디티엠에프톤 송신 기능을 갖는이동통신 단말기 및 그 방법 |
JP2006333057A (ja) * | 2005-05-26 | 2006-12-07 | Nec Corp | ボイスチェンジャ付電話機およびその制御方法並びに制御プログラム |
US8065146B2 (en) * | 2006-07-12 | 2011-11-22 | Microsoft Corporation | Detecting an answering machine using speech recognition |
US20090147937A1 (en) * | 2007-10-23 | 2009-06-11 | Infosys Technologies Ltd. | System and method for personalized call treatment by using a combination of communication and data services |
US8204180B1 (en) * | 2008-08-08 | 2012-06-19 | Intervoice Limited Partnership | Systems and methods for preventing sensitive information from being communicated into a non-secure environment |
US20100238842A1 (en) * | 2009-03-19 | 2010-09-23 | Microsoft Corporation | Phone conferencing architecture with optimized services management |
US8340969B2 (en) * | 2009-04-24 | 2012-12-25 | Research In Motion Limited | Method and mobile communication device for generating dual-tone multi-frequency (DTMF) commands on a mobile communication device having a touchscreen |
-
2010
- 2010-03-29 US US12/749,333 patent/US8990071B2/en active Active
-
2011
- 2011-03-28 CN CN201110084918.5A patent/CN102209143B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
US20110238414A1 (en) | 2011-09-29 |
CN102209143A (zh) | 2011-10-05 |
US8990071B2 (en) | 2015-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102209143B (zh) | 电话服务交互管理 | |
KR102223017B1 (ko) | 공유된 음성 작동 디바이스상의 호출 핸들링 | |
US6629071B1 (en) | Speech recognition system | |
CN108932946B (zh) | 客需服务的语音交互方法和装置 | |
US8238525B2 (en) | Voice recognition server, telephone equipment, voice recognition system, and voice recognition method | |
US20180007196A1 (en) | System and Method for Spoken Caller Identification in a Cellular Telephone Headset | |
CN101183976B (zh) | 实现告警远程通知和告警远程查询的方法、装置及系统 | |
US11762629B2 (en) | System and method for providing a response to a user query using a visual assistant | |
JP2000013510A (ja) | 自動コ―ル及びデ―タ転送処理システム、並びに自動コ―ル又はメッセ―ジ・デ―タ処理を提供する方法 | |
CN103078995A (zh) | 一种在移动终端使用的可定制的个性化应答方法和系统 | |
CN109842712B (zh) | 通话记录生成的方法、装置、计算机设备和存储介质 | |
US20150229756A1 (en) | Device and method for authenticating a user of a voice user interface and selectively managing incoming communications | |
CN103873706A (zh) | 动态智能语音识别ivr服务系统 | |
CN108682421A (zh) | 一种语音识别方法、终端设备及计算机可读存储介质 | |
CN113705943B (zh) | 基于语音对讲功能的任务管理方法、系统与移动装置 | |
US10062386B1 (en) | Signaling voice-controlled devices | |
CN111048091B (zh) | 一种语音识别方法、设备及计算机可读存储介质 | |
US20050069122A1 (en) | System and method for operator assisted automated call handling | |
CN104052883A (zh) | 一种获取菜单信息的方法、设备和系统 | |
CN104732982A (zh) | 交互式语音应答业务中的语音识别方法及装置 | |
KR101399581B1 (ko) | 텔러 참여에 의한 자동 응답 시스템, 방법 및 컴퓨터 판독 가능한 기록 매체 | |
CN100539622C (zh) | 具有集成的tcap和isup接口的语音浏览器 | |
JP2009005350A (ja) | 音声メール・システムを操作する方法。 | |
US10038780B2 (en) | System for switching and outputting sender-controlled incoming ringtone and method therefor | |
CN101588418B (zh) | 用于处理多个流式语音信号的方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: MICROSOFT TECHNOLOGY LICENSING LLC Free format text: FORMER OWNER: MICROSOFT CORP. Effective date: 20150724 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20150724 Address after: Washington State Patentee after: Micro soft technique license Co., Ltd Address before: Washington State Patentee before: Microsoft Corp. |