CN1636384B - 进行带可选语音到文本转换的电话会议的方法和系统 - Google Patents

进行带可选语音到文本转换的电话会议的方法和系统 Download PDF

Info

Publication number
CN1636384B
CN1636384B CN038041979A CN03804197A CN1636384B CN 1636384 B CN1636384 B CN 1636384B CN 038041979 A CN038041979 A CN 038041979A CN 03804197 A CN03804197 A CN 03804197A CN 1636384 B CN1636384 B CN 1636384B
Authority
CN
China
Prior art keywords
text
indication
request
particular participant
participant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN038041979A
Other languages
English (en)
Other versions
CN1636384A (zh
Inventor
尚塔努·萨卡尔
拉比士·帕特尔
什穆埃尔·谢弗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cisco Technology Inc
Original Assignee
Cisco Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cisco Technology Inc filed Critical Cisco Technology Inc
Publication of CN1636384A publication Critical patent/CN1636384A/zh
Application granted granted Critical
Publication of CN1636384B publication Critical patent/CN1636384B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42221Conversation recording systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/567Multimedia conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/38Displays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/60Medium conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/20Aspects of automatic or semi-automatic exchanges related to features of supplementary services
    • H04M2203/2061Language aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • H04M2203/609Secret communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/12Arrangements for interconnection between switching centres for working between exchanges having different types of switching equipment, e.g. power-driven and step by step or decimal and non-decimal
    • H04M7/1205Arrangements for interconnection between switching centres for working between exchanges having different types of switching equipment, e.g. power-driven and step by step or decimal and non-decimal where the types of switching equipement comprises PSTN/ISDN equipment and switching equipment of networks other than PSTN/ISDN, e.g. Internet Protocol networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

根据本发明的一个实施例,提供了一种用于在两个或多个参与者(16)之间进行电话会议的方法。该方法包括从参与者(16)接收文本请求的指示。该方法还包括响应于所述指示,将所述电话会议的其他参与者的任何语音转换成文本。所述方法还包括将所述文本发送到与请求文本的所述参与者相关联的设备。所述设备可操作来显示所述文本。

Description

进行带可选语音到文本转换的电话会议的方法和系统
技术领域
本发明一般地涉及通信,更具体而言,涉及用于进行电话会议的方法和系统。
背景技术
现代商业实践常常需要若干人在电话上接触来参加电话会议。电话会议已引入了某些应用和技术,其优于会议中人们物理上位于相同位置的情形。例如,当时并未积极参与的电话会议参与者可能希望减弱音频输出,而仅仅收听电话会议。这种灵活性允许特定参与者在关注另一事务的同时,例如在与另一方谈话时,有选择地参与该电话会议。
但是,在进行次要任务的同时,尤其是进行需要听或说的那些任务时,在实际监视电话会议中仍然有很大的障碍。例如,减弱音频输出并收听电话会议的参与者在与第二方谈话或收听该电话会议中可能有困难。
发明内容
根据本发明的一个实施例,提供了一种在两个或更多参与者之间进行电话会议的方法。该方法包括从参与者接收文本请求的指示。该方法还包括响应于所述指示,将所述电话会议的其他参与者的任何语音转换成文本。所述方法还包括将所述文本发送到与请求文本的所述参与者相关联的设备。所述设备可操作来显示所述文本。
根据本发明一个实施例,提供了一种在两个或多个参与者之间进行电话会议的系统,包括:用于建立两个或更多个参与者之间的电话会议的装置;用于在所述电话会议期间从所述两个或更多个参与者中的一个特定参与者接收文本请求的指示的装置;用于响应于来自所述特定参与者的所述指示,将所述电话会议的其他参与者的任何语音转换成文本的装置;以及用于将所述文本发送到与从其接收到所述文本请求的指示的所述特定参与者相关联的设备的装置,所述设备可操作来显示所述文本。
该系统还可包括用于将所述电话会议的各参与者的身份发送到所述设备的装置,其中所述身份与关联到各参与者的所述语音的所述文本相关联。
该系统还可包括用于加密所述文本的装置。
该系统还可包括用于将与所述文本相对应的所述语音发送到所述设备的装置。
在该系统中,所述文本可包括时间戳,所述时间戳将所述文本与对应于所述文本的所述语音关联起来。
该系统还可包括用于在所述设备处记录所述文本的装置。
在该系统中,可响应于所述特定参与者将所述电话会议置于保持而接收到所述文本请求的指示。
在该系统中,可响应于所述特定参与者减弱呼叫而接收到所述文本请求的指示。
在该系统中,文本请求的指示可包括以下指示,即在与请求文本的所述特定参与者相关联的电话上按下按钮的指示。
在该系统中,文本请求的指示可包括以下指示,即按下与请求文本的所述特定参与者相关联的软键的指示。
在该系统中,文本请求的指示可包括以下指示,即请求文本的所述特定参与者正在抑制向请求文本的所述特定参与者传输语音媒体分组的指示。
在该系统中,文本请求的指示可包括以下指示,即请求文本的所述特定参与者正在抑制从请求文本的所述特定参与者传输语音媒体分组的指示。
该系统还可包括用于将请求文本的所述特定参与者的任何语音转换成文本的装置。
该系统还可包括用于提醒请求文本的所述特定参与者所述其他参与者中的特定一个正在发言的装置。
根据本发明的一个实施例,提供了一种与多个参与者进行电话会议的系统,包括:用于建立两个或更多个参与者之间的电话会议的装置;用于确定向所述电话会议提供输入的每个参与者的身份的装置;用于在所述电话会议期间从所述两个或更多个参与者中的特定参与者接收文本请求的指示的装置;用于下述操作的装置:响应于从所述特定参与者接收到所述文本请求的指示,当各个其他参与者在发言时,将所述电话会议的所述各个其他参与者的所述身份,发送到与从其接收到所述文本请求的指示的所述特定参与者相关联的设备,所述设备可操作来显示各参与者的所述身份。
该系统还可包括用于下述操作的装置:响应于所述文本请求的指示,将所述电话会议的各个其他参与者的任何语音转换成文本,并将所述文本发送到所述设备,所述文本与各个参与者的所述身份相关联。
该系统还可包括用于加密所述文本的装置。
该系统还可包括用于将与所述文本相关联的所述语音发送到所述设备的装置。
在该系统中,文本可包括时间戳,所述时间戳将所述文本与对应于所述文本的所述语音关联起来。
该系统还可包括用于在所述设备处记录所述文本和对应于所述文本的所述语音的装置。
在该系统中,用于记录所述文本和语音的装置可包括用于在所述设备处记录所述语音和文本的装置。
在该系统中,用于记录所述文本和语音的装置可包括用于在连接到网络的中央存储单元中记录所述语音和文本的装置。
在该系统中,可响应于所述特定参与者将所述电话会议置于保持而接收到所述文本请求的指示。
在该系统中,可响应于所述特定参与者减弱呼叫而接收到所述文本请求的指示。
在该系统中,文本请求的指示可包括以下指示,即在与请求文本的所述特定参与者相关联的电话上按下按钮的指示。
在该系统中,文本请求的指示可包括以下指示,即按下与请求文本的所述特定参与者相关联的软键的指示。
在该系统中,文本请求的指示可包括以下指示,即请求文本的所述特定参与者正在抑制向请求文本的所述特定参与者传输语音媒体分组的指示。
在该系统中,文本请求的指示可包括以下指示,即请求文本的所述特定参与者正在抑制从请求文本的所述特定参与者传输语音媒体分组的指示。
该系统还可包括用于当请求文本的所述特定参与者在发言时,向所述设备发送请求文本的所述特定参与者的所述身份的装置。
本发明的一些实施例提供许多技术优点。一些实施例可从这些优点中的某些、不从这些优点或从所有这些优点受益。例如,根据一个实施例,向被动参与者提供了电话会议的文本,这允许该被动参与者在进行第二任务的同时,视觉监视电话会议。这样一种选择允许被动参与者在与第二方会谈的同时通过阅读来监视电话会议,而不是被强迫来收听多方并试图来恰当地响应。根据另一个实施例,向被动参与者提供发言者的身份,由此允许被动参与者在进行第二任务的同时有选择的参与。有选择地参与电话会议的能力,允许被动参与者更关注其他任务,这增加了被动参与者的工作效率。
本领域技术人员可以很容易确定其他技术优点。
附图说明
现在结合附图来参考以下说明,所述附图中类似的标号指示类似的元件,其中:
图1是图示可能从本发明的教导受益的通信网络的示意图;
图2是图示图1的通信网络的多个部分的示意图,所述多个部分包括根据本发明一个实施例用于进行电话会议的系统;
图3是图示根据本发明一个实施例的图2的会议桥和语音到文本引擎的示意图;和
图4是图示用于利用根据本发明一个实施例的图2的系统来进行电话会议的方法的流程图。
具体实施方式
通过参考附图中的图1至4来最好地理解本发明的实施例,类似的标号被用于各个附图中类似和相应的部分。
图1图示了可能从本发明的教导受益的通信系统12。在本实施例中,通信系统12是在源和目的端点之间传输音频、视频、语音、数据以及其他合适类型的实时和非实时流量的分布式系统;但是,传输任何形式流量的其他通信系统也可以从本发明的教导受益。通信系统12包括连接到网络14的多个通信设备16,以及通过网关20和公共交换电话网络(“PSTN”)22连接到网络14的多个模拟电话18。通信设备16、模拟电话18和网关20通过以下链路连接到网络14和/或PSTN 22:双绞线、电缆、光纤、射频、红外、微波或任何其他合适类型或组合的有线或无线链路28。
在一个实施例中,网络14是因特网、广域网(“WAN”)、局域网(“LAN”)或其他合适网络。在因特网实施例中,网络14以因特网协议(“IP”)分组来传输信息。电话语音信息以IP语音(“VoIP”)格式来传输。诸如VoIP分组之类的实时IP分组被封装在实时传输协议(“RTP”)分组中以在网络14上传输。网络14可以包括任何其他合适类型的元件和链路,在所述链路上可以使用其他协议和格式来以其它方式合适地传输流量。
通信设备16包括诸如IP电话16A(在图2中示出,在下面讨论)之类的IP或其他数字电话、诸如个人计算机16B(在图2中示出,在下面讨论)之类的个人和其他合适的计算机或计算设备、诸如个人数字助理(“PDA”)之类的电子个人组织器、或其他合适类型的通信设备。通信设备16还可以包括能够传递实时音频、视频和/或其他信息,并能够通过网络14与其他设备或设备集一起参加会议的蜂窝或其他移动电话或手机或任何其他合适的通信设备或设备集,其例子是模拟电话18和网关20的组合。通信设备16还可以包括显示文本消息的屏幕,例如IP显示器16C(在图2中示出,在下面讨论)。除了传递实体信息之外,通信设备16还与网络14传递控制信息,以控制呼叫设置、挂断和处理,以及呼叫服务。
对于语音呼叫,通信设备16包括一个或多个实时应用,这些应用在接收到流量或基本接收到流量时播放该流量。可以利用编码/解码器(“codec”,未明确示出)来将以下信号从模拟信号转换成数字形式:用户所产生的音频、视频或其他信号,例如来自用户对电话机所说的话。数字编码的数据被封装到IP或其他合适的分组,以在网络14上传输。从网络14接收到的IP分组被转换回模拟信号并对用户播放。通信设备16可以以其它方式合适地编码、解码、压缩和解压缩在网络14上传输或从网络14接收的信号。
网关20提供模拟和/或数字格式之间的转换。模拟电话18通过PSTN22向网关20传递标准电话信号。在网关20处,标准电话信号被转换成VoIP格式的IP分组。类似地,从网络14所接收的VoIP分组被转换成标准电话信号,以通过PSTN 22传送到模拟电话18。网关20还在IP网络呼叫控制系统以及在PSTN 22中使用的ISDN、T1、CAS和其他信令协议之间进行转换。
在一个实施例中,呼叫管理器30和会议桥32被连接到网络14。呼叫管理器30和会议桥32可以位于中心设备中,或者使其功能分布于网络14或其外围设备。呼叫管理器30和会议桥32通过任何合适类型的有线或无线链路28耦合到网络14。在另一个实施例中,网络14可以在没有呼叫管理器30的情况下工作,其中通信设备16可以彼此或者与其他合适的网络元件直接传递控制信息。在此实施例中,由通信设备16和/或其他合适的网络元件提供服务。
呼叫管理器30管理网络14中的呼叫。呼叫是两个或多个端点之间的任何通信会话。端点可以是人和/或诸如电话或计算机之类的设备。会话可以包括实时连接、具有实时特性的连接、非实时连接和/或连接类型的组合。
呼叫管理器30响应于来自通信设备16的服务请求,包括通过网关20来自模拟电话18的服务请求。例如,呼叫管理器30可以为通信设备16提供语音邮件、桥接、群播、呼叫保持、电话会议和其他多方通信以及/或者其他合适的服务。呼叫管理器30通过以下方式来提供服务:实际进行服务、控制服务的进行、委托服务的进行、和/或以其它方式启动服务。
会议桥32在通信设备16之间提供电话会议以及其他合适的音频、视频和/或实时多方通信会话。多方通信会话包括交换音频和/或其他合适信息的两方或多方。具体而言,会议桥32接收来自参与的通信设备16的媒体,并使用合适的信号处理技术来混和来自每个参与的通信设备16的媒体,以生成会议输出流。在正常操作期间,各通信设备16接收这样的会议输出流,其包括来自所有其他参与的通信设备16的贡献。
在一个实施例的操作中,当呼叫被置于网络14上时首先向呼叫管理器30发送呼叫启动请求。例如,呼叫启动请求可以由通信设备16和/或用于模拟电话18的网关20生成。一旦呼叫管理器30接收到该呼叫启动请求,呼叫管理器30就向想要呼叫目的设备的启动通信设备16和/或用于模拟电话18的网关20发送控制信号。如果目的设备可以接受该呼叫,则目的设备答复呼叫管理器30其将接受该呼叫。通过接收到此承诺,呼叫管理器30向目的设备传输信号使其响铃。当该呼叫被应答时,呼叫管理器30指示被呼叫的设备和发起的设备开始向彼此发送媒体流。如果发起设备是模拟电话18,那么媒体流就发生在网关20和目的设备之间。网关20随后将媒体传输到模拟电话18。
在一个实施例中,对于电话会议,呼叫管理器30基于被呼叫的号码或其他合适准则来识别参与者。参与者是电话会议所涉及的任一方。在一个实施例中,呼叫管理器30控制会议桥32来设置、处理和挂断电话会议以及其他多方通信会话。在另一个实施例中,会议桥32设置、处理和挂断电话会议以及其他多方通信会话。在多方通信会话期间,参与者被连接到会议桥32,并且使媒体通过会议桥32流动。在一个实施例中,混和媒体以生成要被传输到各参与者的会议输出流。参与者的会议输出流包括所有其他参与者的媒体、其他参与者的子集、或由参与者和/或多方会话的类型所要求的其他合适的混和。
涉及在诸如网络14之类的网络上的音频通信的传统电话会议中的任何参与者,可以选择作为该电话会议的被动参与者。被动参与者是希望部分或完全不向电话会议提供输入的任何参与者。采用这样一种选择的原因可能是要应答另一个呼叫、与同事谈话、看新闻、或可以在监视电话会议的同时进行的任何其他任务。有许多被动参与电话会议的方法。例如,被动参与者可以减弱他/她的音频输出并仅仅收听电话会议。被动参与者还可以保持该电话会议。在关注另一事务的同时监视电话会议的灵活性增加了被动参与者的工作效率。但是,某些任务难以与听觉监视电话会议同时进行。例如,正在听觉监视电话会议的被动参与者可能发现难以参与同另一方的第二谈话,因为收听两个不同方会产生混乱和理解的隔阂。在这种情况下,听觉监视电话会议、第二谈话、或者这两者的质量都可能变差。
根据本发明的教导,用于进行电话会议的方法和系统包括向被动参与者提供电话会议的基本实时的文本流。这是有益的,因为被动参与者可能发现在进行另一任务的同时,使用视觉要比使用听觉更容易监视电话会议。可以在音频信号之外或代替音频信号来提供这样的文本。根据本发明的另一个实施例,这样的文本可以被提供给也主动参与电话会议的参与者。下面结合图2至4来更详细地描述该系统和方法的示例实施例的其他细节。
图2是图示图1的通信网络的多个部分的示意图,所述多个部分包括根据本发明的一个实施例进行电话会议的系统。会议桥32有助于在IP网络14上参与电话会议的通信设备16之间的通信。可从Cisco Systems得到名为“Cisco会议连接”的会议桥32的示例。会议桥32被耦合到语音到文本引擎46。语音到文本引擎46的示例可从IBM和Microsoft得到。或者,可以使用一般提供比语音到文本引擎更有限的语法能力的自适应语音识别系统,以及将语音转换成文本的现有或还未开发的任何其他合适设备。自适应语音识别系统的一个示例可从Nuance得到。语音到文本引擎46可以是会议桥32的一个组成部分或独立于会议桥32的单独组件。通信设备16通过链路28和IP网络14被链接到会议桥32。由通信设备16传输的参与者的语音,通过链路28被发送到IP网络14上的会议桥32。会议桥32恰当地转换并混和来自各通信设备16的语音,并将所得到的会议输出流发送到各通信设备16。语音到文本引擎46内的资源可以与会议桥32同时被保存,或者在其他合适时间被保存。
当参与者希望被动地参与电话会议或希望接收文本时,参与者传输文本请求的指示。参与者可以通过例如按下通信设备16上的“保持”按钮或“减弱”按钮或其他合适按钮来做出这样的请求。或者,可以通过合适的“软按钮”或其他合适技术来做出这样的请求。在一个示例中,传输指示文本请求的“信息元素”(IE)。当通信设备16在抑制输出的语音,或者当与通信相关联的用户仅仅希望在接收或不接收音频的情况下看到文本时,可以从通信设备16传输文本请求的指示。响应于接收到指示文本请求的信息元素,会议桥32将来自通信设备16的语音发送到语音到文本引擎46。语音到文本引擎46将语音转换成文本表示,并将文本发送回会议桥32。接着,会议桥32将文本发送到之前传输文本请求的通信设备16。下面结合图3提供关于会议桥32和语音到文本引擎46的其他细节。在其他实施例中,通信设备16可以绕过会议桥32直接向语音到文本引擎46发送音频。
在另一个实施例中,IP电话16a如上所述接收到文本请求的指示,但并不将这样的指示发送到会议桥32,而是将接收自会议桥32的任何语音直接传输到具体与IP电话17相关联的相关联语音到文本引擎,例如语音到文本引擎146。语音到文本引擎146随后将所接收的语音转换到文本,并将文本提供回给IP电话16a。这样,可以在不要求会议桥维持知道哪些参与者在请求文本的必要功能的情况下,将语音转换到文本。
在一个实施例中,被动参与者可以使用具有文本显示屏17的IP电话16a。当被动参与者使IP电话16a调用接收文本的特征时,会议桥32就将电话会议的文本传输到IP电话16a。接着,IP电话16a将文本显示到文本显示屏17上。请求文本的参与者在参与另一谈话的同时,可以通过阅读由文本显示屏17所显示的文本来监视电话会议。在请求文本的参与者是被动参与者的示例中,当被动参与者希望恢复主动参与电话会议时,被动参与者可以通过请求IP电话16a向会议桥32传输请求停止接收文本的指示,来调用停止文本特征。在一个示例中,通过放开参与者的通信设备16上的“减弱”或“保持”按钮可以发起这样的请求。在进入的语音被抑制的实施例中,响应于请求停止接收文本的指示,会议桥32恢复将会议输出流传输到发起该请求的通信设备16,并停止传输相关联的文本。或者,在进入的语音未被抑制的实施例中,停止接收文本的请求仅仅停止接收文本。
在一个实施例中,会议桥32可以传输电话会议的各发言参与者的身份。在另一个实施例中,会议桥32可以向IP电话16a传输会议输出流、文本以及与文本相关联的参与者的身份。取决于被动参与者所表达的需要,会议输出流、文本和/或参与者的身份每一种自身或者任何的组合,都可以由会议桥32传输到任何的通信设备16。在另一个实施例中,当其他参与者中的某一个在发言时,被动参与者可以收到提醒。在另一个实施例中,会议桥32可以生成伴随文本的时间戳,这里该时间戳将文本关联到各参与者的语音和/或会议输出流。例如,时间戳可以包括会议桥32接收到各参与者的语音时的时间。本领域技术人员将能够确定将文本关联到各参与者的语音和/或会议输出流的不同方法。在另一个实施例中,IP电话16a可以使用耦合到IP电话16a的存储介质19来记录文本、发言者的身份、时间戳和/或会议输出语音流。存储设备19也可以连接到网络14,而不是与某个电话相关联。
在一个实施例中,通过网关20使用模拟电话18来参与电话会议的被动参与者或者其他请求文本的参与者,也可以包括个人计算机16b来监视电话会议。个人计算机16b可以耦合到模拟电话18或者位于模拟电话18附近,以使得参与者可以通过个人计算机16来监视电话会议,并取决于参与者的需要来访问模拟电话18以主动参与电话会议。一旦通过使用模拟电话18或个人计算机16b将特征调用传输到会议桥32,会议桥32就可以通过以下来响应,即取决于被动参与者所表达的需要,将文本、各发言参与者的身份、会议输出流和/或时间戳每一种自身或者任何的组合,传输到个人计算机16b。
在一个实施例中,被动参与者或其他请求文本的参与者可以选择使用耦合到个人计算机16b或连接到网络14的存储介质19,来记录文本和/或时间戳和/或身份和/或会议输出流。在另一个实施例中,可以使用IP电话16a的存储介质19来记录这些。在另一个实施例中,存储可以发生在中心站点。可以组合使用模拟电话18和个人计算机16b来向参与者提供与IP电话16a相同的选择。例如,模拟电话18可以用来主动参与电话会议,而个人计算机16b用来记录进入的数据并监视电话会议。一旦向会议桥32传输了指示参与者希望在电话会议中停止接收文本的请求,模拟电话18就又通过网关20从会议桥32接收会议输出流。在被动参与者的情况下,通过放开通信设备16上的“减弱”或“保持”按钮或与被动参与者相关联的其他合适按钮,这样的请求可以有效。如上所述,在一个实施例中用户可以在没有抑制语音分组的情况下同时接收到语音和文本两者。
在一个实施例中,IP显示器16c可以接收电话会议的发言参与者的身份。监视IP显示器16c上的发言参与者的身份,允许被动参与者或其他请求文本的参与者在某个发言者开始在电话会议中发言时,使用通信设备16来有选择地参与电话会议。可以结合IP电话16a、模拟电话18或其他通信设备来使用IP显示器16c,以允许参与者监视发言参与者的身份。IP显示器16c还可以显示由会议桥32发送的文本。
在一个实施例中,IP显示器16c通过系统目录21与IP电话17相关联。系统目录21可以包括传统用于网络中的认证目的的访问信息,但在此实施例中包括将IP显示器16c与IP电话16a相关联的信息。这样,无论何时要将数据发送到IP电话16a,会议桥32都知道替代地将数据发送到IP显示器16c。在此实施例中IP显示器16c和IP电话16a具有不同的IP地址。这种关联可以响应于用户选择IP显示器16c来接收文本的指示而发生,或者可以响应于确定IP电话不具有相关联的显示器而由会议桥32自动进行。如果会议桥32确定IP电话16a不具有相关联的显示器,那么会议桥32还可以从IP电话16a请求另一个屏幕来向其发送文本。
在一个实施例中,会议桥32可以使用加密引擎33来加密任何输出的数据。加密引擎33可以是会议桥32的组成部分或者独立于会议桥32。
系统24提供了这样的技术优点,即在进行其他任务的同时提供监视电话会议的其它方法。取决于其它任务的性质,被动参与者可以选择通过阅读文本、发言者的身份,或在接收文本的同时收听发言者,或记录所有进入数据以在以后回顾,或者通过这些的任何组合,来监视电话会议。例如,如果其它任务是参与同另一方的谈话,被动参与者可以选择通过阅读电话会议的文本并以较低的音量来收听相应的会议输出流,来监视电话会议。
图3图示了根据本发明一个实施例的会议桥32的细节。在此实施例中,会议桥32被耦合到语音到文本引擎46。会议桥32提供两或多个参与者之间的实时多方音频连接。会议桥32可以在不偏离本发明的范围的情况下支持其他类型的合适的多方通信会话,包括实时视频流。
会议桥32包括控制器50、缓冲器52、数字信号处理器53、混和器58和数据库60,数字信号处理器53包括代码转换器54、增益控制单元55、定时单元57和滤波器59。会议桥32的控制器50、代码转换器54、增益控制单元55、定时单元57、滤波器59和混和器58,以及通信系统12的其他合适组件,可以包括在介质中编码的逻辑。逻辑包括用于执行所编程任务的功能指令。介质可以包括计算机磁盘或其他合适的计算机可读介质、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他合适的专用或通用目的处理器、传输介质、或可在其中编码并使用逻辑的其他合适介质。在此示例中,通过数字信号处理器53来实现代码转换器54、增益控制单元55、定时单元57和滤波器59。
缓冲器52包括输入和输出缓冲器。输入缓冲器接收并缓冲来自通信设备16的输入音频流的分组,以由会议桥32来处理。输出缓冲器接收并缓冲由会议桥32和/或语音到文本引擎46所产生的会议输出流和/或会议输出流的文本形式(文本),以传输到通信设备16,通信设备16包括例如IP电话16a、个人计算机16b和IP显示器16c。
数字信号处理器53内的代码转换器54包括输入和输出代码转换器。输入代码转换器54从相应的缓冲器52接收输入音频流,并将该音频流从通信设备16的压缩格式转换成会议桥32的未压缩格式,以在会议桥32或语音到文本引擎46中混和和处理。在一个示例中,未压缩格式指的是表示原始、未压缩的语音或数据的G.711格式,而压缩格式指的是表示压缩语音的G.729格式。相反,代码转换器54接收未压缩格式的会议输出流,并将会议输出流转换成各参与者的通信设备16以及被动参与者的通信设备16的压缩格式。这样,会议桥32允许参与者使用各种设备和技术来参与电话会议。
增益控制55为会议桥32的各个组件提供增益控制。定时单元57控制与会议桥32的各个组件相关联的定时。滤波器59为会议桥32提供滤波能力。在此示例中,这些组件中的每一个都如所示地通过数字信号处理器53来实现。
混和器58包括多个求和器或其他合适的信号处理资源,每个都可操作来将多个输入音频流求和、相加或组合成用于参与电话会议的通信设备16的会议输出流。一旦混和器58已生成了会议输出流,那么就可以取决于是否曾从参与者接收到文本请求的指示,而将会议输出流路由到语音到文本引擎46。会议输出流由相应的代码转换器54转换,并由相应的输出缓冲器52缓冲,以传输到相应的通信设备16。
数据库60包括用于会议桥32的各个正在进行的电话会议的一组会议参数62。各个电话会议的会议参数62包括对电话会议的参与者64的标识。在一个实施例中,在电话会议开始时基于呼叫者ID、电话号码、IP地址或其他合适的标识符来识别相应通信设备16的参与者。进入的媒体流的每个分组可以直接或间接地识别相关联的参与者,或者可以提供对参与者身份的其他合适指示。在一个实施例中,来自各通信设备16的每组分组可以包含与特定通信设备16相关联的参与者的IP地址。接着,会议桥32可以向被动参与者或者向以其它方式请求文本的参与者,发送特定参与者身份的指示,同时发送或不发送该参与者的语音或语音的文本版本。
控制器50指示会议桥32的其他组件,并在一个实施例中与呼叫管理器30通信来设置、处理和挂断电话会议。控制器50还可以或者直接从通信设备16或者通过呼叫管理器30接收希望接收文本的指示。可以在频带内与音频流一起或在频带外的控制链路或信道上,从参与者接收这样的指示。
响应于希望接收文本的指示,控制器50指示混和器58将进入到混和器58的所有流的组合发送到语音到文本引擎46。一接收到进入流的组合,语音到文本引擎46就将会议输出流转换成文本。在转换之后,语音到文本引擎46将文本发送回会议桥32。会议桥32通过使用恰当的代码转换器54和/或缓冲器52,随后将文本发送到发起文本请求的通信设备16。在一个实施例中,会议桥32将会议输出语音流与输出的文本一起发送。在另一个实施例中,会议桥32传输存储在数据库60中的各参与者的身份64。在另一个实施例中,会议桥32将文本和/或会议输出流与负责特定发言和/或文本的各参与者的身份64一起传输。在另一个实施例中,会议桥32可以生成时间戳来耦合到文本,其中时间戳有助于将文本与语音关联起来。取决于被动参与者的需要,可以由会议桥32分别或以任何组合提供文本、语音、时间戳和/或身份64。在另一个实施例中,可以使用加密引擎33来加密从输出缓冲器52传输的所有或部分媒体流。在另一个实施例中,端点16直接与语音到文本引擎通信。
图4示出了根据本发明一个实施例的方法110的流程图。可以由图2的系统24利用图3的会议桥32和语音到文本引擎46,或者由其他系统来实现方法110的一个实施例。方法110开始于步骤80。在步骤82,使用或不使用呼叫管理器30来设置电话会议。会议桥32或呼叫管理器30可以确定电话会议的各参与者的身份64。可以从例如通信设备16的IP地址来做出此确定。在另一个实施例中,用户登陆到电话会议,此时认证用户的身份。在步骤84,会议桥32确定是否至少有一个通信设备16在被动参与者的指导下或者在以其它方式指示转录文本的请求的指导下正在抑制任何输出的信号。当参与者的通信设备16触发了对要传输文本的请求时,会议桥32可以做出此确定,所述请求表示参与者请求在抑制或不抑制输出的语音分组的情况下的文本。用户可以通过通信设备16上的按钮、通过软键或通过其他合适技术来表示在抑制或不抑制输出的语音分组的情况下接收文本的这样一种要求,以使得被转录的文本被发送到通信设备16。
如果会议桥32确定没有通信设备16在抑制任何输出的信号或者确定未请求文本,那么会议桥32就在步骤86继续向各通信设备16发送会议输出流。在一个实施例中,如果会议桥32从一个或多个通信设备16接收到文本请求,那么会议桥32就在步骤88采取措施将来自各通信设备16的语音转换成文本。一旦语音被转换成文本,那么会议桥32就在步骤90将文本发送到发起文本请求的通信设备16。当在通信设备16处接收到文本时,接收文本的参与者就在步骤92监视文本。接收文本的参与者可以在进行另一任务的同时监视文本。方法110在步骤100结束。
在一个实施例中,会议桥32可以在步骤102仅传输各发言参与者的身份64,而非相关联的实际文本。接收文本的参与者随后在步骤92监视各发言参与者的身份64,以有选择地参与电话会议。在另一个实施例中,可以在步骤104加密从会议桥32传输的所有或部分媒体流。例如,在步骤102处发送身份64之前,会议桥32可以在步骤104使用加密引擎33来加密身份64。在另一个实施例中,在步骤90发送文本和/或会议输出流和/或身份64之前,加密引擎33可以被用来在步骤104加密文本和/或会议输出流和/或身份64。在另一个实施例中,会议桥32可以在步骤106生成时间戳并将其耦合到输出的文本。可以通过使用网络连接存储设备来记录语音分组或转录文本,网络连接存储设备指被连接到网络的中央存储站点;但是,在一些实施例中,在本地记录这样的信息可能是有益的,例如在IP电话16a的存储介质19中,如步骤108所图示。
以上详细描述的方法和系统对于在执行另一任务的同时进行电话会议的难题提供了一种解决方案。本发明的一些实施例的好处在于,参与者可以根据其它任务的性质来选择监视电话会议的方法。
虽然已经详细描述了本发明,但是应该理解到可以向其做出各种变化、替代和改变,而不偏离如权利要求所限定的本发明的精神和范围。

Claims (63)

1.一种在两个或多个参与者之间进行电话会议的方法,包括:
建立两个或更多个参与者之间的电话会议;
在所述电话会议期间从所述两个或更多个参与者中的一个特定参与者接收文本请求的指示;
响应于来自所述特定参与者的所述指示,将所述电话会议的其他参与者的任何语音转换成文本;以及
将所述文本发送到与从其接收到所述文本请求的指示的所述特定参与者相关联的设备,所述设备可操作来显示所述文本。
2.如权利要求1所述的方法,还包括将所述电话会议的各参与者的身份发送到所述设备,其中所述身份与关联到各参与者的所述语音的所述文本相关联。
3.如权利要求1所述的方法,还包括加密所述文本。
4.如权利要求1所述的方法,还包括将与所述文本相对应的所述语音发送到所述设备。
5.如权利要求4所述的方法,其中所述文本包括时间戳,所述时间戳将所述文本与对应于所述文本的所述语音关联起来。
6.如权利要求1所述的方法,还包括在所述设备处记录所述文本。
7.如权利要求1所述的方法,其中响应于所述特定参与者将所述电话会议置于保持而接收到所述文本请求的指示。
8.如权利要求1所述的方法,其中响应于所述特定参与者减弱呼叫而接收到所述文本请求的指示。
9.如权利要求1所述的方法,其中所述文本请求的指示包括以下指示,即在与请求文本的所述特定参与者相关联的电话上按下按钮的指示。
10.如权利要求1所述的方法,其中所述文本请求的指示包括以下指示,即按下与请求文本的所述特定参与者相关联的软键的指示。
11.如权利要求1所述的方法,其中所述文本请求的指示包括以下指示,即请求文本的所述特定参与者正在抑制向请求文本的所述特定参与者传输语音媒体分组的指示。
12.如权利要求1所述的方法,其中所述文本请求的指示包括以下指示,即请求文本的所述特定参与者正在抑制从请求文本的所述特定参与者传输语音媒体分组的指示。
13.如权利要求1所述的方法,还包括将请求文本的所述特定参与者的任何语音转换成文本。
14.如权利要求1所述的方法,还包括提醒请求文本的所述特定参与者所述其他参与者中的特定一个正在发言。
15.一种与多个参与者进行电话会议的方法,包括:
建立两个或更多个参与者之间的电话会议;
确定向所述电话会议提供输入的每个参与者的身份;
在所述电话会议期间从所述两个或更多个参与者中的特定参与者接收文本请求的指示;
响应于从所述特定参与者接收到所述文本请求的指示,当各个其他参与者在发言时,将所述电话会议的所述各个其他参与者的所述身份,发送到与从其接收到所述文本请求的指示的所述特定参与者相关联的设备,所述设备可操作来显示各参与者的所述身份。
16.如权利要求15所述的方法,还包括响应于所述文本请求的指示,将所述电话会议的各个其他参与者的任何语音转换成文本,并将所述文本发送到所述设备,所述文本与各个参与者的所述身份相关联。
17.如权利要求16所述的方法,还包括加密所述文本。
18.如权利要求16所述的方法,还包括将与所述文本相关联的所述语音发送到所述设备。
19.如权利要求18所述的方法,其中所述文本包括时间戳,所述时间戳将所述文本与对应于所述文本的所述语音关联起来。
20.如权利要求19所述的方法,还包括在所述设备处记录所述文本和对应于所述文本的所述语音。
21.如权利要求20所述的方法,其中记录所述文本和语音,包括在所述设备处记录所述语音和文本。
22.如权利要求20所述的方法,其中记录所述文本和语音,包括在连接到网络的中央存储单元中记录所述语音和文本。
23.如权利要求15所述的方法,其中响应于所述特定参与者将所述电话会议置于保持而接收到所述文本请求的指示。
24.如权利要求15所述的方法,其中响应于所述特定参与者减弱呼叫而接收到所述文本请求的指示。
25.如权利要求15所述的方法,其中所述文本请求的指示包括以下指示,即在与请求文本的所述特定参与者相关联的电话上按下按钮的指示。
26.如权利要求15所述的方法,其中所述文本请求的指示包括以下指示,即按下与请求文本的所述特定参与者相关联的软键的指示。
27.如权利要求15所述的方法,其中所述文本请求的指示包括以下指示,即请求文本的所述特定参与者正在抑制向请求文本的所述特定参与者传输语音媒体分组的指示。
28.如权利要求15所述的方法,其中所述文本请求的指示包括以下指示,即请求文本的所述特定参与者正在抑制从请求文本的所述特定参与者传输语音媒体分组的指示。
29.如权利要求15所述的方法,还包括当请求文本的所述特定参与者在发言时,向所述设备发送请求文本的所述特定参与者的所述身份。
30.一种在两个或多个参与者之间进行电话会议的系统,包括:
用于建立两个或更多个参与者之间的电话会议的装置;
用于在所述电话会议期间从所述两个或更多个参与者中的一个特定参与者接收文本请求的指示的装置;
用于响应于来自所述特定参与者的所述指示,将所述电话会议的其他参与者的任何语音转换成文本的装置;以及
用于将所述文本发送到与从其接收到所述文本请求的指示的所述特定参与者相关联的设备的装置,所述设备可操作来显示所述文本。
31.如权利要求30所述的系统,还包括用于将所述电话会议的各参与者的身份发送到所述设备的装置,其中所述身份与关联到各参与者的所述语音的所述文本相关联。
32.如权利要求30所述的系统,还包括用于加密所述文本的装置。
33.如权利要求30所述的系统,还包括用于将与所述文本相对应的所述语音发送到所述设备的装置。
34.如权利要求33所述的系统,其中所述文本包括时间戳,所述时间戳将所述文本与对应于所述文本的所述语音关联起来。
35.如权利要求30所述的系统,还包括用于在所述设备处记录所述文本的装置。
36.如权利要求30所述的系统,其中响应于所述特定参与者将所述电话会议置于保持而接收到所述文本请求的指示。
37.如权利要求30所述的系统,其中响应于所述特定参与者减弱呼叫而接收到所述文本请求的指示。
38.如权利要求30所述的系统,其中所述文本请求的指示包括以下指示,即在与请求文本的所述特定参与者相关联的电话上按下按钮的指示。
39.如权利要求30所述的系统,其中所述文本请求的指示包括以下指示,即按下与请求文本的所述特定参与者相关联的软键的指示。
40.如权利要求30所述的系统,其中所述文本请求的指示包括以下指示,即请求文本的所述特定参与者正在抑制向请求文本的所述特定参与者传输语音媒体分组的指示。
41.如权利要求30所述的系统,其中所述文本请求的指示包括以下指示,即请求文本的所述特定参与者正在抑制从请求文本的所述特定参与者传输语音媒体分组的指示。
42.如权利要求30所述的系统,还包括用于将请求文本的所述特定参与者的任何语音转换成文本的装置。
43.如权利要求30所述的系统,还包括用于提醒请求文本的所述特定参与者所述其他参与者中的特定一个正在发言的装置。
44.一种与多个参与者进行电话会议的系统,包括:
用于建立两个或更多个参与者之间的电话会议的装置;
用于确定向所述电话会议提供输入的每个参与者的身份的装置;
用于在所述电话会议期间从所述两个或更多个参与者中的特定参与者接收文本请求的指示的装置;
用于下述操作的装置:响应于从所述特定参与者接收到所述文本请求的指示,当各个其他参与者在发言时,将所述电话会议的所述各个其他参与者的所述身份,发送到与从其接收到所述文本请求的指示的所述特定参与者相关联的设备,所述设备可操作来显示各参与者的所述身份。
45.如权利要求44所述的系统,还包括用于下述操作的装置:响应于所述文本请求的指示,将所述电话会议的各个其他参与者的任何语音转换成文本,并将所述文本发送到所述设备,所述文本与各个参与者的所述身份相关联。
46.如权利要求45所述的系统,还包括用于加密所述文本的装置。
47.如权利要求45所述的系统,还包括用于将与所述文本相关联的所述语音发送到所述设备的装置。
48.如权利要求47所述的系统,其中所述文本包括时间戳,所述时间戳将所述文本与对应于所述文本的所述语音关联起来。
49.如权利要求48所述的系统,还包括用于在所述设备处记录所述文本和对应于所述文本的所述语音的装置。
50.如权利要求49所述的系统,其中用于记录所述文本和语音的装置包括用于在所述设备处记录所述语音和文本的装置。
51.如权利要求49所述的系统,其中用于记录所述文本和语音的装置包括用于在连接到网络的中央存储单元中记录所述语音和文本的装置。
52.如权利要求44所述的系统,其中响应于所述特定参与者将所述电话会议置于保持而接收到所述文本请求的指示。
53.如权利要求44所述的系统,其中响应于所述特定参与者减弱呼叫而接收到所述文本请求的指示。
54.如权利要求44所述的系统,其中所述文本请求的指示包括以下指示,即在与请求文本的所述特定参与者相关联的电话上按下按钮的指示。
55.如权利要求44所述的系统,其中所述文本请求的指示包括以下指示,即按下与请求文本的所述特定参与者相关联的软键的指示。
56.如权利要求44所述的系统,其中所述文本请求的指示包括以下指示,即请求文本的所述特定参与者正在抑制向请求文本的所述特定参与者传输语音媒体分组的指示。
57.如权利要求44所述的系统,其中所述文本请求的指示包括以下指示,即请求文本的所述特定参与者正在抑制从请求文本的所述特定参与者传输语音媒体分组的指示。
58.如权利要求44所述的系统,还包括用于当请求文本的所述特定参与者在发言时,向所述设备发送请求文本的所述特定参与者的所述身份的装置。
59.一种在两个或多个参与者之间进行电话会议的方法,包括:
建立两个或更多个参与者之间的电话会议;
在电话处,从使用所述电话的所述电话会议的所述两个或更多个参与者中的一个特定参与者接收文本请求的指示;
响应于所述指示,自动将在所述电话处接收到的任何语音从所述电话传输到语音到文本引擎;以及
在所述电话处从所述语音到文本引擎接收指示所接收语音的文本。
60.如权利要求59所述的方法,其中响应于所述特定参与者将所述电话会议置于保持而接收到所述文本请求的指示。
61.如权利要求59所述的方法,其中响应于所述特定参与者减弱呼叫而接收到所述文本请求的指示。
62.如权利要求59所述的方法,其中所述文本请求的指示包括以下指示,即在与请求文本的所述特定参与者相关联的电话上按下按钮的指示。
63.如权利要求59所述的方法,其中所述文本请求的指示包括以下指示,即按下与请求文本的所述特定参与者相关联的软键的指示。
CN038041979A 2002-02-20 2003-02-11 进行带可选语音到文本转换的电话会议的方法和系统 Expired - Fee Related CN1636384B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/081,608 2002-02-20
US10/081,608 US7236580B1 (en) 2002-02-20 2002-02-20 Method and system for conducting a conference call
PCT/US2003/004042 WO2003071774A1 (en) 2002-02-20 2003-02-11 Method and system for conducting conference calls with optional voice to text translation

Publications (2)

Publication Number Publication Date
CN1636384A CN1636384A (zh) 2005-07-06
CN1636384B true CN1636384B (zh) 2011-08-10

Family

ID=27752973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN038041979A Expired - Fee Related CN1636384B (zh) 2002-02-20 2003-02-11 进行带可选语音到文本转换的电话会议的方法和系统

Country Status (6)

Country Link
US (1) US7236580B1 (zh)
EP (1) EP1477017B1 (zh)
CN (1) CN1636384B (zh)
AU (1) AU2003215153B2 (zh)
CA (1) CA2473147C (zh)
WO (1) WO2003071774A1 (zh)

Families Citing this family (120)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6603835B2 (en) 1997-09-08 2003-08-05 Ultratec, Inc. System for text assisted telephony
US6501739B1 (en) * 2000-05-25 2002-12-31 Remoteability, Inc. Participant-controlled conference calling system
US8416925B2 (en) 2005-06-29 2013-04-09 Ultratec, Inc. Device independent text captioned telephone service
TW200427293A (en) * 2003-05-16 2004-12-01 Hon Hai Prec Ind Co Ltd IP phone and method
EP1649706A4 (en) * 2003-07-18 2011-05-11 Kodiak Networks Inc PREMIUM VOICE SERVICES FOR WIRELESS COMMUNICATION SYSTEMS
US8873561B2 (en) * 2003-08-18 2014-10-28 Cisco Technology, Inc. Supporting enhanced media communications using a packet-based communication link
US8515024B2 (en) 2010-01-13 2013-08-20 Ultratec, Inc. Captioned telephone service
US8027276B2 (en) * 2004-04-14 2011-09-27 Siemens Enterprise Communications, Inc. Mixed mode conferencing
KR20050101505A (ko) * 2004-04-19 2005-10-24 삼성전자주식회사 무선 통신 시스템에서 다중 세션 모니터링 방법 및 장치
DE102004021321B8 (de) * 2004-04-30 2011-11-10 Siemens Ag Verfahren und Einheit zum Ermitteln nutzbarer Dienste
US8234335B1 (en) * 2004-06-29 2012-07-31 Sprint Spectrum L.P. Customized grouping of participants in real-time conference set-up
US7532713B2 (en) 2004-09-23 2009-05-12 Vapps Llc System and method for voice over internet protocol audio conferencing
US9913300B2 (en) 2011-12-14 2018-03-06 Kodiak Networks, Inc. Push-to-talk-over-cellular (PoC)
US9137646B2 (en) 2004-11-23 2015-09-15 Kodiak Networks, Inc. Method and framework to detect service users in an insufficient wireless radio coverage network and to improve a service delivery experience by guaranteed presence
US10367863B2 (en) 2004-11-23 2019-07-30 Kodiak Networks Inc. Method for providing dynamic quality of service for push-to-talk service
US7853279B2 (en) * 2006-04-26 2010-12-14 Kodiak Networks, Inc. Advanced features on a real-time exchange system
US8958348B2 (en) * 2008-10-20 2015-02-17 Kodiak Networks, Inc. Hybrid push-to-talk for mobile phone networks
US10116691B2 (en) 2004-11-23 2018-10-30 Kodiak Networks, Inc. VoIP denial-of-service protection mechanisms from attack
US10111055B2 (en) 2004-11-23 2018-10-23 Kodiak Networks, Inc. Optimized methods for large group calling using unicast and multicast transport bearer for PoC
US8670760B2 (en) 2008-01-24 2014-03-11 Kodiak Networks, Inc. Converged mobile-web communications solution
US8369829B2 (en) * 2010-03-03 2013-02-05 Kodiak Networks, Inc. Prepaid billing solutions for push-to-talk in a wireless communications network
US10178513B2 (en) 2004-11-23 2019-01-08 Kodiak Networks, Inc. Relay-mode and direct-mode operations for push-to-talk-over-cellular (PoC) using WiFi-technologies
US10750327B2 (en) 2004-11-23 2020-08-18 Kodiak Networks Inc Method for multiplexing media streams to optimize network resource usage for push-to-talk-over-cellular service
US9088876B2 (en) 2012-02-01 2015-07-21 Kodiak Networks, Inc. WiFi interworking solutions for push-to-talk-over-cellular (PoC)
US8036692B2 (en) * 2005-08-08 2011-10-11 Kodiaks Networks, Inc. Brew platform enabling advanced voice services (AVS) including push-to-talk, push-to-conference and push-to-message on wireless handsets and networks
US8498660B2 (en) * 2009-03-30 2013-07-30 Kodiak Networks, Inc. Enhanced group calling features for connected portfolio services in a wireless communications network
US8676189B2 (en) * 2008-01-24 2014-03-18 Kodiak Networks, Inc. Converged mobile-web communications solution
US9485787B2 (en) 2005-05-24 2016-11-01 Kodiak Networks, Inc. Method to achieve a fully acknowledged mode communication (FAMC) in push-to-talk-over-cellular (PoC)
US10057105B2 (en) 2004-11-23 2018-08-21 Kodiak Networks, Inc. Architecture framework to realize push-to-X services using cloudbased storage services
US7739109B2 (en) * 2005-01-12 2010-06-15 Microsoft Corporation System and process for muting audio transmission during a computer network-based, multi-party teleconferencing session
US8190672B2 (en) * 2005-02-16 2012-05-29 Nextel Communications Inc. Apparatus and method for sending a web logging message to a dispatch communication device
US8185574B2 (en) * 2005-02-16 2012-05-22 Nextel Communications Inc. System and method for retrieving a web logging message via a dispatch communication
US8185573B2 (en) * 2005-02-16 2012-05-22 Nextel Communications Inc. System and method for posting a web logging message via a dispatch communication
US8185575B2 (en) * 2005-02-16 2012-05-22 Nextel Communications Inc. Apparatus and method for posting a web logging message via a dispatch communication
US8150908B2 (en) * 2005-02-16 2012-04-03 Nextel Communications Inc. System and method for notifying of the posting of a web logging message via a dispatch communication
US20060184629A1 (en) * 2005-02-16 2006-08-17 Izdepski Erich J System and method for relaying a web logging message via a dispatch communication
US8015241B2 (en) * 2005-02-16 2011-09-06 Nextel Communications Inc. Apparatus and method for notifying of the posting of a web logging message via a dispatch communication
US7917178B2 (en) 2005-03-22 2011-03-29 Sony Ericsson Mobile Communications Ab Wireless communications device with voice-to-text conversion
ES2299294B1 (es) 2005-05-24 2009-04-01 Vodafone España, S.A. Sistema y metodo de transcripcion de conversaciones telefonicas en tiempo real.
US20060293888A1 (en) * 2005-06-27 2006-12-28 Lucent Technologies Inc. Providing text during a live voice conversation over a telephone network
US11258900B2 (en) 2005-06-29 2022-02-22 Ultratec, Inc. Device independent text captioned telephone service
US7570752B2 (en) * 2005-09-23 2009-08-04 Alcatel Lucent Telephony/conference activity presence state
US8442197B1 (en) * 2006-03-30 2013-05-14 Avaya Inc. Telephone-based user interface for participating simultaneously in more than one teleconference
US8510109B2 (en) * 2007-08-22 2013-08-13 Canyon Ip Holdings Llc Continuous speech transcription performance indication
US9436951B1 (en) 2007-08-22 2016-09-06 Amazon Technologies, Inc. Facilitating presentation by mobile device of additional content for a word or phrase upon utterance thereof
WO2007117626A2 (en) 2006-04-05 2007-10-18 Yap, Inc. Hosted voice recognition system for wireless devices
US20090124272A1 (en) 2006-04-05 2009-05-14 Marc White Filtering transcriptions of utterances
US9325749B2 (en) 2007-01-31 2016-04-26 At&T Intellectual Property I, Lp Methods and apparatus to manage conference call activity with internet protocol (IP) networks
CA2714079C (en) * 2007-02-09 2016-04-19 Selective Broadcasting Corporation System and method for providing telephonic access to an audio stream
JP5020663B2 (ja) * 2007-03-08 2012-09-05 京セラ株式会社 移動体通信機、通信システム、及び通信方法
US8611871B2 (en) 2007-12-25 2013-12-17 Canyon Ip Holdings Llc Validation of mobile advertising from derived information
US9973450B2 (en) * 2007-09-17 2018-05-15 Amazon Technologies, Inc. Methods and systems for dynamically updating web service profile information by parsing transcribed message strings
US8352264B2 (en) * 2008-03-19 2013-01-08 Canyon IP Holdings, LLC Corrective feedback loop for automated speech recognition
US8352261B2 (en) * 2008-03-07 2013-01-08 Canyon IP Holdings, LLC Use of intermediate speech transcription results in editing final speech transcription results
US8326636B2 (en) 2008-01-16 2012-12-04 Canyon Ip Holdings Llc Using a physical phenomenon detector to control operation of a speech recognition engine
US20090076917A1 (en) * 2007-08-22 2009-03-19 Victor Roditis Jablokov Facilitating presentation of ads relating to words of a message
US8340086B2 (en) 2007-04-19 2012-12-25 At&T Intellectual Property I, Lp Methods and apparatus to protect and audit communication line status
US8526645B2 (en) 2007-05-04 2013-09-03 Personics Holdings Inc. Method and device for in ear canal echo suppression
US11683643B2 (en) 2007-05-04 2023-06-20 Staton Techiya Llc Method and device for in ear canal echo suppression
US10194032B2 (en) 2007-05-04 2019-01-29 Staton Techiya, Llc Method and apparatus for in-ear canal sound suppression
US11856375B2 (en) 2007-05-04 2023-12-26 Staton Techiya Llc Method and device for in-ear echo suppression
US9053489B2 (en) 2007-08-22 2015-06-09 Canyon Ip Holdings Llc Facilitating presentation of ads relating to words of a message
US8335830B2 (en) * 2007-08-22 2012-12-18 Canyon IP Holdings, LLC. Facilitating presentation by mobile device of additional content for a word or phrase upon utterance thereof
EP2204037A1 (en) * 2007-10-25 2010-07-07 Kodiak Networks, Inc. Connected portfolio services for a wireless communications network
US20090109961A1 (en) * 2007-10-31 2009-04-30 John Michael Garrison Multiple simultaneous call management using voice over internet protocol
JP5781310B2 (ja) * 2008-03-14 2015-09-16 ラリー・イー・ローハー 仮想旅行マイレージを定量化し使用するためのシステムおよび方法
US8676577B2 (en) 2008-03-31 2014-03-18 Canyon IP Holdings, LLC Use of metadata to post process speech recognition output
US7532714B1 (en) 2008-05-15 2009-05-12 International Business Machines Corporation Method for discrete communication with a meeting speaker during a teleconference
US8301454B2 (en) 2008-08-22 2012-10-30 Canyon Ip Holdings Llc Methods, apparatuses, and systems for providing timely user cues pertaining to speech recognition
US9276761B2 (en) * 2009-03-04 2016-03-01 At&T Intellectual Property I, L.P. Method and apparatus for group media consumption
US20100238842A1 (en) * 2009-03-19 2010-09-23 Microsoft Corporation Phone conferencing architecture with optimized services management
JP5332798B2 (ja) * 2009-03-26 2013-11-06 ブラザー工業株式会社 通信制御装置、通信制御方法、及び通信制御プログラム
US20100268534A1 (en) * 2009-04-17 2010-10-21 Microsoft Corporation Transcription, archiving and threading of voice communications
US8621011B2 (en) 2009-05-12 2013-12-31 Avaya Inc. Treatment of web feeds as work assignment in a contact center
US8768705B2 (en) * 2009-10-27 2014-07-01 Cisco Technology, Inc. Automated and enhanced note taking for online collaborative computing sessions
FR2952492B1 (fr) * 2009-11-10 2012-03-30 Alcatel Lucent Procede de diffusion d'un flux de donnees et procede d'interaction entre utilisateurs
WO2011069165A1 (en) * 2009-12-04 2011-06-09 Kodiak Networks, Inc. Community group client and community auto discovery solutions in a wireless communications network
US20110195739A1 (en) * 2010-02-10 2011-08-11 Harris Corporation Communication device with a speech-to-text conversion function
US9009040B2 (en) * 2010-05-05 2015-04-14 Cisco Technology, Inc. Training a transcription system
WO2011146205A1 (en) 2010-05-21 2011-11-24 Kodiak Networks, Inc. Predictive wakeup for push-to-talk-over-cellular (poc) call setup optimizations
US8744860B2 (en) 2010-08-02 2014-06-03 At&T Intellectual Property I, L.P. Apparatus and method for providing messages in a social network
CN102592596A (zh) * 2011-01-12 2012-07-18 鸿富锦精密工业(深圳)有限公司 语音文字转换装置及方法
CN102811439A (zh) * 2011-06-02 2012-12-05 中兴通讯股份有限公司 语音处理方法及系统
US9230546B2 (en) * 2011-11-03 2016-01-05 International Business Machines Corporation Voice content transcription during collaboration sessions
US10177926B2 (en) 2012-01-30 2019-01-08 International Business Machines Corporation Visualizing conversations across conference calls
CN103379460A (zh) * 2012-04-20 2013-10-30 华为终端有限公司 一种语音消息处理方法及终端
KR101954774B1 (ko) * 2012-08-16 2019-03-06 삼성전자주식회사 문자 데이터를 이용한 음성 통화를 제공하기 위한 전자 장치 및 방법
WO2014085985A1 (zh) * 2012-12-04 2014-06-12 Itp创新科技有限公司 一种通话转录系统和方法
EP3025529B1 (en) 2013-07-23 2018-04-11 Kodiak Networks, Inc. Radio access network aware service push-to-talk-over-cellular networks
US20150170651A1 (en) * 2013-12-12 2015-06-18 International Business Machines Corporation Remedying distortions in speech audios received by participants in conference calls using voice over internet (voip)
US9854439B2 (en) 2014-02-07 2017-12-26 First Principles, Inc. Device and method for authenticating a user of a voice user interface and selectively managing incoming communications
US20180270350A1 (en) 2014-02-28 2018-09-20 Ultratec, Inc. Semiautomated relay method and apparatus
US10389876B2 (en) 2014-02-28 2019-08-20 Ultratec, Inc. Semiautomated relay method and apparatus
US20180034961A1 (en) 2014-02-28 2018-02-01 Ultratec, Inc. Semiautomated Relay Method and Apparatus
US10878721B2 (en) 2014-02-28 2020-12-29 Ultratec, Inc. Semiautomated relay method and apparatus
US9728190B2 (en) 2014-07-25 2017-08-08 International Business Machines Corporation Summarization of audio data
CN105469790A (zh) * 2014-08-29 2016-04-06 上海联影医疗科技有限公司 会诊信息处理方法及装置
CN106105175B (zh) * 2015-01-30 2019-05-21 华为技术有限公司 一种多方通话中语音转文本的方法及装置
US10362074B2 (en) 2015-02-03 2019-07-23 Kodiak Networks, Inc Session management and notification mechanisms for push-to-talk (PTT)
US10044872B2 (en) * 2015-03-27 2018-08-07 International Business Machines Corporation Organizing conference calls using speaker and topic hierarchies
WO2016179502A1 (en) 2015-05-07 2016-11-10 Kodiak Networks, Inc. System and method for data synchronization
CN105094641A (zh) * 2015-07-15 2015-11-25 百度在线网络技术(北京)有限公司 语音问答交互方法和装置
DE112016004558B4 (de) 2015-10-06 2023-01-05 Kodiak Networks, Inc. System und verfahren zum abstimmen von ptt über lte
CA3000202C (en) 2015-10-06 2022-05-31 Kodiak Networks, Inc. System and method for media encoding scheme (mes) selection
WO2017070551A1 (en) 2015-10-23 2017-04-27 Kodiak Networks Inc. System and method for content messaging
US20170178630A1 (en) * 2015-12-18 2017-06-22 Qualcomm Incorporated Sending a transcript of a voice conversation during telecommunication
US10362535B2 (en) 2016-04-22 2019-07-23 Kodiak Networks, Inc. System and method for push-to-talk (PTT) key one-touch calling
US10555370B2 (en) 2016-09-28 2020-02-04 Kodiak Networks, Inc. System and method for push-to-talk (PTT) in high latency networks
US10257669B2 (en) 2016-12-01 2019-04-09 Kodiak Networks, Inc. PTX data analytic engine notifying group list of detected risk event
US10630529B2 (en) 2016-12-29 2020-04-21 Kodiak Networks, Inc. System and method for push-to-talk (PTT) in mobile edge computing (MEC)
US10341823B2 (en) 2016-12-30 2019-07-02 Kodiak Networks Inc. System and method for direct mode push to talk communication protocols
US10147415B2 (en) * 2017-02-02 2018-12-04 Microsoft Technology Licensing, Llc Artificially generated speech for a communication session
US10558421B2 (en) * 2017-05-22 2020-02-11 International Business Machines Corporation Context based identification of non-relevant verbal communications
JP6318292B1 (ja) 2017-06-16 2018-04-25 株式会社シアンス・アール 信号処理装置、通信システム、信号処理装置で実施される方法、信号処理装置で実行されるプログラム、通信端末で実施される方法、及び通信端末で実行されるプログラム
JP2019191824A (ja) * 2018-04-23 2019-10-31 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
US20200084057A1 (en) * 2018-09-12 2020-03-12 Avaya Inc. Conference session management with mode selection
CN109068089A (zh) * 2018-09-30 2018-12-21 视联动力信息技术股份有限公司 一种会议数据生成方法和装置
CN111243594A (zh) * 2018-11-28 2020-06-05 海能达通信股份有限公司 一种音频转换文字的方法及装置
US10971168B2 (en) 2019-02-21 2021-04-06 International Business Machines Corporation Dynamic communication session filtering
US11539900B2 (en) 2020-02-21 2022-12-27 Ultratec, Inc. Caption modification and augmentation systems and methods for use by hearing assisted user

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0664636A2 (en) * 1994-01-19 1995-07-26 International Business Machines Corporation Audio conferencing system
EP0835015A2 (en) * 1996-10-02 1998-04-08 AT&T Corp. Advanced call waiting and messaging system
EP0978981A2 (en) * 1998-08-05 2000-02-09 AT&T Corp. Network-based caller speech muting

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10136327A (ja) * 1996-10-25 1998-05-22 Meidensha Corp ディスクトップ会議システム
US6477491B1 (en) * 1999-05-27 2002-11-05 Mark Chandler System and method for providing speaker-specific records of statements of speakers
US6457045B1 (en) * 1999-08-30 2002-09-24 Zaplet, Inc. System and method for group choice making
US6816468B1 (en) * 1999-12-16 2004-11-09 Nortel Networks Limited Captioning for tele-conferences
US6501739B1 (en) * 2000-05-25 2002-12-31 Remoteability, Inc. Participant-controlled conference calling system
US6996531B2 (en) * 2001-03-30 2006-02-07 Comverse Ltd. Automated database assistance using a telephone for a speech based or text based multimedia communication mode
US7027986B2 (en) * 2002-01-22 2006-04-11 At&T Corp. Method and device for providing speech-to-text encoding and telephony service
US6763095B1 (en) * 2002-09-24 2004-07-13 Verizon Laboratories Inc. Unified messaging system and method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0664636A2 (en) * 1994-01-19 1995-07-26 International Business Machines Corporation Audio conferencing system
EP0835015A2 (en) * 1996-10-02 1998-04-08 AT&T Corp. Advanced call waiting and messaging system
EP0978981A2 (en) * 1998-08-05 2000-02-09 AT&T Corp. Network-based caller speech muting

Also Published As

Publication number Publication date
AU2003215153B2 (en) 2008-10-30
US7236580B1 (en) 2007-06-26
EP1477017B1 (en) 2017-08-02
EP1477017A1 (en) 2004-11-17
CN1636384A (zh) 2005-07-06
WO2003071774A1 (en) 2003-08-28
CA2473147C (en) 2010-12-21
CA2473147A1 (en) 2003-08-28
AU2003215153A1 (en) 2003-09-09

Similar Documents

Publication Publication Date Title
CN1636384B (zh) 进行带可选语音到文本转换的电话会议的方法和系统
US6792092B1 (en) Method and system for independent participant control of audio during multiparty communication sessions
EP1461938B1 (en) Method and system for controlling audio content during multiparty communication sessions
US6600733B2 (en) System for interconnecting packet-switched and circuit-switched voice communications
US7075900B2 (en) Software based single agent multipoint conference capability
US7729345B2 (en) Scalable voice over IP system providing independent call bridging for outbound calls initiated by user interface applications
CN101156374B (zh) 一种监听视频呼叫的系统和方法
US20060067499A1 (en) Method and apparatus for querying a list of participants in a conference
US7227922B2 (en) Method and device for the transmission of data in a packet-oriented data network
CN101159901B (zh) 发起会议的方法、短信应用业务代理、会议服务器及系统
CN102082884B (zh) 一种基于3g的音视频协作方法及系统
CN109802913A (zh) 融合会议实现方法及装置、电子设备、可读存储介质
US6977911B1 (en) Scalable voice over IP system configured for dynamically switching codecs during a call
US20090299735A1 (en) Method for Transferring an Audio Stream Between a Plurality of Terminals
KR20050016061A (ko) 개선된 그룹 통신 시스템
KR100544036B1 (ko) 인터넷 영상전화기의 단문 서비스시스템 및 방법
US20080305751A1 (en) Poc Communication System, Method for the Transmitting Poc Signalling and/or Poc Data, and a Server Device Therefor
JP4644813B2 (ja) 多者間通話システム、多者間通話システムにおける通話端末および通話サーバ、多者間通話方法
KR20020084783A (ko) 인터넷망과 브이오아이피 기능을 이용한 사내전화시스템및 방법
US20100002691A1 (en) Method and apparatus for providing asynchronous audio messaging
KR100718806B1 (ko) H.323 기반의 텍스트 서비스가 가능한 VoIP 시스템
US20230247136A1 (en) Automated attendant that specifies audio transmission characteristics for calls
JP2010206717A (ja) 音声応答システム、音声応答装置および音声応答方法
KR20030016065A (ko) 디지털 가입자 인터페이스 보드를 이용한 화상회의 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110810

Termination date: 20210211

CF01 Termination of patent right due to non-payment of annual fee