CN1636384A - 进行带可选语音到文本转换的电话会议的方法和系统 - Google Patents

进行带可选语音到文本转换的电话会议的方法和系统 Download PDF

Info

Publication number
CN1636384A
CN1636384A CNA038041979A CN03804197A CN1636384A CN 1636384 A CN1636384 A CN 1636384A CN A038041979 A CNA038041979 A CN A038041979A CN 03804197 A CN03804197 A CN 03804197A CN 1636384 A CN1636384 A CN 1636384A
Authority
CN
China
Prior art keywords
text
participant
indication
request
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA038041979A
Other languages
English (en)
Other versions
CN1636384B (zh
Inventor
尚塔努·萨卡尔
拉比士·帕特尔
什穆埃尔·谢弗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cisco Technology Inc
Original Assignee
Cisco Technology Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cisco Technology Inc filed Critical Cisco Technology Inc
Publication of CN1636384A publication Critical patent/CN1636384A/zh
Application granted granted Critical
Publication of CN1636384B publication Critical patent/CN1636384B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42221Conversation recording systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/567Multimedia conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/38Displays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/60Medium conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/20Aspects of automatic or semi-automatic exchanges related to features of supplementary services
    • H04M2203/2061Language aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/60Aspects of automatic or semi-automatic exchanges related to security aspects in telephonic communication systems
    • H04M2203/609Secret communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/12Arrangements for interconnection between switching centres for working between exchanges having different types of switching equipment, e.g. power-driven and step by step or decimal and non-decimal
    • H04M7/1205Arrangements for interconnection between switching centres for working between exchanges having different types of switching equipment, e.g. power-driven and step by step or decimal and non-decimal where the types of switching equipement comprises PSTN/ISDN equipment and switching equipment of networks other than PSTN/ISDN, e.g. Internet Protocol networks

Abstract

根据本发明的一个实施例,提供了一种用于在两个或多个参与者(16)之间进行电话会议的方法。该方法包括从参与者(16)接收文本请求的指示。该方法还包括响应于所述指示,将所述电话会议的其他参与者的任何语音转换成文本。所述方法还包括将所述文本发送到与请求文本的所述参与者相关联的设备。所述设备可操作来显示所述文本。

Description

进行带可选语音到文本转换的电话会议的方法和系统
技术领域
本发明一般地涉及通信,更具体而言,涉及用于进行电话会议的方法和系统。
背景技术
现代商业实践常常需要若干人在电话上接触来参加电话会议。电话会议已引入了某些应用和技术,其优于会议中人们物理上位于相同位置的情形。例如,当时并未积极参与的电话会议参与者可能希望减弱音频输出,而仅仅收听电话会议。这种灵活性允许特定参与者在关注另一事务的同时,例如在与另一方谈话时,有选择地参与该电话会议。
但是,在进行次要任务的同时,尤其是进行需要听或说的那些任务时,在实际监视电话会议中仍然有很大的障碍。例如,减弱音频输出并收听电话会议的参与者在与第二方谈话或收听该电话会议中可能有困难。
发明内容
根据本发明的一个实施例,提供了一种在两个或更多参与者之间进行电话会议的方法。该方法包括从参与者接收文本请求的指示。该方法还包括响应于所述指示,将所述电话会议的其他参与者的任何语音转换成文本。所述方法还包括将所述文本发送到与请求文本的所述参与者相关联的设备。所述设备可操作来显示所述文本。
本发明的一些实施例提供许多技术优点。一些实施例可从这些优点中的某些、不从这些优点或从所有这些优点受益。例如,根据一个实施例,向被动参与者提供了电话会议的文本,这允许该被动参与者在进行第二任务的同时,视觉监视电话会议。这样一种选择允许被动参与者在与第二方会谈的同时通过阅读来监视电话会议,而不是被强迫来收听多方并试图来恰当地响应。根据另一个实施例,向被动参与者提供发言者的身份,由此允许被动参与者在进行第二任务的同时有选择的参与。有选择地参与电话会议的能力,允许被动参与者更关注其他任务,这增加了被动参与者的工作效率。
本领域技术人员可以很容易确定其他技术优点。
附图说明
现在结合附图来参考以下说明,所述附图中类似的标号指示类似的元件,其中:
图1是图示可能从本发明的教导受益的通信网络的示意图;
图2是图示图1的通信网络的多个部分的示意图,所述多个部分包括根据本发明一个实施例用于进行电话会议的系统;
图3是图示根据本发明一个实施例的图2的会议桥和语音到文本引擎的示意图;和
图4是图示用于利用根据本发明一个实施例的图2的系统来进行电话会议的方法的流程图。
具体实施方式
通过参考附图中的图1至4来最好地理解本发明的实施例,类似的标号被用于各个附图中类似和相应的部分。
图1图示了可能从本发明的教导受益的通信系统12。在本实施例中,通信系统12是在源和目的端点之间传输音频、视频、语音、数据以及其他合适类型的实时和非实时流量的分布式系统;但是,传输任何形式流量的其他通信系统也可以从本发明的教导受益。通信系统12包括连接到网络14的多个通信设备16,以及通过网关20和公共交换电话网络(“PSTN”)22连接到网络14的多个模拟电话18。通信设备16、模拟电话18和网关20通过以下链路连接到网络14和/或PSTN 22:双绞线、电缆、光纤、射频、红外、微波或任何其他合适类型或组合的有线或无线链路28。
在一个实施例中,网络14是因特网、广域网(“WAN”)、局域网(“LAN”)或其他合适网络。在因特网实施例中,网络14以因特网协议(“IP”)分组来传输信息。电话语音信息以IP语音(“VoIP”)格式来传输。诸如VoIP分组之类的实时IP分组被封装在实时传输协议(“RTP”)分组中以在网络14上传输。网络14可以包括任何其他合适类型的元件和链路,在所述链路上可以使用其他协议和格式来以其它方式合适地传输流量。
通信设备16包括诸如IP电话16A(在图2中示出,在下面讨论)之类的IP或其他数字电话、诸如个人计算机16B(在图2中示出,在下面讨论)之类的个人和其他合适的计算机或计算设备、诸如个人数字助理(“PDA”)之类的电子个人组织器、或其他合适类型的通信设备。通信设备16还可以包括能够传递实时音频、视频和/或其他信息,并能够通过网络14与其他设备或设备集一起参加会议的蜂窝或其他移动电话或手机或任何其他合适的通信设备或设备集,其例子是模拟电话18和网关20的组合。通信设备16还可以包括显示文本消息的屏幕,例如IP显示器16C(在图2中示出,在下面讨论)。除了传递实体信息之外,通信设备16还与网络14传递控制信息,以控制呼叫设置、挂断和处理,以及呼叫服务。
对于语音呼叫,通信设备16包括一个或多个实时应用,这些应用在接收到流量或基本接收到流量时播放该流量。可以利用编码/解码器(“codec”,未明确示出)来将以下信号从模拟信号转换成数字形式:用户所产生的音频、视频或其他信号,例如来自用户对电话机所说的话。数字编码的数据被封装到IP或其他合适的分组,以在网络14上传输。从网络14接收到的IP分组被转换回模拟信号并对用户播放。通信设备16可以以其它方式合适地编码、解码、压缩和解压缩在网络14上传输或从网络14接收的信号。
网关20提供模拟和/或数字格式之间的转换。模拟电话18通过PSTN22向网关20传递标准电话信号。在网关20处,标准电话信号被转换成VoIP格式的IP分组。类似地,从网络14所接收的VoIP分组被转换成标准电话信号,以通过PSTN 22传送到模拟电话18。网关20还在IP网络呼叫控制系统以及在PSTN 22中使用的ISDN、T1、CAS和其他信令协议之间进行转换。
在一个实施例中,呼叫管理器30和会议桥32被连接到网络14。呼叫管理器30和会议桥32可以位于中心设备中,或者使其功能分布于网络14或其外围设备。呼叫管理器30和会议桥32通过任何合适类型的有线或无线链路28耦合到网络14。在另一个实施例中,网络14可以在没有呼叫管理器30的情况下工作,其中通信设备16可以彼此或者与其他合适的网络元件直接传递控制信息。在此实施例中,由通信设备16和/或其他合适的网络元件提供服务。
呼叫管理器30管理网络14中的呼叫。呼叫是两个或多个端点之间的任何通信会话。端点可以是人和/或诸如电话或计算机之类的设备。会话可以包括实时连接、具有实时特性的连接、非实时连接和/或连接类型的组合。
呼叫管理器30响应于来自通信设备16的服务请求,包括通过网关20来自模拟电话18的服务请求。例如,呼叫管理器30可以为通信设备16提供语音邮件、桥接、群播、呼叫保持、电话会议和其他多方通信以及/或者其他合适的服务。呼叫管理器30通过以下方式来提供服务:实际进行服务、控制服务的进行、委托服务的进行、和/或以其它方式启动服务。
会议桥32在通信设备16之间提供电话会议以及其他合适的音频、视频和/或实时多方通信会话。多方通信会话包括交换音频和/或其他合适信息的两方或多方。具体而言,会议桥32接收来自参与的通信设备16的媒体,并使用合适的信号处理技术来混和来自每个参与的通信设备16的媒体,以生成会议输出流。在正常操作期间,各通信设备16接收这样的会议输出流,其包括来自所有其他参与的通信设备16的贡献。
在一个实施例的操作中,当呼叫被置于网络14上时首先向呼叫管理器30发送呼叫启动请求。例如,呼叫启动请求可以由通信设备16和/或用于模拟电话18的网关20生成。一旦呼叫管理器30接收到该呼叫启动请求,呼叫管理器30就向想要呼叫目的设备的启动通信设备16和/或用于模拟电话18的网关20发送控制信号。如果目的设备可以接受该呼叫,则目的设备答复呼叫管理器30其将接受该呼叫。通过接收到此承诺,呼叫管理器30向目的设备传输信号使其响铃。当该呼叫被应答时,呼叫管理器30指示被呼叫的设备和发起的设备开始向彼此发送媒体流。如果发起设备是模拟电话18,那么媒体流就发生在网关20和目的设备之间。网关20随后将媒体传输到模拟电话18。
在一个实施例中,对于电话会议,呼叫管理器30基于被呼叫的号码或其他合适准则来识别参与者。参与者是电话会议所涉及的任一方。在一个实施例中,呼叫管理器30控制会议桥32来设置、处理和挂断电话会议以及其他多方通信会话。在另一个实施例中,会议桥32设置、处理和挂断电话会议以及其他多方通信会话。在多方通信会话期间,参与者被连接到会议桥32,并且使媒体通过会议桥32流动。在一个实施例中,混和媒体以生成要被传输到各参与者的会议输出流。参与者的会议输出流包括所有其他参与者的媒体、其他参与者的子集、或由参与者和/或多方会话的类型所要求的其他合适的混和。
涉及在诸如网络14之类的网络上的音频通信的传统电话会议中的任何参与者,可以选择作为该电话会议的被动参与者。被动参与者是希望部分或完全不向电话会议提供输入的任何参与者。采用这样一种选择的原因可能是要应答另一个呼叫、与同事谈话、看新闻、或可以在监视电话会议的同时进行的任何其他任务。有许多被动参与电话会议的方法。例如,被动参与者可以减弱他/她的音频输出并仅仅收听电话会议。被动参与者还可以保持该电话会议。在关注另一事务的同时监视电话会议的灵活性增加了被动参与者的工作效率。但是,某些任务难以与听觉监视电话会议同时进行。例如,正在听觉监视电话会议的被动参与者可能发现难以参与同另一方的第二谈话,因为收听两个不同方会产生混乱和理解的隔阂。在这种情况下,听觉监视电话会议、第二谈话、或者这两者的质量都可能变差。
根据本发明的教导,用于进行电话会议的方法和系统包括向被动参与者提供电话会议的基本实时的文本流。这是有益的,因为被动参与者可能发现在进行另一任务的同时,使用视觉要比使用听觉更容易监视电话会议。可以在音频信号之外或代替音频信号来提供这样的文本。根据本发明的另一个实施例,这样的文本可以被提供给也主动参与电话会议的参与者。下面结合图2至4来更详细地描述该系统和方法的示例实施例的其他细节。
图2是图示图1的通信网络的多个部分的示意图,所述多个部分包括根据本发明的一个实施例进行电话会议的系统。会议桥32有助于在IP网络14上参与电话会议的通信设备16之间的通信。可从Cisco Systems得到名为“Cisco会议连接”的会议桥32的示例。会议桥32被耦合到语音到文本引擎46。语音到文本引擎46的示例可从IBM和Microsoft得到。或者,可以使用一般提供比语音到文本引擎更有限的语法能力的自适应语音识别系统,以及将语音转换成文本的现有或还未开发的任何其他合适设备。自适应语音识别系统的一个示例可从Nuance得到。语音到文本引擎46可以是会议桥32的一个组成部分或独立于会议桥32的单独组件。通信设备16通过链路28和IP网络14被链接到会议桥32。由通信设备16传输的参与者的语音,通过链路28被发送到IP网络14上的会议桥32。会议桥32恰当地转换并混和来自各通信设备16的语音,并将所得到的会议输出流发送到各通信设备16。语音到文本引擎46内的资源可以与会议桥32同时被保存,或者在其他合适时间被保存。
当参与者希望被动地参与电话会议或希望接收文本时,参与者传输文本请求的指示。参与者可以通过例如按下通信设备16上的“保持”按钮或“减弱”按钮或其他合适按钮来做出这样的请求。或者,可以通过合适的“软按钮”或其他合适技术来做出这样的请求。在一个示例中,传输指示文本请求的“信息元素”(IE)。当通信设备16在抑制输出的语音,或者当与通信相关联的用户仅仅希望在接收或不接收音频的情况下看到文本时,可以从通信设备16传输文本请求的指示。响应于接收到指示文本请求的信息元素,会议桥32将来自通信设备16的语音发送到语音到文本引擎46。语音到文本引擎46将语音转换成文本表示,并将文本发送回会议桥32。接着,会议桥32将文本发送到之前传输文本请求的通信设备16。下面结合图3提供关于会议桥32和语音到文本引擎46的其他细节。在其他实施例中,通信设备16可以绕过会议桥32直接向语音到文本引擎46发送音频。
在另一个实施例中,IP电话16a如上所述接收到文本请求的指示,但并不将这样的指示发送到会议桥32,而是将接收自会议桥32的任何语音直接传输到具体与IP电话17相关联的相关联语音到文本引擎,例如语音到文本引擎146。语音到文本引擎146随后将所接收的语音转换到文本,并将文本提供回给IP电话16a。这样,可以在不要求会议桥维持知道哪些参与者在请求文本的必要功能的情况下,将语音转换到文本。
在一个实施例中,被动参与者可以使用具有文本显示屏17的IP电话16a。当被动参与者使IP电话16a调用接收文本的特征时,会议桥32就将电话会议的文本传输到IP电话16a。接着,IP电话16a将文本显示到文本显示屏17上。请求文本的参与者在参与另一谈话的同时,可以通过阅读由文本显示屏17所显示的文本来监视电话会议。在请求文本的参与者是被动参与者的示例中,当被动参与者希望恢复主动参与电话会议时,被动参与者可以通过请求IP电话16a向会议桥32传输请求停止接收文本的指示,来调用停止文本特征。在一个示例中,通过放开参与者的通信设备16上的“减弱”或“保持”按钮可以发起这样的请求。在进入的语音被抑制的实施例中,响应于请求停止接收文本的指示,会议桥32恢复将会议输出流传输到发起该请求的通信设备16,并停止传输相关联的文本。或者,在进入的语音未被抑制的实施例中,停止接收文本的请求仅仅停止接收文本。
在一个实施例中,会议桥32可以传输电话会议的各发言参与者的身份。在另一个实施例中,会议桥32可以向IP电话16a传输会议输出流、文本以及与文本相关联的参与者的身份。取决于被动参与者所表达的需要,会议输出流、文本和/或参与者的身份每一种自身或者任何的组合,都可以由会议桥32传输到任何的通信设备16。在另一个实施例中,当其他参与者中的某一个在发言时,被动参与者可以收到提醒。在另一个实施例中,会议桥32可以生成伴随文本的时间戳,这里该时间戳将文本关联到各参与者的语音和/或会议输出流。例如,时间戳可以包括会议桥32接收到各参与者的语音时的时间。本领域技术人员将能够确定将文本关联到各参与者的语音和/或会议输出流的不同方法。在另一个实施例中,IP电话16a可以使用耦合到IP电话16a的存储介质19来记录文本、发言者的身份、时间戳和/或会议输出语音流。存储设备19也可以连接到网络14,而不是与某个电话相关联。
在一个实施例中,通过网关20使用模拟电话18来参与电话会议的被动参与者或者其他请求文本的参与者,也可以包括个人计算机16b来监视电话会议。个人计算机16b可以耦合到模拟电话18或者位于模拟电话18附近,以使得参与者可以通过个人计算机16来监视电话会议,并取决于参与者的需要来访问模拟电话18以主动参与电话会议。一旦通过使用模拟电话18或个人计算机16b将特征调用传输到会议桥32,会议桥32就可以通过以下来响应,即取决于被动参与者所表达的需要,将文本、各发言参与者的身份、会议输出流和/或时间戳每一种自身或者任何的组合,传输到个人计算机16b。
在一个实施例中,被动参与者或其他请求文本的参与者可以选择使用耦合到个人计算机16b或连接到网络14的存储介质19,来记录文本和/或时间戳和/或身份和/或会议输出流。在另一个实施例中,可以使用IP电话16a的存储介质19来记录这些。在另一个实施例中,存储可以发生在中心站点。可以组合使用模拟电话18和个人计算机16b来向参与者提供与IP电话16a相同的选择。例如,模拟电话18可以用来主动参与电话会议,而个人计算机16b用来记录进入的数据并监视电话会议。一旦向会议桥32传输了指示参与者希望在电话会议中停止接收文本的请求,模拟电话18就又通过网关20从会议桥32接收会议输出流。在被动参与者的情况下,通过放开通信设备16上的“减弱”或“保持”按钮或与被动参与者相关联的其他合适按钮,这样的请求可以有效。如上所述,在一个实施例中用户可以在没有抑制语音分组的情况下同时接收到语音和文本两者。
在一个实施例中,IP显示器16c可以接收电话会议的发言参与者的身份。监视IP显示器16c上的发言参与者的身份,允许被动参与者或其他请求文本的参与者在某个发言者开始在电话会议中发言时,使用通信设备16来有选择地参与电话会议。可以结合IP电话16a、模拟电话18或其他通信设备来使用IP显示器16c,以允许参与者监视发言参与者的身份。IP显示器16c还可以显示由会议桥32发送的文本。
在一个实施例中,IP显示器16c通过系统目录21与IP电话1 7相关联。系统目录21可以包括传统用于网络中的认证目的的访问信息,但在此实施例中包括将IP显示器16c与IP电话16a相关联的信息。这样,无论何时要将数据发送到IP电话16a,会议桥32都知道替代地将数据发送到IP显示器16c。在此实施例中IP显示器16c和IP电话16a具有不同的IP地址。这种关联可以响应于用户选择IP显示器16c来接收文本的指示而发生,或者可以响应于确定IP电话不具有相关联的显示器而由会议桥32自动进行。如果会议桥32确定IP电话16a不具有相关联的显示器,那么会议桥32还可以从IP电话16a请求另一个屏幕来向其发送文本。
在一个实施例中,会议桥32可以使用加密引擎33来加密任何输出的数据。加密引擎33可以是会议桥32的组成部分或者独立于会议桥32。
系统24提供了这样的技术优点,即在进行其他任务的同时提供监视电话会议的其它方法。取决于其它任务的性质,被动参与者可以选择通过阅读文本、发言者的身份,或在接收文本的同时收听发言者,或记录所有进入数据以在以后回顾,或者通过这些的任何组合,来监视电话会议。例如,如果其它任务是参与同另一方的谈话,被动参与者可以选择通过阅读电话会议的文本并以较低的音量来收听相应的会议输出流,来监视电话会议。
图3图示了根据本发明一个实施例的会议桥32的细节。在此实施例中,会议桥32被耦合到语音到文本引擎46。会议桥32提供两或多个参与者之间的实时多方音频连接。会议桥32可以在不偏离本发明的范围的情况下支持其他类型的合适的多方通信会话,包括实时视频流。
会议桥32包括控制器50、缓冲器52、数字信号处理器53、混和器58和数据库60,数字信号处理器53包括代码转换器54、增益控制单元55、定时单元57和滤波器59。会议桥32的控制器50、代码转换器54、增益控制单元55、定时单元57、滤波器59和混和器58,以及通信系统12的其他合适组件,可以包括在介质中编码的逻辑。逻辑包括用于执行所编程任务的功能指令。介质可以包括计算机磁盘或其他合适的计算机可读介质、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他合适的专用或通用目的处理器、传输介质、或可在其中编码并使用逻辑的其他合适介质。在此示例中,通过数字信号处理器53来实现代码转换器54、增益控制单元55、定时单元57和滤波器59。
缓冲器52包括输入和输出缓冲器。输入缓冲器接收并缓冲来自通信设备16的输入音频流的分组,以由会议桥32来处理。输出缓冲器接收并缓冲由会议桥32和/或语音到文本引擎46所产生的会议输出流和/或会议输出流的文本形式(文本),以传输到通信设备16,通信设备16包括例如IP电话16a、个人计算机16b和IP显示器16c。
数字信号处理器53内的代码转换器54包括输入和输出代码转换器。输入代码转换器54从相应的缓冲器52接收输入音频流,并将该音频流从通信设备16的压缩格式转换成会议桥32的未压缩格式,以在会议桥32或语音到文本引擎46中混和和处理。在一个示例中,未压缩格式指的是表示原始、未压缩的语音或数据的G.711格式,而压缩格式指的是表示压缩语音的G.729格式。相反,代码转换器54接收未压缩格式的会议输出流,并将会议输出流转换成各参与者的通信设备16以及被动参与者的通信设备16的压缩格式。这样,会议桥32允许参与者使用各种设备和技术来参与电话会议。
增益控制55为会议桥32的各个组件提供增益控制。定时单元57控制与会议桥32的各个组件相关联的定时。滤波器59为会议桥32提供滤波能力。在此示例中,这些组件中的每一个都如所示地通过数字信号处理器53来实现。
混和器58包括多个求和器或其他合适的信号处理资源,每个都可操作来将多个输入音频流求和、相加或组合成用于参与电话会议的通信设备16的会议输出流。一旦混和器58已生成了会议输出流,那么就可以取决于是否曾从参与者接收到文本请求的指示,而将会议输出流路由到语音到文本引擎46。会议输出流由相应的代码转换器54转换,并由相应的输出缓冲器52缓冲,以传输到相应的通信设备16。
数据库60包括用于会议桥32的各个正在进行的电话会议的一组会议参数62。各个电话会议的会议参数62包括对电话会议的参与者64的标识。在一个实施例中,在电话会议开始时基于呼叫者ID、电话号码、IP地址或其他合适的标识符来识别相应通信设备16的参与者。进入的媒体流的每个分组可以直接或间接地识别相关联的参与者,或者可以提供对参与者身份的其他合适指示。在一个实施例中,来自各通信设备16的每组分组可以包含与特定通信设备16相关联的参与者的IP地址。接着,会议桥32可以向被动参与者或者向以其它方式请求文本的参与者,发送特定参与者身份的指示,同时发送或不发送该参与者的语音或语音的文本版本。
控制器50指示会议桥32的其他组件,并在一个实施例中与呼叫管理器30通信来设置、处理和挂断电话会议。控制器50还可以或者直接从通信设备16或者通过呼叫管理器30接收希望接收文本的指示。可以在频带内与音频流一起或在频带外的控制链路或信道上,从参与者接收这样的指示。
响应于希望接收文本的指示,控制器50指示混和器58将进入到混和器58的所有流的组合发送到语音到文本引擎46。一接收到进入流的组合,语音到文本引擎46就将会议输出流转换成文本。在转换之后,语音到文本引擎46将文本发送回会议桥32。会议桥32通过使用恰当的代码转换器54和/或缓冲器52,随后将文本发送到发起文本请求的通信设备16。在一个实施例中,会议桥32将会议输出语音流与输出的文本一起发送。在另一个实施例中,会议桥32传输存储在数据库60中的各参与者的身份64。在另一个实施例中,会议桥32将文本和/或会议输出流与负责特定发言和/或文本的各参与者的身份64一起传输。在另一个实施例中,会议桥32可以生成时间戳来耦合到文本,其中时间戳有助于将文本与语音关联起来。取决于被动参与者的需要,可以由会议桥32分别或以任何组合提供文本、语音、时间戳和/或身份64。在另一个实施例中,可以使用加密引擎33来加密从输出缓冲器52传输的所有或部分媒体流。在另一个实施例中,端点16直接与语音到文本引擎通信。
图4示出了根据本发明一个实施例的方法110的流程图。可以由图2的系统24利用图3的会议桥32和语音到文本引擎46,或者由其他系统来实现方法110的一个实施例。方法110开始于步骤80。在步骤82,使用或不使用呼叫管理器30来设置电话会议。会议桥32或呼叫管理器30可以确定电话会议的各参与者的身份64。可以从例如通信设备16的IP地址来做出此确定。在另一个实施例中,用户登陆到电话会议,此时认证用户的身份。在步骤84,会议桥32确定是否至少有一个通信设备16在被动参与者的指导下或者在以其它方式指示转录文本的请求的指导下正在抑制任何输出的信号。当参与者的通信设备16触发了对要传输文本的请求时,会议桥32可以做出此确定,所述请求表示参与者请求在抑制或不抑制输出的语音分组的情况下的文本。用户可以通过通信设备16上的按钮、通过软键或通过其他合适技术来表示在抑制或不抑制输出的语音分组的情况下接收文本的这样一种要求,以使得被转录的文本被发送到通信设备16。
如果会议桥32确定没有通信设备16在抑制任何输出的信号或者确定未请求文本,那么会议桥32就在步骤86继续向各通信设备16发送会议输出流。在一个实施例中,如果会议桥32从一个或多个通信设备16接收到文本请求,那么会议桥32就在步骤88采取措施将来自各通信设备16的语音转换成文本。一旦语音被转换成文本,那么会议桥32就在步骤90将文本发送到发起文本请求的通信设备16。当在通信设备16处接收到文本时,接收文本的参与者就在步骤92监视文本。接收文本的参与者可以在进行另一任务的同时监视文本。方法110在步骤100结束。
在一个实施例中,会议桥32可以在步骤102仅传输各发言参与者的身份64,而非相关联的实际文本。接收文本的参与者随后在步骤92监视各发言参与者的身份64,以有选择地参与电话会议。在另一个实施例中,可以在步骤104加密从会议桥32传输的所有或部分媒体流。例如,在步骤102处发送身份64之前,会议桥32可以在步骤104使用加密引擎33来加密身份64。在另一个实施例中,在步骤90发送文本和/或会议输出流和/或身份64之前,加密引擎33可以被用来在步骤104加密文本和/或会议输出流和/或身份64。在另一个实施例中,会议桥32可以在步骤106生成时间戳并将其耦合到输出的文本。可以通过使用网络连接存储设备来记录语音分组或转录文本,网络连接存储设备指被连接到网络的中央存储站点;但是,在一些实施例中,在本地记录这样的信息可能是有益的,例如在IP电话16a的存储介质19中,如步骤108所图示。
以上详细描述的方法和系统对于在执行另一任务的同时进行电话会议的难题提供了一种解决方案。本发明的一些实施例的好处在于,参与者可以根据其它任务的性质来选择监视电话会议的方法。
虽然已经详细描述了本发明,但是应该理解到可以向其做出各种变化、替代和改变,而不偏离如权利要求所限定的本发明的精神和范围。

Claims (55)

1.一种在两个或多个参与者之间进行电话会议的方法,包括:
从所述电话会议的参与者接收文本请求的指示;
响应于来自所述参与者的所述指示,将所述电话会议的其他参与者的任何语音转换成文本;以及
将所述文本发送到与从其接收到所述文本请求的指示的所述参与者相关联的设备,所述设备可操作来显示所述文本。
2.如权利要求1所述的方法,还包括将所述电话会议的各参与者的身份发送到所述设备,其中所述身份与关联到各参与者的所述语音的所述文本相关联。
3.如权利要求1所述的方法,还包括加密所述文本。
4.如权利要求1所述的方法,还包括将与所述文本相对应的所述语音发送到所述设备。
5.如权利要求4所述的方法,其中所述文本包括时间戳,所述时间戳将所述文本与对应于所述文本的所述语音关联起来。
6.如权利要求1所述的方法,还包括在所述设备处记录所述文本。
7.如权利要求1所述的方法,其中响应于参与者将所述电话会议置于保持而接收到所述文本请求的指示。
8.如权利要求1所述的方法,其中响应于参与者减弱呼叫而接收到所述文本请求的指示。
9.如权利要求1所述的方法,其中所述文本请求的指示包括以下指示,即在与请求文本的所述参与者相关联的电话上按下按钮的指示。
10.如权利要求1所述的方法,其中所述文本请求的指示包括以下指示,即按下与请求文本的所述参与者相关联的软键的指示。
11.如权利要求1所述的方法,其中所述文本请求的指示包括以下指示,即请求文本的所述参与者正在抑制向请求文本的所述参与者传输语音媒体分组的指示。
12.如权利要求1所述的方法,其中所述文本请求的指示包括以下指示,即请求文本的所述参与者正在抑制从请求文本的所述参与者传输语音媒体分组的指示。
13.如权利要求1所述的方法,还包括将请求文本的所述参与者的任何语音转换成文本。
14.如权利要求1所述的方法,还包括提醒请求文本的所述参与者所述其他参与者中的特定一个正在发言。
15.一种与多个参与者进行电话会议的方法,包括:
确定向所述电话会议提供输入的每个参与者的身份;
从所述电话会议的参与者接收文本请求的指示;
响应于从所述参与者接收到所述文本请求的指示,当各个其他参与者在发言时,将所述电话会议的所述各个其他参与者的所述身份,发送到与从其接收到所述文本请求的指示的所述参与者相关联的设备,所述设备可操作来显示各参与者的所述身份。
16.如权利要求15所述的方法,还包括响应于所述文本请求的指示,将所述电话会议的各个其他参与者的任何语音转换成文本,并将所述文本发送到所述设备,所述文本与各个参与者的所述身份相关联。
17.如权利要求16所述的方法,还包括加密所述文本。
18.如权利要求16所述的方法,还包括将与所述文本相关联的所述语音发送到所述设备。
19.如权利要求18所述的方法,其中所述文本包括时间戳,所述时间戳将所述文本与对应于所述文本的所述语音关联起来。
20.如权利要求19所述的方法,还包括在所述设备处记录所述文本和对应于所述文本的所述语音。
21.如权利要求20所述的方法,其中记录所述文本和语音,包括在所述设备处记录所述语音和文本。
22.如权利要求20所述的方法,其中记录所述文本和语音,包括在连接到网络的中央存储单元中记录所述语音和文本。
23.如权利要求15所述的方法,其中响应于参与者将所述电话会议置于保持而接收到所述文本请求的指示。
24.如权利要求15所述的方法,其中响应于参与者减弱呼叫而接收到所述文本请求的指示。
25.如权利要求15所述的方法,其中所述文本请求的指示包括以下指示,即在与请求文本的所述参与者相关联的电话上按下按钮的指示。
26.如权利要求15所述的方法,其中所述文本请求的指示包括以下指示,即按下与请求文本的所述参与者相关联的软键的指示。
27.如权利要求15所述的方法,其中所述文本请求的指示包括以下指示,即请求文本的所述参与者正在抑制向请求文本的所述参与者传输语音媒体分组的指示。
28.如权利要求15所述的方法,其中所述文本请求的指示包括以下指示,即请求文本的所述参与者正在抑制从请求文本的所述参与者传输语音媒体分组的指示。
29.如权利要求15所述的方法,还包括当请求文本的所述参与者在发言时,向所述设备发送请求文本的所述参与者的所述身份。
30.一种与多个参与者进行电话会议的系统,包括:
会议桥,所述会议桥可操作来从至少一个所述参与者接收文本请求的指示,并响应于所述指示,向请求文本的所述参与者发送代表一个或多个所述参与者的语音的文本;和
被耦合到所述会议桥的语音到文本引擎,所述引擎可操作来将所述一个或多个参与者的所述语音转换成所述文本,并将所述文本发送到所述会议桥。
31.如权利要求30所述的系统,其中所述会议桥可操作来确定所述电话会议的各个参与者的身份,并将所述身份发送到做出所述文本请求的所述参与者,每个身份与代表各个参与者的所述语音的相对应文本相关联。
32.如权利要求30所述的系统,还包括被耦合到所述会议桥的加密引擎。
33.如权利要求30所述的系统,其中所述会议桥可操作来将各个参与者的所述语音与所述文本一起发送到请求文本的所述参与者。
34.如权利要求33所述的系统,其中所述会议桥可操作来将时间戳与所述文本耦合,随后将所述文本发送到请求文本的所述参与者,所述时间戳将所述文本与对应于所述文本的所述语音关联起来。
35.如权利要求30所述的系统,还包括与所述参与者相关联的设备,所述设备包括存储介质。
36.如权利要求35所述的系统,其中所述设备是耦合到因特网协议电话的文本显示屏。
37.如权利要求35所述的系统,其中所述设备是计算机。
38.如权利要求30所述的系统,其中来自至少一个所述参与者的所述文本请求的指示,还指示所述参与者正在抑制向所述参与者传输语音媒体分组。
39.如权利要求30所述的系统,其中所述会议桥和语音到文本引擎每个都可操作来响应于并发保留请求。
40.一种进行电话会议的系统,包括:
会议管理装置,所述会议管理装置用于从至少一个参与者接收文本请求的指示,并响应于所述指示,向请求文本的所述参与者发送代表各个参与者的语音的文本;和
被耦合到所述会议管理装置的语音到文本转换装置,所述语音到文本转换装置用于将各个参与者的所述语音转换成所述文本,并将所述文本发送到所述会议管理装置。
41.如权利要求38所述的系统,还包括这样的装置,所述装置用于将所述电话会议的各个参与者的身份与各个参与者对所述电话会议的输入相关联,并将所述身份耦合到相对应的文本,所述装置被耦合到所述会议管理装置。
42.如权利要求38所述的系统,还包括用于收听所述语音的通信装置,所述通信装置被耦合到显示装置。
43.如权利要求38所述的系统,其中所述会议管理装置还用于将所述语音传输到所述通信装置。
44.如权利要求41所述的系统,其中所述会议管理装置还用于将时间戳与所述文本耦合,随后将所述文本传输到所述显示装置,所述时间戳将所述文本与对应于所述文本的所述语音关联起来。
45.如权利要求42所述的系统,还包括用于记录所述文本和所述语音的存储装置,所述存储装置被耦合到所述通信装置。
46.如权利要求38所述的系统,其中来自至少一个所述参与者的所述文本请求的指示,还指示所述参与者正在抑制向所述参与者传输语音媒体分组。
47.一种显示信息的方法,包括:
从连接到网络并具有第一地址的因特网协议电话传输对数据的请求;以及
响应于所述被传输的请求,在连接到所述网络并具有不同于所述第一地址的第二地址的因特网协议显示器处接收数据。
48.如权利要求47所述的方法,其中所述数据包括文本。
49.如权利要求47所述的方法,还包括将所述因特网协议电话与所述因特网协议显示器关联起来。
50.如权利要求49所述的方法,其中所述关联包括通过连接到所述网络的系统目录来将所述因特网协议电话与所述因特网协议显示器关联起来。
51.一种在两个或多个参与者之间进行电话会议的方法,包括:
在电话处,从使用所述电话的所述电话会议的参与者接收文本请求的指示;
响应于所述指示,自动将在所述电话处接收到的任何语音从所述电话传输到语音到文本引擎;以及
在所述电话处从所述语音到文本引擎接收指示所接收语音的文本。
52.如权利要求51所述的方法,其中响应于参与者将所述电话会议置于保持而接收到所述文本请求的指示。
53.如权利要求51所述的方法,其中响应于参与者减弱呼叫而接收到所述文本请求的指示。
54.如权利要求51所述的方法,其中所述文本请求的指示包括以下指示,即在与请求文本的所述参与者相关联的电话上按下按钮的指示。
55.如权利要求51所述的方法,其中所述文本请求的指示包括以下指示,即按下与请求文本的所述参与者相关联的软键的指示。
CN038041979A 2002-02-20 2003-02-11 进行带可选语音到文本转换的电话会议的方法和系统 Expired - Fee Related CN1636384B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/081,608 2002-02-20
US10/081,608 US7236580B1 (en) 2002-02-20 2002-02-20 Method and system for conducting a conference call
PCT/US2003/004042 WO2003071774A1 (en) 2002-02-20 2003-02-11 Method and system for conducting conference calls with optional voice to text translation

Publications (2)

Publication Number Publication Date
CN1636384A true CN1636384A (zh) 2005-07-06
CN1636384B CN1636384B (zh) 2011-08-10

Family

ID=27752973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN038041979A Expired - Fee Related CN1636384B (zh) 2002-02-20 2003-02-11 进行带可选语音到文本转换的电话会议的方法和系统

Country Status (6)

Country Link
US (1) US7236580B1 (zh)
EP (1) EP1477017B1 (zh)
CN (1) CN1636384B (zh)
AU (1) AU2003215153B2 (zh)
CA (1) CA2473147C (zh)
WO (1) WO2003071774A1 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592596A (zh) * 2011-01-12 2012-07-18 鸿富锦精密工业(深圳)有限公司 语音文字转换装置及方法
WO2012163127A1 (zh) * 2011-06-02 2012-12-06 中兴通讯股份有限公司 语音处理方法及系统
CN103379460A (zh) * 2012-04-20 2013-10-30 华为终端有限公司 一种语音消息处理方法及终端
WO2014085985A1 (zh) * 2012-12-04 2014-06-12 Itp创新科技有限公司 一种通话转录系统和方法
CN104067603A (zh) * 2012-01-30 2014-09-24 国际商业机器公司 可视化跨电话会议的对话
CN105094641A (zh) * 2015-07-15 2015-11-25 百度在线网络技术(北京)有限公司 语音问答交互方法和装置
CN105469790A (zh) * 2014-08-29 2016-04-06 上海联影医疗科技有限公司 会诊信息处理方法及装置
WO2016119226A1 (zh) * 2015-01-30 2016-08-04 华为技术有限公司 一种多方通话中语音转文本的方法及装置
CN108430043A (zh) * 2012-08-16 2018-08-21 三星电子株式会社 用于提供使用文本数据的语音通话的方法及其电子装置
CN109068089A (zh) * 2018-09-30 2018-12-21 视联动力信息技术股份有限公司 一种会议数据生成方法和装置
CN110291769A (zh) * 2017-06-16 2019-09-27 株式会社科学艺术 信号处理装置、通信系统、信号处理装置中实施的方法、信号处理装置中执行的程序、通信终端中实施的方法、以及通信终端中执行的程序
CN111243594A (zh) * 2018-11-28 2020-06-05 海能达通信股份有限公司 一种音频转换文字的方法及装置

Families Citing this family (108)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6603835B2 (en) 1997-09-08 2003-08-05 Ultratec, Inc. System for text assisted telephony
US6501739B1 (en) * 2000-05-25 2002-12-31 Remoteability, Inc. Participant-controlled conference calling system
US8416925B2 (en) 2005-06-29 2013-04-09 Ultratec, Inc. Device independent text captioned telephone service
TW200427293A (en) * 2003-05-16 2004-12-01 Hon Hai Prec Ind Co Ltd IP phone and method
US20060189337A1 (en) * 2003-07-18 2006-08-24 Farrill Craig F Premium voice services for wireless communications systems
US7590231B2 (en) * 2003-08-18 2009-09-15 Cisco Technology, Inc. Supporting enhanced media communications in communications conferences
US8515024B2 (en) 2010-01-13 2013-08-20 Ultratec, Inc. Captioned telephone service
US8027276B2 (en) * 2004-04-14 2011-09-27 Siemens Enterprise Communications, Inc. Mixed mode conferencing
KR20050101505A (ko) * 2004-04-19 2005-10-24 삼성전자주식회사 무선 통신 시스템에서 다중 세션 모니터링 방법 및 장치
DE102004021321B8 (de) * 2004-04-30 2011-11-10 Siemens Ag Verfahren und Einheit zum Ermitteln nutzbarer Dienste
US8234335B1 (en) * 2004-06-29 2012-07-31 Sprint Spectrum L.P. Customized grouping of participants in real-time conference set-up
US7532713B2 (en) 2004-09-23 2009-05-12 Vapps Llc System and method for voice over internet protocol audio conferencing
US10057105B2 (en) 2004-11-23 2018-08-21 Kodiak Networks, Inc. Architecture framework to realize push-to-X services using cloudbased storage services
US9485787B2 (en) 2005-05-24 2016-11-01 Kodiak Networks, Inc. Method to achieve a fully acknowledged mode communication (FAMC) in push-to-talk-over-cellular (PoC)
US8036692B2 (en) * 2005-08-08 2011-10-11 Kodiaks Networks, Inc. Brew platform enabling advanced voice services (AVS) including push-to-talk, push-to-conference and push-to-message on wireless handsets and networks
US10178513B2 (en) 2004-11-23 2019-01-08 Kodiak Networks, Inc. Relay-mode and direct-mode operations for push-to-talk-over-cellular (PoC) using WiFi-technologies
US20110183659A1 (en) * 2009-12-04 2011-07-28 Kodiak Networks, Inc. Community group client and community auto discovery solutions in a wireless communications network
US8676189B2 (en) * 2008-01-24 2014-03-18 Kodiak Networks, Inc. Converged mobile-web communications solution
US9137646B2 (en) 2004-11-23 2015-09-15 Kodiak Networks, Inc. Method and framework to detect service users in an insufficient wireless radio coverage network and to improve a service delivery experience by guaranteed presence
US10116691B2 (en) 2004-11-23 2018-10-30 Kodiak Networks, Inc. VoIP denial-of-service protection mechanisms from attack
US9913300B2 (en) 2011-12-14 2018-03-06 Kodiak Networks, Inc. Push-to-talk-over-cellular (PoC)
US10750327B2 (en) 2004-11-23 2020-08-18 Kodiak Networks Inc Method for multiplexing media streams to optimize network resource usage for push-to-talk-over-cellular service
US8369829B2 (en) * 2010-03-03 2013-02-05 Kodiak Networks, Inc. Prepaid billing solutions for push-to-talk in a wireless communications network
US10111055B2 (en) 2004-11-23 2018-10-23 Kodiak Networks, Inc. Optimized methods for large group calling using unicast and multicast transport bearer for PoC
US7853279B2 (en) * 2006-04-26 2010-12-14 Kodiak Networks, Inc. Advanced features on a real-time exchange system
US8670760B2 (en) 2008-01-24 2014-03-11 Kodiak Networks, Inc. Converged mobile-web communications solution
US10367863B2 (en) 2004-11-23 2019-07-30 Kodiak Networks Inc. Method for providing dynamic quality of service for push-to-talk service
US7739109B2 (en) * 2005-01-12 2010-06-15 Microsoft Corporation System and process for muting audio transmission during a computer network-based, multi-party teleconferencing session
US20060184629A1 (en) * 2005-02-16 2006-08-17 Izdepski Erich J System and method for relaying a web logging message via a dispatch communication
US8015241B2 (en) * 2005-02-16 2011-09-06 Nextel Communications Inc. Apparatus and method for notifying of the posting of a web logging message via a dispatch communication
US8190672B2 (en) * 2005-02-16 2012-05-29 Nextel Communications Inc. Apparatus and method for sending a web logging message to a dispatch communication device
US8185575B2 (en) * 2005-02-16 2012-05-22 Nextel Communications Inc. Apparatus and method for posting a web logging message via a dispatch communication
US8185573B2 (en) * 2005-02-16 2012-05-22 Nextel Communications Inc. System and method for posting a web logging message via a dispatch communication
US8185574B2 (en) * 2005-02-16 2012-05-22 Nextel Communications Inc. System and method for retrieving a web logging message via a dispatch communication
US8150908B2 (en) * 2005-02-16 2012-04-03 Nextel Communications Inc. System and method for notifying of the posting of a web logging message via a dispatch communication
US7917178B2 (en) * 2005-03-22 2011-03-29 Sony Ericsson Mobile Communications Ab Wireless communications device with voice-to-text conversion
ES2299294B1 (es) 2005-05-24 2009-04-01 Vodafone España, S.A. Sistema y metodo de transcripcion de conversaciones telefonicas en tiempo real.
US20060293888A1 (en) * 2005-06-27 2006-12-28 Lucent Technologies Inc. Providing text during a live voice conversation over a telephone network
US11258900B2 (en) 2005-06-29 2022-02-22 Ultratec, Inc. Device independent text captioned telephone service
US7570752B2 (en) * 2005-09-23 2009-08-04 Alcatel Lucent Telephony/conference activity presence state
US8442197B1 (en) * 2006-03-30 2013-05-14 Avaya Inc. Telephone-based user interface for participating simultaneously in more than one teleconference
US8510109B2 (en) 2007-08-22 2013-08-13 Canyon Ip Holdings Llc Continuous speech transcription performance indication
WO2007117626A2 (en) 2006-04-05 2007-10-18 Yap, Inc. Hosted voice recognition system for wireless devices
US9436951B1 (en) 2007-08-22 2016-09-06 Amazon Technologies, Inc. Facilitating presentation by mobile device of additional content for a word or phrase upon utterance thereof
US20090124272A1 (en) 2006-04-05 2009-05-14 Marc White Filtering transcriptions of utterances
US9325749B2 (en) 2007-01-31 2016-04-26 At&T Intellectual Property I, Lp Methods and apparatus to manage conference call activity with internet protocol (IP) networks
WO2008100466A1 (en) * 2007-02-09 2008-08-21 Selective Broadcasting Corporation System and method for providing telephonic access to an audio stream
JP5020663B2 (ja) * 2007-03-08 2012-09-05 京セラ株式会社 移動体通信機、通信システム、及び通信方法
US20090076917A1 (en) * 2007-08-22 2009-03-19 Victor Roditis Jablokov Facilitating presentation of ads relating to words of a message
US8352261B2 (en) * 2008-03-07 2013-01-08 Canyon IP Holdings, LLC Use of intermediate speech transcription results in editing final speech transcription results
US8352264B2 (en) 2008-03-19 2013-01-08 Canyon IP Holdings, LLC Corrective feedback loop for automated speech recognition
US8611871B2 (en) 2007-12-25 2013-12-17 Canyon Ip Holdings Llc Validation of mobile advertising from derived information
US8326636B2 (en) * 2008-01-16 2012-12-04 Canyon Ip Holdings Llc Using a physical phenomenon detector to control operation of a speech recognition engine
US9973450B2 (en) * 2007-09-17 2018-05-15 Amazon Technologies, Inc. Methods and systems for dynamically updating web service profile information by parsing transcribed message strings
US8340086B2 (en) 2007-04-19 2012-12-25 At&T Intellectual Property I, Lp Methods and apparatus to protect and audit communication line status
US11683643B2 (en) 2007-05-04 2023-06-20 Staton Techiya Llc Method and device for in ear canal echo suppression
US8526645B2 (en) 2007-05-04 2013-09-03 Personics Holdings Inc. Method and device for in ear canal echo suppression
US11856375B2 (en) 2007-05-04 2023-12-26 Staton Techiya Llc Method and device for in-ear echo suppression
US10194032B2 (en) 2007-05-04 2019-01-29 Staton Techiya, Llc Method and apparatus for in-ear canal sound suppression
US9053489B2 (en) 2007-08-22 2015-06-09 Canyon Ip Holdings Llc Facilitating presentation of ads relating to words of a message
US8335829B1 (en) 2007-08-22 2012-12-18 Canyon IP Holdings, LLC Facilitating presentation by mobile device of additional content for a word or phrase upon utterance thereof
WO2009055808A1 (en) * 2007-10-25 2009-04-30 Kodiak Networks, Inc. Connected portfolio services for a wireless communications network
US20090109961A1 (en) * 2007-10-31 2009-04-30 John Michael Garrison Multiple simultaneous call management using voice over internet protocol
US20090234704A1 (en) * 2008-03-14 2009-09-17 Roher Larry E System and method for quantifying and using virtual travel mileage
US8676577B2 (en) 2008-03-31 2014-03-18 Canyon IP Holdings, LLC Use of metadata to post process speech recognition output
US7532714B1 (en) 2008-05-15 2009-05-12 International Business Machines Corporation Method for discrete communication with a meeting speaker during a teleconference
US8301454B2 (en) 2008-08-22 2012-10-30 Canyon Ip Holdings Llc Methods, apparatuses, and systems for providing timely user cues pertaining to speech recognition
CA2740240A1 (en) * 2008-10-20 2010-04-29 Kodiak Networks, Inc. Hybrid push-to-talk for mobile phone networks
US9276761B2 (en) * 2009-03-04 2016-03-01 At&T Intellectual Property I, L.P. Method and apparatus for group media consumption
US20100238842A1 (en) * 2009-03-19 2010-09-23 Microsoft Corporation Phone conferencing architecture with optimized services management
JP5332798B2 (ja) * 2009-03-26 2013-11-06 ブラザー工業株式会社 通信制御装置、通信制御方法、及び通信制御プログラム
WO2010117815A1 (en) * 2009-03-30 2010-10-14 Kodiak Networks, Inc. Enhanced group calling features for connected portfolio services in a wireless communications network
US20100268534A1 (en) * 2009-04-17 2010-10-21 Microsoft Corporation Transcription, archiving and threading of voice communications
US8621011B2 (en) 2009-05-12 2013-12-31 Avaya Inc. Treatment of web feeds as work assignment in a contact center
US8768705B2 (en) * 2009-10-27 2014-07-01 Cisco Technology, Inc. Automated and enhanced note taking for online collaborative computing sessions
FR2952492B1 (fr) * 2009-11-10 2012-03-30 Alcatel Lucent Procede de diffusion d'un flux de donnees et procede d'interaction entre utilisateurs
US20110195739A1 (en) * 2010-02-10 2011-08-11 Harris Corporation Communication device with a speech-to-text conversion function
US9009040B2 (en) * 2010-05-05 2015-04-14 Cisco Technology, Inc. Training a transcription system
DK2599326T3 (en) 2010-05-21 2016-02-01 Kodiak Networks Inc Predictive wake-up call for optimizing POC (push-to-talk-over-cellular) call setup
US8744860B2 (en) * 2010-08-02 2014-06-03 At&T Intellectual Property I, L.P. Apparatus and method for providing messages in a social network
US9230546B2 (en) * 2011-11-03 2016-01-05 International Business Machines Corporation Voice content transcription during collaboration sessions
CA2804368C (en) 2012-02-01 2018-03-13 Kodiak Networks, Inc. Wifi interworking solutions for push-to-talk-over-cellular (poc)
MX350027B (es) 2013-07-23 2017-08-23 Kodiak Networks Inc Presencia efectiva para redes de pulsar para hablar por teléfono celular (poc).
US20150170651A1 (en) * 2013-12-12 2015-06-18 International Business Machines Corporation Remedying distortions in speech audios received by participants in conference calls using voice over internet (voip)
US9854439B2 (en) 2014-02-07 2017-12-26 First Principles, Inc. Device and method for authenticating a user of a voice user interface and selectively managing incoming communications
US20180270350A1 (en) 2014-02-28 2018-09-20 Ultratec, Inc. Semiautomated relay method and apparatus
US10878721B2 (en) 2014-02-28 2020-12-29 Ultratec, Inc. Semiautomated relay method and apparatus
US10389876B2 (en) 2014-02-28 2019-08-20 Ultratec, Inc. Semiautomated relay method and apparatus
US20180034961A1 (en) 2014-02-28 2018-02-01 Ultratec, Inc. Semiautomated Relay Method and Apparatus
US9728190B2 (en) 2014-07-25 2017-08-08 International Business Machines Corporation Summarization of audio data
US10362074B2 (en) 2015-02-03 2019-07-23 Kodiak Networks, Inc Session management and notification mechanisms for push-to-talk (PTT)
US10044872B2 (en) * 2015-03-27 2018-08-07 International Business Machines Corporation Organizing conference calls using speaker and topic hierarchies
MX2017014026A (es) 2015-05-07 2018-03-01 Kodiak Networks Inc Sistema y metodo para la sincronizacion de datos.
AU2016336539B2 (en) 2015-10-06 2019-04-18 Kodiak Networks, Inc. System and method for media encoding scheme (MES) selection
WO2017062595A1 (en) 2015-10-06 2017-04-13 Kodiak Networks Inc. System and method for tuning ptt over lte
GB2561722B (en) 2015-10-23 2021-10-20 Kodiak Networks Inc System and method for content messaging
US20170178630A1 (en) * 2015-12-18 2017-06-22 Qualcomm Incorporated Sending a transcript of a voice conversation during telecommunication
GB2564316C (en) 2016-04-22 2021-09-22 Kodiak Networks Inc System and method for push-to-talk (PTT) key one-touch calling
US10555370B2 (en) 2016-09-28 2020-02-04 Kodiak Networks, Inc. System and method for push-to-talk (PTT) in high latency networks
US10257669B2 (en) 2016-12-01 2019-04-09 Kodiak Networks, Inc. PTX data analytic engine notifying group list of detected risk event
US10630529B2 (en) 2016-12-29 2020-04-21 Kodiak Networks, Inc. System and method for push-to-talk (PTT) in mobile edge computing (MEC)
US10341823B2 (en) 2016-12-30 2019-07-02 Kodiak Networks Inc. System and method for direct mode push to talk communication protocols
US10147415B2 (en) * 2017-02-02 2018-12-04 Microsoft Technology Licensing, Llc Artificially generated speech for a communication session
US10558421B2 (en) * 2017-05-22 2020-02-11 International Business Machines Corporation Context based identification of non-relevant verbal communications
JP2019191824A (ja) * 2018-04-23 2019-10-31 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
US20200084057A1 (en) * 2018-09-12 2020-03-12 Avaya Inc. Conference session management with mode selection
US10971168B2 (en) 2019-02-21 2021-04-06 International Business Machines Corporation Dynamic communication session filtering
US11539900B2 (en) 2020-02-21 2022-12-27 Ultratec, Inc. Caption modification and augmentation systems and methods for use by hearing assisted user

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2285895A (en) 1994-01-19 1995-07-26 Ibm Audio conferencing system which generates a set of minutes
US5894504A (en) 1996-10-02 1999-04-13 At&T Advanced call waiting and messaging system
JPH10136327A (ja) * 1996-10-25 1998-05-22 Meidensha Corp ディスクトップ会議システム
US6243454B1 (en) 1998-08-05 2001-06-05 At&T Corp. Network-based caller speech muting
US6477491B1 (en) * 1999-05-27 2002-11-05 Mark Chandler System and method for providing speaker-specific records of statements of speakers
US6457045B1 (en) * 1999-08-30 2002-09-24 Zaplet, Inc. System and method for group choice making
US6816468B1 (en) * 1999-12-16 2004-11-09 Nortel Networks Limited Captioning for tele-conferences
US6501739B1 (en) * 2000-05-25 2002-12-31 Remoteability, Inc. Participant-controlled conference calling system
US6996531B2 (en) * 2001-03-30 2006-02-07 Comverse Ltd. Automated database assistance using a telephone for a speech based or text based multimedia communication mode
US7027986B2 (en) * 2002-01-22 2006-04-11 At&T Corp. Method and device for providing speech-to-text encoding and telephony service
US6763095B1 (en) * 2002-09-24 2004-07-13 Verizon Laboratories Inc. Unified messaging system and method

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592596A (zh) * 2011-01-12 2012-07-18 鸿富锦精密工业(深圳)有限公司 语音文字转换装置及方法
WO2012163127A1 (zh) * 2011-06-02 2012-12-06 中兴通讯股份有限公司 语音处理方法及系统
US10574473B2 (en) 2012-01-30 2020-02-25 International Business Machines Corporation Visualizing conversations across conference calls
CN104067603A (zh) * 2012-01-30 2014-09-24 国际商业机器公司 可视化跨电话会议的对话
US10200205B2 (en) 2012-01-30 2019-02-05 International Business Machines Corporation Visualizing conversations across conference calls
US10177926B2 (en) 2012-01-30 2019-01-08 International Business Machines Corporation Visualizing conversations across conference calls
CN103379460A (zh) * 2012-04-20 2013-10-30 华为终端有限公司 一种语音消息处理方法及终端
CN108430043A (zh) * 2012-08-16 2018-08-21 三星电子株式会社 用于提供使用文本数据的语音通话的方法及其电子装置
WO2014085985A1 (zh) * 2012-12-04 2014-06-12 Itp创新科技有限公司 一种通话转录系统和方法
CN105469790A (zh) * 2014-08-29 2016-04-06 上海联影医疗科技有限公司 会诊信息处理方法及装置
CN106105175A (zh) * 2015-01-30 2016-11-09 华为技术有限公司 一种多方通话中语音转文本的方法及装置
US10825459B2 (en) 2015-01-30 2020-11-03 Huawei Technologies Co., Ltd. Method and apparatus for converting voice into text in multiparty call
WO2016119226A1 (zh) * 2015-01-30 2016-08-04 华为技术有限公司 一种多方通话中语音转文本的方法及装置
CN106105175B (zh) * 2015-01-30 2019-05-21 华为技术有限公司 一种多方通话中语音转文本的方法及装置
CN105094641A (zh) * 2015-07-15 2015-11-25 百度在线网络技术(北京)有限公司 语音问答交互方法和装置
CN110291769A (zh) * 2017-06-16 2019-09-27 株式会社科学艺术 信号处理装置、通信系统、信号处理装置中实施的方法、信号处理装置中执行的程序、通信终端中实施的方法、以及通信终端中执行的程序
CN110291769B (zh) * 2017-06-16 2021-04-20 株式会社科学艺术 通信系统及方法、信号处理装置、以及可读存储介质
US11568154B2 (en) 2017-06-16 2023-01-31 Science Arts, Inc. Signal processing apparatus, communication system, method performed by signal processing apparatus, storage medium for signal processing apparatus, method performed by communication terminal, and storage medium for communication terminal to receive text data from another communication terminal in response to a unique texting completion notice
US11836457B2 (en) 2017-06-16 2023-12-05 Science Arts, Inc. Signal processing apparatus, communication system, method performed by signal processing apparatus, storage medium for signal processing apparatus, method performed by communication terminal, and storage medium for communication terminal to receive text data from another communication terminal in response to a unique texting completion notice
CN109068089A (zh) * 2018-09-30 2018-12-21 视联动力信息技术股份有限公司 一种会议数据生成方法和装置
CN111243594A (zh) * 2018-11-28 2020-06-05 海能达通信股份有限公司 一种音频转换文字的方法及装置

Also Published As

Publication number Publication date
EP1477017A1 (en) 2004-11-17
CA2473147A1 (en) 2003-08-28
AU2003215153A1 (en) 2003-09-09
CA2473147C (en) 2010-12-21
EP1477017B1 (en) 2017-08-02
AU2003215153B2 (en) 2008-10-30
WO2003071774A1 (en) 2003-08-28
CN1636384B (zh) 2011-08-10
US7236580B1 (en) 2007-06-26

Similar Documents

Publication Publication Date Title
CN1636384B (zh) 进行带可选语音到文本转换的电话会议的方法和系统
US6792092B1 (en) Method and system for independent participant control of audio during multiparty communication sessions
US6600733B2 (en) System for interconnecting packet-switched and circuit-switched voice communications
EP1461938B1 (en) Method and system for controlling audio content during multiparty communication sessions
CN101156374B (zh) 一种监听视频呼叫的系统和方法
CN101159901B (zh) 发起会议的方法、短信应用业务代理、会议服务器及系统
US20060067499A1 (en) Method and apparatus for querying a list of participants in a conference
CN102082884B (zh) 一种基于3g的音视频协作方法及系统
US20030012148A1 (en) Software based single agent multipoint conference capability
US9398160B2 (en) Method and communication terminal for providing VoIP
US20030048855A1 (en) Method and device for the transmission of data in a packet-oriented data network
MXPA02003072A (es) Metodo y sistema para proporcionar servicios inteligentes de control de red en la telefonia ip.
CN101909192B (zh) 电视终端的通信方法及其电视终端
CN102148775B (zh) 网页呼叫服务网关、呼叫服务系统和方法
CN101035007A (zh) 利用即时通信设备召开混合型电话会议的控制方法
WO2009003334A1 (fr) Procédé et système servant à réaliser le contrôle d'un système de centre d'appel grâce à un terminal léger sip
US20060114884A1 (en) Method and apparatus for audio conference bridge initiated remote device muting
US6977911B1 (en) Scalable voice over IP system configured for dynamically switching codecs during a call
US20090299735A1 (en) Method for Transferring an Audio Stream Between a Plurality of Terminals
CN113905023B (zh) 基于网页即时通信技术的外呼系统及方法
KR20050016061A (ko) 개선된 그룹 통신 시스템
CN101056174A (zh) 一种实现网络日志服务的系统、装置及方法
KR20010092015A (ko) 고속 무선 인터넷망에서 멀티미디어 통신용 인터넷폰서비스 제공 방법 및 시스템
WO2008067722A1 (fr) Procédé, système de téléphone et terminal de téléphone pour une session d'appel
KR20040022738A (ko) 인터넷 영상전화기의 단문 서비스시스템 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110810

Termination date: 20210211