CN1155214C - 用于电话消息录制的编辑系统和方法 - Google Patents

用于电话消息录制的编辑系统和方法 Download PDF

Info

Publication number
CN1155214C
CN1155214C CNB991109899A CN99110989A CN1155214C CN 1155214 C CN1155214 C CN 1155214C CN B991109899 A CNB991109899 A CN B991109899A CN 99110989 A CN99110989 A CN 99110989A CN 1155214 C CN1155214 C CN 1155214C
Authority
CN
China
Prior art keywords
message
text
user
correct
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB991109899A
Other languages
English (en)
Other versions
CN1255011A (zh
Inventor
�����¡��Dz����
穆昆德·帕德曼那布翰
迈克尔·比珍尼
�κ�ķ
戴维·奈翰姆
·
塞里木·路克斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1255011A publication Critical patent/CN1255011A/zh
Application granted granted Critical
Publication of CN1155214C publication Critical patent/CN1155214C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M11/00Telephonic communication systems specially adapted for combination with other electrical systems
    • H04M11/10Telephonic communication systems specially adapted for combination with other electrical systems with dictation recording and playback systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/533Voice mail systems
    • H04M3/53366Message disposing or creating aspects
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/5307Centralised arrangements for recording incoming messages, i.e. mailbox systems for recording messages comprising any combination of audio and non-audio components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/60Medium conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Telephonic Communication Services (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

根据本发明的一种消息传送系统,用来通过一电话接收语音和将该语音转换为文本,该系统包括一用来接收由一用户输入的语音的第一服务器,一用来将语音转换为文本的语音识别系统,一为了播放由用户进行校正的合成语音用来将文本转换成语音的语音合成器和用来使该用户能够校正合成语音从而该校正语音作为用于传送的文本通过一通信系统而被提供的校正机构。还披露了根据本发明的一方法。

Description

用于电话消息录制的编辑系统和方法
技术领域
本发明涉及用于语音识别的编辑系统,更详细地说,本发明涉及用来编辑自一电话所录制的语音的系统和方法。
背景技术
近年来在个人通信方面的进展趋向于通过例如语音、多媒体(图形和语音)、文本(电子邮件、寻呼电话接收机)等多种通道将信息传送给用户。由于这些进展,产生了统一的消息传送的概念,从而由用户通过各种媒介所接收的消息被存贮在一单一的存贮器中,并且可由用户在他的/她的设备中重新得到被检索到。另外,该用户可能仅具有功能非常有限的个人数字助理(PDA),通过它来获取他的消息。但是,通常即使最简单的PDA也可支持文本的接收,但它不可能支持多媒体信号的接收。因此,它必须将语音和多媒体信号转换成文本,从而使这些信号可容易地被存取。言外之意在用于通信的带宽要求方面,即对于传送来说文本信号所需的带宽要小于语音所需的带宽。
语音邮件是一种通用的消息传送系统,在这种系统中一个人的语音被记录并随后由该消息的接收者所播放。因此,统一的消息传送的一个重要方面是能够将这种消息转换成文本。这当然可使用自动语音识别算法来实现。但是,语音邮件消息通常表示通过一未知的(留言的发话人可能在地球的另一边也可能在隔壁房间)电话带宽信道而被记录的自然语音,因此它对于自动语音识别系统是极具挑战性的任务。因此,存在所录制的文本充满错误而使该消息的接收者无法理解所有消息的危险。因而,包含一种反馈机构,从而使留言人可以检验该录制的质量并且如有必要可以对它进行校正是有益的。
因此,需要有一种交互式系统和方法,用来将语音数据转换为文本并且其包含校正由语言录制的文本的特性。
发明内容
根据本发明,一种用于接收语音和将语音转换为文本的消息传送系统包括有一用来接收由用户输入的语音的第一服务器,一用来将语音转换成文本的语音识别系统,一用来将文本转换成语音而用来播放由用户校正的合成语音的语音合成器和用来启动用户通过重录去校正该语音从而将所校正的语音通过一通信系统作为文本而传送的校正机构。
在另外的实施例中,通过该通信系统传送文本可包括传送到一寻呼机、邮件或传真中的一种。该校正机构可促使用户去选择用于校正的该语音输入的部分。该语音识别服务器可将诊断数据提供给该校正机构以指示被校正的语音输入的部分。该校正机构可以促使用户去重录用于校正的该语音输入的部分。该系统可进一步包括一语言翻译服务器,用来将该语音输入转换为文本从而以不同语言文字通过通信系统进行传送。该系统还可进一步包括一发话人识别服务器,用来识别用户和用来调整用于由该语音识别服务器识别的语音的语音识别模式。
一种用于通用消息传送系统的校正消息的方法包括记录一音频消息的步骤,利用语音识别系统将该消息录制为文本的步骤,根据所录制的文本提供用来播放用于校正的消息的语音的步骤,识别所校正的消息部分的步骤,通过重录该所识别的部分校正该消息的步骤和通过一通信系统输出该文本的步骤。
一种利用机器可读取的程序存贮装置,该程序存贮装置确实包含有一通过该机器可执行多个指令的程序以执行用于对在一通用消息系统中的消息提供校正的方法步骤,该方法步骤包括有记录一音频消息的步骤,利用语音识别系统将该消息录制为文本的步骤,根据所录制的文本提供用来播放用于校正的消息的语音的步骤,识别被校正的消息的部分的步骤,通过重录该所识别部分校正该消息的步骤和通过一通信系统输出该文本的步骤。
在各个可由该程序存贮装置所执行的方法中,音频消息最好是由电话来记录。识别被校正的消息部分的步骤可以包括提供来自该语音识别服务器的用来确定该消息部分的校正的可能性的诊断数据的步骤。识别被校正的消息部分的步骤可以包括收听该播放消息和选择被校正部分的步骤。通过重录所识别部分而校正该消息的步骤可以包括重录该消息的部分的步骤,利用语音识别服务器变换所重录的部分以修正该文本的步骤,根据所修正的文本播放重录部分语音的步骤和如果满意的话批准消息部分的步骤。可以包括以多种语言中的一种记录消息的步骤。可以包括通过该通信系统以多种语言中的一种输出文本的步骤。还可以包括识别与语音识别模型相关的一用户并且提供该模式以识别该用户的音频输入的步骤。
通过下面结合附图对所述实施例的详细说明可使本发明的这些和其它目的、特性和优点变得更为明显。
附图说明
参考下面的附图通过对下述最佳实施例的说明将详细描述本发明。
图1是根据本发明的具有一校正机构的一通用消息传送系统的方框/流程图;和
图2是根据本发明的用于校正消息的流程图。
具体实施方式
本发明涉及用于语音识别的编辑系统,更详细地说,本发明涉及一种用于编辑自一电话的语音所录制的消息的系统和方法。
应当理解,图1-2中所示的各个部分可以硬件、软件或软件和硬件的组合来实施。最好是,这些元件是在一个或多个具有处理器和存贮器以及输入/输出接口的适当编程的通用数字计算机中以软件的形式来实施。参见该图,图中相同的标号表示相同或相似部分。图1的方框/流程图相应于通常称之为系统10的统一消息传送系统/方法。消息服务器12是接收/发送和存贮所有消息的通用集线器。消息服务器12可通过计算机14、或通过电话16、或以几种信息形式(邮件18、传真20、录音邮件22、页面24、还有某些电话和个人数字辅助设备(PDA)也可接收文本消息)、或键控例如删除、答复等在消息服务器12上的用户消息来进行存取。另外,消息服务器12还可以让用户直接通过邮件18、传真20或页面24来接收消息。该用户通过电话所接收的消息还可存贮在消息服务器12中,但也可将另外的电话服务器26作为从电话16和消息服务器12所得到的语音之间的一中间桥梁。在另一实施例中,电话服务器26可包括在消息服务器12之中。电话服务器还对在系统10的部分构件中的信息流进行控制。
应当理解术语“服务器”被用来表示计算机或程序,该程序可运行于同一计算机或运行于最好是可通过网络进行访问的不同计算机上。
现在将说明在一系统/方法中一用户可使用电话16给另一用户留一消息,和说明在该方法中包含的各个系统组成部分的功能。
由第一用户给出一电话呼叫并由电话服务器26所获取,电话服务器26随后向第一用户给出对保留与另一用户相关的消息或取出第一用户的消息或处理第一用户的消息的选择。这些选择通过由电话服务器26所提供的提示而提供给第一用户。第一用户随后可被提供一个选择一个选项的机会,这种选择可以通过预定的音调(对于选择1按压1,对于选择2按压2等)或者通过记录第一用户的语音应答并利用语音识别服务器32将该语音应答转换成文本来确定,它类似于这里所参考的发表在1995年Interational Acoustics speech andSignal processing论文集中由L.R.Bahl等所著的“Performance of the IBM LargeVocabulary Confinuous Speech Recognifion system on ARPA wall street JournalTask”中所描述的系统。该被识别的文本用来检测哪一选项被该用户选用。
在第一用户希望对另一用户留一消息的场合,系统10将存贮一消息的选择直接作为一语音消息或将该消息转换为文本给予第一用户。该用户选择一种上面所提到的可以通过一音调或由语音所规定的选择。在该用户希望发送一页面到一数字寻呼机,或者以不同语音发送该消息的场合,它必须将该语音转换为文本。
如果该用户规定了这个选择,随后电话服务器26给出一提示通知该用户记录该消息。一旦该消息被记录(该消息的终止最好是由检验该线上无声,或通过用户按压一键来判断的),并且所记录的语音被装载到语音识别服务器32中。语音识别服务器利用自动语音识别算法(可以利用自然语言处理去过滤该录制)将该语音录制为文本,并且随同诊断(诸如在该发声中的每一字所产生的相似性方面,或涉及在该发声中的每一字的置信度测重,或每一字或子字的持续时间等)将所录制的文本传送回该电话服务器26。
电话服务器26随后将该文本和诊断传送到语音合成服务器34,语音合成服务器34产生合成了的语音并且将该语音发送回电话服务器26。电话服务器26随后根据本发明通过电话线将该语音向该用户播出(应注意的是这种语音相应于由语音识别服务器32所产生的可能是全部为错误的录制)。
将该语音向用户播出的一个目的是能使该用户校正不满意的或不正确的区域。电话服务器26随后向该用户提供一个选择以校正该消息。
与一校正机构36相关的该语音的播放可由几个步骤来实现。一些例子包括(i)电话服务器26向该用户播放全部消息并且如果它是不能令人接受或不正确的则用户要求重录该消息,(ii)电话服务器26使用从语音识别服务器32接收的置信度进行诊断以确定具有低置信度的录制区域并且用户要求仅仅校正这些区域,(iii)电话服务器26根据测量,例如根据所经过的时间或根据在该语音中的暂停将该录制截断为若干部分,并向该用户播放每一部分并向该用户给出分别地校正每一部分的选择。另外的校正方法也由本发明来考虑。
利用校正机构36,该用户可以校正该消息的任何所希望部分,这可以不同步骤来实现。这些例子包括(i)该用户按压在电话16上的一键以指明接收或拒绝该消息(或该部分消息),并且重录该部分,随后以如上述(ii)所述的相似方式来处理,该用户说“是”或“OK”或保持沉默以指明接收该消息或者用户说“不”以指明拒绝该消息。在这种情况中,该用户的回答被记录或被录制成文本并且该被录制的文本(是,OK,沉默或不)确定用户选择的选项。
当用户满意该录制之后,电话服务器26将该文本与所记录的语音一起传送给消息服务器12,随着指令而存贮它以用于后面的存取,作为由该用户通过一通信网络或系统的选择,或者通过邮件18、传真20或页面24传送该文本。
在另一实施例中,如果用户希望以另外的语言来传送该消息,则电话服务器26将该文本传送到语言翻译服务器38,语言翻译服务器38使用自动翻译算法将该文本转换为不同的语言并且将该翻译的文本传送回电话服务器26,电话服务器26随后将该翻译的文本传送给消息服务器12以便进一步进行处理。
通常,如果在进行该语音录制的同时使用扬声器特性或发话人适应模式,则语音识别服务器32的语音识别特性被改善。因此,电话服务器26还可与发话人识别服务器40通信以确定该呼叫用户的身份,或者换句话说用户可要求说出他/她的名字并且随同发话人独立模式使用语音识别服务器32以录制该语音并且使用该录制以确定该用户的身份。一旦它被确定,语音识别服务器32可将被修整的模式用于该特殊用户或用户组(如果可用的话)以录制他/她的语音。
在另外的实施例中,在消息服务器中存贮的消息可被传送到多个帐号/地址/器件。例如,一被保存的被录制的消息可传送到第一用户组的一寻呼接收机,电子邮件到第二用户组和/或传真到第三用户。系统10还可以使用例如一页面或一传真等不同的媒体将相同消息传送到一单个用户。另外,语音合成服务器34可用来合成一文本消息并将它传送到一电话或一语音邮件系统。在其它的实施例中,每一用户可具有一个人网页(webpage)42,与消息被对于这个用户录制时,卷筒纸页被自动地更新。网页42通过诸如因特网之类的通信网络而被存取。
参见图2,如果该用户规定记录一消息,在框102中给出要求用户记录该消息的提示。在框104中,通过说话,一消息被记录到电话或其它声学器件(该消息的终止最好通过检验线上的寂静,或通过该用户按压一键来确定),并且将所记录的语音装载到一语音识别服务器32(图1)中。在框106中,语音识别服务器32利用自动语音识别算法(可以使用自然语言处理以对该录制滤波)将该语音录制为文本,并且随同诊断(诸如在该发声中的每一字所产生的相似性方面,或涉及在该发声中的每一字的置信度测量,或每一字或子字的持续时间等)将所录制的文本传送回该电话服务器26。
在框108中,电话服务器26随后将该文本和诊断传送给语音合成服务器34,语音合成服务器34产生合成的语音并将该语音传送回电话服务器26。电话服务器26根据本发明随后通过电话线将该语音向该用户播出(应注意的是这种语音相应于由语音服务器32所产生的可能是全部为错误的录制)。
在框110中,该用户校正在该消息中的不满意或不正确的区域。用于校正的该语音的播放可由几个步骤来实现。一些例子包括(i)整个消息被播放给用户并且如果它能令人接受或不正确则用户要求重录该消息,(ii)根据语音识别服务器32所接收的置信度诊断来确定具有低置信度的录制区域并且用户要求仅仅校正这些区域,(iii)根据测量,例如根据所经过的时间或根据在该语音中的暂停该录制被截断为若干部分,向该用户播放每一部分并向该用户给出分别地校正每一部分的选择。另外的校正方法也由本发明来考虑。
该消息的各部分可分别地被校正。一些例子包括(i)该用户按压电话16上的一个键以指明接收或拒绝该消息(或部分消息),并且重录该部分,随后以如上所述(ii)所述的相似方式来处理,该用户说“是”或“OK”或保持沉默以指明接收该消息或者用户说“不”以指明拒绝该消息。在这种情况中,该用户的回答被记录或被录制成文本并且该被录制的文本(是,OK,沉默或不)确定用户选择的选择。
在框112中,当该用户满意该录制之后,电话服务器26将该文本与所记录的语音一起传送给消息服务器12,随着指令而存贮它以用于后面的存取,作为由该用户的选择,通过邮件18,传真20或页面24传送该文本。如果用户选择通过诸如一电话系统的通信网络来传送,该消息可被转换为不同的语言。另外,用户可以规定一种其中记录了所述消息的语言。这可以是上述发话人识别处理的一部分。
已说明了编辑系统的一系统和方法以及用于电话消息录制的方法的最佳实施例(这些是想要例证性说明的而不受其限制),应注意的是本领域的普通技术人员根据上述教导可对这些实施例进行修改和变型。因此,在所附权利要求所提出的本发明的精神和范围之内可对所披露的本发明的特定实施例进行变化。按专利法的要求对本发明作了详细的说明,在所附权利要求中陈述了所要求和所希望的保护。

Claims (15)

1.一种用来接收语音和将该语音转换为文本的消息传送系统,包括:
第一服务器,用来接收由用户输入的语音;
语音识别系统,用来将该语音转换为文本;
语音合成器,用来将该文本转换成合成语音,播放该合成语音以由用户进行校正;和
校正机构,用来通过重录使该用户能够校正合成语音,从而使该校正后的语音作为文本被提供用以通过通信系统进行传送。
2.如权利要求1的系统,其中通过通信系统传送文本包括向一文本读取装置传送文本。
3.如权利要求1的系统,其中该校正机构被配置成提示该用户去选择用于校正的语音输入的部分。
4.如权利要求1的系统,其中该语音识别系统将诊断数据提供给该校正机构以指明须要校正的语音输入的部分。
5.如权利要求1的系统,其中该校正机构被配置成提示用户去重录用于校正的语音输入的部分。
6.如权利要求1的系统,进一步包括一个语言翻译服务器,用于以不同的语言将输入的语音转换成用于经过所述通信系统传送的文本。
7.如权利要求1的系统,进一步包括一讲话人识别服务器,用来识别所述用户和用于利用语音识别系统调节与所述语音识别相关的语音模式。
8.一种用于通用消息传送系统校正消息的方法,包括步骤:
记录一音频消息;
利用一语音识别系统将该消息录制为文本;
根据所录制的文本提供语音以用于播放与校正相关的消息;
识别要被校正的部分消息;
通过重录被识别部分校正该消息;和
通过一通信系统输出校正后的文本。
9.如权利要求8的方法,其中该音频消息由电话所记录。
10.如权利要求8的方法,其中识别要被校正的消息的部分的步骤包括从该语音识别系统提供用来确定该消息的部分的正确的可能性的诊断数据的步骤。
11.如权利要求8的方法,其中识别要被校正的消息的部分的步骤包括收听所播放的消息和选择要被校正的部分的步骤。
12.如权利要求8的方法,其中通过重录所识别部分校正该消息的步骤包括有步骤:
重录部分该消息;
利用该语音识别系统转换重录部分以修正该文本;
根据修正的文本播放重录部分的语音,和
如果可以接受,认可所述消息的重录部分。
13.如权利要求8的方法,进一步包括以多种语言中的一种语言记录该消息的步骤。
14.如权利要求8的方法,进一步包括通过一通信系统以多种语言中的一种语言输出该文本的步骤。
15.如权利要求8的方法,进一步包括步骤:
识别与语音识别模型有关的用户;和
应用该模型以识别该用户的音频输入。
CNB991109899A 1998-11-03 1999-07-02 用于电话消息录制的编辑系统和方法 Expired - Lifetime CN1155214C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US185,332 1980-09-08
US185332 1998-11-03
US09/185,332 US6219638B1 (en) 1998-11-03 1998-11-03 Telephone messaging and editing system

Publications (2)

Publication Number Publication Date
CN1255011A CN1255011A (zh) 2000-05-31
CN1155214C true CN1155214C (zh) 2004-06-23

Family

ID=22680552

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB991109899A Expired - Lifetime CN1155214C (zh) 1998-11-03 1999-07-02 用于电话消息录制的编辑系统和方法

Country Status (4)

Country Link
US (1) US6219638B1 (zh)
JP (1) JP3873131B2 (zh)
KR (1) KR100329894B1 (zh)
CN (1) CN1155214C (zh)

Families Citing this family (142)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8734339B2 (en) 1996-12-16 2014-05-27 Ip Holdings, Inc. Electronic skin patch for real time monitoring of cardiac activity and personal health management
US6169789B1 (en) * 1996-12-16 2001-01-02 Sanjay K. Rao Intelligent keyboard system
US6606373B1 (en) * 1997-12-31 2003-08-12 Weblink Wireless, Inc. Controller for use with communications systems for generating a condensed text message index
US6483899B2 (en) * 1998-06-19 2002-11-19 At&T Corp Voice messaging system
US20030078989A1 (en) * 1999-02-10 2003-04-24 David J. Ladd System and method for transmission and delivery of travel instructions to informational appliances
GB2352933A (en) * 1999-07-31 2001-02-07 Ibm Speech encoding in a client server system
JP3879323B2 (ja) * 1999-09-06 2007-02-14 ヤマハ株式会社 電話端末装置
US7548846B1 (en) * 1999-11-10 2009-06-16 Global Market Insite, Inc. Language sensitive electronic mail generation and associated applications
US6999565B1 (en) * 2000-02-01 2006-02-14 Envoyworldwide, Inc. Multi-mode message routing and management
DE10018143C5 (de) * 2000-04-12 2012-09-06 Oerlikon Trading Ag, Trübbach DLC-Schichtsystem sowie Verfahren und Vorrichtung zur Herstellung eines derartigen Schichtsystems
US6687689B1 (en) 2000-06-16 2004-02-03 Nusuara Technologies Sdn. Bhd. System and methods for document retrieval using natural language-based queries
FR2810548A1 (fr) * 2000-06-26 2001-12-28 Oreal Utilisation d'ergothioneine et/ou de ses derives comme agent anti-glycation
US7200555B1 (en) * 2000-07-05 2007-04-03 International Business Machines Corporation Speech recognition correction for devices having limited or no display
DE10045081A1 (de) * 2000-09-12 2002-03-28 Mende Speech Solutions Gmbh & Vorrichtung und Verfahren zum graphischen Darstellen und zum Übertragen von Informationen
US7075671B1 (en) * 2000-09-14 2006-07-11 International Business Machines Corp. System and method for providing a printing capability for a transcription service or multimedia presentation
US20120191052A1 (en) 2000-10-06 2012-07-26 Ip Holdings, Inc. Intelligent activated skin patch system
US7091976B1 (en) 2000-11-03 2006-08-15 At&T Corp. System and method of customizing animated entities for use in a multi-media communication application
US20080040227A1 (en) 2000-11-03 2008-02-14 At&T Corp. System and method of marketing using a multi-media communication system
US6976082B1 (en) 2000-11-03 2005-12-13 At&T Corp. System and method for receiving multi-media messages
US7035803B1 (en) 2000-11-03 2006-04-25 At&T Corp. Method for sending multi-media messages using customizable background images
US6963839B1 (en) 2000-11-03 2005-11-08 At&T Corp. System and method of controlling sound in a multi-media communication application
US6990452B1 (en) 2000-11-03 2006-01-24 At&T Corp. Method for sending multi-media messages using emoticons
US7203648B1 (en) 2000-11-03 2007-04-10 At&T Corp. Method for sending multi-media messages with customized audio
EP1215659A1 (en) * 2000-12-14 2002-06-19 Nokia Corporation Locally distibuted speech recognition system and method of its operation
JP2002197081A (ja) * 2000-12-26 2002-07-12 Kobelco Systems Corp 音声・文字変換転送サービスシステム
US7412525B2 (en) * 2001-01-24 2008-08-12 Microsoft Corporation System verifying if an email request passed a policy check before initiating an interactive telephony session
US7225126B2 (en) * 2001-06-12 2007-05-29 At&T Corp. System and method for processing speech files
US6782086B2 (en) * 2001-08-02 2004-08-24 Intel Corporation Caller ID lookup
WO2003019528A1 (fr) * 2001-08-22 2003-03-06 International Business Machines Corporation Procede de production d'intonation, dispositif de synthese de signaux vocaux fonctionnant selon ledit procede et serveur vocal
US8583430B2 (en) * 2001-09-06 2013-11-12 J. Albert Avila Semi-automated intermodal voice to data transcription method and apparatus
US7346505B1 (en) * 2001-09-28 2008-03-18 At&T Delaware Intellectual Property, Inc. System and method for voicemail transcription
US7441016B2 (en) * 2001-10-03 2008-10-21 Accenture Global Services Gmbh Service authorizer
US7233655B2 (en) * 2001-10-03 2007-06-19 Accenture Global Services Gmbh Multi-modal callback
US7472091B2 (en) * 2001-10-03 2008-12-30 Accenture Global Services Gmbh Virtual customer database
AU2007216929C1 (en) * 2001-10-03 2011-05-26 Accenture Global Services Limited Multi-modal callback
ATE335354T1 (de) * 2001-10-03 2006-08-15 Accenture Global Services Gmbh Mehrfachmodales nachrichtenübertragungsrückrufsystem mit dienstauthorisierer und virtueller kundendatenbank
US7640006B2 (en) * 2001-10-03 2009-12-29 Accenture Global Services Gmbh Directory assistance with multi-modal messaging
EP1708470B1 (en) * 2001-10-03 2012-05-16 Accenture Global Services Limited Multi-modal callback system
US7254384B2 (en) 2001-10-03 2007-08-07 Accenture Global Services Gmbh Multi-modal messaging
DE60211197T2 (de) * 2001-10-31 2007-05-03 Koninklijke Philips Electronics N.V. Verfahren und vorrichtung zur wandlung gesprochener in geschriebene texte und korrektur der erkannten texte
US7671861B1 (en) 2001-11-02 2010-03-02 At&T Intellectual Property Ii, L.P. Apparatus and method of customizing animated entities for use in a multi-media communication application
ES2228739T3 (es) * 2001-12-12 2005-04-16 Siemens Aktiengesellschaft Procedimiento para sistema de reconocimiento de lenguaje y procedimiento para el funcionamiento de un sistema asi.
US7296057B2 (en) * 2002-01-08 2007-11-13 International Business Machines Corporation Method for user-specified error correction in an instant messaging system
US7593990B2 (en) * 2002-01-16 2009-09-22 International Business Machines Corporation Automatically sending a URL by e-mail or telephone
GB0204056D0 (en) 2002-02-21 2002-04-10 Mitel Knowledge Corp Voice activated language translation
US7092884B2 (en) 2002-03-01 2006-08-15 International Business Machines Corporation Method of nonvisual enrollment for speech recognition
US7464035B2 (en) * 2002-07-24 2008-12-09 Robert Bosch Corporation Voice control of home automation systems via telephone
DE10251112A1 (de) * 2002-11-02 2004-05-19 Philips Intellectual Property & Standards Gmbh Verfahren und System zur Spracherkennung
EP1422691B1 (en) * 2002-11-15 2008-01-02 Sony Deutschland GmbH Method for adapting a speech recognition system
US7822612B1 (en) * 2003-01-03 2010-10-26 Verizon Laboratories Inc. Methods of processing a voice command from a caller
US7379872B2 (en) * 2003-01-17 2008-05-27 International Business Machines Corporation Method, apparatus, and program for certifying a voice profile when transmitting text messages for synthesized speech
DE10304229A1 (de) * 2003-01-28 2004-08-05 Deutsche Telekom Ag Kommunikationssystem, Kommunikationsendeinrichtung und Vorrichtung zum Erkennen fehlerbehafteter Text-Nachrichten
JP4714694B2 (ja) * 2003-11-05 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声−テキストトランスクリプションシステムの誤り検出
US7764771B2 (en) * 2003-12-24 2010-07-27 Kimberly-Clark Worldwide, Inc. Method of recording invention disclosures
US7398215B2 (en) * 2003-12-24 2008-07-08 Inter-Tel, Inc. Prompt language translation for a telecommunications system
TWI232431B (en) * 2004-01-13 2005-05-11 Benq Corp Method of speech transformation
US20050221142A1 (en) * 2004-03-23 2005-10-06 Narayanan Sekharipuram R Composite polymer electrolytes based on organosilica hybrid proton conductors for fuel cells
US7570636B2 (en) 2004-06-29 2009-08-04 Damaka, Inc. System and method for traversing a NAT device for peer-to-peer hybrid communications
US7623516B2 (en) * 2004-06-29 2009-11-24 Damaka, Inc. System and method for deterministic routing in a peer-to-peer hybrid communications network
US8050272B2 (en) * 2004-06-29 2011-11-01 Damaka, Inc. System and method for concurrent sessions in a peer-to-peer hybrid communications network
US20070078720A1 (en) * 2004-06-29 2007-04-05 Damaka, Inc. System and method for advertising in a peer-to-peer hybrid communications network
US7933260B2 (en) 2004-06-29 2011-04-26 Damaka, Inc. System and method for routing and communicating in a heterogeneous network environment
US7778187B2 (en) * 2004-06-29 2010-08-17 Damaka, Inc. System and method for dynamic stability in a peer-to-peer hybrid communications network
US20060206310A1 (en) * 2004-06-29 2006-09-14 Damaka, Inc. System and method for natural language processing in a peer-to-peer hybrid communications network
US8009586B2 (en) 2004-06-29 2011-08-30 Damaka, Inc. System and method for data transfer in a peer-to peer hybrid communication network
US7623476B2 (en) * 2004-06-29 2009-11-24 Damaka, Inc. System and method for conferencing in a peer-to-peer hybrid communications network
US20060095365A1 (en) * 2004-06-29 2006-05-04 Damaka, Inc. System and method for conducting an auction in a peer-to peer network
US7656870B2 (en) * 2004-06-29 2010-02-02 Damaka, Inc. System and method for peer-to-peer hybrid communications
US20070036290A1 (en) * 2005-03-02 2007-02-15 Warner Bros. Entertainment Inc. Voicemail system and related method
CN100375087C (zh) * 2005-03-09 2008-03-12 邱聪智 实时翻译系统
US8542803B2 (en) 2005-08-19 2013-09-24 At&T Intellectual Property Ii, L.P. System and method for integrating and managing E-mail, voicemail, and telephone conversations using speech processing techniques
US20070099783A1 (en) * 2005-10-27 2007-05-03 Rennco, Inc. Bag forming device
US8379821B1 (en) 2005-11-18 2013-02-19 At&T Intellectual Property Ii, L.P. Per-conference-leg recording control for multimedia conferencing
US7657006B2 (en) 2005-12-15 2010-02-02 At&T Intellectual Property I, L.P. Messaging translation services
EP1821553B1 (en) 2006-02-16 2012-04-11 Imerj, Limited Method and system for converting a voice message into a text message
US9037466B2 (en) * 2006-03-09 2015-05-19 Nuance Communications, Inc. Email administration for rendering email on a digital audio player
US8849895B2 (en) 2006-03-09 2014-09-30 International Business Machines Corporation Associating user selected content management directives with user selected ratings
US9361299B2 (en) * 2006-03-09 2016-06-07 International Business Machines Corporation RSS content administration for rendering RSS content on a digital audio player
US9092542B2 (en) * 2006-03-09 2015-07-28 International Business Machines Corporation Podcasting content associated with a user account
US8510277B2 (en) * 2006-03-09 2013-08-13 International Business Machines Corporation Informing a user of a content management directive associated with a rating
US8510109B2 (en) 2007-08-22 2013-08-13 Canyon Ip Holdings Llc Continuous speech transcription performance indication
US9436951B1 (en) 2007-08-22 2016-09-06 Amazon Technologies, Inc. Facilitating presentation by mobile device of additional content for a word or phrase upon utterance thereof
CA2648617C (en) 2006-04-05 2017-12-12 Yap, Inc. Hosted voice recognition system for wireless devices
US20090124272A1 (en) 2006-04-05 2009-05-14 Marc White Filtering transcriptions of utterances
US8000456B2 (en) 2006-04-20 2011-08-16 Cisco Technology, Inc. Techniques for marking and manipulating voice message segments through a telephone user interface
US20070274496A1 (en) * 2006-04-20 2007-11-29 Ujjwal Singh Method and system for multimodal communication using a phone number
US7860995B1 (en) 2007-11-29 2010-12-28 Saynow Corporation Conditional audio content delivery method and system
US20070255554A1 (en) * 2006-04-26 2007-11-01 Lucent Technologies Inc. Language translation service for text message communications
US8300781B1 (en) * 2006-04-28 2012-10-30 At&T Intellectual Property Ii, L.P. Method and apparatus for retrieving all voicemail messages at the same time
US8204185B1 (en) * 2006-04-28 2012-06-19 At&T Intellectual Property Ii, L.P. Method and apparatus for retrieving voicemail messages via customer premise equipment
US20070282613A1 (en) * 2006-05-31 2007-12-06 Avaya Technology Llc Audio buddy lists for speech communication
WO2007140023A2 (en) * 2006-06-01 2007-12-06 Voxpixel, Inc. Methods and systems for incorporating a voice-attached, tagged rich media package from a wireless camera-equipped handheld mobile device into a collaborative workflow
US8521510B2 (en) * 2006-08-31 2013-08-27 At&T Intellectual Property Ii, L.P. Method and system for providing an automated web transcription service
WO2008030608A2 (en) * 2006-09-08 2008-03-13 James Siminoff System and method for automatic caller transcription (act)
US8983051B2 (en) * 2007-04-03 2015-03-17 William F. Barton Outgoing call classification and disposition
US8131556B2 (en) * 2007-04-03 2012-03-06 Microsoft Corporation Communications using different modalities
US20090076917A1 (en) * 2007-08-22 2009-03-19 Victor Roditis Jablokov Facilitating presentation of ads relating to words of a message
US8611871B2 (en) 2007-12-25 2013-12-17 Canyon Ip Holdings Llc Validation of mobile advertising from derived information
US9973450B2 (en) * 2007-09-17 2018-05-15 Amazon Technologies, Inc. Methods and systems for dynamically updating web service profile information by parsing transcribed message strings
US8352264B2 (en) 2008-03-19 2013-01-08 Canyon IP Holdings, LLC Corrective feedback loop for automated speech recognition
US8326636B2 (en) * 2008-01-16 2012-12-04 Canyon Ip Holdings Llc Using a physical phenomenon detector to control operation of a speech recognition engine
US8352261B2 (en) * 2008-03-07 2013-01-08 Canyon IP Holdings, LLC Use of intermediate speech transcription results in editing final speech transcription results
DE102007027363A1 (de) * 2007-06-11 2008-12-24 Avaya Gmbh & Co. Kg Verfahren zum Betreiben eines Voice-Mail-Systems
US9053489B2 (en) 2007-08-22 2015-06-09 Canyon Ip Holdings Llc Facilitating presentation of ads relating to words of a message
US8335830B2 (en) * 2007-08-22 2012-12-18 Canyon IP Holdings, LLC. Facilitating presentation by mobile device of additional content for a word or phrase upon utterance thereof
CA2701894C (en) 2007-09-03 2015-11-17 Damaka, Inc. Device and method for maintaining a communication session during a network transition
WO2009043016A2 (en) 2007-09-28 2009-04-02 Damaka, Inc. System and method for transitioning a communication session between networks that are not commonly controlled
US8380859B2 (en) * 2007-11-28 2013-02-19 Damaka, Inc. System and method for endpoint handoff in a hybrid peer-to-peer networking environment
US8676577B2 (en) 2008-03-31 2014-03-18 Canyon IP Holdings, LLC Use of metadata to post process speech recognition output
US20090281833A1 (en) * 2008-05-09 2009-11-12 Tele Video Md, Inc. System and method for secure multi-party medical conferencing
US8301454B2 (en) 2008-08-22 2012-10-30 Canyon Ip Holdings Llc Methods, apparatuses, and systems for providing timely user cues pertaining to speech recognition
EP2196989B1 (en) * 2008-12-10 2012-06-27 Nuance Communications, Inc. Grammar and template-based speech recognition of spoken utterances
JP5471106B2 (ja) * 2009-07-16 2014-04-16 独立行政法人情報通信研究機構 音声翻訳システム、辞書サーバ装置、およびプログラム
US8217251B2 (en) * 2009-09-28 2012-07-10 Lawrence E Anderson Interactive display
WO2011040056A1 (ja) * 2009-10-02 2011-04-07 独立行政法人情報通信研究機構 音声翻訳システム、第一端末装置、音声認識サーバ装置、翻訳サーバ装置、および音声合成サーバ装置
US20110142208A1 (en) * 2009-12-10 2011-06-16 Lawrence Anderson Interactive answering system and method
US8725895B2 (en) 2010-02-15 2014-05-13 Damaka, Inc. NAT traversal by concurrently probing multiple candidates
US8874785B2 (en) * 2010-02-15 2014-10-28 Damaka, Inc. System and method for signaling and data tunneling in a peer-to-peer environment
US8892646B2 (en) 2010-08-25 2014-11-18 Damaka, Inc. System and method for shared session appearance in a hybrid peer-to-peer environment
US8689307B2 (en) * 2010-03-19 2014-04-01 Damaka, Inc. System and method for providing a virtual peer-to-peer environment
US9043488B2 (en) * 2010-03-29 2015-05-26 Damaka, Inc. System and method for session sweeping between devices
US9191416B2 (en) 2010-04-16 2015-11-17 Damaka, Inc. System and method for providing enterprise voice call continuity
US8352563B2 (en) 2010-04-29 2013-01-08 Damaka, Inc. System and method for peer-to-peer media routing using a third party instant messaging system for signaling
US8446900B2 (en) 2010-06-18 2013-05-21 Damaka, Inc. System and method for transferring a call between endpoints in a hybrid peer-to-peer network
US8611540B2 (en) 2010-06-23 2013-12-17 Damaka, Inc. System and method for secure messaging in a hybrid peer-to-peer network
US8468010B2 (en) 2010-09-24 2013-06-18 Damaka, Inc. System and method for language translation in a hybrid peer-to-peer environment
US8743781B2 (en) 2010-10-11 2014-06-03 Damaka, Inc. System and method for a reverse invitation in a hybrid peer-to-peer environment
US8407314B2 (en) 2011-04-04 2013-03-26 Damaka, Inc. System and method for sharing unsupported document types between communication devices
US8694587B2 (en) 2011-05-17 2014-04-08 Damaka, Inc. System and method for transferring a call bridge between communication devices
US8478890B2 (en) 2011-07-15 2013-07-02 Damaka, Inc. System and method for reliable virtual bi-directional data stream communications with single socket point-to-multipoint capability
US8583431B2 (en) * 2011-08-25 2013-11-12 Harris Corporation Communications system with speech-to-text conversion and associated methods
ES2637414T3 (es) * 2012-12-06 2017-10-13 Saronikos Trading And Services, Unipessoal Lda Método y dispositivos para la determinación del idioma para la transcripción de voz a texto de llamadas telefónicas
US9027032B2 (en) 2013-07-16 2015-05-05 Damaka, Inc. System and method for providing additional functionality to existing software in an integrated manner
US9357016B2 (en) 2013-10-18 2016-05-31 Damaka, Inc. System and method for virtual parallel resource management
CA2956617A1 (en) 2014-08-05 2016-02-11 Damaka, Inc. System and method for providing unified communications and collaboration (ucc) connectivity between incompatible systems
JP2016177782A (ja) * 2015-03-19 2016-10-06 パナソニックIpマネジメント株式会社 ウェアラブル装置及び翻訳システム
US10091025B2 (en) 2016-03-31 2018-10-02 Damaka, Inc. System and method for enabling use of a single user identifier across incompatible networks for UCC functionality
CN106383902A (zh) * 2016-09-29 2017-02-08 安徽声讯信息技术有限公司 一种现场访问新闻即时存储发布方法及系统
CN111177353B (zh) * 2019-12-27 2023-06-09 赣州得辉达科技有限公司 文本记录生成方法、装置、计算机设备及存储介质
CN113763920B (zh) * 2020-05-29 2023-09-08 广东美的制冷设备有限公司 空调器及其语音生成方法、语音生成装置和可读存储介质
US11902343B1 (en) 2021-04-19 2024-02-13 Damaka, Inc. System and method for highly scalable browser-based audio/video conferencing
US11770584B1 (en) 2021-05-23 2023-09-26 Damaka, Inc. System and method for optimizing video communications based on device capabilities

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5051924A (en) * 1988-03-31 1991-09-24 Bergeron Larry E Method and apparatus for the generation of reports
DE4331710A1 (de) * 1993-09-17 1995-03-23 Sel Alcatel Ag Verfahren und Vorrichtung zum Erstellen und Bearbeiten von Textdokumenten
US5875448A (en) * 1996-10-08 1999-02-23 Boys; Donald R. Data stream editing system including a hand-held voice-editing apparatus having a position-finding enunciator

Also Published As

Publication number Publication date
US6219638B1 (en) 2001-04-17
KR20000034881A (ko) 2000-06-26
JP3873131B2 (ja) 2007-01-24
CN1255011A (zh) 2000-05-31
KR100329894B1 (ko) 2002-03-22
JP2000148182A (ja) 2000-05-26

Similar Documents

Publication Publication Date Title
CN1155214C (zh) 用于电话消息录制的编辑系统和方法
EP0378694B1 (en) Response control system
US6507643B1 (en) Speech recognition system and method for converting voice mail messages to electronic mail messages
US6519327B1 (en) System and method for selectively retrieving messages stored on telephony and data networks
US5724410A (en) Two-way voice messaging terminal having a speech to text converter
US6651042B1 (en) System and method for automatic voice message processing
US6385306B1 (en) Audio file transmission method
US8755494B2 (en) Method and apparatus for voice interactive messaging
US6775360B2 (en) Method and system for providing textual content along with voice messages
JP3527401B2 (ja) ボイスメッセージの明瞭度を向上する方法
US6873687B2 (en) Method and apparatus for capturing and retrieving voice messages
US20090157830A1 (en) Apparatus for and method of generating a multimedia email
EP1440552A2 (en) System for sending text messages converted into speech through an internet connection to a telephone and method for running it
US20120243669A1 (en) System and method for automatically transcribing voicemail
US20040008827A1 (en) Management of a voicemail system
US20060233319A1 (en) Automatic messaging system
KR100338466B1 (ko) 전화응답시스템및전화메시지를효율적으로액세스하는방법
KR100325986B1 (ko) 전화를 이용한 멀티미디어 카드 송수신 방법 및 장치
US6963838B1 (en) Adaptive hosted text to speech processing
US7346505B1 (en) System and method for voicemail transcription
US7653181B2 (en) Method of creating and managing a customized recording of audio data relayed over a phone network
JP2006146507A (ja) 不動産管理システム及びその方法
JP5326539B2 (ja) 留守番電話システム、留守番電話サービスサーバ及び留守番電話サービス方法
WO2000054482A1 (en) Method and apparatus for telephone email
JP2000020096A (ja) 音声メッセージ再生装置

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20040623