CN104854852A - 用于为电话通话的语音到文本转录确定语言的方法和设备 - Google Patents

用于为电话通话的语音到文本转录确定语言的方法和设备 Download PDF

Info

Publication number
CN104854852A
CN104854852A CN201280077542.8A CN201280077542A CN104854852A CN 104854852 A CN104854852 A CN 104854852A CN 201280077542 A CN201280077542 A CN 201280077542A CN 104854852 A CN104854852 A CN 104854852A
Authority
CN
China
Prior art keywords
language
caller
recipient
text
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280077542.8A
Other languages
English (en)
Other versions
CN104854852B (zh
Inventor
埃塞基耶尔·鲁伊斯·罗德里格斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
This Trade Of Salol Nico And Service One People Co Ltd
Saronikos Trading and Services Unipessoal Ltda
Original Assignee
This Trade Of Salol Nico And Service One People Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by This Trade Of Salol Nico And Service One People Co Ltd filed Critical This Trade Of Salol Nico And Service One People Co Ltd
Publication of CN104854852A publication Critical patent/CN104854852A/zh
Application granted granted Critical
Publication of CN104854852B publication Critical patent/CN104854852B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/533Voice mail systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/60Medium conversion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/20Aspects of automatic or semi-automatic exchanges related to features of supplementary services
    • H04M2203/2061Language aspects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2203/00Aspects of automatic or semi-automatic exchanges
    • H04M2203/45Aspects of automatic or semi-automatic exchanges related to voicemail messaging
    • H04M2203/4536Voicemail combined with text-based messaging
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2242/00Special services or facilities
    • H04M2242/12Language recognition, selection or translation arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/58Details of telephonic subscriber devices including a multilanguage function

Abstract

本发明提供了用于从可用于由应答机系统提供的、对呼叫者和接收者之间的电话通话进行语音到文本转录的多种语言中确定语言的方法、设备和系统,其特征在于,基于以下选项向呼叫者建议可用语言中的至少两种:与所述呼叫者对应的电话国家代码,与所述接收者对应的电话国家代码,在可用于由所述应答机系统进行的转录的一组语言中包含的语言,基于由呼叫者或接收者设定的参数而自动选择的语言,其中所述呼叫者选择与所述应答机系统交互的所述语言,并且相应的语音消息被转录成所选语言的文本以传送给所述接收者。

Description

用于为电话通话的语音到文本转录确定语言的方法和设备
本发明总体上涉及用于将语音消息转录成文本的方法、设备和系统。本发明更特别地涉及用于确定语音到文本转录的语言的方法、设备和系统。
已经开发了许多转录系统和方法。例如当呼叫者建立连接以给接收者留消息时,通话可能会被转录代理监控或者被转录算法分析以识别出正确的转录语言。语音消息然后被代理手动地或者通过转录算法转录成文本文件。由现有解决方案提供的手动的语音到文本转录系统的一个缺点在于需要人力来转录,由于成本的原因这限制了语音到文本转录服务(VTTS)的可用性并且抑制了VTTS在国家和国际层面上的传播。由于会涉及不同语言,手动VTTS的传播需要大量的人力。此外,由于语音到文本转录(VTT)的算法性能不够,可用的自动VTTS是不可靠的。语音识别系统领域中的首要问题是语言识别。在不能识别出正确的语言的情况下,这导致自动转录的所有在后处理步骤的讹误。抑制VTTS的地域扩展的另一个原因是,在实际接收者不可及或者不方便的情况下,用于接收通话的应答机不提供可接受的语言以与呼叫者通信和以根据正确的语言转录语音消息。
因此,需要用于通过基于不同的规范或条件而确定正确的语言来将语音消息转录成文本的方法、设备和系统,以增强转录性能。
本发明的另一个目标在于向呼叫者和/或接收者提供期望的语言用于转录语音消息。
本发明的又一目标在于提供用于电话、特别是用于手机的语音到文本转录模式,其能够由接收者激活,使得当接收者不方便应答语音通话时,转录语言被选择为使得接收者在任何情况下都能够接收文本形式的被转录的语音消息。
通过以下方法实现本发明的前述目标和其他目标,所述方法用于从可用于由应答机系统提供的对呼叫者和接收者之间的电话通话进行语音到文本转录的多种语言中确定语言,其特征在于,基于以下选项中的至少两个向呼叫者建议所述可用语言中的至少两种:
-与所述呼叫者对应的电话国家代码,
-与所述接收者对应的电话国家代码,
-在可用于由所述应答机系统进行的转录的一组语言中包含的语言,
-基于由呼叫者或接收者设定的参数而自动选择的语言,
-由所述呼叫者定义的语言,
-由所述接收者定义的语言。
其中所述呼叫者选择与所述应答机系统交互的所述语言,并且相应的语音消息被转录成所选语言的文本用于传送给所述接收者。
在基于前述条件建议了一种或更多种语言后,呼叫者通过输入相应的号码或者通过语音命令来选择语言,使得语音消息被转录成文本。还能够基于由呼叫者或接收者设定的参数自动选择用于语音到文本转录的语言。
考虑以下详细描述和附图,本发明的以上和其他的方面和优点会变得明显,在附图中:
图1表示实施方法并且包括根据本发明的一些实施例的用于将语音消息转录成文本的设备和系统的电话网络的框图。
在用于确定语音消息到文本的转录(VTTS)中的语言的系统中起着重要作用的实体是:呼叫者的电话3、实际与呼叫者的电话3联系的服务提供者4(不管服务提供者4是否进行漫游服务)、连接全世界服务提供者的全球网络6、实际与接收者的电话5和应答机联系的服务提供者1,其中所述应答机包含在正接收来自呼叫者的电话通话的服务提供者1的服务器中托管(host)的语音到文本转录VTT 2。
因此,基于本发明,技术问题在于,当呼叫者进行电话通话而接收者未应答并且服务提供者1想向接收者提供不仅听取呼叫者的消息而且将由呼叫者留下的语音消息的呼叫者语言转录成文本的可能性时,具有VTT设施的服务器侧要做什么。然而,能够仅使用伴随呼叫者的电话3的少量信息(例如国家代码)或根据在接收者的服务提供者1的服务器中存储的一些信息来选择转录语言。例如,在接收者与服务提供者1签订电话协议的时刻,可以设定他/她想要用于VTTS的转录语言。
根据本发明的一些有用的实施例,服务器能够存储呼叫者和接收者先前选择的语言和/或设置。根据存储的信息,服务器向呼叫者和/或接收者建议优选的语言,或者其自动选择由同一呼叫者在先前通话期间使用的VTT2的语言。存储相关信息的一个有利的实施例是存储与特定电话号码相关的语音到文本转录语言。在这种情况下,服务提供者1记录呼叫者的电话号码和同一呼叫者之前使用的用于转录的语言,应答机具有自动选择用于未应答来电并且用于执行语音到文本转录的语言的可能性,而不需要搜索可用于转录的所有语言。
存在几个有利的可选方案来限定依赖关系以建议优选的语言。第一可选方案是根据呼叫者的电话号码建议所选语言。在这种情况下,使用从特定的呼叫者到特定的接收者的先前通话中的语言选择来建议优选的语言。第二可选方案是根据特定的接收者来建议所选语言。根据该可选方案,建议与接收者的国家代码相关的语言或者以前使用的语言,而不管呼叫人的电话号码和在服务器中所存储的语言。该可选方案具有如下优点,在使用语音到文本转录系统一段时间之后,根据特定的接收者的所有可使用的语言都被存储在服务器上,这提高了为将来的语言到文本转录而建议和选择合适语言的效率和速度。
存在数种可能性来限定电话国家代码。电话国家代码得自在呼叫者或接收者的相应电话号码中包含的电话国家代码(例如德国是+41,英国是+44,法国是+33等),所述国家代码对VTT来说是已知的,这是由于其例如是来电时由电信网络6发送到VTT的。
电话国家代码还与所使用的SIM卡的来源国有关(或者对应于所述呼叫者或接收者在通话期间的当前位置),或者还与MCC(移动国家代码)和MNC(移动网络代码)有关,这两种代码结合形成国际移动用户识别码(IMSI),其唯一地标识移动电话运营商/承载商,并且由此隐含地标识通话源自哪个国家或呼叫者的国家。
使用与术语“语言”相关的术语“建议”来表示提供可视或可听的信息或指示(如语音消息),其指定一种或更多种语言或者指定包括一种或更多种语言的列表以用于手动或自动选择。短语“国家代码”的使用等同于电话国家代码。
使用与呼叫者或接收者对应的国家代码作为条件,在两端(即在呼叫者端和接收者端)都涉及数种可能性。依赖于呼叫者的一个可选方案是验证呼叫者的电话号码的国家代码。这意味着如果呼叫者的电话号码源自特定国家或基地在特定国家的特定电信公司,那么相应地使用和建议这些国家中的一个的国家代码,其通常为同一国家代码。当呼叫者停留在他/她居住和说当地语言的其原籍国家,而因此呼叫者以当地语言留语音消息的可能性非常大时,该方法是有利的。当接收者与呼叫者停留并且生活在同一国家并且说同一种语言时,这种可能性也是大的。这意味着即使接收者停留在呼叫者的国家代码之外的国外,这也会使得高效地建议或选择正确的语言。当双方(即呼叫者和接收者)都待在国外时,前述方法(即依赖于呼叫者的状态)也是有利的。而呼叫者待在国外时意味着呼叫者国家代码的两个主要的验证可选方案。第一个可选方案是通过位于不同国家的几个电信公司之间的漫游协议和漫游系统的存在,可以验证呼叫者的国家代码,这是因为通过不管呼叫者的位置来发起通话,呼叫者的设备或者SIM卡的原始国家代码都被传输的事实,使得执行正确语言的建议和/或选择。这也使得当双方都待在国外并且接收者来自与呼叫者相同乃至不同的国家时建议和/或选择正确的语言,这是因为接收者与呼叫者说同一种语言的可能性非常高。总之,能够说依赖于呼叫者的原籍而不管接收者的原籍,使得能够建议和/或选择正确的语音到文本转录语言。
在本发明的另一个有利的实施例(可选方案)中,接收者的状态(例如呼叫者和/或接收者的生活区域)被纳入考虑,或者其涉及在世界上广泛分布的语言。与上述有利方法类似地,根据接收者的原籍国家代码来执行正确语言的建议和/或选择,所述代码例如由所使用的设备的来源、SIM卡的来源或者电信公司与接收者之间的协议来限定。
另一个有利的实施例(可选方案)包括世界上广泛分布的语言的建议和/或选择。通过呼叫者预先知道的预定义语言来执行该有利的方法或者通过语音消息向呼叫者通告该语言。根据在区域、州、国家或国际层面上的本地发生来指定广泛分布的语言。广泛分布的语言的一些示例是英语、西班牙语、德语、法语、葡萄牙语等。
总之,存在能够被提供给呼叫者用于VTTS的数种语言,重要的是呼叫者通过输入相应的语言识别命令或者通过语音命令来选择优选的语言,然后相应的语音消息被转录成所选语言的文本用于传送给所述接收者。可以通过例如在呼叫者的电话(特别是无绳电话、手机、智能电话等类型的电话)的显示屏上显示的选择菜单来支持由呼叫者进行的选择,其中在该选择菜单中基于以下选项中的至少两个在所述显示屏上建议那些语言:
-与所述呼叫者对应的电话国家代码,
-与所述接收者对应的电话国家代码,
-在可用于由所述应答机系统进行的转录的一组语言中包含的语言,
-基于由呼叫者或接收者设定的参数而自动选择的语言,
-由所述呼叫者定义的语言,
-由所述接收者定义的语言。
根据另一个有利的实施例,呼叫者获得了核准和/或修改他被转录的语音消息的可能性。该可选方案在向接收者传送之前将转录的文本消息提供给呼叫者。在这种情况下,在传送给接收者之前,VTT服务器将转录的文本消息(例如SMS消息)发送给呼叫者用于核准和/或修改,并且呼叫者在检查转录的文本消息的同时可以选择修改、扩展甚至放弃该文本消息并且取消传送。当转录文本得到呼叫者核准时,其最终被发送给接收者。
呼叫者还有利地获得将诸如图像、pdf(可移植文档格式)、文本数据、URL(统一资源定位符)等的数据附加到文本消息的可能性。将数据附加到然后被转录到文本的语音消息的有利的可能性不限于在传送给接收者之前接收转录的文本消息的前述可选方案。通过在留语音消息之前或之后选择至少一种数据作为附件来支持有利的附加功能。
VTT服务器或电信服务器识别出转录语音消息和选作附件的数据是一起的。
另一个有利的实施例考虑了由呼叫者使用的设备的设定语言。已知电子设备、特别是与使用者交互的电话和手机能够提供不同的语言设置。有利地考虑了设备的设定语言有助于独立于SIM号码或通话源自哪个国家来自动建议和/或选择由呼叫者实际使用的VTT语言。因此,对呼叫者和/或接收者的设备的设定语言的请求使得建议和/或选择正确的并且能够被呼叫者和接收者理解的VTT语言。显然在这种情况下,应该加强呼叫者的服务器和接收者的服务器之间的数据交换协议,以还将该信息包含在呼叫者和接收者之间交换的数据中。
根据本发明的另一个有利的实施例,考虑了存储的文本内容、特别是文本消息(如SMS、MMS、电子邮件、备忘录、twitter文本)的语言以建议和/或选择正确且能够被理解的VTT语言。由于与应用为了识别所使用的语言而分析语音消息的算法相比,分析书面形式的文本内容有利于更好地识别语言,因此前述实施例是有利的。而且在这种情况下,应该加强呼叫者的服务器和接收者的服务器之间的交换数据的协议,以还将该信息包含在呼叫者和接收者之间交换的数据中。
另一个有利的实施例考虑了呼叫者和/或接收者的联系人列表信息。该有利的考虑基于现今设备能够存储用于几个联系人的联系人列表的事实,这为单个联系人的多个条目提供了可能。单个联系人的可能信息栏包括关于移动电话号码、固话号码、家庭地址、公司地址、主页、名、姓、公司、注释、电子邮件地址、主页、生日的条目乃至能够由使用者个别地修改的栏。许多前述条目给出了可观的信息来建议和/或选择正确且能够被理解的VTT语言。还有利的是创建专门的栏以输入用于每个联系人的文本转录语言。有益的是每当使用者在他的设备、特别是电话或手机上创建新的联系人时都执行自动的语言输入请求。当呼叫者利用关于接收者语言的条目拨打他/她的号码以留下被指定会转录成文本消息的语音消息时,然后使用该有利的和最可靠的条目。在这种情况下,在来自与呼叫者相关的服务提供者4的服务器和与接收者相关的服务提供者1的服务器的数据的交换中应该插入特定的信息。前述实施例的另一个有利效果是可以在诸如各种“云”设施之类的服务器系统上访问联系人列表。然后在不同使用者和电信公司之间共享联系人列表中的一些条目。通过遵守监管数据保护和数据安全的法律,可以具有包括可由电信公司访问的、用于VTT服务的电话号码和相应语言的条目。
本发明的另一个有利的实施例旨在用于考虑多个可转录和可用的语言,以自动建议和/或选择正确且可理解的VTT语言。该有益的实施例的目标在于考虑关于可供VTT服务使用的语言的区域、国家或者国际的性能或语言差别的限制。可能是VTT服务被限于一些特定语言的情况,使得由之前的有利实施例中的一个而获得的语言中的一种不被支持,或者甚至没有合适的算法可用于一些外来语言的加密。还可以设想由于过载、错误或可访问性问题而在特定的时间不支持VTT服务中的一种或更多种语言。在上述情况下,多个可被转录且可用的语言的建议和/或选择对于克服这些问题来说是有利的实施例。
在根据之前的有利实施例中的一个建议一种语言之后自动或手动地执行语言的选择。通过偏好或优先考虑上述条件中的一个以用于语言的最终选择,提供了实现语言的自动选择的一种有利的方式,这使得对于呼叫者来说VTT服务被简化。该优先考虑意味着考虑上述条件中的一个或一些,这导致单一语言或不同语言的列表。
在获得数种语言的列表的情况下,根据具有最大可能性的语言、例如列表上面的语言来执行自动选择。还可以具有特别的算法来分析由以上条件得出的不同语言,以选择所建议的语言中的一种用于VTT服务。
通过为呼叫者和/或接收者提供手动的选择,提出了本发明的另一种有利策略。根据该方案,使用者、呼叫者和/或接听者分别获得包括供选择的语言中的一种或多种的建议。语言的建议是文本形式的,在使用者的设备的显示屏上可见的,或者作为语音消息,该语音消息促使使用者拨打与所建议语言中的一种相对应的号码、滚动并且选择语言中的一种或者重复期望的语言作为语音命令。
另一个有利的实施例提出了由使用者在语音消息的特定位置通过直接的语音命令进行的手动选择。语音消息的特定位置或时间帧有利地在语音消息的开始或者结尾处。将特定的时间帧定义为指定该语言作为语音命令提高了通过语音识别算法识别所指定的语言的可能性。一种方案是拨打接收者的号码,并且呼叫者在语音消息开始时直接指定VTT语言,然后通过语音识别算法来验证该语言。
另一个有利实施例考虑了当呼叫者第一次呼叫接收者时或者当用于上述条件以建议和/或选择VTT语言的信息不可用时的情况。在这种情况下,可以发起然后被可能的接收者实时应答的请求。根据以上可选方案中的一个来执行所述请求,并且在接收者应答了关于期望语言的问题后,呼叫者以任一种期望的语言或者甚至以可能的接收者所期望的同一种语言留下消息。这样在VTT服务中涉及翻译服务。使得不管各方的语言能力如何都执行他们之间的通信。
在无绳电话、手机等的特定类型中,提供语音到文本转录配置能够被创建或被激活,所述配置用于将来电转移到语音到文本转录服务。所述配置文件能够由使用者激活。
本发明提供了用于具有语音到文本转录配置的电话、特别是无绳电话或手机的另一个有利的实施例。已知特别是手机提供振动提示、静音配置或由使用者个别定义的其它配置。具有语音到文本转录配置的有利方法使得能够手动地确定电话的状态。除了上述优点之外,在不允许已知模式的典型使用的情况下(例如在飞行期间、降落、起飞或者在如医院或实验室的对电磁敏感的区域中)可设想VTT的另外的优点。通过单独地决定和确定电话的接收状态,通过利用VTT配置来使接收者能够接收被转录的语音消息,实现了这样的优点。另一个优点在传输比SMS或电子邮件更长的消息而不需要费力书写的同时缓解了对于呼叫者的情况中得以实现。
为了进一步理解本发明,下文中我们描述怎么利用本发明的示例性示例。
让我们假设呼叫者正呼叫接收者,并且让我们进一步假设该呼叫者能够用至少两种语言(例如葡萄牙语和英语)交谈。此外,让我们假设呼叫者具有分配有巴西电话国家代码0055的电话并且呼叫者正呼叫在电话国家代码为0044的英国的某人。如果当时由于接收者不在,呼叫者想在接收者的应答机上留消息,使得所述消息的文本将在语音到文本转录中被转录,则呼叫者必须决定他必须使用哪种语言。如果接收者仅能够用英语交谈,则如果呼叫者将葡萄牙语用于他的文本消息来进行语音到文本转录是没有任何意义的,这是因为接收者不理解该语言。因此,该系统可以向呼叫者建议将英语(基于0044)或者葡萄牙语(基于0055)用于他的语音消息,而呼叫者可以选择英语。
但是如果接收者也能够用葡萄牙语和英语交谈,则系统给呼叫者机会来在分配给他的电话国家代码的语言(巴西,因此葡萄牙语)和接收者的电话国家代码的语言(因此英语)之间选择。然后呼叫者可以使用他/她正选择的语言(可能是他最熟悉的语言),使得语音到文本转录能够分析他的以所选语言的语音消息并且能够将其转录成文本。
让我们假设前述示例的变化方案,呼叫者是德语为母语的某人,并且让我们进一步假设接收者是呼叫者的父亲并且也能够说作为母语的德语。如果当时实际上在巴西并且具有巴西电话国家代码的呼叫者正在呼叫他在英国的具有英国电话国家代码的父亲,呼叫者不愿意用葡萄牙语或英语和他的父亲交谈,即使接收者能够用葡萄牙语和英语和德语交谈,但是如果呼叫者与接收者具有特定关系(如儿子或女儿与他或她的父亲具有特定关系一样),他们通常希望用他们偏爱的交流语言(例如在此是作为母语的德语)来交谈。
因此,可能更好的是,基于由呼叫者或接收者设定的参数自动选择语言,例如接收者可能会设定与在巴西的特定电话号码(即他的儿子或他的女儿的电话号码)相关的参数,德语被建议作为优选语言和/或英语和/或葡萄牙语作为第二和/或第三选项。
另一个示例可以是接收者的应答机不是最先进的一种,使得应答机仅能够使用一种或两种语言(例如英语和荷兰语)用于语音到文本转录。那么,呼叫者应该具有他可以将哪种语言用于语音到文本消息的信息。
因此,可以使用多少可选方案还取决于由呼叫者和/或接收者使用的全部硬件和软件。最明显的可选方案有时可以是建议呼叫者使用他的电话国家代码的语言,下一个可选方案(也是非常可能的)是待使用的语言由接收者的电话国家代码来限定。但是,如之前在示例中提到的,有时这导致建议不是最佳一个并且因此会考虑其他可选方案来建议优选语言。
此外,如果呼叫者给特定的电话号码分配特定的语言,则以下是可能的:如果呼叫者呼叫另一个电话号码,则基于前述可选方案中的一个,他仍能够在不同语言之间选择。
因此,本发明的整个系统还能够个性化地处理呼叫者的愿望和接收者的愿望,并且由于事实上有很多时机对于一个呼叫者来说有各种不同的接收者或者对于一个接收者来说有各种不同的呼叫者,本发明的系统足够灵活来以在各种情景下支持语音到文本转录的自动方式使用,使得文本消息最终被转录成能够由接收者使用的语言。
如果例如接收者不能以某种语言(例如法语)交谈,则还可以通过消息将不能接受法语的信息以电子方式传递给呼叫者的电话,使得呼叫者通过使用传统菜单系统(用于选择语言)在建议能够使用的各种语言的、他的菜单中看到不能接受法语。因此,于优选在呼叫者的电话(如手机、智能手机等)的显示屏上显示的菜单中,不仅存在建议的能够使用的那些语言而且它还可以加上不能被接收者或他的应答机系统所接受的一种或另外的语言。
本发明的另一个变化方案能够如下:
让我们假设呼叫者是仅能够说英语的某人,并且让我们进一步假设接收者是不能理解英语而仅能理解德语的某人。
然后,呼叫者会将他的英语用于文本消息来进行语音到文本转录。除此之外,他/她还可以决定应答机系统应该使用哪种自动翻译系统来将英语文本翻译成德语文本。如果例如呼叫者对某个翻译系统(例如“谷歌翻译器”)具有非常好的经验,他认为该翻译系统远好于另一自动翻译系统(例如“LEO”或其它自动翻译系统),则这是非常有利的解决方案。
因此,以下也可以是本发明方法的一部分:呼叫者不仅选择由他/她使用来与应答机交互的某种语言,他/她还决定应答机应该使用哪种翻译程序(软件)或系统。如果例如呼叫者选择“谷歌”翻译程序,则他/她会将该信息通过电子命令或电子信息给应答机系统,使得在语音到文本转录之后,该文本被自动传递给“谷歌”翻译系统,并且响应于此,接收者接收由“谷歌翻译器”翻译的英语文本,该文本有可能与德语文本一起(或者仅德语文本)。
本发明的另一个有利的变化方案是,由应答机系统自动选择待选择的翻译服务,这是由于该机器系统已经由接收者设定为使用某种翻译服务,例如“LEO”。于是,呼叫者不需要决定应该使用哪种翻译系统,这是由于应答机系统已经被编程为使用某种翻译系统用于转录的文本。用于将语音消息转录成文本的方法、设备和系统和更特别是用于确定语音到文本转录语言的方法、设备和系统可以在不脱离本发明思想的新颖性精神的情况下受到许多可能的改变;还显而易见的是,在本发明的实际实施中,所图示的细节可以具有不同的形状或者被其他的技术等同元素替代。
因此,能够容易地理解的是,本发明不限于如本说明书中描述的用于确定语音到文本转录语言的方法、设备和系统,而是在不脱离如所附权利要求中明确规定的本发明思想的新颖性精神的情况下可以受到许多修改、改进或等同部分和元素的替代。

Claims (16)

1.一种用于从可用于由应答机系统提供的、对呼叫者和接收者之间的电话通话进行语音到文本转录的多种语言中确定语言的方法,其特征在于,基于至少两个不同的技术选项向所述呼叫者建议可用语言中的至少两种:
其中所述呼叫者通过与所述应答机系统交互来从所建议的至少两种语言中选择所述语言,
并且相应的语音消息被转录成所选语言的文本以用于传送给所述接收者。
2.根据权利要求1所述的方法,
其中从以下选项中选择所述至少两个不同的技术选项:
-与所述呼叫者对应的电话国家代码,
-与所述接收者对应的电话国家代码,
-在可用于所述应答机系统进行的转录的一组语言中包含的语言,
-基于由所述呼叫者或所述接收者设定的参数而自动选择的语言,
-由所述呼叫者定义的语言,
-由所述接收者定义的语言。
3.根据权利要求1所述的方法,其特征在于所述交互包括输入相应语言识别命令或给出语音命令的步骤。
4.根据权利要求1所述的方法,其特征在于在所述一组语言中包含的所述语言中的至少一种由所述呼叫者和/或接收者的居住区域限定或者涉及在世界上广泛分布的语言。
5.根据前述权利要求中任一项所述的方法,其特征在于,所述电话国家代码得自在所述呼叫者或所述接收者的相应电话号码中包含的电话国家代码、与所使用的SIM卡的来源国相关的电话国家代码或者与所述呼叫者或所述接收者在所述通话期间的当前位置相对应的电话国家代码。
6.根据前述权利要求中任一项所述的方法,其特征在于,所述接收者和/或所述呼叫者的电话提供语音到文本转录模式,以显示用于由所述接收者或所述呼叫者手动选择语言的所述可用语言。
7.根据前述权利要求之一所述的方法,其特征在于,所述应答机被包含在电信服务器中,所述服务器存储所述呼叫者和/或所述接收者的语言选择信息以建议用于由所述呼叫者请求的、将来的语音到文本转录的优选语言。
8.根据前述权利要求中任一项所述的方法,其特征在于,在所述传送给所述接收者之前,所述呼叫者接收文本消息以用于核准和/或修改,然后在所述呼叫者确认的情况下,所述文本消息被传送给所述接收者。
9.根据前述权利要求中任一项所述的方法,其特征在于,所述呼叫者将数据附加到相应的转录的文本消息中,所附加的数据至少是与所述转录的文本消息相关的、待由所述接收者接收的文本文档、图像、电子邮件、URL等,通过在所述呼叫者的电话上的选择来附加所述数据。
10.一种用于从可用于由应答机系统提供的、对呼叫者和接收者之间的电话通话进行语音到文本转录的多种语言中确定语言的方法,其特征在于,基于由所述呼叫者或所述接收者设定的参数来自动选择用于所述语音到文本转录的语言。
11.根据权利要求10所述的从多种语言中确定语言的方法,其特征在于,从所述呼叫者的电话设置的不同语言中选择的语言用于自动选择文本转录的语言。
12.根据权利要求10所述的从多种语言中确定语言的方法,其特征在于,在所述呼叫者的电话中存储的文本数据的书面形式的内容被用于识别所述文本转录的语言。
13.根据权利要求10所述的从多种语言中确定语言的方法,其特征在于,根据在联系人列表中存储的信息来获得待用于所述文本转录的语言并且将该语言传输给所述应答机系统,所述联系人列表是用于在所述呼叫者的电话中记录的几个联系人的列表。
14.根据权利要求10所述的从多种语言中确定语言的方法,其特征在于,所述呼叫者的电话号码和之前用于来自所述呼叫者的语音消息的转录的语言被记录在所述应答机系统中,并且被用于自动选择转录语言。
15.一种包括至少一个电子设备的转录系统,其用于执行根据前述权利要求中至少一项所述的方法中的一个。
16.一种电话,特别是无绳电话、手机等类型的电话,其提供了语音到文本转录配置,该配置用于将来电转移到语音到文本转录服务,其中所述配置被自动激活或者由使用者基于根据前述权利要求中的至少一项所述的方法来激活。
CN201280077542.8A 2012-12-06 2012-12-06 用于为电话通话的语音到文本转录确定语言的方法和设备 Active CN104854852B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2012/074706 WO2014086424A1 (en) 2012-12-06 2012-12-06 Method and devices for language determination for voice to text transcription of phone calls

Publications (2)

Publication Number Publication Date
CN104854852A true CN104854852A (zh) 2015-08-19
CN104854852B CN104854852B (zh) 2018-04-20

Family

ID=47678667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280077542.8A Active CN104854852B (zh) 2012-12-06 2012-12-06 用于为电话通话的语音到文本转录确定语言的方法和设备

Country Status (7)

Country Link
US (1) US9966072B2 (zh)
EP (1) EP2929677B1 (zh)
JP (1) JP2016502828A (zh)
KR (1) KR20150091406A (zh)
CN (1) CN104854852B (zh)
ES (1) ES2637414T3 (zh)
WO (1) WO2014086424A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140180671A1 (en) * 2012-12-24 2014-06-26 Maria Osipova Transferring Language of Communication Information
WO2015010053A1 (en) * 2013-07-19 2015-01-22 Purple Communications Inc A method and system for routing video calls to a target queue based upon dynamically selected or statically defined parameters
US9614969B2 (en) * 2014-05-27 2017-04-04 Microsoft Technology Licensing, Llc In-call translation
US9514129B2 (en) * 2014-07-18 2016-12-06 Intel Corporation Technologies for providing textual information and systems and methods using the same
US10775996B2 (en) * 2014-11-26 2020-09-15 Snap Inc. Hybridization of voice notes and calling
EP3217638B1 (en) * 2016-03-11 2019-11-20 Sony Mobile Communications Inc Transferring information from a sender to a recipient during a telephone call under noisy environment
US11323458B1 (en) * 2016-08-22 2022-05-03 Paubox, Inc. Method for securely communicating email content between a sender and a recipient
US11410641B2 (en) * 2018-11-28 2022-08-09 Google Llc Training and/or using a language selection model for automatically determining language for speech recognition of spoken utterance
US11095775B1 (en) * 2019-08-06 2021-08-17 Noble Systems Corporation Handling an outbound call reaching a voicemail service
CN111182153B (zh) * 2020-01-03 2021-09-28 惠州Tcl移动通信有限公司 系统语言的设置方法、装置、存储介质及移动终端
US11627223B2 (en) * 2021-04-22 2023-04-11 Zoom Video Communications, Inc. Visual interactive voice response

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1255011A (zh) * 1998-11-03 2000-05-31 国际商业机器公司 用于电话消息录制的编辑系统和方法
US20040102201A1 (en) * 2002-11-22 2004-05-27 Levin Robert E. System and method for language translation via remote devices
US20090248392A1 (en) * 2008-03-25 2009-10-01 International Business Machines Corporation Facilitating language learning during instant messaging sessions through simultaneous presentation of an original instant message and a translated version
US20100303222A1 (en) * 2009-05-28 2010-12-02 Comcast Cable Communications, Llc Stateful Home Phone Service
US20120035908A1 (en) * 2010-08-05 2012-02-09 Google Inc. Translating Languages
US20120069131A1 (en) * 2010-05-28 2012-03-22 Abelow Daniel H Reality alternate
US20120078609A1 (en) * 2010-09-24 2012-03-29 Damaka, Inc. System and method for language translation in a hybrid peer-to-peer environment

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5440615A (en) * 1992-03-31 1995-08-08 At&T Corp. Language selection for voice messaging system
US6865266B1 (en) * 2002-01-16 2005-03-08 Verizon Services Corp. Methods and apparatus for transferring from a PSTN to a VOIP telephone network
GB0204246D0 (en) * 2002-02-22 2002-04-10 Mitel Knowledge Corp System and method for message language translation
JP2003288340A (ja) 2002-03-27 2003-10-10 Ntt Comware Corp 通話翻訳装置
JP3686879B2 (ja) 2002-05-08 2005-08-24 Necアクセステクニカ株式会社 ファクシミリ装置
US20050239037A1 (en) * 2004-04-06 2005-10-27 Surapong Lertsithichai Convertible podium system
US8204748B2 (en) 2006-05-02 2012-06-19 Xerox Corporation System and method for providing a textual representation of an audio message to a mobile device
DE102007027363A1 (de) 2007-06-11 2008-12-24 Avaya Gmbh & Co. Kg Verfahren zum Betreiben eines Voice-Mail-Systems
WO2009029296A1 (en) * 2007-08-31 2009-03-05 At & T Mobility Ii Llc Enhanced messaging with language translation feature
US8995947B2 (en) * 2012-07-20 2015-03-31 Google Technology Holdings LLC Configuration of display settings for broadcast messaging while roaming

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1255011A (zh) * 1998-11-03 2000-05-31 国际商业机器公司 用于电话消息录制的编辑系统和方法
US20040102201A1 (en) * 2002-11-22 2004-05-27 Levin Robert E. System and method for language translation via remote devices
US20090248392A1 (en) * 2008-03-25 2009-10-01 International Business Machines Corporation Facilitating language learning during instant messaging sessions through simultaneous presentation of an original instant message and a translated version
US20100303222A1 (en) * 2009-05-28 2010-12-02 Comcast Cable Communications, Llc Stateful Home Phone Service
US20120069131A1 (en) * 2010-05-28 2012-03-22 Abelow Daniel H Reality alternate
US20120035908A1 (en) * 2010-08-05 2012-02-09 Google Inc. Translating Languages
US20120078609A1 (en) * 2010-09-24 2012-03-29 Damaka, Inc. System and method for language translation in a hybrid peer-to-peer environment

Also Published As

Publication number Publication date
US20150317975A1 (en) 2015-11-05
ES2637414T3 (es) 2017-10-13
US9966072B2 (en) 2018-05-08
KR20150091406A (ko) 2015-08-10
EP2929677A1 (en) 2015-10-14
JP2016502828A (ja) 2016-01-28
CN104854852B (zh) 2018-04-20
WO2014086424A1 (en) 2014-06-12
EP2929677B1 (en) 2017-07-19

Similar Documents

Publication Publication Date Title
CN104854852A (zh) 用于为电话通话的语音到文本转录确定语言的方法和设备
CN101406028B (zh) 动态快速拨叫号码映射
CN101416539A (zh) 附加移动通信任务到用户信息模块卡的方法以及并入该方法的移动通信装置
CN102546989B (zh) 复杂话务快速转接方法及系统
CN105407202A (zh) 一种远程查询联系人信息的方法及终端
CN102934419A (zh) 用于管理运营商信息的设备和方法
CN103118358A (zh) 一种唯一识别手机用户注册方法
CN103167449A (zh) 为通信终端本机设置呼叫转移的方法和系统
CN105208179A (zh) 电话号码识别方法、系统及电子产品
KR101641166B1 (ko) 레터링 서비스 제공 장치 및 방법
KR101129299B1 (ko) 익명 통화 서비스 방법
KR101879785B1 (ko) 보이는ars에서 웹/앱의 세션 연결과 전화채널을 동기화시켜주는 착신 연결 방법
CN101340642A (zh) 一种传输电子名片的方法、系统和装置
KR20150067700A (ko) 다수의 메신저를 통합한 통합 메신저
US10142277B2 (en) Posting and consultation of messages by users of social networks
TWM617391U (zh) 預約管理系統
CN101267634B (zh) 一种主叫名片用户只读信息存储的方法
KR100738208B1 (ko) 통화중인 상대방과의 통신정보를 제공하는 방법 및서비스제공서버
KR101531309B1 (ko) 어플리케이션을 이용한 통화 종료 후의 서비스 제공방법
KR100776031B1 (ko) 통화중에 메시지를 전송하는 방법 및 이를 위한 시스템
KR20130137423A (ko) 주소록 정보 제공 장치 및 방법
CN101933309A (zh) 通信系统中为用户提供提示信息的方法和装置
KR101106326B1 (ko) 착신 단말기 전화번호에 매칭된 서브 착신 단말기로 통신 연결을 수행하는 통신 처리 서버 및 그 제어방법
KR20070074730A (ko) 단문메시지 서비스를 이용한 상담서비스 제공방법
KR101104705B1 (ko) 발신자정보 자동완성 방법, 그를 위한 발신자정보 표시시스템 및 발신자정보 관리 서버

Legal Events

Date Code Title Description
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant