CN104679733B - 一种语音对话翻译方法、装置及系统 - Google Patents

一种语音对话翻译方法、装置及系统 Download PDF

Info

Publication number
CN104679733B
CN104679733B CN201310611654.3A CN201310611654A CN104679733B CN 104679733 B CN104679733 B CN 104679733B CN 201310611654 A CN201310611654 A CN 201310611654A CN 104679733 B CN104679733 B CN 104679733B
Authority
CN
China
Prior art keywords
text information
topic field
language text
topic
source language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310611654.3A
Other languages
English (en)
Other versions
CN104679733A (zh
Inventor
郭勐
杨蕾
张俭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201310611654.3A priority Critical patent/CN104679733B/zh
Publication of CN104679733A publication Critical patent/CN104679733A/zh
Application granted granted Critical
Publication of CN104679733B publication Critical patent/CN104679733B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种语音对话翻译方法、装置及系统,包括:将当前对话的源语言语音转换为当前源语言文字信息,针对话题领域表中的每个话题领域,从该话题领域表中查询该当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数,针对每个话题领域,确定该多个关键词汇在该话题领域中的历史使用次数和,在该话题领域表中多个话题领域中,将历史使用次数和最大所对应的话题领域,确定为该当前对话的话题领域,按照该当前对话的话题领域对应的翻译规则,将该当前源语言文字信息翻译为目标语言文字信息,并将该目标语言文字信息转换为目标语言语音。采用本发明实施例提供的方案,相比现有技术,提高了语音对话翻译的准确度。

Description

一种语音对话翻译方法、装置及系统
技术领域
本发明涉及通信领域,尤其涉及一种语音对话翻译方法、装置及系统。
背景技术
随着计算机智能化的逐步发展,机器与人之间的信息交互更加多样化,理想的人机智能接口方式是让机器能够听懂人的语言,实现人机之间的直接对话,对话的前提是首先进行语音识别。在两种不同语言进行对话通信时,为了能够使两种语言实时通信,通过机器将一种语言翻译成另一种语言,实现两种不同语言的语音翻译。
目前,在两种不同语言进行对话通信时,现有的语音对话翻译方法主要是通过语音识别将源语言的语音信号转换为源语言文字,将该源语言文字翻译成目标语言文字,并通过语音合成将该目标语言文字合成为对应的目标语言语音。
在上述现有的语音对话翻译方法中,由于在对源语言文字进行翻译时,将源语言文字中的词汇翻译为对应的目标语言词汇,未考虑对话的话题领域和句型结构,使得语音对话翻译的准确度低。
发明内容
本发明实施例提供一种语音对话翻译方法、装置及系统,用以解决现有技术中存在的语音对话翻译的准确度低的问题。
本发明实施例提供一种语音对话翻译方法,包括:
将当前对话的源语言语音转换为当前源语言文字信息;
针对话题领域表中的每个话题领域,从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数;
针对每个话题领域,确定所述多个关键词汇在该话题领域中的历史使用次数和;
在所述话题领域表中多个话题领域中,将历史使用次数和最大所对应的话题领域,确定为所述当前对话的话题领域;
按照所述当前对话的话题领域对应的翻译规则,将所述当前源语言文字信息翻译为目标语言文字信息,并将所述目标语言文字信息转换为目标语言语音。
采用本发明实施例提供的上述方法,由于在对当前对话的源语言文字信息进行翻译时,参考了当前对话的话题领域,提高了语音对话翻译的准确度。
进一步的,在从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇在该话题领域中的历史使用次数之前,还包括:
确定历史对话表中存在所述当前源语言文字信息包括的关键句,所述关键句中包括所述当前源语言文字信息包括的多个关键词汇,所述历史对话表中存储有转换历史对话的源语言语音得到的源语言文字信息。
这样,通过确定历史对话表中存在所述当前源语言文字信息包括的关键句,可以确定当前对话与历史对话相关,则可以根据当前对话的话题领域对应的翻译规则,将当前源语言文字信息翻译为目标语言文字信息。
进一步的,上述方法,还包括:
当确定所述历史对话表中不存在所述当前源语言文字信息包括的所述关键句时,按照当前源语言的句型结构,将所述当前源语言文字信息翻译为目标语言文字信息,并将所述目标语言文字信息转换为目标语言语音。
进一步的,上述方法,还包括:
更新所述话题领域表中保存的所述多个关键词汇各自在所述当前对话的话题领域中的历史使用次数。
这样,在每一次对话翻译后,通过更新话题领域表中保存的多个关键词汇各自在当前对话的话题领域中的历史使用次数,能够更加准确地确定当前对话的话题领域,从而使得按照该当前源语言文字信息包括的多个关键词汇在当前对话的话题领域对应的翻译词汇,对当前对话进行翻译,可以提高当前对话翻译的准确度。
进一步的,按照所述当前对话的话题领域对应的翻译规则,将所述当前源语言文字信息翻译为目标语言文字信息,具体包括:
在所述当前对话的话题领域对应的当前翻译词汇表中,将所述多个关键词汇对应的翻译词汇,分别作为所述多个关键词汇对应的目标语言词汇;
根据所述多个关键词汇各自对应的目标语言词汇,将所述当前源语言文字信息翻译为目标语言文字信息。
本发明实施例还提供了一种语音对话翻译装置,包括:
转换单元,用于将当前对话的源语言语音转换为当前源语言文字信息;
查询单元,用于针对话题领域表中的每个话题领域,从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数;
历史使用次数和确定单元,用于针对每个话题领域,确定所述多个关键词汇在该话题领域中的历史使用次数和;
话题领域确定单元,用于在所述话题领域表中多个话题领域中,将历史使用次数和最大所对应的话题领域,确定为所述当前对话的话题领域;
第一翻译单元,用于按照所述当前对话的话题领域对应的翻译规则,将所述当前源语言文字信息翻译为目标语言文字信息,并将所述目标语言文字信息转换为目标语言语音。
采用本发明实施例提供的上述装置,由于在对当前对话的源语言文字信息进行翻译时,参考了当前对话的话题领域,提高了语音对话翻译的准确度。
进一步的,上述装置,还包括:
关键句确定单元,用于在从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇在该话题领域中的历史使用次数之前,确定历史对话表中存在所述当前源语言文字信息包括的关键句,所述关键句中包括所述当前源语言文字信息包括的多个关键词汇,所述历史对话表中存储有转换历史对话的源语言语音得到的源语言文字信息。
这样,通过确定历史对话表中存在所述当前源语言文字信息包括的关键句,可以确定当前对话与历史对话相关,则可以根据当前对话的话题领域对应的翻译规则,将当前源语言文字信息翻译为目标语言文字信息。
进一步的,上述装置,还包括:
第二翻译单元,用于当确定所述历史对话表中不存在所述当前源语言文字信息包括的所述关键句时,按照源语言的句型结构,将所述当前源语言文字信息翻译为目标语言文字信息,并将所述目标语言文字信息转换为目标语言语音。
进一步的,上述装置,还包括:
更新单元,用于更新所述话题领域表中保存的所述多个关键词汇各自在所述当前对话的话题领域中的历史使用次数。
这样,在每一次对话翻译后,通过更新话题领域表中保存的多个关键词汇各自在当前对话的话题领域中的历史使用次数,能够更加准确地确定当前对话的话题领域,从而使得按照该当前源语言文字信息包括的多个关键词汇在当前对话的话题领域对应的翻译词汇,对当前对话进行翻译,可以提高当前对话翻译的准确度。
进一步的,所述第一翻译单元,具体用于在所述当前对话的话题领域对应的当前翻译词汇表中,将所述多个关键词汇对应的翻译词汇,分别作为所述多个关键词汇对应的目标语言词汇;根据所述多个关键词汇各自对应的目标语言词汇,将所述当前源语言文字信息翻译为目标语言文字信息。
本发明实施例还提供了一种语音对话翻译系统,包括:语音输入端、翻译设备和语音输出端,其中:
所述语音输入端,用于采集用户的语音,并将采集的语音作为当前对话的源语言语音,发送给所述翻译设备;
所述翻译设备,用于将当前对话的源语言语音转换为当前源语言文字信息;并针对话题领域表中的每个话题领域,从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数;并针对每个话题领域,确定所述多个关键词汇在该话题领域中的历史使用次数和;并在所述话题领域表中多个话题领域中,将历史使用次数和最大所对应的话题领域,确定为所述当前对话的话题领域;并按照所述当前对话的话题领域对应的翻译规则,将所述当前源语言文字信息翻译为目标语言文字信息,并将所述目标语言文字信息转换为目标语言语音;以及将所述目标语言语音发送给所述语音输出端;
所述语音输出端,用于输出所述目标语言语音。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例提供的语音对话翻译方法的流程图;
图2为本发明实施例1提供的语音对话翻译方法的流程图;
图3为本发明实施例2提供的语音对话装置的结构示意图;
图4为本发明实施例3提供的语音对话系统的结构示意图。
具体实施方式
为了给出语音对话翻译的准确度的实现方案,本发明实施例提供了一种语音对话翻译方法、装置及系统,以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明实施例提供一种语音对话翻译方法,如图1所示,包括:
步骤101、将当前对话的源语言语音转换为当前源语言文字信息。
步骤102、针对话题领域表中的每个话题领域,从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数。
步骤103、针对每个话题领域,确定所述多个关键词汇在该话题领域中的历史使用次数和。
步骤104、在所述话题领域表中多个话题领域中,将历史使用次数和最大所对应的话题领域,确定为所述当前对话的话题领域。
步骤105、按照所述当前对话的话题领域对应的翻译规则,将所述当前源语言文字信息翻译为目标语言文字信息,并将所述目标语言文字信息转换为目标语言语音。
本发明实施例提供的上述图1所示方法中,话题领域表可以预先设置,可以通过统计每个话题领域的常用对话中多个关键词汇的使用次数,将该多个关键词汇的使用次数和该多个关键词汇各自对应的话题领域记录在初始的话题领域表中,当有新的对话需要翻译时,可以从话题领域表中查询当前对话的当前源语言文字信息的多个关键词汇各自在初始话题领域表中的历史使用次数,并在当前对话翻译完成后,更新话题领域表中保存的当前源语言文字信息的多个关键词汇各自在当前对话的话题领域中的历史使用次数。
进一步的,在从话题领域表中查询当前源语言文字信息包括的多个关键词汇在该话题领域中的历史使用次数之前,还可以通过确定历史对话表中是否存在当前源语言文字信息包括的关键句,判断当前对话与历史对话是否相关,如果历史对话表中存在当前源语言文字信息包括的关键句,则当前对话与历史对话相关,可以根据当前对话的话题领域对应的翻译规则,将当前源语言文字信息翻译为目标语言文字信息,如果历史对话表中不存在当前源语言文字信息包括的关键句,则当前对话与历史对话不相关,可以根据当前源语言的句型结构,将当前源语言文字信息翻译为目标语言文字信息。
下面结合附图,用具体实施例对本发明提供的方法及装置进行详细描述。
实施例1:
图2为本发明实施例1提供的语音对话翻译方法的流程图,具体包括如下处理步骤:
步骤201、将当前对话的源语言语音转换为当前源语言文字信息。
本步骤中,在翻译电话的应用中,当有新的语音对话需要翻译时,接收当前用户的当前对话的源语言语音,将当前对话的源语言语音通过语音识别技术转换为原始当前源语言文字信息,对原始当前源语言文字信息进行预处理,去除语气词和重复语句,得到当前源语言文字信息。
步骤202、确定历史对话表中是否存在该当前源语言文字信息包括的关键句,如果否,进入步骤203,如果是,进入步骤205。
其中,该关键句中包括该当前源语言文字信息包括的多个关键词汇,该关键词汇为通过查询该当前源语言文字信息中使用次数大于预设使用次数的词汇,该预设使用次数可以根据实际经验和需要进行灵活设置,该历史对话表中存储有转换历史对话的源语言语音得到的源语言文字信息。
本步骤中,具体可以采用如下方式确定历史对话表中是否存在该当前源语言文字信息包括的关键句:将该当前源语言文字信息包括的关键句的第一个文字与该历史对话表中的第一个文字对齐,依次逐个文字进行比较,确定该历史对话表中与该关键句对应位置上的文字是否与该关键句相同,如果相同,确定该历史对话表中存在该当前源语言文字信息包括的关键句,如果不相同,将该当前源语言文字信息包括的关键句的第一个文字与该历史对话表中的第二个文字对齐,再依次逐个文字进行比较,确定该历史对话表中与该关键句对应位置上的文字是否与该关键句相同,重复此过程,直至与该历史对话表中的所有文字进行比较后结束。
本步骤中,该历史对话表可以分为短时对话表和长时对话表,该短时对话表中的历史对话与所述当前对话的相隔时间小于预设相隔时间,该长时对话表中的历史对话与所述当前对话的相隔时间不小于预设相隔时间,可以先确定该短时对话表中是否存在该当前源语言文字信息包括的关键句,如果是,进入步骤205,如果否,确定该长时对话表中是否存在该当前源语言文字信息包括的关键句,如果否,进入步骤203,如果是,进入步骤205。
步骤203、当确定该历史对话表中不存在该当前源语言文字信息包括的关键句时,按照当前源语言的句型结构,将该当前源语言文字信息翻译为目标语言文字信息。
本步骤中,对该当前源语言进行结构分析,提取句型结构,将该当前源语言文字信息翻译为目标语言文字信息。
步骤204、将该目标语言文字信息转换为目标语言语音。
本步骤中,可以通过语音合成技术将该目标语言文字信息转换为目标语言语音。
进一步的,可以将该目标语言语音输出给用户。
步骤205、当确定该历史对话表中存在该当前源语言文字信息包括的关键句时,针对话题领域表中的每个话题领域,从该话题领域表中查询该当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数。
步骤206、针对每个话题领域,确定多个关键词汇在该话题领域中的历史使用次数和。
步骤207、在该话题领域表中多个话题领域中,将历史使用次数和最大所对应的话题领域,确定为该当前对话的话题领域。
本步骤中,如果当前源语言文字信息包括三个关键词汇,分别为a、b、c,话题领域表中的话题领域分别为A1、A2、……、An,n为话题领域的数量,三个关键词汇各自在话题领域Ai中的历史使用次数分别为ai、bi、ci,1≤i≤n,三个关键词汇在话题领域Ai中的历史使用次数和为Mi=ai+bi+ci,将M1、M2、……、Mn中的最大值Mk所对应的话题领域Ak,确定为该当前对话的话题领域。
步骤208、在该当前对话的话题领域对应的当前翻译词汇表中,将该多个关键词汇对应的翻译词汇,分别作为该多个关键词汇对应的目标语言词汇。
步骤209、根据该多个关键词汇各自对应的目标语言词汇,将该当前源语言文字信息翻译为目标语言文字信息。
本步骤中,根据该多个关键词汇各自对应的目标语言词汇,并结合当前源语言文字信息包括的关键句的句式,调整语言使用习惯,将该当前源语言文字信息翻译为目标语言文字信息。
步骤210、将该目标语言文字信息转换为目标语言语音。
本步骤中,可以通过语音合成技术将该目标语言文字信息转换为目标语言语音。
进一步的,可以将该目标语言语音输出给用户。
步骤211、在当前对话翻译完成后,更新话题领域表中保存的当前源语言文字信息的多个关键词汇各自在当前对话的话题领域中的历史使用次数。
通过本发明上述实施例1提供的方法,由于在对当前对话的源语言进行翻译时,参考了当前对话的话题领域,提高了语音对话翻译的准确度。
实施例2:
基于同一发明构思,根据本发明上述实施例提供的语音对话翻译方法,相应地,本发明实施例2还提供了一种语音对话翻译装置,其结构示意图如图3所示,具体包括:
转换单元301,用于将当前对话的源语言语音转换为当前源语言文字信息;
查询单元302,用于针对话题领域表中的每个话题领域,从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数;
历史使用次数和确定单元303,用于针对每个话题领域,确定所述多个关键词汇在该话题领域中的历史使用次数和;
话题领域确定单元304,用于在所述话题领域表中多个话题领域中,将历史使用次数和最大所对应的话题领域,确定为所述当前对话的话题领域;
第一翻译单元305,用于按照所述当前对话的话题领域对应的翻译规则,将所述当前源语言文字信息翻译为目标语言文字信息,并将所述目标语言文字信息转换为目标语言语音。
进一步的,上述装置,还包括:
关键句确定单元306,用于在从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇在该话题领域中的历史使用次数之前,确定历史对话表中存在所述当前源语言文字信息包括的关键句,所述关键句中包括所述当前源语言文字信息包括的多个关键词汇,所述历史对话表中存储有转换历史对话的源语言语音得到的源语言文字信息。
进一步的,上述装置,还包括:
第二翻译单元307,用于当确定所述历史对话表中不存在所述当前源语言文字信息包括的所述关键句时,按照源语言的句型结构,将所述当前源语言文字信息翻译为目标语言文字信息,并将所述目标语言文字信息转换为目标语言语音。
进一步的,上述装置,还包括:
更新单元308,用于更新所述话题领域表中保存的所述多个关键词汇各自在所述当前对话的话题领域中的历史使用次数。
进一步的,第一翻译单元305,具体用于在所述当前对话的话题领域对应的当前翻译词汇表中,将所述多个关键词汇对应的翻译词汇,分别作为所述多个关键词汇对应的目标语言词汇;根据所述多个关键词汇各自对应的目标语言词汇,将所述当前源语言文字信息翻译为目标语言文字信息。
上述各单元的功能可对应于图1或图2所示流程中的相应处理步骤,在此不再赘述。
实施例3:
基于同一发明构思,根据本发明上述实施例提供的语音对话翻译方法方法,相应地,本发明实施例3还提供了一种语音对话翻译系统,其结构示意图如图4所示,包括:语音输入端401、翻译设备402和语音输出端403,其中:
语音输入端401,用于采集用户的语音,并将采集的语音作为当前对话的源语言语音,发送给所述翻译设备;
翻译设备402,用于将当前对话的源语言语音转换为当前源语言文字信息;并针对话题领域表中的每个话题领域,从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数;并针对每个话题领域,确定所述多个关键词汇在该话题领域中的历史使用次数和;并在所述话题领域表中多个话题领域中,将历史使用次数和最大所对应的话题领域,确定为所述当前对话的话题领域;并按照所述当前对话的话题领域对应的翻译规则,将所述当前源语言文字信息翻译为目标语言文字信息,并将所述目标语言文字信息转换为目标语言语音;以及将所述目标语言语音发送给所述语音输出端;
语音输出端403,用于输出所述目标语言语音。
本发明实施例3提供的上述如图4所示的语音对话翻译系统,其中所包括的翻译设备402进一步的功能,可对应于图1和图2所示流程中的具体处理步骤,在此不再赘述。
综上所述,本发明实施例提供的方案,包括:将当前对话的源语言语音转换为当前源语言文字信息,针对话题领域表中的每个话题领域,从该话题领域表中查询该当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数,针对每个话题领域,确定该多个关键词汇在该话题领域中的历史使用次数和,在该话题领域表中多个话题领域中,将历史使用次数和最大所对应的话题领域,确定为该当前对话的话题领域,按照该当前对话的话题领域对应的翻译规则,将该当前源语言文字信息翻译为目标语言文字信息,并将该目标语言文字信息转换为目标语言语音。采用本发明实施例提供的方案,相比现有技术,提高了语音对话翻译的准确度。
本申请的实施例所提供的语音对话翻译装置及系统可通过计算机程序实现。本领域技术人员应该能够理解,上述的模块划分方式仅是众多模块划分方式中的一种,如果划分为其他模块或不划分模块,只要语音对话翻译装置及系统具有上述功能,都应该在本申请的保护范围之内。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (11)

1.一种语音对话翻译方法,其特征在于,包括:
将当前对话的源语言语音转换为当前源语言文字信息;
针对话题领域表中的每个话题领域,从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数;
针对每个话题领域,确定所述多个关键词汇在该话题领域中的历史使用次数和;
在所述话题领域表中多个话题领域中,将历史使用次数和最大所对应的话题领域,确定为所述当前对话的话题领域;
按照所述当前对话的话题领域对应的翻译规则,将所述当前源语言文字信息翻译为目标语言文字信息,并将所述目标语言文字信息转换为目标语言语音。
2.如权利要求1所述的方法,其特征在于,在从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇在该话题领域中的历史使用次数之前,还包括:
确定历史对话表中存在所述当前源语言文字信息包括的关键句,所述关键句中包括所述当前源语言文字信息包括的多个关键词汇,所述历史对话表中存储有转换历史对话的源语言语音得到的源语言文字信息。
3.如权利要求2所述的方法,其特征在于,还包括:
当确定所述历史对话表中不存在所述当前源语言文字信息包括的所述关键句时,按照当前源语言的句型结构,将所述当前源语言文字信息翻译为目标语言文字信息,并将所述目标语言文字信息转换为目标语言语音。
4.如权利要求1或2所述的方法,其特征在于,还包括:
更新所述话题领域表中保存的所述多个关键词汇各自在所述当前对话的话题领域中的历史使用次数。
5.如权利要求1所述的方法,其特征在于,按照所述当前对话的话题领域对应的翻译规则,将所述当前源语言文字信息翻译为目标语言文字信息,具体包括:
在所述当前对话的话题领域对应的当前翻译词汇表中,将所述多个关键词汇对应的翻译词汇,分别作为所述多个关键词汇对应的目标语言词汇;
根据所述多个关键词汇各自对应的目标语言词汇,将所述当前源语言文字信息翻译为目标语言文字信息。
6.一种语音对话翻译装置,其特征在于,包括:
转换单元,用于将当前对话的源语言语音转换为当前源语言文字信息;
查询单元,用于针对话题领域表中的每个话题领域,从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数;
历史使用次数和确定单元,用于针对每个话题领域,确定所述多个关键词汇在该话题领域中的历史使用次数和;
话题领域确定单元,用于在所述话题领域表中多个话题领域中,将历史使用次数和最大所对应的话题领域,确定为所述当前对话的话题领域;
第一翻译单元,用于按照所述当前对话的话题领域对应的翻译规则,将所述当前源语言文字信息翻译为目标语言文字信息,并将所述目标语言文字信息转换为目标语言语音。
7.如权利要求6所述的装置,其特征在于,还包括:
关键句确定单元,用于在从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇在该话题领域中的历史使用次数之前,确定历史对话表中存在所述当前源语言文字信息包括的关键句,所述关键句中包括所述当前源语言文字信息包括的多个关键词汇,所述历史对话表中存储有转换历史对话的源语言语音得到的源语言文字信息。
8.如权利要求7所述的装置,其特征在于,还包括:
第二翻译单元,用于当确定所述历史对话表中不存在所述当前源语言文字信息包括的所述关键句时,按照源语言的句型结构,将所述当前源语言文字信息翻译为目标语言文字信息,并将所述目标语言文字信息转换为目标语言语音。
9.如权利要求6或7所述的装置,其特征在于,还包括:
更新单元,用于更新所述话题领域表中保存的所述多个关键词汇各自在所述当前对话的话题领域中的历史使用次数。
10.如权利要求6所述的装置,其特征在于,所述第一翻译单元,具体用于在所述当前对话的话题领域对应的当前翻译词汇表中,将所述多个关键词汇对应的翻译词汇,分别作为所述多个关键词汇对应的目标语言词汇;根据所述多个关键词汇各自对应的目标语言词汇,将所述当前源语言文字信息翻译为目标语言文字信息。
11.一种语音对话翻译系统,其特征在于,包括:语音输入端、翻译设备和语音输出端,其中:
所述语音输入端,用于采集用户的语音,并将采集的语音作为当前对话的源语言语音,发送给所述翻译设备;
所述翻译设备,用于将当前对话的源语言语音转换为当前源语言文字信息;并针对话题领域表中的每个话题领域,从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数;并针对每个话题领域,确定所述多个关键词汇在该话题领域中的历史使用次数和;并在所述话题领域表中多个话题领域中,将历史使用次数和最大所对应的话题领域,确定为所述当前对话的话题领域;并按照所述当前对话的话题领域对应的翻译规则,将所述当前源语言文字信息翻译为目标语言文字信息,并将所述目标语言文字信息转换为目标语言语音;以及将所述目标语言语音发送给所述语音输出端;
所述语音输出端,用于输出所述目标语言语音。
CN201310611654.3A 2013-11-26 2013-11-26 一种语音对话翻译方法、装置及系统 Active CN104679733B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310611654.3A CN104679733B (zh) 2013-11-26 2013-11-26 一种语音对话翻译方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310611654.3A CN104679733B (zh) 2013-11-26 2013-11-26 一种语音对话翻译方法、装置及系统

Publications (2)

Publication Number Publication Date
CN104679733A CN104679733A (zh) 2015-06-03
CN104679733B true CN104679733B (zh) 2018-02-23

Family

ID=53314797

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310611654.3A Active CN104679733B (zh) 2013-11-26 2013-11-26 一种语音对话翻译方法、装置及系统

Country Status (1)

Country Link
CN (1) CN104679733B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106557460A (zh) * 2015-09-29 2017-04-05 株式会社东芝 从单文档中提取关键词的装置及方法
WO2018023315A1 (zh) * 2016-07-31 2018-02-08 李仁涛 早教机
CN110209774A (zh) * 2018-02-11 2019-09-06 北京三星通信技术研究有限公司 处理会话信息的方法、装置及终端设备
CN108415906B (zh) * 2018-03-28 2021-08-17 中译语通科技股份有限公司 基于领域自动识别篇章机器翻译方法、机器翻译系统
CN110969026A (zh) * 2019-11-27 2020-04-07 北京欧珀通信有限公司 译文输出方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101008942A (zh) * 2006-01-25 2007-08-01 北京金远见电脑技术有限公司 机器翻译装置和机器翻译方法
CN102270198A (zh) * 2011-08-16 2011-12-07 上海交通大学出版社有限公司 计算机辅助翻译系统
CN103049568A (zh) * 2012-12-31 2013-04-17 武汉传神信息技术有限公司 对海量文档库的文档分类的方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007220045A (ja) * 2006-02-20 2007-08-30 Toshiba Corp コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
CN101266600A (zh) * 2008-05-07 2008-09-17 陈光火 多媒体多语言互动同步翻译方法
CN101599059A (zh) * 2008-06-06 2009-12-09 佛山市顺德区顺达电脑厂有限公司 语音输入的翻译装置与方法
CN101957813A (zh) * 2009-07-16 2011-01-26 刘越 一种网络电话语音翻译系统和翻译方法
CN102262624A (zh) * 2011-08-08 2011-11-30 中国科学院自动化研究所 基于多模态辅助的实现跨语言沟通系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101008942A (zh) * 2006-01-25 2007-08-01 北京金远见电脑技术有限公司 机器翻译装置和机器翻译方法
CN102270198A (zh) * 2011-08-16 2011-12-07 上海交通大学出版社有限公司 计算机辅助翻译系统
CN103049568A (zh) * 2012-12-31 2013-04-17 武汉传神信息技术有限公司 对海量文档库的文档分类的方法

Also Published As

Publication number Publication date
CN104679733A (zh) 2015-06-03

Similar Documents

Publication Publication Date Title
US11361751B2 (en) Speech synthesis method and device
WO2022057712A1 (zh) 电子设备及其语义解析方法、介质和人机对话系统
CN104679733B (zh) 一种语音对话翻译方法、装置及系统
CN109102809A (zh) 一种用于智能机器人的对话方法及系统
JP2019528512A (ja) 人工知能に基づくヒューマンマシンインタラクション方法及び装置
CN103543979A (zh) 一种输出语音的方法、语音交互的方法及电子设备
CN109523989A (zh) 语音合成方法、语音合成装置、存储介质及电子设备
CN106959839A (zh) 一种人机交互装置及方法
CN106847279A (zh) 基于机器人操作系统ros的人机交互方法
CN106356057A (zh) 一种基于计算机应用场景语义理解的语音识别系统
CN108536670A (zh) 输出语句生成装置、方法和程序
CN111433847A (zh) 语音转换的方法及训练方法、智能装置和存储介质
CN111694940A (zh) 一种用户报告的生成方法及终端设备
CN107808007A (zh) 信息处理方法和装置
CN111429915A (zh) 一种基于语音识别的调度系统及调度方法
Cao et al. Optimization of intelligent English pronunciation training system based on android platform
CN114330371A (zh) 基于提示学习的会话意图识别方法、装置和电子设备
CN106356054A (zh) 一种基于语音识别的农产品信息采集方法和系统
CN113140219A (zh) 调控指令生成方法、装置、电子设备及存储介质
CN111128175B (zh) 口语对话管理方法及系统
CN106710587A (zh) 一种语音识别数据预处理方法
CN109243458A (zh) 一种用于智能机器人的语音识别系统
CN108831458A (zh) 一种离线的语音到命令变换方法和系统
CN102196100A (zh) 通话即时翻译系统及方法
CN109243424A (zh) 一种一键语音翻译终端及翻译方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant