CN104679733B

CN104679733B - 一种语音对话翻译方法、装置及系统

Info

Publication number: CN104679733B
Application number: CN201310611654.3A
Authority: CN
Inventors: 郭勐; 杨蕾; 张俭
Original assignee: China Mobile Communications Group Co Ltd
Current assignee: China Mobile Communications Group Co Ltd
Priority date: 2013-11-26
Filing date: 2013-11-26
Publication date: 2018-02-23
Anticipated expiration: 2033-11-26
Also published as: CN104679733A

Abstract

本发明公开了一种语音对话翻译方法、装置及系统，包括：将当前对话的源语言语音转换为当前源语言文字信息，针对话题领域表中的每个话题领域，从该话题领域表中查询该当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数，针对每个话题领域，确定该多个关键词汇在该话题领域中的历史使用次数和，在该话题领域表中多个话题领域中，将历史使用次数和最大所对应的话题领域，确定为该当前对话的话题领域，按照该当前对话的话题领域对应的翻译规则，将该当前源语言文字信息翻译为目标语言文字信息，并将该目标语言文字信息转换为目标语言语音。采用本发明实施例提供的方案，相比现有技术，提高了语音对话翻译的准确度。

Description

一种语音对话翻译方法、装置及系统

技术领域

本发明涉及通信领域，尤其涉及一种语音对话翻译方法、装置及系统。

背景技术

随着计算机智能化的逐步发展，机器与人之间的信息交互更加多样化，理想的人机智能接口方式是让机器能够听懂人的语言，实现人机之间的直接对话，对话的前提是首先进行语音识别。在两种不同语言进行对话通信时，为了能够使两种语言实时通信，通过机器将一种语言翻译成另一种语言，实现两种不同语言的语音翻译。

目前，在两种不同语言进行对话通信时，现有的语音对话翻译方法主要是通过语音识别将源语言的语音信号转换为源语言文字，将该源语言文字翻译成目标语言文字，并通过语音合成将该目标语言文字合成为对应的目标语言语音。

在上述现有的语音对话翻译方法中，由于在对源语言文字进行翻译时，将源语言文字中的词汇翻译为对应的目标语言词汇，未考虑对话的话题领域和句型结构，使得语音对话翻译的准确度低。

发明内容

本发明实施例提供一种语音对话翻译方法、装置及系统，用以解决现有技术中存在的语音对话翻译的准确度低的问题。

本发明实施例提供一种语音对话翻译方法，包括：

将当前对话的源语言语音转换为当前源语言文字信息；

针对话题领域表中的每个话题领域，从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数；

针对每个话题领域，确定所述多个关键词汇在该话题领域中的历史使用次数和；

在所述话题领域表中多个话题领域中，将历史使用次数和最大所对应的话题领域，确定为所述当前对话的话题领域；

按照所述当前对话的话题领域对应的翻译规则，将所述当前源语言文字信息翻译为目标语言文字信息，并将所述目标语言文字信息转换为目标语言语音。

采用本发明实施例提供的上述方法，由于在对当前对话的源语言文字信息进行翻译时，参考了当前对话的话题领域，提高了语音对话翻译的准确度。

进一步的，在从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇在该话题领域中的历史使用次数之前，还包括：

确定历史对话表中存在所述当前源语言文字信息包括的关键句，所述关键句中包括所述当前源语言文字信息包括的多个关键词汇，所述历史对话表中存储有转换历史对话的源语言语音得到的源语言文字信息。

这样，通过确定历史对话表中存在所述当前源语言文字信息包括的关键句，可以确定当前对话与历史对话相关，则可以根据当前对话的话题领域对应的翻译规则，将当前源语言文字信息翻译为目标语言文字信息。

进一步的，上述方法，还包括：

当确定所述历史对话表中不存在所述当前源语言文字信息包括的所述关键句时，按照当前源语言的句型结构，将所述当前源语言文字信息翻译为目标语言文字信息，并将所述目标语言文字信息转换为目标语言语音。

进一步的，上述方法，还包括：

更新所述话题领域表中保存的所述多个关键词汇各自在所述当前对话的话题领域中的历史使用次数。

这样，在每一次对话翻译后，通过更新话题领域表中保存的多个关键词汇各自在当前对话的话题领域中的历史使用次数，能够更加准确地确定当前对话的话题领域，从而使得按照该当前源语言文字信息包括的多个关键词汇在当前对话的话题领域对应的翻译词汇，对当前对话进行翻译，可以提高当前对话翻译的准确度。

进一步的，按照所述当前对话的话题领域对应的翻译规则，将所述当前源语言文字信息翻译为目标语言文字信息，具体包括：

在所述当前对话的话题领域对应的当前翻译词汇表中，将所述多个关键词汇对应的翻译词汇，分别作为所述多个关键词汇对应的目标语言词汇；

根据所述多个关键词汇各自对应的目标语言词汇，将所述当前源语言文字信息翻译为目标语言文字信息。

本发明实施例还提供了一种语音对话翻译装置，包括：

转换单元，用于将当前对话的源语言语音转换为当前源语言文字信息；

查询单元，用于针对话题领域表中的每个话题领域，从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数；

历史使用次数和确定单元，用于针对每个话题领域，确定所述多个关键词汇在该话题领域中的历史使用次数和；

话题领域确定单元，用于在所述话题领域表中多个话题领域中，将历史使用次数和最大所对应的话题领域，确定为所述当前对话的话题领域；

第一翻译单元，用于按照所述当前对话的话题领域对应的翻译规则，将所述当前源语言文字信息翻译为目标语言文字信息，并将所述目标语言文字信息转换为目标语言语音。

采用本发明实施例提供的上述装置，由于在对当前对话的源语言文字信息进行翻译时，参考了当前对话的话题领域，提高了语音对话翻译的准确度。

进一步的，上述装置，还包括：

关键句确定单元，用于在从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇在该话题领域中的历史使用次数之前，确定历史对话表中存在所述当前源语言文字信息包括的关键句，所述关键句中包括所述当前源语言文字信息包括的多个关键词汇，所述历史对话表中存储有转换历史对话的源语言语音得到的源语言文字信息。

进一步的，上述装置，还包括：

第二翻译单元，用于当确定所述历史对话表中不存在所述当前源语言文字信息包括的所述关键句时，按照源语言的句型结构，将所述当前源语言文字信息翻译为目标语言文字信息，并将所述目标语言文字信息转换为目标语言语音。

进一步的，上述装置，还包括：

更新单元，用于更新所述话题领域表中保存的所述多个关键词汇各自在所述当前对话的话题领域中的历史使用次数。

进一步的，所述第一翻译单元，具体用于在所述当前对话的话题领域对应的当前翻译词汇表中，将所述多个关键词汇对应的翻译词汇，分别作为所述多个关键词汇对应的目标语言词汇；根据所述多个关键词汇各自对应的目标语言词汇，将所述当前源语言文字信息翻译为目标语言文字信息。

本发明实施例还提供了一种语音对话翻译系统，包括：语音输入端、翻译设备和语音输出端，其中：

所述语音输入端，用于采集用户的语音，并将采集的语音作为当前对话的源语言语音，发送给所述翻译设备；

所述翻译设备，用于将当前对话的源语言语音转换为当前源语言文字信息；并针对话题领域表中的每个话题领域，从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数；并针对每个话题领域，确定所述多个关键词汇在该话题领域中的历史使用次数和；并在所述话题领域表中多个话题领域中，将历史使用次数和最大所对应的话题领域，确定为所述当前对话的话题领域；并按照所述当前对话的话题领域对应的翻译规则，将所述当前源语言文字信息翻译为目标语言文字信息，并将所述目标语言文字信息转换为目标语言语音；以及将所述目标语言语音发送给所述语音输出端；

所述语音输出端，用于输出所述目标语言语音。

本申请的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明实施例提供的语音对话翻译方法的流程图；

图2为本发明实施例1提供的语音对话翻译方法的流程图；

图3为本发明实施例2提供的语音对话装置的结构示意图；

图4为本发明实施例3提供的语音对话系统的结构示意图。

具体实施方式

为了给出语音对话翻译的准确度的实现方案，本发明实施例提供了一种语音对话翻译方法、装置及系统，以下结合说明书附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。并且在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

本发明实施例提供一种语音对话翻译方法，如图1所示，包括：

步骤101、将当前对话的源语言语音转换为当前源语言文字信息。

步骤102、针对话题领域表中的每个话题领域，从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数。

步骤103、针对每个话题领域，确定所述多个关键词汇在该话题领域中的历史使用次数和。

步骤104、在所述话题领域表中多个话题领域中，将历史使用次数和最大所对应的话题领域，确定为所述当前对话的话题领域。

步骤105、按照所述当前对话的话题领域对应的翻译规则，将所述当前源语言文字信息翻译为目标语言文字信息，并将所述目标语言文字信息转换为目标语言语音。

本发明实施例提供的上述图1所示方法中，话题领域表可以预先设置，可以通过统计每个话题领域的常用对话中多个关键词汇的使用次数，将该多个关键词汇的使用次数和该多个关键词汇各自对应的话题领域记录在初始的话题领域表中，当有新的对话需要翻译时，可以从话题领域表中查询当前对话的当前源语言文字信息的多个关键词汇各自在初始话题领域表中的历史使用次数，并在当前对话翻译完成后，更新话题领域表中保存的当前源语言文字信息的多个关键词汇各自在当前对话的话题领域中的历史使用次数。

进一步的，在从话题领域表中查询当前源语言文字信息包括的多个关键词汇在该话题领域中的历史使用次数之前，还可以通过确定历史对话表中是否存在当前源语言文字信息包括的关键句，判断当前对话与历史对话是否相关，如果历史对话表中存在当前源语言文字信息包括的关键句，则当前对话与历史对话相关，可以根据当前对话的话题领域对应的翻译规则，将当前源语言文字信息翻译为目标语言文字信息，如果历史对话表中不存在当前源语言文字信息包括的关键句，则当前对话与历史对话不相关，可以根据当前源语言的句型结构，将当前源语言文字信息翻译为目标语言文字信息。

下面结合附图，用具体实施例对本发明提供的方法及装置进行详细描述。

实施例1：

图2为本发明实施例1提供的语音对话翻译方法的流程图，具体包括如下处理步骤：

步骤201、将当前对话的源语言语音转换为当前源语言文字信息。

本步骤中，在翻译电话的应用中，当有新的语音对话需要翻译时，接收当前用户的当前对话的源语言语音，将当前对话的源语言语音通过语音识别技术转换为原始当前源语言文字信息，对原始当前源语言文字信息进行预处理，去除语气词和重复语句，得到当前源语言文字信息。

步骤202、确定历史对话表中是否存在该当前源语言文字信息包括的关键句，如果否，进入步骤203，如果是，进入步骤205。

其中，该关键句中包括该当前源语言文字信息包括的多个关键词汇，该关键词汇为通过查询该当前源语言文字信息中使用次数大于预设使用次数的词汇，该预设使用次数可以根据实际经验和需要进行灵活设置，该历史对话表中存储有转换历史对话的源语言语音得到的源语言文字信息。

本步骤中，具体可以采用如下方式确定历史对话表中是否存在该当前源语言文字信息包括的关键句：将该当前源语言文字信息包括的关键句的第一个文字与该历史对话表中的第一个文字对齐，依次逐个文字进行比较，确定该历史对话表中与该关键句对应位置上的文字是否与该关键句相同，如果相同，确定该历史对话表中存在该当前源语言文字信息包括的关键句，如果不相同，将该当前源语言文字信息包括的关键句的第一个文字与该历史对话表中的第二个文字对齐，再依次逐个文字进行比较，确定该历史对话表中与该关键句对应位置上的文字是否与该关键句相同，重复此过程，直至与该历史对话表中的所有文字进行比较后结束。

本步骤中，该历史对话表可以分为短时对话表和长时对话表，该短时对话表中的历史对话与所述当前对话的相隔时间小于预设相隔时间，该长时对话表中的历史对话与所述当前对话的相隔时间不小于预设相隔时间，可以先确定该短时对话表中是否存在该当前源语言文字信息包括的关键句，如果是，进入步骤205，如果否，确定该长时对话表中是否存在该当前源语言文字信息包括的关键句，如果否，进入步骤203，如果是，进入步骤205。

步骤203、当确定该历史对话表中不存在该当前源语言文字信息包括的关键句时，按照当前源语言的句型结构，将该当前源语言文字信息翻译为目标语言文字信息。

本步骤中，对该当前源语言进行结构分析，提取句型结构，将该当前源语言文字信息翻译为目标语言文字信息。

步骤204、将该目标语言文字信息转换为目标语言语音。

本步骤中，可以通过语音合成技术将该目标语言文字信息转换为目标语言语音。

进一步的，可以将该目标语言语音输出给用户。

步骤205、当确定该历史对话表中存在该当前源语言文字信息包括的关键句时，针对话题领域表中的每个话题领域，从该话题领域表中查询该当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数。

步骤206、针对每个话题领域，确定多个关键词汇在该话题领域中的历史使用次数和。

步骤207、在该话题领域表中多个话题领域中，将历史使用次数和最大所对应的话题领域，确定为该当前对话的话题领域。

本步骤中，如果当前源语言文字信息包括三个关键词汇，分别为a、b、c，话题领域表中的话题领域分别为A₁、A₂、……、A_n，n为话题领域的数量，三个关键词汇各自在话题领域A_i中的历史使用次数分别为a_i、b_i、c_i，1≤i≤n，三个关键词汇在话题领域A_i中的历史使用次数和为M_i=a_i+b_i+c_i，将M₁、M₂、……、M_n中的最大值M_k所对应的话题领域A_k，确定为该当前对话的话题领域。

步骤208、在该当前对话的话题领域对应的当前翻译词汇表中，将该多个关键词汇对应的翻译词汇，分别作为该多个关键词汇对应的目标语言词汇。

步骤209、根据该多个关键词汇各自对应的目标语言词汇，将该当前源语言文字信息翻译为目标语言文字信息。

本步骤中，根据该多个关键词汇各自对应的目标语言词汇，并结合当前源语言文字信息包括的关键句的句式，调整语言使用习惯，将该当前源语言文字信息翻译为目标语言文字信息。

步骤210、将该目标语言文字信息转换为目标语言语音。

进一步的，可以将该目标语言语音输出给用户。

步骤211、在当前对话翻译完成后，更新话题领域表中保存的当前源语言文字信息的多个关键词汇各自在当前对话的话题领域中的历史使用次数。

通过本发明上述实施例1提供的方法，由于在对当前对话的源语言进行翻译时，参考了当前对话的话题领域，提高了语音对话翻译的准确度。

实施例2：

基于同一发明构思，根据本发明上述实施例提供的语音对话翻译方法，相应地，本发明实施例2还提供了一种语音对话翻译装置，其结构示意图如图3所示，具体包括：

转换单元301，用于将当前对话的源语言语音转换为当前源语言文字信息；

查询单元302，用于针对话题领域表中的每个话题领域，从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数；

历史使用次数和确定单元303，用于针对每个话题领域，确定所述多个关键词汇在该话题领域中的历史使用次数和；

话题领域确定单元304，用于在所述话题领域表中多个话题领域中，将历史使用次数和最大所对应的话题领域，确定为所述当前对话的话题领域；

第一翻译单元305，用于按照所述当前对话的话题领域对应的翻译规则，将所述当前源语言文字信息翻译为目标语言文字信息，并将所述目标语言文字信息转换为目标语言语音。

进一步的，上述装置，还包括：

关键句确定单元306，用于在从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇在该话题领域中的历史使用次数之前，确定历史对话表中存在所述当前源语言文字信息包括的关键句，所述关键句中包括所述当前源语言文字信息包括的多个关键词汇，所述历史对话表中存储有转换历史对话的源语言语音得到的源语言文字信息。

进一步的，上述装置，还包括：

第二翻译单元307，用于当确定所述历史对话表中不存在所述当前源语言文字信息包括的所述关键句时，按照源语言的句型结构，将所述当前源语言文字信息翻译为目标语言文字信息，并将所述目标语言文字信息转换为目标语言语音。

进一步的，上述装置，还包括：

更新单元308，用于更新所述话题领域表中保存的所述多个关键词汇各自在所述当前对话的话题领域中的历史使用次数。

进一步的，第一翻译单元305，具体用于在所述当前对话的话题领域对应的当前翻译词汇表中，将所述多个关键词汇对应的翻译词汇，分别作为所述多个关键词汇对应的目标语言词汇；根据所述多个关键词汇各自对应的目标语言词汇，将所述当前源语言文字信息翻译为目标语言文字信息。

上述各单元的功能可对应于图1或图2所示流程中的相应处理步骤，在此不再赘述。

实施例3：

基于同一发明构思，根据本发明上述实施例提供的语音对话翻译方法方法，相应地，本发明实施例3还提供了一种语音对话翻译系统，其结构示意图如图4所示，包括：语音输入端401、翻译设备402和语音输出端403，其中：

语音输入端401，用于采集用户的语音，并将采集的语音作为当前对话的源语言语音，发送给所述翻译设备；

翻译设备402，用于将当前对话的源语言语音转换为当前源语言文字信息；并针对话题领域表中的每个话题领域，从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数；并针对每个话题领域，确定所述多个关键词汇在该话题领域中的历史使用次数和；并在所述话题领域表中多个话题领域中，将历史使用次数和最大所对应的话题领域，确定为所述当前对话的话题领域；并按照所述当前对话的话题领域对应的翻译规则，将所述当前源语言文字信息翻译为目标语言文字信息，并将所述目标语言文字信息转换为目标语言语音；以及将所述目标语言语音发送给所述语音输出端；

语音输出端403，用于输出所述目标语言语音。

本发明实施例3提供的上述如图4所示的语音对话翻译系统，其中所包括的翻译设备402进一步的功能，可对应于图1和图2所示流程中的具体处理步骤，在此不再赘述。

综上所述，本发明实施例提供的方案，包括：将当前对话的源语言语音转换为当前源语言文字信息，针对话题领域表中的每个话题领域，从该话题领域表中查询该当前源语言文字信息包括的多个关键词汇各自在该话题领域中的历史使用次数，针对每个话题领域，确定该多个关键词汇在该话题领域中的历史使用次数和，在该话题领域表中多个话题领域中，将历史使用次数和最大所对应的话题领域，确定为该当前对话的话题领域，按照该当前对话的话题领域对应的翻译规则，将该当前源语言文字信息翻译为目标语言文字信息，并将该目标语言文字信息转换为目标语言语音。采用本发明实施例提供的方案，相比现有技术，提高了语音对话翻译的准确度。

本申请的实施例所提供的语音对话翻译装置及系统可通过计算机程序实现。本领域技术人员应该能够理解，上述的模块划分方式仅是众多模块划分方式中的一种，如果划分为其他模块或不划分模块，只要语音对话翻译装置及系统具有上述功能，都应该在本申请的保护范围之内。

本申请是参照根据本申请实施例的方法、设备（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种语音对话翻译方法，其特征在于，包括：

将当前对话的源语言语音转换为当前源语言文字信息；

2.如权利要求1所述的方法，其特征在于，在从所述话题领域表中查询所述当前源语言文字信息包括的多个关键词汇在该话题领域中的历史使用次数之前，还包括：

3.如权利要求2所述的方法，其特征在于，还包括：

4.如权利要求1或2所述的方法，其特征在于，还包括：

5.如权利要求1所述的方法，其特征在于，按照所述当前对话的话题领域对应的翻译规则，将所述当前源语言文字信息翻译为目标语言文字信息，具体包括：

6.一种语音对话翻译装置，其特征在于，包括：

7.如权利要求6所述的装置，其特征在于，还包括：

8.如权利要求7所述的装置，其特征在于，还包括：

9.如权利要求6或7所述的装置，其特征在于，还包括：

10.如权利要求6所述的装置，其特征在于，所述第一翻译单元，具体用于在所述当前对话的话题领域对应的当前翻译词汇表中，将所述多个关键词汇对应的翻译词汇，分别作为所述多个关键词汇对应的目标语言词汇；根据所述多个关键词汇各自对应的目标语言词汇，将所述当前源语言文字信息翻译为目标语言文字信息。

11.一种语音对话翻译系统，其特征在于，包括：语音输入端、翻译设备和语音输出端，其中：

所述语音输出端，用于输出所述目标语言语音。