CN114462428A

CN114462428A - 翻译评测方法和系统、电子设备及可读存储介质

Info

Publication number: CN114462428A
Application number: CN202210032270.5A
Authority: CN
Inventors: 王轲; 张昱琪; 王巍巍; 赵宇; 骆卫华
Original assignee: Alibaba China Co Ltd
Current assignee: Alibaba China Co Ltd
Priority date: 2022-01-12
Filing date: 2022-01-12
Publication date: 2022-05-10

Abstract

本说明书实施例提供了翻译评测方法和系统、电子设备及可读存储介质，其中一种翻译评测方法包括：获取源语内容、目标语参考答案，以及源语种和目标语种信息；获取对所述源语内容进行翻译得到的目标语结果；基于所述目标语参考答案和所述目标语结果，进行句子对齐，生成句对齐信息；根据所述句对齐信息和所述源语种和目标语种信息，进行特征提取，生成所述目标语结果的特征；将所述目标语结果的特征输入完成预训练的多维能力模型，生成对应的翻译评测结果。采用上述方案，能够在保障评测质量的情况下，提高翻译评测的效率。

Description

翻译评测方法和系统、电子设备及可读存储介质

技术领域

本说明书实施例涉及自然语言处理技术领域，尤其涉及翻译评测方法和系统、电子设备及可读存储介质。

背景技术

随着国际化进程的推进，对于翻译人才的需求日益增加，而培养一个翻译人才需要大量的实践练习，并且需要对翻译练习的结果的质量进行有效而及时地反馈。传统的方法是通过老师(或称为教师，审阅者)人工批改，给出翻译质量评价打分，这样效率很低，很难满足学生的训练需求。

发明内容

有鉴于此，本说明书实施例提供一种翻译评测方法和系统、电子设备及可读存储介质，能够在保障评测质量的情况下，提高翻译评测的效率。

本说明书实施例的一个方面，提供了一种翻译评测方法，其中，包括：

获取源语内容、目标语参考答案，以及源语种和目标语种信息；

获取对所述源语内容进行翻译得到的目标语结果；

基于所述目标语参考答案和所述目标语结果，进行句子对齐，生成句对齐信息；

根据所述句对齐信息和所述源语种和目标语种信息，进行特征提取，生成所述目标语结果的特征；

将所述目标语结果的特征输入完成预训练的多维能力模型，生成对应的翻译评测结果。

可选地，所述获取源语内容，包括：获取待笔译的原始文本；

所述获取对所述源语内容进行翻译得到的目标语结果，包括以下至少一种方式：通过键盘或手写输入方式直接获取对待笔译的原始文本进行笔译得到的笔译文本，得到目标语文本；

获取用户上传的对待笔译的原始文本进行笔译得到的笔译文本，得到目标语文本；

获取用户上传的对待笔译的原始文本进行笔译的笔译文本图像，并通过图像识别，得到目标语文本。

可选地，所述获取源语内容，包括：获取待口译内容的原始音频；

所述获取对所述源语内容进行翻译得到的目标语结果，包括：

获取对待口译内容的原始音频进行口译得到的口译音频；

对所述口译音频进行识别处理，生成口译文本，以得到目标语文本。

可选地，所述翻译评测方法还包括：

响应于对所述口译文本中的识别错误进行修正的操作，对所述口译文本进行修正处理，得到修正后的口译文本，作为所述目标语文本。

可选地，所述基于所述目标语参考答案和所述目标语结果，进行句子对齐，生成句对齐信息，包括：

对所述目标语文本和所述目标语参考答案分别按照字节顺序以预设窗口大小进行滑动操作，形成以所述预设窗口大小为片段单位的第一片段序列和第二片段序列；

按照字节顺序，以所述预设窗口大小为对齐单位，将所述第一片段序列和所述第二片段序列执行对齐操作，生成所述句对齐信息。

可选地，所述基于所述句对齐信息和所述源语种和目标语种信息，进行特征提取，生成所述目标语文本的特征，包括：

基于所述句对齐信息以及所述源语种和目标语种信息，采用多种粒度的特征提取模型，进行特征提取，得到相应粒度的特征向量；

将提取得到的不同粒度的特征向量进行融合，得到所述目标语文本的特征向量。

可选地，所述基于所述句对齐信息以及所述源语种和目标语种信息，采用多种粒度的特征提取模型，进行特征提取，得到相应粒度的特征向量，包括：

基于所述句对齐信息中的第一片段序列和所述第二片段序列，采用基于统计的特征提取方法，提取词级别的特征，得到相应的词向量；

基于所述句对齐信息中的第一片段序列和所述第二片段序列，采用基于语义的特征提取方法，提取句子级别的特征，得到相应的句子向量。

可选地，所述基于所述句对齐信息中的第一片段序列和所述第二片段序列，采用基于语义的特征提取方法，提取句子级别的特征，得到相应的句子向量，包括以下至少一种：

将所述第一片段序列输入预设的概率语言模型，计算所述第一片段序列作为一句话的概率，得到对应的单语质量分，作为相应的句子向量；

将所述第一片段序列和所述第二片段序列输入预训练的相似度评估模型，得到所述第一片段序列和所述第二片段序列的相似度值，作为相应的句子向量。

可选地，所述基于所述句对齐信息以及所述源语种和目标语种信息，采用多种粒度的特征提取模型，进行特征提取，得到相应粒度的特征向量，还包括：

基于所述句对齐信息中的第一片段序列和所述第二片段序列，对所述第一片段序列中的相邻片段进行位置互换，采用预设的分类模型，提取句子的语法特征信息，得到相应的句子向量。

可选地，所述将所述目标语文本的特征输入完成预训练的多维能力模型，生成对应的翻译评测结果，包括：

将所述目标语文本的特征向量分别输入预设的多个维度的能力模型，分别得到多个维度的量化分级数据；

基于所述多个维度的量化分级数据，生成所述翻译评测结果。

本说明书实施例的另一方面，提供了另一种翻译评测方法，其中，包括：

获取待口译内容的原始音频、目标语参考答案，以及源语种和目标语种信息；

获取对待口译内容的原始音频进行口译得到的口译音频，对所述口译音频进行识别，生成口译文本，以得到目标语文本；

基于所述目标语参考答案和所述目标语文本，进行句子对齐，生成句对齐信息；

可选地，所述获取对待口译内容的原始音频进行口译得到的口译音频，对所述口译音频进行识别，生成口译文本，以得到目标语文本，包括：

获取对待口译内容的原始音频进行同声传译得到的同声传译音频；对所述同声传译音频通过自动语音识别，生成口译文本，作为目标语文本；

或，

获取对待口译内容的原始音频进行交替传译得到的交替传译音频；对所述交替传译音频通过自动语音识别，生成交替传译文本；对所述交替传译文本进行识别，提取出目标语文本。

本说明书实施例的另一方面，提供了一种翻译评测系统，其中，包括：

第一获取单元，适于获取源语内容、目标语参考答案，以及源语种和目标语种信息；

第二获取单元，适于获取对所述源语内容进行翻译得到的目标语结果；

句对齐单元，适于基于所述目标语参考答案和所述目标语文本，进行句子对齐，生成句对齐信息；

特征提取单元，适于根据所述句对齐信息和所述源语种和目标语种信息，进行特征提取，生成所述目标语结果的特征；

评测单元，适于将所述目标语结果的特征输入完成预训练的多维能力模型，生成对应的翻译评测结果。

本说明书实施例的又一方面，还提供了一种翻译评测系统，其中，包括：第一交互端和第二交互端，其中：

所述第一交互端，适于提供源语内容；所述第一交互端包括：任务创建模块和任务发布模块，其中：

所述任务创建模块，适于创建目标任务，包括：获取源语内容及用于任务评测的目标语参考答案，配置目标任务要求信息，生成目标任务；所述目标任务要求信息包括：源语种及目标语种信息；

所述任务发布模块，适于发布所创建的目标任务；

所述第二交互端，适于获取所述源语内容，并对获取的对所述源语内容进行翻译得到的目标语结果进行翻译评测，得到对应的翻译评测结果，所述第二交互端包括：任务查询模块、目标语结果获取模块、评测模块，其中：

所述任务查询模块，适于获取所发布的目标任务；

所述目标语结果获取模块，适于获取基于所述目标任务所输入的对所述源语内容进行翻译得到目标语结果；

所述评测模块，基于所述目标语参考答案和所述目标语结果，进行句子对齐，生成句对齐信息；根据所述句对齐信息和所述源语种和目标语种信息，进行特征提取，生成所述目标语结果的特征；将所述目标语结果的特征输入完成预训练的多维能力模型，生成对应的翻译评测结果。

可选地，所述目标任务要求信息还包括：所述任务的应用模式，以及在不同应用模式下任务执行者的权限。

可选地，在所述目标任务的类型包括口译任务时，所述源语内容为待口译内容的原始音频，所述目标语结果基于对所述待口译内容进行口译所生成的口译音频得到；并且，其中，在所述口译任务的类型包括同声传译时，所述目标语结果获取模块包括：

第一音频获取子模块，适于获取对待口译内容的原始音频进行同声传译得到的同声传译音频；

第一语音识别子模块，适于对所述同声传译音频通过自动语音识别，生成口译文本，作为目标语文本；

在所述口译任务的类型包括交替传译时，所述目标语结果获取模块，包括：

第二音频获取子模块，适于获取对待口译内容的原始音频进行交替传译得到的交替传译音频；

第二语音识别子模块，适于对所述交替传译音频通过自动语音识别，生成交替传译文本；

目标语内容识别子模块，适于对所述交替传译文本进行识别，提取出目标语文本。

可选地，所述第二交互端还包括：修正模块，适于响应于对目标语文本中的识别错误进行修正的操作，对所述目标语文本进行修正处理，得到修正后的目标语文本，用于翻译评测。

可选地，所述第一交互端还包括：

统计分析模块，适于基于所发布的目标任务的翻译评测结果进行统计分析，得到统计分析数据；

统计结果存储模块，适于对所述统计分析模块得到的统计分析数据进行存储；

所述任务创建模块，还适于基于所述统计结果存储模块存储的统计分析数据，确定任务难度等级，创建相应难度级别的目标任务。

本说明书实施例的又一方面，还提供了一种电子设备，包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的计算机程序，其中，所述处理器运行所述计算机程序时执行前述任一实施例所述的方法的步骤。

本说明书实施例的再一方面，还提供了一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序运行时执行前述任一实施例所述的方法的步骤。

采用本说明书实施例的翻译评测方法，在整个翻译评测过程中，首先，基于目标语参考答案和目标语结果，进行句子对齐后进行特征提取，得到的目标语结果的特征可以比较全面地反映目标语结果的信息，进而将所述目标语结果的特征输入至完成预训练的多维能力模型，使得所述多维能力模型可以从多个维度全面而有效地学习到这些信息，可以从多个维度对目标语结果进行准确评测，因而可以提高翻译评测质量，且整个评测过程自动完成，无须人工参与，因而可以提高翻译评测的效率。

进一步地，通过获取对源语内容的原始音频进行口译得到的目标音频，并通过自动语音识别将所述目标音频转换为目标语文本，所述目标语文本与所述目标语参考答案进行句子对齐，之后，根据生成的句对齐信息和源语种和目标语种信息，进行特征提取，生成所述目标语结果的特征，这一过程可以体现口译的翻译信息，适应口译场景需求，因而评测结果可以更加准确地反映实际的口译质量，故可以进一步提高口译评测质量。

进一步地，响应于对所述识别文本中的识别错误进行修正的操作，对所述识别文本进行修正处理，将修正后的目标语文本用于翻译评测，可以进一步提高翻译评测质量。

进一步地，基于所述句对齐信息以及所述源语种和目标语种信息，采用多种粒度的特征提取模型，进行特征提取，得到相应粒度的特征向量，进而将提取得到的不同粒度的特征向量进行融合，得到所述目标语文本的特征向量，进而输入完成预训练的多维能力模型，可以全面多维地反映目标语结果的实际情况，因而可以提高翻译评测的准确性。

进一步地，通过将所述目标语文本的特征向量分别输入预设的多个维度的能力模型，分别得到多个维度的量化分级数据，并基于所述多个维度的量化分级数据，生成所述翻译评测结果，可以提高翻译评测的准确度，实现量化精准评测。

附图说明

为了更清楚地说明本说明书实施例的技术方案，下面将对本说明书实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面所描述的附图仅仅是本说明书的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本说明书实施例中一种具体应用场景中的翻译评测系统的结构示意图；

图2示出了本说明书实施例中一种翻译评测方法的流程图；

图3示出了本说明书实施例中另一种翻译评测方法的流程图；

图4示出了本说明书实施例中另一种具体应用场景中的翻译评测系统的结构示意图；

图5示出了本说明书实施例中又一种具体应用场景中的翻译评测系统的结构示意图；

图6A和图6B分别示出了本说明书实施例中两种目标语获取模块的结构示意图；

图7示出了本说明书实施例中一种电子设备的结构示意图。

具体实施方式

如背景技术所述，传统的针对翻译得到的目标语结果人工评估的方式，在保障翻译评测质量的情况下，提高翻译评测效率。

针对上述问题，本说明书实施例提供了相应的翻译评测方案。具体而言，整个翻译评测过程中，首先，基于目标语参考答案和目标语结果，进行句子对齐后进行特征提取，可以比较全面地反映目标语结果的信息，进而将所述目标语结果的特征输入至完成预训练的多维能力模型，使得所述多维能力模型可以从多个维度全面而有效地学习到这些信息，进而使得所述多维能力模型能够基于输入的目标语结果的特征，得到更加准确的翻译评测结果，因而可以保障翻译评测质量，且整个评测过程自动完成，无须人工参与，因而可以提高翻译评测的效率。

为描述方便，在本说明书实施例中，将待翻译内容称为“源语内容”；源语内容的语言类型，称为“源语种”；对源语内容通过翻译得到的翻译结果，简称为“目标语结果”；目标语结果的语言类型，称为“目标语种”；采用目标语种表达的能够准确反映源语内容，用于评价源语内容翻译至相应目标语种的翻译结果质量的参考答案，简称为“目标语参考答案”。

为使本领域技术人员更好地理解本说明书实施例的技术构思、工作原理及优点，实施本说明书实施例的技术方案，以下参照附图，并结合具体应用场景，对本说明书实施例通过一些具体的可选示例进行详细介绍。

首先，本说明书实施例中的翻译评测方法，能够实现对目标语结果进行自动评测，具体可以采用翻译评测系统执行，翻译评测系统可以运行于电子设备中，翻译评测用户可以与其进行交互操作，具体而言，例如老师可以通过交互操作，提供源语内容；学生可以通过交互操作对完成的目标语结果通过翻译评测系统进行评测。

为使本领域技术人员便于理解及实施，以下结合图1所示的具体应用场景中的翻译评测系统的结构示意图，介绍用户与翻译评测系统的交互原理。

如图1所示，翻译评测系统10包括：第一交互端11和第二交互端12，其中：所述第一交互端11适于提供源语内容，所述第二交互端12与所述第一交互端11耦接，适于获取所述源语内容，并对获取的对所述源语内容进行翻译得到的目标语结果进行翻译评测，得到对应的翻译评测结果。

更具体而言，例如老师用户可以通过所述第一交互端11提供源语内容，学生用户可以通过所述第二交互端12获取源语内容，在完成翻译后，将目标语结果输入所述第二交互端12，进而可以获得对应的翻译评测结果。

可以理解的是，以上仅为具体应用场景的示例说明，本说明书实施例中的翻译评测方法并不限于应用于以上架构的翻译评测系统。在具体应用过程中，所述翻译评测系统可以为分布式架构，也可以为集中式架构，整个翻译评测系统可以部署在本地，也可以部署在云端，或者一部分部署在本地，一部分部署在云端。以上架构的描述并不构成对本发明实施例中的翻译评测方法的限定。

为使本领域技术人员更好地理解和实施，以下结合具体应用场景，并参照附图，对本发明实施例中的一些翻译评测方法进行示例性介绍。

参照图2所示的翻译评测方法的流程图，具体可以通过以下步骤执行：

S21，获取源语内容、目标语参考答案，以及源语种和目标语种信息。

在具体实施中，各个步骤可能自主执行，或者基于用户的交互操作执行。对于可能需要进行翻译评测的场景，例如翻译练习，或者翻译考试，可能涉及到布置翻译任务(或者说布置作业或出题)的老师用户，及需要完成任务(具体地，例如完成考试/作业)学生用户。因此，不同的步骤可以由不同的用户触发，例如，步骤S21可以通过与老师用户或翻译内容提供方用户交互操作得到。

更具体地，老师用户或者翻译内容提供方用户可以通过交互操作，创建相应的翻译任务，直接在翻译评测系统上通过编辑操作生成所述源语内容，或者，将本地存储的翻译素材上传作为源语内容，或者从第三方获取翻译素材，用于作为源语内容。

在具体实施中，可以在翻译评测系统中建立一个包含大量翻译素材的资源库，其中的翻译素材可以以一次翻译练习或者考卷的形式形成一次翻译评测的基本单位。用户可以从中抽取翻译练习题或者老师所布置的考题作为一次翻译任务来完成。翻译任务布置者可以设置相应翻译任务的具体要求。例如，可以在翻译评测系统上设置翻译任务对应的源语种和目标语种信息。此外，针对具体任务类型的不同，还可以设置任务完成时间，或者任务允许上传的次数，以及用户权限等信息。

除了获取源语内容外，翻译评测系统还要获取源语内容对应的目标语参考答案，作为翻译评测的依据。

此外，针对翻译形式的不同，可以分为不同的翻译评测类型，例如，可以分为口译和笔译。

其中，口译，即口语翻译，指译员(或称译者)以口语的方式，将译入的源语转换为译出的目标语的方式，主要分为同声传译和交替传译。同声传译指译员在不打断讲者讲话的情况下，不间断地将讲话内容口译给听众的一种翻译方式。交替传译是译员一面听源语讲话，一面记笔记，当讲者停下来时，再重新表达讲者讲话的全部内容信息。口语评测，是指从不同的维度对译员口译结构进行评价打分。笔译，是以源语文本为输入对象，目标语文本为输出产品的跨文化语际中介。

因此，不同类型的翻译评测，源语内容的形式可以有所不同。作为具体示例，若翻译形式为笔译，则可以获取待笔译内容的原始文本(源语文本)，而若翻译形式为口译，则可以获取待口译内容的原始音频，或者原始视频，或者从原始视频中提取得到的音频文件作为待口译内容的原始音频。

S22，获取对所述源语内容进行翻译得到的目标语结果。

在具体实施中，译员(或者称为任务执行者)可以通过翻译评测系统，例如结合图1，通过第二交互端12获得待翻译的源语内容，之后，对其进行翻译，并将翻译得到的翻译结果，即目标语结果上传至所述翻译评测系统。

根据翻译形式的不同，所获取的目标语结果的形式有所不同。

更具体而言，对于笔译，可以获取对待笔译的原始文本(即包含源语内容原始文本)进行笔译得到的笔译文本，作为目标语文本。在具体实施中，根据笔译内容的格式及获取途径的不同，可以有多种实现方式。用户可以直接在线输入，或者将在本地完成的笔译内容上传，基于用户本地所使用的文本格式与翻译评测系统所能够识别的文本格式是否一致，可以有不同的处理方式。例如，可以通过键盘或手写输入方式直接获取对待笔译的原始文本进行笔译得到的笔译文本，得到目标语文本；又如，可以获取用户上传的对待笔译的原始文本进行笔译得到的笔译文本，得到目标语文本；或者，可以获取用户上传的对待笔译的原始文本进行笔译的笔译文本图像，并通过图像识别，得到目标语文本。

若是口译，则译员可以对待口译内容的原始音频进行口译，得到口译音频，之后，为便于对翻译质量进行评测，可以对所述口译音频进行识别处理，生成口译文本，进而可以得到目标语文本。例如可以通过自动语音识别(Automatic Speech Recognition，ASR)对所述口译音频进行自动识别，生成口译文本，作为目标语文本。

ASR是一种通过预设的语音识别算法程序将音频转换为文字的过程。在具体实施中，可以采用已知的ASR算法，也可以根据需要采用专门设计的ASR算法，针对不同的语种，可能采用的ASR算法有所不同，ASR算法的具体类型并不构成对本发明保护范围的限制。

S23，基于所述目标语参考答案和所述目标语结果，进行句子对齐，生成句对齐信息。

在翻译评测过程中，需要基于目标语结果与目标语参考答案的一致度，或者说差异度进行判断。而为了比较二者的一致度，或者说差异度，可以首先将二者进行匹配。在具体应用过程中，可以通过精确匹配的方式进行，也可以通过模糊匹配的方式进行。

其中，精确匹配的方式具体例如可以采用克努特-莫里斯-普拉特(Knuth-Morris-Pratt，KMP)字符串查找算法、波伊尔-摩尔(Boyer-Moore，BM)算法和BMH算法等。KMP字符串查找算法，简称KMP算法，常用于在一个文本串S内查找一个模式串P的出现位置，这个算法由唐纳德·克努特(Donald Knuth)、沃恩·普拉特(Vaughan Pratt)、詹姆斯·H·莫里斯(James H.Morris)三人于1977年联合发表，故取这3人的姓氏命名此算法，按照从前向后的顺序进行字符串匹配，其对于任何模式和目标序列，都可以在线性时间内完成匹配查找，而不会发生退化，是一个非常优秀的模式匹配算法。BM算法是另一种在O(n)时间复杂度内，完成字符串匹配的算法，其中n是指目标串长度；其是按照从右向左进行比较的方法，同时应用到两种启发式规则，即坏字符规则和好后缀规则，来决定向右调的距离。BMH算法则是一种BM算法的改进算法，其仅使用坏字符策略，而不使用导致不匹配的字符，而始终使用文本窗口的匹配的字符。

模糊匹配方法的关键在于如何衡量两个长得很像的单词(字符串)之间的差异，这种差异通常又称为距离。模糊匹配的算法例如基于编辑距离的概念的史密斯-沃特曼(Smith-Waterman)算法和尼德曼-翁施(Needleman-Wunsch)算法，又如基于N-Gram模型(亦称为N元模型)的算法。其中，基于N-Gram模型的算法是一种基于统计语言模型的算法，其基本思想是将文本里面的内容按照字节进行大小为N的滑动窗口操作，形成长度是N的字节片段序列。

作为一种可选示例，可以采用基于N-Gram模型的句对齐算法，生成句对齐信息。更具体地，可以对所述目标语文本和所述目标语参考答案分别按照字节顺序以预设窗口大小进行滑动操作，形成以所述预设窗口大小为片段单位的第一片段序列和第二片段序列；按照字节顺序，以所述预设窗口大小(窗长为N)为对齐单位，将所述第一片段序列和所述第二片段序列执行对齐操作，生成所述句对齐信息。

S24，根据所述句对齐信息和所述源语种和目标语种信息，进行特征提取，生成所述目标语结果的特征。

在具体实施中，为了提高翻译评测的准确性，在一些实施例中，可以采用多粒度的特征提取模型进行提取。具体而言，可以基于所述句对齐信息以及所述源语种和目标语种信息，采用多种粒度的特征提取模型，进行特征提取，得到相应粒度的特征向量；将提取得到的不同粒度的特征向量进行融合，得到所述目标语文本的特征向量。

例如，提供多个特征提取模型，其中可以包括以下至少两种粒度的特征提取模型：基于词粒度的特征提取模型；基于句子粒度的特征提取模型；基于上下文语义信息的特征提取模型。

S25，将所述目标语结果的特征输入完成预训练的多维能力模型，生成对应的翻译评测结果。

在具体实施中，可以将步骤S24得到的目标语文本的特征向量分别输入预设的多个维度的能力模型，分别得到多个维度的量化分级数据，并基于所述多个维度的量化分级数据，生成所述翻译评测结果。

采用上述实施例，从整个翻译评测过程可知，由于基于目标语参考答案和目标语结果，进行句子对齐后进行特征提取，因此，得到的目标语结果的特征可以比较全面地反映目标语结果的信息，进而将所述目标语结果的特征输入至完成预训练的多维能力模型，使得所述多维能力模型可以从多个维度全面而有效地学习到这些信息，进而可以从多个维度对目标语结果进行准确评测，因而可以提高翻译评测质量，且整个评测过程自动完成，无须人工参与，因而可以提高翻译评测的效率。

发明人在研究过程中发现，目前缺乏能够保障评测质量及效率的口译评测方法，目前也没有公开的口译评测产品或方案，可能有一些口译训练和口语评测方案。其中，对于口译训练，相关的训练模型都是用户自己设置，难以应用于口译评测，例如无法应用于口译教学场景，或口译比赛场景。而口语评测则通过语音特征计算模型进行打分，其缺乏对翻译内容的评价，因此也难以应用于口译评测场景。

由上可知，口译训练方案和口语评测都无法真正有效地满足英语教学中口译教学的需求。当前，口译评测主要通过线下方式，老师发起评测任务，学生提交口译录音音频文件，进而老师通过口译录音的语音自动识别结果，收到对口译结果进行打分，得到评测结果。可以看出，这种线下模式的口译评测工作量很大，因而无法形成有效、及时的结果反馈，也难以做到频繁地口译训练测评，难以实现形成性评价(Formative Evaluation)。形成性评价是指在教学过程中为了解学生的学习情况，及时发现教学中的问题而进行的评价。

针对目前口译评测领域中存在的上述问题，可以采用以下实施例中介绍的翻译评测方法进行有效解决。为使本领域技术人员更好地理解及实施，以下以针对口译评测场景，通过具体翻译评测过程进行详细的示例性介绍。

参照图3所示的另一种翻译评测方法的流程图，具体可以包括如下步骤：

S31，获取待口译内容的原始音频、目标语参考答案，以及源语种和目标语种信息。

在口译教学场景，作为一种可选示例，可以由教师创建口译任务，并将待口译内容的原始视频上传，并配置所述口译任务的任务要求信息，其中可以设置口译要求的源语种和目标语种信息，例如源语种为英文，目标语种为中文，则是要求将英文音频口译为中文。

更具体地，根据翻译评测方法所处应用模式的不同，可以具有不同的模式配置，例如不同的模式评测用户有不同的权限，包括读权限(也即可以查看的信息范围)和写权限(包括修改权限)。在一些可选示例中，应用模式可以包括练习模式和考试模式。例如，若所创建的口译任务为练习模式，则可以配置针对所述口译任务所输入目标语结果的次数不受限制；又如，在考试模式下，可以配置完成所述口译任务的时间要求信息，例如，可以配置目标语结果输入(即上传)的最迟时间信息，或者配置完成所述口译任务的总的时长信息。

需要说明的是，在一些示例中，目标语参考答案并不向翻译评测系统的任务执行者开放，仅用于翻译评测系统内部评估翻译结果，在另一些示例中，例如在练习模式下，目标语参考答案可以在任务执行者完成任务后再向其展示。

S32，获取对待口译内容的原始音频进行口译得到的口译音频。

在本说明书一些实施例中，译员(例如学生或者口译比赛中的选手)可以获取待口译内容的原始音频，并对其进行口译，得到目标音频。在具体实施中，所述翻译评测系统根据具体应用场景可以实时采集译员的口译音频，作为所述目标音频，或者译员可以将口译音频保存至其他存储终端，待完成翻译后，再统一上传至翻译评测系统。

S33，对所述口译音频进行识别，生成口译文本，以得到目标语文本。

作为一可选步骤，对于上传或者采集到的目标音频，可以通过ASR方式，将口译音频转换为文本数据，得到口译文本。ASR技术原理及具体实现可以参见前述实施例中步骤S22中的示例性介绍，此处不再展开描述。

在具体实施中，口译存在同声传译和交替传译等类型，基于口译类型的不同，得到目标语文本的方式有所不同。

例如，对于同声传译，由于译员在不打断讲话者讲话的情况下，不间断地将内容口译出来，因此，可以实时不间断地获取同声传译音频。例如，翻译评测系统可以获取译员对待口译内容的原始音频进行同声传译得到的同声传译音频。此时同声传译音频中可以仅包含译员口译出来的目标语内容，因此，可以对所述同声传译音频通过自动语音识别，生成口译文本，直接将所述口译文本作为目标语文本。

又如，对于交替传译，是译员一边听源语讲话，一边记笔记，当讲者停下来时，再重新表达讲者发言的全部信息内容。在这一过程中，为了避免评测过程打断交替传译过程，避免对译者的翻译进程产生干扰，译者可以在完成整个交替传译任务后将交替传译音频整体上传，则交替传译音频中既包括译者口译出的目标语音频内容，也包括原始音频内容，为了避免原始音频内容对评测结果产生干扰，在获取到译者对待口译内容的原始音频进行交替传译得到的交替传译音频后，可以对所述交替传译音频通过自动语音识别，生成交替传译文本，之后对所述交替传译文本进行识别，区分出其中的目标语内容部分和源语内容部分，从中提取出目标语内容，进而可以得到目标语文本。

S34，响应于对所述口译文本中的识别错误进行修正的操作，对所述口译文本进行修正处理，得到修正后的口译文本，作为目标语文本。

在具体实施中，通过ASR方式自动生成的口译文本，可能存在识别错误。为此，在本说明书一些实施例中，为了进一步提高口译评测的评测准确性，作为可选步骤，可以通过识别得到的口译文本中的识别错误进行修正。具体地，译者对于识别得到的口译文本，可以进行检查核对，在发现识别错误时，可以选中错误之处，并对错误之处进行替换修正。因此，对于翻译评测系统而言，可以在接收到对所述口译文本中的识别错误进行修正的操作时，可以对所述口译文本进行修正处理，进而将修正后的口译文本，作为目标语文本。

S35，对所述目标语文本和所述目标语参考答案，进行句子对齐，生成句对齐信息。

作为一可选示例，采用基于N-Gram模型的句对齐算法，生成句对齐信息。具体步骤如下：可以对所述目标语文本和所述目标语参考答案分别按照字节顺序以预设窗口大小进行滑动操作，形成以所述预设窗口大小为片段单位的第一片段序列和第二片段序列；按照字节顺序，以所述预设窗口大小(窗长为N)为对齐单位，将所述第一片段序列和所述第二片段序列执行对齐操作，生成所述句对齐信息。这里，第一片段序列为目标语文本对应的片段序列，第二片段序列为目标语参考答案对应的目标序列。

通过句子对齐，生成句对齐信息的其他具体方式可以参见前述实施例中的步骤S23的示例性详细介绍，此处不再展开描述。

S36，根据所述句对齐信息和所述源语种和目标语种信息，进行特征提取，生成所述目标语文本的特征。

如前述实施例所述，为了能够更加全面多维地反映目标语结果的实际情况，提高翻译评测的准确性，可以采用多种粒度的特征提取模型，进行特征提取，可以分别得到相应粒度的特征向量，进而可以将提取得到的不同粒度的特征向量进行融合，得到目标语文本的特征向量。在具体实施中，可以以句长为单位，将句子或句对的特征进行合并，融合得到整个目标语文本的特征。

以下示出一些特征提取的具体可实现示例：

在具体实施中，可以至少执行两种粒度的特征提取，例如：

一方面，可以基于所述句对齐信息中的第一片段序列和所述第二片段序列，提取词级别的特征，得到相应的词向量；

另一方面，可以基于所述句对齐信息中的第一片段序列和所述第二片段序列，采用基于语义的特征提取方法，提取句子级别的特征，得到相应的句子向量。

其中，提取词级别的特征的方法可以有多种。例如，可以采用一种或多种关键词提取算法分别提取出句对齐信息中的第一片段序列和所述第二片段序列中的关键词，统计除去停用词外，词频最高的预设数目的词语作为文本关键词。作为可选示例，关键词提取可以是无监督关键词提取，也可以是有监督关键词提取，或者半监督的关键词提取。更具体地，无监督关键词提取可以选用基于统计特征的关键词提取，其利用统计信息抽取第一片段序列和第二片段序列的关键词可以将文本经过预处理得到候选词语集合，然后采用特征值量化的方式，从候选词语集合中得到关键词，其中特征值量化指标可以采用基于词权重的特征量化(例如词性、词频、逆向文件频率、相对词频、词长等其中至少一种)，或者基于词的位置的特征量化等。

在一些可选示例中，可以选用词频-逆向文件频率(Term Frequency-InverseDocument Frequency，TF-IDF)算法，也可以选用基于词图模型的关键词提取算法，例如TextRank算法，进行关键词抽取，也可以进行关键短语抽取。

可以理解的是，以上算法仅为示例性说明，本说明书实施例并不限定所采用的具体算法，只要能够提取到词级别的特征即可。

类似地，对于基于语义的特征提取方法，本说明书实施例并不限定所采用的具体算法，只要能够提取到句子级别的特征即可。以下给出两种示例，可以选用其中至少一种方式：

1)将所述第一片段序列输入预设的概率语言模型，计算所述第一片段序列作为一句话的概率，得到对应的单语质量分，作为相应的句子向量；

2)将所述第一片段序列和所述第二片段序列输入预训练的相似度评估模型，得到所述第一片段序列和所述第二片段序列的相似度值，作为相应的句子向量。作为可选示例，分类模型具体可以采用转换器的双向编码器表示(Bidirectional EncoderRepresentations from Transformers，BERT)预训练模型，计算第一片段序列和所述第二片段序列的相似度，这个相似度可以称为转换器的双向编码器表示分数(BERTScore)，作为一种自动评估指标。

在具体实施，特征提取还可以采用其他的特征提取模型进行不同粒度的特征提取。在本说明书一些实施例中，可以基于所述句对齐信息中的第一片段序列和所述第二片段序列，对所述第一片段序列中的相邻片段进行位置互换，采用预设的分类模型，提取句子的语法特征信息，得到相应的句子向量。作为可选示例，分类模型可以采用决策树、支持向量机(Support Vector Machines，SVM)等分类模型。需要说明的是，本说明书实施例中并不限定所采用的具体分类模型。

S37，将所述目标语文本的特征输入完成预训练的多维能力模型，生成对应的翻译评测结果。

在具体实施中，可以将所述目标语文本的特征向量分别输入预设的多个维度的能力模型，分别得到多个维度的量化分级数据；基于所述多个维度的量化分级数据，生成所述翻译评测结果。其中，所述多个维度的能力模型可以分别采用不同的能力模型。

口译能力，是指通过口头表达形式，调用语言知识和策略将一次性的源语听力文本转换为目标语文本的跨文化语际中介能力。例如，对于口译能力，可以从多个维度进行量化评估，可以包括：翻译口头描述、翻译口头叙述、翻译口头说明、翻译口头指示、翻译口头论述、翻译口头互动等多个方面。各能力模型可以通过预先训练得到。具体训练过程中可以采用教科书、论文、新闻等各种类型的语料进行训练。

S38，基于所述翻译评测结果，输出翻译评测报告。

作为可选步骤，在得到翻译评测结果后，可以输出评测结果，例如，翻译评测分数，可以包括总分数以及不同维度的分数。为了促进译员口译能力的有效提升，可以输出更加详细有针对性的翻译评测报告，例如，除了评测结果外，还可以包括以下至少一项：1)与评测结果相应的评语；2)与评测结果相应的优化改进建议信息。

采用上述实施例，通过获取对源语内容的原始音频进行口译得到的目标音频，并通过自动语音识别将所述目标音频转换为目标语文本，所述目标语文本与所述目标语参考答案进行句子对齐，之后，根据生成的句对齐信息和源语种和目标语种信息，进行特征提取，生成所述目标语结果的特征，这一过程可以体现口译的翻译信息，适应口译场景需求，因而评测结果可以更加准确地反映实际的口译质量，故可以进一步提高口译评测质量。

上述口译评测方法若应用于口译比赛过程中，能够自动快速而准确地生成评测结果，从而可以有效地节约人力成本及评测时间。若应用于口译教学和；练习过程中，则可以提高学习效率，减少人力成本。

以上通过具体实施例并结合具体应用场景及附图对本说明书实施例中的翻译评测方法进行了详细的介绍，本说明书实施例还提供了对应的翻译评测系统。以下结合附图，并通过一些具体实施例进行对应介绍。

参照图4所示的翻译评测系统的结构示意图，在本说明书一些实施例中，如图4所示，翻译评测系统40包括：第一获取单元41、第二获取单元42、句对齐单元43、特征提取单元44和评测单元45，其中：

所述第一获取单元41，适于获取源语内容、目标语参考答案，以及源语种和目标语种信息；

所述第二获取单元42，适于获取对所述源语内容进行翻译得到的目标语结果；

所述句对齐单元43，适于基于所述目标语参考答案和所述目标语文本，进行句子对齐，生成句对齐信息；

所述特征提取单元44，适于根据所述句对齐信息和所述源语种和目标语种信息，进行特征提取，生成所述目标语结果的特征；

所述评测单元45，适于将所述目标语结果的特征输入完成预训练的多维能力模型，生成对应的翻译评测结果。

采用上述翻译评测系统，由于其基于目标语参考答案和目标语结果，进行句子对齐后进行特征提取，因此，得到的目标语结果的特征可以比较全面地反映目标语结果的信息，进而将所述目标语结果的特征输入至完成预训练的多维能力模型，使得所述多维能力模型可以从多个维度全面而有效地学习到这些信息，进而可以从多个维度对目标语结果进行准确评测，因而可以提高翻译评测质量，且整个评测过程自动完成，无须人工参与，因而可以提高翻译评测的效率。

在具体实施中，继续参照图4，所述翻译评测系统40还可以包括：报告生成单元46，适于基于所述翻译评测结果，输出翻译评测报告。翻译评测报告的具体内容可以包括以下至少一项：评测结果、与评测结果相应的评语、与评测结果相应的优化改进建议信息。

翻译评测系统的具体实施步骤、工作原理及优点，以及针对具体应用场景的扩展示例均可参照前述翻译评测方法的实施例，此处不再赘述。

如前所述，在具体实施过程中，针对翻译评测系统不同角色的用户，可能具有不同的交互方式及操作权限。为此，可以分别针对不同的角色提供相应的交互接口，这里交互接口具体是指一个交互操作界面，可以基于交互客户端或者浏览器、应用程序(APP)、小程序、插件等实施，本说明书实施例中并不限定其具体呈现形式及运行位置，不同的交互端对应不同类型的用户。

参照图5所示的另一种具体应用场景中的翻译评测系统的结构示意图，在本说明书一些实施例中，如图5所示，翻译评测系统50可以包括：第一交互端51和第二交互端52，其中：

作为可选示例，所述第一交互端51可以包括：任务创建模块511和任务发布模块512，其中：

所述任务创建模块511，适于创建目标任务，包括：获取源语内容及用于任务评测的目标语参考答案，配置目标任务要求信息，生成目标任务；所述目标任务要求信息包括：源语种及目标语种信息；

所述任务发布模块512，适于发布所创建的目标任务。

作为可选示例，所述第二交互端52可以包括：任务查询模块521、目标语结果获取模块522、评测模块523，其中：

所述任务查询模块521，适于获取所发布的目标任务；

所述目标语结果获取模块522，适于获取基于所述目标任务所输入的对所述源语内容进行翻译得到目标语结果；

所述评测模块523，基于所述目标语参考答案和所述目标语结果，进行句子对齐，生成句对齐信息；根据所述句对齐信息和所述源语种和目标语种信息，进行特征提取，生成所述目标语结果的特征；将所述目标语结果的特征输入完成预训练的多维能力模型，生成对应的翻译评测结果。

在具体实施中，所述目标任务要求信息还可以包括：所述任务的应用模式，以及在不同应用模式下任务执行者的权限。作为一种可选示例所述应用模式包括：练习模式和考试模式，其中：

在练习模式下，配置所述目标语结果输入模块针对所述目标任务所输入的目标语结果的次数不受限制；

在考试模式下，配置所述目标语结果输入的时间要求信息。

在具体实施中，所述目标任务的类型具体可以为笔译任务，或者口译任务，或者同时包含多种类型的翻译任务，例如同时包含笔译任务和口译任务。

在一些实施例中，若所述目标任务的类型包括口译任务，所述源语内容可以为待口译内容的原始音频，所述目标语结果可以为对所述待口译内容进行口译所生成的口译音频得到。

在具体实施中，根据具体应用场景的不同，口译任务可以分为不同的类型。在本说明书一些实施例中，口译任务类型包括以下至少一种：同声传译及交替传译。

在本说明书一些实施例中，所述口译任务的类型包括同声传译，相应地，参照图6A所示的目标语结果获取模块的结构示意图，在具体实施中，所述目标语结果获取模块522可以包括：第一音频获取子模块5221和第一语音识别子模块5222，其中：

所述第一音频获取子模块5221，适于获取对待口译内容的原始音频进行同声传译得到的同声传译音频；

所述第一语音识别子模块5222，适于对所述同声传译音频通过自动语音识别，生成口译文本，作为目标语文本。

在本说明书另一些实施例中，所述口译任务的类型包括交替传译时，参照图6B所示的目标语结果获取模块的结构示意图，在具体实施中，所述目标语结果获取模块522可以包括：第二音频获取子模块5223、第二语音识别子模块5224和目标语内容识别子模块5225，其中：

所述第二音频获取子模块5223，适于获取对待口译内容的原始音频进行交替传译得到的交替传译音频；

所述第二语音识别子模块5224，适于对所述交替传译音频通过自动语音识别，生成交替传译文本；

所述目标语内容识别子模块5225，适于对所述交替传译文本进行识别，提取出目标语文本。

在具体实施中，若翻译评测系统既可以对同声传译结果进行评测，也可以对交替传译结果进行评测，则所述目标语结果获取模块522可以同时包含图6A和图6B两种类型的功能子模块。可以理解的是，对于其中部分功能模块可以不用区分是同声传译还是交替传译而共用。例如，所述第一音频获取子模块5221和所述第二音频获取子模块5223可以采用一个统一的音频获取子模块，其既可以获取同声传译音频，也可以获取交替传译音频。又如，所述第一语音识别子模块5222和所述第二语音识别子模块5224可以采用一个统一的语音识别子模块，其既可以对同声传译音频进行识别处理，也可以对交替传译音频进行识别处理，不用区分具体的口译类型。

在具体实施中，继续参照图5，所述第二交互端52还可以包括：修正模块525，适于响应于对识别文本中的识别错误进行修正的操作，对所述识别文本进行修正处理，得到修正后的目标语文本。

在具体实施中，第一交互端51的用户通常为教师、评测考试评价人员等角色，第二交互端52的用户通常为学生、考试或比赛应试者等角色，因此通常是一个第一交互端51对应多个第二交互端52，即：通过第一交互端51发布的目标任务，可以有多个任务执行者分别通过不同的第二交互端52分别完成所述目标任务。

针对上述具体应用场景，在本说明书一些实施例中，继续参照图5，所述第一交互端51还可以包括：统计分析模块513，适于基于所发布的目标任务的翻译评测结果进行统计分析，得到统计分析数据。作为一些可选示例，所述统计分析模块513，适于进行分数统计、错误率统计、错误类型统计以及错误分布统计等其中一种或多种类型的统计分析，所述统计分析模块513，可以基于相应的统计分析请求而自动生成，从而便于第一交互端51的用户对目标任务完成情况能够快速而准确全面的了解。

进一步地，继续参照图5，所述第一交互端51还可以包括：统计结果存储模块514，适于对所述统计分析模块513得到的统计分析数据进行存储。

在具体实施中，还可以对所述第一交互端51作进一步地优化和扩展，以期对其功能或/和性能作进一步的提升。例如，为使所发布的目标任务能够更有针对性，以更加有效地提升译员的翻译质量，所述任务创建模块511，还适于基于所述统计结果存储模块514存储的统计分析数据，确定任务难度等级，创建相应难度级别的目标任务。在具体实施中，不同的任务难度等级，可以有不同难度级别、不同翻译类型(例如同声传译、交替口译)的任务。

继续参照图5，在具体实施中，所述第二交互端52还可以包括：评测报告输出模块526，适于基于所述翻译评测结果，输出翻译评测报告。

在本说明书一些实施例中，翻译评测包括可以包括以下至少一项：评测结果、与评测结果相应的评语、与评测结果相应的优化改进建议信息。

以上翻译评测系统不同实施例所解决的问题、针对的具体应用场景、工作原理及有益效果等均可参见前述翻译评测方法的具体实施例的详细介绍，此处不再展开说明。

本说明书实施例还提供了能够实现上述自动翻译评测的电子设备，参照图6所示的电子设备的结构示意图，在具体实施中，如图7所示，电子设备70可以包括存储器71和处理器72，其中，所述存储器71上存储有可在所述处理器72上运行的计算机程序，其中，所述处理器72运行所述计算机程序时可以执行前述任一翻译评测方法实施例中的步骤。

在具体实施中，所述电子设备还可以包括显示器73，适于显示翻译评测结果，输出翻译评测报告，也可以对中间执行过程进行输出显示。

在具体实施中，可以通过输入接口74与用户交互，获取待翻译的源语内容，以及上传对源语内容进行翻译得到的目标语结果等。

在另一些实施例中，可以通过通讯接口75获取所述获取待翻译的源语内容，以及上传对源语内容进行翻译得到的目标语结果等。

在具体实施中，存储器71、处理器72、显示器73、输入接口74及通讯接口75之间可以通过总线76进行通信。

所述电子设备70具体可以是本地的计算机设备，也可以是云端的服务器或者服务器集群。所述存储器71可以是光盘、机械硬盘、固态硬盘等各种适当的可读存储介质，所述处理器72具体可以是单核处理器，也可以是多核处理器。以上各具体器件或模块的具体实现，本说明书实施例均不需要进行任何限定。

本说明书实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序运行时执行前述任一实施例所述的翻译评测方法的步骤，具体步骤可以参见前述实施例，此处不再赘述。

在具体实施中，所述计算机可读存储介质可以是光盘、机械硬盘、固态硬盘等各种适当的可读存储介质。

虽然本说明书实施例披露如上，但本发明并非限定于此。任何本领域技术人员，在不脱离本发明的精神和范围内，均可作各种更动与修改，因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims

1.一种翻译评测方法，其中，包括：

获取对所述源语内容进行翻译得到的目标语结果；

2.根据权利要求1所述的翻译评测方法，其中，所述获取源语内容，包括：

获取待笔译的原始文本；

所述获取对所述源语内容进行翻译得到的目标语结果，包括以下至少一种方式：

通过键盘或手写输入方式直接获取对待笔译的原始文本进行笔译得到的笔译文本，得到目标语文本；

3.根据权利要求1所述的翻译评测方法，其中，所述获取源语内容，包括：

获取待口译内容的原始音频；

获取对待口译内容的原始音频进行口译得到的口译音频；

4.根据权利要求3所述的翻译评测方法，其中，还包括：

5.根据权利要求2-4任一项所述的翻译评测方法，其中，所述基于所述目标语参考答案和所述目标语结果，进行句子对齐，生成句对齐信息，包括：对所述目标语文本和所述目标语参考答案分别按照字节顺序以预设窗口大小进行滑动操作，形成以所述预设窗口大小为片段单位的第一片段序列和第二片段序列；

6.根据权利要求5所述的翻译评测方法，其中，所述基于所述句对齐信息和所述源语种和目标语种信息，进行特征提取，生成所述目标语文本的特征，包括：

7.根据权利要求6所述的翻译评测方法，其中，所述基于所述句对齐信息以及所述源语种和目标语种信息，采用多种粒度的特征提取模型，进行特征提取，得到相应粒度的特征向量，包括：

8.根据权利要求7所述的翻译评测方法，其中，所述基于所述句对齐信息中的第一片段序列和所述第二片段序列，采用基于语义的特征提取方法，提取句子级别的特征，得到相应的句子向量，包括以下至少一种：

9.根据权利要求7所述的翻译评测方法，其中，所述基于所述句对齐信息以及所述源语种和目标语种信息，采用多种粒度的特征提取模型，进行特征提取，得到相应粒度的特征向量，还包括：

10.根据权利要求6所述的翻译评测方法，其中，所述将所述目标语文本的特征输入完成预训练的多维能力模型，生成对应的翻译评测结果，包括：将所述目标语文本的特征向量分别输入预设的多个维度的能力模型，分别得到多个维度的量化分级数据；

11.一种翻译评测方法，其中，包括：

根据所述句对齐信息和所述源语种和目标语种信息，进行特征提取，生成所述目标语文本的特征；

将所述目标语文本的特征输入完成预训练的多维能力模型，生成对应的翻译评测结果。

12.根据权利要求11所述的翻译评测方法，其中，所述获取对待口译内容的原始音频进行口译得到的口译音频，对所述口译音频进行识别，生成口译文本，以得到目标语文本，包括：

或，

13.一种翻译评测系统，其中，包括：

句对齐单元，适于基于所述目标语参考答案和所述目标语结果，进行句子对齐，生成句对齐信息；

14.一种翻译评测系统，其中，包括：第一交互端和第二交互端，其中：所述第一交互端，适于提供源语内容；所述第一交互端包括：任务创建模块和任务发布模块，其中：

所述任务发布模块，适于发布所创建的目标任务；

所述任务查询模块，适于获取所发布的目标任务；

15.根据权利要求14所述的翻译评测系统，其中，所述目标任务要求信息还包括：所述任务的应用模式，以及在不同应用模式下任务执行者的权限。

16.根据权利要求15所述的翻译评测系统，其中，在所述目标任务的类型包括口译任务时，所述源语内容为待口译内容的原始音频，所述目标语结果基于对所述待口译内容进行口译所生成的口译音频得到；并且，其中：在所述口译任务的类型包括同声传译时，所述目标语结果获取模块包括：第一音频获取子模块，适于获取对待口译内容的原始音频进行同声传译得到的同声传译音频；

在所述口译任务的类型包括交替传译时，所述目标语结果获取模块，包括：第二音频获取子模块，适于获取对待口译内容的原始音频进行交替传译得到的交替传译音频；

17.根据权利要求16所述的翻译评测系统，其中，所述第二交互端还包括：修正模块，适于响应于对目标语文本中的识别错误进行修正的操作，对所述目标语文本进行修正处理，得到修正后的目标语文本，用于翻译评测。

18.根据权利要求14-17任一项所述的翻译评测系统，其中，所述第一交互端还包括：

19.一种电子设备，包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的计算机程序，其中，所述处理器运行所述计算机程序时执行权利要求1至10任一项或11-12任一项所述的方法的步骤。

20.一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序运行时执行权利要求1至10任一项或11-12任一项所述的方法的步骤。