CN111931519B

CN111931519B - 翻译测评方法及装置、存储介质和处理器

Info

Publication number: CN111931519B
Application number: CN201910350450.6A
Authority: CN
Inventors: 张成廷; 汪嘉怿; 施杨斌; 赵宇; 骆卫华; 柳妭
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2019-04-28
Filing date: 2019-04-28
Publication date: 2023-11-17
Anticipated expiration: 2039-04-28
Also published as: CN111931519A

Abstract

本发明公开了一种翻译测评方法及装置、存储介质和处理器。其中，该方法包括：获取目标译文段落中属于指定表达类型的词汇，其中，指定表达类型用于指示目标译文段落中的翻译失误类型；确定指定表达类型的词汇所属的标签，其中，标签用于表征词汇在目标领域中所属的类型；根据词汇所属的指定表达类型和词汇所属的标签确定目标译文段落中的词汇在目标领域中对应的权重；根据目标译文段落中的词汇对应的权重确定目标译文段落的测评值，其中，测评值用于表征目标译文段落的表达含义的准确程度。本发明解决了语言学家对机器翻译特定领域的内容的翻译结果进行测评时，测评结果不准确的技术问题。

Description

翻译测评方法及装置、存储介质和处理器

技术领域

本发明涉及机器翻译技术领域，具体而言，涉及一种翻译测评方法及装置、存储介质和处理器。

背景技术

随着人工智能和机器翻译技术的快速发展，大大提高了翻译的速度，减少了人工翻译的工作量，同时，如何利用专业的语言学家对机器翻译的结果进行客观测评，从而提高翻译的精度，一直是一件非常困难的事情。具体地，一方面，由于待翻译词汇所处的领域不同、上下文不同，语言天然地存在某种程度的歧义，尤其在一些特定领域，机器翻译所要处理的对象已经超越了自然语言的范畴，看似轻微的翻译问题会严重影响到用户的使用体验，甚至法律风险；另一方面，语言学家作为翻译结果的评测执行的个体，也存在标准理解和执行上的差异，从而影响翻译结果评测的客观性。因此，需要一套能够在不同的时间、不同的评测资源下针对不同场景给出一个给相对稳定的度量体系，从而实现机器翻译系统质量水平的跟踪以及翻译质量的改进。

相关技术中存在一个业界通用的翻译评测框架，Multidimensional QualityMetrics，简称MQM，它包含了错误类型、评分机制和标记描述。其下的子集，动态翻译质量框架,是由翻译自动化用户协会根据其成员的反馈开发和维护的，用以对翻译错误的词汇进行分类，从而对翻译结果进行测评的框架。但是，该动态翻译质量框架中的分类方法只考虑了错误级别与错误类型存在的关联关系，没有考虑相同错误在不同场景下的影响差异，以及特定场景下不同翻译错误对用户的影响。而且，错误级别的标注由评测的语言学家判断，存在评判标准不一致的可能，影响评测结果的客观性。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种翻译测评方法及装置、存储介质和处理器，以至少解决语言学家对机器翻译特定领域的内容的翻译结果进行测评时，测评结果不准确的技术问题。

根据本发明实施例的一个方面，提供了一种翻译测评方法，包括：获取目标译文段落中属于指定表达类型的词汇，其中，指定表达类型用于指示目标译文段落中的翻译失误类型；确定指定表达类型的词汇所属的标签，其中，标签用于表征词汇在目标领域中所属的类型；根据词汇所属的指定表达类型和词汇所属的标签确定目标译文段落中的词汇在目标领域中对应的权重；根据目标译文段落中的词汇对应的权重确定目标译文段落的测评值，其中，测评值用于表征目标译文段落的表达含义的准确程度。

根据本发明实施例的另一方面，还提供了一种翻译测评装置，包括：获取单元，用于获取目标译文段落中属于指定表达类型的词汇，其中，指定表达类型用于指示目标译文段落中的翻译失误类型；第一确定单元，用于确定指定表达类型的词汇所属的标签，其中，标签用于表征词汇在目标领域中所属的类型；第二确定单元，用于根据词汇所属的指定表达类型和词汇所属的标签确定目标译文段落中的词汇在目标领域中对应的权重；第三确定单元，用于根据目标译文段落中的词汇对应的权重确定目标译文段落的测评值，其中，测评值用于表征目标译文段落的表达含义的准确程度。

在本发明实施例中，采用获取目标译文段落中属于指定表达类型的词汇，根据词汇所属的指定表达类型和词汇所属的标签确定目标译文段落中的词汇在目标领域中对应的权重的方式，通过根据目标译文段落中的词汇对应的权重确定目标译文段落的测评值，达到了提高测评机器翻译特定领域的内容的翻译结果的准确度的目的，从而实现了准确测评翻译结果的技术效果，进而解决了语言学家对机器翻译特定领域的内容的翻译结果进行测评时，测评结果不准确的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种翻译测评方法的计算机终端的硬件结构框图；

图2是根据本发明实施例的一种翻译测评方法的流程图；

图3是根据相关技术中的机器翻译错误类型树的示意图；

图4是根据本发明实施例的翻译测评方法中的机器翻译错误类型树的示意图；

图5是根据本发明实施例的一种翻译测评装置的示意图；

图6是根据本申请实施例的一种可选的翻译测评装置的示意图一；

图7是根据本申请实施例的一种可选的翻译测评装置的示意图二；

图8是根据本申请实施例的一种可选的翻译测评装置的示意图三；

图9是根据本申请实施例的一种可选的翻译测评装置的示意图四；

图10是根据本申请实施例的一种可选的翻译测评装置的示意图五；

图11是根据本申请实施例的一种可选的翻译测评装置的示意图六；

图12是根据本申请实施例的一种可选的翻译测评装置的示意图七；

图13是根据本申请实施例的一种可选的翻译测评装置的示意图八；

图14是根据本申请实施例的一种可选的翻译测评装置的示意图九；以及

图15是根据本申请实施例的一种计算机终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先，在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释：

机器翻译评测：对给定的翻译系统或翻译算法进行评价。

自然语言：通常是指一种自然地随文化演化的语言。

TAUS(Translation Automation User Society):翻译自动化用户协会，一个独立和中立的机器翻译行业组织，2004年成立于旧金山。

实施例1

根据本发明实施例，还提供了一种翻译测评方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现翻译测评方法的计算机终端(或移动设备)的硬件结构框图。如图1所示，计算机终端10(或移动设备10)可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算机终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

存储器104可用于存储应用软件的软件程序以及模块，如本发明实施例中的翻译测评方法对应的程序指令/数据存储装置，处理器102通过运行存储在存储器104内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的应用程序的漏洞检测方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中，传输装置包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

显示器可以例如触摸屏式的液晶显示器(LCD)，该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。

在上述运行环境下，本申请提供了如图2所示的翻译测评方法。图2是根据本发明实施例一的翻译测评方法的流程图。

步骤21，获取目标译文段落中属于指定表达类型的词汇，其中，指定表达类型用于指示目标译文段落中的翻译失误类型。

在上述步骤中，目标译文段落为采用翻译工具对指定的一段待翻译的文字进行翻译后得到的译文段落，指定表达类型为预先设定的语言表达的失误类型，例如，重复表达，拼写错误，用词不准确等表达的失误类型，对于目标译文段落，其指定表达类型为预先设定的翻译失误类型，例如，重复翻译，翻译拼写错误，大小写翻译错误，翻译用词不准等影响译文的可读性的翻译失误类型。

步骤S22，确定指定表达类型的词汇所属的标签，其中，标签用于表征词汇在目标领域中所属的类型。

需要说明的是，在各个领域中，根据领域中对译文表达准确性影响比较大的信息的类型，为词汇设定标签，以分类表征词汇的类型，例如，在电商领域，商品的生产时间、价格、品牌、型号等信息对于商品的售卖和维护比较重要，可以设置时间、价格、品牌、型号等标签，以给对应的词汇归类，例如，“18:00”、“1月1号”等词汇可以设置时间标签，“1千元”、“800元”等词汇可以设置价格标签，商品的品牌词汇可以设置品牌标签，家用电器数码产品等的型号字样可以设置型号标签。再例如，在旅游领域，旅游项目的时间、地点、线路、景点以及价格等信息是用户较为关心的信息，可以设置时间、价格、地点、景点等标签，以给对应的词汇归类，例如，“18:00”、“1月1号”等词汇可以设置时间标签，“1千元”、“800元”等词汇可以设置价格标签，“中国”、“日本”、“欧洲”等词汇可以设置地点标签，“湖泊”、“山川”、“峡谷”等词汇可以设置景点标签。

步骤S23，根据词汇所属的指定表达类型和词汇所属的标签确定目标译文段落中的词汇在目标领域中对应的权重。

需要说明的是，目标译文段落中的词汇在目标领域中对应的权重，用于表征词汇对目标译文的可读性的影响程度，为影响程度大的词汇确定较大的权重，为影响程度小的词汇确定较小的权重，而征词汇对目标译文的可读性的影响程度词汇所属的指定表达类型共同决定。

例如，在电商领域，价格是用户较为关注的信息，但价格标签下的词汇的不同翻译失误类型对用户对商品的价格判断的影响程度不同，具体的，价格标签下的词汇的翻译大小写错误不影响价格信息的含义表达，为这样的翻译失误类型的价格词汇设置较小的权重，而价格标签词汇的拼写错误会造成价格信息表达不清，对目标译文的可读性的影响程度较大，为这样的翻译失误类型的价格词汇设置较大的权重。

步骤S24，根据目标译文段落中的词汇对应的权重确定目标译文段落的测评值，其中，测评值用于表征目标译文段落的表达含义的准确程度。

需要说明的是，对应不同权重的词汇在目标译文段落中占据的比例综合影响测评值，从而影响目标译文段落的表达含义的准确程度，具体地，在目标译文段落中，对应较大权重的词汇占据的比例较低，说明在目标译文段落中翻译失误的情况的占比较低，目标译文段落的表达较为准确，而对应较大权重的词汇占据的比例越高，说明在目标译文段落中翻译失误的情况的占比越高，目标译文段落的含义更不准确，极大影响目标译文段落的可读性。

根据本申请上述实施例，上述方法还包括如下步骤：

在根据词汇所属的指定表达类型和词汇所属的标签确定目标译文段落中的词汇在目标领域中对应的权重之前，根据词汇的指定表达类型对译文在目标领域中的含义的影响程度，以及词汇的标签对译文在目标领域中的含义的影响程度，为不同指定表达类型下的不同标签设置级别；以指定表达类型为列，以标签为行，以不同指定表达类型下的不同标签的级别为元素，设置目标矩阵；为目标矩阵中的不同的级别设置对应的权重。

需要说明的是，若逐个为不同指定表达类型下的不同标签设置不同的权重，工作量较大，后续计算测评值也较为复杂，可以先确定几个错误级别，以矩阵的形式将不同指定表达类型下的不同标签归为这几个错误级别，再灵活地为不同错误级别设置对应的权重值。

如表1所示，为电商领域下的目标矩阵，目标矩阵的行分为：多译、漏译、错译、否定含义错误、未翻译、拼写错误、重复错误、大小写错误、排版错误、虚词错误、词序错误、词形错误、无法理解、非惯用法、别扭用法等指定类型。目标矩阵的列分为：商标/系列、产品明细、型号/规格、数字以及时间、属性、地点/名字、违禁词、动作、其他严重的标签、其他主要的标签以及其他次要的标签，可以设置不同的错误级别，例如，设置3个错误级别，分别为严重的、主要的、次要的，如果相同错误类型的翻译问题对阅读者造成不一样的影响，可以分别配置错误级别。此外，有些标签不存在翻译错误类型，标为“N/A”，还存在整句无效的情况，具体地，分为原文无效和译文无效两种情况，原文无效会从测评样样本中剔除，而译文无效是指译文错误的词汇占目标译文段落的一半以上，使译文无法读并难以逐字标注错误，均标为“N/A”，并为这样的错误直接打出测评值。

表1

在设置目标矩阵后，为不同的级别设置权重，例如，可以为严重级别设置权重值为10、为主要级别设置权重值为5、为次要级别设置权重值为1，需要说明的是，权重的设置可以根据领域和场景的不同需要而改变。

根据本申请上述实施例，步骤23根据词汇所属的指定表达类型和词汇所属的标签确定目标译文段落中的词汇在目标领域中对应的权重包括如下步骤：

根据词汇的指定表达类型和词汇的标签，确定词汇在目标矩阵中的位置；基于词汇在目标矩阵中的位置，确定词汇对应的级别；根据词汇对应的级别确定词汇对应的权重。

需要说明的是，在译文段落中，需要获取一个翻译错误的词汇的权重值，首先需要确定翻译错误所属的指定类型，并确定该词汇在目标领域中所属的标签，从而获取该翻译错误的词汇在目标矩阵中的级别，再根据为不同级别设置的权重，确定翻译错误的词汇的权重值。

例如，在电商领域，将“30”译为“thirteen”，该翻译错误属于“错译”类型，“30”属于数字以及时间标签，如图2所示，该翻译错误的词汇在目标矩阵中对应的级别为“主要”，若严重级别权重值为10、主要级别权重值为5、次要级别权重值为1，则该翻译错误的词汇对应的权重值为5。

通过本实施例，通过目标矩阵，对不同类型的翻译问题进行区分，设置相应的权重，评测的语言学家不再需要标注错误级别，而是标注翻译错误的类型和词汇标签，最终映射到矩阵中的错误级别。

根据本申请上述实施例，步骤24根据目标译文段落中的词汇对应的权重确定目标译文段落的测评值包括如下步骤：

根据词汇对应的权重，不同权重下的词汇的数量，以及目标译文段落包含的词汇的总数量，计算目标译文段落的测评值。

例如，确定错误级别对应的权重值，标注目标译文段落中的翻译错误的词汇，并根据指定类型和标签确定翻译错误的词汇对应的级别，错误级别为严重、主要、次要，统计单个句子各个级别下的词汇的数量，按下式计算测评值：

其中，TQ_unit表示目标译文单句的测评值，#Minor表示次要级别的词汇的数量，Severity_minor表示次要级别的权重，#Major表示主要级别的词汇的数量，Severity_major表示主要级别的权重，#Critical表示严重级别的词汇的数量，Severity_critical表示严重级别的权重，word_count表示目标译文段落中的词汇的数量，Other Issue表示其他问题，Penalty_{invalid target}表示译文无效的扣分，可以取值为-150，Invalid Target表示译文无效。

对于整段译文文本，可以通过单句得分推算得出测评值：

其中，TQ_set表示段落测评值，WordCount_unit表示目标单句的单词数量，需要说明的是，对于译文无效的单句，无需乘单词数，直接带入该译文无效的单句的扣分值即可。

通过本实施例，测评结果能够更加准确体现目标领域下机器翻译的质量情况，衡量译文对用户在目标场景的各个环节的影响，并消除评测人员的主观因素。

根据本申请上述实施例，上述方法还包括如下步骤：

采用下式优化目标译文段落的测评值：

其中，TQ_set表示目标译文段落的测评值，TQ_NEW表示优化后的目标译文段落的测评值，C表示系数，Scalar表示系数，其中，C的取值与Scalar的取值使得TQ_NEW的取值分布在0至100之间。

需要说明的是，算出的测评值并不一定位于0到100之间，由于百分制为常用的测评制度，为了便于用户通过测评值判断翻译情况，以及便于将测评结果与相关技术中的人工打分制方便地进行比较，将测评值换算成百分制，具体地，C取值为100，Scalar取值为2，从而使得测评值分布在0至100之间。

经试验，优化后最终98％的测评值落在[0,100]区间内，此外，经对200句翻译结果进行翻译错误类型以及标签的标注，并按照本实施例得到的测评值，和相关技术中人工打分的结果保持了一致性，从而证实了本方法的可靠性。

根据本申请上述实施例，步骤21获取目标译文段落中属于指定表达类型的词汇包括如下步骤：

采用目标翻译工具对目标段落进行翻译，得到目标译文段落；在目标译文段落中获取属于指定表达类型的词汇。

需要说明的是，为了对翻译工具在目标领域下的翻译效果进行测评，首先采用翻译工具对目标领域下的段落进行翻译，得到翻译出来的译文。在翻译出来的译文段落中查找翻译错误的词汇，并标注翻译错误的词汇分别所属的指定类型。

根据本申请上述实施例，上述方法还包括如下步骤：

根据目标译文段落的测评值，判断目标翻译工具是否与目标领域的翻译要求匹配。

例如，在电商领域，翻译要求为，测评值达到60分以上方认为翻译效果合格，若经目标翻译工具翻译后的译文段落的测评值小于60分，说明该翻译工具和目标领域的翻译要求不匹配，翻译结果准确率低，需要更换其他翻译工具进行翻译，若目标译文段落的测评值大于60分，说明该翻译工具的翻译结果满足目标领域的翻译要求。

根据本申请上述实施例，上述方法还包括如下步骤：

在获取目标译文段落中属于指定表达类型的词汇之前，调整机器翻译错误类型树中的错误类型，其中，机器翻译错误类型树包括多个主错误类型，每个主错误类型下包含多个子错误类型；将调整后的翻译错误类型树中的子错误类型作为目标领域下的指定表达类型。

需要说明的是，Multidimensional Quality Metrics，简称MQM，是一个业界通用的翻译评测框架，包含了错误类型、评分机制和标记描述，错误分类是,由翻译自动化用户协会(Translation Automaton User Society，简称TAUS)根据其成员的反馈开发和维护的动态翻译质量框架(Translation Automaton User Society Dynamic QualityFramework，简称TAUS DQF)是MQM的子集。

如图3所示，为TAUS DQF下的机器翻译错误类型树，包括三个主错误类型：准确度、流畅度和风格，准确度错误主要影响译文含义的准确程度，准确度主错误类型下包括5个子错误类型：多译、漏译、错译、不当的翻译记忆库匹配和未翻译错误。流畅度错误主要影响译文的可读性，流畅度主错误类型下包括4个子错误类型：拼写错误、排版错误、语法错误和翻译后无法理解的错误。风格错误也影响译文的可读性，风格主错误类型下包括2个子错误类型：非惯用法和别扭用法。

通过本实施例，对机器翻译错误类型树中用户感知最强烈的翻译错误类型进行新增和细分，作为本实施例中的指定类型，从而为后续提高翻译结果测评精度奠定基础。

根据本申请上述实施例，调整机器翻译错误类型树中的错误类型包括如下步骤：

在准确度错误的主错误类型下增加子错误类型：否定含义错误，其中，否定含义错误为将否定含义的词汇翻译为肯定含义，和/或，将肯定含义的词汇翻译为否定含义。

需要说明的是，将否定含义的词汇翻译成肯定含义，或将肯定含义的词汇翻译成否定含义，会极大的影响段落的含义，例如，将目标段落中的语句“本商品活动后1个月内不降价”，翻译为“本商品活动后1个月内降价”，发生了否定含义错误，翻译后非但没有表达出商品保价的含义，反而造成用户的误解，减少用户在活动期间购买该商品的热情。

如图4所示，在准确度主错误类型下增加否定含义错误的子错误类型。此外，由于测评人员无法判断译文是否命中了翻译记忆库，在准确度主类型下的子错误类型“不当的翻译记忆库匹配”，在实际应用中缺乏可操作性，故删除该子错误类型。

根据本申请上述实施例，调整机器翻译错误类型树中的错误类型还包括如下步骤：

在流畅度错误的主错误类型下增加子错误类型：重复错误、大小写错误，并将流畅度错误下的语法错误拆分为三个子错误类型：虚词错误、语序错误、词形错误。

需要说明的是，在一个词汇翻译时发生重复错误或大小写错误时，一般不会改变该词汇的含义，不会影响译文表达的准确性。但是，会使得用户读取信息不够流畅，降低用户体验，而且对于商标品名等词汇，发生大小写错误，可能影响信息的准确度表达，因而，在准确度主错误类型下增加重复错误以及大小写错误，从而在后续检测译文中的翻译错误时，检测出该类型错误，提高对翻译工具的翻译测评的精度。

此外，在检测出语法错误并进行错误调整时，不同类型的语法错误在引擎上调整的策略是不同的，语法错误的子错误类型是比较粗略的分类，为了更准确地定位语法错误，将语法错误中的不同错误，拆分为三个子错误类型：虚词错误、语序错误、词形错误。

如图4所示，为调整后的机器翻译错误类型树，增加了增加子错误类型：重复错误、大小写错误，并对语法错误类型进行了拆分，从而在统计目标段落中的翻译错误的词汇的指定类型时，能够统计出相关技术中没有的，且用户关注的类型，实现基于调整后的指定类型提高对翻译结果的测评精度的目的。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

实施例2

根据本发明实施例，还提供了一种用于实施上述翻译测评方法的装置，如图5所示，该装置包括：获取单元51、第一确定单元52、第二确定单元53和第三确定单元54。

具体地，获取单元51，用于获取目标译文段落中属于指定表达类型的词汇，其中，指定表达类型用于指示目标译文段落中的翻译失误类型。

在一种可选的方案中，目标译文段落为采用翻译工具对指定的一段待翻译的文字进行翻译后得到的译文段落，指定表达类型为预先设定的语言表达的失误类型，例如，重复表达，拼写错误，用词不准确等表达的失误类型，对于目标译文段落，其指定表达类型为预先设定的翻译失误类型，例如，重复翻译，翻译拼写错误，大小写翻译错误，翻译用词不准等影响译文的可读性的翻译失误类型。

第一确定单元52，用于确定指定表达类型的词汇所属的标签，其中，标签用于表征词汇在目标领域中所属的类型。

第二确定单元53，用于根据词汇所属的指定表达类型和词汇所属的标签确定目标译文段落中的词汇在目标领域中对应的权重。

第三确定单元54，用于根据目标译文段落中的词汇对应的权重确定目标译文段落的测评值，其中，测评值用于表征目标译文段落的表达含义的准确程度。

此处需要说明的是，上述获取单元51、第一确定单元52、第二确定单元53和第三确定单元54对应于实施例1中的步骤S21至步骤S24，四个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

根据本申请上述实施例，如图6所示，上述装置还包括：第一设置单元61、第二设置单元62和第三设置单元63。

具体地，第一设置单元61，用于在根据词汇所属的指定表达类型和词汇所属的标签确定目标译文段落中的词汇在目标领域中对应的权重之前，根据词汇的指定表达类型对译文在目标领域中的含义的影响程度，以及词汇的标签对译文在目标领域中的含义的影响程度，为不同指定表达类型下的不同标签设置级别；

第二设置单元62，用于以指定表达类型为列，以标签为行，以不同指定表达类型下的不同标签的级别为元素，设置目标矩阵；

第三设置单元63，用于为目标矩阵中的不同的级别设置对应的权重。

例如，电商领域下的目标矩阵，目标矩阵的行分为：多译、漏译、错译、否定含义错误、未翻译、拼写错误、重复错误、大小写错误、排版错误、虚词错误、词序错误、词形错误、无法理解、非惯用法、别扭用法等指定类型。目标矩阵的行分为：商标/系列、产品明细、型号/规格、数字以及时间、属性、地点/名字、违禁词、动作、其他严重严重的标签、其他主要的标签以及其他次要的标签，可以设置3个错误级别，分别为严重严重的、主要的、次要的。此外，有些标签不存在翻译错误类型，标为“N/A”，还存在整句无效的情况，具体地，分为原文无效和译文无效两种情况，原文无效会从测评样样本中剔除，而译文无效是指译文错误的词汇占目标译文段落的一半以上，使译文无法读并难以逐字标注错误，均标为“N/A”，并为这样的错误直接打出测评值。

此处需要说明的是，上述第一设置单元61、第二设置单元62和第三设置单元63对应于实施例1中的步骤，三个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

根据本申请上述实施例，如图7所示，第二确定单元53还包括：第一确定模块5311、第二确定模块532和第三确定模块533。

具体地，第一确定模块531，用于根据词汇的指定表达类型和词汇的标签，确定词汇在目标矩阵中的位置；

第二确定模块532，用于基于词汇在目标矩阵中的位置，确定词汇对应的级别；

第三确定模块533，用于根据词汇对应的级别确定词汇对应的权重。

此处需要说明的是，上述第一确定模块531、第二确定模块532和第三确定模块533对应于实施例1中的步骤，三个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

根据本申请上述实施例，如图8所示，第三确定单元54包括：计算模块541.

具体地，计算模块541，用于根据词汇对应的权重，不同权重下的词汇的数量，以及目标译文段落包含的词汇的总数量，计算目标译文段落的测评值。

对于整段译文文本，可以通过单句得分推算得出测评值：

此处需要说明的是，上述计算模块541对应于实施例1中的步骤，上述模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

根据本申请上述实施例，如图9所示，上述装置还包括：优化单元91。

具体地，优化单元91，用于采用下式优化目标译文段落的测评值：

此处需要说明的是，上述优化单元91对应于实施例1中的步骤，上述模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

根据本申请上述实施例，如图10所示，获取单元51包括：翻译模块511和获取模块512。

具体地，翻译模块511，用于采用目标翻译工具对目标段落进行翻译，得到目标译文段落；

获取模块512，用于在目标译文段落中获取属于指定表达类型的词汇。

此处需要说明的是，上述翻译模块511和获取模块512对应于实施例1中的步骤，两个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

根据本申请上述实施例，如图11所示，上述装置还包括：判断单元111。

其中，判断单元111，用于根据目标译文段落的测评值，判断目标翻译工具是否与目标领域的翻译要求匹配。

此处需要说明的是，上述判断单元111对应于实施例1中的步骤，上述模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

根据本申请上述实施例，如图12所示，上述装置还包括：调整单元121和设定单元122。

其中，调整单元121，用于在获取目标译文段落中属于指定表达类型的词汇之前，调整机器翻译错误类型树中的错误类型，其中，机器翻译错误类型树包括多个主错误类型，每个主错误类型下包含多个子错误类型；

设定单元122，用于将调整后的翻译错误类型树中的子错误类型作为目标领域下的指定表达类型。

此处需要说明的是，上述调整单元121和设定单元122对应于实施例1中的步骤，两个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

根据本申请上述实施例，如图13所示，调整单元121包括：第一增设模块1211，用于在准确度错误的主错误类型下增加子错误类型：否定含义错误，其中，否定含义错误为将否定含义的词汇翻译为肯定含义，和/或，将肯定含义的词汇翻译为否定含义。

此处需要说明的是，上述第一增设模块1211对应于实施例1中的步骤，上述模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

根据本申请上述实施例，如图14所示，调整单元121还包括：第二增设模块1212，用于在流畅度错误的主错误类型下增加子错误类型：重复错误、大小写错误，并将流畅度错误下的语法错误拆分为三个子错误类型：虚词错误、语序错误、词形错误。

此处需要说明的是，上述第二增设模块1212对应于实施例1中的步骤，上述模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例一所公开的内容。需要说明的是，上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

实施例3

本发明的实施例可以提供一种计算机终端，该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地，在本实施例中，上述计算机终端也可以替换为移动终端等终端设备。

可选地，在本实施例中，上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

在本实施例中，上述计算机终端可以执行应用程序的漏洞检测方法中以下步骤的程序代码：获取目标译文段落中属于指定表达类型的词汇，其中，指定表达类型用于指示目标译文段落中的翻译失误类型；确定指定表达类型的词汇所属的标签，其中，标签用于表征词汇在目标领域中所属的类型；根据词汇所属的指定表达类型和词汇所属的标签确定目标译文段落中的词汇在目标领域中对应的权重；根据目标译文段落中的词汇对应的权重确定目标译文段落的测评值，其中，测评值用于表征目标译文段落的表达含义的准确程度。

可选地，图15是根据本发明实施例的一种计算机终端的结构框图。如图15所示，该计算机终端A可以包括：一个或多个(图中仅示出一个)处理器151、存储器153、以及传输装置155。

其中，存储器可用于存储软件程序以及模块，如本发明实施例中的安全漏洞检测方法和装置对应的程序指令/模块，处理器通过运行存储在存储器内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的系统漏洞攻击的检测方法。存储器可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器可以通过传输装置调用存储器存储的信息及应用程序，以执行下述步骤：获取目标译文段落中属于指定表达类型的词汇，其中，指定表达类型用于指示目标译文段落中的翻译失误类型；确定指定表达类型的词汇所属的标签，其中，标签用于表征词汇在目标领域中所属的类型；根据词汇所属的指定表达类型和词汇所属的标签确定目标译文段落中的词汇在目标领域中对应的权重；根据目标译文段落中的词汇对应的权重确定目标译文段落的测评值，其中，测评值用于表征目标译文段落的表达含义的准确程度。

可选的，上述处理器还可以执行如下步骤的程序代码：在根据词汇所属的指定表达类型和词汇所属的标签确定目标译文段落中的词汇在目标领域中对应的权重之前，根据词汇的指定表达类型对译文在目标领域中的含义的影响程度，以及词汇的标签对译文在目标领域中的含义的影响程度，为不同指定表达类型下的不同标签设置级别；以指定表达类型为列，以标签为行，以不同指定表达类型下的不同标签的级别为元素，设置目标矩阵；为目标矩阵中的不同的级别设置对应的权重。

可选的，上述处理器还可以执行如下步骤的程序代码：根据词汇的指定表达类型和词汇的标签，确定词汇在目标矩阵中的位置；基于词汇在目标矩阵中的位置，确定词汇对应的级别；根据词汇对应的级别确定词汇对应的权重。

可选的，上述处理器还可以执行如下步骤的程序代码：根据词汇对应的权重，不同权重下的词汇的数量，以及目标译文段落包含的词汇的总数量，计算目标译文段落的测评值。

可选的，上述处理器还可以执行如下步骤的程序代码：采用下式优化目标译文段落的测评值：

可选的，上述处理器还可以执行如下步骤的程序代码：采用目标翻译工具对目标段落进行翻译，得到目标译文段落；在目标译文段落中获取属于指定表达类型的词汇。

可选的，上述处理器还可以执行如下步骤的程序代码：根据目标译文段落的测评值，判断目标翻译工具是否与目标领域的翻译要求匹配。

可选的，上述处理器还可以执行如下步骤的程序代码：在获取目标译文段落中属于指定表达类型的词汇之前，调整机器翻译错误类型树中的错误类型，其中，机器翻译错误类型树包括多个主错误类型，每个主错误类型下包含多个子错误类型；将调整后的翻译错误类型树中的子错误类型作为目标领域下的指定表达类型。

可选的，上述处理器还可以执行如下步骤的程序代码：在准确度错误的主错误类型下增加子错误类型：否定含义错误，其中，否定含义错误为将否定含义的词汇翻译为肯定含义，和/或，将肯定含义的词汇翻译为否定含义。

可选的，上述处理器还可以执行如下步骤的程序代码：在流畅度错误的主错误类型下增加子错误类型：重复错误、大小写错误，并将流畅度错误下的语法错误拆分为三个子错误类型：虚词错误、语序错误、词形错误。

采用本发明实施例，采用获取目标译文段落中属于指定表达类型的词汇，根据词汇所属的指定表达类型和词汇所属的标签确定目标译文段落中的词汇在目标领域中对应的权重的方式，通过根据目标译文段落中的词汇对应的权重确定目标译文段落的测评值，达到了提高测评机器翻译特定领域的内容的翻译结果的准确度的目的，进而解决了语言学家对机器翻译特定领域的内容的翻译结果进行测评时，测评结果不准确的技术问题。

本领域普通技术人员可以理解，图15所示的结构仅为示意，计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices，MID)、PAD等终端设备。图15其并不对上述电子装置的结构造成限定。例如，计算机终端10还可包括比图15中所示更多或者更少的组件(如网络接口、显示装置等)，或者具有与图15所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(RandomAccess Memory，RAM)、磁盘或光盘等。

实施例4

本发明的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以用于保存上述实施例一所提供的翻译测评方法所执行的程序代码。

可选地，在本实施例中，上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中，或者位于移动终端群中的任意一个移动终端中。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：获取目标译文段落中属于指定表达类型的词汇，其中，指定表达类型用于指示目标译文段落中的翻译失误类型；确定指定表达类型的词汇所属的标签，其中，标签用于表征词汇在目标领域中所属的类型；根据词汇所属的指定表达类型和词汇所属的标签确定目标译文段落中的词汇在目标领域中对应的权重；根据目标译文段落中的词汇对应的权重确定目标译文段落的测评值，其中，测评值用于表征目标译文段落的表达含义的准确程度。

该方法还包括：在根据词汇所属的指定表达类型和词汇所属的标签确定目标译文段落中的词汇在目标领域中对应的权重之前，根据词汇的指定表达类型对译文在目标领域中的含义的影响程度，以及词汇的标签对译文在目标领域中的含义的影响程度，为不同指定表达类型下的不同标签设置级别；以指定表达类型为列，以标签为行，以不同指定表达类型下的不同标签的级别为元素，设置目标矩阵；为目标矩阵中的不同的级别设置对应的权重。

根据词汇所属的指定表达类型和词汇所属的标签确定目标译文段落中的词汇在目标领域中对应的权重包括：根据词汇的指定表达类型和词汇的标签，确定词汇在目标矩阵中的位置；基于词汇在目标矩阵中的位置，确定词汇对应的级别；根据词汇对应的级别确定词汇对应的权重。

根据目标译文段落中的词汇对应的权重确定目标译文段落的测评值包括：根据词汇对应的权重，不同权重下的词汇的数量，以及目标译文段落包含的词汇的总数量，计算目标译文段落的测评值。

该方法还包括：采用下式优化目标译文段落的测评值：

获取目标译文段落中属于指定表达类型的词汇包括：采用目标翻译工具对目标段落进行翻译，得到目标译文段落；在目标译文段落中获取属于指定表达类型的词汇。

该方法还包括：根据目标译文段落的测评值，判断目标翻译工具是否与目标领域的翻译要求匹配。

该方法还包括：在获取目标译文段落中属于指定表达类型的词汇之前，调整机器翻译错误类型树中的错误类型，其中，机器翻译错误类型树包括多个主错误类型，每个主错误类型下包含多个子错误类型；将调整后的翻译错误类型树中的子错误类型作为目标领域下的指定表达类型。

调整机器翻译错误类型树中的错误类型包括：在准确度错误的主错误类型下增加子错误类型：否定含义错误，其中，否定含义错误为将否定含义的词汇翻译为肯定含义，和/或，将肯定含义的词汇翻译为否定含义。

调整机器翻译错误类型树中的错误类型还包括：在流畅度错误的主错误类型下增加子错误类型：重复错误、大小写错误，并将流畅度错误下的语法错误拆分为三个子错误类型：虚词错误、语序错误、词形错误。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种翻译测评方法，包括：

获取目标译文段落中属于指定表达类型的词汇，其中，所述指定表达类型用于指示所述目标译文段落中的翻译失误类型；

确定所述指定表达类型的词汇所属的标签，其中，所述标签用于表征词汇在目标领域中所属的类型；

根据词汇所属的指定表达类型和词汇所属的标签确定所述目标译文段落中的词汇在所述目标领域中对应的权重；

根据所述目标译文段落中的词汇对应的权重确定所述目标译文段落的测评值，其中，所述测评值用于表征所述目标译文段落的表达含义的准确程度。

2.根据权利要求1所述的方法，其中，之前所述方法还包括：

在根据词汇所属的指定表达类型和词汇所属的标签确定所述目标译文段落中的词汇在所述目标领域中对应的权重之前，根据词汇的指定表达类型对译文在所述目标领域中的含义的影响程度，以及词汇的标签对译文在所述目标领域中的含义的影响程度，为不同指定表达类型下的不同标签设置级别；

以所述指定表达类型为列，以所述标签为行，以所述不同指定表达类型下的不同标签的级别为元素，设置目标矩阵；

为所述目标矩阵中的不同的级别设置对应的权重。

3.根据权利要求2所述的方法，其中，根据词汇所属的指定表达类型和词汇所属的标签确定所述目标译文段落中的词汇在所述目标领域中对应的权重包括：

根据词汇的指定表达类型和词汇的标签，确定词汇在所述目标矩阵中的位置；

基于词汇在所述目标矩阵中的位置，确定词汇对应的级别；

根据词汇对应的级别确定词汇对应的权重。

4.根据权利要求3所述的方法，其中，根据所述目标译文段落中的词汇对应的权重确定所述目标译文段落的测评值包括：

根据词汇对应的权重，不同权重下的词汇的数量，以及所述目标译文段落包含的词汇的总数量，计算所述目标译文段落的测评值。

5.根据权利要求4所述的方法，其中，所述方法还包括：

采用下式优化所述目标译文段落的测评值：

其中，TQ_set表示所述目标译文段落的测评值，TQ_NEW表示优化后的所述目标译文段落的测评值，C表示系数，Scalar表示系数，其中，C的取值与Scalar的取值使得TQ_NEW的取值分布在0至100之间。

6.根据权利要求1所述的方法，其中，获取目标译文段落中属于指定表达类型的词汇包括：

采用目标翻译工具对目标段落进行翻译，得到所述目标译文段落；

在所述目标译文段落中获取属于指定表达类型的词汇。

7.根据权利要求6所述的方法，其中，所述方法还包括：

根据所述目标译文段落的测评值，判断所述目标翻译工具是否与所述目标领域的翻译要求匹配。

8.根据权利要求1所述的方法，其中，所述方法还包括：

在获取目标译文段落中属于指定表达类型的词汇之前，调整机器翻译错误类型树中的错误类型，其中，所述机器翻译错误类型树包括多个主错误类型，每个所述主错误类型下包含多个子错误类型；

将调整后的所述翻译错误类型树中的子错误类型作为所述目标领域下的指定表达类型。

9.根据权利要求8所述的方法，其中，调整机器翻译错误类型树中的错误类型包括：

在准确度错误的主错误类型下增加子错误类型：否定含义错误，其中，所述否定含义错误为将否定含义的词汇翻译为肯定含义，和/或，将肯定含义的词汇翻译为否定含义。

10.根据权利要求8所述的方法，其中，调整机器翻译错误类型树中的错误类型还包括：

在流畅度错误的主错误类型下增加子错误类型：重复错误、大小写错误，并将所述流畅度错误下的语法错误拆分为三个子错误类型：虚词错误、语序错误、词形错误。

11.一种翻译测评装置，包括：

获取单元，用于获取目标译文段落中属于指定表达类型的词汇，其中，所述指定表达类型用于指示所述目标译文段落中的翻译失误类型；

第一确定单元，用于确定所述指定表达类型的词汇所属的标签，其中，所述标签用于表征词汇在目标领域中所属的类型；

第二确定单元，用于根据词汇所属的指定表达类型和词汇所属的标签确定所述目标译文段落中的词汇在所述目标领域中对应的权重；

第三确定单元，用于根据所述目标译文段落中的词汇对应的权重确定所述目标译文段落的测评值，其中，所述测评值用于表征所述目标译文段落的表达含义的准确程度。

12.一种存储介质，其特征在于，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行权利要求1至10中任意一项所述的翻译测评方法。

13.一种处理器，其特征在于，所述处理器用于运行程序，其中，所述程序运行时执行权利要求1至10中任意一项所述的翻译测评方法。