CN104731777A

CN104731777A - 一种译文评价方法及装置

Info

Publication number: CN104731777A
Application number: CN201510148814.4A
Authority: CN
Inventors: 杨光旭; 黄瑾; 孙奇峰
Original assignee: NET EASE YOUDAO INFORMATION TECHNOLOGY (BEIJING) Co Ltd
Current assignee: NET EASE YOUDAO INFORMATION TECHNOLOGY (BEIJING) Co Ltd; Netease Youdao Information Technology Beijing Co Ltd
Priority date: 2015-03-31
Filing date: 2015-03-31
Publication date: 2015-06-24
Anticipated expiration: 2035-03-31
Also published as: CN104731777B

Abstract

本发明的实施方式提供了一种译文评价方法。该方法包括：获得与应用场景对应的特征库和译文评价模型；基于所获得的特征库，对原文和待分析译文进行处理以获得相应的特征向量；使用所述译文评价模型对所获得的特征向量进行运算，以得到所述待分析译文的评价结果。根据本发明实施方式的方法，可以针对不同应用场景选择适应的特征库和译文评价模型对待分析译文进行评价，使得评价结果更加准确，并且减少人工劳动，不限制原文和译文的语言种类，适用于多种应用场景。此外，本发明的实施方式提供了一种译文评价装置。

Description

一种译文评价方法及装置

技术领域

本发明的实施方式涉及计算机信息处理技术领域，更具体地，本发明的实施方式涉及一种译文评价方法及装置。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

目前，存在各种类型的英语考试，例如中国英语四级、六级、专业八级、CATTI等考试，这些考试中通常包含英译中翻译题型。这种翻译题，通常由阅卷老师进行人工评分。这一方面增加了阅卷工作量，另一方面，评分的客观性和公平性不可避免地受到阅卷老师个人主观理解差异的影响。

另外，有很多在线英语培训网站，也涉及翻译的练习。学员提交译文后，如能及时获得评分反馈，有助于学员及时了解自己的翻译技能水平，激发进一步学习的兴趣。

发明人了解到，目前存在例如针对英文写作的自动评分技术。这种自动评分技术，通过引入各种可能描述文章特点的特征的方法，例如包括但不限于词数、句子长度分布、词汇难度、句子结构复杂程度、是否有拼写错误、标点使用情况、是否有语法句法错误等，来为一篇英文作文进行综合打分。但是，这种自动评分技术，仅考虑单个语言信息，而没有关联的原文，因此，很可能一篇语言流畅、优美但无关主题的作文，也可以得到高分。显然，这种自动评分技术无法直接应用于翻译考试的评分。

发明人还了解到，目前还存在一些针对机器翻译系统的译文进行评价的技术。这通常需要由人工事先给出若干正确的翻译结果(也称为参考译文)，然后比较机器翻译的译文与参考译文之间的相似度，从而给出评分。

但是，机器翻译不同于人的翻译，译文的错误类型也大不相同，比如机器翻译词汇一般都是正确的，而翻译考试中学生的词汇问题比较明显。因此，针对机器翻译系统的译文进行评价的技术不能很好地适用于针对人工翻译译文的评价。

发明内容

为此，非常需要一种改进的译文评价方法及装置，以能够针对不同应用场景下的译文进行合适的评价。

在本上下文中，本发明的实施方式期望提供一种改进的译文评价方法及装置。

在本发明实施方式的第一方面中，提供了一种改进的译文评价方法，包括：

获得与应用场景对应的特征库和译文评价模型；

基于所获得的特征库，对原文和待分析译文进行处理以获得相应的特征向量；

使用所述译文评价模型对所获得的特征向量进行运算，以得到所述待分析译文的评价结果。

在本发明实施方式的第二方面中，提供了一种译文评价装置，包括：

第一获得单元，用于获得与应用场景对应的特征库和译文评价模型；

第二获得单元，用于基于所获得的特征库，对原文和待分析译文进行处理以获得相应的特征向量；

处理单元，用于使用所述译文评价模型对所获得的特征向量进行运算，以得到所述待分析译文的评价结果。

根据本发明实施方式的方法和装置，可以针对不同应用场景选择适应的特征库和译文评价模型对待分析译文进行评价，使得评价结果更加准确，并且减少人工劳动，不限制原文和译文的语言种类，适用于多种应用场景。

附图说明

通过参考附图阅读下文的详细描述，本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本发明的若干实施方式，其中：

图1示意性地示出了本发明实施例可以在其中实施的环境；

图2示意性地示出了根据本发明实施例的一种译文评价方法的流程图；

图3示意性地示出了根据本发明实施例的译文评价方法的具体流程图；

图4示意性地示出了根据本发明实施例的训练译文评价模型方法的流程图；

图5示意性地示出了根据本发明实施例的一种译文评价装置的结构示意图；

图6示意性地示出了根据本发明实施例的译文评价装置的数据处理示意图。

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明，而并非以任何方式限制本发明的范围。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术人员知道，本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

根据本发明的实施方式，提出了一种译文评价方法及装置。

附图中的任何元素数量均用于示例而非限制，以及任何命名都仅用于区分，而不具有任何限制含义。

下面参考本发明的若干代表性实施方式，详细阐释本发明的原理和精神。

发明概述

本发明人发现，例如对于前述各类英语考试中的翻译题的译文评价以及其他特定应用场景(例如书信、科技论文等)的译文评价，如直接使用现有的机器翻译的评价技术，结果很不理想。

在本发明实施例中，发明人将不同应用场景下的译文评价(打分)抽象为一个多元回归问题。即，首先对原文和译文进行特征抽取，获得特征向量X，进而按以下公式对该特征向量进行加权运算，以获得译文评分：

f(x)＝w₁*x₁+w₂*x₂+...w_k*x_k

其中，X₁、……、X_k是特征向量X的各个分量(即特征)，W₁、……、W_k是各个分量对应的权重。

根据应用场景的不同采用不同的特征库和译文评价模型，并根据从原文和待分析译文中获得的特征向量利用所述译文评价模型得到该待分析译文的评价结果。这样，可以针对应用场景的不同，例如考试场景或者某种专业资料的翻译场景等，选择不同的特征库和译文评价模型，从而可以得到针对该应用场景比较准确的翻译评价结果。

在介绍了本发明的基本原理之后，下面具体介绍本发明的各种非限制性实施方式。

应用场景总览

首先参考图1，图1示意性地示出了本发明实施例可以在其中实施的环境。其中，用户通过客户端102与提供译文评价服务的服务器101进行交互。本领域技术人员可以理解，图1所示的框架示意图仅是本发明的实施方式可以在其中得以实现的一个示例。本发明实施方式的适用范围不受到该框架任何方面的限制。

需要注意的是，此处的客户端102可以是现有的、正在研发的或将来研发的、能够通过任何形式的有线和/或无线连接(例如，Wi-Fi、LAN、蜂窝、同轴电缆等)与服务器101交互的任何客户端，包括但不限于：现有的、正在研发的或将来研发的智能手机、非智能手机、平板电脑、膝上型个人计算机、桌面型个人计算机、小型计算机、中型计算机、大型计算机等。

还需要注意的是，此处的服务器101仅是现有的、正在研发的或将来研发的、能够为用户进行译文评价的设备的一个示例。本发明的实施方式在此方面不受任何限制。

基于图1所示的环境，服务器101可以响应于用户通过客户端102的选择操作，例如选择应用场景，获得与应用场景对应的特征库和译文评价模型；然后，服务器101基于所获得的特征库，对原文和待分析译文进行处理以获得相应的特征向量；接下来，服务器101使用所述译文评价模型对所获得的特征向量进行运算，以得到所述待分析译文的评价结果。最后，服务器101可以将得到的所述待分析译文的评价结果发送给客户端102，以向用户显示。

可以理解的是，本发明的应用场景中，虽然此处和下面将本发明实施方式的动作描述为由服务器101执行，但是这些动作也可以部分由客户端102执行、部分由服务器101执行，或者完全由客户端102执行。本发明在执行主体方面不受限制，只要执行了本发明实施方式所公开的动作即可。

另外，需要说明的是，更具体地，通过在服务器101或客户端102上安装的软件，来执行本发明实施方式的动作。

示例性方法

下面参考图2来描述根据本发明示例性实施方式的用于译文评价的方法。

参见图2所示，为根据本发明实施例的一种译文评价方法200的流程图。

该译文评价方法200可以包括：

步骤201，获得与应用场景对应的特征库和译文评价模型。

步骤202，基于所获得的特征库，对原文和待分析译文进行处理以获得相应的特征向量。

步骤203，使用所述译文评价模型对所获得的特征向量进行运算，以得到所述待分析译文的评价结果。

具体地，当需要进行译文评价时，用户在客户端102上，更一般地，在客户端102上安装的应用软件上，通过可视化界面向服务器确定当前所需的特征库和译文评价模型，例如当前应用场景为相应考试中的翻译、某种专业技术文献的翻译等时，那么选择与相应考试和该种专业技术相对应的特征库和译文模型，并且将原文和待分析译文输入到服务器中，服务器获得这些信息后，进行特征向量的提取，根据提取的特征向量，利用译文评价模型对原文和待分析译文进行计算得到评价结果，以及最后向用户显示评价结果。当然，本领域的技术人员可以理解，在某些情况下，服务器中本身存在有原文，用户并不需要输入原文到服务器中。

其中，所述的特征库包括与应用场景相对应的词汇表、短语表等，例如应用场景为四、六级英文考试翻译评价时，所述特征库包括四、六级英文考试中所涉及的特定词汇表、短语表，或者应用场景为计算机科学相关的文献翻译评价时，所述特征库包括与计算机科学相关的词汇表和短语表。

具体地，在所有步骤之前，还可以存在训练译文评价模型的步骤，在该步骤中，利用与应用场景相关的标注语料对译文评价模型进行训练，以使所述译文评价模型适合该应用场景，从而可以使得针对该应用场景的评价结果更加准确。

具体地，在得到特征向量之前，还可以包括，检查并统计所述待分析译文的文字错误，以及改正所述待分析译文中的文字错误的步骤，其中，所统计的所述待分析译文的文字错误被作为特征之一记录到所述特征向量中。

与机器翻译译文不会出现文字错误不同，人工翻译译文很有可能会出现文字错误，例如拼音文字的拼写错误，因此，文字错误可以作为译文评价的一个重要因素，并且可以加入到特征向量中。

如图3所示为根据本发明实施例的译文评价方法300的具体流程图。

在本实施例中以四、六级英文考试中的英文翻译评价作为应用场景，以考生的翻译译文作为待分析译文，对其进行评价并获得相应的分数。

该方法300包括步骤301，针对四、六级英文考试应用场景，使用大量的对应标注语料对考试译文评价模型进行训练。

具体地，如图4所示为根据本发明实施例的训练译文评价模型方法400的流程图。

该方法400包括步骤401，获得与考试应用场景相关的标注语料和特征库。

其中，所述标注语料包括大量的四、六级英文考试翻译原文，及具有人工译文评价结果的考试译文。特征库包括四、六级英文考试中规定的词汇表和短语表。也就是说在四、六级英语考试的翻译中，如果出现了词汇表或短语表中的词汇或者短语，翻译译文的评价得分就会有所提高。作为另一个实施例，如果应用场景为专业八级的英文考试，则特征库包括与专业八级的英文考试相应的词汇表和短语表，显然，专业八级英文考试的特征库和四、六级英文考试的特征库是不相同的，因为两者英文考试要求的词汇表和短语表是不相同的。

步骤402，生成所述标注语料的特征向量。

其中，标注语料的特征向量的生成方法可以参考后面描述的特征向量的获取方法。

步骤403，确定机器学习算法。

在本例中，可以采用多元回归学习算法，具体地，将标注语料的特征向量用X表示，多元回归学习算法可以用如下公式表示：

f(x)＝w₁*x₁+w₂*x₂+...w_k*x_k

其中，f(x)为译文评价结果，w₁…w_k表示相应特征的权重。

在其它的实施例中，还可以选择使用其它的机器学习算法，例如K邻近算法，在此不再赘述。

步骤404，利用所述标注语料的特征向量训练所述机器学习算法，得到考试译文评价模型。

具体地，在有标注语料的情况下，可以根据标注语料拟合得到特征对应的权重。权重确定了，就确定了译文评价模型。

通过上述的步骤可以针对不同应用场景训练出不同的译文评价模型，使得译文评价更加具有针对性，评价结果更加准确。

返回方法300，其还包括步骤302，针对四、六级英文考试评价应用场景，获得四、六级英文考试译文评价模型及对应的特征库。

在本步骤中，用户通过鼠标、键盘或者触摸屏幕在客户端处从众多应用场景中选择四、六级英文考试评价应用场景，服务器响应用户的选择，获得与四、六级英文考试评价应用场景相对应的译文评价模型和特征库。

步骤303，对原文和待分析译文进行处理以获得特征向量。

在本实施例中，可以将待分析译文中落入特征库词汇表和短语表的词汇和短语作为特征向量的特征，也就是说待分析译文中使用了特征库词汇表和短语表中的词汇和短语，这样的情况会使得待分析译文的评价结果得分更高。

作为一个可选的实施例，对所述待分析译文进行文字错误检查和统计，更正所述待分析译文中的文字错误，并将文字错误作为特征之一记录到所述特征向量中。

对于四、六级英文考试译文评价应用场景来说，人工翻译译文的特点在于可能存在的文字错误，以拼音文字为例，错误的拼写、错误的短语组合等等都经常出现，从而文字错误在译文评价中是一项重要内容。因此将该文字错误作为特征之一记录到特征向量中，根据译文评价模型，其可以具有较高的权重，即如果文字错误较多则将会很大程度上影响最终的译文评价结果。

在优选的实施例中，还可以根据译文忠实度特征和/或译文流利程度特征提取特征向量，也就是说，特征向量可以包括译文忠实度特征和译文流利程度特征其中之一，或者两者全部。

其中，译文忠实度特征可以包括以下内容的一个或者任意多个组合：

原文和待分析译文单词个数；

原文和待分析译文对空的单词个数；

原文和待分析译文中对齐的单词个数；

原文和待分析译文中对齐的单词比例；

原文和待分析译文中最长的连续对齐片段长度；

原文和待分析译文中最长的连续不对齐片段长度；

原文和待分析译文中排名前三位的单词繁殖率；

原文和待分析译文中单词个数比例；或

译文句子长短期记忆神经网络(LSTM)条件概率分值。

所述原文和待分析译文对空的单词个数是指，在原文中没有被翻译出来的单词的个数，例如原文“我”没有被翻译出，那么原文和待分析译文对空的单词个数增加1；原文和待分析译文中对齐的单词个数是指，原文中被正确翻译出来的单词的个数；原文和待分析译文中最长的连续对齐片段长度是指，原文中所有词汇都被翻译出来的片段长度；单词繁殖率是指，很多词汇在不同的场合下可能被翻译成不同个数的目标词汇(例如“我去北京”被翻译成"I go to Beijing"，“去”对应了两个单词"go to")，如果用概率，比如P(length|word)，表示单词word，被翻译成为length个词的概率，这个概率就是繁殖率；译文句子长短期记忆神经网络(LSTM)条件概率分值的含义可参考Ilya Sutskever等人发表的论文“Sequence to SequenceLearning with Neural Networks”。

所述译文流利度特征可以包括待分析译文的语言模型分值。其中，所述待分析译文的语言模型分值是指，将待分析译文分为小片段，综合每个小片段出现在译文语种文献中的概率的数值，小片段出现在译文语种文献中的概率越高说明译文的流利度越高。

作为一个优选的实施例，在提取特征向量的过程中，可以对待分析译文进行词汇-短语-句式的统计分析，将统计分析结果作为特征加入到特征向量中，所述对待分析译文进行词汇-短语-句式的统计分析的结果包括以下中的任意一项或多项的组合：

词法和句法错误频次；

词汇多样性；

词汇等级分布；

词组、短语的使用频次；或

不定式、动名词、从句的使用频次。

词法错误例如可以包括：名词单复数错误、动词时态错误、单词形式错误、标点错误等等。

词汇多样性指同一个原文词汇翻译成不同的译文词汇的情况；

词汇等级指相应译文词汇的高级程度，例如某个原文词汇既可以翻译成普通的译文词汇，也可以翻译成高级(例如专用)的译文词汇。

作为一个可选的实施例，在提取特征向量的过程中，还可以包括将待分析译文与参考答案进行比对，得到待分析译文与参考答案的相似度，将该相似度作为特征之一加入到特征向量中。如果待分析译文与参考答案的相似度较高，则会正面影响译文的评价结果。

作为一个可选的实施例，在提取特征向量的过程中，还可以包括将以下内容的一个或者多项的组合作为特征之一加入到特征向量中：

原文和待分析译文的词汇的词频-逆文档频率(tf-idf)；

原文和待分析译文的停用词使用情况；

原文和待分析译文的词性。

在本步骤中所执行的特征向量提取过程可以不分先后顺序，可以只提取其中某些特征而不必全部提取全部特征即可进行后面的利用考试译文评价模型进行的运算处理。当然本领域技术人员可以理解的是，特征向量越全面，最终的评价结果也就越准确。

步骤304，利用获得考试译文评价模型对从所述原文和待分析译文中提取的特征向量进行运算，以得到所述待分析译文的评价结果。

由于考试译文评价模型已经在步骤301中训练完毕，该考试译文评价模型已经能够针对考试类型的待分析译文进行运算处理，从而可以得到该待分析译文的评价结果。

通过上述本发明实施例的方法，可以针对不同应用场景选择相应的特征库和译文评价模型对待分析译文进行评价，使得评价结果更加准确，并且减少人工劳动，不限制原文和译文的语言种类，适用于多种应用场景。

该方法适用于普通计算机或者具有数据处理能力的终端等客户端，或者适用于客户端和远端服务器配合的网络环境，其中在客户端进行特征库和译文评价模型(即应用场景)的选择，并输入原文(可选)和待分析译文，在远端服务器上进行对原文和待分析译文的特征向量提取和译文评价模型的运算，对待分析译文的评价，以及向客户端返回评价结果。

示例性设备

在介绍了本发明示例性实施方式的方法之后，接下来，参考图5对本发明示例性实施方式的译文评价装置进行说明，该译文评价装置用于自动化的评价不同应用场景的译文质量，减少人工劳动。

译文评价装置的实施可以参见上述方法的实施，重复之处不再赘述。以下所使用的术语“单元”或者“模块”，可以是实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

如图5所示为根据本发明实施例的一种译文评价装置500的结构示意图。如图5所示，装置500包括：

第一获得单元501，用于获得与应用场景对应的特征库和译文评价模型；

第二获得单元502，用于基于所获得的特征库，对原文和待分析译文进行处理以获得相应的特征向量；

处理单元503，用于使用所述译文评价模型对所获得的特征向量进行运算，以得到所述待分析译文的评价结果。

作为优选的实施例，该译文评价装置还可以包括训练单元504，用于在所述处理单元503使用所述译文评价模型对所获得的特征向量进行运算前，利用与所述应用场景相关联的标注语料对所述译文评价模型进行训练。

作为优选的实施例，所述第二获得单元503还用于检查并统计所述待分析译文的文字错误；改正所述待分析译文中的文字错误，其中，所统计的所述待分析译文的文字错误被作为特征之一记录到所述特征向量中。

作为优选的实施例，所述特征向量包括译文忠实度特征和译文流利度特征中的一个或全部两个，

并且其中，所述译文忠实度特征包括以下内容的一个或者任意多个组合：

原文和待分析译文单词个数；

原文和待分析译文对空的单词个数；

原文和待分析译文中对齐的单词个数；

原文和待分析译文中对齐的单词比例；

原文和待分析译文中最长的连续对齐片段长度；

原文和待分析译文中最长的连续不对齐片段长度；

原文和待分析译文中排名前三位的单词繁殖率；

原文和待分析译文中单词个数比例；或

译文句子长短期记忆神经网络(LSTM)条件概率分值，

并且其中，所述流利度特征包括所述待分析译文的语言模型分值。

作为优选的实施例，所述特征向量还包括以下中的一个或全部两个：

待分析译文的词汇-短语-句式的统计分析结果；或

待分析译文与参考答案的相似度。

作为优选的实施例，所述待分析译文的词汇-短语-句式的统计分析结果包括以下项目中的任意一项或多项的组合：

词法和句法错误频次；

词汇多样性；

词汇等级分布；

词组、短语的使用频次；或

不定式、动名词、从句的使用频次。

在一些实施方式中，上述装置500包括的第一获得单元501、第二获得单元502、处理单元503和训练单元504可以设置于客户端，用户通过鼠标、键盘或者触摸屏幕等输入设备调用相应单元来获得与应用场景对应的特征库和译文评价模型；基于所获得的特征库，对原文和待分析译文进行处理以获得相应的特征向量；使用所述译文评价模型对所获得的特征向量进行运算，以得到所述待分析译文的评价结果。

另外，在另外的实施方式中，上述装置500包括的第一获得单元501、第二获得单元502、处理单元503和训练单元504可以设置于服务器中。用户在客户端通过鼠标、键盘或者触摸屏幕等输入设备来输入相关信息，通过客户端和远端服务器的网络通信，将这些相关信息提供给服务器，从而服务器获得特征库和译文评价模型的选择结果，待分析译文和原文，从而可以进行特征向量的提取，使用译文评价模型对提取的特征向量进行运算得到待分析译文的评价结果，将该评价结果通过网络通信的方式传送给客户端，从而客户端可以在屏幕上显示该评价结果。

如图6所示为根据本发明实施例的译文评价装置的数据处理示意图。

在该图中，训练单元根据标注语料和特征库对译文评价模型进行训练，得到对应于不同应用场景的多个译文评价模型；由第一获得单元获得与某个应用场景对应的特征库和译文评价模型；原文和待分析译文输入到译文评价装置中，由第二获得单元对待分析译文的文字错误进行纠正，将文字错误的统计结果作为特征之一添加到特征向量中，并且根据特征库提取原文和待分析译文的特征向量，并将提取的特征向量输入到处理单元进行处理；处理单元根据译文评价模型和特征向量进行运算处理，得到待分析译文的评价结果，其中，评价结果可以为具体分值，或者其它形式，例如优、良、中、差。

应当注意，尽管在上文详细描述中提及了译文评价装置的若干单元，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之，上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。

此外，尽管在附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本发明的精神和原理，但是应该理解，本发明并不限于所公开的具体实施方式，对各方面的划分也不意味着这些方面中的特征不能组合以进行受益，这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims

1.一种译文评价方法，包括：

获得与应用场景对应的特征库和译文评价模型；

2.根据权利要求1所述的方法，其中，所述特征库中至少包括有与所述应用场景相关联的以下内容之一：词汇表、短语表。

3.根据权利要求1所述的方法，其中，在使用所述译文评价模型对所获得的特征向量进行运算之前，还包括：

利用与所述应用场景相关联的标注语料对所述译文评价模型进行训练。

4.根据权利要求1所述的方法，其中，在对原文和待分析译文进行处理以获得相应的特征向量之中还包括：

检查并统计所述待分析译文的文字错误；

改正所述待分析译文中的文字错误，

其中，所统计的所述待分析译文的文字错误被作为特征之一记录到所述特征向量中。

5.根据权利要求1所述的方法，其中，所述特征向量包括译文忠实度特征和译文流利度特征中的一个或全部两个，

原文和待分析译文单词个数；

原文和待分析译文对空的单词个数；

原文和待分析译文中对齐的单词个数；

原文和待分析译文中对齐的单词比例；

原文和待分析译文中最长的连续对齐片段长度；

原文和待分析译文中最长的连续不对齐片段长度；

原文和待分析译文中排名前三位的单词繁殖率；

原文和待分析译文中单词个数比例；或

译文句子长短期记忆神经网络(LSTM)条件概率分值，

并且其中，所述译文流利度特征包括所述待分析译文的语言模型分值。

6.根据权利要求5所述的方法，其中，所述特征向量还包括以下中的一个或全部两个：

待分析译文的词汇-短语-句式的统计分析结果；或

待分析译文与参考答案的相似度。

7.根据权利要求6所述的方法，其中，所述待分析译文的词汇-短语-句式的统计分析结果包括以下项目中的任意一项或多项的组合：

词法和句法错误频次；

词汇多样性；

词汇等级分布；

词组、短语的使用频次；或

不定式、动名词、从句的使用频次。

8.一种译文评价装置，包括：

9.根据权利要求8所述的装置，其中，所述特征库中至少包括与所述应用场景相关联的以下内容之一：词汇表、短语表。

10.根据权利要求8所述的装置，还包括：

训练单元，用于在所述处理单元使用所述译文评价模型对所获得的特征向量进行运算前，利用与所述应用场景相关联的标注语料对所述译文评价模型进行训练。

11.根据权利要求8所述的装置，其中，所述第二获得单元还用于检查并统计所述待分析译文的文字错误；改正所述待分析译文中的文字错误，其中，所统计的所述待分析译文的文字错误被作为特征之一记录到所述特征向量中。

12.根据权利要求8所述的装置，其中，所述特征向量包括译文忠实度特征和译文流利度特征中的一个或全部两个，

原文和待分析译文单词个数；

原文和待分析译文对空的单词个数；

原文和待分析译文中对齐的单词个数；

原文和待分析译文中对齐的单词比例；

原文和待分析译文中最长的连续对齐片段长度；

原文和待分析译文中最长的连续不对齐片段长度；

原文和待分析译文中排名前三位的单词繁殖率；

原文和待分析译文中单词个数比例；或

译文句子长短期记忆神经网络(LSTM)条件概率分值，

13.根据权利要求12所述的装置，其中，所述特征向量还包括以下中的一个或全部两个：

待分析译文的词汇-短语-句式的统计分析结果；或

待分析译文与参考答案的相似度。

14.根据权利要求13所述的装置，其中，所述待分析译文的词汇-短语-句式的统计分析结果包括以下项目中的任意一项或多项的组合：

词法和句法错误频次；

词汇多样性；

词汇等级分布；

词组、短语的使用频次；或

不定式、动名词、从句的使用频次。