CN101923540A

CN101923540A - 语言翻译质量审核方法

Info

Publication number: CN101923540A
Application number: CN2010102342753A
Authority: CN
Inventors: 陈洁
Original assignee: Individual
Current assignee: Individual
Priority date: 2010-07-20
Filing date: 2010-07-20
Publication date: 2010-12-22

Abstract

本发明提供了一种语言翻译质量审核方法，该审核方法对被翻译的源语基于现有可信赖的众多翻译方法翻译形成一翻译比对库。分别将该翻译比对库中的各翻译句和待审核的目标语与根据源语生成的参照句进行基于范畴标识为基础结构的语义比较，计算出相应的语义差异度。并判断目标语与参照句的语义差异度是否在翻译比对库中各翻译句与参照句的语义差异度的范围之内，进而判断该翻译是否值得信赖，并提供对错误翻译的修改。这样的审核方法自动化和标准化程度高，是理想的翻译质量审核方法。

Description

语言翻译质量审核方法

技术领域

本发明涉及一种语言翻译质量的审核方法，特别是一种基于计算机程序设计的自动化、标准化的对语言翻译质量进行审核评估，甚至修改的语言审核方法，属于语言学及计算机科学技术领域。

背景技术

目前机器翻译的方法多样，其中应用较为普遍的是骨架依存树和块组方法。它们的核心都是分解句子结构及语义相似度计算。区别在于前者的结构单位是谓语中心词及其支配成分构成的整体，后者是功能性的语块，象主语块、谓语块等。

机器翻译输出的目标语是基于源语骨架或语块结构的语义对应。其前提是源语与目标语的句法结构相同或相近，也就是不同语种语言的共性问题。探索性地提出句子的骨架和语块便于计算机程序设计，易于实现。但骨架和块组的建构方法用于不同语种之间的语言转换仍有局限性。源语与目标语的个性问题，即差异性的句法和文法暂被忽略，或未就此提出系统完整的解决方案及实现方法。目前，仍然需要大量人工来进行翻译及审核工作，就是为了解决语言的个性问题。然而，这种通过人工进行翻译、审核的工作方式，不仅消耗大量人力资源，而且对翻译及审核的质量难以保证。

鉴于此，我们有必要设计一种基于计算机程序能够自动完成语言翻译质量审核工作的程序，并且基于该计算机程序的语言翻译质量审核工作是具有一致性审核质量保证的。

发明内容

本发明的发明目的在于提供一种基于计算机程序设计的自动化、标准化的对语言翻译质量进行审核评估的审核方法。

本发明的发明目的是通过下述技术方案予以实现的：

语言翻译质量审核方法，其特征在于：包括步骤如下：

(1)对所有源语和目标语标注范畴标识；

(2)对所有标注范畴标识后的源语和目标语拆分其范畴树图；

(3)根据所述源语生成参照句；

(4)对所述参照句和目标语进行语义相似度比较，根据各句子间的语义相似度值进行句子配对，以使目标语与其所翻译的对应源语相配对；

(5)基于可信赖的语言翻译工具，对所有源语进行翻译，生成翻译比对库；

(6)将目标语与所配对的参照句进行语句差异度评估，得到目标语对参照句的语句差异度评估值E₁；

(7)将翻译比对库中各个翻译句与所配对的参照句进行语句差异度评估，得到翻译比对库对参照句的语句差异度评估值集合{E₂}；

(8)判断所述E₁是否属于{E₂}，如果属于则认为该目标语的翻译是可信赖的，如果不属于则认为该目标语的翻译是不可信赖的。

在所述步骤(8)后还包括有对错误翻译的句子进行修改的步骤：

(9)当该目标语的翻译被判断为不可信赖后，从翻译比对库中任意选取一句对应翻译句替换该目标语，以对该错误翻译进行修改。

(9’)当该目标语的翻译被判断为不可信赖后，从翻译比对库中选取翻译比对库对参照句的语义差异度集合{E₂}中与目标语对参照句的语义差异度E₁最接近的一句对应翻译句替换该目标语，以对该错误翻译进行修改。

所述步骤(4)包括如下具体步骤：

(41)依据语义差异度计算公式依次计算目标语各句相对于参照句各句的语义差异度A₁；所述语义差异度计算公式为A₁(Sn，S′m)＝∑C_XSn*δ_XSn*DD_X(Sn，S′m)；

其中，A₁(Sn，S′m)表示目标语中第XS句相对于参照句中第S′m句的语义差异度，DD_X(Sn，S′m)表示目标语中第Sn句相对于参照句中第S′m句中第X对范畴标识之间的词汇语义变化幅度，δ_XSn表示在该对范畴标识中该目标语的范畴标识在该目标语句子中的重要性权重值，C_XSn表示在该对范畴标识对中该目标语的范畴标识在该目标语句子的范畴树图中的范畴层数权重值；

(42)依据语义差异度计算公式依次计算参照句各句相对于目标语各句的语义差异度A₂；所述语义差异度计算公式为A₂(S′m，Sn)＝∑C_YS′m*δ_YS′m*DD_Y(S′m，Sn)；

其中，A₂(S′m，Sn)表示参照句中第S′m句相对于目标语中第Sn句的语义差异度，DD_Y(S′m，Sn)表示参照句中第S′m句相对于目标语中第Sn句中第Y对范畴标识之间的词汇语义变化幅度，δ_YS′m表示在该对范畴标识对中该参照句的范畴标识在该参照句句子中的重要性权重值，C_YS′m表示在该对范畴标识对中该参照句的范畴标识在该参照句句子的范畴树图中的范畴层数权重值；

(43)根据步骤(41)和(42)所计算出的语义差异度A₁、A₂，按照公式A(Sn，S′m)＝(A₁(Sn，S′m)+A₂(S′m，Sn))/2计算目标语与参照句之间的平均语义差异度A(Sn，S′m)；

(44)从目标语中第一句开始选取参照句中与该句平均语义差异度最低的一句建立配对关系；

(45)目标语中的后续句子依次从参照句中与前一句进行配对的句子开始查找与该句平均语义差异度最低的一句建立配对关系，直至目标语结束，完成从目标语到参照句的句子配对过程。

所述步骤(3)的参照句生成过程具体如下：

(3)所述源语根据步骤(1)所标注的范畴标识，基于词典进行词汇的直接替换，从而生成参照句。

所述步骤(6)包括如下具体步骤：

(61)依据语义差异度计算公式依次计算目标语各句相对于所配对的参照句的语义差异度A_E1；所述语义差异度计算公式为A_E1(Sn，S′m)＝∑C_XSn*δ_XSn*DD_X(Sn，S′m)；

其中，A_E1(Sn，S′m)表示目标语中句子Sn相对于参照句中所配对句子S′m的语义差异度，DD_X(Sn，S′m)表示目标语中句子Sn相对于参照句中句子S′m中第X对范畴标识之间的词汇语义变化幅度，δ_XSn表示在该对范畴标识中该目标语的范畴标识在该目标语句子中的重要性权重值，C_XSn表示在该对范畴标识对中该目标语的范畴标识在该目标语句子的范畴树图中的范畴层数权重值；

(62)依据句式差异度计算公式依次计算目标语各句相对于所配对的参照句的句式差异度B_E1；所述句式差异度计算公式为

其中，B_E1(Sn，S′m)表示目标语中句子Sn相对于参照句中所配对句子S′m的句式差异度，δ_XSn表示在该对范畴标识中该目标语的范畴标识在该目标语句子中的重要性权重值，C_XSn表示在该对范畴标识对中该目标语的范畴标识在该目标语句子的范畴树图中的范畴层数权重值，C_XS′m表示在该对范畴标识对中该参照句的范畴标识在该源语句子的范畴树图中的范畴层数权重值，

表示将目标语中句子Sn相对于参照句中句子S′m中第X对范畴标识之间的范畴标识进行异或计算；

(63)根据步骤(61)、(62)所计算的语义差异度A_E1(Sn，S′m)和句式差异度B_E1(Sn，S′m)，得到目标语对参照句的语句差异度评估值E₁(Sn，S′m)＝(A_E1(Sn，S′m)，B_E1(Sn，S′m))。

所述步骤(7)包括如下具体步骤：

(71)依据语义差异度计算公式依次计算翻译比对库中各个翻译句相对于所配对的参照句的语义差异度{A_E2}；所述语义差异度计算公式为{A_E2(Sl，S′m)}＝{∑C_XSl*δ_XSl*DD_X(Sl，S′m)}；

其中，{A_E2(Sl，S′m)}表示翻译比对库中句子Sl相对于参照句中所配对句子S′m的语义差异度，DD_X(Sl，S′m)表示翻译比对库中句子Sl相对于参照句中句子S′m中第X对范畴标识之间的词汇语义变化幅度，δ_XSl表示在该对范畴标识中该翻译比对库中的范畴标识在其句子中的重要性权重值，C_XSl表示在该对范畴标识对中该翻译比对库中的范畴标识在其句子的范畴树图中的范畴层数权重值；

(72)依据句式差异度计算公式依次计算翻译比对库中各个翻译句相对于所配对的参照句的句式差异度{B_E2}；所述句式差异度计算公式为

其中，{B_E2(Sl，S′m)}表示翻译比对库中句子Sl相对于参照句中所配对句子S′m的句式差异度，δ_XSl表示在该对范畴标识中该翻译比对库中的范畴标识在其句子中的重要性权重值，C_XSl表示在该对范畴标识对中该翻译比对库中的范畴标识在其句子的范畴树图中的范畴层数权重值，C_XS′m表示在该对范畴标识对中该参照句的范畴标识在该源语句子的范畴树图中的范畴层数权重值，

表示将翻译比对库中句子Sl相对于参照句中句子S′m中第X对范畴标识之间的范畴标识进行异或计算；

(73)根据步骤(71)、(72)所计算的语义差异度{A_E2(Sl，S′m)}和句式差异度{B_E2(Sl，S′m)}，得到翻译比对库对参照句的语句差异度评估值集合{E₂(Sl，S′m)}＝{(A_E2(Sl，S′m)，B_E2(Sl，S′m))}。

所述步骤(8)的判断过程具体如下：

(81)人为给出语义差异度的允许变化范围值d_A和句式差异度的允许变化范围值d_B；

(82)判断目标语的语义差异度A_E1(Sn，S′m)是否在翻译比对库的语义差异度变化范围{A_E2(Sl，S′m)±d_A}之内；

(83)判断目标语的句式差异度B_E1(Sn，S′m)是否在翻译比对库的句式差异度变化范围{B_E2(Sl，S′m)±d_B}之内；

(84)根据步骤(82)、(83)的判断结果判断该目标语的翻译是否是可信赖的，如果步骤(82)、(83)均判断在变化范围之内，则认为该目标语的翻译是可信赖的，如果步骤(82)、(83)有任一步骤不被判断在变化范围之内，则认为该目标语的翻译是不可信赖的。

在所述步骤(4)和步骤(5)之间还包括如下句子处理步骤：

(a1)计算所述参照句中各个以范畴标识为单位的词汇与相配对目标语组中各个以范畴标识为单位的词汇语义变化幅度DD；

(a2)根据该词汇语义变化幅度DD将参照句中各个以范畴标识为单位的词汇按照相匹配的目标语组中的句子进行划分；

(a3)将划分后的词汇按照既有语法规则组织成新的独立句子；

(a4)将所组织的新的独立句子作为新的参照句与相配对的目标语建立配对关系。

在所述步骤(4)和步骤(5)之间还包括如下句子处理步骤：

(b1)将所述与目标句相匹配的多句源语中各个以范畴标识为单位的词汇按照语法规则组织成新的独立句子；

(b2)将所组织的新的独立句子作为新的参照句与相配对的目标语建立配对关系。

本发明的有益效果是：该语言翻译质量审核方法通过判断目标语与参照句的语义差异度是否在翻译比对库中各翻译句与参照句的语义差异度的范围之内，进而判断该翻译是否值得信赖。这样的审核方法自动化和标准化程度高，是理想的翻译质量审核方法。

附图说明

图1为语言翻译质量审核方法的流程图；

图2为句子配对方法流程图；

图3为目标语与参照句进行语句差异度评估的计算流程图；

图4为翻译比对库对参照句的语句差异度评估值的计算流程图；

图5(A)为源语的范畴树图；

图5(B)为目标语的范畴树图。

具体实施方式

下面结合附图和实施例对本发明作进一步描述。

如前所述，本发明是鉴于现有语言翻译质量审核工作主要有赖于人工工作方式，消耗大量人力资源，且翻译审核的质量难以保证，设计了一种基于计算机程序设计的自动化、标准化的对语言翻译质量进行审核评估的审核方法。

该审核方法的设计思想是对被翻译的源语基于现有可信赖的众多翻译方法翻译形成一翻译比对库。分别将该翻译比对库中的各翻译句和待审核的目标语与根据源语生成的参照句进行基于范畴标识为基础结构的语义比较，计算出相应的语义差异度。比较目标语与参照句的语义差异度是否在翻译比对库中各翻译句与参照句的语义差异度的范围之内。如果在该范围之内，则可认为该待审核的目标语是可信赖的翻译，如果不在该范围之内，则认为该待审核的目标语是不可信赖的翻译。

实施例一：

基于上述设计思想，参照图1所示本发明审核方法的流程图，本发明所设计的语言翻译质量审核方法的具体步骤如下：

(1)对所有源语和目标语标注范畴标识；

这里，所谓源语是指被翻译的原始文章，而所谓目标语是指待审核的翻译后文章。

如前所述，本发明所进行句子间的语义差异度比较是以范畴语法中的范畴标识为结构基础进行的。所谓范畴语法是1958年由数学家兰姆贝克(J.Lambek)在《句子结构的数学》中提出的一种句法类型演算理论。它是通过将一个句子中的各个成分以不同的符号进行表示，进而通过该符号串辨识该句子自然语言结构的演算理论。而范畴标识正是范畴语法中用以表示句法功用的符号。例如，S指句子，N指主语或宾语，S/N指不及物谓语，(S/N)/N指及物谓语等。由于，范畴语法是从句子自然语言结构上对句子结构进行划分的，因此该语法规则不限于某种具体的语言语法。在语言翻译审核过程中，正可以以这种范畴语法划分规则作为进行语义比较的结构基础。

另外，由于范畴语法现已是语言学中一种成熟的语法理论，基于该语法规则进行范畴标识标注的方法有很多。因此，在此就不再对范畴标识的标注方法做进一步详述。

(2)对所有标注范畴标识后的源语和目标语拆分其范畴树图；

参见图5，所谓范畴树图是范畴类型有穷个演算步骤的图示。尽管图示方法不一，但一般与树图同形。不同图示方法的主要区别在于层次方向的规定。有的自下而上为从具体到概括，有的则反向。这里采用的是越上层概括性越强，越下层具体性越强的方向。

(3)根据所述源语生成参照句；

所谓参照句是以源语所标注的范畴标识为结构基础，对各个范畴标识进行直接语言翻译所生成的句子。该参照句的主要目的是作为目标语和翻译比对库中的各个翻译句进行比较的参考依据。

这一步骤主要是通过句子间的语义相似度比较，确定目标文章中各个句子与源文章中各个句子间的对应关系，以自动实现目标语与其所翻译的对应源语的配对。

所述翻译比对库是通过已知可信赖的语言翻译工具对源语进行翻译的句子集合。通过这种方法生成的翻译比对库可以作为本发明翻译质量审核方法进行翻译质量审核的比对依据，用以确定翻译质量的可信范围。这里，所谓的可信赖的语言翻译工具可以是任意现有可信赖的翻译手法或既有应用程序，其规模范围可以由人为设定。在此就不再对其具体实现形式做进一步限定。

这里，由于翻译比对库是通过多种不同可信赖的翻译工具翻译生成的翻译句的集合，因此其与参照句进行语句差异度评估的结果也是一个集合。

通过上述具体步骤，本发明所设计的语言翻译质量审核方法通过分别计算目标语及可信赖的翻译比对库相对于作为参考的参照句的语句差异度评估，并进行相应比较判断，可以完成任意语言之间的翻译质量审核工作。并且，该翻译质量审核方法是基于计算机程序设计的，实现了自动化、标准化的审核过程。

在前述步骤的基础上，本发明还可以进一步包括有对错误翻译的句子进行修改的步骤，具体如下：

通过该步骤可以使此审核方法在对翻译文章的质量进行审核的同时，还对其中错误的翻译进行修改。为了使得所替换的翻译句与原目标语的翻译尽量贴合，该步骤(9)还可以采用下述步骤：

实施例二：

本实施例是在实施例一的基础上，对所述步骤(4)中的句子配对方法作进一步限定。如图2所示，所述步骤(4)包括如下具体步骤：

其中，A₁(Sn，S′m)表示目标语中第Sn句相对于参照句中第S′m句的语义差异度，DD_X(Sn，S′m)表示目标语中第Sn句相对于参照句中第S′m句中第X对范畴标识之间的词汇语义变化幅度，δ_XSn表示在该对范畴标识中该目标语的范畴标识在该目标语句子中的重要性权重值，C_XSn表示在该对范畴标识对中该目标语的范畴标识在该目标语句子的范畴树图中的范畴层数权重值。用户还可根据文体等需要增加其他的权重因素。

应当说明的是，该DD_X(Sn，S′m)目标语中第Sn句相对于参照句中第S′m句中第X对范畴标识之间的词汇语义变化幅度，是两个句子之间任意一对主要以范畴标识为基础的配对词汇或词组之间的语义变化幅度。而两个词汇或词组之间的语义变化幅度是可以基于现有语言学的词汇词义比较数据库以及语法检查技术给出的，即为现有技术。本发明只是借助于这一现有数据库进行的再利用，在此就不再对该数据库的构成作进一步描述。

δ_XSn范畴标识在句子中的重要性权重值。由于每个范畴标识在句子中的重要性并不相同。而进行翻译时，这些重要范畴标识的翻译准确性对整个句子的翻译质量起到更大的作用。因此，我们在进行语义差异度计算时引入了这部分的权重值。而这里范畴标识在句子中的重要性权重值可以按范畴类别主要对应的自然语句成分权重值而规定，也非本发明的设计重点。

C_XSn范畴标识在句子的范畴树图中的范畴层数权重值。如前步骤(2)所述，一个句子可以依范畴标识拆分为范畴树图。在该范畴树图较上层次的范畴标识在句子中也较为重要，而在范畴树图较下层次的范畴标识在句子中也较为次要。该范畴层数权重值通常用分数形式表示，例如在共有a层范畴标识的句子的第b层的范畴标识(a≥b)，其范畴层数权重值为(a-b+1)/a。

另外，应当指出所述语义差异度计算公式的值是有方向性的，即目标语相对于参照句的语义差异度，是以目标语为基础进行比较的。其公式中的C_XSn、δ_XSn都是基于该范畴标识对中在目标语中的范畴标识在目标语中的权重值决定的。

(42)依据语义差异度计算公式依次计算参照句各句相对于目标语各句的语义差异度A₂；所述语义差异度计算公式为A₂(S′m，Sn)＝∑C_YS′m*δ_YS′m*DDY(S′m，Sn)；

其中，A₂(S′m，Sn)表示参照句中第S′m句相对于目标语中第Sn句的语义差异度，DD_y(S′m，Sn)表示参照句中第S′m句相对于目标语中第Sn句中第Y对范畴标识之间的词汇语义变化幅度，δ_YS′m表示在该对范畴标识对中该参照句的范畴标识在该参照句句子中的重要性权重值，C_YS′m表示在该对范畴标识对中该参照句的范畴标识在该参照句句子的范畴树图中的范畴层数权重值。

该A(Sn，S′m)表示目标语中第Sn句与参照句中第S′m句的平均语义差异度。

这里，如果目标语的第一句并非与参照句的第一句建立配对关系，则将参照句中建立配对关系之前的句子指向空句，即认为漏翻这些句子。

实施例三：

本实施例是在实施例一的基础上，对所述步骤(3)中的参照句的生成过程作进一步限定。所述步骤(3)的参照句生成过程具体如下：

这里，源语以其范畴标识标注的最小集合进行词汇或词组的直接替换。如果遇到同义词或近义词则直接将一组同义词或近义词同时对该范畴标识进行替换。如前所述，这里所生成的参照句只是作为目标语和翻译比对库中的各个翻译句进行比较的参考依据，因此在其生成过程中并不需要参考任何语言的语法规则，只要直接进行词汇替换即可。

实施例四：

本实施例是在实施例一的基础上，对所述步骤(6)、(7)中目标语及翻译比对库与所配对的参照句进行语句差异度评估的过程作进一步限定。该语句差异度的评估主要包括两部分，一部分为语义差异度计算，另一部分为句式差异度计算。对于语句差异度的评估是基于这两方面所做的综合比较，具体如下：

如图3所示，所述步骤(6)包括如下具体步骤：

其中，A_E1(Sn，S′m)表示目标语中句子Sn相对于参照句中所配对句子S′m的语义差异度，DD_X(Sn，S′m)表示目标语中句子Sn相对于参照句中句子S′m中第X对范畴标识之间的词汇语义变化幅度，δ_XSn表示在该对范畴标识中该目标语的范畴标识在该目标语句子中的重要性权重值，C_XSn表示在该对范畴标识对中该目标语的范畴标识在该目标语句子的范畴树图中的范畴层数权重值。

其中，B_E1(Sn，S′m)表示目标语中句子Sn相对于参照句中所配对句子S′m的句式差异度，δ_XSn表示在该对范畴标识中该目标语的范畴标识在该目标语句子中的重要性权重值，C_XSn表示在该对范畴标识对中该目标语的范畴标识在该目标语句子的范畴树图中的范畴层数权重值，C_XS′m表示在该对范畴标识对中该参照句的范畴标识在该源语句子的范畴树图中的范畴层数权重值，表示将目标语中句子Sn相对于参照句中句子S′m中第X对范畴标识之间的范畴标识进行异或计算，即该对范畴标识相同为0，不相同为1。用户还可根据文体需要增加其他的权重因素。

从上面所述句式差异度计算公式可以看出，句式差异度计算主要是通过对应范畴标识的本身属性比较和其所在句子的范畴树图中的范畴层数差异比较进行综合判断的，并辅以该范畴标识重要性和范畴层数的权重值加权。不难看出，通过这样的句式差异度计算公式计算，其计算结果越小说明其句式的相似度越大。

这里，该语句差异度评估值E₁(Sn，S′m)为由语义差异度A_E1(Sn，S′m)和句式差异度B_E1(Sn，S′m)共同构成的二元参数。

如图4所示，所述步骤(7)包括如下具体步骤：

其中，{A_E2(Sl，S′m)}表示翻译比对库中句子Sl相对于参照句中所配对句子S′m的语义差异度，DD_Y(Sl，S′m)表示翻译比对库中句子Sl相对于参照句中句子S′m中第X对范畴标识之间的词汇语义变化幅度，δ_XSl表示在该对范畴标识中该翻译比对库中的范畴标识在其句子中的重要性权重值，C_XSl表示在该对范畴标识对中该翻译比对库中的范畴标识在其句子的范畴树图中的范畴层数权重值。

其中，{B_E2(Sl，S′m)}表示翻译比对库中句子Sl相对于参照句中所配对句子S′m的句式差异度，δ_XSl表示在该对范畴标识中该翻译比对库中的范畴标识在其句子中的重要性权重值，C_XSl表示在该对范畴标识对中该翻译比对库中的范畴标识在其句子的范畴树图中的范畴层数权重值，C_XS′m表示在该对范畴标识对中该参照句的范畴标识在该源语句子的范畴树图中的范畴层数权重值，表示将翻译比对库中句子Sl相对于参照句中句子S′m中第X对范畴标识之间的范畴标识进行异或计算，即该对范畴标识相同为0，不相同为1。

这里，该语句差异度评估值集合{E₂(Sl，S′m)}为由语义差异度{A_E2(Sl，S′m)}和句式差异度{B_E2(Sl，S′m)}共同构成的二元参数集合。

实施例五：

本实施例是在实施例四的基础上，对所述步骤(8)中的判断过程作进一步限定。所述步骤(8)的判断过程具体如下：

(81)有人为给出语义差异度的允许变化范围值d_A和句式差异度的允许变化范围值d_B；

上述判断原则还可以用逻辑计算式表示为：

此计算式结果为1，则认为该目标语的翻译是可信赖的，计算是结果为0，则认为该目标语的翻译是不可信赖的。

在翻译过程中，由于语言习惯不同，可能会出现一句翻译成多句，或是多句被翻译成一句的情况。针对这种并非一一对应翻译的情况，本发明设计了一下几种处理方法。

实施例六：

针对步骤(4)句子配对后出现一句源语与多句目标语相配对的情况，本实施例在第一实施例的基础上，在所述步骤(4)和步骤(5)之间还包括如下句子处理步骤：

这里所述词汇语义变化幅度DD与前面所述语义差异度计算公式中的词汇语义变化幅度相同，在此就不再重复介绍。

(a3)将划分后的词汇按照既有语法规则组织成新的独立句子；

这里，基于现有的语言学方法将一些散乱的词汇按照语法规则组织成符合语法规则的完整句子是可以实现的。在这里我们就不再介绍其实现方法。

通过上述步骤，我们将源语长句拆分成若干句与目标句相配对的参照句，从而建立了参照句与目标句之间的一一对应关系，以方便进行比较审核。应当指出，后续步骤(5)的翻译比对库生成过程中也将已上述所新组织成的独立句子为标准，生成翻译比对库。

实施例七：

针对步骤(4)句子配对后出现多句源语与一句目标语相配对的情况，本实施例在第一实施例的基础上，在所述步骤(4)和步骤(5)之间还包括如下句子处理步骤：

通过上述步骤，我们将多句源语合并成一句与目标句相配对的参照句，从而建立了参照句与目标句之间的一一对应关系，以方便进行比较审核。应当指出，后续步骤(5)的翻译比对库生成过程中也将以上述所新组织成的独立句子为标准，生成翻译比对库。

下面以两个具体翻译审核实例对上述语言翻译质量审核方法做进一步说明。

实例一

该实例的英文源语为：Neither the United States nor China is contentto rest on our achievements.(选自美国总统奥巴马2009年11月16日在上海与中国青年的对话)。该源语的中文目标语为：无论美国还是中国，是休息的内容，我们的成就。

步骤(1)我们对英文源语和目标语标注范畴标识：

源语范畴标识：

Neither the United States nor China is content to

S/S N S/S N S/N (S/N)/(S/N) S/S

rest on our achievements.

(S/N)/N N/N N

目标语范畴标识：

无论美国还是中国，是休息的内容，我们的成就。

S/S N S/S N (S/N)/N N/N N N/N N

在范畴标识中：

S指句子。

N指名称，对应自然语言中的名词，语法成分中的主语和宾语。

S/N一般对应自然语言中的不及物动词。

(S/N)/N一般对应自然语言中的及物动词。

S/S在形式语言中的定义是“具有句中造句功能的范畴，象‘必要地’、‘可能地’以及其他模态运算符(modal operator)都属于这类范畴”(第134页，《Logic in Linguistics》，牛津大学出版社1977年首次出版，作者Jens Allwood等)。例句中如果没有neither...nor，那么‘the US andChina are content to rest on our achievements’是一个完整的句子S。在S中加了neither...nor以后，句义增加了，又形成一个句子S，但S是一个句子的属性未变，因此具备这类功能的词汇记做S/S。

例句中以to开头的不定式补语to rest on our achievement修饰content。如果删掉此不定式补语，则剩余部分仍是完整句子，因此在拆分不定式短语前，将to的标识记做S/S。

S/SS具有将两句连为一句的功能，一般对应自然语言中连接句子的连词等虚词。

(S/N)/(S/N)指修饰不及物动词，但未改变动词的不及物属性的范畴。例如源语句中的content修饰偏向不及物动词属性的表语is(其功能和词义类似于feel)。其偏向不及物动词的属性使其和前面的N组成句子，因此is的功用是S/N。而在is后加了content后，句义增加了，而is偏向不及物动词属性不变，仍是S/N，因此具备这类功能的词汇记做(S/N)/(S/N)。

N/N一般对应指自然语言中修饰名称的形容词、名词等。

范畴标识中的连接符可以从右上向左下“/”偏，表示前面的词汇修饰后面的词汇。也可记做从左上向右下偏“\”，表示后面的词汇修饰前面的词汇。

步骤(2)将上述标注范畴标识后的源语和目标语分别拆分为如图5(A)、(B)所示的范畴树图。其中，图5(A)为源语的范畴树图，图5(B)为目标语的范畴树图。

步骤(3)根据步骤(1)所标注的范畴标识，基于词典对源语生成参照句为：既不|美国|也不|中国|是|满足|[

于]|依赖|我们的|成就。

(注：[

于]表示to可以不翻，也可译为“于”，译项的词义范围涵盖自

至“于”的词义区间。)

步骤(4)根据目标语相对于参照句的语义差异度A₁计算公式A₁(Sn，S′m)＝∑C_XSn*δ_XSn*DD_X(Sn，S′m)，计算语义差异度A₁＝0.796。

根据参照句相对于目标语的语义差异度A₂计算公式A₂(S′m，Sn)＝∑C_YS′m*δ_YS′m*DD_Y(S′m，Sn)，计算语义差异度A₂＝0.957。

据此得出目标语与源语之间的配对关系。由于此例子为一对一翻译，所以不存在具体配对关系问题。

步骤(5)基于可信赖的语言翻译工具，对所有源语进行翻译，生成翻译比对库为：

1)美国|(和)|中国|(都不)|满足|(于)|[依赖)|我们的成就。

2)(无论)|美国|(还是)|中国|(对)|[

依赖)|我们的成就|(都不)|(感到)|满足。

(注：[

依赖)表示rest on可以不翻，也可译为“依赖”，还可译为词义权重值低于“依赖”的译项，因此rest on译项的词义范围涵盖自至但不限于“依赖”词项的词义区间。)

该翻译比对库是依据审核要求所采用的可信赖翻译方法而生成的。这里只是以此两句翻译作为翻译比对库示意。

步骤(6)

依据语义差异度计算公式A_E1(Sn，S′m)＝∑C_XSn*δ_XSn*DD_X(Sn，S′m)依次计算目标语各句相对于所配对的参照句的语义差异度A_E1为0.796。依据句式差异度计算公式

依次计算目标语各句相对于所配对的参照句的句式差异度B_E1为2.683。从而得出目标语对参照句的语句差异度评估值E₁(Sn，S′m)＝(A_E1(Sn，S′m)，B_E1(Sn，S′m))＝(0.796，2.683)。

步骤(7)

依据语义差异度计算公式{A_E2(Sl，S′m)}＝{∑C_XSl*δ_XSl*DD_X(Sl，S′m)}依次计算翻译比对库中各个翻译句相对于所配对的参照句的语义差异度{A_E2}为{(1.371，1.660]，(1.518，1.792]}。依据句式差异度计算公式

依次计算翻译比对库中各个翻译句相对于所配对的参照句的句式差异度{B_E2}为{(1.673，1.710]，(1.503，1.532]}。从而得到翻译比对库对参照句的语句差异度评估值集合{E₂(Sl，S′m)}＝{(A_E2(Sl，S′m)，B_E2(Sl，S′m))}＝{((1.371，1.660]，(1.673，1.710])，((1.518，1.792]，(1.503，1.532])}。

步骤(8)由于E₁为(0.796，2.683)，{E₂}为{((1.371，1.660]，(1.673，1.710])，((1.518，1.792]，(1.503，1.532])}，E₁不属于{E₂}，由此判断目标语不可信赖。

这样我们就根据本发明所设计的语言翻译质量审核方法对上述实例的翻译质量完成了自动化、标准化程度高的审核工作。

综上所述，本发明所设计的语言翻译质量审核方法对被翻译的源语基于现有可信赖的众多翻译方法翻译形成一翻译比对库。分别将该翻译比对库中的各翻译句和待审核的目标语与根据源语生成的参照句进行基于范畴标识为基础结构的语义比较，计算出相应的语义差异度。并判断目标语与参照句的语义差异度是否在翻译比对库中各翻译句与参照句的语义差异度的范围之内，进而判断该翻译是否值得信赖，并提供对错误翻译的修改。这样的审核方法自动化和标准化程度高，很好的解决了现有技术中存在的问题。本领域一般技术人员在此设计思想之下所作任何不具有创造性的改造均应视为在本发明的保护范围之内。

Claims

1.语言翻译质量审核方法，其特征在于：包括步骤如下：

(1)对所有源语和目标语标注范畴标识；

(2)对所有标注范畴标识后的源语和目标语拆分其范畴树图；

(3)根据所述源语生成参照句；

2.如权利要求1所述的语言翻译质量审核方法，其特征在于：在所述步骤(8)后还包括有对错误翻译的句子进行修改的步骤：

3.如权利要求1所述的语言翻译质量审核方法，其特征在于：在所述步骤(8)后还包括有对错误翻译的句子进行修改的步骤：

4.如权利要求1所述的语言翻译质量审核方法，其特征在于：所述步骤(4)包括如下具体步骤：

其中，A₁(Sn，S′m)表示目标语中第Sn句相对于参照句中第S′m句的语义差异度，DD_X(Sn，S′m)表示目标语中第Sn句相对于参照句中第S′m句中第X对范畴标识之间的词汇语义变化幅度，δ_XSn表示在该对范畴标识中该目标语的范畴标识在该目标语句子中的重要性权重值，C_XSn表示在该对范畴标识对中该目标语的范畴标识在该目标语句子的范畴树图中的范畴层数权重值；

5.如权利要求1所述的语言翻译质量审核方法，其特征在于：所述步骤(3)的参照句生成过程具体如下：

6.如权利要求1所述的语言翻译质量审核方法，其特征在于：所述步骤(6)包括如下具体步骤：

其中，B_E1(Sn，S′m)表示目标语中句子Sn相对于参照句中所配对句子S′m的句式差异度，δ_XSn表示在该对范畴标识中该目标语的范畴标识在该目标语句子中的重要性权重值，C_XSn表示在该对范畴标识对中该目标语的范畴标识在该目标语句子的范畴树图中的范畴层数权重值，C_XS′m表示在该对范畴标识对中该参照句的范畴标识在该源语句子的范畴树图中的范畴层数权重值，表示将目标语中句子Sn相对于参照句中句子S′m中第X对范畴标识之间的范畴标识进行异或计算；

7.如权利要求1所述的语言翻译质量审核方法，其特征在于：所述步骤(7)包括如下具体步骤：

(73)根据步骤(71)、(72)所计算的语义差异度{A_E2(Sl，S′m)}和句式差异度{B_E2(Sl，S′m)}，得到翻译比对库对参照句的语句差异度评估值集合{E₂(Sl，Sm)}＝{(A_E2(Sl，S′m)，B_E2(Sl，S′m))}。

8.如权利要求6和7所述的语言翻译质量审核方法，其特征在于：所述步骤(8)的判断过程具体如下：

(82)判断目标语的语义差异度A_E1(Sn，S′m)是否在翻译比对库的语义差异度变化范围{A_B2(Sl，S′m)±d_A}之内；

9.如权利要求1所述的语言翻译质量审核方法，其特征在于：在所述步骤(4)和步骤(5)之间还包括如下句子处理步骤：

(a3)将划分后的词汇按照既有语法规则组织成新的独立句子；

10.如权利要求1所述的语言翻译质量审核方法，其特征在于：在所述步骤(4)和步骤(5)之间还包括如下句子处理步骤：