CN106933813A

CN106933813A - 一种用于英语翻译的文本数据处理方法

Info

Publication number: CN106933813A
Application number: CN201710083766.4A
Authority: CN
Inventors: 张林影; 孙强
Original assignee: Mudanjiang Normal University
Current assignee: Mudanjiang Normal University
Priority date: 2017-02-16
Filing date: 2017-02-16
Publication date: 2017-07-07

Abstract

本发明公开了英语翻译技术领域的一种用于英语翻译的文本数据处理方法，该用于英语翻译的文本数据处理方法的具体步骤如下：S1：将待翻译的原始文本提取特征项，并建立布尔逻辑模型；S2：对步骤S1中提取的特征项进行分类，并将原始文本数据中除去特征项的语句存储至数据库中；S3：在数据库中将特征项连同非特征项的待翻译的语句进行翻译后输出，本发明通过对文本模型的建立，实现对待翻译的原始文本数据的处理，同时在数据库中预先存储需要特定翻译的语法知识，避免在翻译过程中出现的时态和语序的错误，本发明充分发挥了计算机翻译上的优势，大大减少了人工翻译的工作量，减少在翻译工作上的资金投入。

Description

一种用于英语翻译的文本数据处理方法

技术领域

本发明涉及英语翻译技术领域，具体为一种用于英语翻译的文本数据处理方法。

背景技术

随着国际交流的不断深入，对英语文件的翻译需求也越来越大，促使了一大批英语翻译的工具的出现，这些英语翻译工具通常分为在线版和本地版，而无论在线版和本地版都是在数据库中搜索译文进行翻译，这些翻译工具的出现极大的满足了用户的翻译需求，对提高翻译效率，推动社会进步作出了贡献。

而由于英语的语法、规则众多，翻译工具的数据库中不一定能够完全匹配到需要翻译的语句，基本上都是将待翻译的语句进行一对一的单词翻译，时态和语序经常发生错误，并且翻译生硬，达不到翻译中常说的信、达、雅的翻译要求。此时还需要有英语基础的用户进行逐句的校对，理顺语序，调整时态，根据自己的语法知识重新组织语言，这些对于英语基础差的用户来说就显得无能无力了。

请专业的翻译人员进行人工翻译是另一种对资料进行翻译的方法，只是目前请专业的翻译人员进行翻译还需要支付昂贵的佣金，并且需等待较长的时间，翻译人员的水平也参差不齐，翻译人员的主观意识也会对翻译结果产生影响，为此，我们提出了一种用于英语翻译的文本数据处理方法投入使用，以解决上述问题。

发明内容

本发明的目的在于提供一种用于英语翻译的文本数据处理方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：一种用于英语翻译的文本数据处理方法，该用于英语翻译的文本数据处理方法的具体步骤如下：

S1：将待翻译的原始文本提取特征项，并建立布尔逻辑模型，使待翻译的原始文本数据转变为计算机可识别的形式；

S2：对步骤S1中提取的特征项进行分类，并将原始文本数据中除去特征项的语句存储至数据库中；

S3：在数据库中将特征项连同非特征项的待翻译的语句进行翻译后输出。

优选的，所述步骤S1中，布尔逻辑模型以原始文本数据中的特征项作为判断标准，文本中有该特征项，则它的权重值为“1”，若无，则其权重值为“0”。

优选的，所述特征项为较难翻译及需要特定翻译的英语语法。

优选的，所述步骤S2中，数据库预先存储较难翻译及需要特定翻译的英语语法和中英词语对照表。

优选的，所述步骤S2中，在进行特征项的分类时，假设原始文本中有类别集合C＝{C₁，C₂，…，C_n}，待分类文本d＝{w₁，w₂，…，w₃}，实现对文本d的分类，转化成对p(c₁/d，c₂/d，…，c_n/d)的求解，若P(c_k|d)＝max{P(c₁|d)，P(c₂|d)，…，P(c_n|d)}，则d∈c_k，其计算公式如下：

其中，

与现有技术相比，本发明的有益效果是：本发明通过对文本模型的建立，实现对待翻译的原始文本数据的处理，将待翻译的原始文本数据转化为计算机能够识别的形式，同时在数据库中预先存储需要特定翻译的语法知识，避免在翻译过程中出现的时态和语序的错误，本发明充分发挥了计算机翻译上的优势，大大减少了人工翻译的工作量，减少在翻译工作上的资金投入。

附图说明

图1为本发明工作流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本发明提供一种技术方案：一种用于英语翻译的文本数据处理方法，该用于英语翻译的文本数据处理方法的具体步骤如下：

S1：将待翻译的原始文本提取特征项，并建立布尔逻辑模型，使待翻译的原始文本数据转变为计算机可识别的形式，布尔逻辑模型以原始文本数据中的特征项作为判断标准，文本中有该特征项，则它的权重值为“1”，若无，则其权重值为“0”，特征项为较难翻译及需要特定翻译的英语语法；

S2：对步骤S1中提取的特征项进行分类，并将原始文本数据中除去特征项的语句存储至数据库中，数据库预先存储较难翻译及需要特定翻译的英语语法和中英词语对照表，在进行特征项的分类时，假设原始文本中有类别集合C＝{C₁，C₂，…，C_n}，待分类文本d＝{w₁，w₂，…，w₃}，实现对文本d的分类，转化成对p(c₁/d，c₂/d，…，c_n/d)的求解，若P(c_k|d)＝max{P(c₁|d)，P(c₂|d)，…，P(c_n|d)}，则d∈c_k，其计算公式如下：

其中，

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种用于英语翻译的文本数据处理方法，其特征在于：该用于英语翻译的文本数据处理方法的具体步骤如下：

2.根据权利要求1所述的一种用于英语翻译的文本数据处理方法，其特征在于：所述步骤S1中，布尔逻辑模型以原始文本数据中的特征项作为判断标准，文本中有该特征项，则它的权重值为“1”，若无，则其权重值为“0”。

3.根据权利要求1和2所述的一种用于英语翻译的文本数据处理方法，其特征在于：所述特征项为较难翻译及需要特定翻译的英语语法。

4.根据权利要求1所述的一种用于英语翻译的文本数据处理方法，其特征在于：所述步骤S2中，数据库预先存储较难翻译及需要特定翻译的英语语法和中英词语对照表。

5.根据权利要求1所述的一种用于英语翻译的文本数据处理方法，其特征在于：所述步骤S2中，在进行特征项的分类时，假设原始文本中有类别集合C＝{C₁，C₂，…，C_n}，待分类文本d＝{w₁，w₂，…，w₃}，实现对文本d的分类，转化成对p(c₁/d，c₂/d，…，c_n/d)的求解，若P(c_k|d)＝max{P(c₁|d)，P(c₂|d)，…，P(c_n|d)}，则d∈c_k，其计算公式如下：

\begin{matrix} P (c_{j} | d) = \frac{P (c_{j}) P (d | c_{j})}{P (d)} = \frac{P (c_{j}) P (w_{1} | c_{j}) P (w_{2} | c_{j}) ... P (w_{n} | c_{j})}{P (d)} \\ = \frac{P (c_{j}) Π_{1}^{n} P (w_{n} | c_{j})}{P (d)} \end{matrix}

其中，