CN109840330A

CN109840330A - 一种用于英语翻译的文本数据处理方法

Info

Publication number: CN109840330A
Application number: CN201910030908.XA
Authority: CN
Inventors: 卢艳阳
Original assignee: Hunan City University
Current assignee: Hunan City University
Priority date: 2019-01-14
Filing date: 2019-01-14
Publication date: 2019-06-04

Abstract

本发明公开了一种用于英语翻译的文本数据处理方法，通过翻译系统实施，所述翻译系统包括用户登录模块、数据采集模块、数据输入模块、数据库、文字识别模块、情绪识别模块、处理模块、输出模块、显示模块和发声模块，其数据处理方法包括以下步骤，S1，建立包含英语库和汉语库的数据库，通过处理模块对数据库内的词汇、语法进行建模分类管理，并生成相应的源代码库，源代码库包括文字源代码库和语音源代码库。本发明对数据库内信息生成源代码，对输入需要翻译的数据生成根代码，通过根代码与源代码进匹配，可快速查找需要翻译成的信息，提高翻译速度，赋予翻译后的语音属于发言者的情绪，使翻译后的词句更加贴合当前发声人的真实意思。

Description

一种用于英语翻译的文本数据处理方法

技术领域

本发明涉及数据处理技术领域，尤其涉及一种用于英语翻译的文本数据处理方法。

背景技术

随着国际交流的不断深入，对英语文件的翻译需求也越来越大，促使了一大批英语翻译工具的出现，这些英语翻译工具通常分为在线版和本地版，而无论在线版还是本地版都是在数据库中搜索译文进行翻译，这些翻译工具的出现极大的满足了用户的翻译需求，对提高翻译效率，推动社会进步作出了贡献。

英语翻译通常为英语翻译成汉语和汉语翻译成英语，中国文化博大精深，相同的汉语文字配合不同的语气词能够表达出不同的意义，因此现有的翻译不能完全将汉语中的寓含的意义完全通过英文表达出来。

发明内容

基于背景技术存在的技术问题，本发明提出了一种用于英语翻译的文本数据处理方法。

本发明提出的一种用于英语翻译的文本数据处理方法，通过翻译系统实施，所述翻译系统包括用户登录模块、数据采集模块、数据输入模块、数据库、文字识别模块、情绪识别模块、处理模块、输出模块、显示模块和发声模块，其数据处理方法包括以下步骤：

S1：建立包含英语库和汉语库的数据库，通过处理模块对数据库内的词汇、语法进行建模分类管理，并生成相应的源代码库，源代码库包括文字源代码库和语音源代码库；

S2：通过用户登录模块注册登录后，用户将需要翻译的文本通过数据输入模块输入处理模块内，文本输入包括图片输入、文档输入和语音输入，用户选择需要的翻译模式，翻译模式包括英译汉和汉译英；

S3：处理模块通过文字识别模块识别所述文本中的文字信息，并生成根代码，处理模块根据根代码查找数据库内与跟代码相匹配的源代码，处理模块依据翻译模式依次选中数据库中的源代码信息；

S4：被选中的源代码被处理模块输入输出模块中，输出模块包括可供用户选择的文字输出、语音输出和文字语音共同输出的三种输出模式，使用文字输入对文字输出翻译过程中用户选择文字输出模块后，输出模块将源代码转换为文字进行输出，并通过显示模块显示翻译后的文字；

S5：涉及语音输入和语音输出的翻译过程中，用户需通过情绪识别模块选择发声人当前情绪状态，赋予语音情绪状态，如喜、怒、哀、乐、悲、恐、惊的情绪状态，处理模块根据被赋予的情绪状态挑选出符合当前选定的情绪状态的词汇进行组合，通过发声模块输出语音。

优选地，所述数据采集模块包括摄像头、语音输入器和USB连接口，通过摄像头采集图片上的文字、通过USB连接口采集文档上的文字和通过语音输入器采集语音，数据采集模块将从图片、文档和语音中采集到的文字信息输入识别模块内。

优选地，所述英语库包括英语词汇子库和英语语法子库，且汉语库包括汉语词汇子库、汉语语法子库、汉语成语子库、汉语典故子库和情绪语气子库。

优选地，所述英语词汇子库、英语语法子库、汉语词汇子库和汉语语法子库均经处理模块转换为源代码，并分别对英语词汇子库和汉语词汇子库所生成的源代码中蕴含情绪含义的词汇进行分类为情绪源代码。

优选地，所述汉语成语子库和汉语典故子库均经处理模块转换为汉语释义，汉语释义经处理模块拆分为多组汉语词汇，并对该多组汉语词汇的源代码按照顺序进行组合为合并源代码，汉语成语或汉语典故翻译为英语时以汉语释义所形成的合并源代码。

优选地，所述英语词汇子库、英语语法子库、汉语词汇子库、汉语语法子库、汉语成语子库、汉语典故子库和情绪语气子库均生成文字源代码和语音源代码，文字源代码存储于文字源代码库，语音源代码存储于语音源代码库，且相同文字信息的生成的文字源代码与语音源代码不同。

本发明的有益效果为：

1、通过对数据库中存储的英语库数据和英语库数据生成源代码，对输入需要翻译的数据生成根代码，通过根代码与源代码进行匹配，可快速查找需要翻译成的信息，提高翻译速度；

2、通过对语音输入者的情绪状态进行选择，，通过情绪语气子库中的情绪词汇与普通的词汇进行组合，可赋予翻译后的语音部分属于发言者的情绪，使翻译后的词句更加符合当前发声人的情绪表达，翻译后的词句更加贴合当前发声人的真实意思。

具体实施方式

下面对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。

实施例1，一种用于英语翻译的文本数据处理方法，通过翻译系统实施，所述翻译系统包括用户登录模块、数据采集模块、数据输入模块、数据库、文字识别模块、情绪识别模块、处理模块、输出模块、显示模块和发声模块，其数据处理方法包括以下步骤：

本发明中，所述数据采集模块包括摄像头、语音输入器和USB连接口，通过摄像头采集图片上的文字、通过USB连接口采集文档上的文字和通过语音输入器采集语音，数据采集模块将从图片、文档和语音中采集到的文字信息输入识别模块内。

本发明中，所述英语库包括英语词汇子库和英语语法子库，且汉语库包括汉语词汇子库、汉语语法子库、汉语成语子库、汉语典故子库和情绪语气子库。

本发明中，所述英语词汇子库、英语语法子库、汉语词汇子库和汉语语法子库均经处理模块转换为源代码，并分别对英语词汇子库和汉语词汇子库所生成的源代码中蕴含情绪含义的词汇进行分类为情绪源代码。

本发明中，所述汉语成语子库和汉语典故子库均经处理模块转换为汉语释义，汉语释义经处理模块拆分为多组汉语词汇，并对该多组汉语词汇的源代码按照顺序进行组合为合并源代码，汉语成语或汉语典故翻译为英语时以汉语释义所形成的合并源代码。

本发明中，所述英语词汇子库、英语语法子库、汉语词汇子库、汉语语法子库、汉语成语子库、汉语典故子库和情绪语气子库均生成文字源代码和语音源代码，文字源代码存储于文字源代码库，语音源代码存储于语音源代码库，且相同文字信息的生成的文字源代码与语音源代码不同。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种用于英语翻译的文本数据处理方法，通过翻译系统实施，其特征在于，所述翻译系统包括用户登录模块、数据采集模块、数据输入模块、数据库、文字识别模块、情绪识别模块、处理模块、输出模块、显示模块和发声模块，其数据处理方法包括以下步骤：

2.根据权利要求1所述的一种用于英语翻译的文本数据处理方法，其特征在于，所述数据采集模块包括摄像头、语音输入器和USB连接口，通过摄像头采集图片上的文字、通过USB连接口采集文档上的文字和通过语音输入器采集语音，数据采集模块将从图片、文档和语音中采集到的文字信息输入识别模块内。

3.根据权利要求1所述的一种用于英语翻译的文本数据处理方法，其特征在于，所述英语库包括英语词汇子库和英语语法子库，且汉语库包括汉语词汇子库、汉语语法子库、汉语成语子库、汉语典故子库和情绪语气子库。

4.根据权利要求3所述的一种用于英语翻译的文本数据处理方法，其特征在于，所述英语词汇子库、英语语法子库、汉语词汇子库和汉语语法子库均经处理模块转换为源代码，并分别对英语词汇子库和汉语词汇子库所生成的源代码中蕴含情绪含义的词汇进行分类为情绪源代码。

5.根据权利要求3所述的一种用于英语翻译的文本数据处理方法，其特征在于，所述汉语成语子库和汉语典故子库均经处理模块转换为汉语释义，汉语释义经处理模块拆分为多组汉语词汇，并对该多组汉语词汇的源代码按照顺序进行组合为合并源代码，汉语成语或汉语典故翻译为英语时以汉语释义所形成的合并源代码。

6.根据权利要求3所述的一种用于英语翻译的文本数据处理方法，其特征在于，所述英语词汇子库、英语语法子库、汉语词汇子库、汉语语法子库、汉语成语子库、汉语典故子库和情绪语气子库均生成文字源代码和语音源代码，文字源代码存储于文字源代码库，语音源代码存储于语音源代码库，且相同文字信息的生成的文字源代码与语音源代码不同。