CN109840330A - 一种用于英语翻译的文本数据处理方法 - Google Patents

一种用于英语翻译的文本数据处理方法 Download PDF

Info

Publication number
CN109840330A
CN109840330A CN201910030908.XA CN201910030908A CN109840330A CN 109840330 A CN109840330 A CN 109840330A CN 201910030908 A CN201910030908 A CN 201910030908A CN 109840330 A CN109840330 A CN 109840330A
Authority
CN
China
Prior art keywords
text
source code
chinese
module
word bank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910030908.XA
Other languages
English (en)
Inventor
卢艳阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan City University
Original Assignee
Hunan City University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan City University filed Critical Hunan City University
Priority to CN201910030908.XA priority Critical patent/CN109840330A/zh
Publication of CN109840330A publication Critical patent/CN109840330A/zh
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种用于英语翻译的文本数据处理方法,通过翻译系统实施,所述翻译系统包括用户登录模块、数据采集模块、数据输入模块、数据库、文字识别模块、情绪识别模块、处理模块、输出模块、显示模块和发声模块,其数据处理方法包括以下步骤,S1,建立包含英语库和汉语库的数据库,通过处理模块对数据库内的词汇、语法进行建模分类管理,并生成相应的源代码库,源代码库包括文字源代码库和语音源代码库。本发明对数据库内信息生成源代码,对输入需要翻译的数据生成根代码,通过根代码与源代码进匹配,可快速查找需要翻译成的信息,提高翻译速度,赋予翻译后的语音属于发言者的情绪,使翻译后的词句更加贴合当前发声人的真实意思。

Description

一种用于英语翻译的文本数据处理方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一种用于英语翻译的文本数据处理方法。
背景技术
随着国际交流的不断深入,对英语文件的翻译需求也越来越大,促使了一大批英语翻译工具的出现,这些英语翻译工具通常分为在线版和本地版,而无论在线版还是本地版都是在数据库中搜索译文进行翻译,这些翻译工具的出现极大的满足了用户的翻译需求,对提高翻译效率,推动社会进步作出了贡献。
英语翻译通常为英语翻译成汉语和汉语翻译成英语,中国文化博大精深,相同的汉语文字配合不同的语气词能够表达出不同的意义,因此现有的翻译不能完全将汉语中的寓含的意义完全通过英文表达出来。
发明内容
基于背景技术存在的技术问题,本发明提出了一种用于英语翻译的文本数据处理方法。
本发明提出的一种用于英语翻译的文本数据处理方法,通过翻译系统实施,所述翻译系统包括用户登录模块、数据采集模块、数据输入模块、数据库、文字识别模块、情绪识别模块、处理模块、输出模块、显示模块和发声模块,其数据处理方法包括以下步骤:
S1:建立包含英语库和汉语库的数据库,通过处理模块对数据库内的词汇、语法进行建模分类管理,并生成相应的源代码库,源代码库包括文字源代码库和语音源代码库;
S2:通过用户登录模块注册登录后,用户将需要翻译的文本通过数据输入模块输入处理模块内,文本输入包括图片输入、文档输入和语音输入,用户选择需要的翻译模式,翻译模式包括英译汉和汉译英;
S3:处理模块通过文字识别模块识别所述文本中的文字信息,并生成根代码,处理模块根据根代码查找数据库内与跟代码相匹配的源代码,处理模块依据翻译模式依次选中数据库中的源代码信息;
S4:被选中的源代码被处理模块输入输出模块中,输出模块包括可供用户选择的文字输出、语音输出和文字语音共同输出的三种输出模式,使用文字输入对文字输出翻译过程中用户选择文字输出模块后,输出模块将源代码转换为文字进行输出,并通过显示模块显示翻译后的文字;
S5:涉及语音输入和语音输出的翻译过程中,用户需通过情绪识别模块选择发声人当前情绪状态,赋予语音情绪状态,如喜、怒、哀、乐、悲、恐、惊的情绪状态,处理模块根据被赋予的情绪状态挑选出符合当前选定的情绪状态的词汇进行组合,通过发声模块输出语音。
优选地,所述数据采集模块包括摄像头、语音输入器和USB连接口,通过摄像头采集图片上的文字、通过USB连接口采集文档上的文字和通过语音输入器采集语音,数据采集模块将从图片、文档和语音中采集到的文字信息输入识别模块内。
优选地,所述英语库包括英语词汇子库和英语语法子库,且汉语库包括汉语词汇子库、汉语语法子库、汉语成语子库、汉语典故子库和情绪语气子库。
优选地,所述英语词汇子库、英语语法子库、汉语词汇子库和汉语语法子库均经处理模块转换为源代码,并分别对英语词汇子库和汉语词汇子库所生成的源代码中蕴含情绪含义的词汇进行分类为情绪源代码。
优选地,所述汉语成语子库和汉语典故子库均经处理模块转换为汉语释义,汉语释义经处理模块拆分为多组汉语词汇,并对该多组汉语词汇的源代码按照顺序进行组合为合并源代码,汉语成语或汉语典故翻译为英语时以汉语释义所形成的合并源代码。
优选地,所述英语词汇子库、英语语法子库、汉语词汇子库、汉语语法子库、汉语成语子库、汉语典故子库和情绪语气子库均生成文字源代码和语音源代码,文字源代码存储于文字源代码库,语音源代码存储于语音源代码库,且相同文字信息的生成的文字源代码与语音源代码不同。
本发明的有益效果为:
1、通过对数据库中存储的英语库数据和英语库数据生成源代码,对输入需要翻译的数据生成根代码,通过根代码与源代码进行匹配,可快速查找需要翻译成的信息,提高翻译速度;
2、通过对语音输入者的情绪状态进行选择,,通过情绪语气子库中的情绪词汇与普通的词汇进行组合,可赋予翻译后的语音部分属于发言者的情绪,使翻译后的词句更加符合当前发声人的情绪表达,翻译后的词句更加贴合当前发声人的真实意思。
具体实施方式
下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
实施例1,一种用于英语翻译的文本数据处理方法,通过翻译系统实施,所述翻译系统包括用户登录模块、数据采集模块、数据输入模块、数据库、文字识别模块、情绪识别模块、处理模块、输出模块、显示模块和发声模块,其数据处理方法包括以下步骤:
S1:建立包含英语库和汉语库的数据库,通过处理模块对数据库内的词汇、语法进行建模分类管理,并生成相应的源代码库,源代码库包括文字源代码库和语音源代码库;
S2:通过用户登录模块注册登录后,用户将需要翻译的文本通过数据输入模块输入处理模块内,文本输入包括图片输入、文档输入和语音输入,用户选择需要的翻译模式,翻译模式包括英译汉和汉译英;
S3:处理模块通过文字识别模块识别所述文本中的文字信息,并生成根代码,处理模块根据根代码查找数据库内与跟代码相匹配的源代码,处理模块依据翻译模式依次选中数据库中的源代码信息;
S4:被选中的源代码被处理模块输入输出模块中,输出模块包括可供用户选择的文字输出、语音输出和文字语音共同输出的三种输出模式,使用文字输入对文字输出翻译过程中用户选择文字输出模块后,输出模块将源代码转换为文字进行输出,并通过显示模块显示翻译后的文字;
S5:涉及语音输入和语音输出的翻译过程中,用户需通过情绪识别模块选择发声人当前情绪状态,赋予语音情绪状态,如喜、怒、哀、乐、悲、恐、惊的情绪状态,处理模块根据被赋予的情绪状态挑选出符合当前选定的情绪状态的词汇进行组合,通过发声模块输出语音。
本发明中,所述数据采集模块包括摄像头、语音输入器和USB连接口,通过摄像头采集图片上的文字、通过USB连接口采集文档上的文字和通过语音输入器采集语音,数据采集模块将从图片、文档和语音中采集到的文字信息输入识别模块内。
本发明中,所述英语库包括英语词汇子库和英语语法子库,且汉语库包括汉语词汇子库、汉语语法子库、汉语成语子库、汉语典故子库和情绪语气子库。
本发明中,所述英语词汇子库、英语语法子库、汉语词汇子库和汉语语法子库均经处理模块转换为源代码,并分别对英语词汇子库和汉语词汇子库所生成的源代码中蕴含情绪含义的词汇进行分类为情绪源代码。
本发明中,所述汉语成语子库和汉语典故子库均经处理模块转换为汉语释义,汉语释义经处理模块拆分为多组汉语词汇,并对该多组汉语词汇的源代码按照顺序进行组合为合并源代码,汉语成语或汉语典故翻译为英语时以汉语释义所形成的合并源代码。
本发明中,所述英语词汇子库、英语语法子库、汉语词汇子库、汉语语法子库、汉语成语子库、汉语典故子库和情绪语气子库均生成文字源代码和语音源代码,文字源代码存储于文字源代码库,语音源代码存储于语音源代码库,且相同文字信息的生成的文字源代码与语音源代码不同。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (6)

1.一种用于英语翻译的文本数据处理方法,通过翻译系统实施,其特征在于,所述翻译系统包括用户登录模块、数据采集模块、数据输入模块、数据库、文字识别模块、情绪识别模块、处理模块、输出模块、显示模块和发声模块,其数据处理方法包括以下步骤:
S1:建立包含英语库和汉语库的数据库,通过处理模块对数据库内的词汇、语法进行建模分类管理,并生成相应的源代码库,源代码库包括文字源代码库和语音源代码库;
S2:通过用户登录模块注册登录后,用户将需要翻译的文本通过数据输入模块输入处理模块内,文本输入包括图片输入、文档输入和语音输入,用户选择需要的翻译模式,翻译模式包括英译汉和汉译英;
S3:处理模块通过文字识别模块识别所述文本中的文字信息,并生成根代码,处理模块根据根代码查找数据库内与跟代码相匹配的源代码,处理模块依据翻译模式依次选中数据库中的源代码信息;
S4:被选中的源代码被处理模块输入输出模块中,输出模块包括可供用户选择的文字输出、语音输出和文字语音共同输出的三种输出模式,使用文字输入对文字输出翻译过程中用户选择文字输出模块后,输出模块将源代码转换为文字进行输出,并通过显示模块显示翻译后的文字;
S5:涉及语音输入和语音输出的翻译过程中,用户需通过情绪识别模块选择发声人当前情绪状态,赋予语音情绪状态,如喜、怒、哀、乐、悲、恐、惊的情绪状态,处理模块根据被赋予的情绪状态挑选出符合当前选定的情绪状态的词汇进行组合,通过发声模块输出语音。
2.根据权利要求1所述的一种用于英语翻译的文本数据处理方法,其特征在于,所述数据采集模块包括摄像头、语音输入器和USB连接口,通过摄像头采集图片上的文字、通过USB连接口采集文档上的文字和通过语音输入器采集语音,数据采集模块将从图片、文档和语音中采集到的文字信息输入识别模块内。
3.根据权利要求1所述的一种用于英语翻译的文本数据处理方法,其特征在于,所述英语库包括英语词汇子库和英语语法子库,且汉语库包括汉语词汇子库、汉语语法子库、汉语成语子库、汉语典故子库和情绪语气子库。
4.根据权利要求3所述的一种用于英语翻译的文本数据处理方法,其特征在于,所述英语词汇子库、英语语法子库、汉语词汇子库和汉语语法子库均经处理模块转换为源代码,并分别对英语词汇子库和汉语词汇子库所生成的源代码中蕴含情绪含义的词汇进行分类为情绪源代码。
5.根据权利要求3所述的一种用于英语翻译的文本数据处理方法,其特征在于,所述汉语成语子库和汉语典故子库均经处理模块转换为汉语释义,汉语释义经处理模块拆分为多组汉语词汇,并对该多组汉语词汇的源代码按照顺序进行组合为合并源代码,汉语成语或汉语典故翻译为英语时以汉语释义所形成的合并源代码。
6.根据权利要求3所述的一种用于英语翻译的文本数据处理方法,其特征在于,所述英语词汇子库、英语语法子库、汉语词汇子库、汉语语法子库、汉语成语子库、汉语典故子库和情绪语气子库均生成文字源代码和语音源代码,文字源代码存储于文字源代码库,语音源代码存储于语音源代码库,且相同文字信息的生成的文字源代码与语音源代码不同。
CN201910030908.XA 2019-01-14 2019-01-14 一种用于英语翻译的文本数据处理方法 Withdrawn CN109840330A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910030908.XA CN109840330A (zh) 2019-01-14 2019-01-14 一种用于英语翻译的文本数据处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910030908.XA CN109840330A (zh) 2019-01-14 2019-01-14 一种用于英语翻译的文本数据处理方法

Publications (1)

Publication Number Publication Date
CN109840330A true CN109840330A (zh) 2019-06-04

Family

ID=66883771

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910030908.XA Withdrawn CN109840330A (zh) 2019-01-14 2019-01-14 一种用于英语翻译的文本数据处理方法

Country Status (1)

Country Link
CN (1) CN109840330A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111274828A (zh) * 2020-01-21 2020-06-12 陈刚 基于留言的语言翻译方法、系统、计算机程序和手持终端

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111274828A (zh) * 2020-01-21 2020-06-12 陈刚 基于留言的语言翻译方法、系统、计算机程序和手持终端

Similar Documents

Publication Publication Date Title
US11645547B2 (en) Human-machine interactive method and device based on artificial intelligence
JP4393494B2 (ja) 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
EP3994683B1 (en) Multilingual neural text-to-speech synthesis
CN108364632B (zh) 一种具备情感的中文文本人声合成方法
Haq et al. Audio-visual feature selection and reduction for emotion classification
Bhaykar et al. Speaker dependent, speaker independent and cross language emotion recognition from speech using GMM and HMM
Latif et al. Self supervised adversarial domain adaptation for cross-corpus and cross-language speech emotion recognition
KR102372069B1 (ko) 언어학습을 위한 양국어 자유 대화 시스템 및 방법
CN1836225A (zh) 语音识别中的统计语言建模的方法
Chiba et al. Multi-stream attention-based BLSTM with feature segmentation for speech emotion recognition
Goel et al. Cross lingual cross corpus speech emotion recognition
Liu et al. Promptstyle: Controllable style transfer for text-to-speech with natural language descriptions
de Velasco et al. Emotion Detection from Speech and Text.
JP2012037790A (ja) 音声対話装置
Ghosh et al. Mmer: Multimodal multi-task learning for speech emotion recognition
CN102970618A (zh) 基于音节识别的视频点播方法
JP5454469B2 (ja) 音声認識辞書作成支援装置,処理プログラム,および処理方法
Vanmassenhove et al. Prediction of Emotions from Text using Sentiment Analysis for Expressive Speech Synthesis.
CN109840330A (zh) 一种用于英语翻译的文本数据处理方法
US20140142925A1 (en) Self-organizing unit recognition for speech and other data series
Ballard et al. A multimodal learning interface for word acquisition
Tsiakoulis et al. Dialogue context sensitive HMM-based speech synthesis
Phukan et al. A comparative study of pre-trained speech and audio embeddings for speech emotion recognition
CN112084791A (zh) 一种对话过程意图提取及说法提示方法、系统及其电子设备
CN111968646A (zh) 一种语音识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20190604