CN107146487B - 一种英语语音翻译方法 - Google Patents
一种英语语音翻译方法 Download PDFInfo
- Publication number
- CN107146487B CN107146487B CN201710598432.0A CN201710598432A CN107146487B CN 107146487 B CN107146487 B CN 107146487B CN 201710598432 A CN201710598432 A CN 201710598432A CN 107146487 B CN107146487 B CN 107146487B
- Authority
- CN
- China
- Prior art keywords
- signal
- electric signal
- english phonetics
- sound
- interpretation method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
- G09B5/06—Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
- G09B5/065—Combinations of audio and video presentations, e.g. videotapes, videodiscs, television systems
Abstract
一种英语语音翻译方法,包括:通过语音检测记录装置采集英语语音信号;将英语语音信号转换为第一电信号,并对第一电信号进行滤波处理,得到第二电信号对第二电信号进行预处理,得到第三电信号;提取第三电信号的特征信息,并过滤掉不支持的字符,形成待翻译文本;选择翻译规则子集,过滤出不匹配规则子集的字符,并与数据库中的文件进行比对后翻译成汉语输出,本发明设计开发了一种英语语音翻译方法,识别度高,翻译准确性好,并给出收音装置的调整方法,以获得更好的收音效果。
Description
技术领域
本发明涉及英语翻译领域,尤其涉及一种英语语音翻译方法。
背景技术
英语作为一种世界范围的语言,越来越多的人需要学习和使用英语。翻译是语言使用过程中的关键环节,翻译就是把一种语言文字的语义用另一种语言文字表达出来,这就要求翻译的过程不仅要把握翻译的准确性,还要把握两种文字的使用习惯现在有很多工具帮助人们进行文字互译,但是存在数翻译不准确,语句不通顺的问题。
发明内容
本发明设计开发了一种英语语音翻译方法,识别度高,翻译准确性好。
本发明还有一个目的是,给出收音装置的调整方法,以获得更好的收音效果。
本发明提供的技术方案为:
一种英语语音翻译方法,包括:
通过语音检测记录装置采集英语语音信号;
将所述英语语音信号转换为第一电信号,并对所述第一电信号进行滤波处理,得到第二电信号;
对所述第二电信号进行预处理,得到第三电信号;
提取所述第三电信号的特征信息,并过滤掉不支持的字符,形成待翻译文本;
选择翻译规则子集,过滤出不匹配规则子集的字符,并与数据库中的文件进行比对后翻译成汉语输出。
优选的是,所述语音检测记录装置采集语音过程,包括:
步骤一:通过声波检测阵列检测声音震动方向,声波阵列中n个声音传感器,检测到的声波强度为I1,I2,I3····In,并计算声音方向角度系数;
步骤二:对声波强度{I1,I2I3…In}依次进行排序,挑选出声波强度最小值Imin对应的声音传感器k,并挑选出与声音传感器k临近的两个声音传感器,声音传感器k-1和声音传感器k+1,其中声音传感器k-1对应的声音强度值为Ik-1,声音传感器k+1对应的声音强度值为Ik+1;
步骤三:比较Ik+1和Ik-1的大小,若Ik+1>Ik-1则记录声音传感器k-1所在方向,并计算第一角度调整值:
其中,麦克风阵列的调整方向为声音传感器k-1所在方向的反向,即调整角度为-α。
优选的是,还包括第二角度调整α′,即为对调整角度α的校正:
其中,Imax为声音传感阵列中声音传感器检测到的声波强度最大值。
优选的是,所述英语语音信号转换为第一语音电信号,包括:将所述语音信号转换为电压信号或电流信号。
优选的是,所述第一电信号转换为第二电信号,包括:将所述第一电信号进行模拟/数字转换,得到数字信号,并对所述数字信号进行高频或者带通滤波,去除非语音干扰信号。
优选的是,所述第二电信号的预处理过程,包括:语音信号预加权处理、语音信号分帧处理,语音信号加窗处理。
优选的是,提取所述第三电信号的特征信息,包括:
对所述第三电信号中的语音帧与数据库中预存储信息进行比对,提取出专业术语和未翻译的关键词,并将祛除专业术语和关键词的语音信号进行比对翻译。
优选的是,所述未翻译的关键词包括:英语语音信号发出者的省略发音和常见拼读错误词汇。
优选的是,所述规则子集包括:专业术语集合和拼读错误词汇集合和常见拼读错误词汇集合。
优选的是,还包括:翻译语序调整,包括:划分翻译后中文句子,提取后置定语,并将定语前置,具体包括,提取“,”后的翻译语句,并搜索具有“的”的文字,确定其是否为后置定语,调整语序,将“,”后的翻译语句,调整“,”前后两个短句的文字位置。
本发明的有益效果
本发明设计开发了一种英语语音翻译方法,识别度高,翻译准确性好,本发明还给出收音装置的调整方法,以获得更好的收音效果。
本发明还设计了一种英语语音检测记录装置,既方便用户学习,又能实现更好的收音采集效果。
附图说明
图1为本发明所述的语音检测记录装置的结构示意图。
图2为本发明所述的拆装环的结构示意图。
图3为本发明所述的第二翻转盒的结构示意图。
图4为本发明所述的旋转架的结构示意图。
图5为本发明所述的英语语音翻译方法的流程图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
如图1所示,本发明还提供了一种语音检测记录装置,包括:转轴100、第一翻转盒200、第二翻转盒300和拆装环400。
其中,第一翻转盒200,其可旋转套设在转轴100上,第一翻转盒上设置有显示屏110;其中,第二翻转盒300可旋转套设在转轴100上,第二翻转盒300能够与第一翻转盒200扣合,第二翻转盒300内具有发音装置310和收音装置320;拆装环400可拆卸设置在第二翻转盒300上方,书写卡片500套设在拆装环400上,第二翻转盒300上方设置有安装孔,拆装环400开拆卸设置在安装孔内。
如图2所示,拆装环400包括:具有开口的圆形环体410,开口的一端铰接紧固装置420,开口的另一端具有固定部430,固定部430上具有螺纹孔431,紧固装置420包括与圆形环体410铰接的连接板411,连接板411的端面开设有螺纹孔,另一端开设有贯通的插槽412,用于插入固定部430,螺栓413通过连接板411上的螺纹孔与固定部430螺纹连接,螺栓413的自由端套装有调节手柄414。
工作过程中,当需要闭合拆装环时,将紧固装置420向固定部430靠拢,使固定部430插入连接板411的插槽412,再施力于调节手柄414使其旋转,调节手柄414带动螺栓413穿过连接板411上的螺纹孔以及固定部430上的螺纹孔431并拧紧,完成拆装环的闭合过程。
书写卡片,其具有安装圆孔,套设在拆装环上,与拆装环400活页连接。
如图3所示,发音装置310,包括:扬声器,其通过吸盘吸附在第二翻转盒300内;通电电路,其连通扬声器,用于为扬声器供电;光电开关,其设置在第二翻转盒300上端,拆装环400下方,其连接通电电路,当书写卡片安装在拆装环400位置,遮挡光电开关位置的通光孔,扬声器发声。
收音装置320,包括:麦克风阵列,其设置在第二翻转盒300下方,麦克风阵列包含多个麦克风,作为一种优选,麦克风阵列为圆形;旋转架330,其设置在麦克风阵列底部,并能够调整麦克风阵列旋转方向,声波检测阵列,其为多个声音传感器,等间距设置在第二翻转盒300内,第二翻转盒300下方,第二翻转盒300对应声音传感器位置具有多个收音通孔,麦克风阵列连接内置声音处理模块,用于存储使用者音频,或将音频翻译成汉语,但音频收集过程中往往受到噪声干扰,因此在麦克风阵列下方设置旋转架。
如图4所示,旋转架,包括:齿轮321,麦克风阵列固定设置在齿轮321上;齿条322,其为闭合环形,齿条322外侧与齿轮321啮合,并能够带动齿轮321旋转;齿条322内侧具有旋转齿;
两个转轴324,其设置在齿条322两端,并与旋转齿啮合,以带动齿条322正转或反转;其中两个转轴324由电机驱动。
实施以语音检测记录装置的工作过程为例,做进一步说明
书写卡片,与拆装环400活页连接,当书写卡片遮挡到光电开关位置的通光孔,扬声器发声,扬声器连接内置语音听写模块,其中,根据语音听写模块内的听写内容,在卡片默写听写内容,语音听写模块内容与显示屏显示内容一致,听写完成后,开启显示屏能够核对听写内容,便于记忆。
其中,语音听写模块可以通过麦克风阵列采集声音,录制收音内容,并将收音内容对应的单词输入存储单元,同步在显示屏上显示。
如图5所示,一种英语语音翻译方法,包括:
步骤S101:通过语音检测记录装置采集英语语音信号;包括:
步骤S102:通过声波检测阵列检测声音震动方向,声波阵列中n个声音传感器,检测到的声波强度为I1,I2,I3····In,并计算声音方向角度系数;
步骤S103:对声波强度{I1,I2I3…In}依次进行排序,挑选出声波强度最小值Imin对应的声音传感器k,并挑选出与声音传感器k临近的两个声音传感器,声音传感器k-1和声音传感器k+1,其中声音传感器k-1对应的声音强度值为Ik-1,声音传感器k+1对应的声音强度值为Ik+1;
步骤S104:比较Ik+1和Ik-1的大小,若Ik+1>Ik-1则记录声音传感器k-1所在方向,并计算第一角度调整值:
其中,麦克风阵列的调整方向为声音传感器k-1所在方向的反向,即调整角度为-α。
对第一角度调整值α进行校正,得到第二角度调整α′,即为对调整角度α
的校正:
其中,Imax为声音传感阵列中声音传感器检测到的声波强度最大值。
步骤S105:所述英语语音信号转换为第一电信号,并对所述第一电信号进行滤波处理,得到第二电信号;作为一种优选,所述英语语音信号转换为第一语音电信号,包括:将所述语音信号转换为电压信号或电流信号。优选的是,所述第一电信号转换为第二电信号,包括:将所述第一电信号进行模拟/数字转换,得到数字信号,并对所述数字信号进行高频或者带通滤波,去除非语音干扰信号。
步骤S106:对所述第二电信号进行预处理,得到第三电信号;提取所述第三电信号的特征信息,并过滤掉不支持的字符,形成待翻译文本;选择翻译规则子集,过滤出不匹配规则子集的字符,并与数据库中的文件进行比对后翻译成汉语输出。
即为包括:语音信号预加权处理、语音信号分帧处理,语音信号加窗处理,
对所述第三电信号中的语音帧与数据库中预存储信息进行比对,提取出专业术语和未翻译的关键词,并将祛除专业术语和关键词的语音信号进行比对翻译。
作为一种优选,未翻译的关键词包括:英语语音信号发出者的省略发音和常见拼读错误词汇,规则子集包括:专业术语集合和拼读错误词汇集合和常见拼读错误词汇集合。
步骤S107,还包括:翻译语序调整,包括:划分翻译后中文句子,提取后置定语,并将定语前置,具体包括,提取“,”后的翻译语句,并搜索具有“的”的文字,确定其是否为后置定语,调整语序,将“,”后的翻译语句,调整“,”前后两个短句的文字位置
一种语音记录装置控制方法,包括:
步骤一:通过声波检测阵列检测声音震动方向,声波阵列中n个声音传感器,检测到的声波强度为I1,I2,I3····In,并计算声音方向角度系数;
步骤二:对声波强度{I1,I2I3…In}依次进行排序,挑选出声波强度最小值Imin对应的声音传感器k,并挑选出与声音传感器k临近的两个声音传感器,声音传感器k-1和声音传感器k+1,其中声音传感器k-1对应的声音强敌值为Ik-1,声音传感器k+1对应的声音强度值为Ik+1;
步骤三:比较Ik+1和Ik-1的大小,若Ik+1>Ik-1则记录声音传感器k-1所在方向,并计算第一角度调整值:
其中,麦克风阵列的调整方向为声音传感器k-1所在方向的反向,即调整角度为-α;
步骤四:记录声波强度最小值Imin对应声音传感器所在方向,并计算齿轮321调整值:
其中,R为旋转齿轮半径;r声音传感器自称的圆周半径;Imax为声音传感阵列中声音传感器检测到的声波强度最大值。
本发明设计开发了一种语音检测记录装置,采用翻转式结构,结构简单,并采用可拆卸式书写卡片,便于记忆和存储查看,实用性强,、在麦克风阵列下方设置旋转架,并给出麦克风阵列调整方法,以获得更好的收音效果。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。
Claims (9)
1.一种英语语音翻译方法,其特征在于,包括:
通过语音检测记录装置采集英语语音信号;
将所述英语语音信号转换为第一电信号,并对所述第一电信号进行滤波处理,得到第二电信号;
对所述第二电信号进行预处理,得到第三电信号;
提取所述第三电信号的特征信息,并过滤掉不支持的字符,形成待翻译文本;
选择翻译规则子集,过滤出不匹配规则子集的字符,并与数据库中的文件进行比对后翻译成汉语输出;
所述语音检测记录装置采集语音过程,包括:
步骤一:通过声波检测阵列检测声音震动方向,声波阵列中n个声音传感器,检测到的声波强度为I1,I2,I3… In,并计算声音方向角度系数;
步骤二:对声波强度{I1,I2I3…In}依次进行排序,挑选出声波强度最小值Imin对应的声音传感器k,并挑选出与声音传感器k临近的两个声音传感器,声音传感器k-1和声音传感器k+1,其中声音传感器k-1对应的声音强度值为Ik-1,声音传感器k+1对应的声音强度值为Ik+1;
步骤三:比较Ik+1和Ik-1的大小,若Ik+1>Ik-1则记录声音传感器k-1所在方向,并计算第一角度调整值α:
其中,麦克风阵列的调整方向为声音传感器k-1所在方向的反向,即调整角度为-α。
2.根据权利要求1所述的英语语音翻译方法,其特征在于,还包括第二角度调整α′,即为对调整角度α的校正:
其中,Imax为声音传感阵列中声音传感器检测到的声波强度最大值。
3.根据权利要求1或2所述的英语语音翻译方法,其特征在于,所述英语语音信号转换为第一语音电信号,包括:将所述语音信号转换为电压信号或电流信号。
4.根据权利要求3所述的英语语音翻译方法,其特征在于,所述第一电信号转换为第二电信号,包括:将所述第一电信号进行模拟/数字转换,得到数字信号,并对所述数字信号进行高频或者带通滤波,去除非语音干扰信号。
5.根据权利要求1所述的英语语音翻译方法,其特征在于,所述第二电信号的预处理过程,包括:语音信号预加权处理、语音信号分帧处理,语音信号加窗处理。
6.根据权利要求5所述的英语语音翻译方法,其特征在于,提取所述第三电信号的特征信息,包括:
对所述第三电信号中的语音帧与数据库中预存储信息进行比对,提取出专业术语和未翻译的关键词,并将祛除专业术语和关键词的语音信号进行比对翻译。
7.根据权利要求6所述的英语语音翻译方法,其特征在于,所述未翻译的关键词包括:英语语音信号发出者的省略发音和常见拼读错误词汇。
8.根据权利要求1所述的英语语音翻译方法,其特征在于,所述规则子集包括:专业术语集合和拼读错误词汇集合和常见拼读错误词汇集合。
9.根据权利要求8所述的英语语音翻译方法,其特征在于,还包括:翻译语序调整,包括:划分翻译后中文句子,提取后置定语,并将定语前置,具体包括,提取“,”后的翻译语句,并搜索具有“的”的文字,确定其是否为后置定语,调整语序,将“,”后的翻译语句,调整“,”前后两个短句的文字位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710598432.0A CN107146487B (zh) | 2017-07-21 | 2017-07-21 | 一种英语语音翻译方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710598432.0A CN107146487B (zh) | 2017-07-21 | 2017-07-21 | 一种英语语音翻译方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107146487A CN107146487A (zh) | 2017-09-08 |
CN107146487B true CN107146487B (zh) | 2019-03-26 |
Family
ID=59775751
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710598432.0A Active CN107146487B (zh) | 2017-07-21 | 2017-07-21 | 一种英语语音翻译方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107146487B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109147785A (zh) * | 2018-09-19 | 2019-01-04 | 淄博职业学院 | 一种韩语音频信息处理的方法与装置 |
CN109637555B (zh) * | 2019-02-15 | 2022-05-24 | 广东科学技术职业学院 | 一种商务会议用日语语音识别翻译系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2417103A (en) * | 2004-08-11 | 2006-02-15 | Sdl Plc | Natural language translation system |
US8041557B2 (en) * | 2005-02-24 | 2011-10-18 | Fuji Xerox Co., Ltd. | Word translation device, translation method, and computer readable medium |
JP4311365B2 (ja) * | 2005-03-25 | 2009-08-12 | 富士ゼロックス株式会社 | 文書処理装置およびプログラム |
US8175864B1 (en) * | 2007-03-30 | 2012-05-08 | Google Inc. | Identifying nearest neighbors for machine translation |
CN101414294A (zh) * | 2007-10-18 | 2009-04-22 | 英业达股份有限公司 | 使用远端翻译记忆库的翻译系统及其方法 |
US8515977B2 (en) * | 2010-09-10 | 2013-08-20 | International Business Machines Corporation | Delta language translation |
CN106776587A (zh) * | 2016-12-19 | 2017-05-31 | 新译信息科技(深圳)有限公司 | 数据处理方法和装置 |
-
2017
- 2017-07-21 CN CN201710598432.0A patent/CN107146487B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN107146487A (zh) | 2017-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lamel et al. | Bref, a large vocabulary spoken corpus for french1 | |
Robinson et al. | WSJCAMO: a British English speech corpus for large vocabulary continuous speech recognition | |
Zheng et al. | Comparison of different implementations of MFCC | |
CN107146487B (zh) | 一种英语语音翻译方法 | |
Claus et al. | A Survey about ASR for Children | |
Deshwal et al. | A Structured Approach towards Robust Database Collection for Language Identification | |
Malde et al. | Development of speech corpora in Gujarati and Marathi for phonetic transcription | |
Zheng et al. | Integrating the energy information into MFCC. | |
Blunt et al. | A model for incorporating an automatic speech recognition system in a noisy educational environment | |
Alotaibi et al. | A canonicalization of distinctive phonetic features to improve arabic speech recognition | |
Magdum et al. | Methodology for designing and creating Hindi speech corpus | |
Wong et al. | Exploring articulatory characteristics of Cantonese dysarthric speech using distinctive features | |
Mohasi et al. | An Acoustic Analysis of Tone in Sesotho. | |
Kabir et al. | A romanian corpus for speech perception and automatic speech recognition | |
Toledano et al. | Acoustic-phonetic decoding of different types of spontaneous speech in Spanish | |
Blomberg et al. | Collection and recognition of children’s speech in the PF-Star project | |
Godambe et al. | Multi-speaker, narrowband, continuous Marathi speech database | |
CN110223679A (zh) | 一种语音识别输入装置 | |
Sikveland et al. | Spontal-N: A corpus of interactional spoken Norwegian | |
Kraleva | Design and development a children's speech database | |
Bansal et al. | Corpus design and development of an annotated speech database for Punjabi | |
Oyo et al. | A preliminary speech learning tool for improvement of African English accents | |
CN112967538B (zh) | 一种英语发音信息采集系统 | |
Jeyalakshmi et al. | Alphabet model-based short vocabulary speech recognition for the assessment of profoundly deaf and hard of hearing speeches | |
De Villiers et al. | Towards lecture transcription in resource-scarce environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |