CN113192494A - 一种英语语言智能识别和输出系统和方法 - Google Patents
一种英语语言智能识别和输出系统和方法 Download PDFInfo
- Publication number
- CN113192494A CN113192494A CN202110406924.1A CN202110406924A CN113192494A CN 113192494 A CN113192494 A CN 113192494A CN 202110406924 A CN202110406924 A CN 202110406924A CN 113192494 A CN113192494 A CN 113192494A
- Authority
- CN
- China
- Prior art keywords
- english
- pronunciation
- information
- syllable
- decibel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000004458 analytical method Methods 0.000 claims abstract description 28
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000000605 extraction Methods 0.000 claims description 57
- 238000006243 chemical reaction Methods 0.000 claims description 23
- 230000003287 optical effect Effects 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 6
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims 1
- 230000009286 beneficial effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012937 correction Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
- G09B19/06—Foreign languages
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
- G09B5/06—Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
- G09B5/065—Combinations of audio and video presentations, e.g. videotapes, videodiscs, television systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/027—Syllables being the recognition units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Educational Administration (AREA)
- General Physics & Mathematics (AREA)
- Educational Technology (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明提供一种英语语言智能识别和输出系统,其包括语音信息收集单元、先期信号处理单元、语音信息识别分析单元和反馈输出单元;音节比对模块用于把得到的单个英语音节与标准音节进行比对,比对结果通过反馈输出单元进行输出。把练习者发出的英语句子分隔为单个的英语单词,并且还把单个的英语单词分隔为单个的音节结构,然后对于单个的音节结构进行分析,这里能够把单个的英语音节单独地进行重复朗读,以与标准的音节进行比对,这样就能够很好地让练习者明白自己发出的单词的音节读法与标准的音节读法究竟存在何种的区别,通过这种区别就能够让练习者有的放矢,从而改进自己的发音习惯。
Description
技术领域
本发明涉及智能化语言学习系统,具体涉及一种能够对于学习者的发音进行自动识别、分析并且纠偏的系统结构和方法。
背景技术
在英语语言的学习中,对于口语的练习是非常重要的,口语发音的准确清晰能够明显提升学习者的学习兴趣。
然而,由于受到母语的发音惯性影响,东方人或者中国人学习英语口语的时候经常会发现口语的正确发音存在十分巨大的难度。针对于此,想要提高口语能力的学习者往往需要耗费巨大的精力和金钱参加培训班、雇佣外教,以练习口语发音,即使如此很多人提升口语能力的速度也较为缓慢,无法快速实现口语能力的提升,并且还消耗了大量的金钱和精力。
这些年来,随着语音采集和识别的兴起,已经逐渐出现了具有语音识别功能的智能识别,其能够对于用户的声音进行捕捉和分析,以得到相应的信息。另外,英语发音是基于一个个的单词进行的,并且每一个单词是基于一个个的音节进行发音的,如果能够把单词和音节的发音与智能语音识别的相互结合而用于用户的英语语音纠正辅助教学,将具有十分重要的意义。
发明内容
为解决上述技术中存在的问题,本发明提供一种能够对于学习者的英语语音进行采集并且进行一系列分析然后进行输出以纠正学习者发音习惯的系统和方法。
本发明提供的一种英语语言智能识别和输出系统,其包括语音信息收集单元、先期信号处理单元、语音信息识别分析单元和反馈输出单元;
所述语音信息识别分析单元包括单词特征提取模块、单词音节特征提取模块和音节比对模块,所述语音特征提取模块用于把采集的语音信息分解为单个的英语单词,所述单词音节特征提取模块用于把得到的英语单词分解为单个英语音节,所述音节比对模块用于把得到的单个英语音节与标准音节进行比对,比对结果通过所述反馈输出单元进行输出。
上述方案的有益效果为:把练习者发出的英语句子分隔为单个的英语单词,并且还把单个的英语单词分隔为单个的音节结构,然后对于单个的音节结构进行分析,这里能够把单个的英语音节单独地进行重复朗读,以与标准的音节进行比对,这样就能够很好地让练习者明白自己发出的单词的音节读法与标准的音节读法究竟存在何种的区别,通过这种区别就能够让练习者有的放矢,从而改进自己的发音习惯。
一个优选的方案是,所述语音信息识别分析单元还包括时间特征提取模块,所述时间特征提取模块用于把所述单个英语音节从发音开始至发音结束的时间进行记录,并且把记录得到的发音时间信息传输至所述反馈输出单元。
上述方案的有益效果为:通过这种结构的设置,其能够把单个英语音节的发音时长记录下来,而发音时长是判断一个英语音节发音正确与否的关键标准,特别是对于英语长音和短音而言,通过这种发音时间长度的测定就能够很好地对于练习者的发音的音节长度进行定量测试并且告知练习者,以加以改进。
一个优选的方案是,同一英语单词被分解为多个单个英语音节,这多个单个英语音节通过所述时间特征提取模块分别得到不同的发音时间信息,并且相应得到这多个单个英语音节的发音时间信息的比例值,把这多个英语音节的发音时间信息的比例值与标准英语音节的发音时间信息的比例值进行比对,并且把比对的信息传输至反馈输出单元。
上述方案的有益效果为:在很多情况下,相对于一个音节发音的长短而言,更为重要的是两个音节的比较发音,即对于两个连续音节的正确发音而言,通常这两个音节具有非常明显的音节发音时间长度的比值,比如为2:1或者3:2,而把这些音节的发音时间长度进行比较之后得到了比例值,这样就更为准确地告知练习者音节发音的相互之间的时间比例是否正确,从而有针对性地练习。
一个优选的方案是,所述语音信息识别分析单元还包括声音分贝特征提取模块,所述声音分贝特征提取模块用于把所述单个英语音节从发音开始至发音结束过程中的最高分贝记录下来,并且把记录得到的最高分贝信息传输至所述反馈输出单元。
上述方案的有益效果为:通过这种结构的设置,其能够把单个英语音节的发音分贝高低记录下来,而发音分贝高低是判断一个英语音节发音正确与否的关键标准,特别是对于英语的重音、爆破音和辅音而言,通过这种发音分贝高低的测定就能够很好地对于练习者的发音的音节发音进行定量测试并且告知练习者,以加以改进。
一个优选的方案是,同一个英语单词被分解为多个单个英语音节,这多个单个英语音节通过所述声音分贝特征提取模块分别得到不同的发音分贝信息,并且相应得到这多个单个英语音节的发音分贝信息的比例值,把这多个英语音节的发音分贝信息的比例值与标准英语音节的发音时间信息的比例值进行比对,并且把比对的信息传输至反馈输出单元。
上述方案的有益效果为:在很多情况下,相对于一个音节发音的分贝高低而言,更为重要的是两个音节的比较发音,即对于两个不同类型的连续音节的正确发音而言,通常这两个音节具有非常明显的音节发音分贝高度的比值,例如一个需要发出重音,而另外一个为轻声的辅音,而把这些音节的发音分贝高低值进行比较之后得到了比例值,这样就更为准确地告知练习者音节发音的相互之间的时间比例是否正确,从而有针对性地练习。
一个优选的方案是,所述语音信息识别分析单元还包括声音分贝特征提取模块,所述声音分贝特征提取模块用于把所述单个英语音节从发音开始至发音结束的过程中的分贝连续记录下来,并且把记录得到的连续分贝信息通过信号转换模块转换为电信号或者光信号,并且电信号或在光信号对应的信号强度与连续分贝信息的分贝强度相互对应。
上述方案的有益效果为:对于得到的音节的连续的分贝值,为了更直观地观察,通过显示屏显示为波动的信号,例如在一个时间(横向)分贝(纵向)的坐标轴中,通过时间的变化,把分贝值绘制一个变化的曲线,然后练习者通过显示屏幕就能够观察这条显示的曲线。并且这个发音形成的曲线与标准发音形成的曲线能够形成一同展示,并且把展示的两个图形均作为参考让练习者使用,这样就更好地让练习者进行自我提高。
本发明提供的英语语言智能识别和输出系统的使用方法,其包括下面的步骤:
S1:用户发出英语语音信息,英语语音信息通过所述语音信息收集单元进行采集,随后通过所述先期信号处理单元对于英语语音信息进行降噪和转换处理;
S2:随后语音信息进入到语音信息识别分析单元,所述单词特征提取模块对于英语语音信息进行分解得到逐个排列的英语单词,随后单个的英语单词通过所述单词音节特征提取模块进行分解得到逐个排列的英语音节,把得到的英语音节和标准音节进行比对,并且给出比对的相似度,把相似度信息通过所述反馈输出单元显示给用户;并且,反馈输出单元把分解得到的单个音节和标准音节通过扬声器模块连续进行比对发声,这种比对发声以对于用户进行纠正发音。
一个优选的方案是,所述语音信息识别分析单元还包括时间特征提取模块;
该使用方法包括下面的步骤:首先,所述时间特征提取模块把所述单个英语音节发音至发音结束的时间记录为发音时间,并且对于同一个英语单词被分解为多个的单个英语音节通过所述时间特征提取模块分别得到对应的不同的发音时间,这些不同的发音时间经过比对后换算为第一比例值;然后,把这些第一比例值与系统内存储的对应的标准英语音节的发音时间形成的第二比例值进行比对,第一比例值和第二比例值的比值信息通过所述反馈输出单元进行输出。
一个优选的方案是,所述语音信息识别分析单元还包括声音分贝特征提取模块;
该使用方法包括下面的步骤:首先,所述声音分贝特征提取模块把所述单个英语音节从发音开始至发音结束过程中的最高分贝记录下来,并且把记录得到的最高分贝信息传输至所述反馈输出单元;并且,同一个英语单词被分解为多个单个英语音节,这多个单个英语音节通过所述声音分贝特征提取模块分别得到不同的发音分贝信息,并且相应得到这多个单个英语音节的发音分贝信息的比例值,把这多个英语音节的发音分贝信息的第三比例值与标准英语音节的发音时间信息的第四比例值进行比对,并且把第三比例值与第四比例值的比对的信息传输至反馈输出单元。
一个优选的方案是,所述语音信息识别分析单元还包括声音分贝特征提取模块;
该使用方法包括下面的步骤:所述声音分贝特征提取模块把所述单个英语音节从发音开始至发音结束的过程中的分贝连续记录下来,并且把记录得到的连续分贝信息通过信号转换模块转换为电信号或者光信号,由此成为测试转换连续分贝信息;然后,在系统内存储有标准发音的单个英语音节的连续分贝信息的转换信息,称为标准发音的转换连续分贝信息,把测试转换连续分贝信息与所述转换连续分贝信息通过所述反馈输出单元进行显示输出。
附图说明
图1是本发明提供的一种英语语言智能识别和输出系统的结构框图。
图2是本发明提供的一种英语语言智能识别和输出系统工作流程步骤的结构框图。
具体实施方式
第一实施例:
如图1所示,本发明提供的一种英语语言智能识别和输出系统,其包括语音信息收集单元、先期信号处理单元、语音信息识别分析单元和反馈输出单元;
所述语音信息识别分析单元包括单词特征提取模块、单词音节特征提取模块和音节比对模块,所述语音特征提取模块用于把采集的语音信息分解为单个的英语单词,所述单词音节特征提取模块用于把得到的英语单词分解为单个英语音节,所述音节比对模块用于把得到的单个英语音节与标准音节进行比对,比对结果通过所述反馈输出单元进行输出。
如图2所示,本发明提供的英语语言智能识别和输出系统的使用方法,其包括下面的步骤:
S1:用户发出英语语音信息,英语语音信息通过所述语音信息收集单元进行采集,随后通过所述先期信号处理单元对于英语语音信息进行降噪和转换处理;
S2:随后语音信息进入到语音信息识别分析单元,所述单词特征提取模块对于英语语音信息进行分解得到逐个排列的英语单词,随后单个的英语单词通过所述单词音节特征提取模块进行分解得到逐个排列的英语音节,把得到的英语音节和标准音节进行比对,并且给出比对的相似度,把相似度信息通过所述反馈输出单元显示给用户,相似度具体可以是发音时间参数、发音分贝比对或者发音形成的波形的比对;并且,反馈输出单元把分解得到的单个音节和标准音节通过扬声器模块连续进行比对发声,这种比对发声以对于用户进行纠正发音。
把练习者发出的英语句子分隔为单个的英语单词,并且还把单个的英语单词分隔为单个的音节结构,然后对于单个的音节结构进行分析,这里能够把单个的英语音节单独地进行重复朗读,以与标准的音节进行比对,这样就能够很好地让练习者明白自己发出的单词的音节读法与标准的音节读法究竟存在何种的区别,通过这种区别就能够让练习者有的放矢,从而改进自己的发音习惯。
第二实施例:
所述语音信息识别分析单元还包括时间特征提取模块;
该使用方法包括下面的步骤:首先,所述时间特征提取模块把所述单个英语音节发音至发音结束的时间记录为发音时间,并且对于同一个英语单词被分解为多个的单个英语音节通过所述时间特征提取模块分别得到对应的不同的发音时间,这些不同的发音时间经过比对后换算为第一比例值;然后,把这些第一比例值与系统内存储的对应的标准英语音节的发音时间形成的第二比例值进行比对,第一比例值和第二比例值的比值信息通过所述反馈输出单元进行输出。
通过这种结构的设置,其能够把单个英语音节的发音时长记录下来,而发音时长是判断一个英语音节发音正确与否的关键标准,特别是对于英语长音和短音而言,通过这种发音时间长度的测定就能够很好地对于练习者的发音的音节长度进行定量测试并且告知练习者,以加以改进。在很多情况下,相对于一个音节发音的长短而言,更为重要的是两个音节的比较发音,即对于两个连续音节的正确发音而言,通常这两个音节具有非常明显的音节发音时间长度的比值,比如为2:1或者3:2,而把这些音节的发音时间长度进行比较之后得到了比例值,这样就更为准确地告知练习者音节发音的相互之间的时间比例是否正确,从而有针对性地练习。
第三实施例:
所述语音信息识别分析单元还包括声音分贝特征提取模块;
该使用方法包括下面的步骤:首先,所述声音分贝特征提取模块把所述单个英语音节从发音开始至发音结束过程中的最高分贝记录下来,并且把记录得到的最高分贝信息传输至所述反馈输出单元;并且,同一个英语单词被分解为多个单个英语音节,这多个单个英语音节通过所述声音分贝特征提取模块分别得到不同的发音分贝信息,并且相应得到这多个单个英语音节的发音分贝信息的比例值,把这多个英语音节的发音分贝信息的第三比例值与标准英语音节的发音时间信息的第四比例值进行比对,并且把第三比例值与第四比例值的比对的信息传输至反馈输出单元。
通过这种结构的设置,其能够把单个英语音节的发音分贝高低记录下来,而发音分贝高低是判断一个英语音节发音正确与否的关键标准,特别是对于英语的重音、爆破音和辅音而言,通过这种发音分贝高低的测定就能够很好地对于练习者的发音的音节发音进行定量测试并且告知练习者,以加以改进。在很多情况下,相对于一个音节发音的分贝高低而言,更为重要的是两个音节的比较发音,即对于两个不同类型的连续音节的正确发音而言,通常这两个音节具有非常明显的音节发音分贝高度的比值,例如一个需要发出重音,而另外一个为轻声的辅音,而把这些音节的发音分贝高低值进行比较之后得到了比例值,这样就更为准确地告知练习者音节发音的相互之间的时间比例是否正确,从而有针对性地练习。
第四实施例:
所述语音信息识别分析单元还包括声音分贝特征提取模块;
该使用方法包括下面的步骤:所述声音分贝特征提取模块把所述单个英语音节从发音开始至发音结束的过程中的分贝连续记录下来,并且把记录得到的连续分贝信息通过信号转换模块转换为电信号或者光信号,由此成为测试转换连续分贝信息;然后,在系统内存储有标准发音的单个英语音节的连续分贝信息的转换信息,称为标准发音的转换连续分贝信息,把测试转换连续分贝信息与所述转换连续分贝信息通过所述反馈输出单元进行显示输出。
对于得到的音节的连续的分贝值,为了更直观地观察,通过显示屏显示为波动的信号,例如在一个时间(横向)分贝(纵向)的坐标轴中,通过时间的变化,把分贝值绘制一个变化的曲线,然后练习者通过显示屏幕就能够观察这条显示的曲线。并且这个发音形成的曲线与标准发音形成的曲线能够形成一同展示,并且把展示的两个图形均作为参考让练习者使用,这样就更好地让练习者进行自我提高。
在其它优选的实施例中,对于每一个单词而言,通过时间(横向)分贝(纵向)的坐标轴形成连续发音的波形图,并且把每一个波形图按照对应的音节进行区分,区分方式例如为颜色或者位置,然后在音节波形图的起始点的时候具有提示信息,提示信息例如为“重音”、“长音”、“爆破音”,这样能够给与练习者提示,而更好地提高水平。另外,对于标准的单词音节的发音形成的波形图具有多种模式,具体为英式口音的标准发音波形图、美式口音的标准发音波形图、印度口音的标准发音波形图,学习者可以选择特定的模式进行比对练习。另外,模拟形成口音发音的口型变化图和标准发音的口音发音的口型变化图,并且口型变化图与上面的波形图进行位置对应,即口型图与波形图的分贝信息对应,这样练习者就能够在对应时间位点根据标准的口型图进行提示练习,并且还可以给出发音练习的口型图以进行提示纠正。
Claims (10)
1.一种英语语言智能识别和输出系统,其特征在于,包括语音信息收集单元、先期信号处理单元、语音信息识别分析单元和反馈输出单元;
所述语音信息识别分析单元包括单词特征提取模块、单词音节特征提取模块和音节比对模块,所述语音特征提取模块用于把采集的语音信息分解为单个的英语单词,所述单词音节特征提取模块用于把得到的英语单词分解为单个英语音节,所述音节比对模块用于把得到的单个英语音节与标准音节进行比对,比对结果通过所述反馈输出单元进行输出。
2.根据权利要求1所述的英语语言智能识别和输出系统,其特征在于,所述语音信息识别分析单元还包括时间特征提取模块,所述时间特征提取模块用于把所述单个英语音节从发音开始至发音结束的时间进行记录,并且把记录得到的发音时间信息传输至所述反馈输出单元。
3.根据权利要求2所述的英语语言智能识别和输出系统,其特征在于,同一英语单词被分解为多个单个英语音节,这多个单个英语音节通过所述时间特征提取模块分别得到不同的发音时间信息,并且相应得到这多个单个英语音节的发音时间信息的比例值,把这多个英语音节的发音时间信息的比例值与标准英语音节的发音时间信息的比例值进行比对,并且把比对的信息传输至反馈输出单元。
4.根据权利要求1所述的英语语言智能识别和输出系统,其特征在于,
所述语音信息识别分析单元还包括声音分贝特征提取模块,所述声音分贝特征提取模块用于把所述单个英语音节从发音开始至发音结束过程中的最高分贝记录下来,并且把记录得到的最高分贝信息传输至所述反馈输出单元。
5.根据权利要求4所述的英语语言智能识别和输出系统,其特征在于,
同一个英语单词被分解为多个单个英语音节,这多个单个英语音节通过所述声音分贝特征提取模块分别得到不同的发音分贝信息,并且相应得到这多个单个英语音节的发音分贝信息的比例值,把这多个英语音节的发音分贝信息的比例值与标准英语音节的发音时间信息的比例值进行比对,并且把比对的信息传输至反馈输出单元。
6.根据权利要求1所述的英语语言智能识别和输出系统,其特征在于,
所述语音信息识别分析单元还包括声音分贝特征提取模块,所述声音分贝特征提取模块用于把所述单个英语音节从发音开始至发音结束的过程中的分贝连续记录下来,并且把记录得到的连续分贝信息通过信号转换模块转换为电信号或者光信号,并且电信号或在光信号对应的信号强度与连续分贝信息的分贝强度相互对应。
7.根据权利要求1所述的英语语言智能识别和输出系统的使用方法,其特征在于,包括下面的步骤:
S1:用户发出英语语音信息,英语语音信息通过所述语音信息收集单元进行采集,随后通过所述先期信号处理单元对于英语语音信息进行降噪和转换处理;
S2:随后语音信息进入到语音信息识别分析单元,所述单词特征提取模块对于英语语音信息进行分解得到逐个排列的英语单词,随后单个的英语单词通过所述单词音节特征提取模块进行分解得到逐个排列的英语音节,把得到的英语音节和标准音节进行比对,并且给出比对的相似度,把相似度信息通过所述反馈输出单元显示给用户;并且,反馈输出单元把分解得到的单个音节和标准音节通过扬声器模块连续进行比对发声,这种比对发声以对于用户进行纠正发音。
8.根据权利要求7所述的英语语言智能识别和输出系统的使用方法,其特征在于,所述语音信息识别分析单元还包括时间特征提取模块;
该使用方法包括下面的步骤:首先,所述时间特征提取模块把所述单个英语音节发音至发音结束的时间记录为发音时间,并且对于同一个英语单词被分解为多个的单个英语音节通过所述时间特征提取模块分别得到对应的不同的发音时间,这些不同的发音时间经过比对后换算为第一比例值;然后,把这些第一比例值与系统内存储的对应的标准英语音节的发音时间形成的第二比例值进行比对,第一比例值和第二比例值的比值信息通过所述反馈输出单元进行输出。
9.根据权利要求7所述的英语语言智能识别和输出系统的使用方法,其特征在于,所述语音信息识别分析单元还包括声音分贝特征提取模块;
该使用方法包括下面的步骤:首先,所述声音分贝特征提取模块把所述单个英语音节从发音开始至发音结束过程中的最高分贝记录下来,并且把记录得到的最高分贝信息传输至所述反馈输出单元;并且,同一个英语单词被分解为多个单个英语音节,这多个单个英语音节通过所述声音分贝特征提取模块分别得到不同的发音分贝信息,并且相应得到这多个单个英语音节的发音分贝信息的比例值,把这多个英语音节的发音分贝信息的第三比例值与标准英语音节的发音时间信息的第四比例值进行比对,并且把第三比例值与第四比例值的比对的信息传输至反馈输出单元。
10.根据权利要求7所述的英语语言智能识别和输出系统,其特征在于,
所述语音信息识别分析单元还包括声音分贝特征提取模块;
该使用方法包括下面的步骤:所述声音分贝特征提取模块把所述单个英语音节从发音开始至发音结束的过程中的分贝连续记录下来,并且把记录得到的连续分贝信息通过信号转换模块转换为电信号或者光信号,由此成为测试转换连续分贝信息;然后,在系统内存储有标准发音的单个英语音节的连续分贝信息的转换信息,称为标准发音的转换连续分贝信息,把测试转换连续分贝信息与所述转换连续分贝信息通过所述反馈输出单元进行显示输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110406924.1A CN113192494A (zh) | 2021-04-15 | 2021-04-15 | 一种英语语言智能识别和输出系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110406924.1A CN113192494A (zh) | 2021-04-15 | 2021-04-15 | 一种英语语言智能识别和输出系统和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113192494A true CN113192494A (zh) | 2021-07-30 |
Family
ID=76977253
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110406924.1A Pending CN113192494A (zh) | 2021-04-15 | 2021-04-15 | 一种英语语言智能识别和输出系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113192494A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104732977A (zh) * | 2015-03-09 | 2015-06-24 | 广东外语外贸大学 | 一种在线口语发音质量评价方法和系统 |
CN108053839A (zh) * | 2017-12-11 | 2018-05-18 | 广东小天才科技有限公司 | 一种语言练习成果的展示方法及麦克风设备 |
CN109697975A (zh) * | 2017-10-20 | 2019-04-30 | 深圳市鹰硕音频科技有限公司 | 一种语音评价方法及装置 |
CN109697988A (zh) * | 2017-10-20 | 2019-04-30 | 深圳市鹰硕音频科技有限公司 | 一种语音评价方法及装置 |
CN109979484A (zh) * | 2019-04-03 | 2019-07-05 | 北京儒博科技有限公司 | 发音检错方法、装置、电子设备及存储介质 |
CN110085261A (zh) * | 2019-05-16 | 2019-08-02 | 上海流利说信息技术有限公司 | 一种发音纠正方法、装置、设备以及计算机可读存储介质 |
CN110782918A (zh) * | 2019-10-12 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的语音韵律评估方法及装置 |
CN111640445A (zh) * | 2020-05-13 | 2020-09-08 | 广州国音智能科技有限公司 | 音频差异检测方法、装置、设备及可读存储介质 |
CN111950480A (zh) * | 2020-08-17 | 2020-11-17 | 刘翠翠 | 一种基于人工智能的英语发音自检方法和自检系统 |
-
2021
- 2021-04-15 CN CN202110406924.1A patent/CN113192494A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104732977A (zh) * | 2015-03-09 | 2015-06-24 | 广东外语外贸大学 | 一种在线口语发音质量评价方法和系统 |
CN109697975A (zh) * | 2017-10-20 | 2019-04-30 | 深圳市鹰硕音频科技有限公司 | 一种语音评价方法及装置 |
CN109697988A (zh) * | 2017-10-20 | 2019-04-30 | 深圳市鹰硕音频科技有限公司 | 一种语音评价方法及装置 |
CN108053839A (zh) * | 2017-12-11 | 2018-05-18 | 广东小天才科技有限公司 | 一种语言练习成果的展示方法及麦克风设备 |
CN109979484A (zh) * | 2019-04-03 | 2019-07-05 | 北京儒博科技有限公司 | 发音检错方法、装置、电子设备及存储介质 |
CN110085261A (zh) * | 2019-05-16 | 2019-08-02 | 上海流利说信息技术有限公司 | 一种发音纠正方法、装置、设备以及计算机可读存储介质 |
CN110782918A (zh) * | 2019-10-12 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的语音韵律评估方法及装置 |
CN111640445A (zh) * | 2020-05-13 | 2020-09-08 | 广州国音智能科技有限公司 | 音频差异检测方法、装置、设备及可读存储介质 |
CN111950480A (zh) * | 2020-08-17 | 2020-11-17 | 刘翠翠 | 一种基于人工智能的英语发音自检方法和自检系统 |
Non-Patent Citations (3)
Title |
---|
吴怡龙;: "以音频信号对比原理为参照实现英语口语标准化的设计", 西部广播电视 * |
李红枫;: "论汉语发音对英语语音语调的影响及英语口语教学", 科技信息 * |
王兴刚;: "英文发音中错误语音自动识别系统设计", 现代电子技术 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108648527B (zh) | 一种英语发音匹配纠正方法 | |
Kiss et al. | Language independent automatic speech segmentation into phoneme-like units on the base of acoustic distinctive features | |
CN111739556B (zh) | 一种语音分析的系统和方法 | |
KR20160122542A (ko) | 발음 유사도 측정 방법 및 장치 | |
CN110111778B (zh) | 一种语音处理方法、装置、存储介质及电子设备 | |
KR101538317B1 (ko) | 영어 리터러시 자동측정 시스템 | |
JP2008158055A (ja) | 言語発音練習支援システム | |
CN111915940A (zh) | 一种口语发音评测和教学方法、系统、终端及存储介质 | |
Wang et al. | A probe into spoken English recognition in English education based on computer-aided comprehensive analysis | |
CN110047474A (zh) | 一种英语音标发音智能训练系统及训练方法 | |
WO2006034569A1 (en) | A speech training system and method for comparing utterances to baseline speech | |
JP2013088552A (ja) | 発音トレーニング装置 | |
JP4811993B2 (ja) | 音声処理装置、およびプログラム | |
CN117198338B (zh) | 一种基于人工智能的对讲机声纹识别方法及系统 | |
KR20080018658A (ko) | 사용자 선택구간에 대한 음성비교 시스템 | |
CN113192494A (zh) | 一种英语语言智能识别和输出系统和方法 | |
JP2844817B2 (ja) | 発声練習用音声合成方式 | |
Johnson | An integrated approach for teaching speech spectrogram analysis to engineering students | |
CN113208592B (zh) | 一种具有多作答模式的心理测试系统 | |
Bai | Pronunciation Tutor for Deaf Children based on ASR | |
RU153322U1 (ru) | Устройство для обучения разговорной(устной) речи с визуальной обратной связью | |
Hussein et al. | Mandarin tone perception and production by German learners. | |
CN117519488B (zh) | 一种对话机器人的对话方法及其对话系统 | |
Anjani et al. | Kannada Speech Recognition Enquiry System For Farmers | |
CN112116832A (zh) | 一种口语练习方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210730 |
|
RJ01 | Rejection of invention patent application after publication |