CN110085260A - 一种单词音节重音识别校正方法、装置、设备以及介质 - Google Patents

一种单词音节重音识别校正方法、装置、设备以及介质 Download PDF

Info

Publication number
CN110085260A
CN110085260A CN201910406369.5A CN201910406369A CN110085260A CN 110085260 A CN110085260 A CN 110085260A CN 201910406369 A CN201910406369 A CN 201910406369A CN 110085260 A CN110085260 A CN 110085260A
Authority
CN
China
Prior art keywords
syllable
stress
predetermined word
audio data
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910406369.5A
Other languages
English (en)
Inventor
刘晨晨
沈欣尧
吴伶俐
张蕾
杨晓飞
蒋成林
冉天华
肖伟
张宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI LIULISHUO INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI LIULISHUO INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI LIULISHUO INFORMATION TECHNOLOGY Co Ltd filed Critical SHANGHAI LIULISHUO INFORMATION TECHNOLOGY Co Ltd
Priority to CN201910406369.5A priority Critical patent/CN110085260A/zh
Publication of CN110085260A publication Critical patent/CN110085260A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/027Syllables being the recognition units

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开了一种单词音节重音识别校正方法,通过获取针对预定单词录入的音频数据;对音频数据进行分析,确定预定单词中的实际重读的音节;将实际重读的音节与预定单词对应的标准重音音节进行比对,生成判断预定单词的当前的音节重音是否正确的反馈信息。本申请所提供的方法可以自动对录入的音频数据进行分析,检测其中的音节重音是否正确,得到的反馈信息可以辅助用户理解音节重音的概念,从而帮助用户有效掌握英语口语中音节重音的效果。并且,采用本申请可以不需要老师当面进行真人教学示范或纠正,用户可以随时随地进行相关的练习。此外,本申请还提供了一种具有上述技术效果的单词音节重音识别校正装置、设备以及计算机可读存储介质。

Description

一种单词音节重音识别校正方法、装置、设备以及介质
技术领域
本发明涉及语音技术领域,特别是涉及一种单词音节重音识别校正方法、装置、设备以及计算机可读存储介质。
背景技术
随着科学技术的发展,基于互联网的语言学习应用也得到了快速的发展。在一些语言学习应用中,应用提供商通过互联网将学习材料发送到客户端,用户经由客户端获取学习材料,进行对应的学习。对于语言学习,除了学习语法和词汇之外,发音能力是其中最重要的能力之一。通常情况下,用户会通过朗读、跟读等方式来提升自身的发音能力。然而,多数情况下用户无法得知自身发音是否准确。
在一个多音节的英文单词中,至少有一个音节会重读,单词的正确发音需要同时做到音素发音的正确以及重音位置的正确。重音位置的移动会影响词义,如单词content,当重音在第一个音节时,是名词“内容”的意思;而当重音在第二个音节时,是形容词“满意的”的意思。但在中文中,一个字一个音节,不存在一个字内部的重音变化,同时每个字都是一样重,所以受母语习惯影响,中国人理解和掌握单词音节重音,尤其是不在第一个音节上的重音时相对困难。
传统的方案是通过原理教学和标准示范,在老师的反馈指导下,让学习者通过不断模仿去尽量掌握。但是单纯通过模仿标准发音来练习的传统手段,需要一定的听辨和总结技能,无法让学习者在练习过程中形成对单词音节重音的直观理解,学习效率较低。并且,学习过程需要真人老师反馈来纠正存在的问题,使得用户的有效练习受到了时间和空间限制。
发明内容
本发明的目的是提供一种单词音节重音识别校正方法、装置、设备以及计算机可读存储介质,以解决传统方法学习效率较低且有效练习的时间和空间受到限制的问题。
为解决上述技术问题,本发明提供一种单词音节重音识别校正方法,包括:
获取针对预定单词录入的音频数据;
对所述音频数据进行分析,确定所述预定单词中的实际重读的音节;
将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息。
可选地,所述对所述音频数据进行分析,确定所述预定单词中的实际重读的音节包括:
对所述音频数据进行分析,以音节为单位提取音节特征;
将所述音节特征输入至预先建立的分类模型中,得到单词中各个音节对应的重弱读指标;
根据各个音节对应的重弱读指标,从中确定出实际重读的音节。
可选地,所述音节特征包括音量特征,或音量特征与时长特征、音高特征的组合。
可选地,在所述将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息之后还包括:
在所述实际重读的音节与所述标准重音音节比对一致时,通过显示界面的第一视觉元素指示所述预定单词的整体音节重音正确;
在所述实际重读的音节与所述标准重音音节比对不一致时,通过所述显示界面的第二视觉元素指示所述预定单词的整体音节重音不正确。
可选地,在所述将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息之后还包括:
通过所述显示界面的第三视觉元素对所述预定单词的各个音节的实际重读情况与标准重读情况进行对比显示,通过所述显示界面的第四视觉元素标示出所述预定单词中各个音节的重弱读情况是否正确。
可选地,在所述将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息之后还包括:
通过显示界面的第五视觉元素标示出所述预定单词中的标准重读音节。
本发明还提供了一种单词音节重音识别校正装置,包括:
获取模块,用于获取针对预定单词录入的音频数据;
确定模块,用于对所述音频数据进行分析,确定所述预定单词中的实际重读的音节;
生成模块,用于将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息。
本发明还提供了一种单词音节重音识别校正设备,应用于服务端,所述设备包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如下步骤:获取针对预定单词录入的音频数据;对所述音频数据进行分析,确定所述预定单词中的实际重读的音节;将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息。
本发明还提供了一种单词音节重音识别校正设备,应用于客户端,所述设备包括:
音频采集装置,用于录入针对预定单词的音频数据;
通信装置,用于将所述音频数据发送至服务端,以便所述服务端对所述音频数据进行分析,确定所述预定单词中的实际重读的音节;将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息;并且接收所述服务端发送的反馈信息;
显示装置,用于将所述反馈信息在显示界面上进行显示。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种所述单词音节重音识别校正方法的步骤。
本发明所提供的单词音节重音识别校正方法,通过获取针对预定单词录入的音频数据;对音频数据进行分析,确定预定单词中的实际重读的音节;将实际重读的音节与预定单词对应的标准重音音节进行比对,生成判断预定单词的当前的音节重音是否正确的反馈信息。本申请所提供的方法可以自动对录入的音频数据进行分析,检测其中的音节重音是否正确,得到的反馈信息可以辅助用户理解音节重音的概念,从而帮助用户有效掌握英语口语中音节重音的效果,提高用户的学习效率。并且,采用本申请可以不需要老师当面进行真人教学示范或纠正,因此克服了学习时间和空间的限制,用户可以随时随地进行相关的练习。此外,本申请还提供了一种具有上述技术效果的单词音节重音识别校正装置、设备以及计算机可读存储介质。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请所提供的单词音节重音识别校正方法的一种具体实施方式的流程图;
图2为确定预定单词中的实际重读的音节的过程示意图;
图3为本申请所提供的单词音节重音识别校正方法的另一种具体实施方式的流程图;
图4为在显示界面对用户单词音节重音练习反馈视觉化展现的示意图;
图5为本发明实施例提供的单词音节重音识别校正装置的结构框图;
图6为本申请实施例所提供的单词音节重音识别校正设备应用于服务端的结构框图;
图7为本申请实施例所提供的单词音节重音识别校正设备应用于客户端的结构框图;
图8为本申请实施例所提供的单词音节重音识别校正系统的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
本发明实施例可以用于发音学习场景,尤其是语言学习中的发音学习场景或者发音校正场景,其中语言包括但不限于英语、法语、德语、日语等外语,以及粤语、四川话等汉语分支。本发明实施例涉及的语言学习场景例如可以是语言学习软件或语言学习终端中的发音测评场景、发音校正场景等场景,也可以是其他语言学习场景,本发明实施例中并不限定。
下面对本申请实施例的应用场景进行详细阐述,用户可以通过客户端进行发音学习,客户端可以在显示界面上显示用户待学习的内容,并且还可以通过扬声器等音频播放装置向用户输出语音形式的音频内容。在用户进行语音的发音学习时,客户端可以通过音频采集装置采集用户发音时的音频数据,以便后续进行单词音节重音识别校正操作。可以理解的是,执行单词音节重音识别校正操作的主体可以为客户端,也可以为服务端,这均不影响本申请的实现。
本发明实施例中客户端可以包括但不限于:智能手机、平板电脑、MP4、MP3、PC、PDA、可穿戴设备和头戴显示设备等;服务端可以包括但不限于:单个网络服务器、多个网络服务器组成的服务器组或基于云计算由大量计算机或网络服务器构成的云。
结合上述应用场景,本申请所提供的单词音节重音识别校正方法的一种具体实施方式的流程图如1所示,该方法具体包括:
步骤S101:获取针对预定单词录入的音频数据;
在本实施例中预定单词为有单词重音特征的待练习多音节单词。用户可以朗读该预定单词,通过客户端录入针对该待练习单词的语音,经过音频采集装置采集后获得语音对应的音频数据。
步骤S102:对所述音频数据进行分析,确定所述预定单词中的实际重读的音节;
通过对音频数据进行分析,得到预定单词中哪个音节是用户实际重读的音节,作为实际重读的音节。需要指出的是,该过程可以由客户端执行,也可以由后台服务端执行,这均不影响本申请的实现。
作为一种具体实施方式,参照图2,本申请中对所述音频数据进行分析,确定所述预定单词中的实际重读的音节的过程可以具体包括:
步骤S1021:对所述音频数据进行分析,以音节为单位提取音节特征;
对所述音频数据进行分析,通过语音识别的强制切分对齐操作,得到单词的各个音节。进一步得到各个音节的音节特征。其中,音节特征包括音量特征,或音量特征与时长特征、音高特征的组合。即音节特征至少包括音量特征,而时长特征与音高特征则可选择性增加。
步骤S1022:将所述音节特征输入至预先建立的分类模型中,得到单词中各个音节对应的重弱读指标;
本实施例中分类模型可以为预先建立,并经过一系列训练样本数据训练得到。具体地,分类模型可以为逻辑回归分类模型。分类模型的训练过程为:由语言学背景人员标注相关数据,得到训练样本集。然后利用音节特征训练统一的分类模型,该分类模型的输入数据为音节特征,输出数据为重弱读指标。重弱读指标为标示音节重弱读情况的数值,数值越大则越接近重读。在训练好分类模型之后,将用户的实际音频数据对应的音节特征输入至该分类模型之后,即可得到每个音节对应的重弱读指标。
步骤S1023:根据各个音节对应的重弱读指标,从中确定出实际重读的音节。
在得到各个音节对应的重弱读指标之后,即可从中确定出实际重读的音节。具体地,可以按照重弱读指标对音节进行排序,选取重弱读指标数值最大的音节作为实际重读的音节,其他音节作为非重音音节。当然,还可以采用其他确定实际重读的音节的方法,在此不做限定。
步骤S103:将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息。
标准重音音节可以为预先设定得到,也可以实时分析得到。将实际重读的音节与标准重音音节进行比对,若存在不一致的情况,即可认为当前的音节重音不正确,从而生成当前的音节重音不正确的反馈信息。若均不存在不一致的情况,即可认为当前的音节重音正确,从而生成当前的音节重音正确的反馈信息。
反馈信息可以通过视觉方式向用户进行直观显示,也可以辅助增加对应的音效进行反馈,在此不做限定。
本发明所提供的单词音节重音识别校正方法,通过获取针对预定单词录入的音频数据;对音频数据进行分析,确定预定单词中的实际重读的音节;将实际重读的音节与预定单词对应的标准重音音节进行比对,生成判断预定单词的当前的音节重音是否正确的反馈信息。本申请所提供的方法可以自动对录入的音频数据进行分析,检测其中的音节重音是否正确,得到的反馈信息可以辅助用户理解音节重音的概念,从而帮助用户有效掌握英语口语中音节重音的效果,提高用户的学习效率。并且,采用本申请可以不需要老师当面进行真人教学示范或纠正,因此克服了学习时间和空间的限制,用户可以随时随地进行相关的练习。
如图3所示,在上述任一实施例的基础上,本申请所提供的单词音节重音识别校正方法在将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息之后还可以进一步包括:通过视觉元素将反馈信息显示给用户、以辅助用户学习的一系列过程。
一种具体实施方式可以为:步骤S1041:在所述实际重读的音节与所述标准重音音节比对一致时,通过显示界面的第一视觉元素指示所述预定单词的整体音节重音正确;在所述实际重读的音节与所述标准重音音节比对不一致时,通过所述显示界面的第二视觉元素指示所述预定单词的整体音节重音不正确。
其中,第一视觉元素与第二视觉元素可以为不同的几何图案,也可以为相同的几何图案,通过几何图案的指示颜色或其他特征的不同来进行区别。例如,几何图案可以选择为圆圈,在整体音节重音正确时,将该圆圈的颜色变为绿色,并同时播放预设第一音效,进行整体音节重音正确的指示。在整体音节重音不正确时,将该圆圈的颜色变为红色,同时该圆圈进行晃动或播放预设第二音效,来进行整体音节重音错误的指示。
另一种具体实施方式可以为:步骤S1042:通过所述显示界面的第三视觉元素对所述预定单词的各个音节的实际重读情况与标准重读情况进行对比显示,通过所述显示界面的第四视觉元素标示出所述预定单词中各个音节的重弱读情况是否正确。
例如,可以在预定单词下方通过圆点的大小表示重弱读情况,重读的音节对应的圆点形状较大,弱读的音节对应的圆点形状较小。实际读音与标准读音的重弱读情况通过两行圆点进行对比显示。对于单个音节,其实际重弱读情况与标准重弱读情况相同时,可以通过圆点的颜色进行指示。例如该特定音节重弱读情况正确时,对应圆点为绿色;该特定音节词重弱读情况不正确时,对应圆点为红色。
又一种具体实施方式可以为:步骤S1043:通过显示界面的第五视觉元素标示出所述预定单词中的标准重读音节。
例如,可以将预定单词句中需重读的音节进行放大显示,可以与其他弱读的音节相区别。当然,还可以采用其他方式对需重读的音节进行突出显示。
可以理解的是,上述反馈信息的方式仅为实例,实际的应用过程中,其他同样可以实现标示显示作用的方式也应包含在本发明的保护范围之内。
参照图4在显示界面对用户单词音节重音练习反馈视觉化展现的示意图,该实施例中,预定单词为“International”,通过界面上方左边的大圆圈指示用户实际的整体音节重音是否正确,该圆圈颜色变绿则表示整体音节重音正确,该圆圈颜色变红则表示整体音节重音不正确。在每个音节下方用圆点标示该音节对应的重弱读情况,位于左边用户实际发音单词下方的圆点为用户实际发音的重弱读情况,位于右边标准发音单词下方的圆点为标准发音的重弱读情况。重读的音节对应的圆点形状较大,弱读的音节对应的圆点形状较小。当该音节的实际发音与标准发音的重弱读情况相同时,该音节下方的圆点颜色变为绿色。当该音节的实际发音与标准发音的重弱读情况不相同时,该音节下方的圆点颜色变为红色。此外,在预定单词的显示中需要重读的音节进行了放大,例如“-na-”这个需要重读的音节,在预定单词中进行了突出显示。
进一步地,本申请还可以通过播放用户在练习时的音频数据及标准语音,帮助用户更清晰地对比自己在发音时出现的问题,并有机会通过模仿标准语音来进一步改善问题。
本实施例中通过显示界面将反馈信息反馈至用户,反馈信息可以包括但不限于:整体音节重音的正误情况、单词中每个音节实际重读情况与标准情况的对比。由于单词中音节的重读概念对学习者来说不易理解,需要不断强化,尤其在学习初期,学习者难以通过标准音频准确判断强弱,需要直接清晰的说明,因此该实施例采用视觉元素辅助学习者清晰获取练习各音节是否重读的区分,在练习过程中加强对概念的理解,并能快速定位自己在练习时的问题所在。视觉上通过音节下方圆圈大和小的对比,辅助用户直观理解单词中各音节的重读情况,同时,用不同颜色显示用户各音节发音的正误情况,正确的为绿色,错误的为红,帮助用户直观、快速定位错误。
下面对本发明实施例提供的单词音节重音识别校正装置进行介绍,下文描述的单词音节重音识别校正装置与上文描述的单词音节重音识别校正方法可相互对应参照。
图5为本发明实施例提供的单词音节重音识别校正装置的结构框图,参照图5单词音节重音识别校正装置可以包括:
获取模块100,用于获取针对预定单词录入的音频数据;
确定模块200,用于对所述音频数据进行分析,确定所述预定单词中的实际重读的音节;
生成模块300,用于将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息。
作为一种具体实施方式,本申请实施例中所述确定模块200可以具体包括:
分析单元,用于对所述音频数据进行分析,以音节为单位提取音节特征;
第一确定单元,用于将所述音节特征输入至预先建立的分类模型中,得到单词中各个音节对应的重弱读指标;
第二确定单元,用于根据各个音节对应的重弱读指标,从中确定出实际重读的音节。
作为一种具体实施方式,本申请实施例中所述确定模块200中,所述音节特征包括音量特征,或音量特征与时长特征、音高特征的组合。
此外,在上述任一实施例的基础上,本申请所提供的单词音节重音识别校正装置还可以进一步包括:
第一显示模块,用于在将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息之后,在所述实际重读的音节与所述标准重音音节比对一致时,通过显示界面的第一视觉元素指示所述预定单词的整体音节重音正确;在所述实际重读的音节与所述标准重音音节比对不一致时,通过所述显示界面的第二视觉元素指示所述预定单词的整体音节重音不正确。
第二显示模块,用于在将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息之后,通过所述显示界面的第三视觉元素对所述预定单词的各个音节的实际重读情况与标准重读情况进行对比显示,通过所述显示界面的第四视觉元素标示出所述预定单词中各个音节的重弱读情况是否正确。
第三显示模块,用于在将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息之后,通过显示界面的第五视觉元素标示出所述预定单词中的标准重读音节。
本实施例的单词音节重音识别校正装置用于实现前述的单词音节重音识别校正方法,因此单词音节重音识别校正装置中的具体实施方式可见前文中的单词音节重音识别校正方法的实施例部分,例如,获取模块100,确定模块200,生成模块300,分别用于实现上述单词音节重音识别校正方法中步骤S101,S102,S103,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
本申请所提供的装置可以自动对录入的音频数据进行分析,检测其中的音节重音是否正确,得到的反馈信息可以辅助用户理解音节重音的概念,从而帮助用户有效掌握英语口语中音节重音的效果,提高用户的学习效率。并且,采用本申请可以不需要老师当面进行真人教学示范或纠正,因此克服了学习时间和空间的限制,用户可以随时随地进行相关的练习。
此外,本申请还提供了一种单词音节重音识别校正设备,应用于服务端1,如图6所示,所述设备包括:
存储器11,用于存储计算机程序;
处理器12,用于执行所述计算机程序时实现如下步骤:获取针对预定单词录入的音频数据;对所述音频数据进行分析,确定所述预定单词中的实际重读的音节;将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是单词音节重音识别校正设备的内部存储单元,例如硬盘。存储器11在另一些实施例中也可以是单词音节重音识别校正设备的外部存储设备,例如插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括单词音节重音识别校正设备的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于单词音节重音识别校正设备的应用软件及各类数据,例如单词音节重音识别校正程序01的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行单词音节重音识别校正程序01等。
可选地,所述处理器12用于执行所述计算机程序时具体实现如下步骤:对所述音频数据进行分析,以音节为单位提取音节特征;将所述音节特征输入至预先建立的分类模型中,得到单词中各个音节对应的重弱读指标;根据各个音节对应的重弱读指标,从中确定出实际重读的音节。
其中,所述音节特征包括以下任意一种或任意组合:音量特征、时长特征、音高特征。
可以理解的是,本申请实施例中服务端可以包括但不限于:单个网络服务器、多个网络服务器组成的服务器组或基于云计算由大量计算机或网络服务器构成的云。
此外,本申请还提供了一种单词音节重音识别校正设备,应用于客户端2,如图7所示,所述设备包括:
音频采集装置21,用于录入针对预定单词的音频数据;
通信装置22,用于将所述音频数据发送至服务端,以便所述服务端对所述音频数据进行分析,确定所述预定单词中的实际重读的音节;将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息;并且接收所述服务端发送的反馈信息;
显示装置23,用于将所述反馈信息在显示界面上进行显示。
可选地,本申请实施例所提供的单词音节重音识别校正设备中显示装置23可以具体用于:在将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息之后,在所述实际重读的音节与所述标准重音音节比对一致时,通过显示界面的第一视觉元素指示所述预定单词的整体音节重音正确;在所述实际重读的音节与所述标准重音音节比对不一致时,通过所述显示界面的第二视觉元素指示所述预定单词的整体音节重音不正确。
可选地,本申请实施例所提供的单词音节重音识别校正设备中显示装置23可以具体用于:在将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息之后,通过所述显示界面的第三视觉元素对所述预定单词的各个音节的实际重读情况与标准重读情况进行对比显示,通过所述显示界面的第四视觉元素标示出所述预定单词中各个音节的重弱读情况是否正确。
可选地,本申请实施例所提供的单词音节重音识别校正设备中显示装置23可以具体用于:在将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息之后,通过显示界面的第五视觉元素标示出所述预定单词中的标准重读音节。
可以理解的是,本申请实施例中客户端可以包括但不限于:智能手机、平板电脑、MP4、MP3、PC、PDA、可穿戴设备和头戴显示设备等。
进一步地,本申请还提供了一种单词音节重音识别校正系统,如图8所示,该系统包括上述任一种服务端1以及上述任一种客户端2。用户可以通过客户端进行发音学习,客户端可以在显示界面上显示用户待学习的内容,并且还可以通过扬声器等音频播放装置向用户输出语音形式的音频内容,在用户进行语音的发音学习时,客户端可以通过音频采集装置采集用户发音时的音频数据,并将音频数据发送至服务端,由服务端进行单词音节重音识别校正的过程。在服务端对音频数据进行分析并得到反馈信息之后,将该反馈信息发送至客户端。通过客户端的显示装置对反馈信息进行显示,向用户提供视觉辅助信息。
此外,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种单词音节重音识别校正方法的步骤。
本申请所提供的单词音节重音识别校正设备、单词音节重音识别校正系统、计算机可读存储介质与前述方法相对应。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。综上所述,本申请通过获取针对预定单词录入的音频数据;对音频数据进行分析,确定预定单词中的实际重读的音节;将实际重读的音节与预定单词对应的标准重音音节进行比对,生成判断预定单词的当前的音节重音是否正确的反馈信息。本申请可以自动对录入的音频数据进行分析,检测其中的音节重音是否正确,得到的反馈信息可以辅助用户理解音节重音的概念,从而帮助用户有效掌握英语口语中音节重音的效果,提高用户的学习效率。并且,采用本申请可以不需要老师当面进行真人教学示范或纠正,因此克服了学习时间和空间的限制,用户可以随时随地进行相关的练习。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的单词音节重音识别校正方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种单词音节重音识别校正方法,其特征在于,包括:
获取针对预定单词录入的音频数据;
对所述音频数据进行分析,确定所述预定单词中的实际重读的音节;
将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息。
2.如权利要求1所述的单词音节重音识别校正方法,其特征在于,所述对所述音频数据进行分析,确定所述预定单词中的实际重读的音节包括:
对所述音频数据进行分析,以音节为单位提取音节特征;
将所述音节特征输入至预先建立的分类模型中,得到单词中各个音节对应的重弱读指标;
根据各个音节对应的重弱读指标,从中确定出实际重读的音节。
3.如权利要求2所述的单词音节重音识别校正方法,其特征在于,所述音节特征包括音量特征,或音量特征与时长特征、音高特征的组合。
4.如权利要求1至3任一项所述的单词音节重音识别校正方法,其特征在于,在所述将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息之后还包括:
在所述实际重读的音节与所述标准重音音节比对一致时,通过显示界面的第一视觉元素指示所述预定单词的整体音节重音正确;
在所述实际重读的音节与所述标准重音音节比对不一致时,通过所述显示界面的第二视觉元素指示所述预定单词的整体音节重音不正确。
5.如权利要求4所述的单词音节重音识别校正方法,其特征在于,在所述将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息之后还包括:
通过所述显示界面的第三视觉元素对所述预定单词的各个音节的实际重读情况与标准重读情况进行对比显示,通过所述显示界面的第四视觉元素标示出所述预定单词中各个音节的重弱读情况是否正确。
6.如权利要求5所述的单词音节重音识别校正方法,其特征在于,在所述将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息之后还包括:
通过显示界面的第五视觉元素标示出所述预定单词中的标准重读音节。
7.一种单词音节重音识别校正装置,其特征在于,包括:
获取模块,用于获取针对预定单词录入的音频数据;
确定模块,用于对所述音频数据进行分析,确定所述预定单词中的实际重读的音节;
生成模块,用于将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息。
8.一种单词音节重音识别校正设备,其特征在于,应用于服务端,所述设备包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如下步骤:获取针对预定单词录入的音频数据;对所述音频数据进行分析,确定所述预定单词中的实际重读的音节;将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息。
9.一种单词音节重音识别校正设备,其特征在于,应用于客户端,所述设备包括:
音频采集装置,用于录入针对预定单词的音频数据;
通信装置,用于将所述音频数据发送至服务端,以便所述服务端对所述音频数据进行分析,确定所述预定单词中的实际重读的音节;将所述实际重读的音节与所述预定单词对应的标准重音音节进行比对,生成判断所述预定单词的当前的音节重音是否正确的反馈信息;并且接收所述服务端发送的反馈信息;
显示装置,用于将所述反馈信息在显示界面上进行显示。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述单词音节重音识别校正方法的步骤。
CN201910406369.5A 2019-05-16 2019-05-16 一种单词音节重音识别校正方法、装置、设备以及介质 Pending CN110085260A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910406369.5A CN110085260A (zh) 2019-05-16 2019-05-16 一种单词音节重音识别校正方法、装置、设备以及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910406369.5A CN110085260A (zh) 2019-05-16 2019-05-16 一种单词音节重音识别校正方法、装置、设备以及介质

Publications (1)

Publication Number Publication Date
CN110085260A true CN110085260A (zh) 2019-08-02

Family

ID=67420439

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910406369.5A Pending CN110085260A (zh) 2019-05-16 2019-05-16 一种单词音节重音识别校正方法、装置、设备以及介质

Country Status (1)

Country Link
CN (1) CN110085260A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110992986A (zh) * 2019-12-04 2020-04-10 南京大学 单词音节重读检错方法、装置、电子设备和存储介质
CN113838479A (zh) * 2021-10-27 2021-12-24 海信集团控股股份有限公司 单词发音评测方法、服务器及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512300A (zh) * 2002-12-30 2004-07-14 艾尔科技股份有限公司 自动标示音标以矫正发音的使用者接口、系统及方法
US20070067174A1 (en) * 2005-09-22 2007-03-22 International Business Machines Corporation Visual comparison of speech utterance waveforms in which syllables are indicated
CN101393694A (zh) * 2008-10-21 2009-03-25 无敌科技(西安)有限公司 一种具有汉字正音功能的汉字发音学习装置及其方法
CN101551952A (zh) * 2009-05-21 2009-10-07 无敌科技(西安)有限公司 发音评测装置及其方法
WO2011019257A2 (ko) * 2009-08-14 2011-02-17 O Joo Sung 영어 학습 시스템
KR20140078810A (ko) * 2012-12-18 2014-06-26 주홍찬 언어 데이터 및 원어민의 발음 데이터를 이용한 리듬 패턴 학습장치 및 방법
CN104485116A (zh) * 2014-12-04 2015-04-01 上海流利说信息技术有限公司 语音质量评价设备、方法和系统
TW201601128A (zh) * 2014-06-30 2016-01-01 陳念霞 外國語之重讀音節與輕讀音節的視覺輔助辨識方法及其輔具
CN106504755A (zh) * 2016-11-08 2017-03-15 广东小天才科技有限公司 一种错误发音的识别方法及装置、用户终端

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512300A (zh) * 2002-12-30 2004-07-14 艾尔科技股份有限公司 自动标示音标以矫正发音的使用者接口、系统及方法
US20070067174A1 (en) * 2005-09-22 2007-03-22 International Business Machines Corporation Visual comparison of speech utterance waveforms in which syllables are indicated
CN101393694A (zh) * 2008-10-21 2009-03-25 无敌科技(西安)有限公司 一种具有汉字正音功能的汉字发音学习装置及其方法
CN101551952A (zh) * 2009-05-21 2009-10-07 无敌科技(西安)有限公司 发音评测装置及其方法
WO2011019257A2 (ko) * 2009-08-14 2011-02-17 O Joo Sung 영어 학습 시스템
KR20140078810A (ko) * 2012-12-18 2014-06-26 주홍찬 언어 데이터 및 원어민의 발음 데이터를 이용한 리듬 패턴 학습장치 및 방법
TW201601128A (zh) * 2014-06-30 2016-01-01 陳念霞 外國語之重讀音節與輕讀音節的視覺輔助辨識方法及其輔具
CN104485116A (zh) * 2014-12-04 2015-04-01 上海流利说信息技术有限公司 语音质量评价设备、方法和系统
CN106504755A (zh) * 2016-11-08 2017-03-15 广东小天才科技有限公司 一种错误发音的识别方法及装置、用户终端

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110992986A (zh) * 2019-12-04 2020-04-10 南京大学 单词音节重读检错方法、装置、电子设备和存储介质
CN110992986B (zh) * 2019-12-04 2022-06-07 南京大学 单词音节重读检错方法、装置、电子设备和存储介质
CN113838479A (zh) * 2021-10-27 2021-12-24 海信集团控股股份有限公司 单词发音评测方法、服务器及系统
CN113838479B (zh) * 2021-10-27 2023-10-24 海信集团控股股份有限公司 单词发音评测方法、服务器及系统

Similar Documents

Publication Publication Date Title
CN110085261B (zh) 一种发音纠正方法、装置、设备以及计算机可读存储介质
CN110136747A (zh) 一种评价语音音素正确性的方法、装置、设备及存储介质
CN110136748A (zh) 一种节奏识别校正方法、装置、设备及存储介质
CN108389573B (zh) 语种识别方法及装置、训练方法及装置、介质、终端
CN109036464A (zh) 发音检错方法、装置、设备及存储介质
CN109326162A (zh) 一种口语练习自动评测方法及装置
CN110782921A (zh) 语音测评方法和装置、存储介质及电子装置
CN111653274B (zh) 唤醒词识别的方法、装置及存储介质
CN108431883A (zh) 语言学习系统以及语言学习程序
CN112837401B (zh) 一种信息处理方法、装置、计算机设备及存储介质
CN109166569B (zh) 音素误标注的检测方法和装置
CN110085260A (zh) 一种单词音节重音识别校正方法、装置、设备以及介质
WO2019146753A1 (ja) 脳活動を利用した語学能力評価装置、及び語学能力評価システム
CN114373481A (zh) 发音检错方法及装置、发音检错模型的训练方法及装置
JP2000019941A (ja) 発音学習装置
CN114549946A (zh) 一种基于跨模态注意力机制的多模态个性识别方法及系统
CN110503941B (zh) 语言能力评测方法、装置、系统、计算机设备及存储介质
CN110097874A (zh) 一种发音纠正方法、装置、设备以及存储介质
CN112309429A (zh) 一种失爆检测方法、装置、设备及计算机可读存储介质
CN111951827B (zh) 一种连读识别校正方法、装置、设备以及可读存储介质
CN116702746A (zh) 跨平台多主题的讽刺及动因识别方法、装置、设备及介质
US20150127352A1 (en) Methods, Systems, and Tools for Promoting Literacy
CN112687296B (zh) 音频不流利的识别方法、装置、设备及可读存储介质
CN109949813A (zh) 一种将语音转换为文字的方法、装置及系统
CN111128181B (zh) 背诵题评测方法、装置以及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190802

RJ01 Rejection of invention patent application after publication